Lieber Björn, du rettest mir mit deinen unglaublich kompetenten Videos meine Masterarbeit. Vielen herzlichen Dank! Ich wüsste gar nicht, was ich momentan ohne die Videos machen würde... Mach weiter so! Liebe Grüße!
@@StatistikamPC_BjoernWalther Gibt es inzwischen ein Video zur hierarchisch-moderierter Regression? Ich hab jetzt so viele Videos geschaut aber weiss immer noch nicht wo ich anfangen soll :(
Hallo, vielen Dank für das Video. Ich habe noch eine Frage zur Prädiktorenaufnahme, wenn man theoriegeleitet vorgeht: Wann verwende ich Einschluss und wann eher Blockweise?
Hallo Rebecca, Einschluss nimmt alle UV gleichzeitig auf, wohingegen Blockweise jeweils die vorherige Definition der UV in einem Block erfordert. Ein Block kann auch nur aus einer UV bestehen, eine Begründung für Größe und Reihenfolge sollte hier aber vorhanden sein. Viele Grüße, Björn.
Hallo Björn, erstmal vielen Dank für die vielen tollen Videos. Gefühlt habe ich jedes SPSS-Video gesehen und dabei über die Jahre viel gelernt. Eine Frage zur schrittweisen Regression und deren Anwendung habe ich nach dem Video: Ich habe 7 UVs und 1 AV. Ich schaue mir an, ob z. B. das Geschlecht, das Einkommen, das Alter, etc. einen Einfluss auf die Lebenszufriedenheit haben. Das alles wird mit Theorie am Anfang der Arbeit begründet und in Hypothesen formuliert. Der Grundgedanke der Arbeit ist es sich anzuschauen: "Was hat alles einen Einfluss auf die Lebenszufriedenheit und was ist nicht relevant?". Ist es dann trotzdem nicht "sauber" eine schrittweise Regression zu rechnen, auch wenn man Theorie und Hypothesen hat oder würde das in einem solchen Fall gehen? Was empfiehlst du in einem solchen Fall? LG und nochmal danke!
Hallo und danke für dein Lob! Freut mich, wenn dir meine Videos helfen konnte. Zu deiner Frage: gibt es denn einen Grund, warum du schrittweise vorgehen möchtest? Wenn du alle UV's theoriebasiert hergeleitet hast, gibt es m.M.n.keinen Grund schrittweise vorzugehen. Vielmehr lohnt sich die alleinige Rechnung eines vollständigen Modells und Betrachtung der Ergebnisse. Mit diesen Ergebnissen sieht man auch, welche Einflüsse beobachtet werden können und wie deren Richtung und Stärke ist. Wenn du am Ende wieder "nicht signifikante" Variablen ausschließt, ändern sich andere Signifikanzen auch immer, weil die Korrelation der UV untereinander entscheidend ist und der größte Vorteil eines vollständigen Modells vs. schrittweisem Vorgehen ist. Man könnte m.M.n. maximal Kontrollvariablen in einen Block und die dich interessierenden UV in einen anderen Block aufnehmen, um die Verbesserung für das Modell durch die Beachtung von Kontrollvariablen zu quantifizieren. Viele Grüße, Björn.
Hey Björn, wann würde man eine schrittweise Regression denn dann empfehlen, umgekehrt? Würde man bei einer multiplen linearen Regressionsanalyse eher schrittweise durchführen (statt "Einschluss"), wenn relativ viele unabhängige Variablen (13) im Modell enthalten sind und man bereits Fehlermeldungen in der Rechnung (perfekte Übereinstimmung; Einflussstatistiken können nicht berechnet werden) angezeigt bekommt? So wie ich das verstehe, ist mein Modell zu komplex (Overfitting) und wenn ich das Modell "zerlege" in schrittweise Regression, wäre das dann besser?
Hallo, an sich ist schrittweise v.a. dann sinnvoll, wenn man die Zunahme des Modellfits (R²) betrachten möchte, wenn man Variablen von Interesse und Kontrollvariablen in verschiede Blöcke auftrennt. Wenn das Modell overfitted, wäre mein erster Schritt die Variable(n), die am unwahrscheinlichsten (idealerweise theoretisch-konzeptionell begründet) einen Einfluss auf die AV ausüben, auszuschließen, um wieder ein paar Freiheitsgrade zu gewinnen, die bei dir scheinbar sehr gering sind. Das "Zerlegen" des Modells ist vermutlich nur eine Behandlung des Symptoms Overfitting, behebt jedoch nicht das zugrundeliegende Problem, dass zu viele UV auf zu wenige Beobachtungen stoßen. Hast du im Vorfeld eine Poweranalyse gemacht bzw. wie ist das Verhältnis zwischen UV und Beobachtungen? Viele Grüße, Björn.
@@StatistikamPC_BjoernWalther Hey Björn (: lieben Dank für deine Antwort. Also viell. als Info zum Modell, ich habe eine (übergeordnete) AV (in zwei Summenindizes umgerechnet, da die AV 1x offline; 1x online etwas bemisst, extra mit SUM.-Funktion gearbeitet wg. fehlender Werte). Mein Datensatz hat 1.300 Fälle (also recht viele). Mein Regressionsmodell (ich rechne insg. 2 Modelle wg. der "gesplitteten" AV, die UVs bleiben stets gleich) hat 10 UVs. Leider sind alle relevant (theoretisch abgeleitet) und ich kann keine der UVs ausschließen. Eine Poweranalyse habe ich nicht gemacht, das sagt mir leider nicht so viel gerad. Meinst du mit Beobachtungen die Effekte nach der Regression? (ah doofe Frage sry) Bei beiden Regressionsmodellen (wenn mit allen 1.300 Fällen gerechnet) sind die Modelle signifikant (wenn auch kaum bis gar keine Effekte zwischen AV und UVS vorliegen). Wenn ich den Datensatz zudem VOR der Regression nach Altersgruppen aufteile (also gruppenweise ausgeben lasse, da ich bestimmte Zusammenhänge zw. Altersgruppen vergleichen will), dann kommt im Ausgabefenster für die Regressionsergebnisse entweder die Warnung, dass "Einflussstatistiken nicht berechnet werden können, da die Variable Altersgruppen eine perfekte Übereinstimmung mit meiner AV aufweist" ODER die Warnung bleibt aus, wenn ich SPSS neu starte, aber bei einer der beiden AVs (jene, die online etwas bemisst), sind die Modelle nicht mehr signifikant und es stehen "." in Spalten und Zeilen und auch die ANOVA sagt bereits, dass das Modell nicht mehr gegen den Zufall abgesichert ist. Ich habe gedacht, es läge Overfitting vor. Sry für den langen Text o.O
Lieber Björn, ich hoffe du kannst mir eine Frage zu einer moderierten hierarchischen Regression beantworten: Ich muss eine multiple + moderierte Regression rechnen, empfohlen wurde nun ebenfalls eine hierarchische Regression. Allerdings hat meine UV 5 weitere Teil-UVen. Kann ich mit all diesen überhaupt eine moderierten hierarchischen Regression rechnen? Wenn ja, wie wäre die Schreibweise für R? step1
Hallo Liva, wenn ich dich richtig verstehe, hast du eine UV, die sich aus 5 Subskalen zusammensetzt, die du jetzt einzeln jeweils mit einem Moderator multipliziert in dein Modell aufnimmst. Prinzipiell kannst du das schrittweise rechnen. Zwar geht das auch manuell, man kann aber auch mit der train()-Funktion aus dem caret-Paket den Arbeitsablauf reduzieren. Die Pakete leaps und MASS sind auch notwendig. Eine gute Anleitung in Schriftform findest du hier: www.sthda.com/english/articles/37-model-selection-essentials-in-r/154-stepwise-regression-essentials-in-r/ Viele Grüße, Björn.
Hi Björn, erstmal deine Videos sind schonmal sehr hilfreich und gut erklärt, danke dafür :) Ich habe aber mal eine kleine Frage bzgl eines Details des Videos. Bei dem Regressionskoeffizient fuer den Intelligenzquotienten verändert sich das Beta ja stark wenn man nun die Motivation hinzufügt. Ich habe in einigen englischseitigen Webseiten gelesen, dass dies problematisch sein kann (confounding). Hat das multiples Regressionsmodell trotzdem noch seine Gültigkeit und man kann seine Hypothesen testen oder nicht ? Danke im Voraus fuer jede Antwort, hoffe man versteht was ich meine :)
Hallo Yutaka, danke für dein Lob! Schrittweise Regression sollte eigentlich nicht gerechnet werden, schon gar nicht, wenn man Hypothesen hat und ein "Endmodell" rechnen muss - ich zeige das Vorgehen nur der Vollständigkeit wegen. Der von dir angesprochenen confounding-Aspekt ist natürlich bei jedweder empirischer Forschung zu bedenken und im Vorfeld sollten solche möglichen Einflussfaktoren bedacht und benannt werden, um sie schlussendlich in Experimentalsettings (v.a. klinischer Natur) kontrollieren zu können. Natürlich ist es meist nicht so einfach und man hat die Daten bereits und kann dann lediglich im Nachgang auf mögliche Störeinflüsse hinweisen. Viele Grüße, Björn.
Hallo, umgangssprachlich wird das oft vermischt. In SPSS wird blockweise von dir definiert, was aufgenommen werden soll. Bei schrittweiser Regression wird in SPSS wird anhand von p-Werten entweder ein Modell aufgebaut oder zusammengekürzt. Schrittweise ist in diesem Sinne (und meiner Meinung nach unwissenschaftlich), weil ich im Vorfeld das Modell hergeleitet habe und dieses teste und dann nicht anfange die gemachtenÜberlegungen über den Haufen zu schmeißen und anhand des p-Wertes zusammenstreiche. Viele Grüße, Björn.
Lieber Björn, vielen Dank für das tolle Video, du hast mir echt geholfen! Eine Frage habe ich aber noch, wie bzw. wann und wo kann man Kontrollvariablen in die Regression aufnehmen? Liebe Grüße!
Hallo Björn, Vielen Dank für das hilfreiche Video! Mich würde nun interessieren, warum in der Tabelle Koeffizienten der Wert vom Intelligenzquotienten von 1. Schritt zum 2. Schritt sich verändert. Hast du dafür eine Antwort? Danke Dir! :)
Kann es sein dass die schrittweise Regression auch "manuell" geht, indem man auf Lineare Regression geht und dann im Fenster in dem Bereich "Block" über den Button "Nächste" immer die Variablen hinzufügt, die man jeweils schrittweise aufnehmen will? Denn dadurch st es möglich, auch mehrere unabhängige Variablen in jeweils einem einzigen Schritt zu ergänzen.
@@StatistikamPC_BjoernWalther cool dass du geantwortet hast! Ich habe ein Frage, bin grad ein wenig am verzweifeln… und teste ich für meine Regression im ersten Modell einen Effekt, um ihn im zweiten Modell um sozioökonomische kontrollvariablen zu erweitern und im dritten um noch weitere Kontrollvariablen zu erweitern. In einer separaten Regressionsanalyse habe ich den Effekt nochmal getestet. Dabei kamen andere Ergebnisse raus (R und die Coef.) als in dem Test des Effekts im ersten Modell des dreistufigen modells. Wie kann das sein?
@Björn Lieber Björn, vielen Dank für deine tollen videos! Ich hätte eine Frage und zwar habe ich einen Persönlichkeitsfragebogen D benutzt der zusätzlich zu der dunklen Triade 8 weitere Sub-Skalen enthält. Ich will jetzt herausfinden ob der Persönlichkeitsfragebogen D besser beim vorhersagen von Inzivilität ist als die dunkle Triade. Kannst du mir da weiterhelfen?
Hallo Björn, danke für dieses hilfreiche Video! :) Ich habe dazu eine Frage (und hoffe ich bin damit nach über 2 Jahren nach dem Upload nicht zu spät): Ich habe vor, neben meiner hypothesengeleiteten multiplen Regression (mit 2 Prädiktoren) explorativ herauszufinden, welcher der beiden Prädiktoren signifikant mehr Varianz in der AV aufklärt. Eine Idee dabei wäre, durch eine schrittweise Regression, die beiden standardisierten Regressionsgewichte bzw. die beiden Korrelationen zu vergleichen, und den Zuwachs im Determinationskoeffizienten zu berichten. Aber kann ich außer, neben diesem eher deskriptiven Ergebnis, auch eine Aussage über Signifikanz treffen? Also, dass ich sagen kann, dass z.B. UV1 signifikant mehr in der AV vorhersagt als UV2? Kann ich dazu vielleicht die beiden t-Werte, die ich jeweils für die Prädiktoren in der multiplen Regression ausgegeben bekomme, auf Unterschiedlichkeit testen? Liebe Grüße!
Hallo Anne und danke für dein Lob! Ich versuche immer noch jeden Kommentar zu beantworten, obgleich es natürlich nicht weniger werden. ;-) Zu deiner Frage: Signifikanz ist die Fehlerwahrscheinlichkeit für den Fehler 1. Art. Signifikanzen vergleicht man allerdings nicht, weil es wie gesagt Fehlerwahrscheinlichkeiten sind. Entweder UV sind signifikant oder nicht. Was dich interessiert ist die gleichzeitige Aufnahme beider UV und das Einschätzen der Einflussstärke auf die AV. Das entscheidet man mittels des betragsmäßig größten standardisierten Koeffizienten. Viele Grüße, Björn.
Hallo Björn, bedanke mich ganz herzlich für die ganzen tollen Video von Dir! Das hat mir und bestimmte vielen anderen sehr geholfen :) Habe die folgenden drei Fragen an Dich: I. Gilt die Kritik (keine hypothesenbasiertes theoretisch konzeptionell fundiertes Vorgehen), die für die schrittweise Regression verwendet wurde (expoloratives Verfahren etc.) auch für die Backward Elimination? II. Kommt oder sollte bei der schrittweisen Regression eigentlich dassgleiche herauskommen wie bei der Backwards Elimination bzw. der Forward Selektion? III. Welches von den drei Verfahren (Backward, Forward oder schrittweise Regression) würdest Du persönlich eher empfehlen und wäre ggf. zuverlässiger? Ich habe gedacht, dass die schrittweise Regression beide Verfahren (Backward & Forward) miteinander verbindet und zwar so, dass dieses Verfahren zu bevorzugen wäre!? Oder wäre eine Kombination vielleicht sinnvoll? Bedanke mich im Voraus für die Antwort! :)
Hallo Ilia und danke für dein Lob! Freut mich, wenn dir die Videos helfen! :-) Zu deinen Fragen: I) Meiner Meinung nach eindeutig ja. Im Zweifel kann der Gutachter aber auch davon absehen - nicht jeder sieht es so streng. Da gibt es gegensätzliche Ansichten zu und das wird sicher auch so bleiben. II) Häufig wird das gleiche rauskommen, je mehr Variablen du hast, desto eher wird aber eine andere Modellschätzung vorgenommen und es werden unterschiedliche Variablen im Modell verbleiben/aufgenommen. Man muss natürlich auch mit der SIgnifikanz aufpassen. Bei vorwärts ist standardmäßig =0,1 ausgeschlossen. Deswegen sehe ich es bei I auch so streng. ;-) III) Wenn, dann würde ich wohl schrittweise rechnen und als Ausschlusswahrscheinlichkeit >=0,051 festlegen. Ich bin aber ohnehin immer auf eine simultane Schätzung aller x-Variablen aus, weil man sich ja schon die gedankliche Arbeit macht, welche x-Variablen alle GLEICHZEITIG auf die y-Variable wirken und das sollte man entsprechend auch so testen. Viele Grüße, Björn.
Danke für das Video, kann man sich am Ende auch eine Formel ausgeben lassen, in die alle Variablen, die in die schrittweise Regression aufgenommen wurden, auch einfließen? Sodass quasi jeder die Wahrscheinlichkeit für das Ereignis X berechnen kann?
Bei mir kommt eine Fehlermeldung, wenn ich eine schrittweise Regression durchführen möchte bzw. es steht: "Für die Gleichung wurden keine Variablen angegeben." Was habe ich falsch gemacht?
Danke für das Video! Ich habe jedoch eine Frage: Warum ändert sich das B und das Beta des Intelligenzquotienten vom Modell 1 zum Modell 2 also durch die Aufnahme der Motivation?
Hallo, das liegt an den anderen aufgenommenen x-Variablen und deren jeweiliger Einflüsse auf die Y-Variable. Ausführlicher auch hier: ua-cam.com/video/VQKBEFHLw6g/v-deo.html Viele Grüße, Björn.
Hallo Laura, das ist nur bei nominal skalierten notwendig. Bei ordinal skalierten Daten können diese so wie ursprünglich codiert im Modell verbleiben. Viele Grüße, Björn.
Kleine Frage: Wenn ich für Model 2 das korregierte R^2 nehme, sollte ich dann auch die Änderung des R^2 auf Basis des Korregierten R^2 berechnen. In diesem Fall also nicht 0,07 (0,898-0,828) Änderung im R^2, sondern 0,066 (0,894-0,828)
Hey Björn, eine Frage wie sieht es aus, wenn bei dem Modell die Variable Geschlecht sowohl bei den Koeefizienten auftaucht, als auch bei den Ausgeschlossenen Variablen? 🤷♂️
Hallo, hast du Geschlecht dummy-codiert und es hat mehr als zwei Ausprägungen, also neben männlich und weiblich noch divers? Ansonsten sollte es, wenn es dichotom ist, nur einmal auftauchen. Viele Grüße, Björn.
@@StatistikamPC_BjoernWalther vielen Dank, so langsam habe ich es raus. :) Ist Schrittweise Regression eigentlich das Selbe wie Hierarchische Regression? In SPSS nimmt man die verschiedenen UVs schrittweise auf. Könnte man aber auch im 1. schritt eine (normale) lineare Regression mit mehreren UV in einer Model 1 speichern. Dann im 2 schritt eine neue hierarchische Regression untersuchen indem das Model 1 zuzüglich eine UV aufgenommen wird? Viele Grüße
Danke, nicht ganz. Schrittweise überlässt SPSS die Reihenfolge des Einschlusses, wohingegen bei hierarchisch über den Block der Anwender die Reihenfolge bestimmt. Viele Grüße, Björn.
Hey Björn, vielen Dank für deine Videos:) Ich hätte noch eine Frage, sind bei der schrittweisen multiplen Regresssion die Voraussetzungen die gleichen wie bei der "normalen" multiplen linearen Regression? Viele Grüße
Hallo Lea, Recht hast du, es gibt keine blöden Fragen. :-D Also, schrittweise unterscheidet sich von hierarchisch dahingehend, dass schrittweise die im Video genannenten Kriterien hinsichtlich der Signifikanz über Aufnahme und Verbleib der UV entscheiden und jede Variable quasi einzeln geprüft wird. Bei hierarchisch wird das ganze blockweise gemacht, ein Block kann natürlich auch nur aus einer Variable bestehen. Du gibst aber die Reihenfolge der Aufnahme der Variable(n) vor. Das Modell wird dir bei hierarchischer Regression auch noch mal in Gänze angegeben, was auch hilfreich sein kann. Viele Grüße, Björn.
NEIN! Das habe ich nämlich auch verwechselt, weil wir im Studium gelernt haben, dass man bei hierarchischer Regression Schritt für Schritt vorgeht. Das ist also sehr ungünstig ausgedrückt, aber nun mal die Wahrheit. Sehr ärgerlich für mich, dass ich das zusammengewürfelt und meine Berechnungen nun falsch gemacht habe. Ansonsten hat mir das Video sehr geholfen, aber es wäre vielleicht nochmal sinnvoll, darauf hinzuweisen, dass es leicht missverständlich ist, z.B. Hinweis in der Erklärung oder als gesetzten Kommentar, der oben auftaucht. Hierarchisch: man verwendet “Einschluss“ statt "schrittweise" und muss mit “Weiter“ die einzelnen Modelle nacheinander definieren.
Schön wäre eine solche Anleitung über die Syntax, denn in der Uni ist es uns verboten die Reiter zu nutzen und bislang gibt es leider keine Hilfestellungen im Netz, die den Weg der Syntax gehen.
Hallo Lisa, du kannst einfach am Ende des Dialogfeldes auf einfügen klicken und bekommst dann den Syntax. Das eine Uni die Dialogfelder "verbietet" wäre mir auch neu. Ihr sollt vermutlich über die Syntax arbeiten, um wir Ergebnisse besser reproduzieren zu können. Viele Grüße, Björn. P.S. etwas zynisch: wenn deine Uni wert aufb dir Syntax legt, sollte sie auch wert auf KEINE schrittweise Regression legen, da diese eigentlich totaler Quatsch ist. ;-)
Lieber Björn, du rettest mir mit deinen unglaublich kompetenten Videos meine Masterarbeit. Vielen herzlichen Dank! Ich wüsste gar nicht, was ich momentan ohne die Videos machen würde... Mach weiter so! Liebe Grüße!
Danke!
Gerne und danke für den Super Thanks!
Toll wäre auch ein Tutorial zu hierarchisch-moderierter/mediierter Regression :)
Puh, da muss ich mal schauen, wie das möglichst schmerzfrei funktioniert. ;-)
@@StatistikamPC_BjoernWalther So ein Video würde mir auch sehr weiterhelfen!
@@StatistikamPC_BjoernWalther Gibt es inzwischen ein Video zur hierarchisch-moderierter Regression? Ich hab jetzt so viele Videos geschaut aber weiss immer noch nicht wo ich anfangen soll :(
Hallo, vielen Dank für das Video. Ich habe noch eine Frage zur Prädiktorenaufnahme, wenn man theoriegeleitet vorgeht: Wann verwende ich Einschluss und wann eher Blockweise?
Hallo Rebecca,
Einschluss nimmt alle UV gleichzeitig auf, wohingegen Blockweise jeweils die vorherige Definition der UV in einem Block erfordert. Ein Block kann auch nur aus einer UV bestehen, eine Begründung für Größe und Reihenfolge sollte hier aber vorhanden sein.
Viele Grüße, Björn.
Hallo Björn, erstmal vielen Dank für die vielen tollen Videos. Gefühlt habe ich jedes SPSS-Video gesehen und dabei über die Jahre viel gelernt. Eine Frage zur schrittweisen Regression und deren Anwendung habe ich nach dem Video: Ich habe 7 UVs und 1 AV. Ich schaue mir an, ob z. B. das Geschlecht, das Einkommen, das Alter, etc. einen Einfluss auf die Lebenszufriedenheit haben. Das alles wird mit Theorie am Anfang der Arbeit begründet und in Hypothesen formuliert. Der Grundgedanke der Arbeit ist es sich anzuschauen: "Was hat alles einen Einfluss auf die Lebenszufriedenheit und was ist nicht relevant?". Ist es dann trotzdem nicht "sauber" eine schrittweise Regression zu rechnen, auch wenn man Theorie und Hypothesen hat oder würde das in einem solchen Fall gehen? Was empfiehlst du in einem solchen Fall?
LG und nochmal danke!
Hallo und danke für dein Lob! Freut mich, wenn dir meine Videos helfen konnte.
Zu deiner Frage: gibt es denn einen Grund, warum du schrittweise vorgehen möchtest? Wenn du alle UV's theoriebasiert hergeleitet hast, gibt es m.M.n.keinen Grund schrittweise vorzugehen. Vielmehr lohnt sich die alleinige Rechnung eines vollständigen Modells und Betrachtung der Ergebnisse. Mit diesen Ergebnissen sieht man auch, welche Einflüsse beobachtet werden können und wie deren Richtung und Stärke ist. Wenn du am Ende wieder "nicht signifikante" Variablen ausschließt, ändern sich andere Signifikanzen auch immer, weil die Korrelation der UV untereinander entscheidend ist und der größte Vorteil eines vollständigen Modells vs. schrittweisem Vorgehen ist.
Man könnte m.M.n. maximal Kontrollvariablen in einen Block und die dich interessierenden UV in einen anderen Block aufnehmen, um die Verbesserung für das Modell durch die Beachtung von Kontrollvariablen zu quantifizieren.
Viele Grüße, Björn.
Hey Björn, wann würde man eine schrittweise Regression denn dann empfehlen, umgekehrt? Würde man bei einer multiplen linearen Regressionsanalyse eher schrittweise durchführen (statt "Einschluss"), wenn relativ viele unabhängige Variablen (13) im Modell enthalten sind und man bereits Fehlermeldungen in der Rechnung (perfekte Übereinstimmung; Einflussstatistiken können nicht berechnet werden) angezeigt bekommt? So wie ich das verstehe, ist mein Modell zu komplex (Overfitting) und wenn ich das Modell "zerlege" in schrittweise Regression, wäre das dann besser?
Hallo, an sich ist schrittweise v.a. dann sinnvoll, wenn man die Zunahme des Modellfits (R²) betrachten möchte, wenn man Variablen von Interesse und Kontrollvariablen in verschiede Blöcke auftrennt. Wenn das Modell overfitted, wäre mein erster Schritt die Variable(n), die am unwahrscheinlichsten (idealerweise theoretisch-konzeptionell begründet) einen Einfluss auf die AV ausüben, auszuschließen, um wieder ein paar Freiheitsgrade zu gewinnen, die bei dir scheinbar sehr gering sind.
Das "Zerlegen" des Modells ist vermutlich nur eine Behandlung des Symptoms Overfitting, behebt jedoch nicht das zugrundeliegende Problem, dass zu viele UV auf zu wenige Beobachtungen stoßen. Hast du im Vorfeld eine Poweranalyse gemacht bzw. wie ist das Verhältnis zwischen UV und Beobachtungen?
Viele Grüße, Björn.
@@StatistikamPC_BjoernWalther Hey Björn (: lieben Dank für deine Antwort. Also viell. als Info zum Modell, ich habe eine (übergeordnete) AV (in zwei Summenindizes umgerechnet, da die AV 1x offline; 1x online etwas bemisst, extra mit SUM.-Funktion gearbeitet wg. fehlender Werte). Mein Datensatz hat 1.300 Fälle (also recht viele). Mein Regressionsmodell (ich rechne insg. 2 Modelle wg. der "gesplitteten" AV, die UVs bleiben stets gleich) hat 10 UVs. Leider sind alle relevant (theoretisch abgeleitet) und ich kann keine der UVs ausschließen.
Eine Poweranalyse habe ich nicht gemacht, das sagt mir leider nicht so viel gerad.
Meinst du mit Beobachtungen die Effekte nach der Regression? (ah doofe Frage sry)
Bei beiden Regressionsmodellen (wenn mit allen 1.300 Fällen gerechnet) sind die Modelle signifikant (wenn auch kaum bis gar keine Effekte zwischen AV und UVS vorliegen). Wenn ich den Datensatz zudem VOR der Regression nach Altersgruppen aufteile (also gruppenweise ausgeben lasse, da ich bestimmte Zusammenhänge zw. Altersgruppen vergleichen will), dann kommt im Ausgabefenster für die Regressionsergebnisse entweder die Warnung, dass "Einflussstatistiken nicht berechnet werden können, da die Variable Altersgruppen eine perfekte Übereinstimmung mit meiner AV aufweist" ODER die Warnung bleibt aus, wenn ich SPSS neu starte, aber bei einer der beiden AVs (jene, die online etwas bemisst), sind die Modelle nicht mehr signifikant und es stehen "." in Spalten und Zeilen und auch die ANOVA sagt bereits, dass das Modell nicht mehr gegen den Zufall abgesichert ist. Ich habe gedacht, es läge Overfitting vor. Sry für den langen Text o.O
Ein riesiges Dankeschön.
Danke für dein Lob!
Viele Grüße, Björn.
Lieber Björn, ich hoffe du kannst mir eine Frage zu einer moderierten hierarchischen Regression beantworten:
Ich muss eine multiple + moderierte Regression rechnen, empfohlen wurde nun ebenfalls eine hierarchische Regression. Allerdings hat meine UV 5 weitere Teil-UVen. Kann ich mit all diesen überhaupt eine moderierten hierarchischen Regression rechnen? Wenn ja, wie wäre die Schreibweise für R?
step1
Hallo Liva,
wenn ich dich richtig verstehe, hast du eine UV, die sich aus 5 Subskalen zusammensetzt, die du jetzt einzeln jeweils mit einem Moderator multipliziert in dein Modell aufnimmst.
Prinzipiell kannst du das schrittweise rechnen. Zwar geht das auch manuell, man kann aber auch mit der train()-Funktion aus dem caret-Paket den Arbeitsablauf reduzieren. Die Pakete leaps und MASS sind auch notwendig. Eine gute Anleitung in Schriftform findest du hier: www.sthda.com/english/articles/37-model-selection-essentials-in-r/154-stepwise-regression-essentials-in-r/
Viele Grüße, Björn.
@@StatistikamPC_BjoernWalther vielen Dank, das hilft mir sehr!
Hi Björn, erstmal deine Videos sind schonmal sehr hilfreich und gut erklärt, danke dafür :) Ich habe aber mal eine kleine Frage bzgl eines Details des Videos. Bei dem Regressionskoeffizient fuer den Intelligenzquotienten verändert sich das Beta ja stark wenn man nun die Motivation hinzufügt. Ich habe in einigen englischseitigen Webseiten gelesen, dass dies problematisch sein kann (confounding). Hat das multiples Regressionsmodell trotzdem noch seine Gültigkeit und man kann seine Hypothesen testen oder nicht ? Danke im Voraus fuer jede Antwort, hoffe man versteht was ich meine :)
Hallo Yutaka, danke für dein Lob!
Schrittweise Regression sollte eigentlich nicht gerechnet werden, schon gar nicht, wenn man Hypothesen hat und ein "Endmodell" rechnen muss - ich zeige das Vorgehen nur der Vollständigkeit wegen.
Der von dir angesprochenen confounding-Aspekt ist natürlich bei jedweder empirischer Forschung zu bedenken und im Vorfeld sollten solche möglichen Einflussfaktoren bedacht und benannt werden, um sie schlussendlich in Experimentalsettings (v.a. klinischer Natur) kontrollieren zu können. Natürlich ist es meist nicht so einfach und man hat die Daten bereits und kann dann lediglich im Nachgang auf mögliche Störeinflüsse hinweisen.
Viele Grüße, Björn.
Ist mit der schrittweisen Regression die blockweise Regression gemeint ? Ist das das gleiche?
Hallo, umgangssprachlich wird das oft vermischt. In SPSS wird blockweise von dir definiert, was aufgenommen werden soll. Bei schrittweiser Regression wird in SPSS wird anhand von p-Werten entweder ein Modell aufgebaut oder zusammengekürzt. Schrittweise ist in diesem Sinne (und meiner Meinung nach unwissenschaftlich), weil ich im Vorfeld das Modell hergeleitet habe und dieses teste und dann nicht anfange die gemachtenÜberlegungen über den Haufen zu schmeißen und anhand des p-Wertes zusammenstreiche.
Viele Grüße, Björn.
Lieber Björn,
vielen Dank für das tolle Video, du hast mir echt geholfen! Eine Frage habe ich aber noch, wie bzw. wann und wo kann man Kontrollvariablen in die Regression aufnehmen?
Liebe Grüße!
Lieber Björn, vielen Dank! Kann ich dieses Vorgehen verwenden, wenn ich Kontrollvariablen in meinem Modell Regressionsmodell habe?
Hallo Linda, ja, das funktioniert dann analog.
Viele Grüße, Björn.
Hallo Björn, Vielen Dank für das hilfreiche Video!
Mich würde nun interessieren, warum in der Tabelle Koeffizienten der Wert vom Intelligenzquotienten von 1. Schritt zum 2. Schritt sich verändert. Hast du dafür eine Antwort? Danke Dir! :)
Kann es sein dass die schrittweise Regression auch "manuell" geht, indem man auf Lineare Regression geht und dann im Fenster in dem Bereich "Block" über den Button "Nächste" immer die Variablen hinzufügt, die man jeweils schrittweise aufnehmen will? Denn dadurch st es möglich, auch mehrere unabhängige Variablen in jeweils einem einzigen Schritt zu ergänzen.
Hallo, ja, das geht auch.
Viele Grüße, Björn.
@@StatistikamPC_BjoernWalther cool dass du geantwortet hast! Ich habe ein Frage, bin grad ein wenig am verzweifeln… und teste ich für meine Regression im ersten Modell einen Effekt, um ihn im zweiten Modell um sozioökonomische kontrollvariablen zu erweitern und im dritten um noch weitere Kontrollvariablen zu erweitern.
In einer separaten Regressionsanalyse habe ich den Effekt nochmal getestet. Dabei kamen andere Ergebnisse raus (R und die Coef.) als in dem Test des Effekts im ersten Modell des dreistufigen modells. Wie kann das sein?
@Björn Lieber Björn, vielen Dank für deine tollen videos! Ich hätte eine Frage und zwar habe ich einen Persönlichkeitsfragebogen D benutzt der zusätzlich zu der dunklen Triade 8 weitere Sub-Skalen enthält. Ich will jetzt herausfinden ob der Persönlichkeitsfragebogen D besser beim vorhersagen von Inzivilität ist als die dunkle Triade. Kannst du mir da weiterhelfen?
Hallo Björn, danke für dieses hilfreiche Video! :) Ich habe dazu eine Frage (und hoffe ich bin damit nach über 2 Jahren nach dem Upload nicht zu spät):
Ich habe vor, neben meiner hypothesengeleiteten multiplen Regression (mit 2 Prädiktoren) explorativ herauszufinden, welcher der beiden Prädiktoren signifikant mehr Varianz in der AV aufklärt. Eine Idee dabei wäre, durch eine schrittweise Regression, die beiden standardisierten Regressionsgewichte bzw. die beiden Korrelationen zu vergleichen, und den Zuwachs im Determinationskoeffizienten zu berichten. Aber kann ich außer, neben diesem eher deskriptiven Ergebnis, auch eine Aussage über Signifikanz treffen? Also, dass ich sagen kann, dass z.B. UV1 signifikant mehr in der AV vorhersagt als UV2? Kann ich dazu vielleicht die beiden t-Werte, die ich jeweils für die Prädiktoren in der multiplen Regression ausgegeben bekomme, auf Unterschiedlichkeit testen?
Liebe Grüße!
Hallo Anne und danke für dein Lob! Ich versuche immer noch jeden Kommentar zu beantworten, obgleich es natürlich nicht weniger werden. ;-)
Zu deiner Frage: Signifikanz ist die Fehlerwahrscheinlichkeit für den Fehler 1. Art. Signifikanzen vergleicht man allerdings nicht, weil es wie gesagt Fehlerwahrscheinlichkeiten sind. Entweder UV sind signifikant oder nicht. Was dich interessiert ist die gleichzeitige Aufnahme beider UV und das Einschätzen der Einflussstärke auf die AV. Das entscheidet man mittels des betragsmäßig größten standardisierten Koeffizienten.
Viele Grüße, Björn.
Hallo Björn,
bedanke mich ganz herzlich für die ganzen tollen Video von Dir!
Das hat mir und bestimmte vielen anderen sehr geholfen :)
Habe die folgenden drei Fragen an Dich:
I. Gilt die Kritik (keine hypothesenbasiertes theoretisch konzeptionell fundiertes Vorgehen), die für die schrittweise Regression verwendet wurde (expoloratives Verfahren etc.) auch für die Backward Elimination?
II. Kommt oder sollte bei der schrittweisen Regression eigentlich dassgleiche herauskommen wie bei der Backwards Elimination
bzw. der Forward Selektion?
III. Welches von den drei Verfahren (Backward, Forward oder schrittweise Regression) würdest Du persönlich eher empfehlen und wäre ggf. zuverlässiger? Ich habe gedacht, dass die schrittweise Regression beide Verfahren (Backward & Forward) miteinander verbindet und zwar so, dass dieses Verfahren zu bevorzugen wäre!? Oder wäre eine Kombination vielleicht sinnvoll?
Bedanke mich im Voraus für die Antwort! :)
Hallo Ilia und danke für dein Lob! Freut mich, wenn dir die Videos helfen! :-)
Zu deinen Fragen:
I) Meiner Meinung nach eindeutig ja. Im Zweifel kann der Gutachter aber auch davon absehen - nicht jeder sieht es so streng. Da gibt es gegensätzliche Ansichten zu und das wird sicher auch so bleiben.
II) Häufig wird das gleiche rauskommen, je mehr Variablen du hast, desto eher wird aber eine andere Modellschätzung vorgenommen und es werden unterschiedliche Variablen im Modell verbleiben/aufgenommen. Man muss natürlich auch mit der SIgnifikanz aufpassen. Bei vorwärts ist standardmäßig =0,1 ausgeschlossen. Deswegen sehe ich es bei I auch so streng. ;-)
III) Wenn, dann würde ich wohl schrittweise rechnen und als Ausschlusswahrscheinlichkeit >=0,051 festlegen. Ich bin aber ohnehin immer auf eine simultane Schätzung aller x-Variablen aus, weil man sich ja schon die gedankliche Arbeit macht, welche x-Variablen alle GLEICHZEITIG auf die y-Variable wirken und das sollte man entsprechend auch so testen.
Viele Grüße, Björn.
Danke für das Video, kann man sich am Ende auch eine Formel ausgeben lassen, in die alle Variablen, die in die schrittweise Regression aufgenommen wurden, auch einfließen? Sodass quasi jeder die Wahrscheinlichkeit für das Ereignis X berechnen kann?
Hallo, nein, diese Funktion bietet SPSS nicht an.
Viele Grüße, Björn.
Bei mir kommt eine Fehlermeldung, wenn ich eine schrittweise Regression durchführen möchte bzw. es steht: "Für die Gleichung wurden keine Variablen angegeben." Was habe ich falsch gemacht?
Wie viele Variablen hast du und wie sind sie skaliert?
Viele Grüße, Björn.
Danke für das Video!
Ich habe jedoch eine Frage: Warum ändert sich das B und das Beta des Intelligenzquotienten vom Modell 1 zum Modell 2 also durch die Aufnahme der Motivation?
Hallo, das liegt an den anderen aufgenommenen x-Variablen und deren jeweiliger Einflüsse auf die Y-Variable. Ausführlicher auch hier: ua-cam.com/video/VQKBEFHLw6g/v-deo.html
Viele Grüße, Björn.
Hallo, müssten die Variablen die ordinal skaliert sind z.B. Motivation nicht umgewandelt werden in Dummy-Variablen?
Hallo Laura, das ist nur bei nominal skalierten notwendig. Bei ordinal skalierten Daten können diese so wie ursprünglich codiert im Modell verbleiben.
Viele Grüße, Björn.
Kleine Frage: Wenn ich für Model 2 das korregierte R^2 nehme, sollte ich dann auch die Änderung des R^2 auf Basis des Korregierten R^2 berechnen. In diesem Fall also nicht 0,07 (0,898-0,828) Änderung im R^2, sondern 0,066 (0,894-0,828)
Hallo, neben R², korrigiertem R² sollte man auch die Änderung von R² berichten.
Viele Grüße, Björn.
Hey Björn, eine Frage wie sieht es aus, wenn bei dem Modell die Variable Geschlecht sowohl bei den Koeefizienten auftaucht, als auch bei den Ausgeschlossenen Variablen? 🤷♂️
Hallo, hast du Geschlecht dummy-codiert und es hat mehr als zwei Ausprägungen, also neben männlich und weiblich noch divers? Ansonsten sollte es, wenn es dichotom ist, nur einmal auftauchen.
Viele Grüße, Björn.
@@StatistikamPC_BjoernWalther vielen Dank, so langsam habe ich es raus. :) Ist Schrittweise Regression eigentlich das Selbe wie Hierarchische Regression?
In SPSS nimmt man die verschiedenen UVs schrittweise auf.
Könnte man aber auch im 1. schritt eine (normale) lineare Regression mit mehreren UV in einer Model 1 speichern.
Dann im 2 schritt eine neue hierarchische Regression untersuchen indem das Model 1 zuzüglich eine UV aufgenommen wird? Viele Grüße
Super Viedo, ist hierachische Regreesion ein Synonym für eine schrittweise selektion?
Danke, nicht ganz. Schrittweise überlässt SPSS die Reihenfolge des Einschlusses, wohingegen bei hierarchisch über den Block der Anwender die Reihenfolge bestimmt.
Viele Grüße, Björn.
Hey Björn, vielen Dank für deine Videos:) Ich hätte noch eine Frage, sind bei der schrittweisen multiplen Regresssion die Voraussetzungen die gleichen wie bei der "normalen" multiplen linearen Regression? Viele Grüße
Hallo Marie, ja, da ändert sich nichts.
Viele Grüße, Björn.
Sehr angenehm!
Dankeschön! Viel Erfolg weiterhin!
Viele Grüße, Björn.
Blöde Fragen gibt es ja nicht... ;-) Ist schrittweise Regression dasselbe wie hierarchische Regression???
Hallo Lea, Recht hast du, es gibt keine blöden Fragen. :-D
Also, schrittweise unterscheidet sich von hierarchisch dahingehend, dass schrittweise die im Video genannenten Kriterien hinsichtlich der Signifikanz über Aufnahme und Verbleib der UV entscheiden und jede Variable quasi einzeln geprüft wird. Bei hierarchisch wird das ganze blockweise gemacht, ein Block kann natürlich auch nur aus einer Variable bestehen. Du gibst aber die Reihenfolge der Aufnahme der Variable(n) vor. Das Modell wird dir bei hierarchischer Regression auch noch mal in Gänze angegeben, was auch hilfreich sein kann.
Viele Grüße, Björn.
NEIN! Das habe ich nämlich auch verwechselt, weil wir im Studium gelernt haben, dass man bei hierarchischer Regression Schritt für Schritt vorgeht. Das ist also sehr ungünstig ausgedrückt, aber nun mal die Wahrheit. Sehr ärgerlich für mich, dass ich das zusammengewürfelt und meine Berechnungen nun falsch gemacht habe. Ansonsten hat mir das Video sehr geholfen, aber es wäre vielleicht nochmal sinnvoll, darauf hinzuweisen, dass es leicht missverständlich ist, z.B. Hinweis in der Erklärung oder als gesetzten Kommentar, der oben auftaucht. Hierarchisch: man verwendet “Einschluss“ statt "schrittweise" und muss mit “Weiter“ die einzelnen Modelle nacheinander definieren.
Schön wäre eine solche Anleitung über die Syntax, denn in der Uni ist es uns verboten die Reiter zu nutzen und bislang gibt es leider keine Hilfestellungen im Netz, die den Weg der Syntax gehen.
Hallo Lisa, du kannst einfach am Ende des Dialogfeldes auf einfügen klicken und bekommst dann den Syntax.
Das eine Uni die Dialogfelder "verbietet" wäre mir auch neu. Ihr sollt vermutlich über die Syntax arbeiten, um wir Ergebnisse besser reproduzieren zu können.
Viele Grüße, Björn.
P.S. etwas zynisch: wenn deine Uni wert aufb dir Syntax legt, sollte sie auch wert auf KEINE schrittweise Regression legen, da diese eigentlich totaler Quatsch ist. ;-)