Ich verstehe das bei 9:40 nicht. War das Vorzeichen da nicht negativ? Also müsste es dann nicht heißen, dass die Chance für eine Frau 0,243 geringer ist? Sonst ist die Chance ja in beiden Fällen (männlich und weiblich) positiv.
Die Chance ist für Frauen nicht um 0,243 höher, sondern 0,243 mal so hoch. Im Ergebnis erkranken Frauen also 1 * 0,243 = 0,243 so häufig wie Männer. Oder anders betrachtet erkranken Männer 1 / 0,243 = 4,11 mal so häufig wie Frauen :)
Vielen Dank für deine Videos, die helfen echt sehr! Könntest du in einem Video erklären wie man diese binär-logistische Regression graphisch darstellen kann?
Hallo Lukas, das ist eher unüblich. Evtl. hilft dir das aber: stats.idre.ucla.edu/spss/code/graphing-results-in-logistic-regression/ Viele Grüße, Björn.
Ich interpretiere die metrischen Koeffizienten meiner logistischen Regression in Prozent (Anstieg der unabhängigen Variable um 1 steigert/senkt die Wahrscheinlichkeit, dass Krankheit als abhängige Variable eintritt um x Prozent), indem ich sie wie folgt transformiere: (exp(model$coefficients)-1) Das sollte auch in Ordnung sein, oder? P.s.: gilt der linktest auch als F-Test des logistischen Modells zur Beurteilung der Modellsignifikanz an sich?
Hi eine Frage, wenn ich einen Standartfehler habe der bei 0,7 liegt, was bedeutet das bei einem binominalen GLM. Kann ich den Prädiktor dann überhaupt sinvoll als signifikant einstufen, selbst wenn der p-Wert signifikant ist?
Hallo! vielen Dank für dein tolles Video!! wie sieht das ganze aus wenn ich noch fixe Effekte (year und Sektor) mit einbaue! sitze schon seit tagen daran und bekomme es leider einfach nicht hin
Hallo:) vielen Dank erstmal für das tolle Erklärvideo :) ich hätte eine Frage: wenn ich die binär logistische Regression mit nur einer unabhängigen Variable berechne kommen komplett unterschiedliche Werte (egal ob Exp(B) oder Sign.) raus, als wenn ich mehrere unabhängige Variablen mit reinnehme. Woran liegt das bzw. was ist dann "richtig"? und wenn der Omnibus-Test nicht signifikant ist, macht das meine gesamte Berechnung dann "irrelevant" ? Dankeschön!!
Kurze und vielleicht dumme Rückfrage, aber hätte ich nur ein Signifikanzniveau von 0.1 bei manchen unabhängigen Variablen und bei den restlichen sogar ein noch höheres würde ich das Modell dann komplett verwerfen?
Was sagt dir denn der Omnibustest für dein Testmodell? Ich denke, der wird dich bereits zum Verwerfen des Modells führen. Ist der jedoch signifikant, erklärt dass Modell per se erstmal etwas und die Koeffizienten musst du dir anschauen. Da wärst du allerdings recht schnell fertig, da alle über .1 sind. Viele Grüße, Björn.
Super Video, danke dir! :) Hättest du zufällig auch einen Ratschlag, wie sich der Output und die Modellgüte bei einem Datenvektor testen lassen, also bei svyglm() ? Daran hapert es aktuell in unserer Gruppe...
Hallo, bei Field (2012) Discovering Statistics Using R im 8. Kapitel zur logistischen Regression (ab S. 312) - die genaue Stelle habe ich aber nicht parat. Viele Grüße, Björn.
@@StatistikamPC_BjoernWalther Vielen Dank, das hilft mir :) Echt super Videos, du hast mir schon bei meiner letzten Hausarbeit durch deine Videos gut helfen können. Finde es auch krass, wie viel Content du raushaust, meine Abobox kommt mir manchmal, wie ein Semesterplan für ein Seminar vor :P
Hallo, der Datensatz ist auf meiner Homepage im Artikel verlinkt: bjoernwalther.com/binaer-logistische-regression-in-r-rechnen-und-interpretieren/ Viele Grüße, Björn.
Hallo, könntest du mir vielleicht erklären, wie man bei einer binär-logistischen Regression die Stichprobengröße berechnet mit G*Power oder durch andere Möglichkeiten? Ich muss dies in meiner Bachelorarbeit anwenden und vorher noch einen Chi-Quadrat Test durchführen. Liebe Grüße 😊
Vielen Dank für die super Erklärung. Ich schreibe in den kommenden Monaten meine Masterarbeit und werde genau dieses Verfahren verwenden. Ich wollte zusätzlich noch den Interaktionseffekt der UVs (kategorial) untersuchen. Ist das mit diesem Verfahren möglich? Gibt es dazu hilfreiche Literatur?
Vielen lieben Dank für deine Videos! Ich sitze gerade an einer ähnlichen Aufgabe, weiß aber nicht wie ich mein Odds Ratio interpretieren soll. In meinem Dataframe ist das Geschlecht als character und nicht als 0 und 1 definiert. Nach der summary gibt mir r direkt eine Zeile mit sexmale aus und einem signifikanten p-Wert. Wenn ich mir dann die Odds Ratio rausziehe, bekomme ich den Wert 0.79 für Sexmale. Könnte man dann sagen, die Wahrscheinlichkeit als Mann an einem Experiment teilzunehmen (die Aufgabe) ist um 21% geringer, als als Frau? Hoffe du verstehst :-) Vielen Dank schonmal!
Hallo, ich würde das Geschlecht eher als Faktor hinterlegen, damit ich weiß, was männlich und was weiblich ist und wie dann die Referenzkateogrie ist und was das OR dann letztlich bedeutet. Viele Grüße, Björn.
Hey, ich bin gerade erst auf den Kanal gestoßen und wir machen gerade genau dieses Thema (zwar in spss aber r ist nie verkehrt zu wissen), also schonmal danke, die videos sind top :D Ich hätte im folgenden mal eine Frage, ein Rätsel für dich(oder die community). Wir haben das in Statistik zu gemischten Modellen gemacht und mein prof gibt als preis für die antwort der Frage ein Lehrbuch und Eis aus, wäre also echt super wenn mir wer helfen könnte :D Folgendes Problem: Datensatz mit einer intervallskalierten abhängigen Variable. Es gibt: die festen faktoren/Kovariaten: "quality" mit "easy" und "difficult" als auswahlmöglichkeiten "size" mit größe 3 oder 5 Es wird ein gemischtes lineares Modell berechnet in dem wir auch den Interaktionseffekt Quality*size anschauen. Wenn wir das nun mit "size" als kovariate und quality als festen faktor(kategorial) ausrechnen kommt kein interaktionseffekt raus und beide Haupteffekte sind signifikant. NUN ZUM PROBLEM: Man könnte auf die Idee kommen, size als festen faktor auszuwählen, da er eh nur 2 Ausprägungen hat. An den Ergebnissen ändert sich nichts, AUßER, dass der Haupteffekt von "quality" verschwindet (p geht von 0.001 zu 0.967, F ist gegen 0). Tipp vom prof: "Hinweis: Es hat mit korrelierten Prädiktoren zu tun und so ein bisschen ist es auch ein Simpson-Paradox." [es wird zudem clusterrandomisiert, das sollte hier aber eigentlich keinen einfluss haben glaube ich]
📘Mein Buch "Statistik mit R - Schnelleinstieg": amzn.to/3OzeLJI [Affiliatelink]
Danke übrigens für die 1,0 in meiner Hausarbeit in Datenanalyse.
Top Video!
tolles Video! Rettest mir wieder mal den A**** 🙂
Ich verstehe das bei 9:40 nicht. War das Vorzeichen da nicht negativ? Also müsste es dann nicht heißen, dass die Chance für eine Frau 0,243 geringer ist? Sonst ist die Chance ja in beiden Fällen (männlich und weiblich) positiv.
Die Chance ist für Frauen nicht um 0,243 höher, sondern 0,243 mal so hoch. Im Ergebnis erkranken Frauen also 1 * 0,243 = 0,243 so häufig wie Männer. Oder anders betrachtet erkranken Männer 1 / 0,243 = 4,11 mal so häufig wie Frauen :)
@@BartwurstGaming Ah 0,243 bei den Frauen und 4,11 bei den Männern sagen also genau das geiche aus, nur andersherum formuliert. Vielen Dank :)
Vielen Dank für deine Videos, die helfen echt sehr! Könntest du in einem Video erklären wie man diese binär-logistische Regression graphisch darstellen kann?
Hallo Lukas, das ist eher unüblich. Evtl. hilft dir das aber: stats.idre.ucla.edu/spss/code/graphing-results-in-logistic-regression/
Viele Grüße, Björn.
Ich interpretiere die metrischen Koeffizienten meiner logistischen Regression in Prozent (Anstieg der unabhängigen Variable um 1 steigert/senkt die Wahrscheinlichkeit, dass Krankheit als abhängige Variable eintritt um x Prozent), indem ich sie wie folgt transformiere: (exp(model$coefficients)-1)
Das sollte auch in Ordnung sein, oder?
P.s.: gilt der linktest auch als F-Test des logistischen Modells zur Beurteilung der Modellsignifikanz an sich?
Hi eine Frage, wenn ich einen Standartfehler habe der bei 0,7 liegt, was bedeutet das bei einem binominalen GLM. Kann ich den Prädiktor dann überhaupt sinvoll als signifikant einstufen, selbst wenn der p-Wert signifikant ist?
Vielen Dank für das Video. Leider ist es mir noch nicht klar, wieso wir das Nullmodell berechnen, wenn danach nicht mehr damit gerechnet wird?
Hallo! vielen Dank für dein tolles Video!! wie sieht das ganze aus wenn ich noch fixe Effekte (year und Sektor) mit einbaue! sitze schon seit tagen daran und bekomme es leider einfach nicht hin
Hallo:) vielen Dank erstmal für das tolle Erklärvideo :) ich hätte eine Frage: wenn ich die binär logistische Regression mit nur einer unabhängigen Variable berechne kommen komplett unterschiedliche Werte (egal ob Exp(B) oder Sign.) raus, als wenn ich mehrere unabhängige Variablen mit reinnehme. Woran liegt das bzw. was ist dann "richtig"? und wenn der Omnibus-Test nicht signifikant ist, macht das meine gesamte Berechnung dann "irrelevant" ? Dankeschön!!
Kurze und vielleicht dumme Rückfrage, aber hätte ich nur ein Signifikanzniveau von 0.1 bei manchen unabhängigen Variablen und bei den restlichen sogar ein noch höheres würde ich das Modell dann komplett verwerfen?
Was sagt dir denn der Omnibustest für dein Testmodell? Ich denke, der wird dich bereits zum Verwerfen des Modells führen. Ist der jedoch signifikant, erklärt dass Modell per se erstmal etwas und die Koeffizienten musst du dir anschauen. Da wärst du allerdings recht schnell fertig, da alle über .1 sind.
Viele Grüße, Björn.
Super Video, danke dir! :) Hättest du zufällig auch einen Ratschlag, wie sich der Output und die Modellgüte bei einem Datenvektor testen lassen, also bei svyglm() ?
Daran hapert es aktuell in unserer Gruppe...
Sehr gutes Video, danke dir. Hast du zufällig eine Literaturempfehlung, woraus ich das Verfahren zum Omnibustest zitieren könnte?
Hallo, bei Field (2012) Discovering Statistics Using R im 8. Kapitel zur logistischen Regression (ab S. 312) - die genaue Stelle habe ich aber nicht parat.
Viele Grüße, Björn.
@@StatistikamPC_BjoernWalther Vielen Dank, das hilft mir :)
Echt super Videos, du hast mir schon bei meiner letzten Hausarbeit durch deine Videos gut helfen können. Finde es auch krass, wie viel Content du raushaust, meine Abobox kommt mir manchmal, wie ein Semesterplan für ein Seminar vor :P
Danke für das Video! :) Muss für die binäre logistische Regression nach Homoskedastizität geprüft werden?
Hallo, nein, die einzige Voraussetzung, die noch zu prüfen ist, ist Multikollinearität.
Viele Grüße, Björn.
Können Sie den Link zu den Daten geben? Vielen Dank
Hallo, der Datensatz ist auf meiner Homepage im Artikel verlinkt: bjoernwalther.com/binaer-logistische-regression-in-r-rechnen-und-interpretieren/
Viele Grüße, Björn.
Kommt auch noch ein Video zur multinomialen logistischen Regression? LG😉
Ist in Planung. ;-)
@@StatistikamPC_BjoernWalther Das Thema würde mich auch total interessieren :)
Supder Video, kannst du vielleicht erklären warum wir bei der logistischen Regression immer Heteroskedastizität vorliegen haben?
Hallo, könntest du mir vielleicht erklären, wie man bei einer binär-logistischen Regression die Stichprobengröße berechnet mit G*Power oder durch andere Möglichkeiten?
Ich muss dies in meiner Bachelorarbeit anwenden und vorher noch einen Chi-Quadrat Test durchführen.
Liebe Grüße 😊
Vielen Dank für die super Erklärung. Ich schreibe in den kommenden Monaten meine Masterarbeit und werde genau dieses Verfahren verwenden. Ich wollte zusätzlich noch den Interaktionseffekt der UVs (kategorial) untersuchen. Ist das mit diesem Verfahren möglich? Gibt es dazu hilfreiche Literatur?
Vielen lieben Dank für deine Videos! Ich sitze gerade an einer ähnlichen Aufgabe, weiß aber nicht wie ich mein Odds Ratio interpretieren soll. In meinem Dataframe ist das Geschlecht als character und nicht als 0 und 1 definiert. Nach der summary gibt mir r direkt eine Zeile mit sexmale aus und einem signifikanten p-Wert. Wenn ich mir dann die Odds Ratio rausziehe, bekomme ich den Wert 0.79 für Sexmale. Könnte man dann sagen, die Wahrscheinlichkeit als Mann an einem Experiment teilzunehmen (die Aufgabe) ist um 21% geringer, als als Frau? Hoffe du verstehst :-) Vielen Dank schonmal!
Hallo, ich würde das Geschlecht eher als Faktor hinterlegen, damit ich weiß, was männlich und was weiblich ist und wie dann die Referenzkateogrie ist und was das OR dann letztlich bedeutet.
Viele Grüße, Björn.
Steigt der BMI um zwei ist dann die Chance die Krankheit zu kriegen um 3,2 höher?
Theoretisch ja, das interpretiert man aber eher nur mit 1.
Viele Grüße, Björn.
Hey, ich bin gerade erst auf den Kanal gestoßen und wir machen gerade genau dieses Thema (zwar in spss aber r ist nie verkehrt zu wissen), also schonmal danke, die videos sind top :D
Ich hätte im folgenden mal eine Frage, ein Rätsel für dich(oder die community). Wir haben das in Statistik zu gemischten Modellen gemacht und mein prof gibt als preis für die antwort der Frage ein Lehrbuch und Eis aus, wäre also echt super wenn mir wer helfen könnte :D
Folgendes Problem:
Datensatz mit einer intervallskalierten abhängigen Variable. Es gibt:
die festen faktoren/Kovariaten: "quality" mit "easy" und "difficult" als auswahlmöglichkeiten
"size" mit größe 3 oder 5
Es wird ein gemischtes lineares Modell berechnet in dem wir auch den Interaktionseffekt Quality*size anschauen.
Wenn wir das nun mit "size" als kovariate und quality als festen faktor(kategorial) ausrechnen kommt kein interaktionseffekt raus und beide Haupteffekte sind signifikant.
NUN ZUM PROBLEM:
Man könnte auf die Idee kommen, size als festen faktor auszuwählen, da er eh nur 2 Ausprägungen hat.
An den Ergebnissen ändert sich nichts, AUßER, dass der Haupteffekt von "quality" verschwindet (p geht von 0.001 zu 0.967, F ist gegen 0).
Tipp vom prof: "Hinweis: Es hat mit korrelierten Prädiktoren zu tun und so ein bisschen ist es auch ein Simpson-Paradox."
[es wird zudem clusterrandomisiert, das sollte hier aber eigentlich keinen einfluss haben glaube ich]