Vielen lieben Dank, für die super aufbereiteten Videos. Gerade weil es, zumindest meiner Meinung nach, "so einfach" aufbereitet erscheint, macht es diese Videos zu wirklich qualitativen Videos. Ich für mich kenne da wirklich keinen UA-cam-Kanal, der ein paar Themen der Statistik so gut aufbereitet. Im egoistischen Sinne etwas schade, dass kein "Bayes" dabei ist, aber man kann ja nicht alles haben. Ich kann zumindest ein aufrichtig gemeintes "Danke" zurückgeben. Würde ich Sie in der Realität kennen, würde ich wohl nicht um ein paar Blumen herumkommen. Klingt kitschig, aber es ist wirklich eine große Hilfe für mich, in einem Modul, was mich dann doch ein wenig an meine Grenzen bringt - Da sind Sie für dieses Modul nicht mehr und nicht weniger als eine Stütze für meine Zukunft - Alles Gute Ihnen
Danke! Kommentare wie diese motivieren mich sehr das Thema noch weiter auszubauen, auch wenn es im Alltag immer nicht einfach ist die Zeit zu finden neue Videos zu machen. Freut mich auf jeden Fall sehe, dass ihnen die Videos geholfen haben warm zu werden mit dem Thema Statistik.
etwas leise, aber die Erklärung wie immer flawless! Ihre Videos machen mein Fernstudium echt angenehmer und interessanter. Gibt es mit diesem Ansatz auch eine kurze Erklärung/Formel, wie man die Varianz für nur einen bestimmten Prädiktor auflösen kann? Also welchen Einfluss z.B. nur Werbeanzeigen auf den Burgerkauf haben, verglichen mit Prädiktor Hunger z.B. :)
Hallo, Ich hätte eine Frage zur ANOVA Tabelle bei einer linearen Regression und auch wenn dies nicht in diesem Video behandelt wurde, wäre ich wirklich dankbar, wenn Sie mir hier eventuell weiterhelfen könnten. Genauer gesagt geht es um die Anzahl der Freiheitsgrade und am besten gehen wir der Einfachheit halber von Regression mit nur einer unabhängigen Variable aus. Laut den Formeln errechnet sich die Anzahl der freiheitsgrade für SSE (sum of squares errors) aus n-2 und für SSR (sum of squares regression) aus 1. Im Falle von SSE wird dies in den meisten Lehrbüchern damit erklärt, dass n der Anzahl der observations entspricht und “-2” weil intercept und slope der Regression geschätzt werden. Die “1” bei SSR wird oft damit begründet, dass dies der Anzahl der unabhängigen Variablen entspricht. Hier habe ich nun ein Problem mit der Nachvollziehbarkeit: Sowohl SSE als Auch SSR werden auf auf Grundlage aller observations errechnet. Deshalb verstehe nicht weshalb bei dem einen mit der Anzahl der aller Observations “n” berechnet wird und bei dem anderen nur mit “1” (der Anzahl der unabhängigen Variablen.)
Vielen Dank für die tollen Videos! Die helfen wirklich sehr beim Verständnis! Ich habe für den F-Wert aus unserem Unterricht einen Interpretationswert von F > 4 = gut im Kopf. Verwechsle ich da etwas? Freundliche Grüsse
Danke. F=4 ist kein Grenzwert der mir gängig wäre. Grundsätzlich hängt die Interpretation vom konkreten Fall ab. Man kann nur sagen dass Modlle mit F größer 1 einen Mehrwert bieten. Die Größe des F Werts lässt sich jedoch nicht einfach interpretieren. Viele Grüße
Ich hab gerade einen Denkfehler und weiß nicht wo: Wenn F-Statistik = Regressionsvarianz/Fehlervarianz dann bedeutet F-Statistik > 1 => Regressionsvarianz > Fehlervarianz. Soweit alles in Ordnung. ABER, Gesamtvarianz = Regressionsvarianz + Fehlervarianz und Determinationskoeffizient = Regressionsvarianz/Gesamtvarianz Das müsste dann aber doch bedeuten, dass eine F-Statistik von >1 bedeutet, dass der Determinationskoeffizient > 0,5 ist oder? Die Gesamtvarianz setzt sich ja nur aus den beiden Summanden zusammen und die Regressionsvarianz ist ja größer. Also warum nimmt man dann nicht als Bestimmungswert, ob ein Modell gut ist den Determinationskoeffizient? Ich bin mir sicher, dass in meiner Logik irgendwo ein Fehler ist, aber ich find ihn nicht. Vielen Dank schon mal!
Danke, das ist sehr scharfsinnig und kein Denkfehler. In der Tat ist das im Video etwas vereinfacht, aber dadurch auch verständlicher, dargestellt. Grundsätzliche gibt es mehrere Arten von Varianzen. Für die Berechnung des R-Quadrat werden die Sum of Squares (SS) verwendet, also die Varianz ohne die Relativierung an der Fallzahl. Für die Berechnug des F-Werts werden die Mean Sum of Squares (MS) verwendet, die noch an den Freiheitsgraden relativiert werden. Sie finden mehr dazu in meiner Playlisz zur Varianzanalyse. Viele Grüße
Man nimmt doch den Determinationskoeffizienten um das Modell ins Verhältnis zur Wirklichkeit zu setzen, also wir viel das Modell die Wirklichkeit erklären kann. Den F-Wert nimmt man um zu sehen wie das Modell im Verhältnis zu den Fehlern erklärt ist. Also zwei verschiedene Maße, die beide dazu beitragen Teile des Modells zu beschreiben bzw deren Güte festzustellen
Im Skript steht, dass man den Determinationskoeffizienten erhält, indem man die Fehlervarianz durch die Gesamtvarianz teilt. Diese Formel gilt allerdings für die F-Statistik, oder?
Ist es richtig? Man nimmt den Determinationskoeffizienten um das Modell ins Verhältnis zur Wirklichkeit zu setzen, also wie viel das Modell die Wirklichkeit erklären kann. Den F-Wert nimmt man um zu sehen wie das Modell im Verhältnis zu den Fehlern erklärt ist. Also zwei verschiedene Maße, die beide dazu beitragen Teile des Modells zu beschreiben bzw deren Güte In unterschiedlicher Weise festzustellen.
Das Statistik-Buch zu diesem Kanal mit den besten Info-Grafiken und allen Videos jetzt auf Amazon: amzn.to/3dYLUip
Vielen lieben Dank, für die super aufbereiteten Videos.
Gerade weil es, zumindest meiner Meinung nach, "so einfach" aufbereitet erscheint, macht es diese Videos zu wirklich qualitativen Videos.
Ich für mich kenne da wirklich keinen UA-cam-Kanal, der ein paar Themen der Statistik so gut aufbereitet.
Im egoistischen Sinne etwas schade, dass kein "Bayes" dabei ist, aber man kann ja nicht alles haben.
Ich kann zumindest ein aufrichtig gemeintes "Danke" zurückgeben.
Würde ich Sie in der Realität kennen, würde ich wohl nicht um ein paar Blumen herumkommen.
Klingt kitschig, aber es ist wirklich eine große Hilfe für mich, in einem Modul, was mich dann doch ein wenig an meine Grenzen bringt -
Da sind Sie für dieses Modul nicht mehr und nicht weniger als eine Stütze für meine Zukunft -
Alles Gute Ihnen
Danke! Kommentare wie diese motivieren mich sehr das Thema noch weiter auszubauen, auch wenn es im Alltag immer nicht einfach ist die Zeit zu finden neue Videos zu machen. Freut mich auf jeden Fall sehe, dass ihnen die Videos geholfen haben warm zu werden mit dem Thema Statistik.
Sehr schönes Video - motivierend und verständlich! Vielen Dank!
Danke
Viiielen Dank für die Erklärungen, ich bin begeistert !!!!
Danke freut mich!
Hi, vielen Dank für die Videos! Habs jetzt endlich verstanden:)
Das freut mich !
etwas leise, aber die Erklärung wie immer flawless! Ihre Videos machen mein Fernstudium echt angenehmer und interessanter.
Gibt es mit diesem Ansatz auch eine kurze Erklärung/Formel, wie man die Varianz für nur einen bestimmten Prädiktor auflösen kann? Also welchen Einfluss z.B. nur Werbeanzeigen auf den Burgerkauf haben, verglichen mit Prädiktor Hunger z.B. :)
Hallo,
Ich hätte eine Frage zur ANOVA Tabelle bei einer linearen Regression und auch wenn dies nicht in diesem Video behandelt wurde, wäre ich wirklich dankbar, wenn Sie mir hier eventuell weiterhelfen könnten. Genauer gesagt geht es um die Anzahl der Freiheitsgrade und am besten gehen wir der Einfachheit halber von Regression mit nur einer unabhängigen Variable aus.
Laut den Formeln errechnet sich die Anzahl der freiheitsgrade für SSE (sum of squares errors) aus n-2 und für SSR (sum of squares regression) aus 1.
Im Falle von SSE wird dies in den meisten Lehrbüchern damit erklärt, dass n der Anzahl der observations entspricht und “-2” weil intercept und slope der Regression geschätzt werden.
Die “1” bei SSR wird oft damit begründet, dass dies der Anzahl der unabhängigen Variablen entspricht.
Hier habe ich nun ein Problem mit der Nachvollziehbarkeit: Sowohl SSE als Auch SSR werden auf auf Grundlage aller observations errechnet. Deshalb verstehe nicht weshalb bei dem einen mit der Anzahl der aller Observations “n” berechnet wird und bei dem anderen nur mit “1” (der Anzahl der unabhängigen Variablen.)
Vielen Dank für die tollen Videos! Die helfen wirklich sehr beim Verständnis! Ich habe für den F-Wert aus unserem Unterricht einen Interpretationswert von F > 4 = gut im Kopf. Verwechsle ich da etwas? Freundliche Grüsse
Danke. F=4 ist kein Grenzwert der mir gängig wäre. Grundsätzlich hängt die Interpretation vom konkreten Fall ab. Man kann nur sagen dass Modlle mit F größer 1 einen Mehrwert bieten. Die Größe des F Werts lässt sich jedoch nicht einfach interpretieren. Viele Grüße
Ich hab gerade einen Denkfehler und weiß nicht wo:
Wenn
F-Statistik = Regressionsvarianz/Fehlervarianz
dann bedeutet
F-Statistik > 1 => Regressionsvarianz > Fehlervarianz.
Soweit alles in Ordnung. ABER,
Gesamtvarianz = Regressionsvarianz + Fehlervarianz
und
Determinationskoeffizient = Regressionsvarianz/Gesamtvarianz
Das müsste dann aber doch bedeuten, dass eine F-Statistik von >1 bedeutet, dass der Determinationskoeffizient > 0,5 ist oder? Die Gesamtvarianz setzt sich ja nur aus den beiden Summanden zusammen und die Regressionsvarianz ist ja größer.
Also warum nimmt man dann nicht als Bestimmungswert, ob ein Modell gut ist den Determinationskoeffizient?
Ich bin mir sicher, dass in meiner Logik irgendwo ein Fehler ist, aber ich find ihn nicht. Vielen Dank schon mal!
Danke, das ist sehr scharfsinnig und kein Denkfehler. In der Tat ist das im Video etwas vereinfacht, aber dadurch auch verständlicher, dargestellt. Grundsätzliche gibt es mehrere Arten von Varianzen. Für die Berechnung des R-Quadrat werden die Sum of Squares (SS) verwendet, also die Varianz ohne die Relativierung an der Fallzahl. Für die Berechnug des F-Werts werden die Mean Sum of Squares (MS) verwendet, die noch an den Freiheitsgraden relativiert werden. Sie finden mehr dazu in meiner Playlisz zur Varianzanalyse. Viele Grüße
Man nimmt doch den Determinationskoeffizienten um das Modell ins Verhältnis zur Wirklichkeit zu setzen, also wir viel das Modell die Wirklichkeit erklären kann. Den F-Wert nimmt man um zu sehen wie das Modell im Verhältnis zu den Fehlern erklärt ist. Also zwei verschiedene Maße, die beide dazu beitragen Teile des Modells zu beschreiben bzw deren Güte festzustellen
Im Skript steht, dass man den Determinationskoeffizienten erhält, indem man die Fehlervarianz durch die Gesamtvarianz teilt. Diese Formel gilt allerdings für die F-Statistik, oder?
Da war in der Tat ein Fehler im Skript. Vielen Dank für den Hinweis. Ist schon korrigiert : www.statistikgrundlagen.de
Danke für die Erklärung! ich hoffe allerdings nicht, dass mich diese Formeln ins Jenseits der Statistik begleiten ...^^
Gerne. Das hoffe ich auch ;-)
Ist es richtig? Man nimmt den Determinationskoeffizienten um das Modell ins Verhältnis zur Wirklichkeit zu setzen, also wie viel das Modell die Wirklichkeit erklären kann. Den F-Wert nimmt man um zu sehen wie das Modell im Verhältnis zu den Fehlern erklärt ist. Also zwei verschiedene Maße, die beide dazu beitragen Teile des Modells zu beschreiben bzw deren Güte In unterschiedlicher Weise festzustellen.
Kann man so sagen ja ;-) viele Grüße