Wie interpretiert man lineare Regression in R? 🔎

Поділитися
Вставка
  • Опубліковано 10 гру 2024

КОМЕНТАРІ • 21

  • @Heinz-JürgenHättig
    @Heinz-JürgenHättig Рік тому +2

    Das beste Video zum Ergebnisausdruck von lm in R. Kurz und bündig, kein unnötiges Geschwafel. Vielleicht kannst Du auch ein Video zu der I(x...) machen. Das ist für mich immer noch ein Geheimnis.

  • @LennArtKanal
    @LennArtKanal Рік тому +1

    Danke für das Video, sehr hilfreich! :)

  • @IkkaKaa
    @IkkaKaa 10 місяців тому

    Sind beide Parameter notwendig, oder kann man 𝛼 oder 𝛽 gleich Null
    setzen?

  • @Birgit_HH
    @Birgit_HH Рік тому +1

    Hallo und ganz lieben Dank! Sehr hilfreiches Video 😃
    Eine Frage noch: Kann ich mit Hilfe des t-value sagen, dass ein Effekt größer/stärker als der andere ist, weil er weiter von Null entfernt ist?
    Danke schonmal für die Antwort 🌷

    • @statistik-mit-lennart
      @statistik-mit-lennart  Рік тому

      Der t-Value macht eine Aussage über die Signifikanz des Effekts. Das ist aber etwas anderes als die Stärke des Effekts. Hier wird der Unterschied schön erklärt: ctreffe.github.io/statspace/effektstaerke.html

    • @Birgit_HH
      @Birgit_HH Рік тому

      Wow... Ganz lieben Dank für die schnelle Antwort und den klasse Link 👍♥️

  • @malte3810
    @malte3810 Рік тому

    Hi,
    kann es sein, dass du bei ca. min 7:50 einen Fehler in der Formel für die SSR hast?

    • @statistik-mit-lennart
      @statistik-mit-lennart  Рік тому

      Ups, das Quadrat muss natürlich außerhalb der Klammer stehen. Danke dir!

  • @lilli1305
    @lilli1305 10 місяців тому

    Hallo Lennart, danke für das Video, ich habe leider nicht ganz verstanden, für was das Intercept steht. Also für ß0 aber was bedeutet das, was sagt mir der Wert 53840 über mein Modell aus? Vielen Dank schonmal

    • @statistik-mit-lennart
      @statistik-mit-lennart  10 місяців тому +1

      Das ist der vorhergesagte Wert, wenn alle erklärenden Variablen den Wert 0 haben. Manchmal kann man den Intercept gut interpretieren, manchmal ergibt Interpretation aber keinen Sinn (man kann sich schlecht ein Haus ohne Wohn- und Grundfläche vorstellen).

  • @baumchen1228
    @baumchen1228 9 місяців тому

    Hallo! Kann man den p-Wert der F-Statistik in der letzten Zeile als Signifikanz des R2 sehen? Ich habe Artikel gefunden in denen das R2 mit Signifikanzsternchen ausgezeichnet war, aber finde nirgendwo etwas zur Inferenzstatistik vom R2. Kann also dieser Wert damit gemeint sein oder gibt es konkrete Wege das R2 inferenzstatistisch abzusichern? (Beim Inkrement würde man das ja über die ANOVA geschachtelter Modelle machen) LG

    • @statistik-mit-lennart
      @statistik-mit-lennart  9 місяців тому

      Tut mir leid, davon habe ich noch nichts gehört und kann es mir auch nur schwer vorstellen. Der p-Wert der F-Statistik bezieht sich auf den F-Test so wie im Video erklärt, das hat mit dem Anteil erklärter Varianz nicht direkt etwas zu tun.

  • @IkkaKaa
    @IkkaKaa Рік тому

    Wie rechnet man mit %.
    Habe Fettanteil (x) und BMI(y). Möchte Aber 40% Fettanteil berechnen.
    Lin. Reg. Output: Y= 13.37394 + 0.32926 * x..
    ----- Y= 13.37394 + 0.32926 * 0.4?

    • @statistik-mit-lennart
      @statistik-mit-lennart  Рік тому

      Das hängt davon ab, welche Einheit für x bei der Schätzung verwendet wurde. Wenn x der Fettanteil in Prozent ist, dann muss in die Regressionsgleichung auch x = 40 für 40% Fettanteil eingesetzt werden. Wahrscheinlich war das bei dir der Fall, denn ein BMI Wert von 26,5 ist realistischer bei 40% Fettanteil als ein BMI Wert von 13,5.

  • @niklasmuhlbradt2351
    @niklasmuhlbradt2351 Рік тому

    Hallo Lennart,
    vielen Dank für das Video. Es war äußerst hilfreich! Allerdings wollte ich fragen, ob es auch Lösungen für den Selbsttest gibt? Ich bin mir unsicher, wie man zu Nr. 4 gelangt, habe jedoch das Gefühl, dass so eine ähnliche Aufgabe auch in der Klausur auftauchen könnte.
    Vielen Dank im Voraus und beste Grüße!

    • @statistik-mit-lennart
      @statistik-mit-lennart  Рік тому

      Der "Residual standard error" ist 53990 mit 84 Freiheitsgraden, also ist SSR = 53990^2 * 84 = 244853288400. Da R^2 = 1 - SSR / SST ist und wir sowohl R^2 als auch SSR kennen, können wir SST berechnen: SST = 244853288400 / (1 - 0.7333) = 918085070866. Und da SST = SSE + SSR ist, können wir jetzt nach SSE auflösen: SSE = SST - SSR = 918085070866 - 244853288400 = 673231782466.

    • @niklasmuhlbradt2351
      @niklasmuhlbradt2351 Рік тому

      ​@@statistik-mit-lennart Danke für den Versuch, es mir zu erklären. Ich bin aber leider irgendwie verwirrt. In meiner Formelsammlung stand R^2 = SSR/SST (dort gilt R^2 = 1 - SSE/SST). Mein Ergebnis ergibt allerdings auch keinen Sinn. Es kam 3.3391*10^22 heraus. Aber trotzdem vielen Dank für die Antwort! Du gibst dir wirklich viel Mühe, jede Frage zu beantworten!

    • @statistik-mit-lennart
      @statistik-mit-lennart  Рік тому

      Wie sind bei dir SSE und SSR definiert? Es kann sein, dass dein SSR mein SSE und dein SSE mein SSR ist. Vergleiche mal mit meiner Definition bei 8:04. Diese blöde Verwirrung liegt daran, dass die Abkürzung SSE für "Sum of squares explained" (bei mir) oder auch für "Sum of squares error" (vielleicht bei dir?) bzw. SSR für "Sum of squares residuals" (bei mir) oder für "Sum of squares regression" stehen kann. Abgesehen davon sind die hohen Zahlen, die wir berechnet haben, nicht ungewöhnlich: Die Preise, die wir erklären, sind sechsstellig. Also können die Residuen durchaus vier- oder fünfstellig sein. Und quadrieren wir eine fünfstellige Zahl, erhalten wir eine neun- bis zehnstellige Zahl. Und davon summieren wir mehrere auf.

    • @niklasmuhlbradt2351
      @niklasmuhlbradt2351 Рік тому +1

      @@statistik-mit-lennart Danke für den Tipp! Ich habe gerade noch einmal erfolgreich nachgerechnet. Bei mir steht "SSE" für "Sum of Squared Errors" und nicht für "explained". Also sum(U^2i) in meinem Fall. "SSR" steht für "Sum of Squares of the Regression". Vielen Dank für die Hilfe!

  • @benjaminjo5430
    @benjaminjo5430 Рік тому

    Was heißt penalisiert? :D

    • @statistik-mit-lennart
      @statistik-mit-lennart  Рік тому

      Du meinst bei 8:23? Was ich hier sagen wollte: Das normale R^2 steigt mit jedem hinzugenommenem Regressor, es kann also nicht dafür verwendet werden, die interessanten von den irrelevanten Regressoren zu unterscheiden. Beim adjustierten R^2 hingegen wird quasi durch die Anzahl an Regressoren K dividiert (siehe Formel im Video). Dadurch steigt das adjustierte R^2 nicht bedingungslos mit zusätzlichen Regressoren, es "bestraft" sozusagen eine größer werdende Anzahl K. Und mit "penalisieren" wollte ich genau das ausdrücken. Im Englischen heißt "penalize" nämlich "bestrafen", aber im Deutschen scheint es das Wort tatsächlich gar nicht zu geben. 😀