OMG endlich kapiere ich es! Mein Prof hat uns mit diesem Stoff 3 Stunden gequält, aber wie du uns das hier erklärst, kann ich meine Freude am Lernen wieder finden...Bitte hör nie auf Videos für uns zu machen! Vielen Dank!!!
@03:40 Allein dass du darauf verzichtest, das Ding "Tilde" zu nennen und stattdessen Schlangenlinie sagst zeigt mir, dass du mehr Wert darauf legst, dass man dich versteht als "klug rüberzukommen". Richtiger Ehrenmann. (Hypothese: Du weißt, dass man das auch Tilde nennt).
@@StatistikamPC_BjoernWalther Hi, bei mir kommt eine Fehlermeldung, wenn ich das so eintippe wie, bei dir. Also dort kommt "Fehler in as.environment(pos) : ungültiges `pos`Argument.
Ich bin trotz diverser Tutorials an meiner Hausarbeit verzweifelt. Dank deines Videos konnte ich es beenden! Danke für deine Mühe dieses Video zu erstellen!
Das Video hat mir so doll geholfen. Ich muss meine zweite Statistik Klausur in der Uni mit R schreiben und habe in den Seminaren bisher nie verstanden, was ich machen soll. Deine Videos sind so einfach zu verstehen und haben mir geholfen endlich mal zu verstehen, wie das Ganze funktioniert!!!
Schätze, das liegt daran, dass du bei R alles über Befehle erst formulieren musst. Ich frage mich, ob man das beim Entwurf des Programm nicht gleich hätte etwas einfacher machen können....
Das liegt daran, dass die Profs in 1.Linie Forscher sind, aber in der Regel nie Didaktik gelernt haben. Sie müssen nicht eigens als Lehrkraft ausgebildet sein. Der Unterricht wird von vielen nur als "lästiger aber notwendiger Zusatzauftrag" gesehen - und so sind viele Vorlesungen dann auch....
Wow was für ein Video! Richtig gut erklärt. Danke dafür! Auch wenn ich schon drei Jahre aus dem Studium raus bin und das Thema gerade erst wieder anfange aufzufrischen, habe ich durch dieses eine Video schon wieder massig Inupt, welcher mir hilft mein Wissen wieder herauszukramen. :D Also nochmals 1000 Dank! :D
Richtig tolles Video! Die detaillierten Erklärungen sind enorm hilfreich! Bitte beibehalten :) spannend wäre noch Multiple Regression / hierarchische Regression mit R
Hallo Владимир Лев, danke für deine lobenden Worte! :-) Multiple Regression wird auch demnächst kommen (ist schon fertig und geht am 15.06. online). Hierachische Regression werde ich evtl. im nächsten Aufnahmezyklus was zu machen. Danke für dein Feedback. Viele Grüße, Björn.
Hallo Björn :) Ich habe leider kein Video zur multivariaten Regressionsanalyse gefunden aber das Video hat mir schon etwas weitergeholfen. Ich möchte in meiner Thesis eine multivariate Regression durchführen (1x UV, 2x AV) und habe die Voraussetzung der linearen Beziehung zwischen der UV und den AV's visuell geprüft. Leider habe ich keine lineare Beziehung feststellen können. Die berechnete Korrelation der Zusammenhänge unterstützt den nicht wirklich vorhandenen linearen Zusammenhang, da r = -.05 und r = - .12. Hast du eine Idee für mich? Gibt es noch eine andere Möglichkeit aufzuführen, dass keine lineare Beziehung vorliegt? Oder kann die multivariate Regression mit der Begründung nicht vorhandener linearer Beziehung nicht durchführen? Danke für deine Rückmeldung und Hilfe!! LG Steffi :)
Super erklärt! Gibt es ein Video wo die Voraussetzungen für die einfache lineare Regression getestet werden? Oder kann man das genau so wie bei der multiplen Regression testen? Vielen Dank im Voraus :)
Kann man mit der einfachen linealen Regression eigentlich auch z.B Einkommen (kategorisiert z.B zwischen 1000€ und 1500€) und mit Ausgaben (AV) numerisch analysieren oder wäre bei dem Beispiel die Varianzanalyse besser geeignet? Hypothese wäre, dass Ausgabenhöhe abhängig vom Einkommen ist 🤔
Moin! Eine kurze Frage: Ich habe zwei Kategorien, eine Einfluss- und eine Zielvariable. Wie kann man die Datenpunkte der Einfluss- und Zielvariable nach den beiden Kategorien in einer Abbildung unterschiedlich einfärben. Und wie kann ich für beide eine Regression aufstellen und für beide Kategorien die Formel und Bestimmheitsmaß in der Abbildung anzeigen lassen. Vielen Dank im Voraus! LG Jan
Hallo, ich versuche bei einer linearen/multiplen Regression auf den P-Wert der F-Statistik zuzugreifen. Leider finde ihn nicht in der summary() Funktion. Obwohl er ja aufgeführt wird, wenn man ihn ausführt. Kann jemand helfen? Ansonsten sehr, sehr schönes und gut verständliches Video!
Hallo, vielen Dank für das Video! :) Eine Frage: Ich möchte mittels linearen Regression eine Eichgerade erstellen und mit der Geradengleichung dann recht viele Werte umrechnen. Gibt es dafür einen Befehl/ eine Möglichkeit, eine große Datenmenge einzulesen (= y-Werte) und umrechnen zu lassen?
Hallo Jasminka, mit Eichgerade meinst du sicherlich Regressionsgerade. In R ist mir da im Moment kein Befehl bekannt. Allerdings kannst du die Formel in Excel einsetzen und hier recht einfach die y-Werte mit der Formel und den x-Werten prognostizieren. Viele Grüße, Björn.
Hallo Jasmina, du kannst dir die entsprechenden Y-Werte ganz einfach selbst ausrechen lassen, indem du dir die Werte aus deiner Regression ziehst. Bleiben wir bei bei dem Beispiel mit den Schulnoten. Du hast eine ganze Reihe von X-Werten (IQ), z.B. von 50 bis 150: X
Wenn das Regressionsmodell y = a + b*x + Ɛ lautet und für Ɛ N(0, σ²) gilt, wie gibt man das Modell in r an? Ich hatte an lm(y ~ x, dat) gedacht, aber dann beziehe ich das Ɛ ja nicht mit ein und das könnte noch einen Teil des Modells erklären, oder? Vielen Dank! :-)
Hallo, das Epsilon ist ein Restterm, der nicht durch das Modell geschätzt werden kann. Nur UV und AV sind in die Modellierung im Programm einzugeben. Viele Grüße, Björn.
Deine Videos sind super erklärt und wirklich hilfreich! Eine Frage hätte ich zur linearen Regression bzw. zur moderierten. Bin ich richtig mit der Annahme, dass wenn bei der linearen Regression UV und AV verschiedene Skalenbreiten haben hier NICHT Z-Standartisiert werden muss? Und wie wäre das bei einer moderierten Regression? Vielen Dank! :)
Hallo Nils, danke für die lobenden Worte! Du musst niemals z-standardisieren, es ist lediglich zu empfehlen, wenn die UV untereinander verschiedene Skalenbreiten haben und du aber deren Einfluss vergleichen möchtest. Da eine Moderation auch nur eine Regression ist, gibt es hierbei keinen Unterschied. Viele Grüße, Björn.
Ich habe eine Frage zum konkreten Output der linearen Regression in R: erhalte ich dabei einen direkten Effekt von UV auf AV oder einen totalen Effekt?
Wie müsste ich vorgehen, wenn ich beispielsweise die Korrelation und statistische Signifikanz zwischen der Arbeitslosenquote und dem Wirtschaftswachstum über 20 Jahre berechnen müsste? Ich habe nur die beiden Wachstumsraten der Daten für die verschiedenen Zeiträume auf Papier ohne Excel Tabelle. Hättest du eventuell Videos, die mir zeigen, wie ich von diesem Ausgangspunkt bis zu meinem Ziel kommen kann? Habe 0 Erfahrung mit R und Excel.
Ich habe in meinem Skript 14 Unterschiedliche Datensätze in einer Schleife integriert. Ergebnis sind demnach 14 unterschiedliche Graphen. Ich würde gerne "summary(model)" für jeden "Graphen" einzeln ansehen, bzw. wie "Pr" jeweils ausschaut. Wie kann ich das in mein Skript integrieren?
Hallo Laura, hast du es inzwischen gelöst? Ich hätte ja einfach eine Schleife für die die Berechnung und summary-Funktion geschrieben. Viele Grüße, Björn.
Hallo Björn, super hilfreiches Video! Gibt es auch ein Video für R Studio wie man den p - Wert für gerichtete Zusammenhangshypothesen berechnet (der p Wert in der Ausgabe ist ja immer der von der zweiseitigen Testung soweit ich weiß)?
Hallo Greta, das geht, wenngleich etwas umständlich ist und nur für positive oder negative Koeffizienten auf einmal funktioniert. Zuerst das Modell berechnen und in einen Vektor (model) schieben, danach die Modellergebnisse mit summary() in einen Vektor (res) schieben. Im Anschluss folgt dann die eigentliche Berechnung mit pt - der t--Wert wird zur p-Wert-Berechnung verwendet. Wichtig ist, dass die Freiheitsgrade stimmen. Bei einer einfachen linearen Regression sind es 2 (1 für das Modell, 1 für die Prädiktor). In meinem Beispiel unterstelle ich einen positiven Koeffizient mit lower=FALSE. Mit lower=TRUE wäre die Koeffizient negativ. model
@@StatistikamPC_BjoernWalther Danke für die Antwort! Kann ich bei z.B. bei einer positiv gerichteten Zusammenhangshypothese sonst auch mit der cor.test(...., alternative = "greater")mir den einseitigen p-Wert der Hypothese ermitteln?
Hallo, danke erstmal für deinen tollen Beitrag. Ich habe allerdings eine kleine Frage. Woher weiß ich dass ich meine Nullhypothese bei einem Wert unter 0,005 verwerfen kann. Mein Streudiagramm ist etwas verstreuter und ich habe einen P-wert von 0,000274. Heißt das es besteht ein Zusammenhang?
Hallo Nadine, in der Statistik nimmt man - je nach Forschungsdisziplin - typischerweise ein Alpha von 0,05 (0,01 oder auch 0,001) als Grenze. Liegt der p-Wert darunter, verwirft man die Nullhypothese KEINES Einflusses der UV auf die AV. Im Umkehrschluss bekräftigt das einen darin, dass ein Einfluss besteht. Bei einem so kleinen p-Wert wie bei dir geht man also von einem Einfluss/Zusammenhang aus. Viele Grüße, Björn.
Danke für das tolle Video! Ich hatte mich gefragt, ob die "Estimates" den standardisierten beta Koeffizienten angeben? Falls nicht, gibt es eine Funktion in R, die ich nutzen könnte, um diese herauszubekommen?
Hallo Maggie, danke für dein Lob! Die Estimats sind immer unstandardisiert. In einer einfachen linearen Regression ist das ja eigentlich auch nicht wirklich wichtig, da die standardisierten Koeffizienten immer nur dann herangezogen werden, wenn wenigstens 2 UV und deren Einfluss auf die AV bei unterschiedlichem Wertebereich verglichen werden sollen. Im Video zur multiplen Regression zeige ich, wie man die standardisierten Koeffizienten erhält - einfach im Vorfeld alle Variablen standardisieren. Viele Grüße, Björn.
Hallo Jan, in der Regel ist der p-Wert vom Intercept nicht wichtig. Selbst, wenn du eine Prognose mit deinem Modell rechnest, ist es unerheblich, wie der p-Wert vom Intercept ist. Das trifft im Prognose-Fall auch auf andere UV zu, wenn der F-Test signifikant ist. Bei der normalen Interpretation ändert sich nichts. Viele Grüße, Björn.
Tolle einfache Erklärung. Hast du auch eine Methode/Video wie mit in R zu dieser linearen Regression einen einseitiges Konfidenzintervall erstellt. Wir sollen den Leistungsabfall eines Produkts über die Zeit errechnen und dazu dann das einseitige 95% CI errechnen. Ich weiß, dass ich mit Hilfe der Formel des Models, die du hier gezeigt hast neue Werte berechnen muss und dann in die Grafik eintragen muss. Nur wie?
Hallo Luisa, nein, es werden in R stets die unstandardisierten Werte verwendet. Wenn du die standardisierten Koeffizienten möchtest, musst du die im Vorfeld mit scale() z-standardisieren: ua-cam.com/video/3pLZBBti1YM/v-deo.html Viele Grüße, Björn.
Danke für die Videos. Sehr gut erklärt etc. Eine Frage nur zu dem IQ: Woher hast du die Daten denn? Das macht inhaltlich doch wenig Sinn, dass wenn der IQ steigt, der Abi Schnitt sinkt. Ich frage mich auch wie man solche Daten erheben will.
Hallo Christian, die Daten sind zufallsgeneriert, allerdings in gewissen Intervallen. Der Abiturschnitt ist aber wie üblich invers kodiert: eine niedrige ist eine gute Note. Das ergibt inhaltlich also durchaus Sinn, wenn ein steigender IQ zu einer niedrigeren und damit besseren Note führt. Viele Grüße, Björn.
Pauschal: je höher, desto besser. 1 ist der Höchstwert. Je nach Disziplin gibt es unterschiedliche "Grenzen". Psychologische Phänomene mit unzähligen Einflussfaktoren haben bei nur einem Prädiktor fast nie mehr als 0,1, meist sogar noch weniger. Wenn ich allerdings eine AV habe, die per se nur wenige Einflussgrößen hat, sollte eine oder wenige UV zumindest etwas höhere Varianzaufklärung der AV erzeugen. Ist das nicht der Fall kommen dann die typischen Fehlerquellen ins Spiel: Stichprobengröße, -auswahl, Messung latenter Konstrukte usw. Viele Grüße, Björn.
Hi, tolles Video. Kannst du mir sagen, wie ich mir noch das CI für den standardisierten Regressionskoeffizienten Beta anzeigen lassen kann? Liebe Grüße
@@StatistikamPC_BjoernWalther Danke für deine Antwort. Ich dachte, das wäre der Befehl für den nicht standardisierten Regressonskoeffizient B. Ich habe die Berechnung in SPSS gemacht (Variablen Z transormiert, CI für B ausgeben lassen, ist dann ja gleich beta). Und da kommen unterschiedlich CI´s raus. Sie sind aber gleich, wenn ich auch in r z transformiere.
Hallo, vorweg ein sehr schönes Video. Es hat mir echt mega weiter geholfen. Eine Frage: Hast du zufällig eine Quelle für die Erklärung der F-Statistik, Coefficents, R² etc. ? Wäre mega. Gruß David
Wie kann ich jetzt Alpha interpretieren? Einzig als Wert, den der Abischnitt bei einem IQ von 0 annimt? Oder gibt es da noch andere Interpretationsmöglichkeiten?
Hallo Daniel, genau richtig. Wenn alle anderen Einflussgrößen 0 sind, ist das der Abiturschnitt. Das ergibt inhaltlich natürlich wenig Sinn, liegt aber in der Natur der linearen Regression. In einem Streudiagramm mit Gerade wäre dies der y-Achsenabschnitt. Viele Grüße, Björn.
@@StatistikamPC_BjoernWalther Danke dir! Dein Video hat sehr geholfen, genau so eine Aufgabe kam auch in der Klausur dran :D Da ging es aber um durchschnittliche Ausgaben von Touristen mit den Variablen Destination und Reisejahr :)
Hallo, du brauchst Dummy-Variablen für kategoriale Variablen. Erstellung: ua-cam.com/video/BhbyB5VO10k/v-deo.html und Interpretation: ua-cam.com/video/zkDzNJ5jEaQ/v-deo.html Viele Grüße, Björn.
Und noch ein Themenvorschlag: Ich habe mal gehört, dass man in R auch Webcrawler basteln kann, die einem die Daten aus dem Web sammeln. Könntest du dazu vielleicht ein Tut machen?
Puh, das habe ich tatsächlich noch nicht versucht. Ich habe sowas mit Visual Basic mal geschrieben, ist aber Jahre her. Webcrawler sind auch immer so ein wenig heikel, wenn man Daten abgreift. Viele Grüße, Björn.
📘Mein Buch "Statistik mit R - Schnelleinstieg": amzn.to/3OzeLJI [Affiliatelink]
OMG endlich kapiere ich es! Mein Prof hat uns mit diesem Stoff 3 Stunden gequält, aber wie du uns das hier erklärst, kann ich meine Freude am Lernen wieder finden...Bitte hör nie auf Videos für uns zu machen! Vielen Dank!!!
@03:40 Allein dass du darauf verzichtest, das Ding "Tilde" zu nennen und stattdessen Schlangenlinie sagst zeigt mir, dass du mehr Wert darauf legst, dass man dich versteht als "klug rüberzukommen". Richtiger Ehrenmann. (Hypothese: Du weißt, dass man das auch Tilde nennt).
Hallo und danke für dein Lob. ;-) Die Hypothese würde ich bekräftigen. :-D
Viele Grüße, Björn.
@@StatistikamPC_BjoernWalther Hi, bei mir kommt eine Fehlermeldung, wenn ich das so eintippe wie, bei dir.
Also dort kommt "Fehler in as.environment(pos) : ungültiges `pos`Argument.
Bruder du bist eine Maschine ❤️
Ich bin trotz diverser Tutorials an meiner Hausarbeit verzweifelt. Dank deines Videos konnte ich es beenden! Danke für deine Mühe dieses Video zu erstellen!
Danke für das positive Feedback, Marco! :-)
Viele Grüße, Björn.
So unglaublich gut erklärt! Warum wird das nicht schon in der Uni so gemacht. Vielen, vielen Dank!!
Wow, vielen Dank für deine Videos und die Erklärungen zu den Werten (vor allem diese haben mir sehr weiter geholfen). Du machst das unglaublich gut.
Das Video hat mir so doll geholfen. Ich muss meine zweite Statistik Klausur in der Uni mit R schreiben und habe in den Seminaren bisher nie verstanden, was ich machen soll. Deine Videos sind so einfach zu verstehen und haben mir geholfen endlich mal zu verstehen, wie das Ganze funktioniert!!!
Hallo Katja, freut mich, wenn dir meine Videos helfen! Viel Erfolg weiterhin!
Viele Grüße, Björn.
Schätze, das liegt daran, dass du bei R alles über Befehle erst formulieren musst. Ich frage mich, ob man das beim Entwurf des Programm nicht gleich hätte etwas einfacher machen können....
Du rettest mir meine Bachelorarbeit, danke =)
Du rettest mein Leben wirklich, Danke!!
In der Uni ist es wie in der Schule, man muss sich erst Videos auf UA-cam reinziehen um was zu kapieren. Danke für die Hilfe!
Das liegt daran, dass die Profs in 1.Linie Forscher sind, aber in der Regel nie Didaktik gelernt haben. Sie müssen nicht eigens als Lehrkraft ausgebildet sein. Der Unterricht wird von vielen nur als "lästiger aber notwendiger Zusatzauftrag" gesehen - und so sind viele Vorlesungen dann auch....
Perfekt erklärt! Vielen lieben Dank dafür
Wow was für ein Video! Richtig gut erklärt. Danke dafür!
Auch wenn ich schon drei Jahre aus dem Studium raus bin und das Thema gerade erst wieder anfange aufzufrischen, habe ich durch dieses eine Video schon wieder massig Inupt, welcher mir hilft mein Wissen wieder herauszukramen. :D Also nochmals 1000 Dank! :D
Bei Fragen und Anregungen zu Einfache lineare Regression in R rechnen und interpretieren, nutzt bitte die Kommentarfunktion.
danke für die schöne Erklärung
danke für das Video hab in 15 min mehr gelernt als in 2 std vorlesung
Wie immer kann ich mich für die Videos nur bedanken! Weiter so! :)
Du rettest meine Klausur morgen!!!
Das freut mich und dann viel Erfolg!
Viele Grüße, Björn.
Danke dir, hilft mir sehr bei meiner BA
Genial auf den Punkt.
bro hast einfach selbes Profilbild.
Statistik am PC bringt mich durchs Studium ❤️
super gut erklärt, danke chef
Sehr gerne 😊
Viele Grüße, Björn.
Richtig tolles Video! Die detaillierten Erklärungen sind enorm hilfreich! Bitte beibehalten :) spannend wäre noch Multiple Regression / hierarchische Regression mit R
Hallo Владимир Лев, danke für deine lobenden Worte! :-)
Multiple Regression wird auch demnächst kommen (ist schon fertig und geht am 15.06. online). Hierachische Regression werde ich evtl. im nächsten Aufnahmezyklus was zu machen. Danke für dein Feedback.
Viele Grüße, Björn.
Vielen Dank für deine Videos, haben mir bei meiner Arbeit sehr geholfen !
Hallo Matthias, das freut mich!
Viele Grüße, Björn.
Sehr nützliches Video, vielen Dank!
Ich komme auf dein Video, weil du von einer Dozentin der TUM empfohlen wurdest ;)
Freut mich zu hören. Dann viel Erfolg weiterhin!
Viele Grüße, Björn.
Wirklich hervorragender Content. Bitte ein Video zu verallgemeinerten linearen Modellen (GLM)!
Omg ich liebe dich grad soo sehr !! Morgen abgabe ist gerettet!!❤️🤓
So gut erklärt!! Herzlichen Dank ❤️
Richtig gut erklärt! Danke! 🫶
Besten Dank!! Super erklärt
kuss aufs nasenbein für dieses legendäre video
wahnsinns-video 🔥🔥 fantastisch erklärt!
Kann ich dies auch für Dummy Variablen anwenden, die nur einen Wert von 0/1 haben?
Geniales Video!!!!
Vielen Dank und weiter so!!!!!
Wow super Video, direkt an die Kommilitonen geschickt.
Hallo Björn :) Ich habe leider kein Video zur multivariaten Regressionsanalyse gefunden aber das Video hat mir schon etwas weitergeholfen. Ich möchte in meiner Thesis eine multivariate Regression durchführen (1x UV, 2x AV) und habe die Voraussetzung der linearen Beziehung zwischen der UV und den AV's visuell geprüft. Leider habe ich keine lineare Beziehung feststellen können. Die berechnete Korrelation der Zusammenhänge unterstützt den nicht wirklich vorhandenen linearen Zusammenhang, da r = -.05 und r = - .12. Hast du eine Idee für mich? Gibt es noch eine andere Möglichkeit aufzuführen, dass keine lineare Beziehung vorliegt? Oder kann die multivariate Regression mit der Begründung nicht vorhandener linearer Beziehung nicht durchführen?
Danke für deine Rückmeldung und Hilfe!! LG Steffi :)
Super erklärt! Gibt es ein Video wo die Voraussetzungen für die einfache lineare Regression getestet werden? Oder kann man das genau so wie bei der multiplen Regression testen? Vielen Dank im Voraus :)
Kann man mit der einfachen linealen Regression eigentlich auch z.B Einkommen (kategorisiert z.B zwischen 1000€ und 1500€) und mit Ausgaben (AV) numerisch analysieren oder wäre bei dem Beispiel die Varianzanalyse besser geeignet?
Hypothese wäre, dass Ausgabenhöhe abhängig vom Einkommen ist 🤔
Moin! Eine kurze Frage: Ich habe zwei Kategorien, eine Einfluss- und eine Zielvariable. Wie kann man die Datenpunkte der Einfluss- und Zielvariable nach den beiden Kategorien in einer Abbildung unterschiedlich einfärben. Und wie kann ich für beide eine Regression aufstellen und für beide Kategorien die Formel und Bestimmheitsmaß in der Abbildung anzeigen lassen. Vielen Dank im Voraus! LG Jan
Ich hab's verstanden! Dankeschön
Hallo, ich versuche bei einer linearen/multiplen Regression auf den P-Wert der F-Statistik zuzugreifen. Leider finde ihn nicht in der summary() Funktion. Obwohl er ja aufgeführt wird, wenn man ihn ausführt. Kann jemand helfen? Ansonsten sehr, sehr schönes und gut verständliches Video!
Hallo aus Frankfurt/M,
Wie kan Mann regression Tabellen zum Wort anpassen??
Danke
Az
Hallo, vielen Dank für das Video! :) Eine Frage: Ich möchte mittels linearen Regression eine Eichgerade erstellen und mit der Geradengleichung dann recht viele Werte umrechnen. Gibt es dafür einen Befehl/ eine Möglichkeit, eine große Datenmenge einzulesen (= y-Werte) und umrechnen zu lassen?
Hallo Jasminka, mit Eichgerade meinst du sicherlich Regressionsgerade. In R ist mir da im Moment kein Befehl bekannt. Allerdings kannst du die Formel in Excel einsetzen und hier recht einfach die y-Werte mit der Formel und den x-Werten prognostizieren.
Viele Grüße, Björn.
Hallo Jasmina,
du kannst dir die entsprechenden Y-Werte ganz einfach selbst ausrechen lassen, indem du dir die Werte aus deiner Regression ziehst. Bleiben wir bei bei dem Beispiel mit den Schulnoten. Du hast eine ganze Reihe von X-Werten (IQ), z.B. von 50 bis 150: X
Es ist EXAKT mein Abischnitt rausgekommen mit der Formel... Krass!
Glückwunsch, du bist in einem Fantasiedatensatz die Referenz geworden. ;-)
Wie rechnet man mit %.
Habe Fettanteil (x) und BMI(y). Möchte Aber 40% Fettanteil berechnen.
Lin. Reg. Output: Y= 13.37394 + 0.32926 * x..
----- Y= 13.37394 + 0.32926 * 0.4?
Gibt es auch ein Video dazu, wie man nur einen Teil der Werte für die Regression verwendet?
Wie kann ich die Befehle anwenden und die Werte dabei vorher logarithmieren? Muss ich das in der Excel/CSV tun?
Top video, danke!
Sehr Gutes video!
Danke für das Lob!
Viele Grüße, Björn.
Wenn das Regressionsmodell y = a + b*x + Ɛ lautet und für Ɛ N(0, σ²) gilt, wie gibt man das Modell in r an? Ich hatte an lm(y ~ x, dat) gedacht, aber dann beziehe ich das Ɛ ja nicht mit ein und das könnte noch einen Teil des Modells erklären, oder? Vielen Dank! :-)
Hallo, das Epsilon ist ein Restterm, der nicht durch das Modell geschätzt werden kann. Nur UV und AV sind in die Modellierung im Programm einzugeben.
Viele Grüße, Björn.
Sind beide Parameter notwendig, oder kann man 𝛼 oder 𝛽 gleich Null
setzen
Hallo, danke für das gut erklärte Video. Wo finde ich denn die Konfidenzintervalle?
Liebe Grüße
Hallo, einfach mit confint(model, level=0.95) anfordern.
Viele Grüße, Björn.
Danke!
Wo bekomme ich dein verwendeten Datensatz her?
Hallo Maximilian, gibt es auf meiner Homepage: www.bjoernwalther.com/einfache-lineare-regression-in-r-rechnen-und-interpretieren/
Viele Grüße, Björn.
Hallo, ich habe eine Frage, welche Bedeutung hat es wenn meine Funktion folgendermaßen aussieht lm(x~y+I(y^2),data=kk)? Welche beutung hat das y^2?
y^2 bedeutet "y hoch 2" oder y²
Deine Videos sind super erklärt und wirklich hilfreich! Eine Frage hätte ich zur linearen Regression bzw. zur moderierten. Bin ich richtig mit der Annahme, dass wenn bei der linearen Regression UV und AV verschiedene Skalenbreiten haben hier NICHT Z-Standartisiert werden muss? Und wie wäre das bei einer moderierten Regression? Vielen Dank! :)
Hallo Nils, danke für die lobenden Worte!
Du musst niemals z-standardisieren, es ist lediglich zu empfehlen, wenn die UV untereinander verschiedene Skalenbreiten haben und du aber deren Einfluss vergleichen möchtest. Da eine Moderation auch nur eine Regression ist, gibt es hierbei keinen Unterschied.
Viele Grüße, Björn.
@@StatistikamPC_BjoernWalther Vielen Dank :)
gibt es irgendeine möglichkeit sich die Gradengleichung auch anzeigen zu lassen?
Hallo, die kannst du aus Intercept + Estimate*x aufstellen.
Viele Grüße, Björn.
Ich habe eine Frage zum konkreten Output der linearen Regression in R: erhalte ich dabei einen direkten Effekt von UV auf AV oder einen totalen Effekt?
Hallo, bei einer einfachen linearen Regression gibt es keine Unterscheidungen. Man hat einen direkten Effekt von UV auf AV.
Viele Grüße, Björn.
Wie müsste ich vorgehen, wenn ich beispielsweise die Korrelation und statistische Signifikanz zwischen der Arbeitslosenquote und dem Wirtschaftswachstum über 20 Jahre berechnen müsste? Ich habe nur die beiden Wachstumsraten der Daten für die verschiedenen Zeiträume auf Papier ohne Excel Tabelle. Hättest du eventuell Videos, die mir zeigen, wie ich von diesem Ausgangspunkt bis zu meinem Ziel kommen kann? Habe 0 Erfahrung mit R und Excel.
Ich habe in meinem Skript 14 Unterschiedliche Datensätze in einer Schleife integriert. Ergebnis sind demnach 14 unterschiedliche Graphen. Ich würde gerne "summary(model)" für jeden "Graphen" einzeln ansehen, bzw. wie "Pr" jeweils ausschaut. Wie kann ich das in mein Skript integrieren?
Hallo Laura, hast du es inzwischen gelöst? Ich hätte ja einfach eine Schleife für die die Berechnung und summary-Funktion geschrieben.
Viele Grüße, Björn.
Kann man Dich irgendwie kontaktieren? Ich habe zb den plot erstellt, die x un y variablen zugewiesen. aber das sieht mehr wie komisch aus.
Hallo Björn, super hilfreiches Video! Gibt es auch ein Video für R Studio wie man den p - Wert für gerichtete Zusammenhangshypothesen berechnet (der p Wert in der Ausgabe ist ja immer der von der zweiseitigen Testung soweit ich weiß)?
Hallo Greta, das geht, wenngleich etwas umständlich ist und nur für positive oder negative Koeffizienten auf einmal funktioniert.
Zuerst das Modell berechnen und in einen Vektor (model) schieben, danach die Modellergebnisse mit summary() in einen Vektor (res) schieben. Im Anschluss folgt dann die eigentliche Berechnung mit pt - der t--Wert wird zur p-Wert-Berechnung verwendet. Wichtig ist, dass die Freiheitsgrade stimmen. Bei einer einfachen linearen Regression sind es 2 (1 für das Modell, 1 für die Prädiktor). In meinem Beispiel unterstelle ich einen positiven Koeffizient mit lower=FALSE. Mit lower=TRUE wäre die Koeffizient negativ.
model
@@StatistikamPC_BjoernWalther Danke für die Antwort! Kann ich bei z.B. bei einer positiv gerichteten Zusammenhangshypothese sonst auch mit der cor.test(...., alternative = "greater")mir den einseitigen p-Wert der Hypothese ermitteln?
Hallo, danke erstmal für deinen tollen Beitrag. Ich habe allerdings eine kleine Frage. Woher weiß ich dass ich meine Nullhypothese bei einem Wert unter 0,005 verwerfen kann. Mein Streudiagramm ist etwas verstreuter und ich habe einen P-wert von 0,000274. Heißt das es besteht ein Zusammenhang?
Hallo Nadine, in der Statistik nimmt man - je nach Forschungsdisziplin - typischerweise ein Alpha von 0,05 (0,01 oder auch 0,001) als Grenze. Liegt der p-Wert darunter, verwirft man die Nullhypothese KEINES Einflusses der UV auf die AV. Im Umkehrschluss bekräftigt das einen darin, dass ein Einfluss besteht. Bei einem so kleinen p-Wert wie bei dir geht man also von einem Einfluss/Zusammenhang aus.
Viele Grüße, Björn.
vielen dank fürt den inhalt, es hat geklappt!!! (nur das beispiel iq und abinote ist irgendwie doof...)
Danke Bruder
Danke für das tolle Video! Ich hatte mich gefragt, ob die "Estimates" den standardisierten beta Koeffizienten angeben? Falls nicht, gibt es eine Funktion in R, die ich nutzen könnte, um diese herauszubekommen?
Hallo Maggie, danke für dein Lob!
Die Estimats sind immer unstandardisiert. In einer einfachen linearen Regression ist das ja eigentlich auch nicht wirklich wichtig, da die standardisierten Koeffizienten immer nur dann herangezogen werden, wenn wenigstens 2 UV und deren Einfluss auf die AV bei unterschiedlichem Wertebereich verglichen werden sollen. Im Video zur multiplen Regression zeige ich, wie man die standardisierten Koeffizienten erhält - einfach im Vorfeld alle Variablen standardisieren.
Viele Grüße, Björn.
Mein Script findet die "model" nicht nur model.response etc.
Hallo, was bringt mir denn der p-Wert für den Intercept? Viele Grüße
Hallo Jan, in der Regel ist der p-Wert vom Intercept nicht wichtig. Selbst, wenn du eine Prognose mit deinem Modell rechnest, ist es unerheblich, wie der p-Wert vom Intercept ist. Das trifft im Prognose-Fall auch auf andere UV zu, wenn der F-Test signifikant ist. Bei der normalen Interpretation ändert sich nichts.
Viele Grüße, Björn.
@@StatistikamPC_BjoernWalther Vielen Dank für die schnelle Antwort
Tolle einfache Erklärung. Hast du auch eine Methode/Video wie mit in R zu dieser linearen Regression einen einseitiges Konfidenzintervall erstellt. Wir sollen den Leistungsabfall eines Produkts über die Zeit errechnen und dazu dann das einseitige 95% CI errechnen. Ich weiß, dass ich mit Hilfe der Formel des Models, die du hier gezeigt hast neue Werte berechnen muss und dann in die Grafik eintragen muss. Nur wie?
Weiss jemand wie ich ausrechnen kann ob die Schätzer Erwartungstreu sind?
Werden für der Regression die z standardisierten Werte genommen? Das wird mir hier aus dem Video nicht ersichtlich
Hallo Luisa, nein, es werden in R stets die unstandardisierten Werte verwendet. Wenn du die standardisierten Koeffizienten möchtest, musst du die im Vorfeld mit scale() z-standardisieren: ua-cam.com/video/3pLZBBti1YM/v-deo.html
Viele Grüße, Björn.
Danke für die Videos. Sehr gut erklärt etc.
Eine Frage nur zu dem IQ: Woher hast du die Daten denn? Das macht inhaltlich doch wenig Sinn, dass wenn der IQ steigt, der Abi Schnitt sinkt. Ich frage mich auch wie man solche Daten erheben will.
Hallo Christian, die Daten sind zufallsgeneriert, allerdings in gewissen Intervallen. Der Abiturschnitt ist aber wie üblich invers kodiert: eine niedrige ist eine gute Note. Das ergibt inhaltlich also durchaus Sinn, wenn ein steigender IQ zu einer niedrigeren und damit besseren Note führt.
Viele Grüße, Björn.
Welcher Wert von R² ist denn akzeptabel? Hier finde ich in keinem Lehrbuch und im ganzen Internet keine Antwort...
Pauschal: je höher, desto besser. 1 ist der Höchstwert. Je nach Disziplin gibt es unterschiedliche "Grenzen". Psychologische Phänomene mit unzähligen Einflussfaktoren haben bei nur einem Prädiktor fast nie mehr als 0,1, meist sogar noch weniger. Wenn ich allerdings eine AV habe, die per se nur wenige Einflussgrößen hat, sollte eine oder wenige UV zumindest etwas höhere Varianzaufklärung der AV erzeugen. Ist das nicht der Fall kommen dann die typischen Fehlerquellen ins Spiel: Stichprobengröße, -auswahl, Messung latenter Konstrukte usw.
Viele Grüße, Björn.
@@StatistikamPC_BjoernWalther super danke für die Antwort und die tollen Videos 🙏🙏🙏
Hi, tolles Video. Kannst du mir sagen, wie ich mir noch das CI für den standardisierten Regressionskoeffizienten Beta anzeigen lassen kann? Liebe Grüße
Hallo Joshi,
da kannst du die Funktion confint() verwenden. In die Klammern einfach den Modellnamen setzen.
Viele Grüße, Björn.
@@StatistikamPC_BjoernWalther Danke für deine Antwort. Ich dachte, das wäre der Befehl für den nicht standardisierten Regressonskoeffizient B. Ich habe die Berechnung in SPSS gemacht (Variablen Z transormiert, CI für B ausgeben lassen, ist dann ja gleich beta). Und da kommen unterschiedlich CI´s raus. Sie sind aber gleich, wenn ich auch in r z transformiere.
Hallo, vorweg ein sehr schönes Video. Es hat mir echt mega weiter geholfen.
Eine Frage: Hast du zufällig eine Quelle für die Erklärung der F-Statistik, Coefficents, R² etc. ?
Wäre mega.
Gruß David
Hallo David, danke für dein Lob!
Field - Discovering Statistics Using R (amzn.to/3auwxIc)
Viele Grüße, Björn.
danke!!
Vielen Dank für die tolle Erklärung! Könnten Sie auch eine Nicht-Lineare Regression an einem Beispiel in R-Studio erläutern? LG ;)
Hallo, das ist angedacht, allerdings erst wenn die wesentlichsten Analysemethoden abgearbeitet wurden.
Viele Grüße, Björn.
Wie kann ich jetzt Alpha interpretieren? Einzig als Wert, den der Abischnitt bei einem IQ von 0 annimt? Oder gibt es da noch andere Interpretationsmöglichkeiten?
Hallo Daniel, genau richtig. Wenn alle anderen Einflussgrößen 0 sind, ist das der Abiturschnitt. Das ergibt inhaltlich natürlich wenig Sinn, liegt aber in der Natur der linearen Regression. In einem Streudiagramm mit Gerade wäre dies der y-Achsenabschnitt.
Viele Grüße, Björn.
@@StatistikamPC_BjoernWalther Danke dir! Dein Video hat sehr geholfen, genau so eine Aufgabe kam auch in der Klausur dran :D Da ging es aber um durchschnittliche Ausgaben von Touristen mit den Variablen Destination und Reisejahr :)
Ehrenmann
Super Video! Vielleicht kannst du mir erklären, wie ich vorgehe, wenn ich Factors statt, numeric habe?
Hallo, du brauchst Dummy-Variablen für kategoriale Variablen. Erstellung: ua-cam.com/video/BhbyB5VO10k/v-deo.html und Interpretation: ua-cam.com/video/zkDzNJ5jEaQ/v-deo.html
Viele Grüße, Björn.
Und noch ein Themenvorschlag: Ich habe mal gehört, dass man in R auch Webcrawler basteln kann, die einem die Daten aus dem Web sammeln. Könntest du dazu vielleicht ein Tut machen?
Puh, das habe ich tatsächlich noch nicht versucht. Ich habe sowas mit Visual Basic mal geschrieben, ist aber Jahre her. Webcrawler sind auch immer so ein wenig heikel, wenn man Daten abgreift.
Viele Grüße, Björn.
Menschen, denen ich mein Leben zu verdanken habe:
Meine Mama
Mein Arzt
Statistik am PC
grüsse an alle meine hsg kollegen. -mike oxlong
kuss kuss kuss
Was lernen wir daraus? Einfach IQ erhöhen jau