Danke für das hilfreiche Video! Ich verstehe noch nicht ganz: Was ist der Unterschied dazwischen, Daten zu filtern und Teildatensätze zu erstellen? Im Video zum Daten filtern bist du ja sehr ähnlich vorgegangen und hast auch subsets erstellt. Da dann aber ohne die Funktion select=c(). Welchen Unterschied macht es, ob man die Daten einfach filtert oder die select-Funktion nutzt?
Hallo Björn, der Befehl ist gut aber wie mache ich es wenn meine Antworten nicht nur Zahlen sind? Zum Beispiel geht es bei mir um Länder die ich mir anzeigen lassen will (Beispiel: Germany, UK &Andorra ). Ist der Dateityp bei dem Befehl immer als Integer/numeric deklariert? Muss ich den Typ auf String ändern?
Hallo, wenn du eine kategoriale Variable als String hinterlegt hast, dann sollte das über =="Germany" | =="UK" | =="Andorra" genauso funktionieren. Vor das == musss natürlich der Variablenname. Wenn du Zahlen hast, dann sind die immer numerisch, nur Text wird als Character/String hinterlegt. Viele Grüße, Björn.
Hallo Björn, ich wollte eine Korrelationstabelle in APA nach deinem Tutorial machen. Klappt aber nicht, denn ich habe die $Variable die zu korrelieren ist im Hauptdatensatz EmPra und die Kriteriumsvariable im Datensatz Verträglichkeit und die zu korrelierende Variable $X_meanVer. Also zwei verschiedene Dataframes (Datensãtze) wie kann ich jetzt die zu korrelierenden $Variablen zusammenbringen? Ich wäre dir zutiefst dankbar für deine Hilfe. Lg. Michele
Hi, gut das du solche Videos machst. Ich bekomme folgenden Fehler, obwohl ich keine Rechtschreibfehler gemacht habe: "Fehler in subset.default(daten, select = c(A,B)) : Argument "subset" fehlt (ohne Standardwert)". Warum ist subset ein argument? Kennt R den Befehl nicht?
ich hätte ein Frage, wie kann man einen gesammten Datensatz numerisch machen. bislang ist der noch in der Klasse "character" und kann sie schlecht bearbeitet werden.. und es sind dann 74 Item bei denen es mir zu viel aufwand ist jedes mit "as.numeric" zu behandeln:)
Woran kann es liegen, wenn ich die Fehlermeldung "Objekt nicht gefunden" bekomme? Ich nutze exakt den subset Befehl aus dem Video und füge die Variablennamen ein, die ich haben will. Darunter auch eine Variable, die ich zuvor mit rowMeans dem Ursprungs-Datensatz hinzugefügt hab
@@StatistikamPC_BjoernWalther hey danke, ich hab es kurzfristig herausgefunden. nun hänge ich aber am mutate-befehl.. ich will s1:s4 gleich rekodieren. Also die Antowrten von 5 sollen auf die 1, die antworten von 4 auf die 2 usw. Zusätzlich werden die Werte alle gleich gelabelt. aber beim Mutate funktioniert es nicht so richtig.
Würde die Zeile data_koerper % select(Geschlecht, Größe, Gewicht, BMI, Sportnote) das ganze nicht auch, aber effiezienter lösen, ganz ohne subset- und c-Funktionen?
Hallo, ich habe eine kurze Frage dazu. Wie kann ich das machen wenn die Antworten meines Fragebogens nicht Num. sind sondern Chr. Bei mir wird immer eine Fehlermeldung angezeigt.
Hey Björn, vielen Dank für deine hilfreichen Videos. Erleichtern mir den Einstieg in R enorm. Ich habe folgendes Problem mit dem subset Befehl. Ich möchte bestimmte PLZ in einem Subset kategorisieren, das klappt bei mir aber leider immer nur bei einer einzelnen PLZ. Wenn ich mehrere verbinden möchte erstell R zwar das subset gibt aber jedes Mal 0 observations an. Ich habe es mit folgendem Befehl und zahlreichen Variationen probiert, finde aber meinen Fehler nicht; Einheim_FG
Hi, super hilfreiche Videos!!! Danke dafür! meine Frage wäre, ich habe Spaltennamen in Form von ganzen Fragen. Gibt es eine Möglichkeit die Spalten mit select=c anzusprechen, ohne die jeweils komplette Frage anzugeben? Danke für die Hilfe :)
Hallo, du kannst einfach die Nummer der Spalte nehmen, also subset(data, select=c(2:5, 8)) würde dir die Spalten 2 bis 5 sowie die Spalte 8 in dein Subset ziehen. Viele Grüße, Björn.
Hey, wie kann ich denn mehrere Reihen auswählen und nicht Kolonnen. Zum Beispiel habe ich eine Tabelle von mehreren Ländern und möchte jetzt 3 Länder auswählen mit den dazugehörigen informationen. Geht das irgendwie?
Danke für das Video, ich habe den Befehl für meine MA genutzt, aber meine subset-table sind leer. Zudem steht dort "no data available in table" Ich stehe auf dem Schlauch und komme nicht weiter
Hallo Rabea, ich vermute mal, dass dein Filter zu "scharf" ist oder du einen Tippfehler im Krtierium hast. Wenn auch das nicht geht, würde ich im Vorfeld über Excel einen Datensatz mit den Kriterien erstellen. Viele Grüße, Björn.
Hallo Maria, ein Teildatensatz beinhaltet mehrere Variablen. Demzufolge können in einer Variable nicht mehrere abgegbildet werden, zumindest nicht, wenn man damit arbeiten möchte. Viele Grüße, Björn.
Hallo, ein super video, sehr verständlich! Wie funktioniert das filtern bei Personen wenn ich keine kategorialen Antworten habe? (Wenn jede Person bei Bedarf z.B eine eigene Antwort eingeben kann)
Hallo Christin, wenn jede Person eine eigene Antwort geben kann, dann brauchst du ja keine Teildatensätze erstellen, weil diese aus nur jeweils einer Beobachtung bestehen würden. Du brauchst schon ein Merkmal, dass mehrfach ausgewählt wurde. Viele Grüße, Björn.
Vielen Dank für das tolle Video! Mir stellt sich noch eine Frage: Ich habe in meinem Ursprungsdatensatz Ausprägungen von 1-5 und möchte in einen Datensatz zur die Ausprägungen zwischen 2 und 3 aufnehmen. Weiß jemand, wie ich das in R machen kann? Über eine Hilfe würde ich mich sehr freuen. Dankeschön!
Ich hatte mir überlegt von einer Variable mehrere Ausprägungen zu haben und nicht nur männlich, sondern vl männlich, weiblich und divers nicht, also: data_m_koerper
vielen Dank für da Video ;) Kannst mir zufällig die Frage beantworten, wie einen subset mache in dem ich beispielsweise alle menschen mit beispielsweise Sportnote 2 und 3 machen. Meine Ideen waren: dat_2_3
Hallo Hans, der Schlüssel ist eine logische Verknüpfung der Bedingung. Das geschieht mit dem senkrechten Strich: | und sieht dann wie folgt aus: data_2_3
super cooles Video. Ich habe eine Frage, die nicht in diesem Video behandelt worden ist und etwas kompliziert ist, ich versuche es mal zu erklären, ich würde mich sehr über Hilfe freuen. Ich habe eine Ursprungstabelle sagen wir data In dieser Ursprungstabelle fasste ich einige spalten zusammen und erstelle eine neue spalte sagen wir info1 das gleiche mache ich mit weiteren spalten die ich zu einer weiteren neuen spalte kombiniere sagen wir info2 nun habe ich also data mit meinen ganzen variablen + zwei neue spalten info1 und info2 diese Ursprungstabelle data teile ich nun mithilfe der subset Funktion in zwei Generationen auf. also zb data_x
Hallo und danke für dein Lob! Ich habe das aus einer xlsx-Datei eingelesen und die read_excel-Funktion verwendet. Die read.csv2-Funktion schafft das leider nicht. Viele Grüße, Björn.
📘Mein Buch "Statistik mit R - Schnelleinstieg": amzn.to/3OzeLJI [Affiliatelink]
Björn, tolle Videos! grandios erklärt, didaktisch toll, unaufgeregt, aufeinander aufbauend! Ganz großes Kino!
Hallo Jan, Danke für das Lob und dein Super Thanks!
Viele Grüße, Björn.
Deine Videos sind der Hammer!!!!!!! Ich wäre verloren ohne dich!!!!!!!!
Vielen Dank!!!!
Wie schaffe ich es, aus einem Datensatz 2 Variablen gleichzeitig auszuwählen & zu plotten ?
Danke! Super Video!
super Video, vielen Dank!!
Danke für das hilfreiche Video! Ich verstehe noch nicht ganz: Was ist der Unterschied dazwischen, Daten zu filtern und Teildatensätze zu erstellen? Im Video zum Daten filtern bist du ja sehr ähnlich vorgegangen und hast auch subsets erstellt. Da dann aber ohne die Funktion select=c(). Welchen Unterschied macht es, ob man die Daten einfach filtert oder die select-Funktion nutzt?
ich küss dein herz
danke, prima
Hallo Björn, der Befehl ist gut aber wie mache ich es wenn meine Antworten nicht nur Zahlen sind? Zum Beispiel geht es bei mir um Länder die ich mir anzeigen lassen will (Beispiel: Germany, UK &Andorra ). Ist der Dateityp bei dem Befehl immer als Integer/numeric deklariert? Muss ich den Typ auf String ändern?
Hallo, wenn du eine kategoriale Variable als String hinterlegt hast, dann sollte das über =="Germany" | =="UK" | =="Andorra" genauso funktionieren. Vor das == musss natürlich der Variablenname. Wenn du Zahlen hast, dann sind die immer numerisch, nur Text wird als Character/String hinterlegt.
Viele Grüße, Björn.
@@StatistikamPC_BjoernWalther habe ich auch versucht, hat jedoch nicht funktioniert. Hast du einen anderen Tip? LG
Bei Fragen und Anregungen zu Teildatensätze in R erstellen - der Subset-Befehl, nutzt bitte die Kommentarfunktion.
Wie kann ich einen Faktor, welchen ich vorher definiert habe mit subset einfügen
was ist wenn ich nur die top 10 IQ angeben möchte?
Hallo Björn, ich wollte eine Korrelationstabelle in APA nach deinem Tutorial machen. Klappt aber nicht, denn ich habe die $Variable die zu korrelieren ist im Hauptdatensatz EmPra und die Kriteriumsvariable im Datensatz Verträglichkeit und die zu korrelierende Variable $X_meanVer. Also zwei verschiedene Dataframes (Datensãtze) wie kann ich jetzt die zu korrelierenden $Variablen zusammenbringen? Ich wäre dir zutiefst dankbar für deine Hilfe. Lg. Michele
Hi, gut das du solche Videos machst. Ich bekomme folgenden Fehler, obwohl ich keine Rechtschreibfehler gemacht habe: "Fehler in subset.default(daten, select = c(A,B)) :
Argument "subset" fehlt (ohne Standardwert)". Warum ist subset ein argument? Kennt R den Befehl nicht?
ich hätte ein Frage, wie kann man einen gesammten Datensatz numerisch machen. bislang ist der noch in der Klasse "character" und kann sie schlecht bearbeitet werden.. und es sind dann 74 Item bei denen es mir zu viel aufwand ist jedes mit "as.numeric" zu behandeln:)
Wie kann ich das denn für das Alter machen? Also das Alter in 4 Gruppen einteilen die ich dann vergleichen kann
Bei mir kommt momentan immer die Fehlermeldung
Argument "subset" fehlt (ohne Standardwert)
Sehr hilfreich, wie kann ich dann den levenetest mit dem subset machen, wenn ich zusätzlich center=mean setze?
Bei mir kommt ständig die Fehlermeldung "'Error in subset.data.frame subset' muss boolesch sein" was bedeutet das und was muss ich da machen?
Woran kann es liegen, wenn ich die Fehlermeldung "Objekt nicht gefunden" bekomme? Ich nutze exakt den subset Befehl aus dem Video und füge die Variablennamen ein, die ich haben will. Darunter auch eine Variable, die ich zuvor mit rowMeans dem Ursprungs-Datensatz hinzugefügt hab
Hallo, hast du die Daten attached bzw. den Dataframe richtig benannt?
Viele Grüße, Björn.
Kann man hier auch das Eintippen der Variablen verkürzen? zB hab ich Variable s1,s2,s3,s4.... tippt man dasn s1* oder s1-s4 ein?
Du kannst s1:s4 schreiben, dann werden s1 bis s4 ausgewählt. Alternativ kannst du auch die Spaltennummer verwenden.
Viele Grüße, Björn.
@@StatistikamPC_BjoernWalther hey danke, ich hab es kurzfristig herausgefunden. nun hänge ich aber am mutate-befehl.. ich will s1:s4 gleich rekodieren. Also die Antowrten von 5 sollen auf die 1, die antworten von 4 auf die 2 usw. Zusätzlich werden die Werte alle gleich gelabelt. aber beim Mutate funktioniert es nicht so richtig.
Würde die Zeile data_koerper % select(Geschlecht, Größe, Gewicht, BMI, Sportnote)
das ganze nicht auch, aber effiezienter lösen, ganz ohne subset- und c-Funktionen?
Hallo Florian, ja, das geht natürlich auch, erfordert aber das dplyr-Paket. Wie immer führen in R viele Wege zum Ziel. ;-)
Viele Grüße, Björn.
@@StatistikamPC_BjoernWalther danke für die Antwort!
Hallo, ich habe eine kurze Frage dazu. Wie kann ich das machen wenn die Antworten meines Fragebogens nicht Num. sind sondern Chr.
Bei mir wird immer eine Fehlermeldung angezeigt.
Hey Björn, vielen Dank für deine hilfreichen Videos. Erleichtern mir den Einstieg in R enorm. Ich habe folgendes Problem mit dem subset Befehl. Ich möchte bestimmte PLZ in einem Subset kategorisieren, das klappt bei mir aber leider immer nur bei einer einzelnen PLZ. Wenn ich mehrere verbinden möchte erstell R zwar das subset gibt aber jedes Mal 0 observations an.
Ich habe es mit folgendem Befehl und zahlreichen Variationen probiert, finde aber meinen Fehler nicht;
Einheim_FG
Müsstest du nicht den ODER Befehl (|)verwenden?
Hi,
super hilfreiche Videos!!! Danke dafür!
meine Frage wäre, ich habe Spaltennamen in Form von ganzen Fragen. Gibt es eine Möglichkeit die Spalten mit select=c anzusprechen, ohne die jeweils komplette Frage anzugeben?
Danke für die Hilfe :)
Hallo, du kannst einfach die Nummer der Spalte nehmen, also subset(data, select=c(2:5, 8)) würde dir die Spalten 2 bis 5 sowie die Spalte 8 in dein Subset ziehen.
Viele Grüße, Björn.
@@StatistikamPC_BjoernWalther Klasse, vielen dank!!
Hey, wie kann ich denn mehrere Reihen auswählen und nicht Kolonnen. Zum Beispiel habe ich eine Tabelle von mehreren Ländern und möchte jetzt 3 Länder auswählen mit den dazugehörigen informationen. Geht das irgendwie?
Hallo Lennard, meinst du evtl. sowas hier: ua-cam.com/video/EZFIwbSR7oc/v-deo.html
Viele Grüße, Björn.
Danke für das Video, ich habe den Befehl für meine MA genutzt, aber meine subset-table sind leer. Zudem steht dort "no data available in table" Ich stehe auf dem Schlauch und komme nicht weiter
Hallo Rabea, ich vermute mal, dass dein Filter zu "scharf" ist oder du einen Tippfehler im Krtierium hast. Wenn auch das nicht geht, würde ich im Vorfeld über Excel einen Datensatz mit den Kriterien erstellen.
Viele Grüße, Björn.
Wie kann man anstatt dem Subdatensatz eine neue Variable erstellen, die den gleichen Zweck hat?
Hallo Maria, ein Teildatensatz beinhaltet mehrere Variablen. Demzufolge können in einer Variable nicht mehrere abgegbildet werden, zumindest nicht, wenn man damit arbeiten möchte.
Viele Grüße, Björn.
Hallo, ein super video, sehr verständlich!
Wie funktioniert das filtern bei Personen wenn ich keine kategorialen Antworten habe?
(Wenn jede Person bei Bedarf z.B eine eigene Antwort eingeben kann)
Hallo Christin, wenn jede Person eine eigene Antwort geben kann, dann brauchst du ja keine Teildatensätze erstellen, weil diese aus nur jeweils einer Beobachtung bestehen würden. Du brauchst schon ein Merkmal, dass mehrfach ausgewählt wurde.
Viele Grüße, Björn.
Vielen Dank für das tolle Video! Mir stellt sich noch eine Frage: Ich habe in meinem Ursprungsdatensatz Ausprägungen von 1-5 und möchte in einen Datensatz zur die Ausprägungen zwischen 2 und 3 aufnehmen. Weiß jemand, wie ich das in R machen kann? Über eine Hilfe würde ich mich sehr freuen. Dankeschön!
Ich hatte mir überlegt von einer Variable mehrere Ausprägungen zu haben und nicht nur männlich, sondern vl männlich, weiblich und divers nicht, also: data_m_koerper
Hallo, du kannst einen Bereich aufspannen, in dem du mit & verknüpfst. Also z.B. "data_m_koerper 999 $ Einkommen
vielen Dank für da Video ;)
Kannst mir zufällig die Frage beantworten, wie einen subset mache in dem ich beispielsweise alle menschen mit beispielsweise Sportnote 2 und 3 machen.
Meine Ideen waren: dat_2_3
Hallo Hans, der Schlüssel ist eine logische Verknüpfung der Bedingung. Das geschieht mit dem senkrechten Strich: | und sieht dann wie folgt aus:
data_2_3
super cooles Video.
Ich habe eine Frage, die nicht in diesem Video behandelt worden ist und etwas kompliziert ist, ich versuche es mal zu erklären, ich würde mich sehr über Hilfe freuen.
Ich habe eine Ursprungstabelle sagen wir
data
In dieser Ursprungstabelle fasste ich einige spalten zusammen und erstelle eine neue spalte sagen wir
info1
das gleiche mache ich mit weiteren spalten die ich zu einer weiteren neuen spalte kombiniere sagen wir
info2
nun habe ich also data mit meinen ganzen variablen + zwei neue spalten info1 und info2
diese Ursprungstabelle data teile ich nun mithilfe der subset Funktion in zwei Generationen auf.
also zb
data_x
Ich kann R nicht leiden.
Gutes Video, sehr hilfreich. Aber wie hast du es geschafft, dass die Umlaute und das ß angezeigt werden?
Hallo und danke für dein Lob!
Ich habe das aus einer xlsx-Datei eingelesen und die read_excel-Funktion verwendet. Die read.csv2-Funktion schafft das leider nicht.
Viele Grüße, Björn.
@@StatistikamPC_BjoernWalther Interessant. Danke für die Antwort.