Website-Icon Björn Walther

t-Test für unabhängige Stichproben in R rechnen und interpretieren

Ziel des t-Test bei unabhängigen Stichproben in R

Der t-Test für unabhängige Stichproben testet, ob für zwei unverbundene (unabhängige) Stichproben unterschiedliche Mittelwerte bzgl. einer abhängigen Testvariable existieren. Für abhängige Stichproben ist der t-Test für abhängige/verbundene Stichproben zu rechnen. In Excel und SPSS kann der t-Test für unabhängige Stichproben auch gerechnet werden. Habt ihr mehr als zwei Gruppen, ist eine einfaktorielle ANOVA zu rechnen.

Sind die folgenden Voraussetzungen nicht erfüllt, solltet ihr einen Mann-Whitney-U-Test rechnen.

Voraussetzungen des t-Test bei unabhängigen Stichproben in R

Die wichtigsten Voraussetzungen sind:

https://www.youtube.com/watch?v=

Fragen können unter dem verlinkten Video gerne auf YouTube gestellt werden.  

Durchführung des t-Test bei unabhängigen Stichproben in R

Nullhypothese

Die Nullhyopthese beim t-Test für unabhängige Stichproben geht von in etwa Gleichheit der Mittelwerte der beiden Gruppen aus.

Ihr könnt bei diesem Test einseitig und zweiseitig testen. Einseitig heißt lediglich, dass ihr eine konkrete Vermutung habt, dass der Mittelwert der Testvariable (=abhängige Variable) der einen Gruppe kleiner oder größer ist als der Mittelwert der Testvariable der anderen Gruppe. Standardmäßig wird zweiseitig getestet, das heißt ihr vermutet einen Unterschied, wisst aber nicht, ob welche Gruppen den größeren Mittelwert hat.

Ein Beispiel: Ich habe einen Datensatz mit Männern und Frauen und ich möchte schauen, ob sie sich im Mittel hinsichtlich ihrer Körpergröße (in m) unterscheiden.

Die Nullhypothese ist also: Es gibt keinen Unterschied hinsichtlich der Körpergröße (in m) zwischen Männern und Frauen. Die Alternativhypothese lautet entsprechend: Es gibt einen Unterschied hinsichtlich der Körpergröße (in m) zwischen Männern und Frauen. Das können wir sogar konkretisieren, da wir aus Erfahrung wissen, dass Männer etwas größer (Frauen: 1,66 m, Männer: 1,79 m) sind. Die Alternativhypothese kann demzufolge sogar lauten: Männer haben im Mittel eine größere Körpergröße (in m).  

 

t-Statistik

Die Berechnung der T-Statistik ist die Basis, die folgende Formel hat:

   

Zum Glück muss man das in R nicht alles nachbauen und kann direkt die Funktion t.test() verwenden.  

 

Code in R

Nach dem Einlesen eurer Daten verwendet ihr die Funktion t.test():


t.test(x~y, var.equal, alternative)

Die Funktion t.test() hat noch viele weitere Attribute, die drei obigen sind aber die wichtigsten. „x“ ist eure Testvariable, „y“ die Gruppenvariable. Bei mir ist „x“ die Körpergröße und „y“ das Geschlecht. „var.equal“ gibt an, ob ihr gleiche oder ungleiche Varianzen habt. Das solltet ihr im Vorfeld testen. Meist reicht ein Augentest mit z.B. der „describeBy“-Funktion des „psych“-Pakets. „alternative“ gibt an, ob ein- oder zweiseitig getestet wird. Einseitig bedeutet, ihr wisst, welche Gruppe einen größeren oder kleineren Wert hat, also es existiert eine konkrete Wirkungsvermutung. Wir können hier einseitig testen, ich zeige aber sowohl einen einseitigen als auch einen zweiseitigen Test.  

 

Beispielcode in R: zweiseitiger Test


t.test(Größe~Geschlecht, var.equal = TRUE, alternative = "two.sided")
Wie zu erkennen ist, habe ich die Größe auf Unterschied hinsichtlich des Geschlechts geprüft („Größe~Geschlecht“). Gleichzeitig habe ich im Vorfeld schon geprüft, ob ich gleiche Varianzen habe. Demzufolge verwende ich auch „var.equal = TRUE“. Sollte ihr ungleiche Varianzen haben, gebt ihr statt TURE einfach FALSE an, dann wird ein Welch-Test gerechnet. Als „alternative“ habe ich „two.sided“ angegeben. Das ist die typische Testung, die standardmäßig von t.test() vorgenommen wird – man kann dieses Argument daher auch hier weglassen.  

 

Beispielcode in R: einseitiger Test

Habt ihr eine konkrete Vermutung, welche Gruppen einen größeren Mittelwert hat, testet ihr einseitig. Dazu fügt ihr dem Code noch das Argument “ alternative = “greater“ “ oder  “ alternative = “less“ “ hinzu. Hierbei ist zu beachten, dass greater bedeutet, dass eure Gruppe 1 größer ist als Gruppe 2. Was ist Gruppe 1 und was ist Gruppe 2? Das habt ihr im Vorfeld im Datensatz festgelegt. In meinem Fall hat die Geschlechtsvariable die Ausprägung 0 für Männer und 1 für Frauen. Die Gruppe 1 im t-Test ist also immer die Gruppe, deren Gruppierungscodierung kleiner ist. Bei mir die Männer.


t.test(Größe~Geschlecht, var.equal = TRUE, alternative = "greater")
Wenn ihr jedoch (aus welchen Gründe auch immer) davon ausgeht, dass die Männer im Mittel kleiner sind als die Frauen, lautet das Argument “ alternative = “less“ „.

t.test(Größe~Geschlecht, var.equal = TRUE, alternative = "less")

 

Interpretation der Ergebnisse des Zweistichproben t-Test in R

Interpretation des zweiseitigen t-Tests

Two Sample t-test data: Größe by Geschlecht
t = 3.9402, df = 49, p-value = 0.0002581
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval: 0.06332773 0.19516458
sample estimates:
mean in group 0: 1.778846
mean in group 1 : 1.649600 

Aus diesem Wust an Zahlen interessiert an und für sich nur sehr weniges.

 

Interpretation des einseitigen t-Tests

Hier wurde nun der t-Test für unverbundene Stichproben einseitig gerechnet. Und zwar war die Vermutung, dass die Männer im Mittel größer sind.


Two Sample t-test data: Größe by Geschlecht
t = 3.9402, df = 49, p-value = 0.000129
alternative hypothesis: true difference in means is greater than 0
95 percent confidence interval: 0.07425165 Inf
sample estimates:
mean in group 0: 1.778846
mean in group 1 : 1.649600 
Der einseitige t-Test ist nahezu analog zum zweiseitigen t-Test zu interpretieren:

 

Download Beispieldatensatz

Datensatz als .zip.

 

  Weitere nützliche Tutorials findest du auf meinem YouTube-Kanal.

 

Die mobile Version verlassen