Website-Icon Björn Walther

T-Test bei unabhängigen Stichproben in Excel durchführen

1 Ziel des t-Test bei unabhängigen Stichproben in Excel

Der t-Test für unabhängige Stichproben in Excel testet, ob bei zwei unabhängigen Stichproben die Mittelwerte unterschiedlich sind. Für abhängige Stichproben ist der t-Test für verbundene Stichproben zu rechnen. In SPSS gibt es den t-Test für unabhängige Stichproben auch.

 

2 Voraussetzungen des t-Test bei unabhängigen Stichproben in Excel

Die wichtigsten Voraussetzungen sind:

 

3 Durchführung des t-Test bei unabhängigen Stichproben in Excel

Im Beispiel möchte ich prüfen, ob der Ruhepuls von trainierten Personen unterschiedlich ist zu untrainierten Personen. Ich kann eine gerichtete/einseitige Hypothese formulieren:

“Trainierte Personen haben einen niedrigeren Ruhepuls als untrainierte Personen.”

 

Über das Menü in Excel: Reiter “Daten” > “Datenanalyse” > “Zweistichproben t-Test: Gleicher Varianzen”.

Hinweis: Sollte die Funktion “Datenanalyse” nicht vorhanden sein, ist diese über “Datei” > “Optionen” > “Add-Ins” > “Verwalten” -> “Los…” zu aktivieren. Dieses Video zeigt dies kurz.

Als Bereich Variable A markiert man die beobachteten Werte der ersten Stichprobe. Im Bereich Variable B sind es entsprechend die beobachteten Werte der zweiten Stichprobe. Unten ist zu sehen, dass B3-B15 die eine Variable bzw. Gruppe und E3-E15 die andere Gruppe bzw. Variable ist.

Bei “Hypothetische Differenz der Mittelwerte” ist eine “0” einzutragen Dies hat zur Folge, dass Excel folgende Nullhypothese testet: die beiden Stichproben stammen aus der gleichen Grundgesamtheit und besitzen damit ähnliche (“gleiche”) Mittelwerte.

Sollte in den Bereichen A und B eine Beschriftung mit markiert worden sein, ist bei “Beschriftungen” ein Haken zu setzen. Dadurch wird die erste Zeile, die dann die Beschriftung enthält, ignoriert.

Als Alpha ist das Alphafehler-Niveau einzutragen. Hier ist typischerweise 5% also 0,05 zu wählen. Es besteht auch die Möglichkeit eine geringere Wahrscheinlichkeit für einen Fehler 1. Art  zu wählen. Das entspricht einer geringeren Wahrscheinlichkeit, die Nullhypothese fälschlicherweise abzulehnen, also einen Effekt zu unterstellen, der nicht vorhanden ist..

 

4 Interpretation des t-Test bei unabhängigen Stichproben in Excel

4.1 Die Voraussetzung der Varianzhomogenität

Pauschal empfehle ich folgendes Vorgehen:

Möchte man stets auf Nummer sicher gehen, wird pauschal der t-Test bei ungleichen Varianzen gerechnet: Die Auswahl und Berechnung ist analog zu oben möglich: Reiter “Daten” > “Datenanalyse” > “Zweistichproben t-Test: Unterschiedlicher Varianzen”.
Logik hinter der pauschalen Rechnung: Liegen Verletzungen vor, wird für diese korrigiert. Liegen keine Verletzungen vor, erfolgt keine Korrektur (vgl. Field (2018), S.259).

 

4.2 Signifikanz des Tests

Neben den standardmäßig ausgegebenen Mittelwert, Varianzen, Beobachtungen usw. ist das Augenmerk auf den p-Wert (“P(T<=t) einseitig” bzw. “P(T<=t) zweiseitig”) zu richten. 

Ausgabe des Zweistichproben t-Test unter der Annahme gleicher Varianzen

ACHTUNG: Hat man bereits eine Vermutung, dass z.B. eine Gruppe einen höheren/niedrigeren Wert hat, ist dies eine gerichtete Hypothese (siehe blaue Box, Abschnitt 3) und man muss 1-seitig testen – sofern die Mittelwerte Anlass dazu geben und die Vermutung widerspiegeln. Dies ist in meinem Fall gegeben, da der Mittelwert der Trainierten mit 52,38 kleiner ist als der Untrainierten mit 61. Demzufolge interessiert nur der Wert hinter “P(T<=t) einseitig”.

Ist der p-Wert (hier: p = 0,018) hinreichend klein bzw. kleiner als Alpha (z.B. 0,05), geht man davon aus, dass die Gruppen nicht aus derselben Grundgesamtheit stammen.

Oder anders formuliert: man kann von nicht zufälligen Unterschieden hinsichtlich der Mittelwerte zwischen den Gruppen ausgehen.

Alternativ kann man statt dem p-Wert auch die sog. “t-Statistik” (hier 2,231) zur Beurteilung heranziehen. Sie ist in Verbindung mit den Freiheitsgraden (24) mit dem “Kritischen t-Wert bei einseitigem t-Test” bzw. “Kritischen t-Wert bei zweiseitigem t-Test” zu vergleichen. Ist der kritische t-Wert (errechnet 1,71) kleiner als die t-Statistik, ist die Nullhypothese von Gleichheit ebenfalls zu verwerfen. Ob einseitig oder zweiseitig zu testen ist, ist analog zu 3. zu entscheiden.

 

4.3 Effektstärke des Tests

Nachdem festgestellt wurde, dass Unterschiede zwischen den Gruppen existieren, ist die Größe dieses Unterschiedes zu quantifizieren.

Nicht vergessen: Der p-Wert sagt nichts über die Stärke des Unterschiedes. Er beschreibt lediglich die Wahrscheinlichkeit, dass der beobachtbare Unterschied zufällig zustande gekommen ist.

 

4.3.1 Cohen’s d manuell berechnen

   

 

mit

   

bzw. bei gleichen Gruppengrößen

   

Im Beispiel sind die Mittelwerte 61 und 52,38 (siehe oben) sowie die gepoolte Standardabweichung 9,85. Eingesetzt in die obige Formel:

   

Diese Größe wird mit Hilfe vergleichbarer Studien eingeordnet. Behelfsweise werden fachspezifische Grenzen verwendet.

Ist beides nicht vorhanden, kann Cohen (1988/1992) herangezogen werden:

Im Beispiel liegt der Wert 0,875 über der Grenze zum starken Effekt. Somit ist der Unterschied zwischen den beiden Gruppen bzw. deren Ruhepulsen stark.

 

4.3.2 Effektstärkemaß r manuell berechnen

Eine zweite Möglichkeit ist die manuelle Berechnung von r sowie die Beurteilung anhand Cohen: Statistical Power Analysis for the Behavioral Sciences (1988), S. 79-81. Cohen selbst merkt aber an, dass die Effektstärkemaße und deren Klassengrenzen nicht 1:1 vergleichbar sind. Vorzuziehen ist Cohen’s d. Die Berechnung von r erfolgt über die Formel mit t² als quadrierter T-Wert und df als degrees of freedom (Freiheitsgrade).

   

Ab 0,1 ist es ein schwacher Effekt, ab 0,3 ein mittlerer und ab 0,5 ein starker Effekt.

Im Beispiel ist der t-Wert 2,231 und die Freiheitsgrade (df) 24. Eingesetzt in die Formel:

   

Das Ergebnis von 0,414 liegt über der Grenze zur mittleren Effektstärke und der Unterschied ist damit laut Cohen ein mittelstarker Unterschied. Allerdings gibt es neuere Richtlinien bzgl. r, die von Gignac, Szodorai (2016) vorgeschlagen wurden, die bei 0,1 (klein), 0,2 (mittel) und 0,3 (groß) liegen. Demnach wäre der Unterschied im Beispiel ein großer.

 

5 Videotutorials

https://www.youtube.com/watch?v=VwkL51UFFhY/ https://www.youtube.com/watch?v=15q3MDex8BM/

 

6 Reporting des t-Tests bei unabhängigen Stichproben

Gruppenmittelwerte und Standardabweichungen sind zu berichten. Zusätzlich die t-Statistik mit Freiheitsgraden, der p-Wert (je nach Hypothese ein- oder zweiseitig) und die Effektstärke (vorzugsweise Cohen’s d):

t(df) = t-Wert; p-Wert; Effektstärke d.

Bei untrainierten Personen (M = 61; SD = 9,82) ist im Vergleich mit trainierten Personen (M = 52,38; SD = 9,87) ein höherer Ruhepuls beobachtbar, t(24) = 2,23; p = 0,035; d = 0,88. Nach Cohen (1992) ist dieser Unterschied groß.

 

7 Literatur

 

Weitere nützliche Tutorials findest du auf meinem YouTube-Kanal.

 

Die mobile Version verlassen