1 Ziel des t-Test bei unabhängigen Stichproben in Excel
Der t-Test für unabhängige Stichproben in Excel testet, ob bei zwei unabhängigen Stichproben die Mittelwerte bzw. zentralen Tendenzen unterschiedlich sind. Für abhängige Stichproben ist der t-Test für verbundene Stichproben zu rechnen. In SPSS gibt es den t-Test für unabhängige Stichproben auch. Habt ihr nur eine Stichprobe, rechnet ihr den Einstichproben t-Test.
2 Voraussetzungen des t-Test bei unabhängigen Stichproben in Excel
Die wichtigsten Voraussetzungen sind:
- zwei voneinander unabhängige Stichproben/Gruppen
- metrisch skalierte y-Variable
- normalverteilte Fehlerterme innerhalb der Gruppen
- Homogene (nahezu gleiche) Varianzen der y-Variablen der Gruppen – über Levene-Test
- Achtung: Mindeststichprobengröße bedenken – über eine Poweranalyse zu ermitteln
Fragen können unter dem verlinkten Video gerne auf YouTube gestellt werden.
3 Durchführung des t-Test bei unabhängigen Stichproben in Excel
Über das Menü in Excel: Reiter “Daten” -> “Datenanalyse” -> “Zweistichproben t-Test: Gleicher Varianzen”.
Hinweis: Sollte die Funktion “Datenanalyse” nicht vorhanden sein, ist diese über “Datei” -> “Optionen” -> “Add-Ins” -> “Verwalten” -> “Los…” zu aktivieren. Dieses Video zeigt dies kurz.
Als Bereich Variable A markiert man die beobachteten Werte der ersten Stichprobe. Im Bereich Variable B sind es entsprechend die beobachteten Werte der zweiten Stichprobe. Unten ist zu sehen, dass B3-B15 die eine Variable bzw. Gruppe und E3-E15 die andere Gruppe bzw. Variable ist.
Bei “Hypothetische Differenz der Mittelwerte” ist eine “0” einzutragen Dies hat zur Folge, dass Excel folgende Nullhypothese testet: die beiden Stichproben stammen aus der gleichen Grundgesamtheit und besitzen damit ähnliche (“gleiche”) Mittelwerte.
Sollte in den Bereichen A und B eine Beschriftung mit markiert worden sein, ist bei “Beschriftungen” ein Haken zu setzen. Dadurch wird die erste Zeile, die dann die Beschriftung enthält, ignoriert.

Als Alpha ist das Alphafehler-Niveau einzutragen. Hier ist typischerweise 5% also 0,05 zu wählen. Es besteht auch die Möglichkeit eine geringere Wahrscheinlichkeit einen Fehler 1. Art zu wählen. Das entspricht einer geringeren Wahrscheinlichkeit, die Nullhypothese fälschlicherweise abzulehnen.
4 Interpretation des t-Test bei unabhängigen Stichproben in Excel
4.1 Die Voraussetzung der Varianzhomogenität
Sie kann auf zwei Arten geprüft werden. Zum einen mit der Berechnung der Varianz der Stichproben. Wenn sie ungefähr gleich sind, genügt dies. Zum anderen kann ein analytischer Test gerechnet werden: der Levene-Test (Video). Häufig reicht die erste Variante bereits. Sind die Varianzen nicht homogen bzw. gleich, muss ein t-Test mit unterschiedlichen Varianzen gerechnet werden. Die Auswahl ist im Menü analog zu oben: Reiter “Daten” -> “Datenanalyse” -> “Zweistichproben t-Test: Unterschiedlicher Varianzen”.
Ausgabe des Zweistichproben t-Test unter der Annahme gleicher Varianzen

4.2 Signifikanz des Tests
Neben den standardmäßig ausgegebenen Mittelwert, Varianzen, Beobachtungen usw. ist das Augenmerk auf den p-Wert (“P(T<=t) einseitig” bzw. “P(T<=t) zweiseitig”) zu richten. ACHTUNG: Hat man bereits eine Vermutung, dass z.B. eine Gruppe einen höheren/niedrigeren Wert hat, ist dies eine gerichtete Hypothese und man muss 1-seitig testen – sofern die Mittelwerte Anlass dazu geben und die Vermutung widerspiegeln. Demzufolge interessiert nur der Wert hinter “P(T<=t) einseitig” und jener wird auf Signifikanz getestet. Ist er kleiner als Alpha (z.B. 0,05), geht man davon aus, dass die Stichproben nicht aus der selben Grundgesamtheit stammen. Hier: 0,018. Oder etwas salopper formuliert: man kann von statistisch signifikanten Unterschieden hinsichtlich der Mittelwerte zwischen den Stichproben ausgehen.
Alternativ kann man statt dem p-Wert auch die sog. “t-Statistik” (hier 2,231) zur Beurteilung heranziehen. Sie ist mit dem “Kritischer t-Wert bei einseitigem t-Test” bzw. “Kritischer t-Wert bei zweiseitigem t-Test” zu vergleichen. Ist der kritische t-Wert kleiner als die t-Statistik , ist die Nullhypothese von Gleichheit ebenfalls zu verwerfen. Ob einseitig oder zweiseitig zu testen ist, ist analog zu 3. zu entscheiden.
4.3 Effektstärke des Tests
4.3.1 Cohen’s d manuell berechnen
Im Beispiel sind die Mittelwerte 61 und 52,38 (siehe oben) sowie die gepoolte Standardabweichung 9,85. Eingesetzt in die obige Formel:
- ab 0,2 klein,
- ab 0,5 mittel und
- ab 0,8 stark.
ACHTUNG: Je nach Disziplin können andere Grenzen gelten. Dies ist im Vorfeld zu prüfen.
4.3.2 Effektstärkemaß r manuell berechnen
Eine zweite Möglichkeit ist die manuelle Berechnung von r sowie die Beurteilung anhand Cohen: Statistical Power Analysis for the Behavioral Sciences (1988), S. 79-81. Cohen selbst merkt aber an, dass die Effektstärkemaße und deren Klassengrenzen nicht 1:1 vergleichbar sind. Vorzuziehen ist Cohen’s d. Die Berechnung von r erfolgt über die Formel mit t² als quadrierter T-Wert und df als degrees of freedom (Freiheitsgrade).
Ab 0,1 ist es ein schwacher Effekt, ab 0,3 ein mittlerer und ab 0,5 ein starker Effekt.
Im Beispiel ist der t-Wert 2,231 und die Freiheitsgrade (df) 24. Eingesetzt in die Formel:
Das Ergebnis von 0,414 liegt über der Grenze zur mittleren Effektstärke und der Unterschied ist damit lauut Cohen ein mittelstarker Unterschied. Allerdings gibt es neuere Richtlinien bzgl. r, die von Gignac, Szodorai (2016) vorgeschlagen wurden, die bei 0,1 (klein), 0,2 (mittel) und 0,3 (groß) liegen. Demnach wäre der Unterschied im Beispiel ein großer.
5 Videotutorials
6 Reporting des t-Tests bei unabhängigen Stichproben
Gruppenmittelwerte und Standardabweichungen sind zu berichten. Zusätzlich die t-Statistik mit Freiheitsgraden, der p-Wert und die Effektstärke (Cohens d bzw. Hedges’ Korrektur): t(df)=t-Wert; p-Wert; Effektstärke.Untrainierte Probanden (M = 61; SD = 9,82) haben gegenüber trainierten Probanden (M = 52,38; SD = 9,87) einen signifikant höheren Ruhepuls, t(24) = 2,23; p = 0,035; d = 0,88. Nach Cohen (1992) ist dieser Unterschied groß.
7 Literatur
- Cohen, J. (1988). Statistical power analysis for the behavioral sciences. New York, NY: Psychology Press, Taylor & Francis Group
- Cohen, J. (1992). A power primer. Psychological bulletin, 112(1), 155-159.
- Gignac, G. E., & Szodorai, E. T. (2016). Effect size guidelines for individual differences researchers. Personality and individual differences, 102, 74-78.
Weitere nützliche Tutorials findest du auf meinem YouTube-Kanal.
Hilfreiche Artikel für’s Arbeiten in Excel: