Mann-Whitney-U-Test in SPSS rechnen

Björn Walther

vor 4 Jahren

1 Ziel des Mann-Whitney-U-Test in SPSS

Der Mann-Whitney-U-Test (auch: Mann-Whitney-Wilcoxon-Test) ist ein nicht parametrischer „Mittelwertvergleich“ bei 2 unabhängigen Stichproben. Er verwendet Ränge anstatt der tatsächlichen Werte, vergleicht also nicht wirklich Mittelwerte, sondern die zentralen Tendenzen der Gruppen. Er ist das Gegenstück zum t-Test bei unabhängigen Stichproben, mit weniger strengen Voraussetzungen.

Nullhypothese und Alternativhypothese des Mann-Whitney-U-Tests / Mann-Whitney-Wilcoxon-Tests

Nullhypothese: Es liegen keine Unterschiede bzgl. der zentralen Tendenz der beiden Gruppen vor.
Alternativhypothese: Es liegen Unterschiede bzgl. der zentralen Tendenz der beiden Gruppen vor.

2 Voraussetzungen des Mann-Whitney-U-Test in SPSS

zwei voneinander unabhängige Stichproben/Gruppen
ordinale, intervall- oder verhältnisskalierte Testvariable
normalverteilte y-Variable innerhalb der Gruppen nicht nötig

3 Durchführung des Mann-Whitney-U-Test in SPSS

Im Beispiel möchte ich prüfen, ob Männer und Frauen meiner fiktiven Stichprobe ein unterschiedliches Gewicht haben.

Über das Menü in SPSS: Analysieren > Nichtparametrische Tests > Unabhängige Stichproben

Als erstes ist der Reiter „Felder“ auszuwählen.
Bei „Testvariable“ ist die zu testende Variable einzusetzen. Ich teste im Beispiel das Gewicht in kg.
Bei „Gruppen“ ist die Gruppierungsvariable einzusetzen. Im Beispiel teste ich die Variable Geschlecht (Frauen vs. Männer) auf ein unterschiedliches Gewicht.

Anschließend wird der Reiter „Einstellungen“ aufgerufen.
Am linken Rand wird bei Element auswählen „Tests auswählen“ angeklickt.
Anschließend wird „Tests anpassen“ angeklickt.
Schließlich wird bei „Verteilungen zwischen Gruppen vergleichen“ der „Mann-Whitney-U-Test (2 Stichproben)“ ausgewählt.

Ein Klick auf „OK“ führt die Berechnung durch und zeigt die Ergebnisse an.

4 Interpretation der Ergebnisse des Mann-Whitney-U-Test in SPSS

Der Output besteht aus drei relevanten Teilen. Ganz oben findet sich die Hypothesenübersicht (4.1), gefolgt von der Zusammenfassung des Mann-Whitney-U-Tests (4.2) und einem zweigeteilten Histogramm (4.3), welches auch als Populationsdiagramm bekannt ist.

4.1 Hypothesenübersicht

Die Hypothesenübersicht zeigt die Nullhypothese („Die Verteilung von Gewicht in kg ist über die Kategorien von Geschlecht identisch.“) sowie die Signifikanz und die Entscheidung bzgl. der Nullhypothese.

In meinem Beispiel ist die asymptotischeSignifikanz mit p < .001 hinreichend klein. Die Nullhypothese von Gleichheit des Gewichts wird abgelehnt/verworfen. Es scheint demnach Unterschiede über die beiden Geschlechter zu geben.
Das Alphaniveau, zu dem getestet wurde, ist unter der Tabelle bei a. angegeben (.05 = 5%).
Tipp: Wenn ein anderes Signifikanzniveau verwendet werden soll, kann dies in den Testoptionen bei den Einstellungen beim Mann-Whitney-U-Test geändert werden.

4.2 Zusammenfassung des Mann-Whitney-U-Tests

Die Zusammenfassung des Mann-Whitney-U-Tests zeigt die im Test errechneten und verwendeten Parameter in einer Übersicht. Am wichtigsten ist hier erneut die Signifikanz. In meinem Beispiel wird die asymptotische Signifikanz (zweiseitig) angegeben.

Hierzu folgende Hinweise:

Die exakte Signifikanz wird nur bei kleineren Stichproben (i.d.R. bei N < 40) ausgegeben. Bei größeren Stichproben ist die asymptotische Signifikanz ausreichend genau.
Eine einseitige Testung kann bei den Testoptionen nicht ausgewählt werden. Sollte im Vorfeld eine einseitige Hypothese hergeleitet worden sein, darf die zweiseitige Signifikanz (asymptotisch oder exakt) manuell halbiert werden.

4.3 Populationsdiagramm

Das Populationsdiagramm zeigt pro Gruppe die Häufigkeiten, ist also nichts anderes als ein geteiltes Histogramm. Zusätzlich werden die Gruppengrößen und der mittlere Rang angegeben.

Hier ist erkennbar, dass die Häufigkeiten auf der Seite der Männer breiter gestreut sind, insbesondere im oberen Bereich gibt es mehr Fälle. Anders ausgedrückt: es gibt schwerere Männer in der Stichprobe. Bei den Frauen gibt es zum einen weniger Streuung und zum anderen zentriert sich die Verteilung im unteren Bereich.

Das Diagramm dient nur als grafische Veranschaulichung der Verteilungen der Gruppen und wird i.d.R. nicht berichtet (zumindest nicht in dieser Form).

5 Ermittlung der Effektstärke des Mann-Whitney-U-Tests

Nachdem festgestellt wurde, dass Unterschiede zwischen den Gruppen existieren, ist die Größe dieses Unterschiedes zu quantifizieren.
Nicht vergessen: Der p-Wert sagt nichts über die Stärke des Unterschiedes. Er beschreibt lediglich die Wahrscheinlichkeit, dass der beobachtbare Unterschied zufällig zustande gekommen ist.

Die Effektstärke r wird mit folgender Formel berechnet (vgl. Field (2018), S. 295:

Die standardisierte Teststatistik (z-Wert) wird durch die Wurzel der Stichprobengröße (N) geteilt. Aufgrund der Betragsstriche ist dieser Quotient immer positiv.
Die entsprechenden einzusetzenden Werte sind in der Testzusammenfassung in 4.2 abzulesen. Die standardisierte Teststatistik ist z = -3.558 und die Anzahl der Beobachtungen N = 51.

Die Einordnung der Effektstärke wird primär mit vergleichbaren Studien vorgenommen. Fachspezifische Grenzen sind eine Alternative.
Ist beides nicht vorhanden, kann Cohen (1988) S. 79-81 bzw. Cohen (1992), S. 157 verwendet werden:

ab r = 0.1 (schwach),
ab r = 0.3 (mittel) und
ab r = 0.5 (stark).

Im vorliegenden Beispiel ist die Effektstärke mit 0.498 nah an der Grenze zum starken Effekt von 0.5 (nach Cohen (1992)). In der vorliegenden Stichprobe ist der Unterschied beim Gewicht von Männern und Frauen mittel, mit der Tendenz zu einem starken Unterschied.

6 Reporting

Zum Berichten empfiehlt sich die Angabe der Gruppenmediane, der U-Statistik mitsamt der Gruppengrößen, der z-Statistik sowie dem p-Wert. Bei beobachtbaren Unterschieden ist zudem die Effektstärke r zu berichten und einzuordnen:

Männer haben ein höheres Gewicht (Mdn = 67.5) als Frauen (Mdn = 58.0), U (N1 = 26, N2 = 25) = 136.5; z = -3.558; p < 0.001; r = 0.498. Nach Cohen (1988/1992) ist dieser Unterschied mittel mit Tendenz zu einem starken Unterschied.

Hinweis: Die Gruppenmediane können über Analysieren > Deskriptive Statistiken > Explorative Datenanalyse angefordert werden. Als Abhängige Variable wird die Testvariable verwendet und als Faktorenliste die Gruppenvariable.

7 Videotutorials

https://www.youtube.com/watch?v=IbePVTt8K4A https://www.youtube.com/watch?v=zO-F6Xq_4ek https://www.youtube.com/watch?v=3GVUUry7J_0 https://www.youtube.com/watch?v=hbfOGW5YKOg

8 Literatur

Cohen, Jacob. „A power primer.“ Psychological bulletin 112.1 (1992): 155.
Cohen, J. (1988). Statistical power analysis for the behavioral sciences: Jacob Cohen. New York, N.J: Psychology Press.
Field, A. P. (2018). Discovering statistics using IBM SPSS Statistics, SAGE.
Mann, H. B., & Whitney, D. R. (1947). On a test of whether one of two random variables is stochastically larger than the other. The annals of mathematical statistics, 50-60.

Weitere nützliche Tutorials findest du auf meinem YouTube-Kanal.