1 Ziel der punktbiserialen Korrelation in SPSS
Die punktbiseriale Korrelation prüft eine metrische und eine dichotome (zweistufige) Variable auf einen Zusammenhang und kann in SPSS leicht berechnet werden (Alternativ auch in R).
Umgekehrt würde man Unterschiede in der metrischen Variable für die verschiedenen Ausprägungen der dichotomen Variable erwarten (Stichwort: t-Test).
Theoretisch kann dies auch im Rahmen einer Regression (je nach Skalenniveau der AV entweder linear oder binär-logistisch) gerechnet werden, wenn Ursache und Wirkung klar definierbar sind.
2 Voraussetzungen der punktbiserialen Korrelation in SPSS
- Wie bereits eingangs erwähnt, muss eine der beiden zu korrelierenden Variablen ein metrisches Skalenniveau besitzen und die andere Variable dichotom, also zweistufig sein.
- Es müssen unabhängige Beobachtungen vorliegen.
3 Durchführung der punktbiserialen Korrelation in SPSS
Über Analysieren > Korrelation > Bivariat:
Dialogfeld aus SPSS 29.
Die beiden zu korrelierenden Variablen (hier: Gewicht und Krankheit) sind in das Feld Variablen zu schieben.
- Bei “Korrelationskoeffizient” muss der Haken bei “Pearson” sein.
- Zwingend: Standardmäßig wird zweiseitig, also ungerichtet getestet.
- Optional: Es kann bei “Test auf Signifikanz” im Falle einer Wirkungsvermutung auch “Einseitig” ausgewählt werden.
- Optional: Unter dem Button “Konfidenzintervall” kann ein Konfidenzintervall (z.B. 95% oder 99%) angefordert werden
- Weitere Optionen können so belassen werden.
- Dieser ist mit p < 0.001 angegeben und somit sehr klein. Er liegt in jedem Fall unter den typischen Verwerfungsgrenzen von Alpha = 0.05 bzw. Alpha = 0.01.
- Die Nullhypothese (Es existiert KEIN Zusammenhang) wird aufgrund p < Alpha verworfen.
- Die Alternativhypothese (Es existiert ein Zusammenhang) wird folglich angenommen.
- Der Korrelationskoeffizient (“Pearson-Korrelation”) beträgt r = 0.485, ist also positiv.
- Eine Zunahme der einen Variable hängt mit einer Zunahme der anderen Variable zusammen.
- In meinem Beispiel ist die Krankheit mit 0 – nicht krank und 1 – krank codiert. Im Zweifel in der “Variablenansicht” unter “Werte” prüfen.
- Wenn die Variable Krankheit folglich um eine Einheit höher ist, ist aufgrund des signifikant und positiven r ein höheres Gewicht beobachtbar.
- Umgekehrt hat ein höheres Gewicht eine höhere Ausprägung der Variable Krankheit zur Folge.
- Im Output stehen die Grenzen 0,242 und 0,671″.
- Von allen Konfidenzintervallen, die auf dem 95%-Niveau berechnet werden, enthalten 95% den wahren Wert des Korrelationskoeffizienten.
- Einfacher gesagt: Bei wiederholter Berechnung von 100 Konfidenzintervallen, ist der wahre Wert in 5 KI nicht enthalten, in 95 KI enthalten.
- Je größer eine Stichprobe, desto besser gelingt eine Schätzung und desto enger ist das Konfidenzintervall.
- Zunächst sind vergleichbare Studien zu suchen und eine Einordnung anhand dessen vorzunehmen.
- Existieren keine vergleichbaren Studien, sind fachspezifische Effektstärkengrenzen zur Einordnung zu verwenden.
- Sind diese auch nicht vorhanden, kann auf Cohen (1988) bzw. Cohen (1992) zurückgegriffen werden.
- Cohen hat die folgenden Grenzen festgelegt: ab 0,1 (= schwach), ab 0,3 (= mittel), ab 0,5 (= stark).
- Der Korrelationskoeffizient r (0,485),
- die Freiheitsgrade df (49) – wird bei Korrelationen stets berechnet mit = N-2
- und der p-Wert (< 0,001) benötigt.
- Das Konfidenzintervall ist zumeist optional, kann aber mit 95% KI [0,24; 0,67] einfach an die untere Zeile angehängt werden.
- Cohen, J. (1988): Statistical Power Analysis for the Behavioral Sciences.
- Cohen, J. (1992): A Power Primer, Psychological Bulletin, 1992, Vol. 112. No. 1, 155-159.
4 Interpretation der Ergebnisse der punktbiserialen Korrelation in R
Bei der Interpretation beschränke ich mich auf die zweiseitigen Testergebnisse. Einseitige Testergebnisse werden analog interpretiert.
Hinweis: In SPSS 28 und früher wurde die Signifikanz auf 3 Nachkommastellen gerundet, sodass mitunter bei der Signifikanz 0,000 stand. Ab SPSS 29 wird in solchen Fällen <0,001 ausgegeben, wie auch unten zu sehen.
Der erste Blick geht auf die Signifikanz, also den p-Wert (“p-value”):
Der zweite Blick geht auf den punktbiserialen Korrelationskoeffizient:
Optional: Der dritte Blick geht auf das 95%-Konfidenzintervall:
5 Ermittlung der Effektstärke der punktbiserialen Korrelation
Die Effektstärke zur Einordnung ist im Rahmen von Korrelationen stets der Korrelationskoeffizient r selbst.
Demzufolge wird mit r = 0.485 eine Einordnung vorgenommen. Negative Werte werden stets als Betrag, also positiver Wert verwendet.
6 Reporting der punktbiserialen Korrelation
Für das Berichten der punktbiserialen Korrelation werden benötigt:
7 Videotutorial
https://www.youtube.com/watch?v=HxpdZraWJHM/
8 Literatur