Website-Icon Björn Walther

Punktbiseriale Korrelation in R rechnen und interpretieren

1 Ziel der punktbiserialen Korrelation in R

Die punktbiseriale Korrelation prüft eine metrische und eine dichotome (zweistufige) Variable auf einen Zusammenhang.
Umgekehrt würde man Unterschiede in der metrischen Variable für die verschiedenen Ausprägungen der dichotomen Variable erwarten (Stichwort: t-Test).

Theoretisch kann dies auch im Rahmen einer Regression (je nach Skalenniveau der AV entweder linear oder logistisch) gerechnet werden, wenn Ursache und Wirkung klar definierbar sind.

 

Beispiel: Ich möchte den Zusammenhang von Gewicht und Krankheit (z.B. Diabetes mellitus) prüfen. Schwerere bzw. übergewichtige Menschen haben ein höheres Risiko für diese Erkrankung – umgekehrt sind übergewichtigere Menschen überdurchschnittlich häufig von der Krankheit betroffen.

 

2 Voraussetzungen der punktbiserialen Korrelation in R

 

3 Durchführung der punktbiserialen Korrelation in R

Nach dem Einlesen der Daten in R kann in den meisten Fällen direkt begonnen werden.
Wichtig, die dichotome Variable darf NICHT als Faktor oder Character hinterlegt sein.
Sie muss zwingend numerisch sein. Dies kann mit x <- as.numeric(x) nachträglich umgewandelt werden.

Zur punktbiserialen Korrelation wird die cor.test()-Funktion verwendet. Die beiden Variablen werden mit Komma getrennt hineingegeben. Die Reihenfolge spielt hierbei keine Rolle.

Standardmäßig wird zweiseitig, also ungerichtet getestet. Eine gerichtete Testung wird mit dem Argument “alternative” erreicht. Im Code unten steht jeweils, wie das Argument für positive bzw. negative unterstellte Korrelation lauten muss.


# zweiseitige Testung
cor.test(df$Krankheit, df$Gewicht)

# einseitige Testung - positive Korrelation erwartet
cor.test(df$Krankheit, df$Gewicht, alternative = "greater")

# einseitige Testung - negative Korrelation erwartet
cor.test(df$Krankheit, df$Gewicht, alternative = "less")

 

4 Interpretation der Ergebnisse der punktbiserialen Korrelation in R

Bei der Interpretation beschränke ich mich auf die zweiseitigen Testergebnisse. Einseitige Testergebnisse werden aber analog interpretiert.


	Pearson's product-moment correlation

data:  df$Krankheit and df$Gewicht
t = 3.8806, df = 49, p-value = 0.0003113
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 0.2415412 0.6708038
sample estimates:
      cor 
0.4848509 

Der erste Blick geht auf die Signifikanz, also den p-Wert (“p-value”):

Der zweite Blick geht auf den punktbiserialen Korrelationskoeffizient:

Optional: Der dritte Blick geht auf das 95%-Konfidenzintervall:

 

5 Ermittlung der Effektstärke der punktbiserialen Korrelation

Die Effektstärke zur Einordnung ist im Rahmen von Korrelationen stets der Korrelationskoeffizient r selbst.
Demzufolge wird mit r = 0.48 eine Einordnung vorgenommen. Negative Werte werden stets als Betrag, also positiver Wert verwendet.

 

6 Reporting der punktbiserialen Korrelation

Für das Berichten der punktbiserialen Korrelation werden benötigt:

Die Variablen Gewicht und Krankheit zeigen einen nach Cohen (1992) mittleren positiven Zusammenhang, mit r (49) = 0,48; p < 0,001. (Eine Tendenz zu einem starken Effekt ist erkennbar)

 

7 Videotutorial

https://www.youtube.com/watch?v=dsz0L9KdKyI/

 

8 Literatur

 

Die mobile Version verlassen