Website-Icon Björn Walther

Items aus Skalen in R rekodieren


Bei der Erfassung latenter Konstrukte werden häufig Skalen verwendet. Diese setzen sich wiederum aus mehreren Items zusammen. Hierbei ist es üblich, dass manche, wenn nicht gar alle Items invers, also umgekehrt kodiert sind. Dieser Beitrag zeigt, wie man Items rekodiert/recodiert ;-).

1 Ausgangssituation – eine Skala und invers codierte Items

Damit sich Autoren nicht mit der Validitätsprüfung (wohl aber Reliabilität) herumschlagen müssen, gibt es mehr oder weniger für alle denkbaren latenten (also nicht direkt messbaren) Konstrukte vorgefertigte und damit auch mindestvalide Skalen. Artikel zur Skalenbildung.

Diese Skalen findet man in Skalenhandbüchern der jeweiligen Fachdisziplin oder z.B. bei Institutionen wie der GESIS. Zumeist wird neben den expliziten Formulierungen der Fragen auch eine Empfehlung über die Skalierung und den Wertebereich der einzelnen Items gegeben, inklusive möglicher Kontrollfragen. Kontrollfragen sollen verhindern, dass der Befragte den Fragebogen einfach unüberlegt durchkreuzt bzw. dass dem Studienleiter ein solches Verhalten auffällt und entsprechend korrigiert werden kann.

In meinem fiktiven Beispiel messe ich die Einstellung zur Umwelt – ausnahmsweise ohne auf eine vorgefertigte Skala Bezug zu nehmen, da in diesem Artikel ja lediglich das inverse Kodieren von Kontrollfragen im Vordergrund steht. Die Skala besteht aus 3 Items (Umwelt1, Umwelt2 und Umwelt3). Das Item Umwelt3 ist das Kontrollitem und invers codiert, was gleich noch wichtig wird.

Die Beantwortung bzw. Zustimmung zu den einzelnen Fragen erfolgt über eine 5-stufige Likert-Skala. Je niedriger der Wert, desto niedriger ist die Zustimmung. Umwelt3 ist allerdings so codiert, dass ein niedriger Wert eine hohe Zustimmung darstellt. Daher ist hier eine Umcodierung notwendig, sodass bei der späteren Skalenbildung, mit z.B. Mittelwert, keine Verzerrung entsteht bzw. das Konstrukt nicht unbrauchbar wird.

Nun ist es allerdings nicht nur aus Gründen der Skalenbildung zuträglich Umwelt3 umzukodieren, es ist auch intuitiver, wenn bei der Beantwortung bei den obigen Items der Wert 1 eine niedrigere Zustimmung darstellt. Ist man sich unsicher, ob Items invers kodiert sind, gibt es hier einen Gegencheck.
 

2 Items mit R rekodieren – Vorarbeiten

Es gibt verschiedenste Möglichkeiten, ein Item in R zu rekodieren. Ich finde die Nutzung des car-Paketes und dessen recode()-Funktion am einfachsten. Sollte das Paket nicht bereits installiert sein, kann es mit der Funktion install.packages(“car”) installiert werden. Anschließend muss es noch mit der Funktion library(car) geladen werden. Ab da kann es eingesetzt werden.


install.packages("car")
library(car)

 

3 Die Umkodierung mit der recode()-Funktion

Als Nächstes wird eine neue Variable erstellt, die idealerweise nicht die alte überschreibt, sondern dem Namensformat ALTERNAME_rekodiert entspricht. So hat man immer noch die alte Variable als Backup und weiß bei der umkodierten Variable, dass jene auch tatsächlich umkodiert ist. Ich wähle daher für die neue Variable den Namen “Umwelt3_rekodiert“.

Im Vorfeld braucht man allerdings noch eine Vorstellung, wie man codiert. Bei einer 5-stufigen Likert-Skala werden die alten Werte wie folgt zu neuen Werten umcodiert:

1 -> 5

2 -> 4

3 -> 3

4 -> 2

5 -> 1

Im Code sieht das dann schlicht so aus, dass in die recode()-Funktion die alten und neuen Werte mit einem “=” verbunden werden. Aus 1 wird 5, indem man schlicht “1=5” schreibt. Durch Komma getrennt werden die anderen Ausprägungen und der Umkodierung angehängt:


data_xls$Umwelt3_rekodiert <- recode(data_xls$Umwelt3, "1=5; 2=4; 3=3; 4=2; 5=1")

Hier ist recht gut erkennbar, dass analog zur obigen Übersicht eine "Spiegelung" der Werte vorgenommen wurde. Die Umkodierung ist hiermit abgeschlossen. Es kann nun eine Score mittels Mittelwert- oder Summenfunktion gebildet werden.

 

4 Videotutorial

https://www.youtube.com/watch?v=224AetNhv3M/
 

Die mobile Version verlassen