1 Ziel der Mediation in SPSS
Eine Mediation beschreibt eine Wirkung einer unabhängigen Variable (X) auf eine abhängige Variable (Y) über den Zwischenschritt einer Mediatorvariable (M).
Man kann also getrost von einer Kette sprechen: unabhängige Variable > Mediator > abhängige Variable.
Ein Beispiel wäre ein mathematischer Score und wie er auf einen wissenschaftlichen Score wirkt – mediiert durch einen Schreibscore (entnommen aus dem hsb2-Datensatz, Download).
Grafisch sieht eine einfache Mediation ohne weitere unabhängige Variablen wie folgt aus:
2 Voraussetzungen der Mediation
Die wichtigsten Voraussetzungen sind, analog zur multiplen linearen Regression:
- linearer Zusammenhang zwischen x-Variablen und y-Variable
- metrisch skalierte y-Variable (mitunter ist auch ordinal vertretbar – da gibt es große Diskussionen zu :-D)
- keine Multikollinearität – Korrelation der x-Variablen sollte nicht zu hoch sein – grafische Diagnose / analytische Diagnose
- normalverteilte Fehlerterme – Achtung beim analytischen Testen mit Kolmogorov-Smirnov und Shapiro-Wilk-Test
- Homoskedastizität– homogen streuende Varianzen des Fehlerterms
- keine Autokorrelation – Unabhängigkeit der Fehlerterme (Vorsicht bei Durbin-Watson-Test!)
- Kontrolle für einflussreiche Fälle bzw. “Ausreißer”
3 Prinzip der Mediation in SPSS
Eine Mediation kann nicht in einem Modell gerechnet werden. Vielmehr ist für jede abhängige Variable, ein separates Modell zu rechnen. Im einfachsten Fall sind dies 2 Modelle, zum einen ist M die abhängige Variable, zum anderen Y.
Modell 1 ist im Beispiel die Wirkung von X auf M. Modell 2 rechnet die gleichzeitige Wirkung von X auf Y und M auf Y.
Anders ausgedrückt, prüft man zunächst in Modell 1, ob der Pfad a signifikant ist (X>M) und dann in Modell 2, ob die Pfade b und c signifikant sind (M>Y sowie X>Y):
4 Durchführung der Mediation in SPSS mit PROCESS
Am einfachsten lässt sich die Analyse mit dem sog. PROCESS-Plugin für SPSS von Andrew Hayes durchführen. Es ist bei der Unversität von Calgary im Resource Hub herunterladbar.
Hinweise zur Installation in diesem kurzen YouTube-Video.
Das Plugin wird über Analysieren > Regression > PROCESS v4.x by Andrew F. Hayes geöffnet
Daraufhin öffnet sich folgendes Dialogfeld, in dem nachfolgende Einstellungen vorzunehmen sind:
- Y variable – die abhängige Variable
- X variable – die unabhängige Variable
- Mediator(s) M – die Mediationsvariable
- Model number: 4 (Nachzulesen in Hayes, A. F. (2022))
Hier sind lediglich folgende Haken zu setzen:
- Show total effect model (only model 4,…)
- Heteroscedasticity consistent inference HC3 (Davidson-MacKinnon)
- Standardized effects (mediation-only models) ist optional
5 Ergebnis der Mediation in SPSS
5.1 Übersicht
Der Output is recht groß und ich werde in den einzelnen folgenden Abschnitten auf die wesentlichen Teile eingehen.
5.2 Teil 1 – Direkter Effekt von X auf M (Pfad a)
- Das Modell ist signifikant (F(1,198) = 153,64; p < 0,001), leistet also einen signifikanten Erklärungsbeitrag.
- Die unabhängige Variable “math” wirkt signifikant (p < 0,001) auf die abhängige Variable “write”.
- Der Koeffizient ist mit 0,6247 > 0.
Eine Zunahme von “math” um eine Einheit wirkt positiv (um 0,6247 Einheiten) auf “write”. - Der Intercept wird trotz Signifikanz ignoriert.
- Die Varianzaufklärung der abhängigen Variable “write” beträgt 38,12% (R-sq).
5.3 Teil 2 – Direkter Effekt von X auf Y und Effekt von M auf Y (Pfad c und b)
- Auch dieses Modell ist signifikant (F(2,197) = 86,61; p < 0,001). Ist p > 0,05, muss an dieser Stelle abgebrochen werden, da X und M zusammen keinen signifikanten Erklärungsbeitrag bzgl. Y leisten.
- Die unabhängige Variable “math” wirkt signifikant (p < 0,001) auf die abhängige Variable “science”.
- Der Koeffizient ist mit 0,4757 > 0.
Eine Zunahme von “math” um eine Einheit wirkt positiv (0,4757 Einheiten) auf “science”. - Die unabhängige Variable “write” (Mediator) wirkt signifikant (p < 0,001) auf die abhängige Variable “science”.
- Der Koeffizient ist mit 0,3055 > 0.
Eine Zunahme von “math” um eine Einheit wirkt positiv (0,3055 Einheiten) auf “science”. - Der Intercept wird trotz Signifikanz ignoriert.
- Die Varianzaufklärung der abhängigen Variable “science” beträgt 45,08% (R-sq).
5.4 Teil 3 – Untersuchung des Mediationseffektes
- Offensichtlich sind Pfad a und Pfad b jeweils signifikant. “math” wirkt auf “write” und “write” wirkt auf “science”.
- Eine Mediation scheint also im vorliegenden Datensatz von “math” auf “science” über den Mediator “write” zu existieren.
- Zusätzlich ist auch Pfad c signifikant, was eine direkte Wirkung von “math” auf “science” bedeutet.
Im nächsten Schritt ist zu prüfen, welcher Anteil des Effektes von “math” auf “science” über den Mediator, also Pfad a und b läuft.
Zum indirekten Effekt (Indirect effect(s) of X on Y):
- Das ist der indirekte Effekt (Pfad a und b) von “math” über “write” auf “science”.
- Er ist positiv mit 0,1909. Er ergibt sich aus dem Produkt der Koeffizienten von “math” auf “write” (a) und “write” auf “science” (b) – aus den Ergebnissen von Teil 1 und 2 entnommen.
- = a*b = 0,6247*0,3055 = 0,1909.
- Der indirekte Effekt ist signifikant (Im Boostrap-Konfidenzintervall ist die 0 NICHT vorhanden).
- Es liegt eine Mediation des Effektes von “math” auf “science” durch “write” vor.
Zum direkten Effekt (direct effect of X on Y)
- Ist der Koeffizient von “math” (Pfad c) in Modell 2.
- Unter Kontrolle für den Effekt von “write” auf “science” ist dieser ebenfalls signifikant (p < 0,001).
Gesamteffekt (Total Effect of X on Y)
- Der Total Effect ergibt sich aus Addition von indirektem und direktem Effekt, bzw. deren Koeffizienten.
- = (a*b)+c = 0,6247*0,30555 + 0,4757 = 0,1909 + 0,4757 = 0,6666 (Abbildung enthält gerundete Werte)
- Steigt also “math” um eine Einheit, so steigt “science” in Summe um 0,6666 Einheiten.
- 0,1909 Einheiten ergeben sich aus dem indirekten Effekt, 0,4757 Einheiten aus dem direkten Effekt.
Stärke der Mediation
- Von Interesse ist, wie hoch der prozentuale Anteil des indirekten Effektes am totalen Effekt ist.
- Einfacher gesagt: wie viel Prozent des Gesamteffektes geschieht über die Mediation.
- Im Beispiel ist dies 0,4757 / 0,666 = 0,2864.
- 28,64 % des totalen Effektes von “math” auf “science” wird also über den Mediator “write” erzielt.
6 Einordnung der Mediation
Schließlich ist die Mediation noch einzuordnen. Hierfür ist Zaho, Lynch (2010) auf S. 201 anwendbar.
Das Flussdiagramms wird von oben nach unten durchgearbeitet und die oben eingeführten und berechneten Pfade verwendet.
Aus didaktischen Gründen arbeite ich die 5 möglichen Ausgänge ab und deren unterschiedliche Pfade.
- Complementary Mediation: Die Pfade a*b sowie c sind signifikant. Zudem ist das Produkt aus a*b*c positiv. Das ist ein Hinweis auf den unterstellten Mediator, allerdings ist es auch wahrscheinlich, dass ein weiterer Mediator existiert. Das liegt daran, dass der signifikante direkte Effekt möglicherweise noch Teile eines weiteren Mediators enthält. Das theoretische Framework sollte hier hinterfragt und evtl. überarbeitet werden.
- Competitive Mediation: Die Pfade a*b sowie c sind signifikant. Zudem ist das Produkt aus a*b*c negativ, die Effekte sind also gegenläufig. Das ist ein Hinweis auf den unterstellten Mediator, allerdings ist es auch wahrscheinlich, dass ein weiterer Mediator existiert. Das liegt möglicherweise daran, dass der signifikante direkte Effekt noch Teile eines weiteren Mediators enthält. Das theoretische Framework sollte auch hier hinterfragt und evtl. überarbeitet werden.
- Indirect-only Mediation: Die Pfade a*b aber nicht c sind signifikant. Das ist sozusagen der Idealfall, weil die emprisichen Ergebnisse mit der Theorie bzw. dem daraus abgeleiteten Modell übereinstimmen. Die Existenz eines weiteren Mediators ist unwahrscheinlich. Das liegt möglicherweise daran, dass der direkte Effekt nach Aufnahme des Mediators nicht (mehr) signifikant ist.
- Direct-only (Non-Mediation): Die Pfade a*b sind nicht signifikant, der Pfad c ist jedoch signifikant. Der unterstellte Mediator konnte nicht empirisch beobachtet werden, jedoch ein direkter Effekt. Das kann ein Hinweis für ein mangelndes theoretisches Framwork sein. Mitunter existiert ein anderer Mediator, aber nicht zwingend.
- No-Effect (Non-Mediation):Die Pfade a*b sowie der Pfad c sind nicht signifikant. Weder der unterstellte Mediator noch der direkte Effekt konnte empirisch beobachtet werden. Das ist ein Hinweis auf einen möglicherweise nicht existenten Mediator, aber Achtung, wie oben bereits ausgeführt, kann der Fall auftreten, dass eine “competitive mediation” mit einem anderen Mediator existert. Das theoretische Framework ist hier in jedem Fall zu hinterfragen.
Abschließende Hinweise:
- Im Beispiel liegt eine komplementäre Mediation vor. Das ist ein Hinweis auf einen weiteren Mediator. Tatsächlich existert im hsb2-Daten noch die Variable “read” (der Lesescore), welche hinzugezogen werden und eine parallele Mediation gerechnet werden kann.
- Sofern Effekte in der Realität existieren, sie also verschieden von 0 sind, ist die Stichprobengröße und damit die statistische Power ein grundlegender Faktor beim Erkennen jener Effekte. Je kleiner Effekte sind, desto größer muss eine Stichprobe sein, um diesen Effekt erkennen zu können (Vgl. Cohen (1988), S. 10-11.
- Diese Tatsache zeige ich in diesem Blogbeitrag.
- Die Größe des p-Wertes sagt nichts über die Größe oder Bedeutsamkeit eines Effektes aus (vgl. Wasserstein, Lazar (2017), S. 132).
- In jeder Regression sind weitere Kontrollvariablen (“Kovariate”) zu berücksichtigen. Hierzu gehören meist soziodemokartische Faktoren oder bereits in der Literatur nachgewiesene Einflussfaktoren. Deren Nichtberücksichtigung im Modell würde bedeuten, dass man deren möglichen (oder bereits nachgewiesenen) Einfluss ignoriert oder ihn beliebig an- und abschalten kann.
Einfach ausgedrückt: das Diabetesrisiko steigt bei Kindern und Jugendlichen. Bei übergewichtigen ist es jedoch 4 mal höher (Vgl. Abbasi et al (2017)) – das Ignorieren des Gewichts wäre also fahrlässig. - Abbasi, A., Juszczyk, D., van Jaarsveld, C. H., & Gulliford, M. C. (2017). Body mass index and incident type 1 and type 2 diabetes in children and young adults: a retrospective cohort study. Journal of the Endocrine Society, 1(5), 524-537.
- Baron, R. M., & Kenny, D. A. (1986). The moderator–mediator variable distinction in social psychological research: Conceptual, strategic, and statistical considerations. Journal of personality and social psychology, 51(6), 1173.
- Cohen, J. (1988). Statistical Power Analysis for the Behavioral Sciences (2nd ed.). Routledge.
- Hayes A. F. (2022). Introduction to mediation moderation and conditional process analysis : a regression-based approach (Third). Guilford Press.
- Hoenig, J. M., & Heisey, D. M. (2001). The abuse of power: the pervasive fallacy of power calculations for data analysis. The American Statistician, 55(1), 19-24.
- Wasserstein, R. L., & Lazar, N. A. (2016). The ASA statement on p-values: context, process, and purpose. The American Statistician, 70(2), 129-133.
- Zhao, X., Lynch Jr, J. G., & Chen, Q. (2010). Reconsidering Baron and Kenny: Myths and truths about mediation analysis. Journal of consumer research, 37(2), 197-206.
Im Nachhinein kann aber NICHT mit einer sog. Post hoc Poweranalyse argumentiert werden, dass Effekte nicht erkannt wurden, weil die Power zu niedrig war (Hoenig, Heisey (2001), S. 20: “Observed power can never fulfill the goals of its advocates because the observed significance level of a test
(“p value”) also determines the observed power; for any test the observed power is a 1:1 function of the p value.”).
7 Videotutorial
https://www.youtube.com/watch?v=7lSa5kfCyqc/
8 Literatur