Einfache lineare Regression in SPSS rechnen und interpretieren

von | Zuletzt bearbeitet am: Jan 2, 2024 | Regressionsanalyse, SPSS

1 Ziel der einfachen linearen Regression

Eine einfache lineare Regressionsanalyse hat das Ziel eine abhängige Variable (y) mittels einer unabhängigen Variablen (x) zu erklären. Es ist ein quantitatives Verfahren, das zur Prognose einer Variable dient.

Die einfache lineare Regression testet auf Zusammenhänge zwischen x und y. Für mehr als eine x-Variable wird die multiple lineare Regression verwendet. Solltet ihr Excel verwenden, schaut euch diesen Artikel an. Im Vorfeld der Regressionsanalyse kann zudem eine Filterung vorgenommen werden, um nur einen gewissen Teil der Stichprobe zu untersuchen, bei dem man am ehesten einen Effekt erwartet.

 

2 Voraussetzungen der einfachen linearen Regression

Die wichtigsten Voraussetzungen sind, und werden in jeweils verlinkten Artikeln separat gezeigt:

ACHTUNG: Die Variablen selbst müssen NICHT normalverteilt sein. Sie können völlig beliebig verteilt sein. Wie oben beschrieben kommt es auf die Fehlerterme (=Residuen) an.

 

3 Durchführung der einfachen linearen Regression in SPSS

Über das Menü in SPSS: Analysieren – Regression – Linear

Lineare Regression SPSS

 

Das von mir gewählte Beispiel versucht das Gewicht von Personen durch deren Größe zu erklären.
Die abhängige (y-)Variable (im Bild: 1) ist also das Gewicht und die unabhängige (x-)Variable (im Bild: 2) die Größe.

SPSS Regressionsmodell definieren


 

4 Interpretation der Ergebnisse der einfachen linearen Regression in SPSS

Hinweis vorweg: Normalerweise werden die Regressionskoeffizienten als ß (Betas) bezeichnet. In SPSS werden sie allerdings B genannt und die standardisierten Koeffizienten als ß (Beta) bezeichnet. Ich verwende daher nachfolgend absichtlich die Schreibweise von SPSS.

 

Sofern die in Gliederungspunkt 2 genannten Voraussetzungen erfüllt sind, sind drei Dinge besonders wichtig.

4.1 ANOVA-Tabelle – Signifikanz des F-Tests

Die ANOVA-Tabelle sollte einen signifikanten p-Wert (typischerweise <0.05) für den F-Test bei “Sig.” ausweisen – ist dies gegeben, leistet das Regressionsmodell einen Erklärungsbeitrag. Die Nullhypothese lautet beim F-Test: kein signifikanter Erklärungsbeitrag durch das Modell. Sie wird bei p < 0.05 verworfen. Im Beispiel ist die Signifikanz mit < 0.001 definitiv klein genug und damit leistet das spezifizierte Regressionsmodell einen (signifikanten) Erklärungsbeitrag.

ANOVA einfache lineare Regression SPSS

Hinweis: Mit Doppelklick auf den p-Wert erhält man den exakten Wert (7.8953E-8). Das ist die wissenschaftliche Schreibweise und E-8 bedeutet, dass das Komma um 8 Stellen nach links versetzt wird.
Folglich: p = 7.8953E-8 = 0.000000078953

 

Sollte der F-Test berichtet werden, ist folgendes Schema anzuwenden:

    \[  F (df_{Regression}, df_{Nicht\: standardisierte\: Residuen}) = <em>F</em>-Wert; <em>p</em>-Wert \]

    \[  F (1,49) = 39.761; <em>p</em> < 0.001 \]

 


 

4.2 Güte des Regressionsmodells

Die Güte der gerechneten Regression wird anhand des Bestimmtheitsmaßes R-Quadrat (R²) abgelesen. Das R² ist zwischen 0 und 1 definiert. Es gibt an, wie viel Prozent der Varianz der abhängigen Variable erklärt werden. Ein höherer Wert ist hierbei besser. Bei einem R² von z.B. 0.65 werden 65% der Varianz der y-Variable erklärt. Im Beispiel erklärt das Modell 44,8% der Varianz, da das R² = 0.448 ist.

Modellgüte einfache lineare Regression SPSS

Pauschal gibt es in der linearen Regression keine Werte, ab denen man von einem “guten Modell” spricht. Vielmehr ist dies je nach Fachdisziplin unterschiedlich.
Höher ist zwar pauschal besser, je mehr potenzielle Einflussfaktoren aber existieren, desto weniger kann eine Variable allein erklären. Das Gewicht kann – abstrahiert von diesem fiktiven Datensatz – eben nicht nur durch die Körpergröße erklärt werden. Weitere Faktoren wie Ernährungsweise, Alter etc. sind denkbar.


 

4.3 Interpretation des Regressionskoeffizienten

A)
In der einfachen linearen Regression ist der p-Wert des Regressionskoeffizienten mit dem p-Wert des F-Tests stets identisch. Wenn der F-Test “bestanden ist”, ist der Regressionskoeffizient somit auch signifikant (hier: p < 0.001). Ist der Regressionskoeffizient signifikant, kann man die Nullhypothese für den Koeffizienten verwerfen. Diese geht von keinem Effekt der x auf die y-Variable aus. Die Verwerfung der Nullhypothese bekräftigt demnach die Unterstellung eines Effektes von Größe auf Gewicht.

Koeffiziententabelle einfache lineare Regression SPSS

 

B)
Unter “Nicht standardisierte Koeffizienten” ist der Regressionskoeffizient B zu sehen. Hier ist zunächst nur B für die x-Variable interessant.
Im Beispiel ist der Koeffizient der Größe 70.071.

Eine zusätzliche Einheit der “Größe in m” führt demnach zu einem zusätzlichen Gewicht in kg von 70.071 führt.

Wäre B fiktiv 70.071, würde eine Zunahme der Einheit “Größe in m” zu einer Abnahme des Gewichts von 70.071 führen.

Das Schema der Interpretation von B ist immer identisch: Steigere ich x um 1 Einheit, verändert sich y um B-Einheiten.

 

Die standardisierten Koeffizienten sind nur im Falle einer multiplen linearen Regression zu interpretieren. Sie vergleichen die Stärken der Effekte der x-Variablen; allerdings nicht für kategoriale Variablen.

 

Ein letzter technischer Hinweis:
Teilt man B durch den Standardfehler (Std.-Fehler), erhält man den T-Wert (70.071/11.112 = 6.306).
Aus dem T-Wert wird letztlich der p-Wert ermittelt. Man kann sich merken, dass t-Werte >3 einen p-Wert < 0,05 zur Folge haben.

 

5 Prognose mittels Regressionsgleichung

Anhand der ersten Spalte der Koeffiziententabelle kann eine Regressionsgleichung aufgestellt werden. Hierfür wird B der Konstante und das Produkt aus x-Variable und B addiert:

    \[ y = B_{Konstante}+B*x \]

Im Beispiel lautet sie:

    \[ y = -54.148 + 70.071*Größe \]

Bei einer Prognose kann man nun einen beliebigen Wert für die Körpergröße einsetzen.
Setzt man z.B. 1.75m als Größe in diese Gleichung ein, erhält man auf Basis des Modells ein geschätztes Gewicht von 68.48 kg:

    \[ y = -54.148 + 70.071*1.75 = 68.48 kg \]

Hinweis: Solche Prognosen sind in ihrer Aussagekraft auf die zugrundeliegende Stichprobe eingeschränkt! Je besser die Stichprobe die Grundgesamtheit repräsentiert, desto eher kann für eine allgemeingültige Prognosekraft durch das geschätzte Modell argumentiert werden.

 

6 Reporting

In der einfachen linearen Regression gibt es eigentlich keine Notwendigkeit eine Tabelle zu erstellen. Man berichtet den Regressionskoeffizienten und die Signifikanz der unabhängigen Variable sowie die Modellgüte, also Bestimmtheitsmaß R² und F-Test (siehe oben).

Körpergröße wirkt positiv auf das Körpergewicht (b = 70.071; p < 0.001) und hat einen Anteil an der Varianzaufklärung von R² = 0.448, F(1,49) = 39.761; p < 0.001

 

Alternativ kannst du dir auch eine Tabelle mit meiner Vorlage generieren, die alle wesentlichen Daten enthät und zugleich nicht das Standardformat von SPSS-Tabellen hat.

 

7 Datensatz zum Download

 

8 Videotutorial

Einfache lineare Regression in SPSS rechnen und interpretieren - Daten analysieren in SPSS (3)

 

Hat dir der Beitrag geholfen?

Dann würde ich mich über eine kleine Spende freuen, die es mir erlaubt, weiterhin kostenfreie Inhalte zu veröffentlichen.
Alternativ kannst du über meinen Amazon Affiliate-Link einkaufen – ohne Zusatzkosten.

Vielen Dank und viel Erfolg!

Über mich

Björn Walther

Ein 💚 für Statistik & Datenanalyse

Excel Online-Kurs

YouTube-Kanal

Inhalt