Website-Icon Björn Walther

Multiple lineare Regression in Excel rechnen und interpretieren

1 Ziel der multiplen linearen Regression

Eine multiple lineare Regressionsanalyse hat das Ziel, eine abhängige Variable (y) mittels mindestens zweier unabhängiger Variablen (x) zu erklären. Sie testet auf lineare Zusammenhänge zwischen x und y-Variablen. Für nur eine x-Variable wird die einfache lineare Regression verwendet. Für SPSS gibt es diesen Artikel und für R diesen Artikel.  

2 Multiple lineare Regression – die Voraussetzungen

Die wichtigsten Voraussetzungen sind:

 

3 Multiple lineare Regression in Excel – die Durchführung

Über das Menü in Daten > Datenanalyse > Regression

Hinweis: Sollte die Funktion „Datenanalyse“ nicht vorhanden sein, ist diese über „Datei“ > „Optionen“ > „Add-Ins“ > „Verwalten“ > „Los…“ zu aktivieren.
Dieses Video zeigt dies kurz.

  1. Als Y-Eingabebereich muss man die Spalte auswählen, die die y-Variable (im Beispiel: Sportnote) enthält. In meinem Fall ist das die Spalte F mit den Zeilen 1-39.
  2. Für den X-Eingabebereich ist entsprechend die Spalte mit der x-Variable (im Beispiel: Gewicht und Größe) auszuwählen. In meiner Datei sind das die Spalten C und D mit jeweils den Zeilen 1-39.
  3. Solltet ihr einen beschrifteten Spaltenkopf haben, muss ein Haken bei „Beschriftungen“ gesetzt werden. Das dient Excel dazu zu erkennen, dass die erste Zeile nicht mit Daten gefüllt ist, sondern eine Bezeichnung beinhaltet.
  4. Das Konfidenzniveau sollte 95% sein. Das bedeutet, dass 95% aller auf Basis der Stichprobe berechneten Konfidenzintervalle den wahren Wert der Grundgesamtheit enthalten.
  5. Als Nächstes wählt ihr noch einen beliebigen Ausgabebereich. Dieser kann im selben Blatt sein, ein neues Tabellenblatt oder eine neue Arbeitsmappe sein.
  6. Schließlich empfehle ich noch das Ausgeben der Residuen, um die jene auf Normalverteilung zu prüfen, siehe das verlinkte Video in Abschnitt 7.

 

4 Multiple lineare Regression in Excel – Interpretation der Ergebnisse

Im Anschluss an die Durchführung solltet ihr vier Tabellen in Excel erhalten. Die Regressions-Statistik (4.1), die ANOVA-Tabelle (4.2), die Koeffizienten-Tabelle (4.3) und die Residuentabelle (siehe Video in 7).  

 

4.1 Regressions-Statistik

 

4.2 ANOVA-Tabelle

 

4.3 Koeffiziententabelle

 

5 Prognose mittels Regressionsgleichung

Auf Basis der Stichprobe wird die folgende Gleichung geschätzt:

   

Setzt man nun eine Größe von z.B. 175 cm und 68 kg  in die Formel ein, erhält man:

   

Ein 175 cm großer und 68kg schwerer Proband würde demnach eine Sportnote von 2,531 erhalten.  

HINWEISE:

 

6 Berichten der Ergebnisse

Beim Berichten der Regressionsergebnisse gibt es bei wenigen x-Variablen wie im Beispiel keine Notwendigkeit, eine Tabelle zu erstellen.

Körpergröße verbessert die Sportnote (b = -0,127; p < 0,001), Körpergewicht hingegen verschlechtert die Sportnote (b = 0,112; p < 0,001). Der Anteil an der Varianzaufklärung beträgt = 0,608 mit F (2,35) = 27,14; p < 0,001.

 

7 Videotutorials

https://www.youtube.com/watch?v=Lz8mVQMlTYc
https://www.youtube.com/watch?v=-GJ4UP2gLKk
https://www.youtube.com/watch?v=eN5q9v-g7lo

 

Die mobile Version verlassen