Gütekriterien quantitativer Forschung (Mess- und Testgütekriterien)

von | Zuletzt bearbeitet am: Nov 14, 2022 | Gütekriterien, Testgüte, Wissenschaftliches Arbeiten

1 Gütekriterien – Sinn und Zweck

Im Rahmen der quantitativen Forschung müssen Messmethoden bzw. Messverfahren Gütekriterien erfüllen.
Zumeist werden sie auch als “Gütekriterien psychologischer Tests” oder “Gütekriterien psychodiagnostischer Verfahren” bezeichnet, weil sich deren Ursprung dort findet.
Im Endeffekt ist aber stets dasselbe gemeint: Instrumente zur Qualitätsbeurteilung von Messverfahren und Testverfahren.
 
Diese Gütekriterien sollten im psychologischen und sozialwissenschaftlichen Kontext bzw. generell angewandt werden. Noch allgemeiner gesprochen: überall, speziell wo latente (= nicht direkt messbare) Konstrukte gemessen werden müssen/sollen, sollte eine Qualitätsbeurteilung anhand von Gütekriterien eine hinreichende Erfüllung bescheinigen. Das sog. Testmanual diskutiert im Teil der Operationalisierung die angewandten Messmethoden und spiegelt sie anhand der nachfolgenden Gütekriterien typischerweise.

 
In diesem Beitrag geht es um die wesentlichen Gütekriterien, die sog. Hauptgütekriterien, Objektivität, Reliabilität und Validität.
 

2 Objektivität

Objektivität umfasst Durchführungsobjektivität, Auswertungsobjektivität und Interpretationsobjektivität. Das bedeutet die Abwesenheit von Spielräumen bei der Durchführung, Auswertung und Interpretation von Messungen/Tests.

Völlige Objektivität wäre also dann gegeben, wenn sowohl jeder beliebige [Test]Leiter, der einen bestimmten Test mit einer bestimmten [Test]Person durchführt, als auch jeder beliebige [Test]Auswerter die [Test]Leistung der [Test]Person genau gleich auswertet und interpretiert.” (Moosbrugger, Kelava (2011), S. 8)

 

3 Reliabilität

Reliabilität beschreibt die Genauigkeit bzw. Zuverlässigkeit einer Messung/eines Tests. Es sollten für eine hohe Reliabilität keine zufälligen Abweichungen des Messergebnisses vom wahren Wert existieren bzw. jene Abweichungen minimal sein. Idealerweise existiert keine Abweichung vom wahren Wert (vgl. Peter (1979), S. 8), was eine sog. “völlige Reliabilität” darstellt.
Es werden weiterhin unterschieden: Retest-Reliabilität, Paralleltest-Reliabilität, Testhalbierungs-Reliabilität (Split-Half) und Interne Konsistenz.

Eine Waage sollte keine zufälligen Messfehler produzieren. Wird ein Pfund (500 g) Mehl gewogen, sollte die Waage dies auch tatsächlich ausweisen. Dies sollte bei jedem Wiegevorgang der Fall sein und zusätzlich sollte es auch keine Rolle spielen, ob es andere Gegenstände bzw. zu wiegende Objekte mit demselben Gewicht, z.B. ein Pfund Nudeln, sind. Die Waage sollte jedes Mal ein Pfund anzeigen.

 

4 Validität

Validität beschreibt die Gültigkeit einer Messung. Eine hohe Validität liegt dann vor, wenn das und nur das Merkmal, was gemessen werden soll, tatsächlich gemessen wird. Hierbei spricht man auch von materieller Genauigkeit. (vgl. Lienert, G. A., Raatz, U. (1988), S. 7)
Es werden weiterhin unterschieden: Inhaltsvalidität, Augenscheinvalidität, Konstruktvalidität und Kriteriumsvalidität.

Um beim Beispiel der Waage zu bleiben: die Waage sollte tatsächlich das Gewicht des zu wiegenden Gegenstandes messen und nicht die Raumtemperatur oder das Gewicht des vorletzten Wiegevorganges.

 

5 Reliabilität und Validität

In folgender Abbildung (Quelle leider unbekannt) wird hoffentlich noch mal deutlich, was eine reliable Messung und eine valide Messung ausmachen und wie sie zusammen passen können. Der Idealfall ist unten rechts abgebildet.
Reliabilität und Validität
 

Objektivität, Reliabilität und Validität bedingen einander. Objektivität ist für Reliabilität notwendig (aber nicht hinreichend). Gleichzeitig ist Reliabilität für Validität notwendig (aber ebenfalls nicht hinreichend).

 

6 Literatur

  • Lienert, G. A., Raatz, U. (1998). Testaufbau und Testanalyse. Deutschland: Beltz, Psychologie Verlags Union.
  • Moosbrugger, H., Kelava, A. (2011). Testtheorie und Fragebogenkonstruktion. Deutschland: Springer Berlin Heidelberg.
  • Peter, J. P. (1979). Reliability: A review of psychometric basics and recent marketing practices. Journal of marketing research, 16(1), 6-17.

 

Hat dir der Beitrag geholfen?

Dann würde ich mich über eine kleine Spende freuen, die es mir erlaubt, weiterhin kostenfreie Inhalte zu veröffentlichen.
Alternativ kannst du über meinen Amazon Affiliate-Link einkaufen – ohne Zusatzkosten.

Vielen Dank und viel Erfolg!

Über mich

Björn Walther

Ein 💚 für Statistik & Datenanalyse

Excel Online-Kurs

YouTube-Kanal

Inhalt