Ressourcen für empirische Methoden

Chi-Quadrat-Streuungstest

Quick Start

Wozu wird der Chi-Quadrat-Streuungstest verwendet?
Der Chi-Quadrat-Streuungstest testet, ob die Varianz einer Variable innerhalb einer Stichprobe (Stichprobenvarianz) mit deren Varianz in der Grundgesamtheit (Populationsvarianz) übereinstimmt.

SPSS-Menü
Analysieren > Deskriptive Statistiken > Häufigkeiten

SPSS-Syntax
FREQUENCIES VARIABLES= Variable
/FORMAT=NOTABLE
/STATISTICS=VARIANCE MEAN

SPSS-Beispieldatensatz
Chi-Quadrat-Streuungstest

1. Einführung

Der Chi-Quadrat-Streuungstest testet, ob die Varianz einer Variablen innerhalb einer Stichprobe (Stichprobenvarianz) mit deren Varianz in der Grundgesamtheit (Populationsvarianz) übereinstimmt. Daher wird auch von einem Test auf „Varianzhomogenität“ gesprochen. Es handelt sich dabei um ein nicht-parametrisches statistisches Verfahren mit einer Teststatistik, die einer Chi-Quadrat-Verteilung folgt.

Beim hier vorgestellten Chi-Quadrat-Streuungstest handelt es sich um einen ungerichteten Test. Das bedeutet, dass lediglich überprüft wird, ob Varianzunterschiede vorliegen. Die Richtung des Unterschiedes, also beispielsweise welche Varianz grösser ist, wird nicht beurteilt.

Die Fragestellung des Chi-Quadrat-Streuungstests wird oft so verkürzt: „Unterscheidet sich die Stichproben- und Populationsvarianz eines interessierenden Merkmals?“

1.1. Beispiele für mögliche Fragestellungen

  • Gibt es einen Unterschied zwischen der Streuung des Gewinnes von Aktienkäufen durch Börsenmakler im Vergleich zur Streuung des Gewinns in der Gesamtheit der Aktienkäufer?
  • Unterscheidet sich die Varianz der Qualität von Marken-T-Shirts im Vergleich zur Gesamtheit der hergestellten T-Shirts?
  • Ist der Unterschied in der Varianz der Haltbarkeit von Freilandeiern und allen zum Verkauf produzierten Eiern zufällig?
  • Unterscheidet sich die Streuung der Anzahl Gewürze, die Spitzenköche in einem Geruchstest erkennen, von der Streuung in der Gesamtheit der Berufsköche?

1.2. Voraussetzungen der einfaktoriellen Varianzanalyse mit Messwiederholung

Die Variable ist intervallskaliert
Es liegen keine Ausreisser vor
Das Merkmal ist in der Grundgesamtheit normalverteilt (Der Test ist nicht robust. Bereits relativ geringfügige Abweichungen beeinflussen das Ergebnis.)
Die Varianz in der Grundgesamtheit muss bekannt sein

2. Grundlegende Konzepte

2.1. Beispiel einer Studie


Eine Gruppe von Sportmedizinern untersucht die Verletzungshäufigkeit (Anzahl Sportverletzungen pro Jahr) von 30 Kampfsportlern im Vergleich zu Sportlern im Allgemeinen. Sie fragen sich, ob sich die Varianz der Verletzungshäufigkeit von Kampfsportlern von der Varianz in der Grundgesamtheit der Sportler unterscheidet.

Der zu analysierende Datensatz enthält neben der Probandennummer (ID) die Verletzungshäufigkeit der Sportler (Verletzungshäufigkeit).

Abbildung 1: Beispieldaten

Abbildung 1: Beispieldaten

Der Datensatz kann unter Quick Start heruntergeladen werden.

2.2. Berechnung der Teststatistik

Berechnung der Teststatistik

Zur Berechnung der Teststatistik wird die Populationsvarianz benötigt. Um diese zu ermitteln, ist es nicht notwendig, die komplette Population zu untersuchen, sondern es wird in der Regel auf die Varianz einer repräsentativen Stichprobe zurückgegriffen. Dies ist auch im vorliegenden Beispiel der Fall: Die Populationsvarianz, also die Varianz der Verletzungshäufigkeit in der Grundgesamtheit der Sportler, wurde in einer früheren Erhebung mittels einer repräsentativen Stichprobe erfasst und liegt damit bereits vor. Die Stichprobenvarianz dagegen wird auf Basis der Stichprobe von Kampfsportler ermittelt. Beide Varianzen sind in Abbildung 1 ersichtlich.

Um zu prüfen, ob sich die beiden Varianzen signifikant unterscheiden, wird die Teststatistik Chi-Quadrat (χ²) ermittelt. Sie wird wie folgt berechnet:

mit

= Stichprobenvarianz
= Populationsvarianz
= Stichprobengrösse

 

Für die Beispieldaten ergibt dies:

Signifikanz der Teststatistik

Der berechnete Wert muss nun auf Signifikanz geprüft werden. Dazu wird die Teststatistik mit dem kritischen Wert der durch die Freiheitsgrade (df) bestimmten Chi-Quadrat-Verteilung verglichen. Dieser kritische Wert kann Tabellen entnommen werden. Abbildung 2 zeigt einen Auszug.

Abbildung 2: Einige kritische Werte der Chi-Quadrat-Verteilung

Abbildung 2: Einige kritische Werte der Chi-Quadrat-Verteilung

Für das vorliegende Beispiel beträgt der kritische Wert 42.56 bei df = 29 und α = .05 (siehe Abbildung 2). Ist der Wert der Teststatistik höher als der kritische Wert, so ist der Unterschied signifikant. Dies ist für das Beispiel nicht der Fall (22.94 < 42.56). Es muss also davon ausgegangen werden, dass es keinen Unterschied zwischen der Varianz der Verletzungshäufigkeit von Kampfsportlern und jener der Grundgesamtheit der Sportler gibt (Chi-Quadrat(29) = 22.94, p > .05, n = 30).

3. Der Chi-Quadrat-Streuungstest mit SPSS

3.1. SPSS-Befehle

Es ist nicht möglich, den Chi-Quadrat-Streuungstest direkt mit SPSS durchzuführen. Die Varianz der Stichprobe kann jedoch mittels SPSS ermittelt werden, wie die Klicksequenz in Abbildung 3 zeigt.

SPSS-Menü: Analysieren > Deskriptive Statistiken > Häufigkeiten

Abbildung 3: Klicksequenz in SPSS

Abbildung 3: Klicksequenz in SPSS


Hinweis

  • Unter Statistiken können die Kennwerte angegeben werden, die SPSS ausgeben soll. Zur manuellen Berechnung des Chi-Quadrat-Tests wird lediglich die Stichprobenvarianz benötigt.


SPSS-Syntax

FREQUENCIES VARIABLES=Verletzungshäufigkeit
/FORMAT=NOTABLE
/STATISTICS=VARIANCE MEAN
/ORDER=ANALYSIS.

3.2. Ergebnisse des Chi-Quadrat-Tests

Abbildung 4: SPSS-Output – Deskriptive Statistik

Abbildung 4: SPSS-Output – Deskriptive Statistik

Mit Hilfe der von SPSS ausgegebenen Stichprobenvarianz (Abbildung 4) lässt sich, wie im Unterkapitel Berechnung der Teststatistik beschrieben, der Chi-Quadrat-Wert ermitteln und das Signifikanzniveau bestimmen.

3.3. Eine typische Aussage

Die Varianz der Verletzungshäufigkeit von Kampfsportlern unterscheidet sich nicht signifikant von derjenigen von Sportlern im Allgemeinen (Chi-Quadrat-Streuungstest: Chi-Quadrat(29) = 22.94, p > .05, n = 30).

top