Navigation auf uzh.ch
Wozu wird der F-Test verwendet? |
Der F-Test prüft, ob die Varianzen von zwei Stichproben im statistischen Sinne gleich sind, das heisst homogen, und folglich aus derselben Grundgesamtheit stammen. Der F-Test umfasst eine Gruppe statistischer Verfahren, bei denen die Teststatistik F-verteilt ist. Varianzhomogenität ist beispielsweise eine Voraussetzung des t-Tests für unabhängige Stichproben und bei Varianzanalysen (ANOVA). Der F-Test und Varianten davon, wie beispielsweise der Levene-Test, werden verwendet, um diese Voraussetzung zu prüfen.
Die Fragestellung des F-Tests wird oft so verkürzt:
"Unterscheiden sich die Varianzen eines interessierenden Merkmals in zwei unabhängigen Stichproben?"
✓ | Die Variable ist intervallskaliert |
✓ | Die Variable weist in der Grundgesamtheit eine Normalverteilung auf |
✓ | Die zu vergleichenden Gruppen sind voneinander unabhängig |
In einer Umfrage wurden je 19 Wirtschafts- und Juraabsolventen nach ihrem Einstiegsgehalt (Jahresgehalt in 1‘000 Franken) befragt. Es soll folgende Frage beantwortet werden: Unterscheiden sich die Varianzen des Einstiegsgehalts von Betriebswirtschafts- und Juraabsolventen?
Der zu analysierende Datensatz kann verschiedene Strukturen aufweisen:
Die erste Möglichkeit ist ein Datensatz – in Abbildung 1 als "Variante 'deskriptive Statistik'" bezeichnet –, der neben der Befragtennummer (ID) die Variablen Jahresgehalt_BWL sowie Jahresgehalt_Jus enthält, die für eine Person das Jahresgehalt enthalten oder einen fehlenden Wert, wenn die Person nicht zur entsprechenden Gruppe gehört. Diese Formatierung bietet sich an, wenn die Berechnung via deskriptive Statistiken erfolgen soll (siehe Kapitel 3.1).
Die zweite Möglichkeit ist ein Datensatz – in Abbildung 1 als "Variante 't-Test'" bezeichnet – der neben der Befragtennummer (ID) eine Variable für die Gruppenzugehörigkeit (Gruppen) und eine für das Einstiegsgehalt (Jahresgehalt) enthält. Diese Formatierung bietet sich an, wenn die Berechnung via t-Test für unabhängige Stichproben erfolgen soll (siehe Kapitel 3.3).
Der Datensatz kann unter Quick Start heruntergeladen werden.
Abbildung 2 zeigt die Mittelwerte und Varianzen der abhängigen Variablen Jahresgehalt für die beiden Stichproben. Während die Mittelwerte sich nur geringfügig unterscheiden, ist die Differenz der Varianzen grösser. Bei Juraabsolventen zeigt sich eine geringere Streuung als bei Wirtschaftsabsolventen. Dieser Unterschied soll nun mittels F-Test auf Signifikanz geprüft werden.
Die Teststatistik des F-Tests wird folgendermassen berechnet:
mit
|
= | Varianz der Stichprobe mit der grösseren Varianz |
|
= | Varianz der Stichprobe mit der kleineren Varianz |
|
= | Freiheitsgrade der Stichprobe mit der grösseren Varianz |
|
= | Freiheitsgrade der Stichprobe mit der kleineren Varianz |
|
= | Stichprobengrössen |
Für das vorliegende Beispiel ergibt dies:
Bei identischen Stichprobenvarianzen beträgt die F-Statistik den Wert 1. Bei F-Werten grösser oder kleiner als 1 unterscheiden sich die beiden Stichprobenvarianzen.
Der berechnete Wert muss nun auf Signifikanz geprüft werden. Dazu wird die Teststatistik mit dem kritischen Wert der durch die Freiheitsgrade bestimmten F-Verteilung verglichen. Dies sind im Falle der F-Verteilung zwei Freiheitsgrade: die Freiheitsgrade der Stichprobe mit der grösseren Varianz (auch Zählerfreiheitsgrade genannt, df1 ) und die Freiheitsgrade der Stichprobe mit der kleineren Varianz (auch Nennerfreiheitsgrade genannt, df2 ). Dieser kritische Wert kann Tabellen entnommen werden. Abbildung 3 zeigt einen Ausschnitt einer F-Tabelle, der die kritischen Werte der Signifikanzniveaus .05 und .01 zeigt.
Für das vorliegende Beispiel beträgt der kritische Wert 2.27 bei df1 = 15, df2 = 18 und α = .05 (siehe Abbildung 3). Ist der Wert der Teststatistik höher als der kritische Wert, so ist der Unterschied signifikant. Dies ist für das Beispiel nicht der Fall (1.65 < 2.27). Es muss also davon ausgegangen werden, dass sich die Varianzen der Einstiegsgehälter der beiden Absolventengruppen nicht unterscheiden (F(15,18) = 1.65, p = .380, n = 35).
SPSS-Menü: Analysieren > Deskriptive Statistiken > Häufigkeiten
Hinweis
SPSS-Syntax
FREQUENCIES VARIABLES=Jahresgehalt_BWL Jahresgehalt_Jus
/FORMAT=NOTABLE
/STATISTICS=VARIANCE MEAN
/ORDER=ANALYSIS.
Wie der entsprechende SPSS-Befehl aufgebaut ist, lässt sich der Seite zum t-Test für unabhängige Stichproben entnehmen.
Unter Verwendung der Varianzen (Abbildung 5) lassen sich, wie im Unterkapitel Berechnung der Teststatistik beschrieben, der F-Wert und das zugehörige Signifikanzniveau bestimmen.
Wie Abbildung 6 zeigt, ist der Levene-Test nicht signifikant (p = .380). Dies bestätigt, dass sich die Varianzen der Einstiegsgehälter der beiden Absolventengruppen nicht unterscheiden (Levene-Test: F(1,33) = .792, p = .38, n = 35).
Die Varianzen des Einstiegsgehalts von Jura- und Wirtschaftsabsolventen unterscheiden sich nicht signifikant und es kann somit von homogenen Varianzen ausgegangen werden, wie ein Test unter Verwendung der deskriptiven Statistik zeigt (F(15,18) = 1.65,
p = .380, n = 35) respektive ein Levene-Test via t-Test zeigt (F(1,33) = .792, p = .380, n = 35).