Kruskal-Wallis H-Test
Der H-Test nach Kruskal und Wallis ist ein nichtparametrisches Verfahren
zum Vergleich der Mittelwerte mehrerer Stichproben
und stellt eine Verallgemeinerung von Wilcoxon's Rangsummentest auf mehr als
zwei Stichproben dar. Es handelt sich somit um eine Alternative zum F-Test (siehe
Varianzanalyse), die vor allem dann angewendet werden sollte, wenn dessen Anwendungsvoraussetzungen
verletzt sind, d.h. wenn die Messwerte nicht normalverteilt sind oder die Varianzen
der Gruppen stark unterschiedlich sind oder sogar beides gegeben ist.
Voraussetzungen für den H-Test sind lediglich unabhängige Stichproben, eine stetige Verteilung und
mindestens ordinalskalierte Daten.
Der H-Test vergleicht statt der Original-Messwerte die Rangwerte der Daten. Die ursprüngliche Prüfgröße des F-Tests wird für die Ränge der Beobachtungen berechnet. Es wird geprüft, ob die Zahl der Beobachtungen, die kleiner (oder größer) als der gemeinsame Median beider Variablen sind, in den Gruppen verschieden ist.
Zur Berechnung des H-Tests werden die Originaldaten durch die entsprechenden Rangplätze ersetzt, die sich bei der Ordnung der Datenwerte der Größe nach über die Gruppen hinweg ergeben. Im Beispiel sieht das etwa so aus:
Gruppe 1 | Gruppe 2 | Gruppe 3 | |||
---|---|---|---|---|---|
Originalwert | Rangplatz | Originalwert | Rangplatz | Originalwert | Rangplatz |
1700 | 1 | 2100 | 3 | 2300 | 4 |
2000 | 2 | 2400 | 5 | 3000 | 8 |
2700 | 6 | 2800 | 7 | 3300 | 9 |
3500 | 10 | 4400 | 11 | 4500 | 12 |
Für jede der Gruppen berechnet man dann die Summe der Ränge, die den Messwerten der betreffenden Gruppe zugeordnet sind. Das weitere Verfahren hängt nun von bestimmten Voraussetzungen ab:
1. Sind die untersuchten Stichproben sehr klein (was das bedeutet, ist in der Literatur nicht einheitlich definiert; häufig findet sich: bei drei Gruppen, wenn n<8, bei vier Gruppen, wenn n<4 und bei fünf Gruppen, wenn n<3), muss ein exakter Test durchgeführt werden und die Prüfgröße H mit entsprechenden kritischen Schwellenwerten verglichen werden, die in manchen Statistik-Lehrbüchern tabelliert sind.
2. Sind die untersuchten Stichproben groß genug, d.h. überschreiten sie die unter
1. genannen Grenzen, lässt sich der asymptotische Test durchführen. Die Größe
folgt einer Chi²-Verteilung mit l-1 Freiheitsgraden.
Treten Bindungen (engl. »Ties«), d.h. gleiche Werte (und damit gleiche Ränge) über die Gruppen
hinweg auf, so wird allen betreffenden Werten das arithmetische Mittel der betreffenden Rangplätze
zugewiesen.
Für den Fall, dass es sehr viele Bindungen gibt, steht eine Formel für eine Korrekturgröße zur Verfügung,
durch die der Wert der Testgröße dividiert werden sollte und die folgendermaßen berechnet wird:
tj ist hier die Anzahl der gleichgroßen Werte an der j-ten Stelle. Wenn keine Bindungen vorliegen, nimmt die Korrekturgröße gerade den Wert 1 an.
© R.Christian, W. Ludwig-Mayerhofer | Last update: 30 Sep 2005