Tau (Goodman und Kruskal)

Tau (nach Goodman und Kruskal) ist ein Maß für die Stärke des Zusammenhanges zweier nominalskalierter Merkmale in einer Kreuztabelle; es darf nicht mit den von Kendall entwickelten Maßen Tau-a, Tau-b, Tau-c für ordinalskalierte Daten verwechselt werden. Es handelt sich um ein PRE-Maß. Tau wird folgendermaßen berechnet (unter Annahme, daß die unabhängige Variable als Spaltenvariable abgetragen ist):

Regel für die Zuordnung ohne Benutzung der Information über die unabhängige Variable: Ordne jeder Zeile der Tabelle soviele Fälle zu, wie sie in der Ausgangstabelle enthält.
Regel für die Zuordnung mit Benutzung der Information über die unabhängige Variable: Ordne innerhalb jeder Spalte jeder Zelle der Tabelle soviele Fälle zu, wie sie in der entsprechenden Spalte Ausgangstabelle enthält.

Weil dies etwas kryptisch erscheinen mag, hier ein Beispiel: Gegeben sei folgende fiktive Tabelle.

Schuhgröße in Abhängigkeit vom Geschlecht
Frauen Männer ALLE
Unter 39 60% 30% 45%
39 und größer 40% 70% 55%
N 100 100 200

Tau wird jetzt folgendermaßen berechnet:
Ohne Kenntnis des Geschlechts ordne ich willkürlich 45 % der Fälle in die Kategorie »unter 39« und 55 % in die Kategorie »39 und größer«. Von den 45 % in der ersten Kategorie sind logischerweise zufällig 45 % richtig zugeordnet, von den 55 % in der zweiten Kategorie ebenso 55 %. Insgesamt werden so also (0.45 * 0.45) + (0.55 * 0.55) = 0.2025 + 0.3025 = 0.505 oder 50,5 % aller Fälle zufällig richtig zugeordnet und 49,5 % falsch.
Weiß ich aber, welche Person männlich und welche weiblich ist, kann ich meine Vorhersage verbessern: Unter den Frauen stufe ich 60 % in der Größe »Unter 39« ein und 40 % in der Größe »39 und größer«. Bei den Männern lauten die entsprechenden Werte 30 % und 70 %. Jetzt mache ich bei den Frauen (0.60 * 0.60) + (0.40 * 0.40) = 0.36 + 0.16 = 52 % richtige Zuordnungen, bei den Männern (0.30 * 0.30) + (0.70 * 0.70) = 0.09 + 0.49 = 58 % richtige Zuordnungen, und somit, da es im Beispiel genau gleich viele Frauen und Männer sind, insgesamt 55 % richtige und damit 45 % falsche Zuordnungen. Der Prozentwert der falschen Vorhersagen verbessert sich also um (49,5 - 45) = 4,5. Gemäß der Regel für PRE-Maße beträgt Tau also 4,5 / 49 = 0,0909.

In der Beispielstabelle beim Stichwort Kreuztabelle hat Tau einen Wert von 0,025!

Siehe auch: Lambda

© W. Ludwig-Mayerhofer, ILMES | Last update: 30 Dec 1999