Tau (Goodman und Kruskal)

Tau (nach Goodman und Kruskal) ist ein Maß für die Stärke des Zusammenhanges zweier nominalskalierter Merkmale in einer Kreuztabelle; es darf nicht mit den von Kendall entwickelten Maßen Tau-a, Tau-b, Tau-c für ordinalskalierte Daten verwechselt werden. Es handelt sich um ein PRE-Maß. Tau wird folgendermaßen berechnet (unter Annahme, daß die unabhängige Variable als Spaltenvariable abgetragen ist):

Regel für die Zuordnung ohne Benutzung der Information über die unabhängige Variable: Ordne jeder Zeile der Tabelle soviele Fälle zu, wie sie in der Ausgangstabelle enthält.
Regel für die Zuordnung mit Benutzung der Information über die unabhängige Variable: Ordne innerhalb jeder Spalte jeder Zelle der Tabelle soviele Fälle zu, wie sie in der entsprechenden Spalte Ausgangstabelle enthält.

Erläutern wir dies an einem Beispiel: Gegeben sei folgende fiktive Tabelle. Sie ist angelehnt an einen Befund von Stefan Liebig und Jürgen Schupp (Leistungs- oder Bedarfsgerechtigkeit? Über einen normativen Zielkonflikt des Wohlfahrtsstaats und seiner Bedeutung für die Bewertung des eigenen Erwerbseinkommens, Soziale Welt, Bd. 59 (1) 2008, S. 7-30) zur wahrgenommenen (Un-)Gerechtigkeit des eigenen Erwerbseinkommens in Ost- und Westdeutschland; die hier dargestellten Zahlen sind aber aus Gründen der Vereinfachung frei erfunden.

**Empfindung des eigenen Einkommens als gerecht in Abhängigkeit vom Wohnort (Ost- oder Westdeutschland)**
	Ost	West	ALLE
Ungerecht	60 %	30 %	45 %
Gerecht	40 %	70 %	55 %
N	100	100	200

Tau wird jetzt folgendermaßen berechnet:

Ohne Kenntnis des Wohnorts (Ost- oder Westdeutschland) würde man willkürlich 45 % der Fälle in die Kategorie »ungerecht« und 55 % in die Kategorie »gerecht« einordnen. Von den 45 % in der ersten Kategorie wären logischerweise zufällig 45 % richtig zugeordnet, von den 55 % in der zweiten Kategorie ebenso 55 %. Insgesamt würden so also (0.45 * 0.45) + (0.55 * 0.55) = 0.2025 + 0.3025 = 0.505 oder 50,5 % aller Fälle zufällig richtig zugeordnet und 49,5 % falsch.

Weiß man aber, ob eine Person in Ost- oder in Westdeutschland wohnt, kann man die Vorhersage verbessern: Unter den Ostdeutschen stuft man 60 % in der Kategorie »ungerecht« ein und 40 % in der Kategorie »gerecht«. Bei den Westdeutschen lauten die entsprechenden Werte 30 % und 70 %. Jetzt macht man also bei den Ostdeutschen (0.60 * 0.60) + (0.40 * 0.40) = 0.36 + 0.16 = 52 % richtige Zuordnungen, bei den Westdeutschen (0.30 * 0.30) + (0.70 * 0.70) = 0.09 + 0.49 = 58 % richtige Zuordnungen, und somit, da es im Beispiel genau gleich viele Ostdeutsche und Westdeutsche sind, insgesamt 55 % richtige und damit 45 % falsche Zuordnungen. Der Prozentwert der falschen Vorhersagen verbessert sich also um (49,5 - 45) = 4,5. Gemäß der Regel für PRE-Maße beträgt Tau also 4,5 / 49 = 0,0909.

In der Beispielstabelle beim Stichwort Kreuztabelle hat Tau einen Wert von 0,025!

Zur inferenzstatistischen Prüfung, ob ein gefundener Zusammenhang statistisch signifikant von Null verschieden ist, verwendet man den Chi-Quadrat-Test für die analysierte Kreuztabelle.

Siehe auch: Lambda