Somers' D
Somers' D ist ein Maß für die Stärke des Zusammenhangs ordinalskalierter Merkmale.
Um diesen Koeffizienten zu verstehen, müssen Sie sich anhand des Stichworts Tau-a, Tau-b, Tau-c mit dem Konzept konkordanter (Nc) und diskordanter (Nd) Paare sowie mit demjenigen der "Ties" vertraut gemacht haben. Es wäre außerdem sinnvoll, vorher den Koeffizienten Gamma zu studieren.
Dann sollte klar werden, daß D ein Mittelding zwischen den Tau-Koeffizienten und Gamma darstellt. Wichtig ist dabei zu beachten, daß D die Richtung des Zusammenhanges berücksichtigt. Dies geschieht dadurch, daß jeweils die Zahl der "Ties" in der "abhängigen" Variablen einbezogen wird. Es gibt auch eine "symmetrische" Version von D, in der keine Variable als "abhängig" definiert wird.
Wir verwenden die bei Tau-a usw. (siehe oben) erläuterten Abkürzungen, um die Formeln darzustellen. Wir bezeichen mit
Nc die Zahl der konkordanten Paare (Number of concordant pairs);
Nd die Zahl der diskordanten Paare (Number of discordant pairs);
Tx die Zahl der Ties in der Spaltenvariablen (Ties in x; x steht hier für die Spaltenvariable );
Ty die Zahl der Ties in der Zeilenvariablen (Ties in y; y steht hier für die Zeilenvariable );
Damit erhalten wir nun für D mit y als abhängiger Variablen:
Für D mit x als abhängiger Variablen lautet die Formel:
Schließlich für die symmetrische Variante:
Sehen wir uns noch einmal die Beispieltabelle an, die bei den Tau-Koeffizienten herangezogen wurde.
Weiblich | Männlich | ALLE | |
---|---|---|---|
Kein Übergewicht | 60 | 30 | 90 |
Übergewicht | 40 | 70 | 110 |
N | 100 | 100 | 200 |
Wir erhalten nun folgende Werte (zur Berechnung der einzelnen Bestandteile evtl. nochmals bei Tau nachsehen!):
Dyx = ( 4200 - 1200 ) / ( 4200 + 1200 + 4600 ) = 0,30.
Dxy =( 4200 - 1200 ) / ( 4200 + 1200 + 4500 ) = 0,303.
Schließlich für die symmetrische Variante:
Ds =( 4200 - 1200 ) / ( 4200 + 1200 + ( 4600 + 4500 ) * 0,5 ) = 0,3015.
In der Beispielstabelle beim Stichwort Kreuztabelle hat Dyx einen Wert von 0,137, Dxy einen Wertvon 0,156 und Ds einen Wert von 0,146.
Zur inferenzstatistischen Prüfung, ob der vorgefundene Zusammenhang überzufällig ist, kann D durch seinen Standardfehler dividiert werden. Beträgt der Wert der Koeffizienten mindestens das 1,96fache seines Standardfehlers, so kann – hinreichend große Fallzahlen vorausgesetzt – die Annahme, daß es sich um einen zufälligen Zusammenhang handelt, mit einer 5-prozentigen Irrtumswahrscheinlichkeit verworfen werden. Es sollte also zur Prüfung der Signifikanz nicht der Chi²-Test für die Kreuztabelle herangezogen werden.
© W. Ludwig-Mayerhofer, ILMES | Last update: 30 Dec 1999