Somers' D

Somers' D ist ein Maß für die Stärke des Zusammenhangs ordinalskalierter Merkmale.

Um diesen Koeffizienten zu verstehen, müssen Sie sich anhand des Stichworts Tau-a, Tau-b, Tau-c mit dem Konzept konkordanter (Nc) und diskordanter (Nd) Paare sowie mit demjenigen der »Ties« vertraut gemacht haben. Es wäre außerdem sinnvoll, vorher den Koeffizienten Gamma zu studieren.

Dann sollte klar werden, dass D ein Mittelding zwischen den Tau-Koeffizienten und Gamma darstellt. Wichtig ist dabei zu beachten, dass D die Richtung des Zusammenhanges berücksichtigt. Dies geschieht dadurch, dass jeweils die Zahl der »Ties« in der »abhängigen« Variablen einbezogen wird. Es gibt auch eine symmetrische Version von D, in der keine Variable als »abhängig&rlaquo; definiert wird.

Wir verwenden die bei Tau-a usw. (siehe oben) erläuterten Abkürzungen, um die Formeln darzustellen. Wir bezeichen mit
Nc die Zahl der konkordanten Paare (Number of concordant pairs);
Nd die Zahl der diskordanten Paare (Number of discordant pairs);
Tx die Zahl der Ties in der Spaltenvariablen (Ties in x; x steht hier für die Spaltenvariable );
Ty die Zahl der Ties in der Zeilenvariablen (Ties in y; y steht hier für die Zeilenvariable );

Damit erhalten wir nun für D mit y als abhängiger Variablen:

Formel y als unabhängige Variable

Für D mit x als abhängiger Variablen lautet die Formel:

Formel x als unabhängige Variable

Schließlich für die symmetrische Variante:

Formel symmetrische Variante

Sehen wir uns noch einmal die Beispieltabelle an, die bei den Tau-Koeffizienten herangezogen wurde.

Empfindung des eigenen Einkommens als gerecht in Abhängigkeit vom Wohnort (Ost- oder Westdeutschland)
Ost               West               ALLE              
Ungerecht               60 30 90
Gerecht               40 70 110
N 100 100 200

Wir erhalten nun folgende Werte (zur Berechnung der einzelnen Bestandteile evtl. nochmals bei Tau nachsehen!):

Dyx = ( 4200 - 1200 ) / ( 4200 + 1200 + 4600 ) = 0,30.

Dxy =( 4200 - 1200 ) / ( 4200 + 1200 + 4500 ) = 0,303.

Schließlich für die symmetrische Variante:

Ds =( 4200 - 1200 ) / ( 4200 + 1200 + ( 4600 + 4500 ) * 0,5 ) = 0,3015.

In der Beispielstabelle beim Stichwort Kreuztabelle hat Dyx einen Wert von 0,137, Dxy einen Wertvon 0,156 und Ds einen Wert von 0,146.

Zur inferenzstatistischen Prüfung, ob der vorgefundene Zusammenhang überzufällig ist, kann D durch seinen Standardfehler dividiert werden. Beträgt der Wert der Koeffizienten mindestens das 1,96-fache seines Standardfehlers, so kann – hinreichend große Fallzahlen vorausgesetzt – die Annahme, dass es sich um einen zufälligen Zusammenhang handelt, mit einer 5-prozentigen Irrtumswahrscheinlichkeit verworfen werden. Es sollte also zur Prüfung der Signifikanz nicht der Chi²-Test für die Kreuztabelle herangezogen werden, da dieser der unterstellten ordinalen Natur des Zusammenhangs nicht gerecht wird.

© W. Ludwig-Mayerhofer, ILMES | Last update: 1 Mar 2025