Lambda
Lambda ist ein Maß für die Stärke des Zusammenhanges zweier Merkmale in einer Kreuztabelle. Es handelt sich um ein PRE-Maß. Lambda wird folgendermaßen berechnet (unter Annahme, dass die unabhängige Variable als Spaltenvariable abgetragen ist):
Regel für die Zuordnung ohne Benutzung der Information über die unabhängige Variable: Ordne die Fälle jener Zeile der Tabelle zu, die insgesamt die höchste Besetzung aufweist.
Regel für die Zuordnung mit Benutzung der Information über die unabhängige Variable: Ordne innerhalb jeder Spalte die Fälle jener Zelle zu, die die höchste Besetzung aufweist.
Erläutern wir dies an einem
Beispiel: Gegeben sei folgende fiktive Tabelle. Sie ist angelehnt an einen Befund von Stefan Liebig und Jürgen Schupp (Leistungs- oder
Bedarfsgerechtigkeit? Über einen normativen Zielkonflikt des Wohlfahrtsstaats und seiner Bedeutung für die Bewertung des eigenen Erwerbseinkommens, Soziale Welt, Bd. 59 (1) 2008, S. 7-30) zur wahrgenommenen (Un-)Gerechtigkeit des eigenen Erwerbseinkommens in Ost- und Westdeutschland; die hier dargestellten Zahlen sind aber aus Gründen der Vereinfachung frei erfunden.
Ost | West | Alle | |
---|---|---|---|
Ungerecht | 60 % | 30 % | 45 % |
Gerecht | 40 % | 70 % | 55 % |
N | 100 | 100 | 200 |
Lambda wird jetzt folgendermaßen berechnet: Ohne Kenntnis des
Wohnorts macht man die wenigsten Fehler – 45 % –, wenn man alle Fälle in die Kategorie »gerecht« einstuft (es werden nämlich 110 Fälle richtig und 90 falsch eingestuft). Weiß man aber, wer in Ost- und wer in Westdeutschland wohnt, kann man die Vorhersage verbessern: Man stuft alle Ostdeutschen in die Kategorie »ungerecht« ein, alle Westdeutschen in die Kategorie »gerecht«. Damit macht man 60 + 70 = 130 richtige Vorhersagen, also nur noch 35 Prozent falsche Vorhersagen; mit anderen Worten: Die Zahl der richtigen Vorhersagen nimmt um 10 Prozentpunkte zu. Lambda wird (wie alle PRE-Maße) so berechnet:
Anteil der zusätzlichen richtigen Vorhersagen bei Kenntnis der x-Variablen/
Anteil der falschen Vorhersagen ohne Kenntnis der x-Variablen
Der Wert von Lambda beträgt im Beispiel also 10 / 45 = 0,2222.
In der Beispielstabelle beim Stichwort Kreuztabelle hat Lambda einen Wert von 0! Wie kommt das? Offensichtlich daher, dass in jeder Spalte die Zelle »niemals arm« die größte Besetzung aufweist. Daher erweist sich in einem solchen Fall das Konzept von Lambda als nicht sehr sinnvoll.
Man kann Lambda selbstverständlich auch unter der Annahme berechnen, dass nicht y, sondern x die abhängige Variable ist. Außerdem gibt es eine symmetrische Version für den Fall, dass die Unterscheidung zwischen abhängiger und unabhängiger Variablen im konkreten Fall sinnlos ist. Dabei werden einfach die richtigen Vorhersagen für y und die für x als abhängige Variable zusammengezählt und dann wie gewohnt zueinander in Beziehung gesetzt.
Zur inferenzstatistischen Prüfung, ob ein gefundener Zusammenhang statistisch signifikant von Null verschieden ist, verwendet man den Chi-Quadrat-Test für die analysierte Kreuztabelle.
Siehe auch: (Goodman und Kruskals) Tau
© W. Ludwig-Mayerhofer, ILMES | Last update: 1 Mar 2025