Lambda

Lambda ist ein Maß für die Stärke des Zusammenhanges zweier Merkmale in einer Kreuztabelle. Es handelt sich um ein PRE-Maß. Lambda wird folgendermaßen berechnet (unter Annahme, daß die unabhängige Variable als Spaltenvariable abgetragen ist):

Regel für die Zuordnung ohne Benutzung der Information über die unabhängige Variable: Ordne die Fälle jener Zeile der Tabelle zu, die insgesamt die höchste Besetzung aufweist.
Regel für die Zuordnung mit Benutzung der Information über die unabhängige Variable: Ordne innerhalb jeder Spalte die Fälle jener Zelle zu, die die höchste Besetzung aufweist.

Weil dies manchen etwas kryptisch erscheinen mag, erkläre ich das an einem
Beispiel: Gegeben sei folgende fiktive Tabelle.

Schuhgröße in Abhängigkeit vom Geschlecht
Frauen Männer Alle
Unter 39 60 % 30 % 45 %
39 und größer 40 % 70 % 55 %
N 100 100 200

Lambda wird jetzt folgendermaßen berechnet: Ohne Kenntnis des Geschlechts mache ich die wenigsten Fehler – 45 % –, wenn ich alle Fälle in die Kategorie "39 und größer" einstufe (es werden nämlich 110 Fälle richtig und 90 falsch eingestuft). Weiß ich aber, welche Person männlich und welche weiblich ist, kann ich meine Vorhersage verbessern: Ich stufe alle Frauen in der Größe »Unter 39« ein, alle Männer in der Größe »39 und größer«. Damit mache ich 60 + 70 = 130 richtige Vorhersagen, also nur noch 35 Prozent falsche Vorhersagen; mit anderen Worten: Die Zahl der richtigen Vorhersagen nimmt um 10 Prozentpunkte zu. Lambda wird (wie alle PRE-Maße) so berechnet:
Anteil der zusätzlichen richtigen Vorhersagen bei Kenntnis der x-Variablen/
Anteil der falschen Vorhersagen ohne Kenntnis der x-Variablen
Der Wert von Lambda beträgt im Beispiel also 10 / 45 = 0,2222.

In der Beispielstabelle beim Stichwort Kreuztabelle hat Lambda einen Wert von 0! Wie kommt das? Offensichtlich daher, dass in jeder Spalte die Zelle "niemals arm" die größte Besetzung aufweist. Daher erweist sich in einem solchen Fall das Konzept von Lambda als nicht sehr sinnvoll.

Man kann Lambda selbstverständlich auch unter der Annahme berechnen, dass nicht y, sondern x die abhängige Variable ist. Außerdem gibt es eine symmetrische Version für den Fall, dass die Unterscheidung zwischen abhängiger und unabhängiger Variablen im konkreten Fall sinnlos ist. Dabei werden einfach die richtigen Vorhersagen für y und die für x als abhängige Variable zusammengezählt und dann wie gewohnt zueinander in Beziehung gesetzt.

Siehe auch: (Goodman und Kruskals) Tau

© W. Ludwig-Mayerhofer, ILMES | Last update: 30 Dec 1999