PRE-Maße (engl.: PRE Measures [of Association])
sind Zusammenhangsmaße, die ausdrücken, wie gut durch die Kenntnis einer oder mehrerer Variablen die Ausprägungen einer weiteren Variablen vorhergesagt werden können. Die relative Verbesserung der Vorhersage (oder anders herum: die Verringerung der Fehlerquote = engl. Proportional Reduction of Error, daher PRE) wird dann im PRE-Maß ausgedrückt. Die meisten PRE-Maße sind asymmetrisch, d.h., sie unterscheiden zwischen abhängiger (zu erklärender) und unabhängiger (erklärender) Variablen; manche sind aber auch symmetrisch. PRE-Maße wurden sowohl für die Analyse von Kreuztabellen als auch für metrische (siehe dazu unter Messniveau) abhängige Variablen entwickelt.
PRE-Maße basieren auf folgender Logik: Wenn man vorhersagen will, wie sich Untersuchungseinheiten auf die Ausprägungen einer Variablen – nennen wir sie Y – verteilen, so wird man auch rein zufällig einen Teil der Fälle richtig und einen anderen Teil falsch einstufen bzw. (im Falle metrischer Variablen) zufällig manchmal näher am und manchmal weiter weg vom faktisch vorliegenden Wert liegen. Besteht aber ein Zusammenhang zwischen Y – der abhängigen Variablen – und einer weiteren Variablen, nennen wir sie X – der unabhängigen Variablen –, so wird man im allgemeinen die Zahl der richtigen Einstufungen in Y verbessern können (bzw. durchschnittlich näher am faktisch vorliegenden Wert liegen), wenn man weiß, welchen Wert die Untersuchungseinheiten in der Variablen X aufweisen.
Für ein PRE-Maß benötigt man also zwei Vorhersageregeln: Eine für den Fall, dass man keine Kenntnis über den Zusammenhang zwischen X und Y hat, und eine für den Fall, dass man über entsprechende Kenntnisse verfügt. Nennen wir das Ausmaß des Vorhersagefehlers im ersten Fall E1 und im zweiten Fall (wenn wir die Zusammenhänge zwischen X und Y kennen) E2, so werden die PRE-Maße so berechnet:
PRE = ( E1 - E2 ) / E1
E1 - E2 ist der "Gewinn" bei der Güte der Vorhersage bei Anwendung der zweiten Vorhersageregel. Näheres dazu bei den einzelnen Maßzahlen.
Die wichtigsten PRE-Maße für Kontingenztabellen sind Lambda, (Goodman und Kruskals) Tau sowie Gamma. Für metrische abhängige Variablen stehen die Maßzahlen Eta² und R² zur Verfügung.
Siehe auch: Chi-Quadrat-basierte Zusammenhangsmaße
Herzlichen Dank an Sigbert Klinke, Berlin, für seinen Hinweis auf einen Fehler in der ersten Version.
© W. Ludwig-Mayerhofer, ILMES | Last (minor) update: 18 Dec 2007 |