Korrelation und Assoziation (engl.: Correlation, Association)
Mit K. und A. werden durch statistische Kennzahlen ausdrückbare Zusammenhänge zwischen zwei Variablen bezeichnet. Zumeist wird der Begriff "Korrelation" auf die Bezeichnung des Zusammenhangs zweier metrischer (siehe Messniveau) Merkmale beschränkt und der Begriff "Assoziation" zur Kennzeichnung anderer Zusammenhänge (etwa zwischen nominal- und/oder ordinalskalierten Merkmalen) verwendet; in der Forschungspraxis wird diese Terminologie nicht immer strikt eingehalten. Werden Zusammenhänge zwischen zwei Variablen unter Berücksichtigung ihrer Zusammenhänge mit weiteren Variablen berechnet, so spricht man von Partialkorrelation oder partieller Korrelation.
Maße für die Stärke der K. werden meist als Korrelationskoeffizienten bezeichnet. Im allgemeinen können diese Werte zwischen minimal -1 und maximal +1 annehmen, wobei -1 einen perfekten negativen ("je größer X, desto kleiner Y") und +1 einen perfekten positiven ("je größer X, desto größer Y") Zusammenhang bezeichnet. Unter den Assoziationsmaßen (also Maßzahlen für die Stärke des Zusammenhangs vor allem zwischen nominal- oder ordinalskalierten Variablen) finden sich gelegentlich auch solche, die die Richtung des Zusammenhangs nicht durch unterschiedliche Vorzeichen ausdrücken, oder die nicht das Maximum von +1 bzw. das Minimum von -1 erreichen können.
Dass eine (gegebenenfalls: partielle) K. oder A. zwischen zwei Merkmalen besteht, ist zwar eine notwendige, aber keine hinreichende Bedingung für die Annahme eines Kausalzusammenhanges.
Die Wahl des Korrelationskoeffizienten bzw. Assoziationsmaßes hängt vom Messniveau der Variablen ab. Die wichtigste Koeffizienten sind:
- bei zwei nominalskalierten Merkmalen Phi, der Kontingenzkoeffizient C, Cramer's V, Tau (PRE-Maß von Goodman und Kruskal für nominalskalierte Daten) oder Lambda;
- bei zwei ordinalskalierten Merkmalen Tau-b, Tau-c, Somers' D, Gamma, Spearmans Korrelationskoeffizient (auch Spearmans Rho genannt) oder u. U. der ->polychorische Korrelationskoeffizient (bei dem angenommen wird, dass den ordinal gemessenen Merkmalen latente metrische und normalverteilte Merkmale zugrunde liegen).
- bei zwei metrischen Merkmalen die Produkt-Moment-Korrelation (auch Bravais- Pearson'scher Korrelationskoeffizient genannt), die oft mit r abgekürzt wird. Manchmal wird dieses Korrelationsmaß einfach als "Korrelation" bezeichnet, wenn aus dem Zusammenhang klar ist, dass es sich um kein anderes Maß handelt.
© W. Ludwig-Mayerhofer, ILMES | Last update: 302 Oct 2005