MCAR, MAR – Missing (Completely) at Random

In empirischen Datensätzen gibt es immer fehlende Datenwerte (Missing Values). Diese sind

  • MCAR (Missing Completely at Random), wenn ihr Auftreten weder vom Wert der in Frage stehenden Variablen noch von anderen Variablen abhängt;
  • MAR (Missing at Random), wenn ihr Auftreten, obschon von anderen Variablen, nicht vom Wert der in Frage stehenden Variablen abhängt.

Beispiel: Daten über Vermögen. Fehlende Werte sind hier MCAR, wenn sie weder von der Höhe des Vermögens abhängen (wenn also nicht etwa besonders hohe oder besonders niedrige Vermögen seltener angegeben werden) noch auch von anderen Merkmalen (wenn also bspw. nicht Selbstständige häufiger die Vermögensangaben verweigern als andere Personen). Die fehlenden Werte wären MAR, wenn bspw. zwar Selbstständige häufiger die Angaben verweigern als abhängig Beschäftigte, aber innerhalb jeder Gruppe das Auftreten fehlender Werte nicht mit der Höhe des Vermögens zusammenhängt.

Sind fehlende Werte weder MAR noch MCAR, so werden sie auch als NMAR (Not Missing At Random) bezeichnet.

Literatur:

Allison, Paul D.: Missing Data. Sage University Paper Series on Quantitative Applications in the Social Sciences, 07-136. Thousand Oaks, London: Sage, 2002

© W. Ludwig-Mayerhofer, ILMES | Last update: 14 Apr 2009