Missing Data-Techniken

M. D.-T. oder Techniken zum Umgang mit fehlenden Werten sind Verfahren, mit denen bei der Auswertung quantitativer Daten das Problem fehlender Werte berücksichtigt wird. In der Regel bezieht man sich hierbei nur auf das Problem der Item-Non-Response, im Prinzip kann man aber auch das Problem der Unit-Non-Response unter diesem Begriff diskutieren. An dieser Stelle gehe ich aber nur auf die Item-Non-Response ein.

Grundsätzlich kann man drei M. D.-T.en unterscheiden:

Erstens kann man fehlende Werte »ignorieren«. In aller Regel werden dabei für die jeweilige Analyse alle Fälle weggelassen, die in mindestens einer der Variablen einen fehlenden Wert haben. In komplexeren Modellen kann es auf diese Weise schnell geschehen, dass eine beträchtliche Anzahl von Fällen ausgeschlossen werden, obwohl diese in den meisten Variablen keine fehlenden Werte haben. Dieses Verfahren wird viel häufiger angewendet, als man angesichts seiner mangelnden Plausibilität annehmen sollten, denn es fungiert in aller Regel als Voreinstellung bei der Anwendung von Standardsoftware zur statistischen Datenanalyse.

Das Verfahren des Ignorierens (oder Casewise Deletion) führt immerhin zu richtigen Punktschätzern, wenn die fehlenden Werte MCAR sind. Allerdings dürften weitere inferenzstatistische Schlüsse durch die oftmals deutlich verringerten Fallzahlen in der Analyse oft problematisch sein.

Zweitens kann man unter Anwendung komplexer Schätzverfahren (EM-Verfahren, Full Information Maximum Likelihood) versuchen, Modelle zu schätzen, die die fehlenden Werte berücksichtigen. Eine Darstellung und Diskussion geht leider über den Rahmen dieser Einfühung hinaus.

Drittens lassen sich Verfahren der Imputation anwenden; moderne Verfahren der multiplen Imputation sind seit der Jahrtausendwende zunehmend populär geworden.

© W. Ludwig-Mayerhofer, ILMES | Last update: 30 Mai 2010