Cooks Distanz (engl.: Cook's Distance)

Cooks Distanz (oft abgekürzt als Cooks D) ist das wichtigste Maß zur Bestimmung einflussreicher Fälle in einem Regressionsmodell. Im linearen Regressionsmodell lautet eine Formel

Formel Cooks D.

Q = π 11 π 22 - π 12 π 21 π 11 π 22 + π 12 π 21

Dabei steht hii für die Diagonalelemente der Hat-Matrix, p ist die Zahl der Variablen im Modell, ei steht für das Residuum des betreffenden Falles und s für die (geschätzte) Standardabweichung der Residuen.

Für andere Regressionsmodelle (etwa die logistische Regression) wurden vergleichbare Kennzahlen entwickelt.

Literatur:

© W. Ludwig-Mayerhofer, ILMES | Last update: 30 Dec 1999