Cooks Distanz (engl.: Cook's Distance)
Cooks Distanz (oft abgekürzt als Cooks D) ist das wichtigste Maß zur Bestimmung einflussreicher Fälle in einem Regressionsmodell. Im linearen Regressionsmodell lautet eine Formel
.
Dabei steht hii für die Diagonalelemente der Hat-Matrix, p ist die Zahl der Variablen im Modell, ei steht für das Residuum des betreffenden Falles und s für die (geschätzte) Standardabweichung der Residuen.
Für andere Regressionsmodelle (etwa die logistische Regression) wurden vergleichbare Kennzahlen entwickelt.
Literatur:
© W. Ludwig-Mayerhofer, ILMES | Last update: 30 Dec 1999