Quantil (engl.: Quantile)
Ein Quantil ist, salopp übersetzt, ein »So-und-so-Vieltel« eines der Größe nach sortierten Datenbündels. Durch mehrere Quantile kann man daher auch die die Streuung eines Datenbündels charakterisieren. Die wichtigsten Qu.e sind die Dezile, die Quartile und – wie gesagt – der Median. Grundsätzlich sind Aussagen über Qu.e nur bei mindestens ordinalskalierten Daten angemessen.
Formaler: Der Wert des p-Quantils einer Verteilung gibt an, welcher Wert die unteren p × 100 Prozent der Datenwerte von den oberen (1 - p) × 100 Prozent trennt. Wenn man etwa das 0,05- (oder das 0,65)-Quantil einer Verteilung angibt, so besagt das, dass 5 (65) Prozent aller Datenwerte kleiner oder gleich dem betreffenden Datenwert sind und 95 (35) Prozent größer oder gleich diesem Wert. Abgekürzt schreibt man (erläutert an den genannten Beispielen) meist Q5 bzw. Q65 oder Q0,05 bzw. Q0,65. Von einem Perzentil (engl.: percentile) spricht man (im deutschen Sprachraum seltener als im angelsächsischen), wenn man sich statt der Anteilswerte direkt auf die Prozentwerte bezieht. Das 0,05-Quantil kann dementsprechend auch als fünftes Perzentil bezeichnet werden, usw.
Oft gibt es keinen Wert im Datenbündel, der exakt dem betreffenden Quantil entspricht. Eine häufig verwendete Regel für die Bestimmung von Quantilen lautet (mit n=Anzahl der Datenwerte):
- Wenn n × p keine ganze Zahl ist, so wird als Ordnungsziffer für den Quantilswert die auf n × p folgende ganze Zahl festgelegt;
- Ist n × p eine ganze Zahl, so liegt das Quantil zwischen der Ordnungszahl n × p und n × p + 1; hier müssen also Interpolationsregeln eingesetzt werden (etwa das arithmetische Mittel aus n × p und n × p + 1.
Beispiel: Bei 16 Datenwerten ergibt sich für das erste Quartil (also das 0,25-Quantil) die Ordnungsziffer 4 (aus 16 × 0,25). Der Wert des Quartils sollte aber möglichst zwischen den unteren 25 und den oberen 75 Prozent liegen; also ist es zweckmäßig, einen Wert zwischen dem 4. und dem 5. Wert des geordneten Datenbündels zu bestimmen. Im gleichen Beispiel würde das erste Dezil bestimmt durch die Ordnungsziffer des auf n × p = 1,6 folgenden Wertes, also als 2. Wert im Datenbündel. Tatsächlich sind dann mindestens 10 Prozent der Daten kleiner oder gleich und mindestens 90 Prozent größer oder gleich diesem Wert !
Die Feinheit der Abstufung der Qu.e sollte natürlich passend zu den vorhandenen Daten gewählt werden. Im genannten Beispiel mit16 Datenwerten ist die Bestimmung von Dezilen kaum sinnvoll.
© W. Ludwig-Mayerhofer, ILMES | Last update: 17 Jun 2012