Dotplot, Dotchart
Unter Dotplot können in der sozialwissenschaftlichen Statistik zwei verschiedene Graphiken verstanden werden: (a) Solche, die die Werte eines Datenbündels möglichst vollständig repräsentieren und dabei auch deren Verteilung näherungsweise erkennen lassen; (b) solche, die entweder Einzelwerte zusammen mit identifzierenden Labeln oder bestimmte Kennwerte (Statistiken) in Form von Punkten repräsentieren. Die zweite Art wird manchmal als »Cleveland Dotplot« bezeichnet, nach dem Statistiker und Visualisierungs-Experten William S. Cleveland, der diese Art von Graphik in seinem Buch Visualizing Data (Hobart Press, 1983) sehr häufig einsetzte. Es finden sich aber auch Publikationen, die pauschal dem »Dotplot« gewidmet sind, ohne erkennen zu lassen, dass sie nur von Cleveland Dotplots handeln (etwa Jacoby 2006).
In der Bioinformatik werden als Dot Plots (oder Dotplots) Verfahren bezeichnet, mittels derer sich biologische Sequenzen vergleichen lassen. Diese Plots werden hier nicht behandelt.
Dotplots zur Repräsentierung von Datenpunkten und ihrer Verteilung
Dieser Dotplot hat inhaltlich große Ähnlichkeit mit einem Histogramm: Die Daten werden (meist) in gleich breite Klassen eingeteilt; innerhalb einer Klasse werden die Datenwerte als Punkte übereinander abgetragen. Bei einem Histogramm würde die Zahl (oder der Anteil) der Datenwerte in Form einer Säule gezeichnet.
Das folgende Diagramm zeigt eine (nach echten Daten simulierte) Verteilung von Haushaltsäquivalenzeinkommen. Es ist eine deutliche Häufung der Werte im Bereich um 2.000 Euro und etwas darüber zu sehen; ein zweiter, kleinerer Schwerpunkt liegt zwischen 1.000 und 1.500 Euro (wobei die Grenzen der jeweiligen Bereiche aus der Graphik infolge der Klasseneinteilung nicht gut zu erkennen sind). Das Diagramm hätte auch um 90 Grad nach links gedreht gezeigt werden können; dies entspräche dem klassischen Histogramm. Allerdings wären dann, anders als bei diesem, die höchsten Werte links und die niedrigsten Werte rechts abgetragen.
Das nächste Diagramm zeigt die gleichen Daten, aber in Abhängigkeit von der Bildung der Befragten.
Wilkinson (1999) schlägt vor, Dotplots, bei denen die Daten in Klassen oder Gruppen eingeteilt werden, wegen ihrer Verwandtschaft mit dem Histogramm als »Histodot plot« zu bezeichnen. Genuine Dotplots kommen seiner Auffassung nach ohne solche Einteilungen (engl. »binning«) aus, zeigen also die Punkte möglichst exakt dort auf der Achse, wo sie auftreten (mit kleinen Verschiebungen, falls mehrere Datenwerte identisch sind). Soweit ersichtlich werden in den meisten Statistikpaketen jedoch Dotplots mit Klasseneinteilungen erzeugt.
Siehe auch: Beanplot, Beeswarm-Plot, Box-and-Whisker-Plot, Sinaplot, Stripplot, Stem-and-Leaf-Diagramm, Violinenplot.
Cleveland Dotplots
Dieser Typ wurde von Cleveland hauptsächlich eingesetzt, um die Einzelwerte aus kleineren Datensätzen zu visualisieren, etwa um sie auf Auffälligkeiten oder mögliche Zusammenhänge explorativ zu untersuchen. Zu diesem Zweck werden die einzelnen Werte (meist mit identifizierenden Etiketten) abgetragen, wobei je nach Erkenntnisinteresse unterschiedliche Anordnungen möglich sind. Statt Einzelwerten können auch Kennwerte wie etwa Mittelwerte, Quantile oder andere Größen abgetragen werden, u. U. auch mehrere Kenngrößen pro Untersuchungseinheit
Die folgende Graphik zeigt Daten der OECD zur Erwerbstätigkeit von Frauen (im Alter zwischen 25 und 49 Jahren) aus dem Jahr 2007 für ausgewählte Länder (siehe Ludwig-Mayerhofer et al. 2014, S. 51); die Daten sind hier der Größe nach geordnet, es wäre aber z. B. auch eine alphabetische Anordnung möglich.
Literatur
- Jacoby, William G. (2006): The Dot Plot: A Graphical Display for Labeled Quantitative Values, The Political Methodologist. Newsletter of the Political Methodology Section, American Political Science Association, Vol. 14, Number 1, pp. 6-14.
- Ludwig-Mayerhofer, Wolfgang/Liebeskind, Uta/Geißler, Ferdinand (2014): Statistik. Eine Einführung für Sozialwissenschaftler, Weinheim, Basel: Beltz Juventa.
- Wilkinson, Leland (1999): Dot plots, The American Statistician, Vol. 53, No. 3, pp. 276-281.
© W. Ludwig-Mayerhofer, ILMES | Last update: 14 Apr 2025