Sinaplot

Ein Sinaplot repräsentiert sämtliche Werte einer metrischen Variablen und soll dabei zugleich visuell deren Dichteverteilung andeuten. Dazu werden die Datenwerte auf einer Achse abgetragen, dabei aber in Intervalle eingeteilt. Innerhalb dieser Intervalle werden sie um die Achse herum ge»jittert«, d. h., mit Zufallszahlen überlagert. Diese Zufallszahlen haben einen umso größeren Wertebereich, je größer die Zahl der Werte innerhalb eines Intervalls ist, so dass die Punkte in solchen Intervallen eine breitere Wolke bilden. Der Sinaplot soll die Vorzüge von Stripplots oder Dotplots (es werden die einzelnen Datenwerte [annähernd] gezeigt) mit denen von Plots vereinigen, die die Dichteverteilung zeigen, wie Violinenplots oder Beanplots. Im Unterschied zu diesen kann bei Gruppenvergleichen die Breite der einzelnen Plots unterschiedlich sein und so besser unterschiedliche Gruppengrößen repräsentieren.

Das folgende Diagramm zeigt eine (nach echten Daten simulierte) Verteilung von Haushaltsäquivalenzeinkommen. Es ist eine deutliche Häufung der Werte im Bereich um 2.000 und bis zu 2.700 Euro zu sehen.

Sina-Plot

Sinaplots eignen sich auch gut für den Vergleich von Gruppen (hier wird das Äquivalenzeinkommen in Abhängigkeit vom Bildungsgrad der Befragten gezeigt). Insbesondere lässt sich an der größeren Breite des Plots für die Gruppe mit mittlerer Bildung ablesen, dass diese Gruppe mehr Fälle als die beiden anderen enthält.

Sina-Plot, drei Gruppen

Siehe auch: Stem-and-Leaf-Diagramm, Beeswarm-plot, Box-and-Whisker-Plot.

Literatur:

  • Nikos Sidiropoulos, Sina Hadi Sohi, Thomas Lin Pedersen, Bo Torben Porse, Ole Winther, Nicolas Rapin & Frederik Otzen Bagger: SinaPlot: An Enhanced Chart for Simple and Truthful Representation of Single Observations Over Multiple Classes, Journal of Computational and Graphical Statistics, 27:3, 673-676, 2018 DOI: 10.1080/10618600.2017.1366914

© W. Ludwig-Mayerhofer, ILMES | Last update: 23 Feb 2025