Clusteranalyse (engl.: Cluster Analysis)

Unter C. versteht man eine Gruppe von Verfahren, Fälle (Untersuchungsobjekte) hinsichtlich ihrer Ähnlichkeit einzustufen und dann Gruppen (Cluster) von untereinander möglichst ähnlichen Fällen zu bilden.

Die Ähnlichkeit der Fälle wird durch Distanzmaße gemessen. Aus der Distanzmatrix werden dann die Cluster gebildet, wobei ebenso wie schon bei den Distanzmaßen eine Auswahl aus einer relativ großen Zahl von Verfahren getroffen werden muss. Die Verfahren sind teils partitionierend (sie gehen aus von der Gesamtheit der Fälle und bilden möglichst homogene Untergruppen), häufiger werden jedoch agglomerierende Verfahren verwendet, bei denen ausgehend von den einzelnen Fällen zunehmend ähnliche Fälle ›angelagert‹ werden, bis am Schluss einige wenige Cluster übrig bleiben. An dieser Stelle ist im allgemeinen noch festzulegen, wieviele Cluster man als ›sinnvolle‹ Einteilung akzeptiert.

Die Entscheidungen über die Wahl des Distanzmaßes, des Clusterungsverfahrens und der Zahl der Cluster sollte möglichst unter theoretischen Gesichtspunkten getroffen werden. Faktisch ist zumeist (mit Ausnahme vielleicht der Distanzmaße) das theoretische Vorwissen nicht ausreichend, so dass häufig ad hoc argumentiert werden muss. Dennoch haben sich C.n zu Recht als wichtiges exploratives Verfahren etabliert.

Literatur:

  • Bacher, Johann: Clusteranalyse. München, Wien: Oldenbourg, 1996 (2. Aufl.)

© W. Ludwig-Mayerhofer, ILMES | Last update: 30 Dec 1999