Datenkorpus (engl.: Data Corpus)

1. Als Datenkorpus (Geschlecht: Neutrum, also: das D.; Plural: Datenkorpora) wird in der qualitativen Sozialforschung manchmal die Gesamtheit der einem Forschungsprojekt zugrundeliegenden Daten bezeichnet. Diese Sprachgebrauch folgt den Text- und Literaturwissenschaften (und anderen Kulturwissenschaften, die sich vor allem mit Texten befassen), wo meist eine Sammlung von auszuwertenden Texten als Textkorpus bezeichnet wird.

Da der Begriff Textkorpus in den entsprechenden Wissenschaften ein Standardbegriff ist, lernen dort alle Studierenden, dass es korrekt das Textkorpus heißt. Beim Export in die Sozialwissenschaften scheint das Wissen um das grammatikalische Geschlecht des Begriffs Korpus jedoch nicht immer mittransportiert zu werden, und ein eigenständiges Erschließen des Geschlechts kann angesichts des Schwindens von Lateinkenntnissen unter Hochschulzugangsberechtigten nicht mehr erwartet werden, so dass der Begriff Datenkorpus nicht selten mit männlichem anstelle des korrekten sächlichen anaphorischen Artikels verwendet wird.

2. In der Anwendung sog. Künstlicher Intelligenz werden Datenkorpora, d.h., dem Anwendungsgebiet entsprechende Materialien, zum »Lernen« eingesetzt. Der Algorithmus »lernt« beispielsweise an einer großen Menge von Bildern, das Geschlecht, das Alter, den Gefühlszustand oder andere Eigenschaften von Personen zu »erkennen« und dann dieses »Wissen« bei neuen und nicht mit den entsprechenden Informationen versehenen Bildern einsetzen zu können.

© W. Ludwig-Mayerhofer, ILMES | Last update: 12 Dec 2020