Scientific Use Files

So genannte SUFs sind Datensätze, die über den ursprünglichen Nutzerkreis hinaus der wissenschaftlichen Forschung zur Verfügung stehen.
Nach dem Bundesstatistikgesetz von 1987 können anonymisierte Individualdatenfiles der amtlichen Statistik durch die statistischen Ämter als so genannte faktisch anonymisierte Daten an die Forschung weitergegeben werden.

Nach §16 Abs. 6 dieses Gesetzes gilt ein Datensatz dann als faktisch anonym, wenn der potentielle "Datenangreifer" aus rationalem Kalkül die Kosten der De-Anonymisierung höher einschätzen würde als den Nutzen, den er aus einem erfolgreichen "Angriff" erwartet; wenn also eine Identifizierung der Untersuchungseinheiten nur mit einem unvertretbar großen Aufwand möglich wäre. Demnach entscheidet über Anonymität nicht eine technische Größe, sondern es wird auf Basis einer ökonomischen Kosten-Nutzen-Analyse entschieden, ob ein Datensatz als faktisch anonym gelten kann. Bei faktischer Anonymisierung besteht also ein gewisses Restrisiko der De-Anonymisierung.

SUFs können ausschließlich durch Hochschulen oder sonstige Einrichtungen mit der Aufgabe unabhängiger wissenschaftlicher Forschung und den dort beschäftigten Wissenschaftlern genutzt werden. Dabei ist zu beachten, dass SUFs nach dem Inländerkonzept derzeit nur inländischen Forschungseinrichtungen zur Verfügung gestellt werden.

Beispielsweise ist das Mikrozensus Scientific Use File eine faktisch anonymisierte 70-Prozent-Substichprobe des Original-Mikrozensus. Die Daten gelten deshalb als faktisch anonymisiert, weil ein "Datenangreifer", der vermutet, dass die Daten einer bestimmten Person im Mikrozensus enthalten sind, nicht wissen kann, ob sich diese Person auch in der Substichprobe befindet.

Siehe auch: Public Use Files.

© R.Christian, W. Ludwig-Mayerhofer | Last update: 30 Sep 2005