Erster Teil, Kapitel II, § 34
§ 34. Notale Daten und synthetische Daten
Runde 1: kommentierte Arbeitsgliederung, sechster Kapitel-II-Batch
Einordnung im Werk
Kapitel II überführt die Grundbegriffe algorithmisch vermittelten Handelns in eine Wirtschaftssoziologie der KI. Dieser sechste Aufbaugang führt von der formal rationalen Modellrechnung in die Datenordnung selbst: kapitalistische KI-Orientierung, Datenverfassung, Sperrdaten, synthetische Daten, Datengeltung und Datenpolitik werden als zusammenhängende Voraussetzungen algorithmischen Wirtschaftens sichtbar.
Gliederungspunkte
- Notale Daten als vermerkte, aktenförmige und abgeleitete Daten
- synthetische Daten als generierte Ersatz- und Erweiterungsdaten
- Simulation, Anonymisierung und Augmentation
- Validität und Herkunftsunsicherheit
- Gefahr der Rückkopplung in Modellwelten
- wirtschaftliche Nutzung bei Datenknappheit
Kommentierte Ausarbeitung
§ 34 unterscheidet notale und synthetische Daten. Notale Daten sind vermerkte, aktenförmige, abgeleitete oder institutionell notierte Daten: Sie entstehen, wenn Organisationen Sachverhalte in Fälle, Kategorien, Akteneinträge, Tickets, Scores oder Protokolle übersetzen. Sie sind nicht roh, sondern bereits durch Beobachtungszwecke und Verwaltungsroutinen geformt.
Synthetische Daten entstehen demgegenüber durch Simulation, Generierung, Augmentation oder modellbasierte Nachbildung. Sie können Datenknappheit mindern, Datenschutzrisiken reduzieren, seltene Fälle trainierbar machen und Testumgebungen stabilisieren. Zugleich verschieben sie die Frage nach Wahrheit, Herkunft und Geltung: Ein synthetischer Fall kann statistisch brauchbar und sozial irreführend zugleich sein.
Besonders riskant wird die Rückkopplung, wenn Modellwelten mit ihren eigenen Ableitungen weitertrainiert werden und die Grenze zwischen beobachteter, notierter und generierter Wirklichkeit verschwimmt. Der Abschnitt schützt damit die Datensoziologie vor einem naiven Begriff von Daten als Abbild. Er bereitet § 35 vor, in dem formale und materiale Geltung von Daten auseinandergehalten werden müssen.