Mit DQ0 bleibt der Datenbestand unverändert. Nichts wird geschwärzt, anonymisiert, synthetisiert oder pseudonymisiert. Die Daten bleiben zur Gänze vorhanden. Auch muss niemand mit der Anonymisierung oder Pseudonymisierung oder mit ähnlichen Verfahren beauftragt werden.
Modellrechnungen auf Basis dieser Daten haben – weil die Daten nicht verändert wurden – eine höhere Qualität.
Anwender bekommen zwar Zugang zu Daten hoher Güte, aber nicht zu jenen Informationen, die dem Datenschutz unterliegen.
Standardsystem schützen nicht ausreichend
General steht der Datenschutz bei Datenabfragen vor einer zentralen Frage: Wie kann im Zuge einer Datenabfrage die Qualität der Antwort möglichst hoch und gleichzeitig der Abfluss von schützenswerten Informationen aus den Daten möglichst gering gehalten werden?
Beliebte Methoden, um sensible Daten Dritten für wissenschaftliche Zwecke zur Verfügung zu stellen, sind Anonymisierung, Pseudonymisierung oder Synthetisierung. Bei diesen Ansätzen sinkt die Analysequalität und die Daten werden verändert, um die Informationen zu schützen.
Hinzu kommt: Zahlreiche Studien und Fälle haben gezeigt, dass diese Maßnahmen die privaten Informationen nicht ausreichend schützen.
Fortschrittlichster Ansatz
Die DQ0 Datenquarantäne arbeitet dagegen nach der wissenschaftlich fortschrittlichsten Methode, der Differential Privacy. Die Quarantäne schließt die Daten sicher ein und erlaubt eine Analyse, ohne die Daten selbst zu manipulieren. Lediglich die Antwort zu Datenabfragen wird so verändert, dass die die Informationen in den Daten schützt. Die Modelle werden bei den Daten trainiert und nur geprüfte, allgemeingültige Informationen verlassen die Datenquarantäne; so sind zu keinem Zeitpunkt Rückschlüsse auf einzelne Personen oder geheime Einzelinformationen möglich.
Kombination mit dem AFI Anonymizer
Der AFI Anonymizer kann innerhalb der DQ0 Plattform angewendet werden. Somit sind die Eingangsdaten optimal durch DQ0 geschützt, und der Dateneigentümer kann die durch den AFI Anonymizer anonymisierten oder pseudonymisierten Daten nach Prüfung zur öffentlichen Verwendung freigeben.
Lokal oder remote
Anwender können mit DQ0 lokal oder remote arbeiten. Für den lokalen Modus muss das SDK installiert werden.
Damit können Anwendungen für maschinelles Lernen verfasst werden, die dann in der Enklave sicher verarbeitet werden. Für den Remote-Modus muss sich der Nutzer mit der Proxy verbinden.
Die Software wird ohne Daten ausgeliefert, die Entwicklung erfolgte mit anwendungstypischen Testdaten.