Ressourcen

DQ0 ist eine Plattform für datenschutzkonformes Maschinelles Lernen. Erfahren Sie hier mehr über die Grundlagen von DQ0 und die Anwendung aus Sicht der Datenbeauftragten und Analysten.

weiterlesen

DQ0 Quarantine

Über DQ0

DQ0 ist eine Plattform für sichere Datenhaltung und -verarbeitung. Datensätze, welche sensible Informationen wie personenbezogene Daten oder Geschäftsgeheimnisse enthalten, werden mit DQ0 in einer sicheren Daten-Enklave gespeichert. Gleichzeitig sorgt DQ0 dafür, dass diese Daten sicher für Analysen genutzt werden können.

Die DQ0 Anwendungssoftware ist zertifiziert vom TÜV Austria. Außerdem liegt uns ein rechtliches Gutachten vor, welches bescheinigt, dass DQ0 alle Datenschutzgesetze erfüllt.Kontaktieren Sie uns für weitere Informationen.

Wenn vertrauliche Daten von anderen Abteilungen oder externen Gruppen verwendet werden sollen, wird häufig die Methode der Anonymisierung gewählt, um die vertraulichen Informationen zu schützen. Leider ist die Anonymisierung der Daten nicht sicher. Es gibt zahlreiche Studien, die gezeigt haben, dass geheime Informationen auch aus vermeintlich völlig anonymen Datensätzen gewonnen werden können.

Rocher, L., Hendrickx, J.M. & de Montjoye, Y. Estimating the success of re-identifications in incomplete datasets using generative models. Nat Commun 10, 3069 (2019). https://www.nature.com/articles/s41467-019-10933-3

Insbesondere das Maschinelle Lernen stellt den Datenschutz vor große Herausforderungen. Spezielle Machine Learning Modelle können verwendet werden, um schützenswerte Informationen über einzelne Datensätze zu erhalten. DQ0 implementiert daher ein robustes Sicherheitskonzept, das auf dem Prinzip der Differential Privacy basiert. So ermöglicht DQ0 mittels AI-Modellierung die Erlangung von Aussagen über die Gesamtheit der Daten bei gleichzeitigem Schutz einzelner Datenpunkte.

Mit DQ0 können datenwissenschaftliche Analysen durchgeführt werden, um allgemeine Informationen zu den verwendeten Datensätzen abzurufen, ohne einzelne Datenpunkte zu gefährden. Es kann eine nützliche allgemeine Aussage wie "Wenn die Eigenschaften a und b vorhanden sind, hat die betreffende Therapie eine Heilungswahrscheinlichkeit von p" formuliert werden; Aussagen, die datenschutzrechtlich nicht erlaubt sind, wie "aufgrund des Vorhandenseins der Eigenschaften a und b musss Patient x im Datensatz enthalten sein" sind nicht möglich.

Weitere Informationen über Differential Privacy:

Für Datenbeauftragte

DQ0 ist verfügbar als

  • eine verwaltetet Software as a Service (Saas) Lösung in der privaten Cloud, oder
  • On-premise Version, installiert direkt "vor" Ihren Daten

Sie können eine Vielzahl unterschiedlicher Datenquellen verwenden.

Formate:
  • CSV
  • JSON
  • HDF5
  • Msgpack
  • Parquet
  • Feather
  • ORC
  • Excel
  • SQL
  • Images
  • Text
  • Binary
Konnektoren:
  • PostgreSQL
  • MySQL
  • SQLite
  • Oracle
  • MS SQL
  • Apache Drill
  • Hive
  • Snowflake
  • Google BigQuery
  • Amazon Redshift
  • SAS
  • SAP Hana

Mit DQ0 werden alle Vorgänge auf den Daten in der sicheren Datenquarantäne, innerhalb Ihrer sicheren Umgebung, ausgeführt. Die DQ0-Plattform bietet verschiedene Optionen für die Durchführung der Berechnungen zur einfachen Integration in Ihre IT.

Als Datenbeauftragter haben Sie mit DQ0 immer die volle Kontrolle über die Verwendung Ihrer Daten. DQ0 bietet eine eigene Schnittstelle zur Verwaltung des Datenzugriffs sowie zur Verwaltung von Benutzern und Modellen. Diese Schnittstelle ist als Befehlszeilentool und als Webanwendung enthalten.

Alle Vorgänge, die auf Ihren Daten ausgeführt werden, werden von DQ0 (datenschutzkonform) protokolliert, sodass Sie jederzeit vollständige Audits durchführen können.

DQ0 bietet Dateneigentümern eine vollständig transparente Ansicht aller Aktivitäten auf Ihren Daten. Dateneigentümer können die von DQ0 verwalteten Datenschutzeinstellungen für jeden Datensatz anpassen und Datennutzern jederzeit den Zugriff gewähren oder sperren.

Darüber hinaus ist der externe Zugriff auf Ihre DQ0-Instanz für höchste Informationssicherheit vollständig Ende-zu-Ende verschlüsselt.

Für DatenwissenschaftlerInnen

DQ0 wurde von DatenwissenschaftlerInnen für DatenwissenschaftlerInnen entwickelt. Neben der Funktionalität der Berechnung von Modellen auf geschützten Daten bietet DQ0 praktische Features für die Modellversionierung sowie für die Parametrisierung und Verwaltung Ihrer Experimente.

Sie können mit DQ0 kommunizieren über:

  • das frei verfügbare Kommandozeilienprogramm (erhältlich für Linux, Mac und Windows) mit eingebauter Ende-zu-Ende Verschlüsselung
  • die integrierte Web-Anwendung
  • das DQ0 SDK, direkt in Ihrer Jupyter Entwicklungsumgebung

DQ0 Data Science Dashboard

DQ0 SDK

Das DQ0 Software Development Kit ist eine Python-Bibliothek, mit der DatenwissenschaftlerInnen einfach und mit bekannten Tools mit DQ0 arbeiten können. Das SDK ist frei verfügbar: https://github.com/gradientzero/dq0-sdk

Beispiel für die Arbeit mit dem DQ0 SDK:

# import dq0sdk
from dq0sdk.core import Project, Experiment

# create a project with name 'model_1'. Automatically creates the 'model_1' directory and changes to this directory.
project = Project(name='model_1')

# Create experiment for project
experiment = Experiment(project=project, name='experiment_1')

# Train an model
run = experiment.train()

# wait for completion
run.wait_for_completion(verbose=True)

# get training results
print(run.get_results())

# get the latest model
model = project.get_latest_model()

# check DQ0 privacy clearance
if model.predict_allowed:
    # call predict
    run = model.predict(np.array([1, 2, 3]))

Beachten Sie auch das Quickstart Notebook mit detaillierten Beispielen: https://github.com/gradientzero/dq0-sdk/blob/master/dq0sdk/cli/DQ0SDK-Quickstart.ipynb