Über DQ0
Datenschutz made in Europe
Sie können viele verschiedene Datenquellen nutzen.
- CSV, JSON
- HDF5
- Msgpack
- Parquet, Feather, ORC
- SQL
- Binary, Text, Images
- PostgreSQL, MySQL, SQLite
- Oracle, MS SQL
- Apache Drill, Hive
- Snowflake, BigQuery, Redshift
- SAS, SAP Hana
- Trino
Für Daten-Beauftragte
Als SaaS Angebot oder On-Premise
Für Data Scientists
Von Data Scientists für Data Scientists
DQ0 wurde von Data Scientists für Data Scientists entwickelt.
Zusätzlich zur Kernfunktionalität Modelle auf sensiblen Daten zu berechnen bietet DQ0 Werkzeuge zur Model-Versionierung und zur Verwaltung von Experimenten basierend auf dem beliebten Framework mlflow.
DQ0 ist mit allen bekannten Frameworks kompatibel, direkt im DQ0 SDK.
Zustäzlich können Sie die eingebaute Web-Applikation nutzen, um Ihre Projekte, Experimente und Runs zu verwalten und mit Ihren Kollegen und Forschugnspartnern in einer integrierten Entwicklungsplattform für Maschinelles Lernen und SQL Analysen zusammenzuarbeiten.
Sie kommunzieren mit der DQ0 Instanz über
- das frei erhältliche Kommandozeilen-Programm (verfügbar für Linux, Mac und Windows) mit eingebauter Ende-zu-Ende Verschlüsselung
- die integrierte Web-Applikation
- das DQ0 SDK, direkt in Ihrer Jupyter Entwicklungsumgebung
DQ0 SDK
Das DQ0 Software Development Kit ist eine freie Python Bibliothek, mit der Data Scientists einfach und mit ihren bekannten Tools mit DQ0 arbeiten können.
Beispiel zur Verwendung des DQ0 SDK:
# import dq0sdk from dq0sdk.core import Project, Experiment # create a project with name 'model_1'. Automatically creates the 'model_1' directory and changes to this directory. project = Project(name='model_1') # Create experiment for project experiment = Experiment(project=project, name='experiment_1') # Train an model run = experiment.train() # wait for completion run.wait_for_completion(verbose=True) # get training results print(run.get_results()) # get the latest model model = project.get_latest_model() # check DQ0 privacy clearance if model.predict_allowed: # call predict run = model.predict(np.array([1, 2, 3]))
Dokumentation
Mehr Informationen in der DQ0 Dokumentation.
Datenschutz-Technologien
Differential Privacy, Verschlüsselung und Federated Learning
Die DQ0 Anwendungssoftware ist zertifiziert vom TÜV Austria. Außerdem liegt uns ein rechtliches Gutachten vor, welches bescheinigt, dass DQ0 alle Datenschutzgesetze erfüllt.Kontaktieren Sie uns für weitere Informationen.
Wenn vertrauliche Daten von anderen Abteilungen oder externen Gruppen verwendet werden sollen, wird häufig die Methode der Anonymisierung oder Synthetisierung gewählt, um die vertraulichen Informationen zu schützen. Leider ist dies nicht sicher. Es gibt zahlreiche Studien, die gezeigt haben, dass geheime Informationen auch aus vermeintlich völlig anonymen Datensätzen gewonnen werden können.
Rocher, L., Hendrickx, J.M. & de Montjoye, Y. Estimating the success of re-identifications in incomplete datasets using generative models. Nat Commun 10, 3069 (2019). https://www.nature.com/articles/s41467-019-10933-3
Insbesondere das Maschinelle Lernen stellt den Datenschutz vor große Herausforderungen. Spezielle Machine Learning Modelle können verwendet werden, um schützenswerte Informationen über einzelne Datensätze zu erhalten. DQ0 implementiert daher ein robustes Sicherheitskonzept, das auf dem Prinzip der Differential Privacy basiert. So ermöglicht DQ0 mittels AI-Modellierung die Erlangung von Aussagen über die Gesamtheit der Daten bei gleichzeitigem Schutz einzelner Datenpunkte.
Mit DQ0 können datenwissenschaftliche Analysen durchgeführt werden, um allgemeine Informationen zu den verwendeten Datensätzen abzurufen, ohne einzelne Datenpunkte zu gefährden. Es kann eine nützliche allgemeine Aussage wie "Wenn die Eigenschaften a und b vorhanden sind, hat die betreffende Therapie eine Heilungswahrscheinlichkeit von p" formuliert werden; Aussagen, die datenschutzrechtlich nicht erlaubt sind, wie "aufgrund des Vorhandenseins der Eigenschaften a und b musss Patient x im Datensatz enthalten sein" sind nicht möglich.
Weitere Informationen über Differential Privacy:
- Differential Privacy: A Primer for a Non-technical Audience
- The Algorithmic Foundations of Differential Privacy
Weitere Informationen zu Federated Learning: