Website
Aktuelles zur Forschung

MLens: wenn Maschinen datenschutzfreundlich lernen

Montag, 26.07.2021

Forschende der Universität zu Lübeck wollen Selbstvermessung datenschutzfreundlicher gestalten

Die Zahl der Menschen, die selbst Messungen vornehmen, um gesundheitsbezogene Daten von sich zu erhalten, hat in den letzten Jahren kontinuierlich zugenommen. Die Selbstvermessungen kommen sowohl für prediktive als auch für präventive Zwecke zum Einsatz, etwa um Herzfrequenzmessungen bei Stress durchzuführen, Trainingszyklen bei Leistungssportlerinnen und -sportlern zu optimieren oder auch für Medikamentenstudien.

Bei vielen dieser Gesundheitsdienstleistungen und Messgeräten kommt Künstliche Intelligenz zur Datenverarbeitung zum Einsatz. Solche digitalen Gesundheitsdienstleistungen benötigen eine große Menge an sensiblen Endnutzerdaten, um maschinell Modelle entwickeln zu können und zu lernen. „Ein verantwortungsvoller Umgang mit medizinischen und persönlichen Daten kann das nötige Vertrauen schaffen, das wir für eine breite Akzeptanz von Gesundheitsapps benötigen“, sagt Prof. Dr. Esfandiar Mohammadi. Er leitet die Arbeitsgruppe Security & Privacy am Institut für IT-Sicherheit der Universität zu Lübeck, welche an privatsphäreerhaltenden Berechnungsverfahren, anonymer Kommunikation und IT-Sicherheit arbeitet.

Eine zentralisierte Datensammlung und modellbasierte Informationsflüsse sind es, die Da-tenschützerinnen und Datenschützern bisher große Sorge bereiten. Das vom BMBF mit rund 650.000 € geförderte Projekt MLens soll deshalb genau hier ansetzen: Ein Kernproblem für klassische Lernverfahren besteht darin, dass Daten zum Lernen zentral gespeichert und verarbeitet werden müssen. Für viele medizinische Anwendungen ist das inakzeptabel. Neueste Arbeiten zeigen darüber hinaus, dass maschinell gelernte Modelle über die erhobenen Trainingsdaten Rückschlüsse auf die Probandinnen und Probanden erlauben. Auch dies ist, insbesondere für medizinische Daten, sehr kritisch.

Neue Technik soll zentralisierte Datensammlungen überflüssig machen

Ziel des Lübecker Projekts „Datenschutzfreundliches Maschinelles Lernen für Endgerät-zentrierte Selbstvermessung“ (MLens) ist es deshalb, Techniken zu entwickeln, die eine zentralisierte Datensammlung überflüssig machen und stattdessen sichere, verteilte maschinelle Lernverfahren einsetzen. Es wird erforscht, wie durch ein initiales Training mit öffentlichen, nicht personenbeziehbaren Daten, verteilte Lernverfahren effizienter und effektiver gestaltet werden können. Um modellbasierte Informationsflüsse möglichst zu verhindern, sollen Daten in der Lernphase gezielt manipuliert (verrauscht) werden. Robuste Statistikverfahren modifizieren die Daten dann so, dass keine Rückschlüsse über die Trainingsdaten möglich sind.Durchgeführt wird das ganze Projekt mit Unterstützung von der Zühlke Engineering GmbH und dem UKSH.

Innovationen und Perspektiven

Die Kerninnovation des Vorhabens liegt darin, zwei wesentliche Hemmnisse bei der Nutzung von sensiblen Daten für maschinelles Lernen auszuräumen. Durch den Einsatz von lokalem Lernen müssen die persönlichen Daten nicht mehr an Dritte übermittelt werden und durch spezielle Lernverfahren lassen sich auch aus dem Gelernten keine Rückschlüs-se aus dem gemeinsam gelernten Modell mehr ziehen. Damit können diese gemeinsam gelernten Modelle unter allen Nutzern geteilt werden. So können Datenschutzbedenken ausgeräumt und medizinische Daten bei der Selbstvermessung genutzt werden. Dadurch wird der Markt für Gesundheitsdienstleistungen in Deutschland gestärkt.