Differential Privacy: Eine Rechnung, die aufgeht

Nils Klute Unkategorisiert 5. März 2020

Ein Beitrag von Nils Klute – Referent und Projekt Manager IoT beim eco Verband der Internetwirtschaft e.V.:

Maschinen warten und Menschen heilen – KI macht es möglich. Was hierzulande aber oft fehlt, um intelligente Algorithmen zu trainieren, ist die Datenbasis. Ob Industrieservice oder Krebsdiagnose: Ein mathematisches Verfahren soll die steigende Nachfrage nach Datentausch und Datenschutz in Einklang bringen.

Europa hat ein Big Data-Problem. Industrie und Wissenschaft fehlt hierzulande die Informationsgrundlage. Eine Grundlage, die notwendig ist, um etwa künstlich intelligente (KI) Algorithmen zu trainieren. Algorithmen, wie sie der Medizin helfen, Menschen zu heilen. „Wenn tausende Patienten mit Diabetes, Krebs oder Demenz ihre Daten verfügbar machten, könnten wir daraus lernen“, sagte Gesundheitsminister Jens Spahn im Januar 2020 auf der Innovationskonferenz DLD, wie das Ärzteblatt berichtet.

Märkte kippen, Datenmonopole drohen

Was dem Wunsch der Mediziner im Wege steht, ist der berechtigte Schutz personenbezogener Daten. Gerade Gesundheitsinformationen gelten hierzulande als besonders sensibel und damit besonders schützenswert. Anders die Situation in USA und Asien. Hier sammeln und aggregieren Plattformen wie Google, Amazon und Alibaba massenhaft Informationen über ihre Nutzer. Der Schutz personenbezogener Daten, wie ihn etwa die Datenschutz-Grundverordnung (DSGVO) regelt, ist in Übersee zweitrangig. Die Folge: Märkte kippen in Richtung großer Plattformbetreiber. Datenmonopole drohen, die Wettbewerb und Innovation ausbremsen, wie eine Studie des Instituts der deutschen Wirtschaft aus dem Jahr 2019 zeigt.

Industriedaten austauschen, Algorithmen trainieren

Nicht anders die Situation in der Industrie. Wer Liefernetzwerke, Wartungsservices oder Produktionsprozesse mit KI optimieren möchte, braucht jede Menge Daten. Die neue EU-Digitalstrategie soll der Wirtschaft die Lösung bringen. Anfang 2020 hat die EU-Kommission ihre Idee präsentiert: Informationen sollen sich über Datenpools einfacher austauschen lassen, um KI-Algorithmen schneller trainieren zu können. Zugleich sollen hiesige Firmen unabhängiger von großen Plattformen werden. Denn: „Je mehr Daten wir haben, desto klüger werden unsere Algorithmen“, sagte EU-Kommissionschefin Ursula von der Leyen auf Tagesschau.de.

Eine Idee, die in der Industrie keinesfalls neu ist, wie beispielsweise die 2015 als Forschungsprojekt gestartete Initiative International Data Spaces der Fraunhofer-Gesellschaft zeigt. Oder eine Studie von PricewaterhouseCoopers aus dem Jahr 2017, laut der bereits 74 Prozent aller mittleren und großen Firmen hierzulande Daten mit Kunden, Lieferanten und Geschäftspartnern teilen. „Bei dieser Entwicklung steht die Wirtschaft allerdings vor einem Dilemma“, sagte Harald Kayser, Chief Digital Officer auf pwc.de. „Einerseits ist der Austausch von Daten unumgänglich, wenn Unternehmen das eigene Geschäftsmodell digitalisieren und neue Erlösquellen wie Smart Services erschließen wollen. Andererseits möchte niemand Gefahr laufen, die Kontrolle über sensible Unternehmensdaten zu verlieren.“

Ungenaue KI-Prognosen, ungenutzte Wertschöpfungspotentiale

Egal, ob Kontrollverlust, Herstellerinteressen oder Vertraulichkeiten – was auch immer industrielle Informationsflüsse bremst, lässt Chancen am Ende ungenutzt. Zwar sammelt die Industrie beispielsweise Nutzungs-, Wartungs- und Qualitätsdaten in unterschiedlichen IT-Systemen, um sie lokal auszuwerten. Aber Daten, die Systemzustände über mehrere Anlagen und unterschiedliche Anwender hinweg erfassen, gehören zumeist nicht dazu. Das Ergebnis: ungenaue KI-Prognosen und ungenutzte Wertschöpfungspotentiale. Die Lösung des Dilemmas könnte jetzt ein bisher kaum eingesetztes Verfahren bringen: Differential Privacy.

Mit Mathematik bringt Differential Privacy die steigende Nachfrage nach Datentausch und Datenschutz in Einklang. Eine Rechnung, die für Maschinen- und Personendaten gleichermaßen aufgehen kann. Denn mit dem Verfahren lassen sich Big Data-Sammlungen gezielt verrauschen – ohne die statistische Aussagekraft zu verlieren. Dazu gruppiert und aggregiert Differential Privacy Informationen – und verschleiert so individuelle Merkmale von Menschen, Anlagen und Geräten. Bleiben sensible Daten derart sicher, lassen sich Informationen tauschen und zugleich Interessen von Einzelpersonen und Herstellern schützen.

Anfang 2020 ist erstmals ein deutsches Projekt gestartet, wie Tagesspiegel.de berichtet, das die Möglichkeiten von Differential Privacy untersuchen soll. Die TU München entwickelt eine Software und untersucht die technischen, ökonomischen und politischen Auswirkungen der Methode. Wichtigste Kernanforderung: Keinesfalls darf sich die Verschleierung zurückrechnen lassen.

KI vollumfänglich einsetzen, volkswirtschaftlich profitieren

Datensilos aufbrechen, Krebstherapien beschleunigen, Interessen von Wirtschaft und Gesellschaft gleichermaßen wahren und die Entwicklung von KI-Anwendungen in Deutschland und Europa nach vorn bringen – Differential Privacy kann ein Schlüssel zur Lösung sein. Das sich die Sache lohnt, zeigt eine aktuelle Studie des eco Verbands: Werden KI-Technologien industrieübergreifend und vollumfänglich eingesetzt, lässt sich – allein für Deutschland – ein volkswirtschaftliches Gesamtpotential von rund 488 Milliarden Euro freisetzen.

Bleiben Sie mit unserem Newsletter zum Thema KI und zum Projekt Service-Meister auf dem laufenden.

Über Nils Klute

Nils Klute ist IT-Fachredakteur. Egal, ob für IT-Medien wie heise.de, zdnet.de und silicon.de, für IT-Unternehmen wie SAP, T-Systems und Sony oder für B2B-Agenturen wie Palmer Hargreaves, Pleon Kohtes Klewes (heute Ketchum) und rheinfaktor – Nils Klute schreibt und spricht seit mehr als 15 Jahren über die Themen, die die IT- und Digitalwirtschaft bewegen. Von der Datenwirtschaft mit Gaia-X über Künstliche Intelligenz im Mittelstand bis hin zu Cloud-Native-Technologien - als Projektmanager Kommunikation Cloud Services ist er bei EuroCloud Deutschland_eco e.V. für das Content Marketing rund um die Themen des Verbands verantwortlich. Zudem unterstützt er KI-Projekte wie Service-Meister und Initiativen wie EuroCloud Native, Channel2Cloud oder EuroCloud Next Leaders mit Blogbeiträgen, Namensartikeln, Interviews, Pressemitteilungen, Konzepten und Strategien. Beruflich wie privat ist er auf LinkedIn und Twitter unterwegs.