Big Data, Privacy by Design und das "Positive Sum" Paradigma
michael.goldbeck.uni-linz, 15. Oktober 2015, 12:27
Das Thema “Privatsphäre” ist in aller Munde. Seit der Veröffentlichung des größten Überwachungsskandals aller Zeiten durch den ehemaligen Mitarbeiter eines National Security Agency (NSA) Partners, Edward Snowden, wurde das Ausmaß der globalen Überwachung auch der breiten Masse bewusst - und zu einem der größten Streitpunkte unserer Zeit [Q1]. Aber nicht nur Geheimdienste und der Staat saugen täglich an unseren Daten - vor allem große Konzerne wie Google, Facebook oder Microsoft sind am “Öl des 21.Jahrhunderts” [Q2] interessiert. Der Chairman von Alphabet, Eric Schmidt, hielt im Jahr 2010 bei der Techonomy Conference in Lake Tahoe etwas sehr beeindruckendes fest:
“[t]here was 5 exabytes of information created between the dawn of civilization through 2003, but that much information is now created every two days, and the pace is increasing.” [Q3]
Jede Sekunde werden sie mehr. Diese Masse an Daten - darunter auch personenbezogene Daten - nimmt in der Informationsgesellschaft eine zentrale Rolle ein; und hat damit große Auswirkungen auf die Privatsphäre des Individuums, wie das erst kürzlich ergangene Urteil des EuGH zum “Safe Harbor” Abkommen zeigt [Q4]. Doch nicht “nur” die Privatsphäre ist von “Big Data” betroffen - durch die Analyse großer Datenmengen entsteht eine Informationsasymmetrie zugunsten der Internet-Giganten; so wird aus “Transparenz” der gläserne Bürger.
In dem von mir ausgewählten Paper “Privacy by Design in the Age of Big Data” von Ann Cavoukian und Jeff Jonas wird wird das Thema “Privatsphäre” mit “Big Data Analysen” gegenübergestellt - mit einem Ausblick einer Lösung der aktuellen Herausforderungen.
Privacy by Design in the Age of Big Data
Das Paper “Privacy by Design in the Age of Big Data” von Ann Cavoukian, der Informationsfreiheits- und Datenschutzbeauftragten der kanadischen Provinz Ontario, und Jeff Jonas, IBM Fellow und Chief Scientist von Context Computing, demonstriert wie Privatsphäre und Verantwortung im Zeitalter von Big Data Analysen avanciert werden können. Die AutorInnen definieren “Big Data” wie folgt:
The term “Big Data” refers to datasets whose size is beyond the ability of typical database software tools to capture, store, manage, and analyze [Q5]. But as technological advances improve our ability to exploit Big Data, potential privacy concerns could stir a regulatory backlash that would dampen the data economy and stifle innovation [Q6].
Big Data Technologien beschreiben eine neue Generation von Technologien und Architekturen, die dazu entworfen wurden, um ökonomischen Wert aus großen Mengen verschiedenster Daten zu schaffen [Q7]. Damit sind die heutigen Daten die Rohstoffe für zukünftige Innovationen. Gerade für Unternehmen sind diese Daten viel wert: mit vielen Informationen über bestehende oder potenzielle Kunden lässt sich ein nahezu holistisches Bild der Kunden zeichnen.
Auch wenn natürlich Innovationen durch Big Data Analysen gefunden werden können, es bleibt die Frage nach Privatsphäre offen. Durch große Datenmengen und deren Zusammenhänge lassen sich Erkenntnisse finden, die gegen den Kunden verwendet werden könnten: z.B. kann es für eine Bank durchaus relevant sein, in welchen Beziehungen der Kunde mit der Bank und anderen Kunden steht - aber auch, welche Reichweite diese Personen z.B. auf Social Networks wie Facebook oder Twitter haben. Desto mehr Daten sich aus verschiedensten Quellen um ein Individuum sammeln, desto höher die Wahrscheinlichkeit, dass dessen private Identität gefährdet wird - auch eine Anonymisierung der Daten kann davor nicht schützen [Q8].
Daher empfehlen Cavoukian und Jonas Unternehmen, die vom technologischen Wandel und der “Big Data Revolution” profitieren wollen, einen Schritt zurück zu machen und abzuwägen, welche Entwicklungsentscheidungen Sicherheit und Privatsphäre stärken können. Werden potenzielle Implikationen der Privatsphäre möglichst früh miteinbezogen, können Entwickler auf diese Rücksicht nehmen und Privatsphäre schonende Eigenschaften direkt im System integrieren: Privacy by Design.
Jeff Jones macht daher folgende sieben Vorschläge für EntwicklerInnen von Big Data Systemen, die die Privatsphäre von Individuen schützen sollen:
-
FULL ATTRIBUTION: Every observation (record) needs to know from where it came and when. There cannot be merge/purge data survivorship processing whereby some observations or fields are discarded.
-
DATA TETHERING: Adds, changes and deletes occurring in systems of record must be accounted for, in real time, in sub-seconds.
-
ANALYTICS ON ANONYMIZED DATA: The ability to perform advanced analytics (including some fuzzy matching) over cryptographically altered data means organizations can anonymize more data before information sharing.
-
TAMPER-RESISTANT AUDIT LOGS: Every user search should be logged in a tamper-resistant manner — even the database administrator should not be able to alter the evidence contained in this audit log.
-
FALSE NEGATIVE FAVORING METHODS: The capability to more strongly favor false negatives is of critical importance in systems that could be used to affect someone’s civil liberties.
-
SELF-CORRECTING FALSE POSITIVES: With every new data point presented, prior assertions are re-evaluated to ensure they are still correct, and if no longer correct, these earlier assertions can often be repaired — in real time.
-
INFORMATION TRANSFER ACCOUNTING: Every secondary transfer of data, whether to human eyeball or a tertiary system, can be recorded to allow stakeholders (e.g., data custodians or the consumers themselves) to understand how their data is flowing.
Das "Positive Sum" Paradigma
Ich schließe mich den Autoren des Papers an: Big Data hat das Potenzial, enormen Wert für die Gesellschaft zu generieren - sei es technologischer, wirtschaftlicher oder wissenschaftlicher Natur. Es handelt sich jedoch um ein zweischneidiges Schwert: so wichtig der Fortschritt in diesen Disziplinen auch ist, Nachteile für die Gesellschaft und Untergrabung hart erkämpfter Menschenrechte sollten nicht einfach hingenommen werden.
Liest man über die Entwicklungen rund um das Web, könnte man fast zum Schluss kommen, es wäre bereits tot. Als Medium der Vielfalt und Freiheit gefeiert, verkam es in den letzten Jahren immer mehr zum Schaufenster der Giganten. Getrieben durch den Netzwerkeffekt werden die größten Dienste immer größer, deren Handlungsspielraum schier unermesslich. Immer weiter geht die Überwachung des privaten Lebens - seien es persönliche Vorlieben, Bilder des letzten Urlaubs oder unsere Partnerinnen und Partner, die in sozialen Netzwerken zur schau gestellt werden. Mit neuen Techniken wird auch das “analoge” Leben immer mehr digital überwacht: seien es Mistkübel, die Cookies auf unsere Telefone setzen, oder Überwachungskameras, die durch Iris-Scan personalisierte Werbung an Tankstellen ermöglichen. Wie Firmen unsere Geheimnisse lernen? Durch genaues Hinsehen, wenn wir es am wenigsten erwarten.
Und das ist nur die Spitze des Eisbergs. Schon heute bestimmt bei vielen Webshops das verwendete Betriebssystem den Preis. Perfekte Preisdiskriminierung ist mit der voranschreitenden “Datafizierung” der User zu Nutzerprofilen unumgänglich. Durch Big Data Applikationen können aus der Datenflut von Kundenkarten die persönlichsten Situationen rekonstruiert werden, wie der Vater eines 16 jähriger Teenagers erfahren musste.
Ja, Big Data kann zu Innovation und einer Verbesserung der Gesellschaft führen - aber nur, wenn die unter dem von Ann Cavoukian angeführten “positive sum paradigm” erfolgt: Funktionalität von Big Data Analysen und die Privatsphäre von Individuen dürfen sich nicht ausschließen, sondern müssen als Win-Win Situation gelebt werden. Es darf aber nicht bei einem Übereinstimmungsproblem bleiben; Privatsphäre muss zu einer betriebswirtschaftlichen Notwendigkeit werden. Dazu braucht es nicht nur neue Technologien, sondern vor allem den Willen der Politik. Dabei spielt meiner Meinung nach das neue europäische Datenschutzpaket eine bedeutende Rolle - auch wenn dieses in der Vergangenheit wegen einzelner Nationalstaaten gescheitert ist. Mit dem EuGH Urteil zum Safe Harbor Abkommen wurde einer erstes Fundament gebaut. Man kann gespannt bleiben.
Literatur:
Paper als Download: https://privacybydesign.ca/content/uploads/2012/06/pbd-big_data.pdf
[Q1] Greenwald, Glenn; MacAskill, Ewen; Poitras, Laura; Edward Snowden: the whistleblower behind the NSA surveillance revelations. The Guardian, 2013. http://www.theguardian.com/world/2013/jun/09/edward-snowden-nsa-whistleblower-surveillance; Zugriff am 09.10.2015.
[Q2] Waidele, Stefan; Web 3.0 — Daten sind das Öl des 21. Jahrhunderts; ACADEMIA; http://www.academia.edu/10226804/Web_3.0_Daten_sind_das_%C3%96l_des_21._Jahrhunderts; Zugriff am 10.10.2015.
[Q3] Cavoukian, Ann; Jonas, Jeff; Privacy by Design in the Age of Big Data. Information & Privacy Commissioner Ontario, Canada; 2012.
[Q4] Spiegel Online; Safe Harbor: EuGH erklärt Datenabkommen mit USA für ungültig; http://www.spiegel.de/netzwelt/netzpolitik/europaeischer-gerichtshof-erklaert-safe-harbor-abkommen-fuer-ungueltig-a-1056366.html; Zugriff am 09.10.2015.
[Q5] Manyika, J., et. al.; Big data: The next frontier for innovation, competition, and productivity. McKinsey Global Institute; http://www.mckinsey.com/Insights/MGI/Research/Technology_and_ Innovation/Big_data_The_next_frontier_for_innovation; 2011.
[Q6] Tene, O., and Polonetsky J.; Privacy in the age of big data: A time for big decisions; Stanford Law Review 64, 63; 2012.
[Q7] Gantz. J., Reinsel. D.; Extracting value from chaos; IDC; http://www.emc.com/ collateral/analyst-reports/idc-extracting-value-from-chaos-ar.pdf; 2011.
[Q8] Ohm, P.; Broken Promises of Privacy: Responding to the Surprising Failure of Anonymization; UCLA; SSRN: http://ssrn.com/abstract=1450006; 2009.
monika.gradl.uni-linz, 15. Oktober 2015, 15:17
Sehr informativer Beitrag! Die Überleitung zur Preisdiskriminierung im Zusammenhang mit Big Data war ebenfalls sehr spannend.
Datenschutz und Privatsphäre sind wichtige Themen, welches gerade im Bezug auf Big Data beachtet werden sollte. Wie so schön beschrieben: Daten sind das "Öl des 21. Jahrhunderts". Dadurch hat sich auch die etwas zweischneidige Ableitung ergeben, dass "Daten den Rohstoff für zukünftige Innovationen" bilden. Sehr interessante Aussage: Ob es so sein wird oder nicht, wird sich zeigen.
In diesem Zusammenhang darf man natürlich den Datenschutz & die Privatsphäre der Menschen nicht vernachlässigen. In meinem Blog bin ich näher auf den gläsernen Konsumten eingegangen und habe mich kritisch mit den Datenschutz auf der einen Seite und der Leichtsinnigkeit mit dem Umgang von Daten auf der anderen Seite beschäftigt.
michael.kaufmann.uni-linz, 15. Oktober 2015, 15:24
Hallo Michael!
Ich habe deine Präsentation sehr interessant gefunden, da Big Data gerade im E-Commerce und App Business eine immer wichtigere Rolle einnimmt. Alleine die Aussagen von runtastic CEO Florian Gschwandtner, dass sich auch runtastic bereits als Big-Data Unternehmen sieht, verdeutlicht einmal mehr die Veränderung der Geschäftsmodelle, denn mit dem App-Verkauf alleine wird man auf Dauer keine Gewinne mehr erzielen können. Die Frage nach der Privatsphäre und die Bedenken hinschtlich der Markttransparenz muss auf jeden Fall kritisch hinterfragt werden. Hinsichtlich Datenschutz liegt meiner Meinung nach der Ball auch bei der Regierung, sich eine neue Abwandlung des DSG2000 zu überlegen.
Monika hat auch über ein ähnliches Thema geschrieben. hier
rainer.kroisamer.uni-linz, 28. Oktober 2015, 10:53
Ich kann in deinem Beitrag insofern parallelen zum zweiten Thema der LVA, der transparente Konsument, herstellen, als dass die Autoren des von mir untersuchten Beitrages "Customer Data: Designing for Transparency and Trust" ebenfalls feststellen, dass der Umgang mit großen von Nutzern generierten Datenmengen bereits seit langem Einzug in die betriebswirtschaftlichen Strategien von Unternehmen gehalten hat. Nutzer sind sich bereits dessen bewusst dass sie digitale Fußabdrücke hinterlassen sobald sie digitale Services und Produkte nutzen, dafür aber einen fairen Gegenwert verlangen. Sie weisen also ihren Daten einen finanziell messbaren Wert zu. Mehr dazu in meinem Blogbeitrag zum Thema der transparente Konsument.
michael.goldbeck.uni-linz, 29. Oktober 2015, 08:47
Hallo Rainer,
herzlichen Dank für den Link zu deinem Beitrag! Finde die Forderung nach einem Gegenwert für die persönlichen Daten grundsätzlich sehr interessant - bin mir aber nicht sicher, ob es für Nutzer die Situation nicht eher verkompliziert. Ohne Automatismus müsste ich bei allen Websiten, Apps und Co. die meine Daten abzapfen selbst anfragen und einen Gegenwert fordern - hört sich bei den vielen verschiedenen Services, die ich nur am Telefon nutze, schon nach einem Full-Time Job an... Die Grundidee ist aber definitiv unterstützenswert :-)