Immer wieder gibt Facebook wegen der Speicherung persönlicher Daten Grund zur Diskussion. Hierbei stellen sich die unterschiedlichsten Fragen: Woher? Was? Warum? Wie? Fakt ist, es gibt hierbei jede Menge Fragezeichen – eines ist allerdings klar, hinter dem System Facebook steckt eine gigantische Datenbank, welche Daten über beinahe jeden Internetnutzer (auch nicht Facebook-User) beinhaltet.
Im August letzten Jahres berichtet futurezone.net, dass es sich bei der Datenmenge um etwa 500 Terabyte Daten täglich (!) handelt. Verursacht werden diese unter anderem durch mehr als 2,5 Milliarden Postings, 2,7 Milliarden Likes sowie 300 Millionen Bildern. Facebook gab zudem bekannt, dass das verwendete System sogar in der Lage wäre, knapp 105 Terabyte Daten in einer halben Stunde zu überprüfen – die Sammlung der Daten geht demnach weiter.
Doch woher bzw. von wem stammen die Daten? Leider wird die der Großteil dieser enormen Datenmenge von den Usern selbst Tag für Tag freiwillig zur Verfügung gestellt. Zudem erhält Facebook auf große Datenmengen von Dritten, wie beispielsweise App-Betreiber (z.B. Farmville,…) oder externen Webseiten, welche sogenannte Social Plugins eingebunden haben (z.B. Welchen Freunden diese Webseite oder der Beitrag gefällt inklusive Like-Button).
Facebook offenbart in den „Datenverwendungsrichtlinien“ und der „Erklärung der Rechte und Pflichten“ eigentlich sehr detailliert über die Speicherung und Verwendung der User-Daten (Die Einholung der Einwilligung zu diesen Richtlinien durch den Nutzer, stellt allerdings ein Problem dar – siehe Blogbeitrag „Aufgabe 6 – Facebook und Datenschutz“). In den Datenverwendungsrichtlinien wird dabei aufmerksam gemacht, dass folgende Daten in ihre Datenbank gespeichert werden:
- Registrierungsdaten: Namen, E-Mail-Adresse, Geburtstag, Geschlecht, eventuell zusätzliche Informationen (wie Telefonnummer)
- Informationen, die freigegeben werden: Statusmeldungen, Fotos, Gefällt-Mir-Angaben, Orte, Kontakte, Netzwerke, Nutzername, Nutzer-ID
- Von Dritten bereitgestellte Informationen z.B. durch Freunde oder andere Personen: Fotos/Statusmeldungen/Orte auf denen man markiert wurde, Gruppen, Einladungen,…
- Sonstige Informationen – zu viele als man sie hier ordentlich auflisten könnte. Demnach gibt es hierzu einen Screenshot aus den Datenverwendungsrichtlinien aus Facebook. Zudem haben die meisten Leser hier wahrscheinlich noch kaum die einen Blick in die Datenverwendungsrichtlinien geworfen. Also höchste Zeit – hier ein kurzer Auszug:
Der Umfang dieser Daten ist allerdings nur einer geringen Anzahl der Betroffenen bewusst.
Weiters ist auch weitgehend unbekannt, dass man sich unter den Einstellungen eine Kopie der eigenen Facebook-Daten herunterladen kann (ein Grund für die Unbekanntheit könnte der sehr kleingedruckte Hinweis darauf sein).
Beim Selbstversuch, dauerte es etwa 3 Minuten nach Ansuchen, bis ich ein Mail mit dem Link zum Download der Daten erhielt. Daraufhin konnte ich einen Zip-Ordner herunterladen, welche entpackt knappe 7 MB aufwies. Darin befanden sich eine Liste an HTML-Dokumenten, worin all meine Profildetails, Nachrichten, Freunde, Einstellungen, Interessen, Statusmeldungen, Zugangsdaten (Browser, IP-Adresse, Cookies,…) und sogar angeklickte Werbeanzeigen zu finden waren, sowie alle meine Fotos.
Die Frage, was Facebook mit den gesammelten Daten macht, ist leicht erklärt – Profit schlagen und zwar durch Werbung. Je mehr Informationen Facebook über den einzelnen User hat, desto besser können Werbeanzeigen auf dessen Interesse, Demografie, Verhalten,… angepasst werden. Durch die optimale Auslieferung von Werbeanzeigen, können Streuverluste vermieden werden, was den Werbetreibenden Unmengen an Geld erspart. Die Lösung ist demnach nicht schwer: Facebook muss genau wissen was der User will/braucht/kauft, um diese Informationen werbetreibenden Unternehmen für Werbezwecke (und natürlich gegen Entgelt) zur Verfügung zu stellen. In der folgenden Grafik ist dies sehr gut dargestellt:
Die Frage, wie die Speicherung bei Facebook passiert, ist sehr schwer zu beantworten, da Facebook selbst ein großes Geheimnis darum macht. Allerdings wird im Internet häufig geschrieben, dass Facebook bis 2011 die NoSQL-Datenbank „Apache Cassandra“ verwendete und dann durch eine Kombination aus HBase, HDFS und Haystack ersetzt wurde. Zudem verfügte Facebook Ende 2012 über etwa 180.000 Server, die in zwei Rechenzentren in den USA bereitgestellt wurden.
http://hobia.com/info/datenschutz.html
http://futurezone.at/digital-life/facebook-500-terabyte-daten-taeglich/24.584.182
http://www.zdnet.de/88167851/facebook-erlautert-nutzung-personlicher-daten-fur-werbezwecke/
https://www.facebook.com/legal/terms?locale=de_DE