Webkommunikation Zweck der Metadatenauswertung

elsa.wiesinger.uni-linz, 26. April 2017, 19:03

Die Metadaten

Sie werden auch Verbindungs- oder Verkehrsdaten genannt. Die Daten kommen unter anderem auch beim Surfen im Internet und beim Verschicken von E-Mails vor. Metadaten dienen außerdem dazu, die Struktur und Beschaffenheit aufzuzeigen. (1)

 

Formen von Metadaten

  • Beschreibende Metadaten beschreiben eine Ressource für die Zwecke der Entdeckung und der Identifizierung. 
  • Strukturelle Metadaten, z.B. Datenmodelle und Referenzdaten. 
  • Administrative Metadaten bieten Informationen zur Verwaltung einer Ressource.  (2) 

 

Metadaten zur Orientierung im Datenmeer

Durch Webkonzepte wie Data Mining, Information Retrieval, Crawling oder Indexing können Metadaten Informationen über Ressourcen wie zB Websites oder Fotos bekanntgeben. 

Ein Überkonzept der Metadaten ist das Semantik Web oder auch die Informationsstrukturierung. Mithilfe des Semantik Webs können Suchvorgänge optimiert werden. Durch das Beifügen von Metadaten können Suchergebnisse zB auf Google optimiert werden. (3) 

 

Metadaten im WWW

Metadaten bei der HTML Programmierung dienen dazu, Informationen für Server, Browser und automatisierte Programme wie Robots, Spider, Crawler festzuhalten.

Metaangaben sind aber nicht nur Informationen, sondern können auf ein Verhalten einer Website aufrufen. Beispielsweise dient 301 Redirect dem Weiterleiten einer Website oder zur Anpassung des Inhalts an die Screengröße.

 

Metadaten im Head-Bereich

Metaangaben im Headbereich besitzen Attribut- und Wertpaare und werden als Metatags betitelt. 

Je nach Ziel sind dabei ganz verschiedene Attribut- und Wertpaare möglich. Zum Beispiel: Metadescriptions, Meta Titles, Meta Keywords oder verschiedene Informationen über den Autor des Dokumentes. 

So definiert der Datenstandard MIME einen wichtigen Teil der Metadaten, damit der Browser diese Inhalte korrekt lesen und mit der richtigen Anwendung ausführen kann. Denn bei jedem Dialog zwischen Klienten und Server werden bestimmte Metadaten übertragen werden. MIME definiert einen wichtigen Teil dieser Metadaten, die im Header eines HTML-Dokumentes weitergegeben werden. Sowohl Server als auch Browser wissen dann, welche Datentypen gerade übertragen und gelesen oder ausgeführt werden sollen. (3)

 

Metadaten für SEO

Mit Bezug zur Suchmaschinenoptimierungen wären Anweisungen für Spider und Crawler zu erwähnen, die mit dem Meta-Tag robots bestimmt werden. Hinzu kommen unterschiedliche Informationen über Sprachen und Arten von Inhalten. 

Crawler nutzen Metadaten um Informationen über eine Website zu sammeln und zu klassifizieren. Mithilfe dieser Daten können Suchmaschinen nicht nur die Websites indexieren, sondern auch richtig zu ordnen. Durch die Nutzung von Meta-Tags können im HTML-Dokument der Website Informationen hinterlegt werden.

Beispielsweise gilt der Title-Tag für Suchmaschinen als äußerst bedeutsam. Für das SEO-Ranking einer Website ist es besonders wichtig, dass das Keyword im Title-Tag vorkommt. 

In der Regel weisen die Suchmaschinen daraufhin, welche Metadaten sie lesen und verarbeiten können. Jedoch kann man nicht genau sagen wie Suchmaschinen wie zum Beispiel Google ihre Rankings berechnet.

Im Einzelfall hängt die Verwendung bestimmter Metatags aber auch davon ab, welche Inhalte auf einer Website vorhanden sind, mit welchen Endgeräten die Website aufgerufen werden soll und welche weiteren Dienste darin enthalten sind (zum Beispiel Druckversionen von Dokumenten oder ausfüllbare Formulare). (3) 

 

Semantik Web und die Metadaten - Die Webisierung von Daten

Um den Informationsüberfluss im WWW zu managen, hat Tim Berners Lee das Semantik Web Projekt gestartet. Alle Inhalte die sich im Netz befinden, werden mit Begriffen versehen in Form von RDF Tripel. Man kann es fast mit dem Etikettieren gleichsetzten.

RDF steht für Resource Description Framework und dient der systematischen Zuweisung von Metadaten. Ein RDF Tripel besteht aus Subjekt, Prädikat und Objekt. 

Ein Beispiel hierfür wäre: "<Österreich> <liegt> <in Europa>". Werden nun weitere Länder der EU mit einem solchen Tripel kategorisiert, entstehen aus Metadaten semantische Netze. 

Werden nun andere Länder Europas ebenfalls mittels solcher Tripels kategorisiert, entstehen durch Verknüpfung dieser Metadaten semantische Netze. Berners-Lee nennt das in einem Artikel für die Royal Society die "Webisierung" von Daten. (4)

 

Internet der Zukunft – Linked Data Web

Das Linked Data Web geht noch weiter hinaus. Diese Vision von Tim Berners Lee besagt, dass alles (Menschen, Länder, Produkte, Fotos, ...) einen eigenen URI besitzen. URI steht für Universal Resource Identifier und dient dem Verlinken von Websites. Aber auch Dinge können, wenn sie eine eigene URI besitzen, miteinander verlinkt werden. 

Linked Data Web steht für ein riesiges Netzwerk verknüpfter Daten, welche aufgrund ihrer Bedeutung (also der zugewiesenen Metadaten) in Beziehung zueinanderstehen. 

Durch die Einführung dieses neuartigen Internets, könnten Nutzer aufgrund der Vielzahl an Verknüpfungen große Datenmengen zu zusammenhängenden Dingen und Konzepten mit nur einer Suchabfrage herausfinden. (4) 

 

Tracking mithilfe von Google Analytics

Durch die einfache Integration eines JavaScript-Codes im Quelltext kann Google Analytics genutzt werden. Der Code lest die IP Adresse jedes Nutzers aus, der die Website besucht und setzt einen Cookie beim Zielrechner. Für die Laufzeit in der sich der Cookie beim Client befindet, wird der Nutzer eindeutig wieder erkannt. Die IP Adresse der Besucher wird jedoch nicht bekanntgegeben.

Das Auswertungstool hilft Websitebetreibern dabei zu verstehen wie gut/schlecht die Website läuft. Es bietet viele interessante Features, wie beispielsweise das Hinterlegen von Conversionzielen.

Aber unter anderem werden auch viele Daten über den Nutzer gesammelt:

 

  • Herkunft (Land und Stadt)
  • Sprache
  • Betriebssystem
  • Gerät (PC, Tablet-PC oder Smartphone)
  • Browser und alle verwendeten Add-ons
  • Auflösung des Computers
  • Besucherqueller ( Facebook , Suchmaschine oder verweisende Webseite)
  • Welche Dateien wurden heruntergeladen?
  • Welche Videos angeschaut?
  • Wurden Werbebanner angeklickt?
  • Wohin ging der Besucher?
  • Klickte er auf weitere Seiten des Portals oder hat er sie komplett verlassen?
  • Wie lange blieb der Besucher? (5)

 

 

Sammlung von Nutzer-Metadaten

Grundsätzlich kann man durch die Speicherung der Metadaten herausfinden, an welchem Standort sich der Nutzung zum Zeitpunkt der Datenerfassung befand. In Zusammenhang mit zusätzlichen Datensätzen (zB Social Media Kanäle) lassen sich bereits aussagekräftige Personenprofile erstellen. 

Zusätzliche Datenquellen stellen wir selbst zur Verfügung. Sei es auf Facebook, Twitter, Google+, Instagram und co. Postings, Bilder, Kommentare, udgl machen Personenprofile detailliert. Die Bekanntgabe von Wohnort, Arbeitsplatz, Restaurants oder Hobbies lassen sich schnell auf sozialen Plattformen ermitteln.(6)

Durch die Verkehrsdaten ist es etwa möglich, anonyme Äußerungen im Internet oder anonyme Teilnehmer an Tauschbörsen einem Telefonanschluss zuzuordnen. Daher sind Polizei- und Strafverfolgungsbehörden besonders daran interessiert, diese Daten für ihre Zwecke auszuwerten. (7)

 

Nutzung von Metadaten

Die Wichtigkeit personenbezogener Daten ist Unternehmen bereits länger bekannt. Je mehr Metadaten und Daten über Kunden und Nutzer gesammelt und analysiert werden, umso genauer können diese Informationen zum ihrem Vorteil genutzt werden.

Wiener Datenexperte Wolfie Christl brachte eine Studie heraus, wo Beispiele für die kommerzielle Verwertung von Daten gesammelt und gezeigt wurden.

 

ZestFinance

70.000 Signale werden beim Analysemodell von ZestFinance gesammelt um die Kreditwürdigkeit von Privatpersonen einzuschätzen.

 

Kredittech

Kredittech sammelt 15.000 Daten um die Kreditwürdigkeit zu analysieren. Darunter befinden sich Daten von Facebook-, Xing- und LinkedIn-Profilen der Antragssteller.

Kredittech fordert die Antragssteller dazu auf, die Informationen der sozialen Netzwerke bekanntzugeben. Zudem wird auch ausgewertet wie lange die Personen beim Ausfüllen von Online-Formularen benötigen und wie oft sie die Löschtaste dabei benötigen.(8)

 

ConnectCubed

Das amerikanische Start-up ConnectCubed bietet Unternehmen Leistungsvorhersagen ihrer Angestellten an. (8)

 

 MediaBrix

Die Werbefirma erkennt die Emotionen von Computerspielern, stimmt darauf die Werbung ab, die diese Spieler zu sehen bekommen, und steigert so das Interesse an ihr bei Online-Spielen um 15%, bei Smartphone-Spielen sogar um 30%. (9)

 

Supermarktketten & ID-Nummern

Eine amerikanische Supermarktkette hat jedem Kunden eine eigene Identifikationsnummer zugewiesen, um „wichtige Momente im Leben der Kunden ausfindig zu machen, in denen ihr Einkaufsverhalten flexibel“ werde.

Dadurch wird eine gezielte Ansprache zum richtigen Zeitpunkt geschaffen. Denn Lebensphasen wie Schulabschluss, Heirat, Umzug oder Scheidung oder eine bevorstehenden Geburt – stellen einschneidende Veränderungen im Kaufverhalten dar.

Diese zu erkennen und für sich zu nutzen, kann durch den Einsatz von ID-Nummern geschaffen werden.(10)

 

So zahlst du mehr!

Facebook-„Likes“, Suchanfragen oder Bewegungen im Internet werden für Persönlichkeitsprofile ausgewertet, und selbst die Dynamik des Tastenanschlags beim Tippen oder die Metadaten von Telefonanrufen lassen mit einer Treffsicherheit von etwa 70% Rückschlüsse auf die emotionale Verfassung der Nutzer zu.

Wissenschaftlich wenig relevant, jedoch wirtschaftlich äußerst interessant!

Bis zu 166% Abweichung der Preise von Online-Produkten bei internationalen Online-Shops (zB Amazon). Auf Basis des Online-Verhaltens, der Standortinformationen, des genutzten Geräts, des Browsers,... wird die Zahlungsbereitschaft eingestuft und abgeschöpft.(8)

 

Orbitz

Das Online-Reisebuchungsportal unterscheidet bei der Preisgestaltung zwischen Apple Computer und normalen PC's. Beim Zugriff mittels einem teuren Gerät von der Marke Apple können die Hotelpreise um bis zu 13% steigen.(8)

 

I can stalk u

Eine Gruppe von Online-Aktivisten stellte die Plattform "I Can Stalk U" online, um mehr Aufmerksamkeit auf die derzeitige Situation der Datensicherheit zu schaffen. Das Angebot bedeutet zu Deutsch "Ich kann dich beobachten" und hielt fest, welche Twitter-User gerade Fotos online stellten. Wie wir bereits wissen, gibt man beim Upload von Bildern auf Plattformen bekannt, wo man sich gerade befindet. Die aktuelle Position und der Nutzername wurde auf der Google Maps-Karte dargestellt und war via I Can Stalk U abrufbar.

Dank dem Geotagging ist dies ganz einfach abrufbar und nur wenige Menschen wissen darüber Bescheid.(11)

 

 

Please Rob me

Es gab aber auch schon weitere Projekte, die sich mit dem Unwissen der Nutzer bei der Freigabe von Fotos oder Postings beschäftigten. Ein bekanntes Beispiel war die niederländische Plattform namens PleaseRobMe: Dort wurden online mithilfe von ungeschützten Informationen im Netz, sämtliche leere Wohnungen gelistet.

Die Betreiber der Site wollten damit demonstrieren, dass beispielsweise auch Einbrecher Daten aus ortsbasierten Diensten nutzen können. Dazu wurden in einem automatisierten Verfahren Daten aus dem Ortsdienst Foursquare ausgewertet, die Nutzer auf Twitter stellten. Da hieß es beispielsweise, dass Nutzer XYZ gerade sein Zuhause verlassen und in einer Bar "eingecheckt" habe. (11)

 

 

 

Beschreibende Metadaten für Unternehmer

Metadaten für Unternehmen Der Grund ist, dass Daten und Metadaten ’für Organisationen Gold wert sind, da sie es ihnen ermöglichen, wertvolle Einblicke in das Verhalten ihrer Kunden zu gewinnen.

Durch das Einbeziehen der Metadaten lassen sich Verhaltensmuster der Kunden erkennen, Business Intelligence schaffen sowie Geschäftsentscheidung auf Basis kundenrelevanter Informationen treffen.

Dies ist der Grund dafür, dass der Schutz von Metadaten sowie die Kontrolle, wer Zugriff darauf hat, für Organisationen immer wichtiger wird. „Organisationen wollen den Besitz und die Kontrolle über ihre Daten nicht nur aus Compliance-Gründen sicherstellen, sondern möchten sie auch für Analysen nutzen.

Spannungsfelder werden sich dabei zwischen Unternehmen und deren Cloudanbietern zeigen. Fragen wie: Wo zieht man die Dateneigentumsgrenze? Vor allem in Bezug auf Metadaten! (12)

 

Metadaten – Auszug aus „Ich glaub, es hackt!“

Bewerbung kam herein für die Stelle eines Systemadministrators: Nach langem Überlegen, ob man den jungen Mann einlagen soll, wurden die Metadaten des Bewerbungsdokuments genauer betrachtet.

Zuerst war die Bewerbung im Ordner „JBG“ abgespeichert. Er hat lediglich den Namen der Firma und kleine Änderungen vorgenommen und abermals in einen anderen Ordner abgespeichert. Daraus lässt sich schließen, dass sich der Herr grundsätzlich gar nicht bei der Firme bewerben wollte. Der Arbeitgeber nahm im Anschluss nochmals die Zeitung in die Hand und sah, dass neben der Stellenausschreibung seines Unternehmens, die Firma JBG auch eine Stelle ausschrieb.

Durch die Versionierung konnte das Unternehmen herausfinden, dass er die Stellenanzeige nebenbei in der Zeitung als interessanter fand und sich dort zuerst beworben hatte. (13)

 

Fazit und Blick in die Zukunft

Werden wir immer gläserner? Es scheint ganz so... Trotz der positiven Eigenschaften von Metadaten, werden sie immer mehr gegen den Nutzer/Kunden verwendet. Es ergeben sich zwar Vorteile, denn ohne des Einsatzes von Metadaten, könnten wir den Informationsüberfluss im Netz nicht mehr kontrollieren.  Zudem sind Angebote, welche unseren Interessen und Vorlieben schmeicheln, nicht prinzipiell negativ.

Jedoch ist die Auswertung nicht immer für den Nutzer. Und oftmals weiß er nicht, wie ihm geschieht bzw. vor allem wie schnell es passieren kann. Aus eigener Erfahrung, weiß ich, dass dem Großteil meiner Freunde Metadaten ein äußerst unklarer Begriff ist. Doch was passiert wenn sich die Verbreitung von Wearables weiter durchsetzt? Durch das Tracking von Körperdaten können personenbezogene Profile noch viel detailierter werden.

Können diese Trends überhaupt noch aufgehalten werden?

Wie nimmt das Ausmaß kommerzieller Überwachung zu, wenn das Internet der Dinge Wirklichkeit geworden ist?

 

&

Zweck der datenauswertung from Elsa

 

 

Quellen:

1. URL: : http://www.spiegel.de/netzwelt/netzpolitik/vorratsdatenspeicherung-wer-hat-uns-verraten-metadaten-a-909942.html, Zuletzt abgerufen am 22.04.2017.

2. URL: https://joinup.ec.europa.eu/sites/default/files/D3.1.9%20Training%20Module%201.4%20Introduction%20to%20metadata%20management%20v1.05_DE.pdf, Zuletzt aufgerufen am 23.04.2017.

3. URL: https://de.onpage.org/wiki/Metadaten, Zuletzt aufgerufen am 23.04.2017.

4. URL: http://sciencev2.orf.at/stories/1713137/index.html, Zuletzt aufgerufen am 23.04.2017.

5. URL: http://www.sat1.at/ratgeber/sicherheit-im-internet/welche-daten-erhebt-google-analytics, Zuletzt aufgerufen am 24.04.2017.

6. URL: https://digitalgefesselt.de/unterschaetzte-metadaten/, Zuletzt aufgerufen am 23.04.2017. 

7. URL: https://de.wikipedia.org/wiki/Verkehrsdaten, Zuletzt aufgerufen am 22.04.2017.

8. URL: http://www.faz.net/aktuell/feuilleton/debatten/eine-neue-studie-ueber-kommerzielle-ueberwachung-13253649.html,  Zuletzt aufgerufen am 23.04.2017.

9. URL: https://www.receptiv.com/,  Zuletzt aufgerufen am 23.04.2017.

10. URL: http://www.nytimes.com/2012/02/19/magazine/shopping-habits.html,  Zuletzt aufgerufen am 23.04.2017.

11. URL: http://www.taz.de/!5136754/, Zuletzt abgerufen am 22.04.2017.

12. URL: http://www.onvista.de/news/dimension-data-veroeffentlicht-it-prognosen-fuer-2017-48697487, Zuletzt abgerufen am 22.04.2017

13. Schrödel, Tobias: „Ich glaub, es hackt!“, Springer Spektrum, S.34 ff,  2014.

0 comments :: Kommentieren


To prevent spam abuse referrers and backlinks are displayed using client-side JavaScript code. Thus, you should enable the option to execute JavaScript code in your browser. Otherwise you will only see this information.