SUMMARY | Srinivasa Raghavan, N. R. (2005). Data Mining in E-Commerce - A survey

1.     Data Mining

 

Im Artikel wird beschrieben, wie Data Mining verwendet werden kann, um verschiedene Services von E-Commerce-basierten Unternehmen wie Webshops zu verbessern.

Data Mining bedeutet wörtlich übersetzt „Daten-Bergbau“ und bedeutet, aus einer großen Menge an Daten (meist eine Korrelation von Daten mehrerer Datenbanken) brauchbare Muster heraus zu filtern, um beispielsweise Präferenzen von Konsumenten zu eroieren. Einem Data Mining Prozess gehen normalerweise andere Prozesse voraus wie ETL (= Extract, Transformation, Loading) oder das Filtern von Daten voraus. Das Ziel von Data Mining ist es, möglichst viele nützliche Informationen aus so genannten „Data Warehouses“ (= große Datenbanken) abzuleiten. Es werden zB Rechnungen aller Art, Telefonate, Reiserouten oder Zugriffsprotokolle zum Internet analysiert.

 

Um Data Mining zu betreiben gibt es verschiedene Techniken die auf einem Zusammenspiel der drei Faktoren Statistik, Artificial Intelligence, AI (=künstliche Intelligenz) und Datenbankengineering beruhen, welche kurz erklärt werden sollen.

·       Statistik ist im Data Mining für die Analyse der Daten und für das Aufstellen von Regeln zuständig. Ein Beispiel für eine Regel: Wenn ein User Site A besucht dann wird er zu 80% auch Site B besuchen.

·       Im Rahmen der künstlichen Intelligenz wird von „Machine Learning“ gesprochen, was bedeutet, dass der Computer mit nur minimaler oder keiner Usereingabe mit Hilfe von Lernalgorithmen zusammenhänge erkennt –>  Neural Networks

·       Die Herausforderung beim Datenbankengineering und der Datenbankforschung besteht darin, Mechanismen und Strukturen zu generieren, um eine riesige Menge an Daten effizient in Information umzuwandeln.

 

Ob ein Data Mining Prozess erfolgreich sein kann oder nicht hängt von fünf Faktoren ab:

·       Die Verfügbarkeit von Daten mit ausführlicher Beschreibung (Metadaten)

·       Verfügbarkeit einer großen Menge an Daten

·        Die Vertrauenswürdigkeit der Daten

·       Nachweis über einen ROI (=Return on investment) des Data Mining Prozesses – „zahlt sich das Ganze überhaupt aus?“

·       Durch Data Mining Anwendungen soll nicht noch mehr Aufwand bzw. ungeordnete Daten generiert werden (zusätzlich zu bereits bestehenden EDV Systemen) 


 

2.     E-Commerce und Data Mining


 

Im Rahmen eines E-Commerce-Prozesses entstehen Daten automatisch als Resultat jeder Online-Transaktion und sie werden dazu benutzt, um das Verhalten und die Präferenzen des Konsumenten im Rahmen eines Online-Kaufs zu erkennen und zu steuern. Folgende Punkte zeigen, in welchen Bereichen des E-Commerce Data Mining interessant ist:

·       Customer Profiling -> für ein Unternehmen ist es außerordentlich wichtig seine Konsumenten zu kennen, da diese den Umsatz generieren. Data Mining wird von Unternehmen dafür eingesetzt, um einen Nutzen für den Konsumenten zu liefern und damit die Kundenbeziehung generieren oder zu festigen. Beispiel: Dell -> wenn Kunde bereits bestimmte Anzahl an Servern gekauft hat ist es naheliegend, dass er auch zusätzliche Router braucht -> kann gezielt angeboten werden

·       Recommendation Systems -> Konsumenten werden automatisch über Produkte oder Veranstaltungen informiert, die in deren Interessensbereich liegen

·      Web Personalization -> es werden beispielsweise Daten über das Navigationsverhalten von Usern gespeichert und beim nächsten Besuch der Website werden bestimmte Bereiche auf einer Website optisch hervorgehoben

·       Buyer Behaviour -> der wichtigste Faktor eines erfolgreichen E-Shops ist eine übersichtliche Navigation, der zweitwichtigste ist sofort zu verhindern, dass der User den Kauf frühzeitig abbricht, im Rahmen dessen sind Daten darüber von Nutzen, was einen User dazu bewegt den Kauf vorzeitig abzubrechen (Stichwort Conversion Rate -> den Besucher zum Käufer machen)

Es werden also Daten über das Verhalten des Konsumenten ausgewertet, um ihm (auch zukünftige) Verhaltensmuster zu zeigen, die ihm vielleicht selbst noch gar nicht bewusst sind.

 

3. Technologien und weitere Einsatzbereiche von Data Mining

 

Im Artikel werden als Technologien RosettaNet und Microsoft BizTalk genannt. Beide zielen auf eine automatisierung von Geschäftsprozessen ab, damit der Austausch großer Datenmengen zwischen Unternehmen vereinfacht werden kann.

Fahndung, Terrorbekämpfung, Aufenthaltsort von Personen bestimmen, ...

Data Mining wird seit einigen Jahren auch "Big Data" genannt.

 

4. Quelle

Srinivasa Raghavan, N. R. (2005). Data Mining in E-Commerce - A survey. Sadhana (Springer) Vol. 30, Parts 2 & 3, April/June 2005, pp. 275–289.