Data Mining

Data Mining Methoden

Data Mining bedeutet übersetzt „Daten schürfen“ und wird zur Analyse von bereits vorhandenen Datenbeständen verwendet. Dabei werden statistische Methoden und Algorithmen genutzt, um neue Trends, Muster und Zusammenhänge zu erkennen. So ermöglicht Data Mining beispielsweise, das Kaufverhalten von bestimmten Kundengruppen zu erkennen und auszuwerten.

Häufig werden Data Mining und Predictive Analytics (P. A.) synonym gebraucht. In der Tat spielen Methoden und Werkzeuge des Data Mining auch eine wesentliche Rolle bei dem P.A.-Verfahren. Predictive Analytics geht aber noch über Data Mining hinaus und nutzt weitere Methoden wie maschinelles Lernen, Elemente der Spieltheorie oder Simulationsverfahren.

Klassische Data-Mining-Methoden sind:

  • Clustering: Hier geht es darum, Daten zu segmentieren und verschiedene Gruppen zu bilden (etwa Kunden nach Einkommensstufen).
  • Klassifizierung: Hier sind die Gruppen/Klassen bereits vorgegeben. Datenelemente werden automatisch den verschiedenen Klassen zugeordnet (beispielsweise umsatzstarke und umsatzschwache Filialen).
  • Regressionsanalyse: Beziehungen zwischen (mehreren) abhängigen und unabhängigen Variablen werden identifiziert (Zum Beispiel, hängt der Produktabsatz von Produktpreis und Einkommen des Kunden ab).
  • Assoziationsanalyse: Suche nach Mustern, bei denen ein Ereignis mit einem anderen Ereignis verbunden ist; die Abhängigkeiten zwischen den Datensätzen werden über Wenn-dann-Regeln beschrieben (etwa, wenn ein Kunde Cola kauft, kauft er auch Salzstangen).

Klassische Data-Mining-Methoden sind:

  • Clustering: Hier geht es darum, Daten zu segmentieren und verschiedene Gruppen zu bilden (etwa Kunden nach Einkommensstufen).
  • Klassifizierung: Hier sind die Gruppen/Klassen bereits vorgegeben. Datenelemente werden automatisch den verschiedenen Klassen zugeordnet (beispielsweise umsatzstarke und umsatzschwache Filialen).
  • Regressionsanalyse: Beziehungen zwischen (mehreren) abhängigen und unabhängigen Variablen werden identifiziert (Zum Beispiel, hängt der Produktabsatz von Produktpreis und Einkommen des Kunden ab).
  • Assoziationsanalyse: Suche nach Mustern, bei denen ein Ereignis mit einem anderen Ereignis verbunden ist; die Abhängigkeiten zwischen den Datensätzen werden über Wenn-dann-Regeln beschrieben (etwa, wenn ein Kunde Cola kauft, kauft er auch Salzstangen).

Data Mining – maschinelles Lernen

Data Mining nutzt auch neuronale Netze, die der Arbeitsweise des menschlichen Gehirns ähneln und über viele Datendurchläufe bestehende Strukturen oder Muster lernen. Daher ist Data Mining eng verwandt mit maschinellem Lernen, sprich Anwendungen und Methoden, in denen Computerprogramme selbstständig neues Wissen erwerben. Während beim Data Mining der Fokus auf dem Finden neuer Muster liegt, die bereits in den bestehenden Daten vorliegen, geht es beim Predictive-Verfahren darum, neue Berechnungsfunktionen aus vorhandenen Daten abzuleiten. Hier werden die Algorithmen so trainiert, dass sie aus den vorliegenden Daten lernen, selbstständig ein Datenmodell erzeugen und dieses für Prognosen oder Entscheidungen einsetzen. Ein Beispiel sind die Vorschläge bei amazon.de „Das könnte Sie auch interessieren“.

 

Ihr Ansprechpartner für Data-Mining

Unser Datenspezialist Michael Eicks (eicks@trebbau.com, Tel.: 0221 / 376 46 – 558) hilft Ihnen gern weiter, zwischen den Verfahren zu differenzieren und Ihnen aufzuzeigen, welche Chancen sich Ihnen mit Data Mining und Predictive Analytics bieten.

 

aici 8.2.9-he.0