Was ist Data Mining?
Data Mining ist der Prozess der Analyse verborgener Datenmuster nach verschiedenen Gesichtspunkten, um diese Daten in nützliche und oft umsetzbare Informationen zu verwandeln.
Daten werden in gemeinsamen Bereichen wie Data Warehouses gesammelt und zusammengestellt, und Data-Mining-Algorithmen suchen nach Mustern, die Unternehmen nutzen k?nnen, um bessere Entscheidungen zu treffen, z. B. Entscheidungen, die zu Kostensenkungen, Umsatzsteigerungen oder einer besseren Betreuung von Kunden oder Klienten beitragen.
Data Mining wird auch als Datenermittlung oder Wissensermittlung bezeichnet. Es ist ein wichtiger Bestandteil der Business Intelligence, um datengestützte Entscheidungen zu treffen.
Techopedia erkl?rt Data Mining
Die wichtigsten Schritte in einem Data-Mining-Prozess sind:
- Extrahieren, Umwandeln und Laden von Daten in ein Data Warehouse
- Speichern und Verwalten von Daten in einer mehrdimensionalen Datenbank
- Bereitstellung des Datenzugriffs für Unternehmensanalysten mithilfe von Anwendungssoftware
- Analysierte Daten in leicht verst?ndlicher Form, z. B. als Diagramme, darstellen
Der erste Schritt beim Data Mining ist das Sammeln relevanter, gesch?ftskritischer Daten. Unternehmensdaten sind entweder Transaktionsdaten, nicht-operative Daten oder Metadaten. Transaktionsdaten befassen sich mit allt?glichen Vorg?ngen wie Verk?ufen, Best?nden und Kosten.
Bei nicht-operativen Daten handelt es sich in der Regel um Prognosen, w?hrend sich Metadaten mit dem logischen Datenbankdesign befassen. Muster und Beziehungen zwischen Datenelementen k?nnen oft wichtige Informationen zur Verbesserung von Gesch?ftsprozessen liefern.
Unternehmen mit starker Kundenorientierung arbeiten mit Data-Mining-Techniken, die ein klares Bild der verkauften Produkte, der Preise, der Konkurrenz und der demografischen Daten der Kunden liefern.
Der Einzelhandelsriese Walmart beispielsweise übertr?gt alle relevanten Informationen in ein Data Warehouse mit Terabytes an Daten. Diese Daten sind für die Lieferanten leicht zug?nglich und erm?glichen es ihnen, das Kaufverhalten der Kunden zu erkennen. Mithilfe von Data-Mining-Techniken k?nnen sie Muster zu Einkaufsgewohnheiten, meistgekauften Tagen, meistgefragten Produkten und anderen Erkenntnissen erstellen.
Der zweite Schritt beim Data Mining ist die Auswahl eines geeigneten Algorithmus – eines Mechanismus, der ein Data-Mining-Modell erstellt. Die allgemeine Funktionsweise des Algorithmus besteht darin, Trends in einem Datensatz zu erkennen und die Ergebnisse zur Definition von Parametern zu verwenden.
Die g?ngigsten Algorithmen für das Data Mining sind Klassifizierungs- und Regressionsalgorithmen, die zur Ermittlung von Beziehungen zwischen Datenelementen verwendet werden. Gro?e Datenbankanbieter wie Oracle und SQL verwenden Data-Mining-Algorithmen wie Clustering und Regressionsb?ume, um die Nachfrage nach Data Mining zu befriedigen.