{'de': 'Data Mining'}
„Babynahrung wird besonders häufig zusammen mit Windeln gekauft“. Beim Data Mining geht es genau darum: eine Art „Warenkorb“ zusammenzustellen, Informationen, die zusammenpassen. Das Data Mining beschreibt also eine Phase im Prozess der Wissensentdeckung aus Datenbanken. Das kann durch Maschinelles Lernen, Statistik, Datenvisualisierung erfolgen. Es geht dabei nicht um die Vorhersage bestimmten zukünftigen Verhaltens wie bei Algorithmen, sondern um das „Aufspüren“ nach verborgenen Erkenntnissen, die allein durch Daten definiert sind – wie beim gemeinsamen Kauf von Babynahrung und Windeln. Anders als bei diesem Beispiel können aber Zusammenhänge aufgedeckt werden, die wir so nicht erwartet hätten.
\nWarum das Ganze? Weil Unternehmen riesige Datenmengen zur Verfügung haben, aber nicht genau wissen, wie sie das Potential dieser Daten unternehmerisch nutzen sollen – à la „We are drowning in data but starving for knowledge”. Es geht dabei nicht nur darum, Produkte zu optimieren und Märkte zu erschließen, sondern auch um das Entstehen von Epidemien und Erdbeben, Shitstorms und Verkehrsstaus. Behörden und Geheimdienste suchen nach Auffälligkeiten und Übereinstimmungen zur De-Anonymisierung von Kriminellen.
\nBeim sogenannte „Clustering“ – eine Untermenge des Data Minings – sollen „ähnliche“ Daten zu größeren und gröberen Strukturen zusammengefasst werden. Um die Daten besser zu verstehen und eine geeignete Auswertungsmöglichkeit zu finden, kann man entweder den gesamten Datensatz teilen (Top-Down) oder Einzelpunkte zusammenfassen (Bottom-Up).
'}