Was ist eigentlich Data-Mining?

Was ist eigentlich Data-Mining?

Jeder, der sich irgendwann schon einmal mit Big Data oder Künstlicher Intelligenz beschäftigt hat, ist schon einmal über den Begriff Data-Mining gestolpert – häufig vielleicht ohne zu verstehen, was damit eigentlich wirklich gemeint ist. Kurz zusammengefasst kann man sagen, dass es bei Data-Mining darum geht, in großen Datenbeständen Zusammenhänge, Muster und Trends zu erkennen, also in vorhandenen Daten nach Erkenntnissen zu suchen – wie ein Goldgräber, der in großen Mengen von Gestein nach Gold sucht.

Ein großes Missverständnis bei Data-Mining ist häufig, dass man im ersten Moment denkt, dass es um die Generierung von Daten gehen würde. Das ist allerdings nicht der Fall. Es geht immer um die Suche nach Wissen und Erkenntnissen innerhalb von bereits bestehenden Daten, nicht aber um die Erzeugung neuer Daten.

Für diese Suche werden verschiedenste Methoden aus der Statistik, Mathematik, Informatik und dem Machine Learning angewendet. Machine Learning ist übrigens generell eng verwandt mit Data-Mining, wobei es dort mehr um das Erkennen bereits bekannter Muster in den Datensätzen geht, während Data-Mining tatsächlich nach Mustern sucht, die bisher noch nicht bekannt sind.