Glaubt man verschiedenen Auswertungen, so gehört die Rolle des Data Scientists zu den attraktivsten Jobprofilen unserer Zeit. Doch was macht Data Science eigentlich? Tatsächlich umfasst der Begriff eine ganze Reihe von Themen, die teilweise aufeinander aufbauen oder sich ergänzen. Grundsätzlich geht es immer darum, Daten zu verwenden, um mit ihrer Hilfe Erkenntnisse zu erlangen und daraus einen Mehrwert zu generieren – es geht also um die Extraktion von Wissen aus Daten.
Bei all den Fachgebieten, die sich mit Daten, ihrer Nutzung und Verarbeitung auseinandersetzen, ist Data Science wohl der wissenschaftlichste und methodischste Ansatz – und gleichzeitig am schwierigsten von anderen Gebieten, wie zum Beispiel Data Mining abzugrenzen. Sie hat sich deshalb zu einer Art übergreifendem Konzept entwickelt, die Techniken und Theorien aus Mathematik, Statistik, Informationstechnologie, Wahrscheinlichkeitsmodelle des Machine Learnings, des statistischen Lernens, der Programmierung, der Datentechnik, der Mustererkennung, der Prognostik, der Modellierung von Unsicherheiten und der Datenlagerung verwendet.
Unternehmen setzen Data Science heute ein, um die eigenen Daten zu analysieren, um daraus Visualisierungen zu generieren, Erkenntnisse sichtbar und verständlich zu machen. Das umfasst auch die Auswertung von Geschäftsprozessen und die vorbereitende Arbeit bei der Verwendung von Daten. Dies kann auch den Bereich des Machine Learnings mit einbeziehen und wird dann zum fließenden Übergang hin zu Künstlicher Intelligenz, die den Data Scientist bei seiner Arbeit unterstützt.