Business Intelligence meets Data Science

Die Ausgangssituation

Auf den ersten Blick ist es verblüffend: Sowohl Business Intelligence als auch Data Science verfolgen den Erkenntnisgewinn aus Daten. Und dennoch trennen die beiden Themen häufig Welten: kulturell, organisatorisch und in Hinblick auf Werkzeuge. In dieser Serie aus Blog-Artikeln möchten wir näher in dieses Thema eintauchen, liegen doch in der Zusammenführung der beiden Themen erhebliche Chancen. Im ersten Teil betrachten näher die Ausgangslage.

Der Begriff „Business Intelligence“ wurde 1989 von Howard Dresner geprägt als Oberbegriff für “concepts and methods to improve business decision making by using fact-based support systems” [1]. In den 1990’er Jahren hat sich der Begriff und die Einführung von Business Intelligence langsam durchgesetzt, es handelt sich insofern um eine Disziplin mit Tradition. Die dabei verfolgte Zielsetzung ist, Daten so aufzubereiten, dass hieraus Erkenntnisse gewonnen werden um im Management bessere Entscheidungen zu treffen.

Gewissermaßen als Standardmodell hat sich vereinfacht folgende Architektur herausgeprägt:

Daten werden aus Quellen extrahiert, per ETL (Extract, Transform, Load) in ein gewünschtes Zielformat transformiert und anschließend in ein zentrales Datenwarenhaus geladen, das als zentrale Quelle für Auswertungen dient. Im Datenwarenhaus werden die Daten historisiert aufbewahrt.

Heutzutage erlauben es Self-Service Werkzeuge immer mehr Anwendern, selbständig Daten visuell zu analysieren und hierdurch Erkenntnisse als Basis für Entscheidungen zu gewinnen.

Business Intelligence ist eine gewachsene Disziplin mit einer gewissen Tradition; in den meisten Organisationen gibt es ein entsprechendes Kompetenzzentrum (CoC) und die bereitgestellten Berichte und Analysen sind wesentlich für die Steuerung von Organisationen.

Data Science ist ein Oberbegriff für wissenschaftliche Methoden, Prozesse, Algorithmen und Systeme um Wissen und Einsichten aus strukturierten und unstrukturierten Daten zu gewinnen, dieses Verständnis des Begriffs wurde 1992 geprägt [2]. Erheblichen Auftrieb hat das Thema durch den Artikel „Data Scientist: The Sexiest Job of the 21st Century“, erschienen 2012 im Havard Business Review, gewonnen [3]. Seitdem genießt das Thema erhebliche Aufmerksamkeit, es gibt vielfältige neue Ausbildungsangebote und auch immer mehr traditionelle Organisationen beschäftigen Data Scientist um eine datenbasierte Grundlage für Entscheidungen zu gewinnen und um Prozesse zu automatisieren und zu optimieren.

Üblicherweise ist Data Science ein projektorientiertes Vorgehen, das in vielen Fällen explizit oder implizit dem CRISP-DM folgt, dem „Cross-industry standard process for data mining“ [4]:

Ausgehend vom fachlichen Anwendungsfall und der Datenlage werden die Daten vorverarbeitet, um anschließend zu einem Modell zu gelangen, also einer meist vereinfachten, ausführbaren Funktion zur Beschreibung des untersuchten Systems. Die Ergebnisse des Modells – dessen Güte – wird evaluiert und möglicherweise das Modell schließlich in Produktion gebracht, also konkret genutzt. In der Praxis sind viele Schleifen und Rücksprünge erforderlich, um schließlich zum Ergebnis zu gelangen. Bedeutsam ist hier, dass, ein Großteil der Zeit für die (Beschaffung und) Vorverarbeitung der Daten aufgewandt wird.

Das Thema Data Science kann immer noch als „hip“ bezeichnet werden; es zieht gerade Menschen mit akademischem Hintergrund und naturwissenschaftlicher oder mathematischer Ausbildung an.

Sowohl Business Intelligence als auch Data Science verfolgen letztlich das Ziel, Erkenntnisse aus Daten zu gewinnen um eine Organisation zu verbessern. Sie sind damit integraler Bestandteil der Digitalisierung, quasi das Herzstück dieses Megatrends. Im Zuge der Digitalisierung wird (fast) alles digital, also zu Daten. Entsprechend kann man die Bedeutung des Erkenntnisgewinns aus Daten nicht überschätzen, sie ist die zielgerichtete Nutzung der immer größer werdenden Datenmengen. Oder um es mit den Worten von Gartner zu sagen: „Data and analytics will become the centerpiece of enterprise strategy, focus and investment“ [5].

„Data & Analytics ist das Herzstück der Digitalisierung“

Aber warum haben sich mit Business Intelligence und Data Science verschiedene Welten ausgeprägt? Und warum ist es eine Chance, wenn es gelingt, die Themen näher aneinander zu bringen? Diese Fragestellungen adressieren wir im nächsten Beitrag der Blogserie.

[1] http://dssresources.com/history/dsshistory.html

[2] https://en.wikipedia.org/wiki/Data_science

[3] https://hbr.org/2012/10/data-scientist-the-sexiest-job-of-the-21st-century

[4] https://en.wikipedia.org/wiki/Cross-industry_standard_process_for_data_mining

[5] https://www.gartner.com/smarterwithgartner/why-data-and-analytics-are-key-to-digital-transformation/

Redaktioneller Hinweis: Dieser Artikel ist ursprünglich im Blog des TDWI e.V. im Februar 2020 erschienen: https://blog.tdwi.eu/augmented-analytics/