Daten erfolgreich für Entscheidungen und insgesamt in Digitalisierungsprojekten zu nutzen, scheitert vielfach an der Datengesundheit. Mit modernen Plattformen und der richtigen Datenkultur lässt sich die Datengesundheit nachhaltig verbessern.

 

Warum das Thema Datengesundheit für Unternehmen fester Bestandteil der Data Governance sein sollte, darüber spricht QuinScape-Geschäftsführer Dr. Gero Presser mit Jan Wetzke, Regional Vice President Sales Central & Eastern Europe bei Talend, in unserer Interview-Reihe Datenhelden.

Außerdem diskutieren die beiden darüber, wie zuverlässige Daten bei Entscheidungen helfen und so den Unternehmenserfolg maßgeblich beeinflussen.

Zur Aufzeichnung des Interviews mit Jan Wetzke geht’s hier entlang.

Dr. Gero Presser (l.) von QuinScape im Datenhelden-Interview mit Jan Wetzke von Talend

Datengesundheit – ein Zusammenspiel von Mensch und Maschine

Nahezu sein gesamtes Berufsleben verbrachte Jan Wetzke im Bereich Datenmanagement und hat einen entsprechend guten Blick auf den Markt.

Seiner Einschätzung nach sind die klassischen Herausforderungen der Integration von Daten und Systemen zumindest aus technologischer Sicht mittlerweile gelöst: „Diese klassischen Integrationsthemen, die Integration von Anwendungen miteinander und das Bewegen von Daten in ein Data Warehouse, sind keine technologischen Herausforderungen mehr. Es gibt eine Reihe guter Tools am Markt, inklusive Talend, die dieses Problem vernünftig lösen.“

Allerdings führe die verstärkte Nutzung der Daten, die größere Verfügbarkeit sowie die Integration von wesentlich mehr Datenquellen zu einem neuen Problem. „Dieses Problem ist die Integrität und Qualität der Daten“, so Wetzke. „Kunden haben zwar eine Vielzahl an Daten, wissen aber nicht, wie sie sie ordentlich nutzen können und wie man daraus Mehrwert gestaltet.“

Warum sich Data Lakes oft zu Datensümpfen entwickeln

Eine Ursache dafür illustriert Wetzke anhand von Data Lakes, die sich vielfach zum Datensumpf entwickeln. Man habe dort zwar die Integration („Ingest“) in den Griff bekommen, indem man einfach alle Daten abgesaugt und in den Data Lake transportiert habe. Allerdings seien diese Daten dann nicht mehr auffindbar.

„Wenn eine Suche nach Kundendaten zum Beispiel 5.000 unterschiedliche Datensätze liefert, erkennt niemand mehr, wo die wirklich wertvollen und vertrauenswürdigen Daten liegen.“ Dieses Problem sei auch bis heute nicht gelöst: „In vielen der großen Data Lake- und Data Lakehouse-Projekten fehlt auch heute noch die Datenqualität.“

Der Weg zu gesunden Daten erfordert eine Datenkultur

Aus der Herausforderung, Daten auffindbar zu machen, hat sich mit Datenkatalogen inzwischen ein Markttrend entwickelt. „Derzeit sind viele Initiativen unterwegs, Datenkataloge zu erstellen“, so Wetzke. „Das Thema ist wichtig, hilft aber nicht, wenn man die Daten nicht qualitativ in Hinblick auf ihre Gesundheit bewerten kann.“

Um Daten vertrauenswürdiger zu machen, brauche man ein kontinuierliches Monitoring. Daten müssen konsequent einem Profiling unterzogen werden. Zudem sollten mit Blick auf Datenqualität sowohl automatisierte Verfahren genutzt als auch die Datenverantwortlichen in manuelle Prozesse eingebunden werden.

Zwar gebe es hierfür bereits leistungsfähige Werkzeuge, wie die von Talend. Doch sei das Gesamtthema nicht nur mit Technik zu lösen, sondern erfordere auch eine entsprechende Organisation und Datenkultur. Hierzu müsse innerhalb des Unternehmens ein Bewusstsein für Datenqualität und Datenwert geschaffen werden.

„Die größte Verantwortung hat das Management. Man kann solch eine Kultur nicht bottom-up etablieren. Man braucht das buy-in des Managements von der höchsten Ebene“, beschreibt Wetzke eine zentrale Herausforderung hierbei.

Datengesundheit sei ein Zusammenspiel von Mensch und Maschine. Keiner von beiden könne das Datenqualitätsproblem allein lösen, doch lassen sich die Stärken beider kombinieren. „Automatisierung mit Machine Learning hilft insbesondere beim Long Tail der Daten“, so Wetzke. Gerade bei den Kerndaten wie Kunde und Produkt sei aber vor allem der Mensch gefragt.

Datenqualität und Data Governance haben hohe Priorität am Markt

Aus Wetzkes Sicht müsse Datenqualität ein Aspekt jeder Digitalisierungsinitiative sein. Dies gelte sowohl für die operativen Bereiche, in denen Daten automatisiert verwendet werden, als auch für den analytischen Bereich, bei dem Entscheidungen auf Basis von Daten getroffen werden.

„Das, was ich im Moment am Markt sehe, wenn ich mit CDOs großer und kleiner Unternehmen spreche: Kein Unternehmen fühlt sich im Stande, ohne eine Data Governance- und Data Quality-Lösung im Markt dauerhaft Bestand zu haben“, unterstreicht Wetzke die Bedeutung des Themas. Viele Unternehmen würden ausgehend von Katalogisierungsprojekten automatisch auf die nächste Ebene rutschen, bei der es um das Thema Datenqualität und Datengesundheit ginge.

Beispiele aus der Praxis: Wettbewerbsvorteile durch bessere Daten

An mehreren Kundenbeispielen führt Wetzke aus, wie Datenqualität und Datengesundheit zu Wettbewerbsvorteilen führen.

So erzählt er von einem deutschen Sportartikelhersteller, den ein Schock-Moment zum Thema Datenqualität brachte. Konkret sei aufgefallen, dass die Beschreibung der eigenen Produkte bei Zalando besser und korrekter waren als im eigenen Onlineshop.

Auch wurden dort Attribute verwendet, die wirklich wichtig für Kaufentscheidungen seien, beispielsweise in puncto Nachhaltigkeit. Dies stand der eigenen Strategie im Wege, in Zukunft mehr Absatz über den eigenen Onlineshop zu erzielen.

Deshalb startete das Unternehmen ein Projekt, um die Datenqualität zu verbessern und kontinuierlich zu monitoren. Datengesundheit hat in diesem Beispiel also einen unmittelbaren Einfluss auf den Umsatz.

Als weiteres Beispiel beschreibt Wetzke die Herausforderung eines deutschen Automobilzulieferers, der 20.000 Datenquellen mit bis zu 4 TB in einen Data Lake binnen zwei Wochen verfügbar machen musste.

Dies sei ein Musterbeispiel für die Herausforderungen der neuen Welt, wo wirklich nur mit Hilfe von klugem Profiling und automatisierten Qualitätsverbesserungen Erfolge und damit Wettbewerbsvorteile erzielt werden könnten.