Im Zuge der Digitalen Transformation werden zunehmend Prozesse digitalisiert, neue Systeme müssen integriert werden. Das Datenvolumen wird sich beträchtlich erhöhen und die Verantwortung der IT-Abteilungen die Systeme synchron zu halten steigt im gleichen Maße. Am Beispiel des Customer Relation Management (CRM) ist dies gut erkennbar: Heute haben wir ein CRM, eingebettet in ein Closed Loop Marketing, das im Rahmen eines Multichannel Marketings die digitalen und analogen Vertriebskanäle anhand von Kennzahlen kontinuierlich bewertet und steuert. Den Kunden interessiert auf seiner Customer Journey diese Systemkomplexität nicht, im Gegenteil, er möchte individuell verstanden und adressiert werden. Warum Sie hier und insbesondere bei der Digitalisierung von Prozessen auf Metadaten zu Ihrem Datenbestand angewiesen sind, beschreiben wir im folgenden Beitrag.

Welche Arten von Metadaten gibt es?

Mit Metadaten werden strukturierte Beschreibungen oder Merkmale über Daten bezeichnet. Metadaten sind nicht neu. Sie sind in aktuellen Systemlandschaften aber oft verstreut in unterschiedlichen, teils proprietären Formaten, gefangen in statischen Dokumentationen und nur schwer zugänglich. Es gibt mehrere Arten von Metadaten und wir werden sehen, warum diese zusammen einen so großen Mehrwert bieten.

Metadaten über Strukturen

Die Metadaten über Strukturen sind Beschreibungen der Datenstrukturen, in denen die Daten abgelegt sind. In relationalen Datenbanken finden sich diese im Information Schema und meistens in einem ER-Diagramm samt logischer Sicht. Wenn wir bei dem Beispiel „Kunde“ bleiben, wird er im CRM einen „Namen“ haben, der physikalisch im Feld „CUSTOMER_NAME“ abgelegt ist. Im ERP wird der Name im Feld „NAME1“ und „NAME2“ abgelegt, im Kampagnen-Management unter „NAME“ und noch woanders unter „F001N“. Wie hilfreich wäre es, mit einer Abfrage für das Domainenobjekt Kunde in allen Systemen den Speicherort für das logische Feld „Name“ zu finden?

Metadaten über die Feldsemantik

Die Verwaltung von Metadaten zu den Inhalten erlaubt es, diese physikalischen Informationen zu logischen Informationen zusammenzuführen. Wo auch immer sich ein Datensatz „KUNDE“ in Ihren Systemen befindet, können Sie ermitteln, in welchem Feld der Name gespeichert ist. Das ausmultipliziert auf alle relevanten Objekte ermöglicht es sehr effizient, auf Integrationsfragestellungen zu reagieren, und es stellt eine hervorragende Basis für agile Weiterentwicklung dar. Wenn Sie nun noch ein Changemanagement auf diesen Strukturen etablieren, haben Sie einen Data-Governance-Prozess, der eine unternehmensweite Sicht auf die Strukturen abbildet. Wie hilfreich wäre es auf Basis dieser Informationen herauszufinden, wie sich Änderungen auf Integrationsprozesse auswirken?

Metadaten über Prozesse

Die Verwaltung der transitiven Abhängigkeiten zwischen den Objekten bildet Ihre Datenintegrationsprozesse ab und damit den Datenfluss. Neben der augenscheinlichen Nachvollziehbarkeit von Abhängigkeiten, ist diese Abbildung auch eine hervorragende Basis für Risikobetrachtungen und Impactanalysen für angestrebte Strukturänderungen. Die aus dieser Transparenz entstehenden Aussagen sind für die Beschleunigung von Entscheidungsprozessen von enormer Bedeutung. Wenn Sie diesen Datenbestand aufgebaut haben, wie hilfreich wäre es, wenn Sie diesen auch im produktiven Betrieb nutzen könnten?

Metadaten über technische Prozesse

Die Erfassung von Metadaten von technischen Abläufen kennen wir klassisch durch eine Protokollierung (Logging). Die Spannbreite hier erstreckt sich über Fehlerprotokolle (eine Aktion war fehlerhaft) über Aktivitätsprotokolle (eine Aktivität ist durchgeführt worden, entweder erfolgreich oder fehlerhaft) bis hin zu Statistikprotokollen (Anzahl Datensätze, Anzahl Fehler, Befüllungsgradanalyse, Durchschnitte, etc). Neben der offensichtlichen Hilfe bei der Suche nach Fehlerzuständen hat man hier ein hervorragendes Werkzeug für die Fehlerprävention. Verbindet man nun diese Statistikdaten mit den zuvor gesammelten Metadaten, erhält man ein mächtiges Monitoringwerkzeug. Dieses Thema ist allerdings so umfangreich, dass wir ihm einen eigenen Blogbeitrag widmen werden.

Metadatenauswertung als natürlichen Teil von Analytics verstehen

Die Zusammenführung dieser Bereiche der Metadatenerfassung zu einem Gesamtkonzept ermöglicht sowohl im operativen Geschäft als auch bei der fortlaufenden Anpassung der Systeme an neue Marktbedingungen einen optimalen Ausgangspunkt. Für die Analyse kann die Infrastruktur genutzt werden, die bereits die Analytik für die Fachbereiche umsetzt.

Wenn Sie innerhalb eines der Abschnitte gedacht haben „Haben wir in Excel“ oder „Das ist in Word dokumentiert“, dann stellen Sie sich die Frage, warum Sie die Daten nicht in der Datenbank haben und warum Ihre Analytik nicht auch damit arbeiten sollte. Hier können nochmal deutliche Mehrwerte geschaffen werden.

Alle diese Teilfragestellungen sind sicher nicht neu, und es gibt für jede Fragestellung eine Vielzahl von Ansätzen, kaum jedoch ganzheitliche Lösungen. Das ist in der Tatsache begründet, dass ein gutes Metadaten-Management nicht trivial ist und viel Erfahrung im Bereich der System- und Datenintegration voraussetzt. Produkte wie der Talend Data Catalog legen einen hervorragenden Grundstein für den Aufbau eines unternehmensweiten Metadatenmanagements.

Bild - Spielfiguren

Die zu verarbeitenden und zu integrierenden Datenmengen haben in den letzten Jahren massiv zugenommen und die Tendenz ist weiter steigend. Die Innovationszyklen werden immer kürzer, und Unternehmen müssen agil auf den sich schnell verändernden Markt reagieren. Daher ist es umso wichtiger, sich als Unternehmen selbst zu verstehen. Auf Prozessebene sind viele Unternehmen hier erfolgreich. Die Ebene der IT wird jedoch vielfach vernachlässigt und das, obwohl sie das Rückgrat der meisten Prozesse ist. Sie werden durch ein konsequentes Metadatenkonzept nicht zwangsläufig viel schneller. Aber Sie werden agiler und können sich auf ihre zentralen Fragestellungen fokussieren. Das gewonnene Budget aus effektiveren Entscheidungsprozessen können sie dann in einen Vorteil stecken: Qualität.

Fragen Sie sich einmal, wie viel Sie über Ihre eignen Daten eigentlich so wissen. Gerne unterstützen wir Sie beim Finden der Antworten. Ihr Ansprechpartner bei QuinScape: Tanja Menke, +49 231 / 533 831 259, talend@quinscape.de).