von Dr. Norbert Jesse mit freundlicher Unterstützung durch Christian Schneider

 

Intelligente Netze für die Energieverteilung (smart grids), integrale Mobilität und kollaborativ-autonom sich organisierende Produktion: Die datengetriebene „Vernetzung aller Dinge“ ist faszinierend und verändert unsere Welt. Doch sind die technologischen Potentiale und auch Grenzen (Gefahren?) bei weitem nicht erfasst.

 

 

Klaus Schwab, Founder and Executive Chairman des World Economic Forum hat unmissverständlich in Bezug auf diese 4. Industrielle Revolution mit ihren cyber-physikalischen Systemen formuliert: „We stand on the brink of a technological revolution that will fundamentally alter the way we live, work, and relate to one another. In its scale, scope, and complexity, the transformation will be unlike anything humankind has experienced before.“

Das Internet of Things (IoT), d. h. die Maschinen mit ihren Sensoren und digitalen Zwillingen, wird zu einem Treiber der sog. Data Economy, in der schrittweise sogar Marktplätze für den unternehmensübergreifenden Austausch von IoT-Daten entstehen. Voraussetzung für den Erfolg: Auch diese Daten-Assets erfordern eine Datenstrategie und eine Governance mit definierten Regeln und Prozessen. Dies wollen wir im Weiteren ansatzweise begründen.

Zunächst: Mein persönliches Interesse an dieser 4. Industriellen Revolution führe ich auf zwei Gründe zurück. Zum einen ist das Gras woanders grüner, d. h. in Bezug auf IoT stellen sich viele sehr interessante Fragen zu den Voraussetzungen für erfolgreiche Use Cases und dem künftigen technischen Entwicklungspfad. Zum anderen aber hatte mich das Thema Roboterfußball als Testfall für das Zusammenspiel halbwegs intelligenter Automaten (multi-agenten systems) vor längerer Zeit einmal umgetrieben.

Damals wurde mir bewusst, dass das Management der Sensordaten eine beachtliche Herausforderung darstellt. Es ging dabei um den Weg „from sensor to insights“. Notwendig war es zunächst, z. B. Bilddaten der Kameras auszuwerten, Positionsdaten von Radsensoren zu interpretieren und Geschwindigkeiten zu messen. Die Daten mussten qualitätsgesichert, zu Informationen verdichtet und in Realzeit in Aktionen umgesetzt werden. Das ultimative Ziel: durch kluge Entscheidungen auf dem Spielfeld mehr Tore schießen als zu erhalten. Oder auf englisch: „Get the data, and make use of it!”.

Am Ende einer Datenstrecke geht es stets um gute Entscheidungen. Wir wollen alles wissen: Was passiert gerade (Deskription), warum passierte es (Diagnose), was wird passieren (Prognose) und was ist zu tun (Handlungsleitung). Voraussetzung hierfür sind stets und unter allen Umständen hinreichend gut gepflegte Daten.

Herausforderungen für IoT-Datenmanagement

Sensordaten können sich in vielfältiger Hinsicht unterscheiden, wie die nachfolgende Tabelle zeigt:

 

 

Für den office floor, also das Datenmanagement in Büro-Anwendungen, sind die Arbeitsschritte für das Datenmanagement gut beschrieben und zunehmend etabliert, wobei es natürlich kein one-size-fits-all-Lösung gibt. Typischen Aufgaben, die es zu lösen gilt, sind gleichwohl

  1. Identifizierung und Korrektur von Datenfehlern (Data Cleaning)
  2. Identifizierung der besonders bedeutsamen Variablen für die jeweilige Fragestellung (Feature Selection)
  3. Veränderung des Formats oder der Struktur von Variablen, um Datenkompatibilität zu schaffen (z. B. Normierung auf die Skala 0 – 1 (Data Transformation)
  4. Verschneiden (Blending) von Datenbeständen und Ableitung neuer Daten aus den vorhandenen (Feature Engineering)
  5. Projektion eines hochdimensionalen Datensatzes in einen niedrig dimensionalen Raum (Dimensionality Reduction).

Wie stellt sich nun Datenmanagement im Kontext von IoT dar, also z. B. bei selbstfahrenden Fahrzeugen, Ölplattformen, Smart Factories (Industrie 4.0), intelligenten Gebäuden oder Smart Farming? Sind die Herausforderungen komplexer oder existieren jenseits der grundsätzlichen Gemeinsamkeiten doch andere Anforderungen?

Nehmen wir die selbstfahrenden Fahrzeuge als Beispiel: Sie sind vollgestopft mit unterschiedlichen Sensoren, die bis zu 1 GB pro Minute an Daten über den Zustand und das Umfeld eines Fahrzeugs liefern und unterschiedliche Charakteristika aufweisen (siehe Tabelle). Nicht alle Daten müssen für Auswertungen gespeichert und analysiert werden (= direkte Umsetzung in Aktionen), gleichwohl verbleibt erheblicher Datenstrom, der gesammelt, bearbeitet und schließlich in handlungsrelevante Entscheidungen überführt werden muss (auch Nichthandeln ist Entscheiden).

Die Frage einer adäquaten Datenqualität stellt sich im IoT-Umfeld wie in sog. Business Applications – nur mit einer anderen Akzentsetzung. Nicht nur die Menge der Sensordaten und die Anforderung an Entscheidungen in Realzeit können eine besondere Herausforderung darstellen. Zusätzlich zu den Aufgaben, wie sie oben benannt sind, können

  • Sensoren oder deren Verbindung zum Netzwerk ausfallen,
  • extreme Umweltbedingungen die Datenlieferung beeinträchtigen und
  • Datenmanipulationen die Informationen verfälschen.

Die Feststellung eines Ausfalls eines Sensors oder ständige starke Abweichungen von Erwartungswerten mögen ggf. kein Problem sein. Schwieriger zu beurteilen sind aber

  • zeitlich wechselnde Messabweichungen,
  • die Lieferung falscher Daten ausschließlich in bestimmten Messintervallen oder
  • gelegentliche Abweichungen (outlier errors) oder völlig stochastischer Fehler.

Eine Folgeabschätzung für eine inadäquate Datenqualität und ein angemessenes Risikomonitoring sind letztlich unerlässlich, um zu verstehen, wie sich etwa der Ausfall einzelner Sensoren oder Knoten auf die Entscheidungsfindung auswirkt.

Dass es sich in den seltensten Fällen um eine leichte, quasi nebenbei zu erledigende Aufgabe handelt, dürfte offensichtlich sein.

Datenmanagement und Datenarchitekturen für IoT

Wie sehen skalierbare Architekturen für das IoT-Datenmanagement aus? Es liegt nahe, die Sensordaten in Schichten (Layern) zu bearbeiten. Ein interessanter Architekturvorschlag sieht beispielsweise drei Layer vor:

  • einen Acquisiton Layer, in dem die Rohdaten ggf. gefiltert, gespeichert und vorverarbeitet werden – dies mag direkt an der Maschine (edge computing) oder in Zwischenknoten (fog computing) geschehen,
  • einen Processing Layer, in dem die relevanten Daten zusammengeführt, geprüft, „irgendwie“ bereinigt und qualitätsgesichert werden,
  • einen Utilization Layer für die Entscheidungsfindung.

Konkrete Aufgaben, die gemäß diesem Architektur-Framework in den Layern zu bearbeiten sind, könnten sein:

 

 

An dieser Stelle ist ein Hinweis auf die Regelungsfamilie ISO/IEC 8000-6x sinnvoll. Diese Norm ist zweifellos eine wichtige Hilfestellung für die Bewertung und Verbesserung eines Datenmanagements (data maturity) im IoT-Kontext. Die Umsetzung in einem durch Sensordaten getriebenen Umfeld dürfte jedoch alles andere als trivial sein. Aspekte, die es hierbei zu entscheiden gilt, betreffen – ohne Anspruch auf Vollständigkeit:

  • eine umfassende Dokumentation der Verarbeitung von Sensordaten,
  • ein Verständnis für die erforderlichen Metadaten,
  • die Explizierung von Risiken,
  • ein belastbares Regime für das Monitoring – unter Einbezug von human inspection und Aspekten der Replikation und Speicherung von Rohdaten.

Zusammenfassend lässt sich das folgende Zwischenfazit ziehen:

  • IoT erfordert eine effektive Datenmanagement-Kompetenz und muss als Teil einer zukunftsorientierten Strategie für die Data Economy angesehen werden.
  • Es bedarf auch hier einer Governance für die IoT-Datenbewirtschaftung mit Regelungen für die Verantwortlichkeiten, Prozesse, Architekturen u.v.m.

 

Literaturhinweise:

Mario Mantoan: Data Mining in IoT, IoT Zone Tutorial, 29.1.2022

Perez-Castillo, R.; Carretero, A. G., Rodriguez, M.; Caballero, I.; Piattini, M.; Mate, A.; Kim, S.; Lee, D.: Data Quality Best Practices in IoT Environments

https://en.wikipedia.org/wiki/ISO_8000

 


Dr. Norbert JesseDr. Norbert Jesse

Geschäftsführer, QuinScape GmbH

Neben der Geschäftsführung bei QuinScape – mit Schwerpunkten in den Bereichen Wissensmanagement, Big Data und Internet of Things – ist der zweifache Familienvater Lecturer an der TU Wien und Visiting Professor an der University for Business and Technology (UBT) in Pristina, Kosovo. Viele Jahre war Norbert Jesse aktiv als Vice-President der Federation of International Robot-Soccer Association.