Daten verteilen sich zunehmend auf verschiedentliche Systeme, Cloud und Social Media erschaffen immer neue Dateninseln. Wo früher einzelne, ausgewählten Datenbanken und vielleicht eine Handvoll Excel-Dateien genutzt wurden, ist ein wahrer Zoo aus unterschiedlichsten Datenquellen entstanden. Zudem kommen immer wieder auch neue Formate und Technologien wie bpsw. Webservices mit JSON-Daten hinzu. Dagegen steht die Anforderung, Daten aus diesen Systemen immer schneller für Auswertungen in einem Gesamtkontext zur Verfügung zu haben. Dies bringt so manche BI-Abteilung ins Schwitzen. Eine mögliche Lösung für diesen Gegensatz ist die Datenvirtualisierung. Welche Probleme sie löst und welche Möglichkeiten sie schafft, beschreiben wir im nachfolgenden Artikel.

Die Bereitstellung von Daten für Auswertungen ist eine der größten Herausforderungen für Unternehmen im Kontext von BI. Dabei liegt der Fokus nicht mehr nur auf den klassischen Datawarehouse-Prozessen (z.B. Beladung per ETL/ELT), bei denen wenige zentrale Systeme angebunden werden, sondern vielmehr auf der Integration einer stetig größer werdenden Vielfalt von Datenquellen. Diese verteilten Daten sollen in der Regel aber nicht isoliert sondern im Zusammenhang betrachtet werden und müssen in immer kürzeren Zyklen für Auswertungen zur Verfügung stehen.

Klassische BI Tools haben Probleme mit vielfältigen Datenquellen

Etablierte Berichtswerkzeuge, wie der JasperReports Server, bieten die Möglichkeit, auf verschiedenen Datenquellen (z.B. einem Datawarehouse) Auswertungen zu definieren. Die meisten dieser Werkzeuge arbeiten sehr gut auf datenbankbasierten Datenquellen, haben jedoch schon größere Schwierigkeiten bei der Anbindung anderer Quellen wie Dateien, Webservices oder Cloud-Diensten und scheitern in der Regel daran, diese innerhalb einer Auswertung zusammenzuführen. Zwar bietet bspw. der JasperReports Server sogenannte virtuelle Datenquellen, die jedoch darauf abzielen, mehrere Datenbanken zu einer einzelnen, virtuellen Sicht zusammenzuführen. Dies funktioniert jedoch nicht so einfach, um Datenbanken und Webservices zu kombinieren.

Datenvirtualisierung verbindet Dateninseln

An dieser Stelle bietet TIBCO mit seinen Jaspersoft Advanced Data Services (ADS) eine Lösung, um genau dieses Problem zu adressieren. Die Jaspersoft ADS basieren auf TIBCOs marktführender Lösung TIBCO Data Virtualization (TDV), die lediglich in ihrer Lizenzierung auf den Anwendungsfall Jaspersoft eingeschränkt sind.

Mit Jaspersoft ADS haben Sie Zugriff auf eine Vielzahl an Datenquellen, angefangen bei allen klassischen Datenbanken, die über JDBC angesprochen werden können, über dateibasierte Datenquellen (Excel, CSV, XML) und REST-Services (JSON) bis hin zu Social Media (Facebook) und Webanalyse-Systemen (Google Analytics).

Der Clou dabei ist, dass alle diese Dateninseln zu virtuellen Datenquellen zusammengeschaltet und über Jaspersoft ADS performant und mit den jeweils aktuellen Daten abgefragt werden können. Dabei kommen umfangreiche Optimierungs-Algorithmen zum Tragen, die für eine möglichst effiziente Abfrage der beteiligten Systeme sorgen. Es muss also nicht auf die Ausführung eines nächtlichen Datawarehouse-Prozesses gewartet werden, um die passenden Daten für Ihre Auswertung zu erhalten.

Für den Konsumenten einer solchen virtuellen Datenquelle stellt sich diese wie eine normale Datenbank dar. Diese können Sie problemlos in den JasperReports Server einbinden und damit auch als Quelle für Domänen und Ad-hoc Berichte nutzen.

Vorsprung bei Mergers & Acquisitions

Darüber hinaus können Sie über die Jaspersoft ADS natürlich auch mehrere ähnliche Datenquellen zu einer Gesamtquelle zusammenführen. Dies können beispielsweise mehrere CRM Systeme sein, die im Rahmen einer Übernahme eines anderen Unternehmens hinzugekommenen sind und mit den eigenen Systemen zu einer Gesamtsicht vereint werden müssen. Damit erhalten Sie einen nicht zu vernachlässigenden zeitlichen Vorsprung in der Auswertung gemeinsamer Potenziale, noch bevor die Systeme tatsächlich (physikalisch) zusammengeführt wurden, was mitunter Monate oder Jahre dauern kann.

Quellen ändern sich

Um bei dem letzten Beispiel zu bleiben, können sich Datenquellen über die Zeit auch ändern. Wurden nach der Akquisition irgendwann die einzelnen Datenquellen zu einer (vielleicht neuen) Datenquelle zusammengeführt, ändert sich auch die Grundlage für die darauf basierenden Auswertungen. Analysen, die auf die einzelnen Datenquellen direkt zugreifen, würden bei einer Zusammenführung überarbeitet und ggf. sogar neu erstellt werden müssen. Mit der Zeit werden auch durchaus bestehende Systeme durch neue ersetzt. Durch die Nutzung von Jaspersoft ADS schaffen wir eine logische Datenzugriffsschicht, die von der tatsächlichen physikalischen Datenschicht entkoppelt werden kann, so dass bei einer Änderung einer zugrundeliegenden Datenquelle nur die Anbindung der Datenschicht angepasst werden muss, danach aber alle Auswertungen ohne weitere Anpassungen wieder funktionieren.

Der Brückenbauer in Ihrer BI-Landschaft

Mit Jaspersoft ADS haben wir somit eine neue Ebene in unserer BI-Landschaft geschaffen, mit der wir eine Reihe von Vorteilen erzielen können. Zum einen haben wir mit Jaspersoft ADS die Möglichkeit, verschiedenste Dateninseln zusammenzuführen, um diese gemeinsam in Auswertungen zu betrachten. Zudem können wir jeweils auf aktuelle Daten zurückgreifen, ohne auf Beladungszyklen eines Datawarehouse angewiesen zu sein und zuletzt machen wir uns ein stückweit unabhängig von der tatsächlichen physikalischen Datenstruktur. Jaspersoft ADS baut dabei Brücken zwischen den Dateninseln, die sich zunehmend in Unternehmen auftun und ermöglicht Auswertungswerkzeugen wie Jaspersoft eine gesamtheitliche Sicht auf all Ihre Daten.

Erfahren Sie mehr über die Möglichkeiten von JasperReports Server und Jaspersoft Advanced Data Services in dem Sie sich für unser kostenfreies Online-Seminar anmelden, das wir zusammen mit TIBCO am 28.03.2019 durchführen werden. Oder Sie sprechen uns einfach unverbindlich an (Tanja Menke, +49 231 / 533 831 259, tibco@quinscape.de).