Blog

Blog2018-07-18T15:55:15+02:00

Blog.

Rekursive Hashmap, warum nicht?

Parent-Child-Hierarchien und deren Relationen miteinander verknüpft darzustellen und diese am besten auch noch dynamisch, nach ihrem Vorkommen zusammenzubauen, ist meist keine erfreuliche Aufgabe. Wir haben in diesem Artikel eine Lösung ausgearbeitet und beispielhaft in Talend umgesetzt. Zuerst klären wir einmal die Begrifflichkeiten: Was ist eine Hashmap? Laut Definition von Talend ist eine Hashmap eine Möglichkeit, Daten direkt in den Speicher zu schreiben und vorzuhalten, um die Daten von dort performant auszulesen, sie zu bearbeiten oder sie zu verändern. Was ist eigentlich Rekursion? Unter dem Begriff Rekursion versteht man den Aufruf einer Funktion, die einen Teil der Arbeit ermittelt und sich [...]

22.05.2019|Kategorien: Blog, Data & Analytics|Schlagwörter: , , , , , |

JasperReports IO – Unternehmensreporting auf einem neuen Level

Geht es um das unternehmensweite Reporting, so führt meist kein Weg an TIBCO Jaspersoft vorbei. Dieses auf Java basierende Open-Source-Berichtswerkzeug ist eine optimale Lösung, um Entscheidern, Mitarbeitern oder Kunden, Zahlen und Fakten in ansprechender Weise zu präsentieren. Der Fokus dieser Lösung liegt dabei auf der Integration von Berichten in die bestehende Applikationslandschaft. Durch den quelloffenen Ansatz lässt sich Jaspersoft einfach an individuelle Wünsche anpassen und erfreut sich einer großen Community. Kleiner Service – flexibel und skalierbar Nun geht TIBCO einen Schritt weiter und führt mit JasperReports IO ein Werkzeug ein, das den aktuellen Trends in der Softwareentwicklung folgt. Die früher [...]

07.05.2019|Kategorien: Blog, Data & Analytics|Schlagwörter: , , , , |

Datenvirtualisierung: Wie Sie Brücken zwischen Ihren Dateninseln bauen können

Daten verteilen sich zunehmend auf verschiedentliche Systeme, Cloud und Social Media erschaffen immer neue Dateninseln. Wo früher einzelne, ausgewählten Datenbanken und vielleicht eine Handvoll Excel-Dateien genutzt wurden, ist ein wahrer Zoo aus unterschiedlichsten Datenquellen entstanden. Zudem kommen immer wieder auch neue Formate und Technologien wie bpsw. Webservices mit JSON-Daten hinzu. Dagegen steht die Anforderung, Daten aus diesen Systemen immer schneller für Auswertungen in einem Gesamtkontext zur Verfügung zu haben. Dies bringt so manche BI-Abteilung ins Schwitzen. Eine mögliche Lösung für diesen Gegensatz ist die Datenvirtualisierung. Welche Probleme sie löst und welche Möglichkeiten sie schafft, beschreiben wir im nachfolgenden Artikel. Die [...]

20.03.2019|Kategorien: Blog|Schlagwörter: , , , |

Stitch + Talend = EL + T?

Talend wird vielfach als ETL- oder auch ELT-Werkzeug im Bereich von Business Intelligence Lösungen eingesetzt. ETL steht dabei für Extrahieren, Transformieren und Laden. Mit dem Zukauf von Stitch, einem reinen EL-Werkzeug in der Cloud, stellt sich die Frage: Ist Stitch und Talend die Kombination von EL und T? Talend und Stitch Talend ist kein reines ELT/ETL-Werkzeug sondern adressiert als Plattform viele weitergehende Themen wie z. B. die Echtzeit-Datenintegration, die Datenvorverarbeitung im Self Service (Data Preparation), Master Data Management (MDM) oder Big Data (u.a. den Umgang mit semistrukturierten und unstrukturierten Daten). Insgesamt positioniert sich Talend als vollumfängliche, moderne Datenintegrationsplattform. Dennoch bleibt [...]

04.03.2019|Kategorien: Blog|Schlagwörter: , , , |

Data Warehouse Modernisierung

Im Rahmen der Tagung der Deutschen Data Vault User Group (DDVUG e.V.) habe ich an einem Kundenbeispiel illustriert, wie und warum wir ein Data Warehouse auf Basis von Data Vault modernisiert haben. Einige übergreifende Aspekte hiervon möchte ich nachfolgend allgemeiner zusammenfassen.   Warum Data Warehouse Modernisierung? Das Data Warehouse (DWH) ist das zentrale Datenlager eines Unternehmens. Ein einer Zeit von „Daten als Öl“ oder „Daten als vierter Produktionsfaktor“ liegt auf der Hand, dass das DWH zum zentralen Organ eines Unternehmens wird und an Wichtigkeit gewinnt. Dennoch sind viele DWHs in die Jahre gekommen und werden den Anforderungen von heute nicht [...]

Automatisiertes Maschinelles Lernen – der heilige Gral?

Maschinelles Lernen ist auf dem Siegeszug. Speziell für die Erkennung von Mustern in Daten ist Maschinelles Lernen das Mittel der Wahl, konkret zum Beispiel eingesetzt bei der Betrugserkennung, der Bilderkennung, im Bereich der vorausschauenden Maschinenwartung oder der Prognose von Zugverspätungen. Hinter dem Maschinellen Lernen befindet sich ein ganzer Werkzeugkasten von Algorithmen, die jeweils mit sogenannten Hyperparametern genauer eingestellt werden können. Beim gängigen „k-Nearest Neighbours“ kann so zum Beispiel die Anzahl der in Betracht gezogenen Nachbarn „k“ eingestellt werden, bei einem Neuronalen Netzwerk u.a. die gesamte Architektur des Netzes. Eine wichtige Aufgabe eines Data Scientists besteht darin, für das jeweilige Problem [...]

19.02.2019|Kategorien: Data & Analytics|

Die Talend-Vision – und warum wir ein engagierter Partner sind

Folgt man der Einschätzung von HBR, so ist der Weg zu einem daten-zentrierten Unternehmen aus drei Gründen steinig: 47% der Unternehmen haben Integritätsprobleme in ihren Daten, Analysten verschwenden gemeinhin 80% ihrer Zeit mit der Datenvorbereitung und 55% der Daten sind nicht oder nicht angemessen verfügbar. Die Konsequenzen sind unternehmenskritisch. Ohne ausgezeichnete Daten keine umsatztreibende Datenanalyse und kein Gleichklang von Governance, Risk & Compliance (GRC). Letztlich gilt: Wer die Daten beherrscht, besitzt entscheidende Wettbewerbsvorteile. Diesen Bedarf adressiert Talend mit der „Talend Data Fabric“, einer weltweit führenden Plattform für die digitale Transformation von Unternehmen. Es geht Talend um die Orchestrierung, Kontrolle und [...]

06.02.2019|Kategorien: Data & Analytics|Schlagwörter: , , |

Unsere Schwerpunktthemen und Positionierung

Seit vielen Jahren verfolgen wir bei der QuinScape die Strategie, für ausgewählte Plattformen eine führende Rolle im deutschsprachigen Raum einzunehmen und hiermit eine einzigartige Positionierung als Experte zu erreichen. Die Plattformen gruppieren sich dabei thematisch in die Bereiche Data & Analytics (u.a. Talend und TIBCO) sowie Agile Enterprise Collaboration (Intrexx, cplace). In Ergänzung dazu haben wir nach wie eine zentrale Kompetenz in der Individualentwicklung komplexer Systeme („Custom Made“), dem Thema, aus dem heraus QuinScape ursprünglich gegründet wurde. Der Fokus liegt hier historisch auf der Java Technologie, entwickelt sich aber laufend weiter. Begleitend haben wir Kompetenz im Bereich „Design & User Experience“ aufgebaut, da dieses [...]

Data Virtualization: Analytics ohne Data Warehouse

Beim klassischen Business Intelligence Ansatz werden Daten zentral im Data Warehouse vorgehalten, das dann als Grundlage für Auswertungen dient. Ein Vorteil  liegt in der Zentralisierung: Die Anbindung, Strukturierung und Bereitstellung von Daten erfolgen an zentraler Stelle. Insgesamt können somit eine definierte Qualität sichergestellt und Governance-Aspekte berücksichtigt werden. Die Kehrseite der Medaille ist jedoch häufig die fehlende Agilität: Der zentrale Ansatz erweist sich als Flaschenhals. Zwar sind die Kerndaten einer Organisation in aller Regel berücksichtigt. Wenn Fachanwender oder Analysten aber spezielle Daten im Data Warehouse ergänzt haben möchten, kann dies Monate oder sogar Jahre dauern, insbesondere wenn die Anforderung keine hohe [...]

12.11.2018|Kategorien: Blog, Data & Analytics|Schlagwörter: , , , , |

QuinScape GmbH