Speakers
Erhard Rahm
(Universität Leipzig)
Eric Peukert
(Universität Leipzig)
Description
Die Analyse sehr großer Netzwerkdaten gewinnt immer mehr an Bedeutung, zum Beispiel um Erkenntnisse aus Logistik-, Geschäfts- und sozialen Netzwerken zu gewinnen. Durch die Repräsentation von Netzwerkdaten als Graph lassen sich komplexe Beziehungsgeflechte zwischen heterogenen Datenobjekten analysieren. In der Forschung existieren bereits wertvolle analytische Graph-Algorithmen, die jedoch oft extrem rechenintensiv und nicht ohne Weiteres in der Praxis anwendbar sind. Klassische Data Warehouse-Lösungen sind für graphbasierte Analysen ungeeignet, da sie weder Graphmodelle noch Graphalgorithmen unterstützen.
Im Vortrag zeigen wir Gradoop, ein auf Apache Flink basierendes Open Source-System, welches massiv verteilte Algorithmen zur Netzwerkanalyse bereitstellt und die Integration und Analyse von Geschäftsdaten ermöglicht. Das Gradoop-Framework erlaubt es Data Scientists und Analysten komplexe Analysen von Graphen mit Hilfe von einfachen und intuitiven analytischen Workflows auszudrücken. Neben Operatoren zum Datenmanagement umfasst das Datenmodell eine breite Palette von analytischen Operatoren und Data-Mining-Algorithmen. Gradoop ermöglicht eine vollkommen neue Art der Analyse von Geschäftsdaten. Die dabei gewonnen Erkenntnisse bieten großes wirtschaftliches Potential in verschiedenen Domänen. Wir präsentieren die praktische Anwendung für Business Intelligence am Beispiel einer Quote-to-Cash Analyse und am Beispiel einer Erkennung von verdächtigen Mustern in Geschäftsdaten.
Track | BDAHM |
---|
Primary authors
Erhard Rahm
(Universität Leipzig)
Eric Peukert
(Universität Leipzig)