Oct 11 – 12, 2017
Karlsruher Institut of Technologie - Campus South
Europe/Berlin timezone

Das Web als Firmendatenbank: Big Data für Marketing, Vertrieb und Pressearbeit

Oct 11, 2017, 3:00 PM
30m
-1.014 (Building 20.30)

-1.014

Building 20.30

Presentation Use-Cases

Speakers

Dr Matthias Keller (Echobot)Mr Nico Schlitter (KIT/SCC)

Description

Informationen zu Bestandskunden und potentiellen Kunden sind von großer Bedeutung für erfolgreiche PR-, Marketing- und Vertriebsprozesse. Die aktuellste und größte Informationsquelle für solche Informationen ist das Web. Der größte Teil der Informationen liegt dort allerdings unstrukturiert in Textform vor ist daher für gezielte Abfragen und quantitative Analysen nicht verfügbar – und genau dies zu erreichen ist das Ziel der Echobot Media Technologies GmbH aus Karlsruhe. Echobot betreibt Webcrawler, die täglich ca. eine halbe Mio. Nachrichten-Artikel sowie 2-3 Mio. Social-Media-Postings aus dem Web erfassen und eine Vielzahl von Unternehmenswebsites in regelmäßigen Abständen indexieren. Um diese Informationen verwertbar zu machen, d.h. Wissen aus den Daten zu generieren und es den betroffenen Firmen zuzuordnen, forscht Echobot an Analysemethoden, die entsprechend skalieren. Im Vortrag wird ein Überblick über die damit verbunden Problemstellungen gegeben und ein Projekt, das in Zusammenarbeit mit dem KIT durchgeführt wurde, genauer vorgestellt. Ziel des Projektes war die Prädiktion der Branchenzugehörigkeit einer Firma auf Basis der Firmen-Website. In einem Zwischenschritt wurden die Website-Inhalte zunächst in Themen-Vektoren überführt, auf deren Basis dann verschiedene Klassifikatoren trainiert und evaluiert wurden. Die hohe Feature-Dimensionalität und große Anzahl verschiedener Klassen stellten dabei besonderen Herausforderungen dar, auf die im Vortrag näher eingegangen wird.
Track SDIC

Primary authors

Dr Christoph König (KIT/SCC) Dr Matthias Keller (Echobot)

Presentation materials