IP Deutschland GmbH
IP Deutschland GmbH
SMART DATA – CLEVER NUTZEN

Schwerpunkt DatenDie weltweit im Internet erzeugte und in sogenannten Data Lakes und Big-Data-Systemen gesammelte Datenmenge liegt aktuell bei jährlich 16,1 Zettabyte. Eine gigantische Menge – und eine gewaltige Herausforderung für Unternehmen. Denn die richtigen Daten müssen nicht nur gefunden, entschlüsselt und analysiert werden, es müssen auch Algorithmen entwickelt werden, die sie sinnvoll nutzbar machen. Bei der Mediengruppe RTL ist ein eigenes Expertenteam mit der Erhebung, Auswertung und Erforschung von  Nutzungsmöglichkeiten großer Datenmengen befasst. Das Top-Thema – hinter der bunt schillernden Fassade unserer modernen Medienwelt.

Daten sind das neue Gold

Daten sind die neue Währung der Medienwelt. Wenn es um Werbung und Kampagnenerfolg geht, stimmt dieser Satz allemal. Denn eine Werbebotschaft kann umso besser und effektiver wirken, je relevanter und qualitativ hochwertiger die zugrunde liegenden Daten sind, je mehr über Interessenten und potenzielle Käufer bekannt ist – und je zeitlich näher zur Kaufabsicht die Botschaft platziert wird. Die alltägliche Internetnutzung – z. B. beim Online-Shopping, bei Produktrecherchen, bei der Suchmaschinennutzung, in sozialen Netzwerken und auf Datingportalen – erzeugt eine Unmenge wertvoller Daten. Doch all diese Daten bringen erst dann etwas, wenn sie intelligent genutzt werden.

Bedürfnisse intelligent befriedigen

Diese Erkenntnis ist keinesfalls neu. Schon seit 15 bis 20 Jahren werden Kampagnen auf möglichst geringe Streuverluste hin ausgerichtet. Bereits die ersten Banner waren mit einer Art Targeting-Filter versehen. So wurden schon sehr früh die User, die sich in einer Community mit Geschlechts- und Altersangabe angemeldet hatten, mittels simpler Techniken verschiedenen Zielgruppen zugeordnet, die werblich spezifisch angesprochen wurden. Den Bedarf an zielgruppengenauer Webansprache gibt es also schon seit etwa zwei Jahrzehnten. Doch die zur Verfügung stehenden Datenmengen waren seinerzeit viel kleiner und die verfügbaren Analysetechniken weit weniger ausgeklügelt. Heute stehen Unternehmen definitiv vor anderen Herausforderungen: Gigantische Datenmengen müssen mittels immer ausgefeilterer Tools und Techniken in Rekordzeit verarbeitet und zielführend genutzt werden.

Mit Datenexperten der Mediengruppe im Gespräch

FOURSCREEN hat mit den Mitgliedern des Smart-Data-Teams der Mediengruppe RTL und dessen verantwortlichem Kopf Volker Stümpflen, Leiter Data Strategy & Operations, über deren aktuelle Projekte gesprochen. Welche Herausforderungen gilt es zu meistern, wie wird der Werbemarkt der Zukunft aussehen – und was hat Kernphysik damit zu tun?

Datenexperten der MG
v.l.n.r. Dr. Olga Lalakulich, Hauke Führes; Dr. Bin Song, Dr. Volker Stümpflen; Nina Berghoff, Barbara Geller, Jos Gesenhues

Herr Stümpflen, Ihr Team besteht aus Menschen, die man aufgrund ihres Werdeganges nicht unbedingt in der Medienbranche vermuten würde. Sie selbst kommen als Chemiker auch aus einer eher artfremden Ecke. Wie geht das alles zusammen?

Volker Stümpflen: Auf den ersten Blick mag das so erscheinen, aber wenn man sich näher mit den Themen Big Data und Smart Data befasst, ergibt es durchaus Sinn, dass hochkompetente Wissenschaftler in diesem Bereich für die Mediengruppe tätig sind. Unser Team besteht im Kern aus Menschen, die sich im Bereich Mathematik und Informatik zuhause fühlen, Programmierung gehört zur täglichen Routine. Gerade im Bereich Big und Small Data ist ein sicherer Umgang mit großen Zahlen und Datenmengen essenziell, da braucht es Profis, wie wir sie haben. Mir selbst hilft meine Expertise aus der physikalischen Chemie und Systembiologie auch, Prozesse für hochkomplexe Analysen zu übertragen. Es ist nicht so wichtig, ob man Daten für das Verständnis von Krankheiten oder für die Medienbranche analysiert, die Abläufe sind relevant, und die lassen sich übertragen.

Frau Lalakulich, inwieweit profitieren Sie als Kernphysikerin von Ihren Erfahrungen, wo können Sie innerhalb der Mediengruppe Ihre Expertisen einbringen?

Olga Lalakulich: Als Wissenschaftlerin der theoretischen Physik bin ich gewohnt, komplexe Vorgänge beziehungsweise komplexes Datenmaterial zu analysieren, das Relevante von Unwichtigem zu trennen und aus dem verbleibenden Material – das dann immer noch sehr umfassend und komplex ist – verständliche Modelle zu erarbeiten, die auf operativer Ebene eingesetzt werden können. Programmierung gehört genauso zur Physik wie heute zu meinem Job. Da gibt es auf jeden Fall Parallelen.

Können Sie uns das anhand eines Praxisbeispiels erklären?

Olga Lalakulich: Aktuell setzen wir uns mit gewaltigen Datenmengen auseinander. Diese gilt es abzugleichen, auf ihre Eigenschaften hin zu analysieren und mit anderen Datensätzen zu verbinden, um letztlich Scores zu berechnen, die derzeit bei etwa 60 Millionen am Tag liegen. Diese Scores drücken Wahrscheinlichkeiten aus, dass bestimmte Datensätze aufgrund analysierter, gleicher oder ähnlicher Interessen einer bestimmten Zielgruppe angehören. Um zu validen Ergebnissen zu kommen, braucht man unter anderem Programmierexpertise und einen guten Blick für komplexe Strukturen.

Jos Gesenhues: Übrigens sind die Quellen, in denen die Daten generiert werden, sehr unterschiedlich. Die Datensätze stammen überwiegend aus internen Logfiles oder aus unserem Panel der „I love MyMedia“-App. Aber auch aus externen Quellen wie IVW, InfOnline oder Heart Beat werden uns Daten zugeliefert, die alle in unserem Data Lake gesammelt, ausgewertet und aggregiert werden.

Hauke Führes: Und für die automatisierte Aufbereitung der Daten arbeiten wir an der Optimierung unserer Big Data-Plattform, die uns nicht nur die technologische Basis liefert, sondern uns auch erlaubt, Daten einerseits retrospektiv und andererseits prognostisch zu verwerten.

Können Sie kurz erklären, welche Ergebnisse retrospektiv evaluiert und verarbeitet werden und zu welchem Zweck?

Hauke Führes: Kurz gesagt, analysieren wir die Bewegungsdaten auf Einzeluserbasis und erstellen daraus Profile. Das Ziel ist, diese Profile mit den Daten der Besucher abzugleichen, von denen wir aufgrund ihrer seltenen Besuche auf unseren Seiten nur wenig wissen, und sie so zu profilieren. Das heißt: Wir suchen in den Bewegungsdaten nach Analogien und berechnen daraus neue Profile, die sich dann operativ nutzen lassen.

Bin Song: Außerdem nutzen wir die Daten, um über Empfehlungen den Traffic auf unseren Seiten zu erhöhen. Dazu sind allerdings umfangreiche Analysen notwendig. Konkret gesagt arbeiten wir zurzeit an einer Recommendation Engine für n-tv und für TV NOW. Hierfür werden die Userdaten in Abhängigkeit von Besuchszeiten, Interessen, aufgesuchten Websites usw. klassifiziert und mit anderen Datensätzen abgeglichen. Sofern Analogien im Userverhalten erkennbar werden, sind gegenseitige Empfehlungen durchaus sinnvoll. Das heißt: Hat User 1 ein Video z. B. über Automobile gesehen und User 2 zeigt in seinen Bewegungsdaten Interesse an Automobilen, wird angenommen, dass er sich für dasselbe Video interessieren könnte, das User 1 gesehen hat und erhält hierfür
eine Empfehlung.

Ende Mai tritt die Europäische Datenschutzgrundverordnung in Kraft. Wie sehen Sie diese Verordnung?

Volker Stümpflen: Ehrlich gesagt gar nicht negativ. In erster Linie bekommen Nutzer die Kontrolle über ihre Daten zurück, das war lange Jahre nicht der Fall. Dass sie dafür mehrere Plattformen besuchen müssen, um ihre Daten zu verwalten, ist die Kehrseite. Das ist einfach aufwändig. Aber an dieser Stelle helfen ja Allianzen, wie auch die Mediengruppe eine forciert hat. Aber insgesamt finde ich gut, dass es für das Thema Datenschutz eine höhere Sensibilität gibt.

Datenexperten der MG

Hier finden Sie alles rund um das Thema Smart Data, zu unseren Produkten, zur Datenverarbeitung innerhalb der Mediengruppe RTL sowie zur DSGVO. Und - lernen Sie unsere Datenexperten kennen.

Wir stellen vor: die Experten

Volker SturmpflenDr. Volker Stümpflen

Promotion in physikalischer Chemie an der Universität Marburg über organische und polymere Leuchtdioden (OLEDs und Poly-LEDs) sowie Postdoc an der TU Eindhoven im Bereich passiv emissiver Displays (LCDs)

Erfahrungen in der Vernetzung großer Datenbanksysteme und Applikationen als Director Data Science mit Schwerpunkt datengetriebenes Risikomanagement im Finanzanlagebereich

langjährige Leitung der Gruppe Biologische Informationssysteme am Helmholtz-Zentrum in München mit Schwerpunkt auf semantischen Big-Data-Systemen in der Biomedizin zur Erforschung multifaktorieller genetischer Erkrankungen

Gründer und Vorstand der Clueda AG, eines mehrfach preisgekrönten FinTech-Start-ups (u. a. „Best in Big Data“-Award, Gewinner im Bereich Big Data der Disruptive Technology Challenge)

Als Leiter Data Strategy & Operations bei der Mediengruppe RTL vor allem für den Auf- und Ausbau der Data-Science-Aktivitäten verantwortlich sowie für die Realisierung und Monetarisierung speziell analysierter Datenmodelle mit Fokus auf Nutzerverhalten und Nutzerbedürfnisse
 

Olga LalakulichDr. Olga Lalakulich

Promovierte Wissenschaftlerin im Bereich Teilchen- und Kernphysik mit Erfahrung an Forschungsinstituten u. a. in Belgien und Deutschland

Kompetenzen in theorie- und datenbasierten Prognosemodellen inklusive programmatischer Implementierung im Bereich Kernphysik

Vortragsrednerin auf internationalen Physikkonferenzen

Analysiert und berechnet für die Mediengruppe RTL vor allem Daten hinsichtlich Nutzeraffinitäten zur Entwicklung neuer Zielgruppen und entwickelt unter Anwendung von Machine- Learning-Algorithmen unterschiedliche Prognosemodelle

 

 

Hauke FruehresHauke Frühres

Wirtschaftsinformatiker mit Stationen als wissenschaftlicher Mitarbeiter in der Schweiz und am Massachusetts Institute of Technology (MIT) sowie als Softwareentwickler im Bereich Analyse sozialer Netzwerke

u. a. Autor und Herausgeber wissenschaftlicher Publikationen

Als Data Scientist besonders im Bereich der Datenanalyse und -verarbeitung u. a. für die Analyse verhaltensbasierter Empfehlungen verantwortlich sowie für den Aufbau einer Datenplattform zur Datenintegration

 

 

 

Bin SongDr. Bin Song

Elektronik-Ingenieurin mit Erfahrungen als Studio-System- Ingenieurin bei einem chinesischen TV-Sender

Forschungsmitarbeit und Promotion im Bereich drahtlose Telekommunikation

Stationen u. a. als Marketingmanagerin bei PricewaterhouseCoopers

Als Data Scientist bei der Mediengruppe RTL besonders für die Analyse verhaltensbasierter Empfehlungen verantwortlich

 

 

 

nina BerghoffNina Berghoff

Wirtschaftsmathematikerin (M. Sc.) mit Stationen bei der EZB in Frankfurt am Main sowie der KPMG

Für die Mediengruppe RTL insbesondere für Programmierungen, Datenanalysen und -visualisierungen im Bereich User Behaviour Prediction verantwortlich

 

 

 

 

 

Barbara GellerBarbera Geller

Diplom-Mathematikerin mit Nebenfach Informatik mit Stationen bei Talanx und SUPER RTL, dort vor allem in der Bilanzmathematik und Medienforschung

Als Data Analyst hauptsächlich in der Prognose der Nutzung des linearen TV tätig sowie in der Entwicklung statistischer Zwillinge

 

 

 

 

 

Jos GesenhuesJos Gesenhues

Diplom-Mathematiker mit Stationen u. a. als wissenschaftlicher Mitarbeiter an der Uni Bonn mit Schwerpunkt Numerik, das heißt Entwicklung und Untersuchung effizienter Algorithmen

Als Data Engineer vor allem am Aufbau einer technischen Infrastruktur beteiligt; Ausbau des Data Lakes zur Weiterverarbeitung bestehender Datensätze