Blog:

Predictive Analytics: Prognostizieren statt Modellieren

Ein Beitrag von René Kessler, Intershop

In einem ersten Beitrag über Predictive Analytics habe ich 10 Anwendungsfälle von prädiktiven Analysen für den Online-Handel vorgestellt. Auch wenn die Verlockungen für den Start  von diesbezüglichen Projekten aktuell groß und die zukünftigen Potentiale von Predictive Analytics Technologien noch größer erscheinen: Predictive Analytics im Blindflug liefert gleichwertig „gute“ Entscheidungsgrundlagen wie die Erkenntnis, dass die Zahl der geborenen Kinder mit der Zahl der vorhandenen Storchenpaare in ihrer Region in einem positiven Zusammenhang steht.

 

Fallstricke stellen aber nicht nur diese sogenannten Scheinkorrelationen dar. Bevor Erkenntnisse über zukünftige Entwicklungen aus (falls überhaupt) vorhandenen Datenbeständen gewonnen werden können, ist es ein weiter Weg. In diesem Beitrag stelle ich ihnen deshalb einige Herausforderungen prädiktiver Analysen vor und gebe ihnen erste Einblicke wie Intershop Online-Händlern mit SIMCOMMERCE zukünftig helfen wird, diese Klippen zu umschiffen.

Know-how ist gefragt

Software für Predictive Analytics respektive Business Analytics gibt es bereits seit vielen Jahren. Für den produktiven Einsatz der meisten Lösungen ist aber immer noch ein tief gehendes mathematisches und statistisches Know-how der Anwender dringend erforderlich. Die meisten Tools werden als „Werkzeugkästen“ angeboten. Darin enthalten sind vielfältige Methoden aus den Bereichen Data-Mining, Text-Mining, Web-Mining oder Online Analytical Processing (OLAP). Diese Werkzeuge besitzen hohe Freiheitsgrade für vielfältige Auswertungen – bestens geeignet für erfahrene Anwender. Im Umkehrschluss führen diese hohen Freiheitsgrade jedoch zu komplexen Analyseprozessen, verbunden mit sehr hohen Anforderungen an das Expertenwissen der Anwender bei der Bedienung der Tools. Anwender müssen sich in statistischen Verfahren sehr gut auskennen, um die für ihre Fragestellungen am besten passende Methode auszuwählen. Jede Methode wiederum erfordert ein individuelles Vorgehen, um valide Aussagen zu erreichen.

Predictive Analytics mit sechsstufigem Vorgehensmodell „CRISP-DM“

Für die Durchführung von Predictive Analytics Projekten können sich Anwender dabei am sechsstufigen Vorgehensmodell „CRISP-DM“ (Cross Industry Standard Process for Data Mining) orientieren:

Phase 1: Projektziele und Anforderungen

Diese erste Phase konzentriert sich auf das Verständnis der Projektziele und Anforderungen aus Sicht des Business Nutzers. Im Online-Handel also des E-Commerce oder Marketing Managers. Vorgehensweisen und Pläne müssen entwickelt werden: Der Daten-Analyst (Neudeutsch: Data Scientist) bestimmt adäquate Methoden aus dem Data-Mining, welche die definierten Ziele abbilden können.

Phase 2: Datenerhebung

Die zweite Phase beginnt mit der Datenerhebung. Diese Phase sorgt auch für ein Verständnis über die Daten. Eine gute Qualität der Rohdaten hilft bereits an dieser Stelle erste nützliche Erkenntnisse zu gewinnen. In der Praxis scheitern jedoch bereits viele Initiativen daran, dass notwenige Rohdaten entweder nicht in der benötigten Qualität oder Quantität vorliegen. Eine Qualitätsverbesserung der Daten kann in der folgenden Phase, der Datenaufbereitung, erreicht werden. Die quantitative Erhöhung der Datenbasis findet zwar dank vorhandener Web- bzw. Social-Media-Analytics sowie ERP- oder CRM-Systemen im Zeitverlauf fast automatisch statt, jedoch oft auf Kosten der Datenqualität und insbesondere meist nur auf die eigene Einflusssphäre beschränkt.

Phase 3: Datenaufbereitung

Ein Datensilo bleibt trotzdem nur ein sprichwörtlicher Heuhaufen, in dem die Nadel der Erkenntnis erst gesucht werden muss. Konsequenterweise umfasst die dritte Phase, die Datenaufbereitung, nun alle Aktivitäten, um den endgültigen Datensatz aus den Rohdaten zu konstruieren. Die Datenaufbereitung mit Vollständigkeits- und Plausibilitätsprüfung ist dabei ein iterativer Prozess welcher in der Regel mehrfach durchlaufen werden muss. Der endgültige Datensatz, bspw. in Form von klassifizierten und kombinierten Merkmalen, kann nun in die Predictive Analytics Software eingespielt werden.

Phase 4: Modellierung

Anschließend erfolgt in der vierten Phase die Modellierung. Dafür hat der Anwender die erwähnte Auswahl an verschiedenen Modellierungstechniken. Mit diesen Techniken werden die Modellparameter auf optimale Werte kalibriert. Typischerweise gibt es verschiedene Techniken für identische Zielstellungen. Einige Methoden haben spezifische Anforderungen an die Daten, sodass eine erneute Datenaufbereitung notwendig werden kann.   

Phase 5: Evaluierung

Nach der Modellierung muss das Modell in der fünften Phase vor der Implementierung gründlich evaluiert werden. Wichtiges Ziel ist es festzustellen, ob alle Fragestellungen und Einflüsse im Modell berücksichtigt wurden. Am Ende dieser Phase steht die Entscheidung über die Verwendung des Modells und der daraus generierbaren Erkenntnisse an.

Phase 6: Umsetzung

Die Erstellung und Implementierung des Modells durch den Daten-Analyst ist jedoch nicht das Ende des Projekts. Die gewonnen Erkenntnisse müssen noch umgesetzt werden. An dieser Stelle befindet sich ebenfalls ein Knackpunkt vieler Projekte: vertraut der Adressat der Erkenntnisse, der E-Commerce resp. Marketing Manager, überhaupt auf die Ergebnisse? Sofern der Adressat hier nicht konsequent in das Projekt bzw. die Nutzung der Software eingebunden ist, siegt vielleicht doch das eigene Bauchgefühl über die Zahlen aus der Blackbox. Eine weitere Schwierigkeit stellen wiederkehrende Tätigkeiten, wie bspw. die Budgetplanung im Online-Marketing dar. Diese erfordern häufig den geschilderten Prozess von Anfang an erneut zu durchlaufen um geänderten Rahmenbedingungen Rechnung zu tragen.

Der kurze Abriss über die methodische Vorgehensweiße macht eines deutlich: Die Umsetzung von Predictive Analytics Projekten ist nach wie vor komplex und aufwändig. Insbesondere für den Mittelstand ist dies kein geeigneter Lösungsweg.


 

Integrierte Modelle und Vorkonfigurationen

 

Den Ansatz, den Intershop mit SIMCOMMERCE nun verfolgt, ist es dem Anwender durch bereits integrierte und vorkonfigurierte Modelle die sonst übliche kostspielige und anwenderseitige Modellbildung abzunehmen. Nutzer können dafür aus einer Reihe bereitgestellter Vorlagen Business Szenarien auswählen. Diese Modellvorlagen beinhalten Kombinationen aus typischen operativen sowie strategischen Entscheidungsprozessen im Online-Handel und sind dank modularer Architektur beliebig kombinierbar und erweiterbar.

SIMCOMMERCE umfasst dabei ein breit gestreutes Spektrum an Modulen: von Maßnahmen der Kundenzuführung wie Suchmaschinenoptimierung oder Suchmaschinenwerbung über verschiedene, in E-Commerce-Plattformen integrierbare Technologien bis hin zum Checkout mit der Optimierung des Zahlungsarten-Portfolios und dem Retourenmanagement wird nahezu der gesamte E-Commerce-Prozess abgebildet.

Jedes Modul beinhaltet die für die jeweilige Kampagne typischen Stellschrauben. Diese Stellschrauben können vom Anwender mit den individuellen Werten des eigenen Online-Shops parametrisiert werden. Parameter für die dem Anwender keine Ausprägungen vorliegen, können aus einer umfassenden Bibliothek mit branchen- und länderspezifischen Vorkonfigurationen importiert werden. Somit haben die Anwender von SIMCOMMERCE trotz fortgefertigter Modelle die Möglichkeit, Szenarien auf individuelle Gegebenheiten des Online-Shops hin auszuprägen. Diese Möglichkeit erspart dem Anwender nicht nur die ersten fünf Schritte des geschilderten Vorgehensmodells, sondern stellt ihm SIMCOMMERCE als persönlichen „Data Scientist“ zur Seite.

Im Anschluss an die Parametrisierung der Modelle wird der Prognoselauf gestartet und die Prognoseergebnisse werden auf vordefinierte Leistungskennzahlen wie Konversionsrate, Umsatz, Kosten pro Bestellung oder ROI abgebildet. Anwender haben aber auch hier volle Konfigurationsmöglichkeiten: Bei Bedarf können beliebige Modellparameter zu neuen Key Performance Indikators kombiniert und als Diagramm oder Wertetabelle abgebildet werden. Mit Hilfe der integrierten Szenario-Analyse und Benchmark-Funktionalität können nun verschiedene Entscheidungsalternativen schnell und effizient gegenübergestellt werden.

Technologisch wird dies durch die Nutzung verschiedener, langjährig erprobter Simulationstechniken realisiert, welche den Modellen zu Grunde liegen. Durch die Nutzung von Simulationen, verzichtet SIMCOMMERCE auch auf die Abfrage und Vorverarbeitung von Rohdaten des Anwenders. Ein klarer Vorteil zugunsten des Schutzes von Anwenderdaten.

Mehrwerte Umsetzen!

Valide Modelle sind für verlässliche Prognosen natürlich unersetzlich. Schlussendlich müssen die gewonnen Erkenntnisse aber auch zeitnah den richtigen Mitarbeitern vorliegen und von diesen umgesetzt werden. Auch an dieser Stelle hilft die Prognosesoftware von Intershop: Predictive Analytics wird mit SIMCOMMERCE als SaaS (Software as a Service) aus der Sphäre der IT und Daten-Analysten zu den eigentlichen Profiteuren prädiktiver Analysen verlagert: Mitarbeiter im Marketing und Shop-Management. Diese können mit SIMCOMMERCE genau nachvollziehen, welche Auswirkungen Ihre Entscheidungen auf den zukünftigen Erfolg Ihrer Kampagnen haben werden. Insbesondere von dieser „Out of the box“ Nutzung von Predictive Analytics werden mittelständische Online-Händler profitieren.

Nach diesem kurzen Einblick setzen wir unser Blogserie zum Thema Predictive Analytics in den kommenden Wochen fort. Anhand von Praxisbeispielen aus den Bereichen Online-Marketing sowie Payment zeige ich Ihnen, wie Sie mit <link www.simcommerce.de/&gt;SIMCOMMERCE</link> Ihre Entscheidungsprozesse optimieren können.