Ähnlich wie bei einem Wetterbericht können mit Hilfe der prädiktiven Analytik, mögliche Szenarien der Zukunft mit einer gewissen Wahrscheinlichkeit vorhergesagt werden. Möglicherweise möchte der Marketingleiter eines E-Commerce Shops wissen ob es sich lohnt, weiterhin Geld in eine Maßnahme oder Online-Werbekampagne zu investieren. Mit Hilfe der prädiktiven Analyse kann der Marketingleiter auf Basis vergangener Messwerte, die Erwartungen der Zukunft ein Stück weit prognostizieren. Damit hat er eine viel bessere Entscheidungsgrundlage und verringert gleichzeitig die Wahrscheinlichkeit mehr Geld zu verlieren.
Was bedeutet prädiktive Analytik und wo wird es eingesetzt?
Der Begriff „prädiktiv“ beschreibt das Etwas prognostiziert, berechenbar, anbahnend bzw. vorhersehbar ist. Im lateinischen wird die Bezeichnung „prae“ erwähnt, welches als Adverb „voran“, bzw. „voraus“ bedeutet [1] . Die prädiktive Analytik umfasst eine Vielzahl von statistischen Techniken aus den Bereichen Data Mining, Predictive Modeling und Machine Learning, die aktuelle und historische Fakten analysieren um Vorhersagen über zukünftige oder anderweitig unbekannte Ereignisse zu treffen.
Die prädiktive Analytik ist ein recht junger Teilbereich der Analytik und wird in vielen technologiegetriebenen Branchen eingesetzt. Eine der bekanntesten Anwendungen ist das Credit Scoring, das in allen Finanzdienstleistungen eingesetzt wird.
Zeitreihenmodelle werden zur Vorhersage oder Prognose des zukünftigen Verhaltens von Variablen verwendet
Die im Laufe der Zeit aufgenommenen Datenpunkte können interne Strukturen aufweisen die kaum vorhersehbar sind. Daher sollten Trends oder saisonale Schwankungen berücksichtigt werden. Infolgedessen können Standard-Regressionsverfahren nicht auf Zeitreihendaten angewendet werden. Dafür wurden spezielle Methoden entwickelt, um die Trend-, Saison- und Konjunkturkomponente der Serie zu zerlegen. Die Modellierung des dynamischen Pfades einer Variablen kann die Prognosen verbessern, da die vorhersehbare Komponente der Serie in die Zukunft projiziert werden kann [2].
Wie erstelle ich selbst eine prädiktive Analyse auf Basis meiner Daten?
Alteryx ist eines der bekanntesten Tools in diesem Bereich. Die Produkte des Unternehmens werden für die Datenwissenschaft und Analytik eingesetzt. Die Software wurde entwickelt, um fortgeschrittene Analysen zugänglich zu machen [3].
Das Analytics-Tool Alteryx, bietet eine kostenlose Testversion an. Die Preise für eine jährliche Lizenz starten ab ca. 5.000 Euro. Im folgenden Screenshot präsentiere ich einen Analytics-Workflow, wo Daten aus dem Facebook Werbeanzeigen Manager verwendet wurden, um wichtige KPIs wie die Click-Through-Rate, Cost-per-Click etc. vorherzusagen. Ich habe mich in meiner Zeitreihenanalyse für das ARIMA-Verfahren entschieden. ARIMA ist ein Akronym, das für Auto-Regressive-Integrated-Moving-Average steht. Es handelt sich dabei um eine Modellklasse, die eine Reihe von verschiedenen Standardzeitstrukturen in Zeitreihendaten erfasst. [4].
Die Grafik stellt den Fluss von Daten dar. Man fängt von links an zu lesen und bewegt sich nach rechts. Erstmal muss man auf einen Datensatz zugreifen, also eine „Quelle“, dazwischen kommen einige Verarbeitungsschritte bis es in eine „Senke“ (Zieltabelle) zurückgeschrieben werden kann. Jeder Knotenpunkt stellt eine Operation dar. Knapp 70% meiner Zeit habe ich damit verbracht, die Daten in das richtige Format zu bekommen. Insgesamt habe ich für den Workflow knapp drei Arbeitstage benötigt. Dargestellt durch die „blauen“ Knoten wird auch klar das ein Großteil des Workflows genau eben aus diesen Datenbereinigungsprozessen besteht.
Was war das Ergebnis meiner prädiktiven Analyse für die Facebook Business KPIs?
Im nachfolgenden Chart wird die Entwicklung der „CTR“, bzw. Click-Through-Rate eines Facebook Werbekontos dargestellt. Die CTR ist eine Social Media KPI, die das Verhältnis von Klicks zu Impressionen auf einer Werbeanzeige in Prozent berechnet. Die „blaue Linie“ beschreibt den tatsächlichen Ist-Wert im täglichen Verlauf. Die anderen „Farben“ grün, gelb, rot, orange und türkis, beschreiben mögliche Erwartungswerte basierend auf der prädiktiven Analyse. Klar, die CTR kann nicht negativ sein deswegen lassen wir die Betrachtung der „türkisen-Linie“ außer Acht.
Wie man auf Basis einer prädiktiven Zeitreihen-Analyse Anomalien erkennen kann
Als Unternehmen ist es nicht nur wichtig Daten zu sammeln und auf einen „Haufen“ zu werfen, siehe Big Data sondern eben diese Daten in Erkenntnisse umzuwandeln, siehe Smart Data. Wie oben beschrieben, kann man mit Hilfe der prädiktiven Analyse den Erwartungswert einer Kennzahl vorhersagen. Trifft diese Erwartung nicht ein, so spricht man von einer Anomalie, also einer Abweichung von der statistischen „Normalität“. In der Prüfung meiner eigenen Vorhersagen bin ich ziemlich nah an die tatsächliche Entwicklung der Kennzahl herangekommen.
Von der prädiktiven Analyse zum intelligenten und digitalen Assistenten
Falls nun bestimmte Grenzen einer Kennzahl unter- oder überschritten werden, so kann innerhalb der Software ein intelligenter Alert ausgelöst werden. Diese Grenzen passen sich dynamisch im Laufe der Zeit je nach Erfahrungswert selbst wieder an. Der Algorithmus lernt so zu sagen selbständig mit. Dieses Prinzip kann flächendeckend auf unterschiedliche Zeitreihen und Dimensionen angewendet werden. So wäre es denkbar, eine komplette Webseite in Echtzeit zu monitoren um passive Benachrichtigungen erst dann zu erhalten, wenn sich auch wirklich etwas in den Daten ändert. Der intelligente Algorithmus übernimmt den Job es Analysten. Damit kommen wir dem Web Operating System noch einen Schritt näher. Für den Marketingleiter eine super Sache, denn damit muss er nicht mehr selbst, proaktiv in die Zahlen reinschauen. Er kann nun in Echtzeit reagieren und die Daten im Dashboard erst prüfen, wenn der digitale Analyse-Assistent interessante Vorkommnisse gemeldet hat.
Fazit:
Mittels der prädiktiven Analytik kann man mit einer gewissen Wahrscheinlichkeit die Entwicklung einer Kennzahl vorhersagen und mit dem Abgleich der Ist-Werte auch Anomalien erkennen, falls der Erwartungswert nicht eintrifft. Man sollte jedoch darauf achten wie man die Parameter einstellt. Das kann von Industrie und Branche sehr unterschiedlich sein. Vor allem im Handel sind meist saisonale Schwankungen die Regel. Zum Beispiel das Kaufverhalten eines neuen Produktes vorherzusagen ist ziemlich schwer, wenn noch keine validen Erfahrungswerte vorhanden sind.
Quellen:
[1] http://www.enzyklo.de/Begriff/pr%C3%A4diktiv
[2] https://en.wikipedia.org/wiki/Predictive_analytics
[3] https://en.wikipedia.org/wiki/Alteryx
[4] https://machinelearningmastery.com/arima-for-time-series-forecasting-with-python/