Prädiktive Analytik um Anomalien zu erkennen

Ähnlich wie bei einem Wetterbericht können mit Hilfe der prädiktiven Analytik, mögliche Szenarien der Zukunft mit einer gewissen Wahrscheinlichkeit vorhergesagt werden. Möglicherweise möchte der Marketingleiter eines E-Commerce Shops wissen ob es sich lohnt, weiterhin Geld in eine Maßnahme oder Online-Werbekampagne zu investieren. Mit Hilfe der prädiktiven Analyse kann der Marketingleiter auf Basis vergangener Messwerte, die Erwartungen der Zukunft ein Stück weit prognostizieren. Damit hat er eine viel bessere Entscheidungsgrundlage und verringert gleichzeitig die Wahrscheinlichkeit mehr Geld zu verlieren. Was bedeutet prädiktive Analytik und wo wird es eingesetzt? Der Begriff „prädiktiv“ beschreibt das Etwas prognostiziert, berechenbar, anbahnend bzw. vorhersehbar ist. Im lateinischen wird die Bezeichnung „prae“ erwähnt, welches als Adverb „voran“,  bzw. „voraus“ bedeutet [1] . Die prädiktive Analytik umfasst eine Vielzahl von statistischen Techniken aus den Bereichen Data Mining, Predictive Modeling und Machine Learning, die aktuelle und historische Fakten analysieren um Vorhersagen über zukünftige oder anderweitig unbekannte Ereignisse zu treffen. Die prädiktive Analytik ist ein recht junger Teilbereich der Analytik und wird in vielen technologiegetriebenen Branchen eingesetzt. Eine der bekanntesten Anwendungen ist das Credit Scoring, das in allen Finanzdienstleistungen eingesetzt wird. Zeitreihenmodelle werden zur Vorhersage oder Prognose des zukünftigen Verhaltens von Variablen verwendet Die im Laufe der Zeit aufgenommenen Datenpunkte […]

  • Cloud Analytics· Datenanalyse· Smart Data

women in car watching dashboard of mobile reporting bi tool in car when alert arrives

Ähnlich wie bei einem Wetterbericht können mit Hilfe der prädiktiven Analytik, mögliche Szenarien der Zukunft mit einer gewissen Wahrscheinlichkeit vorhergesagt werden. Möglicherweise möchte der Marketingleiter eines E-Commerce Shops wissen ob es sich lohnt, weiterhin Geld in eine Maßnahme oder Online-Werbekampagne zu investieren. Mit Hilfe der prädiktiven Analyse kann der Marketingleiter auf Basis vergangener Messwerte, die Erwartungen der Zukunft ein Stück weit prognostizieren. Damit hat er eine viel bessere Entscheidungsgrundlage und verringert gleichzeitig die Wahrscheinlichkeit mehr Geld zu verlieren.

Was bedeutet prädiktive Analytik und wo wird es eingesetzt?

Der Begriff „prädiktiv“ beschreibt das Etwas prognostiziert, berechenbar, anbahnend bzw. vorhersehbar ist. Im lateinischen wird die Bezeichnung „prae“ erwähnt, welches als Adverb „voran“,  bzw. „voraus“ bedeutet [1] . Die prädiktive Analytik umfasst eine Vielzahl von statistischen Techniken aus den Bereichen Data Mining, Predictive Modeling und Machine Learning, die aktuelle und historische Fakten analysieren um Vorhersagen über zukünftige oder anderweitig unbekannte Ereignisse zu treffen.

Die prädiktive Analytik ist ein recht junger Teilbereich der Analytik und wird in vielen technologiegetriebenen Branchen eingesetzt. Eine der bekanntesten Anwendungen ist das Credit Scoring, das in allen Finanzdienstleistungen eingesetzt wird.

Zeitreihenmodelle werden zur Vorhersage oder Prognose des zukünftigen Verhaltens von Variablen verwendet

Die im Laufe der Zeit aufgenommenen Datenpunkte können interne Strukturen aufweisen die kaum vorhersehbar sind. Daher sollten Trends oder saisonale Schwankungen berücksichtigt werden. Infolgedessen können Standard-Regressionsverfahren nicht auf Zeitreihendaten angewendet werden. Dafür wurden spezielle Methoden entwickelt, um die Trend-, Saison- und Konjunkturkomponente der Serie zu zerlegen. Die Modellierung des dynamischen Pfades einer Variablen kann die Prognosen verbessern, da die vorhersehbare Komponente der Serie in die Zukunft projiziert werden kann [2].

Wie erstelle ich selbst eine prädiktive Analyse auf Basis meiner Daten?

Alteryx ist eines der bekanntesten Tools in diesem Bereich. Die Produkte des Unternehmens werden für die Datenwissenschaft und Analytik eingesetzt. Die Software wurde entwickelt, um fortgeschrittene Analysen zugänglich zu machen [3].

Das Analytics-Tool Alteryx, bietet eine kostenlose Testversion an. Die Preise für eine jährliche Lizenz starten ab ca. 5.000 Euro. Im folgenden Screenshot präsentiere ich einen Analytics-Workflow, wo Daten aus dem Facebook Werbeanzeigen Manager verwendet wurden, um wichtige KPIs wie die Click-Through-Rate, Cost-per-Click etc. vorherzusagen. Ich habe mich in meiner Zeitreihenanalyse für das ARIMA-Verfahren entschieden. ARIMA ist ein Akronym, das für Auto-Regressive-Integrated-Moving-Average steht. Es handelt sich dabei um eine Modellklasse, die eine Reihe von verschiedenen Standardzeitstrukturen in Zeitreihendaten erfasst. [4].

Workflow for predictive analytics based on arima for facebook business kpis

Die Grafik stellt den Fluss von Daten dar. Man fängt von links an zu lesen und bewegt sich nach rechts. Erstmal muss man auf einen Datensatz zugreifen, also eine „Quelle“, dazwischen kommen einige Verarbeitungsschritte bis es in eine „Senke“ (Zieltabelle) zurückgeschrieben werden kann. Jeder Knotenpunkt stellt eine Operation dar. Knapp 70% meiner Zeit habe ich damit verbracht, die Daten in das richtige Format zu bekommen. Insgesamt habe ich für den Workflow knapp drei Arbeitstage benötigt. Dargestellt durch die „blauen“ Knoten wird auch klar das ein Großteil des Workflows genau eben aus diesen Datenbereinigungsprozessen besteht.

Was war das Ergebnis meiner prädiktiven Analyse für die Facebook Business KPIs?

Im nachfolgenden Chart wird die Entwicklung der „CTR“, bzw. Click-Through-Rate eines Facebook Werbekontos dargestellt. Die CTR ist eine Social Media KPI, die das Verhältnis von Klicks zu Impressionen auf einer Werbeanzeige in Prozent berechnet. Die „blaue Linie“ beschreibt den tatsächlichen Ist-Wert im täglichen Verlauf. Die anderen „Farben“ grün, gelb, rot, orange und türkis, beschreiben mögliche Erwartungswerte basierend auf der prädiktiven Analyse. Klar, die CTR kann nicht negativ sein deswegen lassen wir die Betrachtung der „türkisen-Linie“ außer Acht.

7 days forecast based on arima time series analysis and facebook ad manager click through rate

 

Wie man auf Basis einer prädiktiven Zeitreihen-Analyse Anomalien erkennen kann

Als Unternehmen ist es nicht nur wichtig Daten zu sammeln und auf einen „Haufen“ zu werfen, siehe Big Data sondern eben diese Daten in Erkenntnisse umzuwandeln, siehe Smart Data. Wie oben beschrieben, kann man mit Hilfe der prädiktiven Analyse den Erwartungswert einer Kennzahl vorhersagen. Trifft diese Erwartung nicht ein, so spricht man von einer Anomalie, also einer Abweichung von der statistischen „Normalität“. In der Prüfung meiner eigenen Vorhersagen bin ich ziemlich nah an die tatsächliche Entwicklung der Kennzahl herangekommen.

time series forecast with predictive analytics based on facebook data in dashboard - abis reporting tool

Die CTR – Vorhersage hat sich als zutreffend herausgestellt. Es wurden auch einige Anomalien erkannt.

Von der prädiktiven Analyse zum intelligenten und digitalen Assistenten

Falls nun bestimmte Grenzen einer Kennzahl unter- oder überschritten werden, so kann innerhalb der Software ein intelligenter Alert ausgelöst werden. Diese Grenzen passen sich dynamisch im Laufe der Zeit je nach Erfahrungswert selbst wieder an. Der Algorithmus lernt so zu sagen selbständig mit. Dieses Prinzip kann flächendeckend auf unterschiedliche Zeitreihen und Dimensionen angewendet werden. So wäre es denkbar, eine komplette Webseite in Echtzeit zu monitoren um passive Benachrichtigungen erst dann zu erhalten, wenn sich auch wirklich etwas in den Daten ändert. Der intelligente Algorithmus übernimmt den Job es Analysten. Damit kommen wir dem Web Operating System noch einen Schritt näher. Für den Marketingleiter eine super Sache, denn damit muss er nicht mehr selbst, proaktiv in die Zahlen reinschauen. Er kann nun in Echtzeit reagieren und die Daten im Dashboard erst prüfen, wenn der digitale Analyse-Assistent interessante Vorkommnisse gemeldet hat.

 

Fazit: 

Mittels der prädiktiven Analytik kann man mit einer gewissen Wahrscheinlichkeit die Entwicklung einer Kennzahl vorhersagen und mit dem Abgleich der Ist-Werte auch Anomalien erkennen, falls der Erwartungswert nicht eintrifft. Man sollte jedoch darauf achten wie man die Parameter einstellt. Das kann von Industrie und Branche sehr unterschiedlich sein. Vor allem im Handel sind meist saisonale Schwankungen die Regel. Zum Beispiel das Kaufverhalten eines neuen Produktes vorherzusagen ist ziemlich schwer, wenn noch keine validen Erfahrungswerte vorhanden sind.

 

Quellen:

[1] http://www.enzyklo.de/Begriff/pr%C3%A4diktiv

[2] https://en.wikipedia.org/wiki/Predictive_analytics

[3] https://en.wikipedia.org/wiki/Alteryx

[4] https://machinelearningmastery.com/arima-for-time-series-forecasting-with-python/

 

[dssb_sharing_buttons icon_color=“#ffa346″ icon_placement_tablet=“icon“ icon_placement_phone=“icon“ icon_placement_last_edited=“on|desktop“ _builder_version=“4.18.0″ _module_preset=“default“ hover_enabled=“0″ global_colors_info=“{}“ sticky_enabled=“0″][dssb_sharing_button social_network=“linkedin“ icon_color=“#ffaa2d“ icon_bg=“#111111″ _builder_version=“4.18.0″ _module_preset=“default“ share_text_color=“#ffaa2d“ background_color=“#111111″ background_enable_color=“on“ border_width_all_item=“2px“ border_color_all_item=“#ffaa2d“ border_color_all_icon=“#ffaa2d“ global_colors_info=“{}“][/dssb_sharing_button][dssb_sharing_button social_network=“twitter“ icon_color=“#ffaa2d“ icon_bg=“#111111″ _builder_version=“4.18.0″ _module_preset=“default“ share_text_color=“#ffaa2d“ background_color=“#111111″ background_enable_color=“on“ border_width_all_item=“2px“ border_color_all_item=“#ffaa2d“ border_color_all_icon=“#ffaa2d“ global_colors_info=“{}“][/dssb_sharing_button][dssb_sharing_button icon_color=“#ffaa2d“ icon_bg=“#111111″ _builder_version=“4.18.0″ _module_preset=“default“ share_text_color=“#ffaa2d“ background_color=“#111111″ background_enable_color=“on“ border_width_all_item=“2px“ border_color_all_item=“#ffaa2d“ border_color_all_icon=“#ffaa2d“ global_colors_info=“{}“][/dssb_sharing_button][dssb_sharing_button social_network=“messenger“ icon_color=“#ffaa2d“ icon_bg=“#111111″ _builder_version=“4.18.0″ _module_preset=“default“ share_text_color=“#ffaa2d“ background_color=“#111111″ background_enable_color=“on“ border_width_all_item=“2px“ border_color_all_item=“#ffaa2d“ border_color_all_icon=“#ffaa2d“ global_colors_info=“{}“][/dssb_sharing_button][dssb_sharing_button social_network=“whatsapp“ icon_color=“#ffaa2d“ icon_bg=“#111111″ _builder_version=“4.18.0″ _module_preset=“default“ share_text_color=“#ffaa2d“ background_color=“#111111″ background_enable_color=“on“ border_width_all_item=“2px“ border_color_all_item=“#ffaa2d“ border_color_all_icon=“#ffaa2d“ global_colors_info=“{}“][/dssb_sharing_button][dssb_sharing_button social_network=“telegram“ icon_color=“#ffaa2d“ icon_bg=“#111111″ _builder_version=“4.18.0″ _module_preset=“default“ share_text_color=“#ffaa2d“ background_color=“#111111″ background_enable_color=“on“ border_width_all_item=“2px“ border_color_all_item=“#ffaa2d“ border_color_all_icon=“#ffaa2d“ global_colors_info=“{}“][/dssb_sharing_button][dssb_sharing_button social_network=“email“ icon_color=“#ffaa2d“ icon_bg=“#111111″ _builder_version=“4.18.0″ _module_preset=“default“ share_text_color=“#ffaa2d“ background_color=“#111111″ background_enable_color=“on“ border_width_all_item=“2px“ border_color_all_item=“#ffaa2d“ border_color_all_icon=“#ffaa2d“ global_colors_info=“{}“][/dssb_sharing_button][dssb_sharing_button social_network=“copy“ icon_color=“#ffaa2d“ icon_bg=“#111111″ _builder_version=“4.18.0″ _module_preset=“default“ share_text_color=“#ffaa2d“ background_color=“#111111″ background_enable_color=“on“ border_width_all_item=“2px“ border_color_all_item=“#ffaa2d“ border_color_all_icon=“#ffaa2d“ global_colors_info=“{}“][/dssb_sharing_button][/dssb_sharing_buttons]

Das könnte Sie auch interessieren…

Data Warehouse – Eine Einführung in Star Schema, ETL-Prozesse und Data Vaults

Data Warehouse – Eine Einführung in Star Schema, ETL-Prozesse und Data Vaults

Wir alle wissen, dass wir uns bei der Entscheidungsfindung auf Daten und Business Intelligence stützen müssen, wenn wir unser Unternehmen zum Erfolg führen wollen. Dazu müssen die Daten erst einmal gesammelt und aufbereitet werden. Die Verwendung von Datenmodellen und der Aufbau von Data Warehouses (DWH) über ETL-Prozesse sind hierfür die gängige Methode.

mehr lesen