BI

Irrtümer über Predictive Analytics: Die Erwartungshaltung

Predictive Analytics

Predictive AnalyticsFehleinschätzungen, Vorurteile und Irrtümer prägen das Bild von Predictive Analytics im Berufsalltag, auf Messen oder in Fachartikeln. Der erste Beitrag zu dem Thema „Irrtümer über Predictive Analytics“ soll ganz am Anfang starten, nämlich bei der Erwartungshaltung.

Ich finde den Punkt der Erwartungshaltung besonders wichtig, da hier bereits über Erfolg oder Misserfolg eines Pilotprojektes entschieden werden kann. Dies ist gerade bei dem Thema Predictive Analytics relevant, bei welchem die Verteilung zwischen Kritikern auf der einen Seite und Phantasten auf der anderen Seite besonders weit gefächert ist.

Wie kommt die starke Verteilung in Zustimmung oder Ablehnung bei Predictive Analytics zustande?

Die Mathematik und die Statistik sind vielen Menschen suspekt. In jedem naturwissenschaftlichen Studiengang kann man an der Notenverteilung sehen, dass nur wenige Personen einen richtigen Zugang zu diesen beiden Fachgebieten finden. Umfragen bei Unternehmen, die Predictive Analytics bereits aktiv einsetzen, zeigen fehlendes Knowhow und mangelndes Verständnis der Prognosetechnologie als die schwerwiegendsten Herausforderungen bei der Umsetzung von Pilotprojekten. Eine größere Skepsis gegen eine Technologie, die hauptsächlich auf statistischen Verfahren basiert, ist daher nicht verwunderlich. Laut derselben Umfrage kann weiterhin nur bei knapp einem Drittel der Pilotprojekte mit Predictive Analytics ein messbarer Wertbeitrag für das Unternehmen generiert werden (TDWI Research 2014).

Auf der anderen Seite gibt es einige gern zitierte Erfolgsgeschichten wie die Schwangerschaftsvorhersage von Target oder die Verbrechensbekämpfung mit Predictive Policing. Diese Darstellungen, die übrigens zumeist von den Herstellern der Predictive Analytics Lösung stammen, lassen so manchen Entscheider ins Träumen geraten.

Was ist eine realistische Zielsetzung für ein Pilotprojekt im Bereich Predictive Analytics?

Predictive Analytics kann theoretisch überall dort eingesetzt werden, wo auf der Grundlage von Daten Entscheidungen getroffen werden sollen. Durch die stetige Zunahme der IT-Unterstützung und den dadurch steigenden Anfall von Daten, ist der mögliche Markt für Predictive Analytics mit den Jahren immer weiter gewachsen.

Um ein Pilotprojekt zu starten, muss zuerst klar sein, was man eigentlich genau wissen möchte. Nur einen Berg an Daten zu besitzen reicht nicht aus. Die Situation muss analysiert, das Problem spezifiziert und die notwendigen Informationen und deren Quellen identifiziert werden. Erst nach diesen Schritten lassen sich Modelle zur Lösung der Fragestellung entwickeln.

Ergebnisse aus einem Pilotprojekt sollten messbar sein. Eine sinnvolle Beurteilung nach Projektende ist nur möglich, wenn die durch Predictive Analytics erzielten Ergebnisse ausgewertet und sichtbar gemacht werden können.

Pilotprojekte sollten mit reduzierten Daten und simplen Modellen starten. Die erzielten Ergebnisse werden zu Beginn in den wenigsten Fällen Jubelarien auslösen. Die Entwicklung eines Modells ist ein iterativer Prozess mit viel Optimierungspotenzial. Den Erfolgsgeschichten aus den Medien unterliegen Modelle, die über Jahre hinweg optimiert wurden und stetig weiterentwickelt werden.

Die Erwartungen an neue Erkenntnisse aus den Beziehungen der Daten sollten zu Beginn nicht zu hoch angesetzt werden. Die Ergebnisse zu Einflüssen auf die Zielvariable werden dem Unternehmen überwiegend bekannt sein. Dies sollte nicht als Enttäuschung verbucht werden, heißt es doch, dass die Modelle funktionieren. Bei manchen Use Cases entsteht der Mehrwert allein durch exaktere Prognosen auf Basis bereits verwendeter Datenquellen.

Fazit: Klein anfangen – groß rauskommen!

Nach den ersten Erfahrungen mit Predictive Analytics lassen sich die anfänglichen Modelle nach und nach optimieren und erweitern. Durch steigenden Dateneinsatz und Komplexität der Modelle lassen sich mit Predictive Analytics bei entsprechender Datenqualität jene vom Menschen mit herkömmlichen Tools erstellten Prognosen mit sehr hoher Wahrscheinlichkeit übertreffen.