Predictive Analytic und die Haftung für fehlerhafte Ergebnisse gegenüber betroffenen Einzelpersonen. Susanne Mentel
Es wird versucht, mithilfe bekannter Muster, die als feste Variablen dienen, eine ungewisse Variable, mithin eine Vorhersage für die Zukunft, zu bestimmen. Die mithilfe von Data Mining erkannten Muster werden als allgemeinverbindliche Muster zugrunde gelegt, die auch neuen Situationen Stand halten sollen. Die besondere Fähigkeit der heute praktizierten Data Mining-Verfahren ist das intelligente und automatisierte Auffinden von Mustern in großen Datenmengen.140
V. Übertragung der Modelle auf neue Daten
Um eine vorausschauende Wirkung für die Zukunft zu entfalten, müssen die erkannten Muster auf jene Daten übertragen werden, über die letztendlich Erkenntnisse gewonnen werden sollen. Dies impliziert, dass die Muster sinnvollerweise mit Trainingsdaten entwickelt werden. Es gilt dann, diese getesteten und für gut befundenen Muster auf neue, dem System unbekannte Datenpools anzuwenden.
VI. Predictive Model
Der Schritt von der Entwicklung eines generellen Musters hin zu einem konkreten Modell kann mithilfe eines sog. Predictive Model erreicht werden. Ein solches vorhersagendes Modell ist nach Siegel, Initiator der Predictive Analytic World-Konferenz, ein Mechanismus, der das Verhalten einer Einzelperson vorhersagt oder, drastischer gesprochen, Auskunft darüber gibt, „ob sie klickt, kauft, lügt oder sterben wird“141. Ziel dieses Mechanismus ist die Ermittlung eines Wertes (sog. Score). Ausgehend von Charakteristika, die über eine Person gesammelt und ausgewertet werden, wird ein individueller Score ermittelt, der die Grundlage für die spätere Predictive Analytic im eigentlichen Sinne142 darstellt. Die für die Entwicklung eines Scores nötige Bewertung kann auf unterschiedlichen Wegen erfolgen: Eine einfache Möglichkeit ist die Gewichtung der einzelnen Charakteristika mit unterschiedlichen Punkten. Stark vereinfacht erklärt, bildet der Gesamtwert der berücksichtigten Kriterien dann die Grundlage der Vorhersage.
Um dies anhand eines Beispiels zu veranschaulichen, käme ein solches, lineares Modell zu einem Score-Wert von 75, wenn die Tatsache, dass die zu bewertende Person männlich ist 10 Punkte wiegt, das Alter zwischen 35-40 ebenfalls mit 10 Punkten bewertet wird, die Herkunftsregion 30 Punkte zählt und der Ausbildungsgrad mit weiteren 25 Punkten in die Rechnung einbezogen wird. Neben diesem vereinfachten Modell können mittels Machine Learning auch komplexere Modelle aufgestellt werden, die auf einer zuvor selbstständig entwickelten Regel basieren. Das Ergebnis dieser Regel beinhaltet dann bereits die einzelnen Gewichtungen und könnte lauten, dass jemand der männlich ist, zwischen 35-40 Jahren alt ist, aus einer bestimmten Region stammt und einen gewissen Ausbildungsgrad hat, eine Wahrscheinlichkeit von 75 % aufweist, demnächst ein neues Auto zu kaufen.143
VII. Bedeutung von Machine Learning
Das Neuartige an heutigen Vorhersagetechniken ist im Gegensatz zu den aufgezeigten einfachen Modellen, dass diese mittels Machine Learning-Modellen automatisch und zum Teil auf selbstlernender Basis entwickelt werden können. Machine Learning ist ein „Forschungsbereich, der Computern die Fähigkeit gibt zu lernen, ohne explizit programmiert zu werden.“144 Aufgrund der automatisch ablaufenden Prozesse wird auch davon gesprochen, dass Machine Learning die Fähigkeit besitzt, das Erkennen von Zusammenhängen zu erlernen.145 Diese Metapher soll jedoch nicht den Anschein erwecken, dass es sich bei dieser Lernfähigkeit um eine der menschlichen Eigenschaft vergleichbare Kompetenz handelt. Der Lerneffekt innerhalb des Machine Learnings ist eher im funktionalen Sinne zu verstehen.146 Dabei sind zwei Arten von Machine Learning zu unterscheiden: Im Rahmen des sog. supervised Machine Learning werden dem Algorithmus zunächst Beispiele eines bestimmten Phänomens vorgegeben. Eine Veranschaulichung dieser Methode liefert die Vorgehensweise bei der automatischen Erkennung von Spam-Emails.147 Durch die Vorauswahl des Email-Empfängers, der bestimmte Emails als Spam kennzeichnet, kann der Algorithmus anhand dieser vorgegebenen Beispiele ein Muster erkennen. Die Entwicklung dieses Musters geschah deshalb nicht vollends selbstständig, sondern wurde durch die Vorgaben des Nutzers angeleitet („supervised“). Darüber hinaus können Machine Learning-Algorithmen aber auch ohne explizite Vorgaben Muster in Daten erkennen. Diese weiterentwickelte Form des Machine Learnings ist heute keine Ausnahme mehr. Durch das Analysieren neuer Datensätze „lernt“ der Algorithmus neue Zusammenhänge und wandelt diese Erkenntnisse in neue Muster und Modelle um. Das Besondere an der Entwicklung von Predictive Models durch Machine Learning ist gerade diese automatische Fortentwicklung. Das ursprüngliche Modell wird durch die ständige Angleichung an neue Erkenntnisse immer weiter perfektioniert. Der Prozess ist erst dann abgeschlossen, wenn das Modell eine Antwort auf die gesuchte Fragestellung liefert. Dieser Automatismus ist der entscheidende Punkt, weshalb die am Ende des Prozesses stehende Predictive Analytic auf der einen Seite so undurchdringlich für den Einzelnen, auf der anderen Seite so vielversprechend für den Verwender sein soll.
VIII. Predictive Analytic im eigentlichen Sinne
Die dargestellten vorangehenden Prozesse münden in die eigentliche Predictive Analytic in Gestalt einer Vorhersage. Mithilfe des durch ein Predictive Model erstellten Score-Wertes lässt sich eine Vorhersage darüber aufstellen, wie wahrscheinlich ein bestimmtes Verhalten eines Einzelnen ist.148 Ein Beispiel für eine mögliche Fragestellung kann die Vorhersage der Kündigungsbereitschaft eines Kunden sein. Dabei bedarf es einer Ausgangsfrage in Form einer Hypothese. In diesem Beispiel würde diese lauten: „Der Kunde ist kündigungsbereit.“ In der Folge wird versucht, diese Ausgangshypothese, die sog. Nullhypothese, zu widerlegen. Mögliche Alternativen zur Nullhypothese werden demgemäß als Alternativhypothesen bezeichnet. Um eine Einteilung der Ergebnisse in eine wahrscheinliche und eine weniger wahrscheinliche Kategorie vorzunehmen, müssen Grenzwerte vergeben werden, bei deren Überschreiten die zugrunde liegende Hypothese als zutreffend oder widerlegt eingeordnet wird. Die Ergebnisse können in zweierlei Kategorien ausgedrückt werden: metrisch149 oder binär. Bei allgemeinen Klassifizierungen, wie im Falle logistischer Regression, werden die Variablen binär erklärt. Das bedeutet, dass es immer nur zwei Ausprägungen gibt.150 Beispiele hierfür sind: ja/nein, kaufbereit/nicht kaufbereit, kündigungsbereit/nicht kündigungsbereit, krank/nicht krank, etc. Der ersten Alternative wird beispielsweise die Zahl 1, der zweiten die Zahl 0 zugeordnet. Zudem muss ein Grenzwert bestimmt werden, der festlegt, ab welchem Wahrscheinlichkeitswert welche Kategorie greift. Wird der Grenzwert beispielsweise bei 0,5 festgesetzt, bestätigen alle Vorhersagen mit einem Wert > 0,5 die Nullhypothese, alle Werte < 0,5 sprechen für die Widerlegung der These. Durch diese Vorgehensweise wird die Hypothese – und damit der ihr zugrunde liegende Sachverhalt – als eher wahrscheinlich oder eher unwahrscheinlich eingeordnet. Diese Wahrscheinlichkeitsaussage ist die Predictive Analytic im eigentlichen Sinne.
109 S. Big Data Insider, Whitepaper Predictive Analytics, 2016, S. 3. 110 Hildebrand, ISreport 2006, 17. 111 Weichert, ZRP 2014, 168, 169. 112 Meffert, So wird aus Big Data Smart Data, 7.6.2017, http://www.bigdata-insider.de/so-wirdaus-big-data-smart-data-a-604998/, zuletzt abgerufen am 27.6.2018. 113 Thon/Nes, edpl 2017, 16. 114 So können bsp. Daten aus Flugdatenbanken entnommen werden. Deren Nutzung läuft laut Wiebe, K&R 2014, 239 auch nicht der normalen Auswertung der Datenbank zuwider. 115 Weichert, ZD 2013, 251, 252. 116 Big Data Insider, Whitepaper Predictive Analytics, 2016, S. 3. 117 Matzer, So verhilft Customer Intelligence zu zufriedeneren Kunden, 12.6.2017, http://www.bigdata-insider.de/so-verhilft-customer-intelligence-zu-zufriedeneren-kunden-a-612405/, zuletzt abgerufen am 27.6.2018.