Predictive Analytic und die Haftung für fehlerhafte Ergebnisse gegenüber betroffenen Einzelpersonen. Susanne Mentel
http://www.zeit.de/digital/datenschutz/2017-11/china-social-credit-system-buergerbewertung, zuletzt abgerufen am 27.6.2018. 99 Strittmatter, Chinas digitaler Plan für den besseren Menschen, 22.5.2017, http://www.sueddeutsche.de/politik/neuer-ueberwachungsstaat-chinas-digitaler-plan-fuer-den-besseren-menschen-1.3517017, zuletzt abgerufen am 27.6.2018; Strittmatter, Schuld und Sühne – Punkteregime, 19.5.2017, http://www.sueddeutsche.de/politik/punkteregime-schuld-undsuehne-1.3514310?reduced=true, zuletzt abgerufen am 27.6.2018; Hodson, Inside China’s plan to give every citizen a character score, 9.10.2015, https://www.newscientist.com/article/dn28314-inside-chinas-plan-to-give-every-citizen-a-character-score/, zuletzt abgerufen am 27.6.2018; aus wissenschaftlicher Sicht Thon/Nes, edpl 2017, 16. 100 Weichert, ZD 2013, 251. 101 Oliver Oursin, Worldwide Predictive and Business Intelligence Solution Executive bei IBM spricht von einer Allgegenwärtigkeit von Predictive Analytics in allen Branchen bis ins Privatleben: isreport.de, Exklusiv-Interview: IBM verankert Analysen in der Prozesssteuerung, abrufbar unter http://www.isreport.de/allgemein/ibm-verankert-analysen-der-prozesssteuerung/, zuletzt abgerufen am 27.6.2018. 102 Bitkom e.V., Potenziale und Einsatz von Big Data – Ergebnisse einer repräsentativen Befragung von Unternehmen in Deutschland, 2014, S. 18. 103 Loadhouse, Predicting the future of predictive analytics, 2013, S. 5. 104 Weiss, CHIP Online – Predictive Analytics – Wunderwaffe oder Scharlatanerie, 25.5.2012, http://business.chip.de/artikel/Predictive-Analytics-_-Wunderwaffe-oder-Scharlatanerie_55967871.html, zuletzt abgerufen am 27.6.2018. 105 Nach einer Pressemitteilung des Softwareherstellers Intershop, Intershop kündigt erste Prognosesoftware speziell für den Online-Handel an, 2.4.2014, wollten diese 2014 mit einer speziell für den E-Commerce entwickelten Lösung SIMCOMMERCE auf den Markt gehen, zuletzt abrufbar unter http://www.intershop.de/pressemeldung/intershop-kuendigt-erste-prognosesoftware-speziell-fuer-den-online-handel-an, abgerufen am 27.6.2018. 106 Iffert, Controlling & Management Review, Sonderheft 1/2016, 16, 22. 107 Anbieter im Bereich self-service-Analytics sind die Unternehmen Alteryx, Self-service Analytics, abrufbar unter https://www.alteryx.com/de/solutions/predictive-analytics, zuletzt abgerufen am 27.6.2018; sowie Salesforce, Overview, abrufbar unter https://www.salesforce.com/products/analytics-cloud/overview/, zuletzt abgerufen am 27.6.2018. 108 S. beispielsweise das Angebot des Software-Herstellers sas und die Hintergründe in: sas Institute, Whitepaper: SAS Results Delivers Value, 2017, abrufbar unter https://www.sas.com/en_us/services/offerings/results-as-a-service.html, zuletzt abgerufen am 27.6.2018.
C. Technische Grundlagen
Vor einer näheren Betrachtung der haftungsrechtlichen Auswirkungen fehlerhafter Predictive Analytic soll der nachfolgende Teil die technischen Grundlagen eines Predictive Analytic-Verfahrens vermitteln. Dabei wird vor allem auf die Funktionsweise und die im Hintergrund einer Predictive Analytic ablaufenden Prozesse eingegangen.
I. Daten als Ausgangsbasis
1. Interne Datenquellen
Die für Predictive Analytic verwendbaren Daten können aus unterschiedlichsten Quellen stammen.109 Sie können unternehmensintern erhoben und gespeichert worden sein, wie es bei Kundendaten oder Informationen über den Ablauf eines Geschäftsabschlusses der Fall ist. Datenbestände wie Stammdaten haben dabei den Vorteil, dass sie ihre Gültigkeit über einen längeren Zeitraum meist nicht verändern.110 Zu typischen Stamm- bzw. Kundendaten zählen Vor- und Zuname, Geschlecht, Geburtsdatum und damit das Alter, Wohnort sowie weitere Kontaktdaten wie die Telefonnummer und Email-Adresse. Unternehmen dokumentieren auch den Ablauf eines Geschäftsabschlusses, also Informationen über die Art des geschlossenen Vertrages, Abschlussdatum, beteiligte Parteien, besondere Vereinbarungen etc. Daneben können gerade bei online agierenden Unternehmen Bestands-, Nutzungs- und Inhaltsdaten einen Großteil der Datengrundlage ausmachen, die durch das Surfen des Einzelnen im Internet entstehen.111 Diese Datenkategorie gibt einen tiefen Einblick in das Verhalten eines Kunden, ist einfach zugänglich und bietet sich deshalb für Analysen an.
2. Externe Datenquellen
Neben internen Unternehmensdaten besteht eine breite Auswahl an externen Datenquellen, die in Ergänzung zu eigenen Daten für Analysen verwendet werden können. Zu diesen externen Datenquellen zählen zunächst alle Daten, die außerhalb des Unternehmens erhoben und gespeichert wurden und zwar unabhängig davon, ob sie frei zugänglich sind oder ein anderes Unternehmen diese für sich in Anspruch nimmt. Bei nicht öffentlich zugänglichen Datenquellen ist es inzwischen üblich, dass diese durch einen Datenankauf erschlossen werden können. Die Vielfalt externer Bezugsquellen ist in den letzten Jahren zudem enorm gestiegen und stellt beinahe grenzenlose Möglichkeiten dar, die eigenen Daten mit externen zu ergänzen.112 Der Zugang zu Daten führt zu einem regelrechten Wettkampf um diese.113
3. Öffentlich zugängliche Daten
Daneben existiert eine Vielzahl öffentlich zugänglicher Daten wie Namen, Anschriften und Telefonnummern, die als Datensätze verwendet werden können. Diese werden aus allgemein zugänglichen Datenbanken extrahiert und finden in dieser Form Eingang in bestimmte Analysen.114 Verwendet werden können auch Daten, die in sozialen Medien wie Facebook, Twitter und Co. von dem Betroffenen selbst eingestellt und frei geteilt wurden.115 Mit der Nutzung von Daten aus sozialen Medien beschäftigen sich auch immer mehr eigens hierfür entwickelte Programme.116 Es existieren ebenfalls bereits Lösungen, die versuchen Informationen wie Bonitätsauskünfte, Handelsregisterauszüge und Presse-Informationen aus freien Datenbanken automatisch zu integrieren.117 Es muss in der Folge davon ausgegangen werden, dass theoretisch jede Art von Daten, die etwas über eine Person aussagt, verwendet werden kann und auch verwendet wird.
4. Größe
Generell gilt bei Predictive Analytic die Annahme, umso mehr Daten der Analyse zugrunde gelegt werden, desto bessere Ergebnisse können generiert werden.118 Dies lässt sich anschaulich am Beispiel der Erstellung eines Kundenprofils aufzeigen. Umso umfassender das Profil eines bestimmten Kunden werden soll, desto breit gefächerter und detaillierter sollten auch die über ihn verwendeten Daten sein. Für ein umfassendes Kundenprofil werden neben Einkommen, Beruf und Familienstand deshalb auch der Standort des Kunden, sein Bildungsgrad und die persönlichen Vorlieben berücksichtigt.119 Der zugrunde gelegten Datenmenge und -größe sind aufgrund der fortgeschrittenen Rechenkapazitäten neuartiger Analyseverfahren kaum Grenzen gesetzt. Viele Predictive Analytic-Anwendungen sind deshalb auch im Stande Big Data, also große Mengen an strukturierten und unstrukturierten Daten, zu verarbeiten.120 Wie viele Daten in eine vorhersagende Analyse einfließen, liegt jedoch immer in der Entscheidung des Predictive Analytic-Anwenders. Das führt zu der wichtigen Unterscheidung, dass Predictive Analytic zwar mit Big Data generiert werden können, dies jedoch nicht zwingend ist. Predictive Analytic können auch ohne Verwendung von Big Data eingesetzt werden und auch mit einer überschaubaren Anzahl von Datensätzen Mehrwert für ihre Anwender bieten.
5. Personenbezug
Für Predictive Analytic können sowohl Daten verwendet werden, die sich