Predictive Analytic und die Haftung für fehlerhafte Ergebnisse gegenüber betroffenen Einzelpersonen. Susanne Mentel
Bezogen auf Scoring-Verfahren allgemein Roßnagel, ZD 2013, 562, 562. 119 S. Big Data Insider, Whitepaper Predictive Analytics, 2016, S. 6. 120 Iffert, Controlling & Management Review, Sonderheft 1/2016, 16, 17. 121 Zur möglichen Reanonymisierung von personenbezogenen Daten hat bereits das BVerfG, 15.12.1983 – 1 BvR 209/83, BVerfGE 65, 1, Rn. 110 – Volkszählungsurteil, Stellung genommen. Es ging bereits davon aus, dass „scheinbar undurchbrechbare Anonymisierungen mit einfachen mathematischen Verfahren wieder repersonalisiert werden können“. 122 So aber die implizierte Definition von Predictive Analytic bei Schulz, in: Gola, Datenschutz-Grundverordnung, 2017, Art. 6 Rn. 197. 123 S. die dahingehende Untersuchung der Datenschutzaspekte bei Crawford/Schultz, 55 Boston College Law Review 93, 1, 4. 124 S. hierzu bereits unter B. IV. 3. a) bb). 125 S. die Ausführungen in Big Data Insider, Whitepaper Predictive Analytics, 2016, S. 5. 126 Big Data Insider, Whitepaper Predictive Analytics, 2016, S. 5. 127 S. z.B. auf der Cloud Plattform von SAP, Cloud Plattform, abrufbar unter https://www.sap.com/germany/products/cloud-platform.html, zuletzt abgerufen am 27.6.2018. 128 Zu cloudbasierten Services s. Iffert, Controlling & Management Review, Sonderheft 1/2016, 16, 22. 129 S. die In-Memory-Lösung SAP HANA, abrufbar unter https://www.sap.com/germany/products/hana.html., zuletzt abgerufen am 27.6.2018; sowie von IBM, BLU Acceleration Solution – Power Systems Edition, abrufbar unter http://www.ibm.com/systems/power/solutions/bigdata-analytics/editions/db2-blu.html, zuletzt abgerufen am 27.6.2018; ebenfalls Oracle, Database In-Memory, abrufbar unter https://www.oracle.com/de/database/database-in-memory/index.html, zuletzt abgerufen am 27.6.2018. 130 S. zur Datenstruktur bereits unter C. I. 6. 131 Vgl. Markl, in: Hoeren, Big Data und Recht, 2014, S. 9, wonach unstrukturierte Daten wie Text- , Bild-, Audio- oder Videodateien zuerst vorverarbeitet werden müssen. 132 S. z.B. die Unified Data Architecture Software des Anbieters teradata, Teradata – Big Data and Advanced Analytics Teradata, abrufbar unter http://www.teradata.com/products-and-services/analytics-from-aster-overview, zuletzt abgerufen am 27.6.2018. 133 S. das Angebot der Alteryx GmbH, Whitepaper: 6 Schritte zu schnellerem Data Blending für Tableau, 7.6.2017, S. 6, abrufbar unter http://www.bigdata-insider.de/data-blending-mit-koepfchen-v-38294-12529/?cmp=nl-ta-wp-lead-Alteryx-20170616, zuletzt abgerufen am 27.6.2018, die ein Data Blending (Datenverschmelzung) anbietet, das die Daten von verschiedensten Quellen miteinander verknüpft, bereinigt und anschließend analysiert. 134 Rouse, Whatsl.com, Extract, Transform, Load (ETL), abrufbar unter http://www.searchenterprisesoftware.de/definition/Extract-Transform-Load-ETL, zuletzt abgerufen am 27.6.2018. 135 S. Claßen, So orchestrieren Sie den Machine Learning Workflow, 28.7.2017, abrufbar unter https://www.bigdata-insider.de/so-orchestrieren-sie-den-machine-learning-workflow-a-618118/, zuletzt abgerufen am 27.6.2018. 136 Vgl. hierzu: Koeffer, Mit Predictive Analytics in die Zukunft blicken, 17.4.2014, http://www.derwesten.de/wirtschaft/digital/mit-predictive-analytics-in-die-zukunft-blicken-id9252539.html, zuletzt abgerufen am 27.6.2018. 137 Big Data Insider, Whitepaper Predictive Analytics, 2016, S. 3. 138 Eine frühe Form fortschrittlicher Mustererkennung aus einer größeren Menge an selbst dokumentierten Daten stellt die im Jahr 1932 von den Anthropologie Professoren Driver und Kroeber aus Berkeley veröffentlichte, quantitative Darstellung von Klassifizierungen kultureller Beziehungen dar. S. hierzu Kroeber, American Anthropologist 1935, 539. 139 Das Modell erfasst den Zyklus eines Data Mining-Prozesses in sechs Phasen, s. grundlegend http://crisp-dm.eu/home/about-crisp-dm/, zuletzt abgerufen am 27.6.2018. 140 S. hierzu sogleich unter VII. Zum Zusammenhang zwischen Data Mining und Machine Learning s. Fraunhofer Institut für sichere Informationstechnologie, Begleitpapier Bürgerdialog Chancen durch Big Data und die Frage des Privatsphärenschutzes, 2015, S. 24. 141 Siegel, Predictive Analytics: the power to predict who will click, buy, lie, or die, 2013, S. 26. 142 S. hierzu sogleich unter VIII. 143 Anlehnung der Beispiele an die in Siegel, Predictive Analytics: the power to predict who will click, buy, lie, or die, 2013, S. 26 genannten Berechnungsmethoden. 144 Eine Auseinandersetzung mit den unterschiedlichen Definitionen von Machine Learning findet sich bei Puget, What Is Machine Learning?, 18.5.2016, abrufbar unter https://www.ibm.com/developerworks/community/blogs/jfp/entry/What_Is_Machine_Learning, zuletzt abgerufen am 27.6.2018. 145 Fraunhofer Institut für sichere Informationstechnologie, Begleitpapier Bürgerdialog Chancen durch Big Data und die Frage des Privatsphärenschutzes, 2015, S. 24. 146 Surden, 89 Washington Law Review Rev. 87, 1, 2 (2014). 147 Ausführlich beschreibt dieses Beispiel Surden, 89 Washington Law Review Rev. 87, 1, 2-4 (2014). 148 Vorhersagen ohne Bezug zu einer Einzelperson werden im Folgenden ausgeklammert. 149 Eine metrische Einordnung erfolgt in Form eines genauen Wertes, z.B. in kg, l, m oder einer sonstigen Maßeinheit. 150 Wagner, INWT Statistics, Logistische Regression – Modell und Grundlagen, 15.7.2015, https://www.inwt-statistics.de/blog-artikel-lesen/Logistische_Regression.html, zuletzt abgerufen am 27.6.2018.
D. Fehlerhafte Predictive Analytic-Ergebnisse
Rechtlich relevant wird die mit einer Predictive Analytic verbundene Vorhersage dann, wenn sie zur Grundlage einer Entscheidung oder Handlung gegenüber der analysierten Person gemacht wird. Dies ist beispielsweise der Fall, wenn ein Rechtsgeschäft vom Erreichen eines bestimmten Wertes abhängig gemacht wird und bei einem dahinter zurück bleibenden Vorhersagewert ein Vertrag nicht geschlossen oder ein höherer Preis verlangt wird. Rechtliche Relevanz entfalten auch Situationen ohne rechtsgeschäftlichen Charakter, wenn die Predictive Analytic dazu führt, dass die analysierte Person auf andere Weise benachteiligt oder diskriminiert wird. Problematisch sind diese Situationen vor allem dann, wenn die Predictive Analytic einer automatisierten Entscheidung zugrunde liegt. Dies ist der Fall, wenn der Wert automatisch zu einer Entscheidung, einer Handlung oder einem Unterlassen führt, ohne dass eine natürliche Person diesen zuvor überprüft. Eingebettet in diesen Problemkreis widmet sich die Arbeit der Haftung für fehlerhafte Predictive Analytic-Ergebnisse.
I. Zur Fehlerhaftigkeit von Wahrscheinlichkeitsaussagen