Schlaglicht

Data Science: Raus aus der Black Box

Von VW-RedaktionTagesaktuelle Informationen und Neuigkeiten aus der Versicherungsbranche. Alle Nachrichten des Tagesreports auch als Newsletter abonnierbar.
Die digitalen Megatrends wie künstliche Intelligenz, humanoide Roboter und autonomes Fahren bestimmen in dieser Woche auch die Agenda der Technologiemesse Cebit, die heute in Hannover ihre Pforten für das Fach- und Privatpublikum öffnet. Wie vor allem die Versicherer die richtigen Schlüsse aus den Entwicklungen um Data Science, Maschinelles Lernen und KI ziehen können, beleuchtet Martin Spindler in einem exklusiven Fachbeitrag.
In den letzten Jahren hat sich Data Science als neues eigenständiges Fachgebiet entwickelt. Dabei handelt es sich um einen interdisziplinären Bereich, der Wissen aus der Informatik, Mathematik, Statistik und den jeweiligen Fachgebieten verknüpft.
Ausgangspunkt für die gegenwärtigen Entwicklungen ist die zunehmende Verfügbarkeit von großen, komplexen Datensätzen. Diese wird getrieben von der Digitalisierung. Digitalisierung senkt die Kosten der Datenerhebung und -verfügbarkeit. Durch die zunehmende Verbreitung von Smartphones, Tablets, Internetanwendungen und -diensten werden viele Informationen digital verfügbar.
Beispiele sind Vertragsdaten von Kunden, Korrespondenzen mit Kunden, elektronische Personalakten oder Daten über die Schadensregulierung. Diese Daten liegen häufig in unstrukturierter Form vor. Der erste Schritt, die Aufbereitung der Daten, kann bereits sehr aufwendig und zeitintensiv sein und den Einsatz von Informatikern und Ingenieuren erfordern.
Dabei müssen häufig Daten aus verschiedenen Quellen und unterschiedlichen Formaten zusammengeführt werden. Nach der Datenaufbereitung beginnt die Aufgabe der Statistiker: nun geht es darum, die richtigen Schlüsse aus den Daten zu ziehen. Dazu muss ein statistisches Modell aufgestellt werden.
Nach der Aufbereitung der Daten hat man für jede Beobachtungseinheit (z.B. Versicherungsnehmer) eine Beobachtung (n Beobachtungen insgesamt) und jede Beobachtung wiederum besteht aus mehreren Variablen (p Variablen). Beispielsweise besteht die Kundendatenbank eines Versicherers aus allen Verträgen und für jeden Vertrag sind Informationen bezüglich Alter, Geschlecht und Schadenhistorie des Versicherungsnehmers hinterlegt.
Zur Analyse solcher Daten sind maschinelle Lernmethoden sehr gut geeignet und in den letzten Jahren gab es hier auch große Fortschritte. Wir gehen davon aus, dass die Daten in aufbereiteter Form vorliegen und analysiert werden sollen. Bei der Analyse von Daten gibt es zwei Ziele bzw. unterschiedliche Aufgaben, die unterschiedliche Methoden benötigen: Vorhersage und kausale Inferenz.
Obwohl einige der Verfahren/Algorithmen schon vor längerer Zeit entwickelt wurden, ist es erst in den letzten Jahren gelungen, die theoretischen Grundlagen zu verstehen. Dieses Verständnis ermöglicht die Entwicklung von neuen, maßgeschneiderten Algorithmen für verschiedene Vorhersageprobleme.
Diese Verfahren funktionieren häufig gut bezüglich der Vorhersageergebnisse, aber der Zusammenhang zwischen den Input- und der Outputvariablen wird häufig als "Black Box" betrachtet. Das heißt, eine Interpretation der Ergebnisse oder eine Erklärung, wie die Vorhersageergebnisse zu Stande kommen, ist häufig nicht möglich. Das Ziel sind gute Vorhersagen.
Eine aktuelle Forschungsrichtung beschäftigt sich damit, die Unsicherheit, die mit der Vorhersage von ML-Methoden verbunden ist, zu quantifizieren. Dies ist beispielsweise unentbehrlich, wenn die Vorhersagen Grundlage für betriebliche Planungen bieten sollen.
Insgesamt lässt sich festhalten, dass maschinelle Lernverfahren und Künstliche Intelligenz sowohl für die Vorhersage als auch kausale Inferenz nützlich sind und häufig bessere Ergebnisse erzielen als klassische Methoden. Die theoretische Entwicklung von neuen Verfahren und die praktische Anwendung gehen dabei Hand in Hand.
Für Unternehmen im Versicherungsbereich ergeben sich viele, neue spannende Herausforderungen. Um sich im Wettbewerb behaupten zu können, ist es von zentraler Bedeutung, modernste Verfahren schnell zu adaptieren.
Den vollständigen Beitrag lesen Sie in der aktuellen Ausgabe der Versicherungswirtschaft.
Autor: Martin Spindler ist Professor für Statistik an der Universität Hamburg.
Bildquelle: GDV
künstliche Intelligenz · Martin Spindler
Auch interessant
Zurück
29.04.2019VWheute
Aktuare: Algo­rithmen dürfen keine Black-Box sein Die Deutsche Aktuarvereinigung wird sich künftig stärker mit Data-Science-Verfahren und Künstlicher …
Aktuare: Algo­rithmen dürfen keine Black-Box sein
Die Deutsche Aktuarvereinigung wird sich künftig stärker mit Data-Science-Verfahren und Künstlicher Intelligenz auseinandersetzen und hält ihren Berufsstand auch für die Überwachung von Algorithmen prädestiniert. "Die neuen …
19.02.2019VWheute
Daten sind Gold – Schürfen eine Wissen­schaft Praxis und Wissenschaft bauen mit der German Data Science Society (GDS) e.V. eine interdisziplinäre …
Daten sind Gold – Schürfen eine Wissen­schaft
Praxis und Wissenschaft bauen mit der German Data Science Society (GDS) e.V. eine interdisziplinäre Brücke. Die Herausforderung, aus umfangreichen, strukturierten und unstrukturierten Datenbeständen Wissen zu generieren ist komplex …
15.02.2019VWheute
Die PKV und ihr Problem mit der Kosten­er­stat­tung Amazon, Airbnb oder BMW Drivenow – all diese Unternehmen haben eigene digitale Schnittstellen g…
Die PKV und ihr Problem mit der Kosten­er­stat­tung
Amazon, Airbnb oder BMW Drivenow – all diese Unternehmen haben eigene digitale Schnittstellen geschaffen, die Produkt und Marke für ihre Kunden erlebbar machen. Auch private Krankenversicherer können diesen simplen Kanal für s…
14.02.2019VWheute
Patrick Döring: "Dass man über Alexa rele­vantes Neuge­schäft gene­riert, kann ich mir noch nicht vorstellen" Smart-Home-Lösungen und …
Patrick Döring: "Dass man über Alexa rele­vantes Neuge­schäft gene­riert, kann ich mir noch nicht vorstellen"
Smart-Home-Lösungen und Tierversicherungen gehören nicht gerade zu den gefragtesten Versicherungspolicen. Dennoch Wertgarantie-Vorstand Patrick Döring im …
Weiter