Cluster-gedreven risicoclassificatie

Kennisbank •

Clusteranalyse is een veelgebruikte techniek in statistische data-analyse en Machine Learning die groepsstructuren binnen datasets kan achterhalen.

Cluster-gedreven risicoclassificatie

Deze methode groepeert objecten zodat zowel de heterogeniteit tussen de resulterende clusters, als de homogeniteit onder datapunten binnen hetzelfde cluster wordt gemaximaliseerd. Dit heeft actuariële toepassingen. Zo kunnen clusteringmethodes waardevol zijn voor het creëren van groepen van polishouders, waardoor de risicoclassificatie kan worden verbeterd. Echter worden clustering-technieken nog steeds onderbenut in de actuariële sector. Dit is grotendeels te wijten aan de gemengde data types (numeriek, categorisch en ordinaal) die in dit vakgebied worden gebruikt, terwijl veel clusteringtechnieken afhankelijk zijn van de Euclidische afstand tussen numerieke datapunten.


Mijn scriptie had als doel om de risicoclassificatie van de claimfrequentie modellen in autoverzekeringen van Achmea te verbeteren door clusteringtechnieken toe te passen op data gekoppeld aan postcodes (bijvoorbeeld urbanisatieniveau en gemiddeld inkomen) en kentekens (bijvoorbeeld automerk en gewicht van de auto).


Lees dit artikel verder onder Download.

Download

Over de auteur

Alyssa Wijker MSc

Junior Capital Model Specialist bij Rabobank.