Trite osiguranja motornih vozila u Crnoj Gori u

  • Slides: 10
Download presentation
Tržište osiguranja motornih vozila u Crnoj Gori u prethodnoj dekadi i njegove perspektive Prof.

Tržište osiguranja motornih vozila u Crnoj Gori u prethodnoj dekadi i njegove perspektive Prof. dr Vladimir Kašćelan Prof. dr Ljiljana Kašćelan doc. dr Milijana Novović- Burić

Pregled premije osiguranja (u 000€) 2008 -2016 Year / Premium Total Non-life Motor TPL

Pregled premije osiguranja (u 000€) 2008 -2016 Year / Premium Total Non-life Motor TPL Motor hull 2008 2009 2010 2011 2012 2013 2014 2015 2016 60, 578 53, 332 65, 570 57, 483 62, 186 53, 819 64, 792 55, 735 66, 922 57, 448 72, 774 61, 898 72, 417 59, 861 76, 933 64, 008 80, 140 66, 463 25, 931 31, 149 28, 332 30, 012 31, 587 33, 129 32, 885 32, 889 35, 235 10, 217 8, 568 5, 934 5, 741 5, 391 5, 052 4, 706 5, 044 5, 079 90 000 80 000 70 000 60 000 Total 50 000 Non-life 40 000 Motor TPL Motor hull 30 000 20 000 10 000 0 2008 2009 2010 2011 2012 2013 2014 2015 2016

U susret liberalizaciji tržišta AO • Od regulisanog (sa 13 premijskih razreda za bonus-malus

U susret liberalizaciji tržišta AO • Od regulisanog (sa 13 premijskih razreda za bonus-malus sistem i 8 tarifnih grupa za klasifikaciju vozila) – jedinstvena premija AO, propisana je za sve učesnike na tržištu od strane osiguravača (preko NBOCG), uz saglasnost regulatora – do sada tržište AO stabilno, sa sigurnim prilivima u fondove za isplatu šteta • Ka (semi)deregulisanom tržištu AO (sloboda formiranja premije, uz mogućnost reagovanja ANO- od avgusta 2017) • Do potpune liberalizacije (ulaskom Crne Gore u Eu), koja podrazumijeva slobodu pružanja usluga (otvoreno tržište) – – Individualizovan pristup osiguraniku, uvažavajući njihove potrebe Stimulišu se korisnici usluga sa „dobrim“ performansama Povećaće se konkurencija i sloboda izbora osiguravača Moguće je koristiti i data- driven pristup

Data –driven scoring tehnike kao alternativni metod za procjenu rizika • Parnitzke (2008) je

Data –driven scoring tehnike kao alternativni metod za procjenu rizika • Parnitzke (2008) je predložio scoring tehnike kao alternativni metod za procjenu rizika u njemačkoj industriji osiguranja automobila • Polazni skup podataka je skup svih dostupnih podataka o polisama-za više godina pa čak i decenija (podaci o vlasniku polise-pol, starost, mjesto stanovanja, stepen obrazovanja, imovinski status, broj polisa, podaci o istoriji šteta- broj prethodnih šteta, iznos prethodnih šteta, podaci o automobilu, podaci o pređenoj kilometraži, garažiranju i ostali faktori rizika kao nezavisne varijable, kao i dvije zavisne varijable indikator da li je bilo štete po polisi i prosječni iznos štete na nivou polise u toku aktuelne godine) • Očekivani iznos štete se izračunava kao proizvod procijenjenog iznosa štete i vjerovatnoće da će nastupiti šteta. • Vjerovatnoća da će nastupiti šteta izračunava se primjenom logističke regresije na polaznom skupu podataka (nezavisne varijable – faktori rizika dostupni u bazi, zavisna varijabla- indikator štete) • Iznos štete se predviđa linearnom regresijom na cijelom polaznom skupu podataka (nezavisne varijable – faktori rizika dostupni u bazi, zavisna varijablaprosječni iznos štete) • U slučaju njemačke industrije osiguranja automobila polazni skup podataka se sastoji od nekoliko miliona polisa! • Kod manjeg broja polisa tačnost logističke i linearne regresije može biti nezadovoljavajuća.

Studija slučaja sa crnogorskog tržišta auto osiguranja • Kompanija: Sava Montenegro • Vrsta osiguranja:

Studija slučaja sa crnogorskog tržišta auto osiguranja • Kompanija: Sava Montenegro • Vrsta osiguranja: AO • Podaci: polise iz 2009, 2010 i 2011 godine - 35, 521 polisa ukupno - 3, 528 sa štetama • Faktori rizika (nezavisne varijable): starost, pol, region i broj osiguranih slučajeva vlasnika polise, tip auta, broj šteta po polisi i broj godina posjedovanja polise • Zavisne varijable: Indikator šteta i prosječni iznos štete • Testirajući metod koji je predložio Parnitzke (2008) dobili smo nezadovoljavajuću tačnost linearne regresije (root MSE = 1081. 67) što znači da u odnosu na prosječni iznos štete od 1338. 33 model pravi 80. 8% grešku (ta greška ne bi smjela biti veća od 10%) • Rezultat je očekivan zbog malog broja polisa sa štetom

Rješenje problema –pristup sa klasterizacijom • Klasterizacijom polaznog skupa podataka, polise se grupišu u

Rješenje problema –pristup sa klasterizacijom • Klasterizacijom polaznog skupa podataka, polise se grupišu u homogene grupe sa sličnim faktorima rizika i prosječnim iznosom šteta (12 klastera na case study skupu podataka) • Prednost u odnosu na tarifne klase je manji broj klastera, veći broj polisa u njima i njihova veća homogenost (polise su slične po svim razmatranim faktorima rizika a ne samo po faktorima koji određuju tarifne klase). Samim tim procjena štete za pripadnike klastera je sa većom tačnošću. • Primjenom linearne regresije na klasterima dobili smo RMSE manji od 10% prosječnog iznosa štete na svakom klasteru. • Odstupanje modelom procijenjenog iznosa štete u odnosu na stvarni iznos je manje od 10% za 65% podataka • Problem: neki iznosi šteta u aktuelnoj godini nisu poznati tj. određeni broj polisa ima nepoznatu zavisnu varijablu • Koeficijenti determinacije linearnih regresija na klasterima nisu visoki što znači da je prediktivna tačnost modela linearne regresije nezadovoljavajuća • Rezultat je očekivan jer funkcijska zavisnost između faktora rizika i iznosa štete obično nije linearna ni monotona. • Testiranje alternativnih regresionih modela (kvadratnih i slično) kompleksno a nekada i nemoguće zbog velikog broja mogućih vrijednosti varijabli (dummy varijable) (posebno kada postoji veliki broj faktora rizika u bazi)

Rješenje problema -SVM umjesto linearne regresije • SVM ima najbolje prediktivne performanse kod nelinearnih

Rješenje problema -SVM umjesto linearne regresije • SVM ima najbolje prediktivne performanse kod nelinearnih zavisnosti podataka • SVM model je obučen na 70% polisa sa poznatim iznosima šteta a onda testiran kada se doda još 30% polisa sa nepoznatim štetama. • RMSE je manji od 10% na svakom klasteru. 69% odstupanja predviđenih iznosa štete je manje od 10% (za 30% polisa sa nepoznatim štetama). • SVM ima bolje prediktivne performanse na podacima sa nepoznatim štetama (69%) nego što je tačnost procjene linearne regresije sa svim poznatim štetama (65%) • Nedostatak SVM modela je što se eksplicitno ne vidi uticaj pojedinih faktora kao kod regresionih modela ( npr. iz modela lin. regresije se lako može uočiti da najveći negativni uticaj kod većine klastera na visinu štete ima faktor Srednja starost vlasnika polise) • Međutim, iako kod SVM modela ovaj uticaj nije eksplicitno vidljiv on se može implicitno izvesti. Na primjer iz grafika ispod se može uočiti da SVM model predviđa da će osiguranici iz sjevernog regiona imati veće štete u odnosu na ostale regione.

SVM model- zavisnost visine štete od regiona

SVM model- zavisnost visine štete od regiona

KLR model- vjerovatnoća pojavljivanja bar jedne štete Pred. 1 Pred. 0 Class Recall True

KLR model- vjerovatnoća pojavljivanja bar jedne štete Pred. 1 Pred. 0 Class Recall True 1 596 462 56. 33% True 0 47 1080 95. 83% Class Precision 92. 69% 70. 04% Accuracy: 76. 70% • Vjerovatnoću pojavljivanja bar jedne štete izračunali smo primjenom KLR (kernel logističke regresije) sa ukupnom tačnošću od oko 77%. • Iz prve vrste tabele vidimo da od ukupno 643 polise sa štetama za samo 47 polisa predviđene su štete iako se realno nisu desile (<10%). • Iz druge vrste tabele vidimo da je modelom predviđeno 30% polisa kao risk-free a realno su imale štete. • U 2011 godini je bilo 1182 polise sa štetama. Od toga u prethodne dvije godine samo 52 polise su imale štete. To znači da na ovaj način (uzimanjem u obzir samo šteta u prethodnom periodu) 95. 6% polisa nisu prepoznate kao rizične. Greška našeg modela je značajno manja-oko 30%

Nedostaci data-driven pristupa • Nedovoljna količina podataka (prediktivna tačnost modela raste sa brojem podataka)

Nedostaci data-driven pristupa • Nedovoljna količina podataka (prediktivna tačnost modela raste sa brojem podataka) • Nedostatak podataka o važnim rizičnim faktorima (zanimanje, zdravstveno stanje, imovinsko stanje, sklonost ka alkoholu vlasnika polise, garažiranje, pređena kilometraža za vozilo i slično) • Kako obrazložiti klijentu obračun premije na ovaj način (lični podaci imaju uticaj na visinu premije)? Zaključno: • Data-driven pristup može se koristiti ne kao zamjena već kao dopuna tradicionalnim metodama koje poznaje praksa • Važna kvalitetna baza podataka (o klijentima, navikama, ponašanju, vozilu itd. )