黃山 尹龍威 孫海晨
摘要:近年來,國際保險行業(yè)穩(wěn)步開展,機(jī)動車保險在我國的財險保費(fèi)中所占比重最大。隨著我國汽車保有輛的持續(xù)增加和相關(guān)車險政策的出臺,投保率也呈持續(xù)上升趨勢。如何能精準(zhǔn)判定客戶續(xù)保概率至關(guān)重要。為此本文建立一個預(yù)測客戶續(xù)保概率模型,首先將影響車險業(yè)務(wù)的因素潛在風(fēng)險進(jìn)行劃分,分別從“人”、 “車”、 “環(huán)境”三個方面考慮風(fēng)險因素,對各項(xiàng)指標(biāo)進(jìn)行風(fēng)險系數(shù)的劃分以及客戶精準(zhǔn)畫像,然后以上述的風(fēng)險因素的風(fēng)險系數(shù)和是否續(xù)保作為輸入因素指標(biāo)和目標(biāo)類別,對貝葉斯分類器進(jìn)行訓(xùn)練學(xué)習(xí),利用貝葉斯分類器對不同客戶進(jìn)行續(xù)保概率求解,從1 000組數(shù)據(jù)的訓(xùn)練樣本學(xué)習(xí)后的貝葉斯分類器分類精準(zhǔn)度在80%左右,相對準(zhǔn)確的從對客戶的畫像中得到了該客戶續(xù)保的概率。
關(guān)鍵詞:貝葉斯分類器;客戶畫像;續(xù)保概率;風(fēng)險因素
0.引言
中國目前的車險費(fèi)率制度,大多數(shù)符合“從車主義”。即車險保費(fèi)多少,主要取決于這輛車本身的各項(xiàng)情況,如車的購置價、座位數(shù)、排量、購車年限等,根據(jù)這些數(shù)據(jù)計算出一個基本的車險保費(fèi)價格,再根據(jù)這輛車的上年理賠次數(shù)來打不同的折扣[2]。這就導(dǎo)致了中國的車險定價模式非常的單調(diào),相似情況的車型,保費(fèi)也都差不多。想要改變這種狀況就需要使其變?yōu)椤皬娜酥髁x”。需要對客戶進(jìn)行精準(zhǔn)畫像也需要對客戶是否續(xù)保概率進(jìn)行預(yù)測。
1.客戶精準(zhǔn)畫像
本文從三個大方向車輛、環(huán)境、人;10個小方向種類、年齡、性別、NCD等對客戶進(jìn)行精準(zhǔn)畫像。針對重要的文字信息,本文通過風(fēng)險厘定將文字信息轉(zhuǎn)化為了數(shù)字信息[1]。下面將選取這些數(shù)字信息以概率統(tǒng)計的方法對客戶進(jìn)行精準(zhǔn)畫像。
2.貝葉斯分類器
在上文我們對客戶車險的風(fēng)險因素劃分了風(fēng)險系數(shù),將以上劃分標(biāo)準(zhǔn)作為類別集合,利用貝葉斯分類器對已有數(shù)據(jù)中的客戶進(jìn)行分類,得到客戶的精準(zhǔn)畫像。利用風(fēng)險系數(shù)計算各類客戶的續(xù)保概率。貝葉斯分類器是一種分類的算法,但他是以概率統(tǒng)計的方法對類別進(jìn)行劃分。利用概率統(tǒng)計中的貝葉斯公式進(jìn)行計算,算法的特點(diǎn)就是不會確定樣本的類別,而是以概率的形式告訴這個樣本有多大可能屬于這一類。本文將續(xù)保不續(xù)保分為兩類,這樣通過將所得數(shù)據(jù)輸入分類器進(jìn)行學(xué)習(xí)。當(dāng)在輸入客戶得這些信息時,貝葉斯模型就會得到該客戶續(xù)保得概率[3]。
貝葉斯分類法基于簡單的貝葉斯公式(1),即通過某對象的先驗(yàn)概率計算其后驗(yàn)概率,選擇具有最大后驗(yàn)概率的類作為該對象所屬的類[4].
根據(jù)貝葉斯公式(2)分別計算P(Y1|x)2P(y2|x),…,P(ym|x),其中,由于假設(shè)X中各個特征屬性是服從正態(tài)分布且條件獨(dú)立的,因此P(X|yj)可由式(3)計算,P(xi|yj)可由式(4)計算。
從P(y1| x),P(y2x|),…,P(ym|x)中找到最大值,對應(yīng)的yj即為X所屬的類。由于P(X)是一定的,要求使得P(yj|x)最大的yj值,即為求使得P(X|yj)P(yj)最大的yj值,即為式(5)。
本文以同品牌同車系的1000組大眾帕塞特客戶相關(guān)信息輸入貝葉斯分類器進(jìn)行學(xué)習(xí)。另找了10個大眾帕塞特客戶的信息輸入已經(jīng)訓(xùn)練好的貝葉斯分類器模型進(jìn)行檢驗(yàn)。
3.結(jié)論
選取10個大眾帕塞特客戶的信息輸入已經(jīng)訓(xùn)練好的貝葉斯分類器模型進(jìn)行檢驗(yàn),結(jié)果如下:
從1000組數(shù)據(jù)的訓(xùn)練樣本學(xué)習(xí)后的貝葉斯分類器分類精準(zhǔn)度可以在80%。而且也成功的從對客戶的畫像中得到了該客戶續(xù)保的概率。
參考文獻(xiàn)
[1]李敬.中國商業(yè)車險費(fèi)率市場化改革下多因子定價模型研究[D].電子科技大學(xué),2018.
[2]胡伊.基于多源數(shù)據(jù)的車輛風(fēng)險分析與保險定價模型研究[D].中央財經(jīng)大學(xué),2016.
[3]王夢晨.A公司車險業(yè)務(wù)續(xù)保率影響因素研究[D].湖南大學(xué),2017.
[4]刁海軍,尹釗.一種基于樸素貝葉斯分類算法的數(shù)據(jù)預(yù)測[J].電大理工,2018( 04):1-3.