劉亮
摘要:本文針對(duì)車險(xiǎn)續(xù)保率,建立了K-means聚類算法與支持向量機(jī)的組合模型。利用K-means聚類算法將客戶劃分為某幾類,然后對(duì)每一類客戶用支持向量機(jī)求出續(xù)保概率,并用多元回歸分析得到每一類客戶的主要影響因素,最后將續(xù)保率最高的一類客戶的主要影響因素與其余類客戶的主要影響因素進(jìn)行對(duì)比,針對(duì)性地提供銷售方案,實(shí)現(xiàn)由低續(xù)保率向高續(xù)保率的轉(zhuǎn)化。
關(guān)鍵詞:車險(xiǎn)續(xù)保率;K-means聚類;支持向量機(jī);多元回歸
中圖分類號(hào):F842.6 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-9416(2019)07-0106-01
0 引言
1978年改革開放以來,各行業(yè)蓬勃發(fā)展,汽車保險(xiǎn)市場(chǎng)逐漸地被挖掘,其市場(chǎng)競(jìng)爭(zhēng)也愈發(fā)激烈。在目前的國內(nèi)保險(xiǎn)公司中,汽車保險(xiǎn)業(yè)務(wù)保費(fèi)收入已占到其財(cái)產(chǎn)保險(xiǎn)業(yè)務(wù)總保費(fèi)收入的一半以上[1],由此可見,汽車保險(xiǎn)業(yè)務(wù)在保險(xiǎn)公司中占有極其重要的地位。但做到高續(xù)保率的財(cái)險(xiǎn)公司是很少的,客戶留存率低成為了財(cái)險(xiǎn)公司的一大難題[2]。以往,保險(xiǎn)公司為了贏得市場(chǎng),采用的是低價(jià)、折扣等銷售措施來拉取客戶,提高客戶的續(xù)保率。但是激烈的市場(chǎng)競(jìng)爭(zhēng),使得大量的保險(xiǎn)公司的利潤率逐年下降,甚至為了占領(lǐng)市場(chǎng)有些惡性競(jìng)爭(zhēng)導(dǎo)致保險(xiǎn)公司虧本經(jīng)營。鑒于此,如何科學(xué)地、有效地爭(zhēng)取客戶,提高客戶續(xù)保率,成為保險(xiǎn)公司的當(dāng)務(wù)之急。
本文對(duì)于此建立了K-means聚類算法與支持向量機(jī)的組合模型,來解決車險(xiǎn)行業(yè)續(xù)保率低的問題。
1 組合模型
1.1 K-means聚類算法簡介
K-means聚類算法是一種著名的原型聚類算法,其目的在于把類似的樣本聚在一起構(gòu)成一類,但并不需要知道這一類具體是什么。
聚類分析算法的基本步驟如下:
(1)指定聚類數(shù)目K;
(2)選擇K個(gè)初始的聚類中心,即確定初始均值向量;
(3)根據(jù)最近原則進(jìn)行聚類:對(duì)于樣本集D,分別計(jì)算出每個(gè)樣本到各個(gè)聚類中心的距離,樣本距離哪個(gè)聚類中心近就被劃分到這個(gè)聚類中心所代表的類中;
(4)劃分完成后,重新計(jì)算聚類中心;
(5)將本次得到的K個(gè)聚類中心與前次得到的聚類中心進(jìn)行比較,如果聚類中心發(fā)生變化,轉(zhuǎn)(3),否則轉(zhuǎn)(6)[3];
(6)當(dāng)聚類中心不發(fā)生變化或收斂時(shí)算法停止。
1.2 支持向量機(jī)簡介
支持向量機(jī)(SVM)是一種二分類模型。它在解決小樣本、非線性和高維模式識(shí)別問題中表現(xiàn)出許多特有的優(yōu)勢(shì)[4]。
給一個(gè)數(shù)據(jù)樣本集,這里,支持向量機(jī)的任務(wù)就是找到一個(gè)劃分超平面,將樣本集D劃分為兩類,并且使分類結(jié)果是最魯棒的。劃分超平面的線性方程可表示如下:
2 模型求解
根據(jù)K-means聚類算法,對(duì)已得數(shù)據(jù)預(yù)處理后進(jìn)行聚類分析。經(jīng)過多次嘗試,發(fā)現(xiàn)將客戶分成三類時(shí)的聚類效果比較好,因此本文通過K-means聚類算法將客戶分為了三類。
將聚類處理好的客戶數(shù)據(jù)帶入編寫好的支持向量機(jī)代碼中,進(jìn)行訓(xùn)練。為減小誤差,每一類客戶數(shù)據(jù)都執(zhí)行了10次代碼,每一次都得到一個(gè)續(xù)保率,再對(duì)每一類客戶的續(xù)保率取平均值,得表1。
在表1中,可得到三類客戶的平均續(xù)保率分別為:0.219552351、0.300796983、0.063300232。
將某類客戶與此類客戶聚類中心之間的距離和它的影響因素進(jìn)行多元回歸分析,得到回歸系數(shù)即影響因素對(duì)客戶續(xù)保率的影響權(quán)重,選取權(quán)重明顯大的為主要影響因素。
第一、第二、第三類客戶續(xù)保率的主要影響因素分別為:渠道、保單性質(zhì)、是否為本省車牌、車齡、立案件數(shù);續(xù)保年、保單性質(zhì)、是否為本省車牌、使用性質(zhì)、簽單保費(fèi);渠道、保單性質(zhì)、車齡、立案件數(shù)。
3 結(jié)果分析
根據(jù)求解結(jié)果對(duì)每一類客戶針對(duì)性地提出優(yōu)惠和福利方案。第二類客戶的續(xù)保率高于其余兩類,第二類與第一類客戶相同的主要影響因素為:保單性質(zhì)、是否為本省車牌,第二類與第三類客戶相同的主要影響因素為:保單性質(zhì)。因此對(duì)于第一類客戶,需要圍繞保單性質(zhì)、是否為本省車牌這兩個(gè)因素提供優(yōu)惠和福利方案,而對(duì)于第三類客戶,則需要圍繞保單性質(zhì)這一個(gè)因素提供優(yōu)惠和福利方案,使第一、三類客戶的主要影響因素接近于第二類客戶的主要影響因素,從而達(dá)到提高客戶續(xù)保率的要求。而對(duì)于續(xù)保率最高的第二類客戶而言,本文建議從此類客戶的主要影響因素出發(fā)制定銷售方案,還可進(jìn)一步對(duì)第二類客戶進(jìn)行再細(xì)分。
參考文獻(xiàn)
[1] 何克勤.探析車險(xiǎn)銷售的必要性[J].赤子,2014(4):245.
[2] 楊子江,王野,馬天詣.影響汽車保險(xiǎn)續(xù)保率的因素分析[J].企業(yè)研究,2011(10):107.
[3] 鄒彥雯.定制商務(wù)班車線路設(shè)計(jì)研究[D].北京交通大學(xué),2017.
[4] 丁世飛,齊丙娟,譚紅艷.支持向量機(jī)理論與算法研究綜述[J].電子科技大學(xué)學(xué)報(bào),2011,40(01):2-10.