徐高凱 楊杉
當前,大數(shù)據(jù)的普遍應用引起了社會經濟的變革,同時也給保險業(yè)帶來了深遠的影響。在客戶信息擁有量巨大的金融行業(yè),將龐雜的數(shù)據(jù)進行深度挖掘和對未來數(shù)據(jù)進行預測以供精確營銷,在企業(yè)的長期發(fā)展中有不可忽視的作用。在保險行業(yè)中,理賠這項工作,既是風險的晴雨表,也是反映保險行業(yè)的經營狀況的重要依據(jù)。
目前在人壽保險的保險數(shù)據(jù)當中,理賠數(shù)據(jù)、退保數(shù)據(jù)的比例較高,該保險公司面臨著企業(yè)理賠風險較大、個別險種設置不合理導致用戶粘性有所下降的情況,這非常不利于企業(yè)長期可循環(huán)發(fā)展,因此對理賠用戶特征進行分析與選擇,可以使公司在用戶發(fā)展上更有方向性。
以四川人壽保險的理賠數(shù)據(jù)為研究對象,對該保險理賠數(shù)據(jù)用戶進行行為畫像。采用excel數(shù)據(jù)分析、SPSS statistics中均值過程、描述統(tǒng)計、頻率分析和數(shù)據(jù)可視化的方法,對理賠信息中的險種、賠款金額、費用類型以及每一類費用類型與客戶信息之間的關系展開分析,希望較為全面地完成關于理賠用戶的數(shù)據(jù)畫像。
數(shù)據(jù)來源
通過在人壽保險公司數(shù)據(jù)庫中觀察,為了數(shù)據(jù)的完整性,對新投保、續(xù)保、理賠、退保四個方面的數(shù)據(jù)進行獲取后進行篩選,其中理賠數(shù)據(jù)包含了機構險種、賠償金額、費用類型、總保費、保額、理賠用戶的基本信息等16列21萬條數(shù)據(jù)。
數(shù)據(jù)清洗
表中年齡、險種都是單個年齡或單獨險種,還有費用類型需要經過數(shù)據(jù)的清洗過后才能夠進行主題分析。由此把excel表中的年齡以18為一個分界標準,共分5個年齡段,分別是小于18歲、18-36歲、36-54歲、54-72歲以及72歲以上,把險種分為S、L、B、Y、4、6這6大類險種,進行完數(shù)據(jù)清洗過后的表格更加的能夠準確的得出研究主題的結論與意義。
研究險種的賠款風險以及各險種賠款金額的均值差異
數(shù)據(jù)中共有6類險種,其中Y險種的平均賠款金額最高,且其賠款風險最高,賠款金額變化大,穩(wěn)定性較差。觀察這六類險種的方差、標準差得到其中Y險種兩個數(shù)據(jù)都遠大于其余險種。而B險種的賠款額方差、標準差值明顯小于其他險種,因此B險種的賠款金額的數(shù)據(jù)變化小,較穩(wěn)定。險種的平均賠付金額范圍在630-4500、19000-24000這兩個區(qū)間內,說明理賠數(shù)據(jù)的均值區(qū)間是差別較大的,數(shù)據(jù)分散性較大,與數(shù)據(jù)的機構、險種變化相關。
研究每一類費用類型的主要年齡段分布情況
數(shù)據(jù)中可得到非意外類型的年齡平均值是在46歲左右,峰度小于0,數(shù)據(jù)呈現(xiàn)扁平狀態(tài),偏度大于0,數(shù)據(jù)右偏,右偏數(shù)據(jù)分布密度稀疏,年齡大的用戶分布稀疏,則非意外類型的人大部分集中在均值附近或者是均值左偏的部分,所以非意外類型的人更多的集中在46歲以下;疾病類型的年齡平均值在47歲左右,峰度小于0,呈現(xiàn)扁平分布,偏度大于0,說明數(shù)據(jù)往右偏,右偏數(shù)據(jù)分布密度稀疏,則疾病類型的人大多集中在均值47歲左右以及47歲以下范圍,而意外類型的平均值為45歲左右,峰度小于0,呈現(xiàn)扁平分布,偏度大于0往右偏,所以意外類型的年齡分布也和非意外和疾病一樣,分布在均值附近以及均值以下,也就是在45歲周圍及以下。
從研究的箱型圖中得到非意外類型:由于箱體短胡須短的一端是位于下方,說明非意外類型的用戶年齡處于偏低的水平更為集中,異常值集中在上方,說明數(shù)據(jù)分布右偏,在疾病的箱型圖中可以看到,數(shù)據(jù)更加集中在年齡偏低的水平,年齡大的用戶的分布稀疏。在意外的箱型圖中可以看到數(shù)據(jù)也是更加的集中在年齡偏低的水平處的。
研究各費用類型中哪些保險機構更易產生賠付金額
1.疾病費用類
根據(jù)疾病費用統(tǒng)計指標得:在疾病費用類型中,510781是產生賠付最多的機構,這一機構對準疾病的賠付保險受眾多,而513999的機構在疾病費用類幾乎沒有賠償??傮w數(shù)據(jù)偏度大于0,呈現(xiàn)右偏,峰度小于0,其為扁平分布。
2.意外費用類
根據(jù)意外費用統(tǒng)計指標得:在意外費用類型中,510120是產生賠付最多的機構,可見510120這一機構對準意外的賠付保險受眾較多,而513999的機構在意外費用類幾乎沒有賠償。偏度大于0,呈現(xiàn)右偏,峰度小于0,可見其為扁平分布。
3.非意外費用類
根據(jù)非意外費用統(tǒng)計指標得,在非意外費用類型中,511024是產生賠付最多的機構,可見511024這一機構對準非意外的賠付保險受眾較多,而513999的機構在非意外費用類出現(xiàn)了賠償,可見513999機構的保險的客戶理賠對準性、靶向性是非常高的。偏度大于0,因此為右偏,而峰度小于0,可見其為扁平分布。
結 論
個人信息依法交易、流通、共享是大數(shù)據(jù)時代的必然現(xiàn)象。在傳統(tǒng)的保險業(yè)中,存在著如何獲取新用戶、如何進行風險控制、如何留住客戶以及如何觸發(fā)客戶的消費等眾多問題,大數(shù)據(jù)的分析運用使這些問題迎刃而解,以現(xiàn)存的保險理賠數(shù)據(jù)資源作為依托,進行數(shù)據(jù)整合并加以利用,對傳統(tǒng)的保險分析模式進行適應時代的改造,從而提高企業(yè)的經濟效益。大數(shù)據(jù)運用于保險業(yè),理賠用戶的數(shù)據(jù)得到分析后有利于了解用戶行為,改善優(yōu)化保險內部問題。因為個人信息在金融行業(yè),特別是在保險業(yè),具有多樣性、敏感性的特點。當今經濟增速放緩,我們需要加大對價值較高的數(shù)據(jù)的挖掘力度,因此需要通過大數(shù)據(jù)分析、數(shù)據(jù)可視化來將數(shù)據(jù)顯化和動態(tài)化。這也使得保險理賠營銷行動目標明確、可追蹤、可衡量、可優(yōu)化,從而形成以數(shù)據(jù)為核心的保險營銷閉環(huán),使理賠營銷行動得到良性循環(huán)。
經過數(shù)據(jù)分析后用戶總體特征主要呈現(xiàn):年齡均值范圍在45-47之間,婚姻狀況主要為已婚人群,性別結構呈現(xiàn)的是女多男少。
在理賠數(shù)據(jù)中,主要進行六類險種的賠付金額的方差等數(shù)據(jù)比較分析,通過對方差、標準差值、均值的大小比較后發(fā)現(xiàn)Y險種對保險公司的賠款風險較高。而B險種較穩(wěn)定,風險較低。另外6類險種賠款金額的數(shù)據(jù)都呈現(xiàn)右偏、尖端分布的情況。情況變動不大。其中,F(xiàn)險種的右尖端分布情況更加明顯。
從數(shù)據(jù)表格可得意外和非意外以及疾病這三種類型理賠數(shù)據(jù)的均值為45-47之間,并且三種類型的數(shù)據(jù)都在年齡均值左右分布,再由箱型圖也進一步輔助說明,在三種類型中用戶更加集中分布在均值和均值(47歲)以下,分布的密度較為平均。
對于理賠數(shù)據(jù)總體主要多數(shù)集中在小于編號為512000的機構前,512000機構后總體賠付少,對意外的理賠也較少。在疾病費用類型中,510781是賠付最多的機構;在意外費用類型中,510120是賠付最多的機構;在非意外費用類型中,511024是賠付最多的機構。而經過研究后發(fā)現(xiàn)511399這一保險機構的保險類型靶向性較高,只對準非意外中其他和其他疾病這兩類承擔著較少且指向性強的保險理賠。
建 議
在大數(shù)據(jù)時代,面對復雜的重要參數(shù)進行仔細的研究形成用戶畫像,本文主要是將險種等重要參數(shù)進行分析,雖不能直接地反映出體系的用戶行為,但是也可以呈現(xiàn)許多可供選擇和改善的地方。
通過對各類險種的賠款金額均值進行研究,發(fā)現(xiàn)賠款風險最高的是Y險種,最低的是B險種。因此在公司推銷業(yè)務時有側重的推薦用戶購買B類險種,而改善Y險種的業(yè)務銷售,降低保險公司的理賠風險,保證用戶的保險權益最大化。
利用大數(shù)據(jù)實行“隱私差別化”管理,不斷從一般信息中挖掘管理價值與經濟價值,是信息保護與利用博弈的必然選擇。在理賠數(shù)據(jù)表中理賠費用類型的年齡都偏向于47歲以下,說明47歲以下是一個理賠高風險的年齡段,因此保險公司在推銷業(yè)務和用戶管理時多關注這一年齡段的人群,可考慮為此年齡段的人群提供適合的保險套餐,根據(jù)不同理賠用戶的群特征量身定制出差別化,多樣化的理賠險種。
理賠機構同時應加強靶向性的保險分布,專注于意外理賠、疾病理賠或者是非意外理賠中的一個方面。隨著社會發(fā)展,一些理賠機構和險種覆蓋種類太多,雖然滿足了綜合性保險的現(xiàn)實需求,提供了便捷的一條龍服務,但因為各個方面都需兼顧,理賠數(shù)額太大,企業(yè)運轉風險性加大,并不有利于企業(yè)的可持續(xù)性發(fā)展。
[本文系四川大學錦城學院青年教師科協(xié)資助]
(四川大學錦城學院計算機與軟件學院)