史 程 泰康人壽總公司運營中心
通過模型訓練讓機器智能化,實現(xiàn)流程的線上化、數(shù)字化,代替線下流程,減少人工,降低成本,提高效率,其巨大的優(yōu)勢和巨大的商業(yè)價值促使各行各業(yè)的投保公司,積極開始建設屬于自己的大數(shù)據(jù)應用及人工智能體系,尤以阿里巴巴、騰訊、美團、滴滴、360等擁有明顯大數(shù)據(jù)資源優(yōu)勢的頭部互聯(lián)網(wǎng)企業(yè)為代表。當前,區(qū)塊鏈、人臉識別、OCR、NLP、RPA、精準預測模型等基于大數(shù)據(jù)技術的商業(yè)化運用,已經逐步成熟,作為對數(shù)據(jù)極為敏感的金融領域,大數(shù)據(jù)所能帶來的巨大價值,無用多言,所有金融類頭部公司,無不把數(shù)字化、線上化、智能化作為開始顛覆傳統(tǒng)的商業(yè)及實現(xiàn)運營管理模式再造的開端。大數(shù)據(jù)推動的產業(yè)升級和流程變革帶來的巨大競爭壓力,迫使對數(shù)據(jù)高度敏感的保險、銀行、信托等金融機構必須流程重塑,轉型升級,在業(yè)務全流程積極引大數(shù)據(jù)和人工智能技術,實現(xiàn)傳統(tǒng)線下業(yè)務員流程和大數(shù)據(jù)的高度結合與平衡。通過構建精準的大數(shù)據(jù)風險預測模型,對于在業(yè)務中存在巨大信息不對稱,經營風險的保險行業(yè)來說,便成了一個極具吸引力的打造公司核心實力的關鍵切入點。
從人身保險和財產保險的整體應用來看,由于財產險,特別是車險的自身特點,更容易實現(xiàn)底層數(shù)據(jù)的標準化,同時車險行業(yè)的承保、理賠信息的整合和共享程度更好,建設也更早一些,所以財產險領域,特別是車險在大數(shù)據(jù)風險識別模型的應用上要較為領先。2016年“全國車險反欺詐信息系統(tǒng)”正式上線,面向各市場主體提供保險欺詐線索識別和風險預警功能,初步實現(xiàn)了行業(yè)車險欺詐信息的交互共享。車險基于大數(shù)據(jù)的風險管控和反欺詐效果凸顯。而人身保險以人的健康和壽命作為對象,其經營的風險更加復雜多樣,健康信息的存在巨大的不對稱性,逆選擇和道德風險極高,同時,我國的公民個人信息管理較為分散,數(shù)據(jù)呈現(xiàn)碎片化,尤其是公民健康數(shù)據(jù)和醫(yī)療數(shù)據(jù)雖然近些年已經取得了巨大的進展,但底層數(shù)據(jù)依然標準化程度較低,分布較散,非常不利于數(shù)據(jù)分析和智能化技術的應用,大數(shù)據(jù)分析技術雖然能夠實現(xiàn)一定程度的從非結構化數(shù)據(jù)中提取關鍵信息。但很多欺詐的關鍵信息都是主觀性較強的非結構化數(shù)據(jù),比如第三方鑒定報告,無法實現(xiàn)批量分析。大數(shù)據(jù)分析在人身保險風險管控領域的應用還比較滯后。
保險公司可以整合、打通、搭建一個集合內外部數(shù)據(jù)的集市,實現(xiàn)數(shù)據(jù)字段的標準化,數(shù)據(jù)輸出的模塊化,通過不同模塊的組合,適應多種場景的應用。一個數(shù)據(jù)豐富,維度多樣的系統(tǒng)可以提升偶發(fā)、新發(fā)的欺詐行為和案件的識別概率。風險預測模型等技術可以批量深入分析欺詐實例,通過篩選欺詐風險因子,進一步迭代優(yōu)化風險識別模型,提升模型的準確性。大數(shù)據(jù)解決方案可以幫助建立覆蓋保單全生命流程的風險管控體系,幫助企業(yè)審視全流程風險,逐步實現(xiàn)風險管控前端化,改善客戶感受,降低風控成本。通過組織內部信息的有效打通和關聯(lián),全流程視角能夠獲得更好的欺詐檢測效果。保險欺詐可以載多個流程節(jié)點同時發(fā)生:承保、理賠、調查、續(xù)期、保全或者與員工行為相關的欺詐或外部欺詐。一個整合了內外部數(shù)據(jù)源的風險識別模型可以起到更好的風險預測功能。
保險公司能夠將已有的內部數(shù)據(jù)和引入的外部數(shù)據(jù)相結合,尋找影響保險欺詐最為顯著的因素及這些因素的權重和取值區(qū)間,建立預測模型,快速的進行欺詐案件分類和調查審核流程管控,并為理賠調查人員的調查方向提供線索,讓理賠審核人員根據(jù)欺詐風險評分的高低迅速審核處理賠案件,極大提高理賠的時效性,同時,通過大數(shù)據(jù)技術給線下調查人員提供明確的調查方向和線索,避免調查人員完全依靠個人主觀經驗判斷風險,實現(xiàn)精準發(fā)起調查任務,指導調查人員獲取異常記錄。這種方式可以極大地提高欺詐風險識別的準確性和效率,同時還可以為保險公司節(jié)省大量的人力成本。筆者供職的泰康人壽作為國內的頭部險企,在人身險領域一直積極嘗試及推動大數(shù)據(jù)分析建模及機器學習。
泰康人壽開發(fā)的認知核保系統(tǒng),將人工智能與醫(yī)學知識、保險業(yè)務緊密結合,打造AI體檢數(shù)據(jù)采集引擎和AI核保決策引擎,使核保更便捷,風控更有效。體檢數(shù)據(jù)采集疫情以客戶體檢報告影像為輸入,自動定位、識別健康數(shù)據(jù),依據(jù)自然語言和醫(yī)學語義使其結構化,自動識別異常體檢項目;核保決策引擎構建可解釋算法模型,預測客戶健康風險,并且結合投保產品特征評估承包風險,輸出核保結論解釋。該核保系統(tǒng)支持超過10類常見疾病患病風險的預測,準確率近80%,同時也將核保環(huán)節(jié)人工審核的效率提升超過25%。
兩核風控是壽險行業(yè)最重要的風控環(huán)節(jié)之一,但實際工作中存在著大量簡單重復性操作步驟,如跨系統(tǒng)數(shù)據(jù)查詢時的信息復制與填充,日常格式化數(shù)據(jù)報表的制作等,消耗了大量的工作時間。隨著近年來外部數(shù)據(jù)平臺的陸續(xù)接入,已有全國同業(yè)的兩核風險數(shù)據(jù)、覆蓋十余省的醫(yī)療數(shù)據(jù)模型等客戶風險信息數(shù)據(jù)實現(xiàn)了遠程線上查詢,為兩核風控提供了更快速、更全面的審核依據(jù)。但在實際工作中,外部數(shù)據(jù)模型查詢面臨著查詢入口分散、檢索條件復雜等多種問題。為解決上述問題,高效利用醫(yī)療大數(shù)據(jù)資源,進一步提升兩核環(huán)節(jié)線上化、智能化水平,泰康人壽利用機器人流程自動化與人工智能技術,建設了服務于兩核風控的“客戶風險信息平臺”,實現(xiàn)統(tǒng)一、便捷的風險模型數(shù)據(jù)查詢。極大提升了兩核效率,優(yōu)化了兩核人員的使用體驗。
泰康人壽持續(xù)探索新技術、新科技在保險領域的應用,在行業(yè)中率先將大數(shù)據(jù)與人工智能技術應用于兩核風控板塊,開發(fā)了兩核大數(shù)據(jù)模型、反欺詐模型、內部審計模型等多個應用于核保、理賠、調查板塊風控工具,在應用中發(fā)揮了良好效果,更加有力地捍衛(wèi)了公司和客戶的利益。
大數(shù)據(jù)模型是利用既往積累的大量數(shù)據(jù)信息對未知結果進行預測的方式,建模過程主要包含數(shù)據(jù)標準化,建立數(shù)據(jù)庫,確定目標結果,篩選相關因子,生成模型,模型自主學習優(yōu)化等。其中生成模型的過程需要使用大數(shù)據(jù)算法,這也是大數(shù)據(jù)建模最關鍵的環(huán)節(jié)之一。
目前成熟的大數(shù)據(jù)算法有很多種,例如:決策樹算法、隨機森林算法、邏輯回歸、樸素貝葉斯等。每次建模需根據(jù)數(shù)據(jù)字段類型、數(shù)據(jù)字段數(shù)量、目標結果等因素選擇適合的算法,以達到最優(yōu)的預測結果。
兩核風控板塊應用有以下幾種大數(shù)據(jù)模型:
(一)兩核大數(shù)據(jù)模型:根據(jù)大量核保、理賠信息,選取10余項投保、理賠時的關鍵字段,使用邏輯回歸算法預測核保、理賠結果的模型應用。用于識別客戶風險等級,具有核保階段高風險客戶攔截,核保階段低風險客戶無需體檢,理賠階段高風險客戶攔截等多種應用場景,減少人工審核量,降低體檢成本的同時抵御客戶風險。
(二)反欺詐模型:使用XGBoost算法在承保后出險前階段識別已承??蛻舻钠墼p風險,具有不影響業(yè)務承保,時效要求寬松,全流程持續(xù)風控等優(yōu)秀。該模型應用后有效提高了提調精度,提升了工作效果。
(三)審計模型:為防范內部人員風險建立的審計模型,根據(jù)工作行為記錄識別個人及案件違規(guī)風險。
保險行業(yè)發(fā)展迅速,保費規(guī)模不斷擴大,隨著“保險姓?!钡恼咧饾u落地,保障性產品,健康險的增加速度迅猛,保險欺詐及各種濫用、套利問題,在信息非對稱化下保不斷地擴大,在大數(shù)據(jù)技術的支撐下,互聯(lián)網(wǎng)保險市場的發(fā)展?jié)摿Σ粩啾环糯?,保險欺詐的風險敞口成倍放大。保險反欺詐一直都是保險公司關注的重點,很多公司在大數(shù)據(jù)及人工智能的應用也進行了嘗試。例如平安集團、弘康人壽等保險公司利用只能圖像技術進行人臉識別實現(xiàn)更快數(shù)投保,防范風險騙保等行為,螞蟻金服同樣利用智能圖像技術推出了車險理賠輔助工具定損寶,幫助保險公司快速處理車輛理賠定損,避免虛假理賠。同時各大保險公司都在利用人工智能的學習算法分析自身現(xiàn)有數(shù)據(jù)或結合醫(yī)療、交通及公安等各類大型數(shù)據(jù)源進行欺詐理賠的識別,進而形成否符合自身特點的動態(tài)反欺詐模型,加大對欺詐案件的防空力度。其中保險業(yè)大數(shù)據(jù)一般有以下幾個來源:
一是保險公司自身建立數(shù)據(jù)庫。保險公司的數(shù)據(jù)庫是自身經營的歷史和現(xiàn)實的記錄,主要針對的是自有客戶、準客戶和已流失客戶的承保和理賠信息,以及公司產品設計信息、保險標的風險查勘信息、出險記錄、防災防損記錄和客戶服務等信息。這些信息除了監(jiān)管部門要求上報的以外,都是保險公司內部使用的,屬于商業(yè)秘密,具有較強的封閉性、專業(yè)性和秘密性。保險公司可以通過數(shù)據(jù)挖掘和分析等方式,對自身數(shù)據(jù)庫信息進行充分利用。
二是保險行業(yè)自主建立數(shù)據(jù)庫。為加強保險行業(yè)信息共享,經國務院批準,由中國保監(jiān)會依法實施管理,2018年6月意健險風險管理系統(tǒng)試運行,7月正式向行業(yè)推出“守護者”系列數(shù)據(jù)服務,一期產品包含4款數(shù)據(jù)產品,8個應用場景2020年意健險風險管理系統(tǒng)二期產品,包含6款數(shù)據(jù)產品,7大類場景,協(xié)助保險公司管控風險、提高效率、降低成本、改善服務。
三是與第三方合作利用大數(shù)據(jù)。隨著移動互聯(lián)網(wǎng)的發(fā)展,線上線下的不斷融合,出現(xiàn)了一大批掌握巨量信息的平臺機構,如阿里、騰訊、百度等。同時,也催生了需要信息的公司與這些平臺合作的機會。
科技改變人類生活,大數(shù)據(jù)及人工智能技術的應用對各行各業(yè)產生了顛覆性的深遠的影響。當前,大數(shù)據(jù)技術,智能化、區(qū)塊鏈等在保險行業(yè)的應用日益廣泛,逐漸形成新的保險體系。通過新科技技術與保險行業(yè)的融合,改善傳統(tǒng)保險的服務模式,保險行業(yè)同時也能夠不斷推出符合時代要求的產品與服務,降低企業(yè)成本,優(yōu)化產業(yè)結構。■