王紅愛,朱建生,陳 靖,張志強
(1.中國鐵道科學研究院 研究生部,北京 100081;2.中國鐵道科學研究院集團有限公司 電子計算技術研究所,北京 100081)
隨著高速鐵路的快速發(fā)展,鐵路客票發(fā)售與預訂系統(tǒng)(以下簡稱“客票系統(tǒng)”)不斷推出新的業(yè)務模式,目前可以通過互聯(lián)網(wǎng)、手機端、自助設備端、車站窗口和代售點窗口等不同渠道,提前進行車票預售。由于旅客行為的不確定性,可能出現(xiàn)辦理退票或改簽的情況,退票時按照階梯退票費率的方法收取退票費,目前在很多行業(yè)(如航空)都有損失承擔保險的退票險,尤其由于旅客自身原因退票產(chǎn)生損失時,可以為旅客承擔一定比例的費用。隨著鐵路電子客票的全面推廣,出現(xiàn)退票量居高不下的情況,研究鐵路退票險不僅是彌補車票退票差價的一種保險,還可以分擔旅客退票和鐵路客運資源在合同約定履行時間內的違約風險,降低旅客由于退票而產(chǎn)生的經(jīng)濟損失,補償鐵路由于退票而造成的資源浪費。因此,通過借鑒交通運輸行業(yè)的非壽險費率計算方法,選擇合適的業(yè)務影響因素和計量模型,構建鐵路退票險費率計算模型,形成針對不同風險類別的費率體系計算純保費,推進鐵路退票險費率研究進程。
退票險保費由純保費和附加保費構成,純保費為期望賠付的成本,附加保費包括經(jīng)營費用和保險監(jiān)管費用等。費率的影響因素是保險費率計算的基礎,根據(jù)可能造成損失的風險大小來確定影響因素,而且不同的影響因素包括不同的分類特征。在保險費率計算時,傳統(tǒng)的模型有加法模型和乘法模型[1],依據(jù)影響因素分類特征作為費率目標函數(shù)的自變量,通過加法或者乘法進行費率迭代計算,可以采用邊際總和法、最小二乘法和極大似然法等方法。這些費率計算方法的差異在于對目標函數(shù)的選擇,如邊際總和法是把收益與損失相等時作為臨界點,根據(jù)每一個影響因素分類的不同水平所計算的純保費之和等于相應的賠付邊際成本之和。假設影響因素分為2 類,費率計算公式為
式中:Cij為每個類別的賠付邊際成本;i為影響因素1 的分類;j為影響因素2 的分類;μ為整個影響因素集合的平均純保費;nij為每個類別的單位數(shù);αi,βj分別為每類影響因素的相對費率。
由公式(1)可得相對費率計算公式,即目標函數(shù)為
令分類變量αi的相對費率為1,即α1=α2= …=αm= 1,將其帶入βj的計算公式,計算得到的βj代入αi的計算公式,通過不斷迭代可以得到收斂的相對費率值,根據(jù)結果值進行回歸計算得到相應的純保費。
廣義線性模型計算方法采用的經(jīng)典費率計算方法是傳統(tǒng)線性模型的擴展,常見的有正態(tài)分布、泊松分布、伽馬分布和逆高斯分布等方法,通過聯(lián)結函數(shù)建立響應變量的數(shù)學期望值與因素變量之間的關系[2-4]。假設r維的響應變量Y服從指數(shù)型分布,概率密度函數(shù)可以表示為
式中:yp為響應變量,f(yp|θp,ω)為對應的概率密度函數(shù),p= 1,2,…,r;θp為自然參數(shù);ω為離散參數(shù);b(θp),c(yp,ω)為相應指數(shù)分布的已知函數(shù)。
假設1:因素變量可以表示為線性組合
式中:ηp為線性向量模型;xp為對應于yp的q維自變量X(即因素變量)的觀測值;β為q維未知參數(shù)。
假設2:yp的均值μp與ηp關系式可以表示為
式中:g(μp)為聯(lián)結函數(shù)。
廣義線性模型計算方法與傳統(tǒng)費率計算方法相比較具有以下優(yōu)勢。
(1)分布更加靈活。傳統(tǒng)費率計算方法通過加法或者乘法進行費率迭代計算,而廣義線性模型的計算方法是將各費率相加后通過聯(lián)結函數(shù)進行變換處理,廣義線性模型允許因素變量服從更為廣泛的分布族,即線性指數(shù)分布族,與普通的線性回歸模型比較,具有更大的靈活性。
(2)計算更加高效。雖然傳統(tǒng)費率計算方法原理簡單,但風險因素較多時迭代公式比較復雜,計算量會非常大,而廣義線性模型計算方法可以在很大程度上降低計算量。
(3)統(tǒng)計更加完整。傳統(tǒng)費率迭代的計算方法不足之處是不能對計算結果進行嚴格的統(tǒng)計檢驗,而廣義線性模型計算方法具有完整的統(tǒng)計檢驗模型。
在非壽險純保費計算的應用中,更多地采用廣義線性模型計算方法[5],廣義線性模型計算方法已經(jīng)成為個人車險、其他個險、以及部分商險計算的指導性方法[6],鑒于廣義線性模型計算方法的優(yōu)點,因而在退票險計算過程中采用廣義線性模型計算方法。
使用廣義線性模型的方法計算退票險費率后,通過赤池信息量準則(Akaike Information Criterion,AIC)值和離差平方和指標進行計算方法的有效性檢驗。
(1)AIC。AIC 是衡量統(tǒng)計模型擬合優(yōu)良性的一種標準,值越低表示擬合效果越好[7]。為防止過擬合,在評價模型時不能僅以擬合精度進行衡量,應是擬合精度和未知參數(shù)個數(shù)的綜合最優(yōu)化配置。
(2)離差平方和。離差平方和通常作為表征數(shù)據(jù)“離散程度”的指標,值越低表示擬合效果越好,計算公式為
式中:U為離差平方和;d為每個數(shù)據(jù);v為所有數(shù)據(jù)的均值。
鐵路退票險業(yè)務由費率計算模型、交易數(shù)據(jù)和盈虧評價模型組成,退票險業(yè)務交易數(shù)據(jù)變化與鐵路退票險費率計算模型密切相關。退票險費率計算是費率計算模型的核心,主要依據(jù)歷史交易數(shù)據(jù)形成退票險知識庫信息,在售票和退票業(yè)務辦理過程中對退票險知識庫信息進行應用,并產(chǎn)生新的交易數(shù)據(jù)。鐵路退票險費率計算模型由影響因素識別、費率計算和退票險知識庫閉環(huán)管理組成。鐵路退票險費率計算模型如圖1 所示。
圖1 鐵路退票險費率計算模型Fig.1 Rates model of railway refund insurance
首先需要依據(jù)風險因素進行分類,從而確定分類風險變量[8-10],將影響因素的屬性值作為后續(xù)費率計算的自變量??梢酝ㄟ^分析鐵路售票、退票、有退票險的退票費賠付等數(shù)據(jù),識別鐵路退票險影響因素。鐵路退票的發(fā)生,排除自然或者列車調圖等原因外,主要為旅客行為。其中,由于自然災害或者運行圖調整等鐵路責任,所發(fā)生的退票一般不收取退票費,不存在賠付;旅客行為從舒適程度、經(jīng)濟壓力和便捷程度等方面考慮賠付。
(1)舒適程度。旅客舒適度受到列車類型、席別、里程和乘車日期影響,旅行歷時越短,席別等級越高,人員擁擠度越低,則旅客舒適度越高。列車類型為目前旅客群體客座率較高的高速鐵路列車、動車組列車和普速鐵路列車;席別特征包含列車類型對應的所有席別種類;日期特征根據(jù)既有的假期進行分類;里程特征以1 000 km 為節(jié)點進行里程歸屬分類。
(2)經(jīng)濟壓力。所購買車票的票價越低,旅客所承擔的經(jīng)濟壓力越小。票價特征以300 元為節(jié)點進行票價分類。
(3)便捷程度。購票渠道包含既有的互聯(lián)網(wǎng)、手機APP、車站窗口、代售點窗口、TVM 和電話訂票渠道。通過手機APP 退票比其他渠道便捷,在開車前可以隨時隨地辦理退票手續(xù)。而且已經(jīng)注冊12306 賬戶的乘車人不論通過哪個渠道購買電子客票,均可以通過手機App 或者互聯(lián)網(wǎng)渠道辦理退票。
當票價相差不大時,旅客會優(yōu)先考慮舒適度高、發(fā)車日期,以及發(fā)點最優(yōu)的列車,然而一旦有更適合的車票,次優(yōu)車票被退票的可能性將提高,而且便捷的退票渠道也將提高退票的概率。綜上,退票險影響因素包括列車類型、席別特征、日期特征、里程特征、票價特征和購票渠道,退票險影響因素如表1 所示。
退票險費率是退票險保費計算的依據(jù),通過對非壽險費率計算方法的比較分析,選擇廣義線性模型的方法進行退票險費率計算。進行退票險費率計算之前,首先應明晰以下幾個變量的含義。一是風險單位,風險度量的基本單位,是保險標的發(fā)生1 次風險可能造成的最大損失范圍,如車輛險以1 輛汽車為1 個風險單位;二是賠付頻率,一定時期內每個風險單位的賠付次數(shù),描述風險發(fā)生的可能性,通常用賠付總次數(shù)和風險單位數(shù)的比值進行估計;三是賠付強度,1 個風險單位每次賠付的金額,描述風險發(fā)生的嚴重程度,通常用賠付總金額與賠付總次數(shù)的比值進行估計。
按照風險單位的含義,對于退票險,1 張車票即為1 個風險單位,1 張車票只能退1 次,賠付頻率為1 或者0,賠付強度為車票的退票損失補償金額。為研究風險類別對應的保費,形成費率體系,以退票險影響因素“列車類型、席別特征、日期特征、里程特征、票價特征和購票渠道”為風險類別,研究一定時期內每個風險類別的賠付頻率及賠付強度。風險單位數(shù)為購買退票險的每個風險類別的車票總張數(shù);賠付總次數(shù)為每個風險類別實際進行賠付的總次數(shù),即按照風險類別產(chǎn)生的退票損失補償總次數(shù);賠付總金額為每個風險類別實際進行賠付的總金額,即按照風險類別產(chǎn)生的退票損失補償款之和。因此,按照風險類別的賠付頻率和賠付強度計算式分別為
表1 退票險影響因素Tab.1 Influencing factors of refund insurance
式中:Lcp為按照風險類別的賠付頻率;Lcn為按照風險類別的退票損失補償總次數(shù);Ts為按照風險類別的購買退票險的車票總張數(shù);Lca為按照風險類別的賠付強度;Mc為按照風險類別的退票損失補償總金額。
目前鐵路退票時實行“梯次退票”規(guī)定,旅客退票費不再按固定比例收取,而是分別按票價的5%,10%和20%來收取。在距離發(fā)車不同的時間階梯內,退票費率不同,旅客越早退票,收取的退票費就越低。退票險購買的初衷是轉移退票風險,補償退票費損失部分,由于旅客是否退票的原因具有復雜性、客觀性,每一位旅客對于退票風險的預估是不同的,一般會在行程不確定、購買的車票不是理想車票等情況下購買退票險?,F(xiàn)在鐵路還沒有開展退票險業(yè)務,暫時沒有退票險購買及退票后的賠付數(shù)據(jù),因而在進行費率計算前,假設:每筆退票都已經(jīng)購買退票險;收取退票費的退票均已經(jīng)進行賠付。在該假設條件下進行費率計算,未來實施退票險后,購買退票險的車票不一定發(fā)生退票,進行退票的車票不一定已經(jīng)購買退票險,對費率計算模型評價后,如果需要優(yōu)化費率體系則根據(jù)實際的購買及賠付數(shù)據(jù)進行費率計算。
根據(jù)費率計算的輸出結果形成退票險費率體系,作為退票險知識庫的重要組成部分。退票險知識庫由退票險費率計算體系和退票損失補償體系組成,為退票險業(yè)務應用提供依據(jù),包括退票售保和賠付等的規(guī)則和基礎信息,通過在售票和退票時進行知識庫信息的應用,在交易數(shù)據(jù)產(chǎn)生后進行盈虧分析,對退票險費率計算模型進行評價,以改進費率計算部分并優(yōu)化退票險知識庫信息,形成對退票險知識庫的閉環(huán)管理,退票險知識庫閉環(huán)管理如圖2 所示。
在退票險知識庫中,將退票險費率計算得到的風險類別的純保費和附加保費相加得到的保費作為基礎數(shù)據(jù)。在預售期內購買車票時,旅客自愿選擇是否購買退票險,當選擇購買退票險時,根據(jù)所購車票信息從退票險知識庫獲得對應風險類別的退票險費用信息。如果已經(jīng)購買退票險,一旦發(fā)生退票時,根據(jù)退票險知識庫的損失補償體系采用即時或者事后方式進行凈退款計算,并進行退票存根及賠付存根的關聯(lián)信息記錄。即時賠付是將賠付費用與退票費用一并計算,退票完成時賠付即完成,如可以按照目前的階梯退票費率,購買退票險的旅客將執(zhí)行降級一檔,或者計算退票費率時,距離開車時間自動加1 d 來承擔部分損失,獲得賠付后的凈退款。事后賠付是在不影響目前的退票業(yè)務的前提下,退票完成后,在一定工作日內將賠付費用返回到旅客賬戶。賠付方式需要根據(jù)歷史退票及賠付數(shù)據(jù)進行分析后制定,并根據(jù)鐵路退票險盈虧評價模型進行退票險知識庫信息的優(yōu)化。
圖2 退票險知識庫閉環(huán)管理Fig.2 Closed loop management of refund insurance knowledge base
通過使用廣義線性模型的方法計算鐵路退票險費率,根據(jù)業(yè)務的先驗信息選擇合適的損失概率密度函數(shù)及聯(lián)結函數(shù),進行賠付頻率和賠付強度的參數(shù)估計,并利用參數(shù)的估計值進行回歸計算后得到純保費。
(1)選擇損失概率密度函數(shù)及聯(lián)結函數(shù)。選取2017 年、2018 年某線路列車退票數(shù)據(jù),依據(jù)已識別的退票險影響因素對實驗數(shù)據(jù)進行預處理,將實驗數(shù)據(jù)按照影響因素的屬性值進行歸類統(tǒng)計,依據(jù)公式(11)和公式(12)生成退票險風險類別對應的風險單位數(shù)、賠付總次數(shù)、賠付總金額等數(shù)據(jù),用以進行賠付頻率及賠付強度分布的研究,研究中對客票數(shù)據(jù)進行脫敏處理。賠付頻率實驗數(shù)據(jù)呈左偏趨勢,賠付強度實驗數(shù)據(jù)呈右偏趨勢,截去賠付頻率小于0.4 的樣本數(shù)據(jù)和賠付強度右偏并且強度極大而且個數(shù)極少的樣本數(shù)據(jù)后,賠付頻率及賠付強度的密度分布如圖3 所示。根據(jù)其他行業(yè)對保費的既有研究及鐵路退票按風險類別的賠付頻率、賠付強度數(shù)據(jù)的分布情況,分別選擇泊松分布、正態(tài)分布作為賠付頻率的損失分布函數(shù),分別選擇伽瑪分布、正態(tài)分布作為賠付強度的損失分布函數(shù),其中自變量為xpq(p= 1,2,…,6;q= 1,2,…,c,c為xp的屬性個數(shù))。為確保退票險的相對費率之間是相乘關系,選擇對數(shù)聯(lián)結函數(shù)。
(2)參數(shù)估計。參數(shù)估計結果如表2 所示。表2 為賠付頻率和賠付強度分別采用不同的損失概率密度函數(shù)建立廣義線性模型時得到的參數(shù)估計結果。根據(jù)本次實驗數(shù)據(jù),自變量“里程特征”僅使用x41和x42類,其它自變量為表1 中的所有分類。通過顯著性檢驗分析,賠付頻率的損失概率密度函數(shù)選擇泊松分布,賠付強度的損失概率密度函數(shù)選擇伽馬分布。
(3)純保費計算。首先得到各風險分類的賠付強度和賠付頻率的期望值,通過賠付頻率和賠付強度期望值的乘積計算該風險類別的鐵路退票險純保費。當退票險試行后,購買退票險的車票不一定發(fā)生退票,退票后不一定發(fā)生索賠,根據(jù)對費率計算模型的評價結果,基于歷史退票數(shù)據(jù)及保險數(shù)據(jù)可以采用同樣的方法建立賠付頻率和賠付強度模型。
(1)退票險賠付頻率和賠付強度的有效性驗證。使用2019 年同一線路列車的數(shù)據(jù)給出賠付頻率、賠付強度的驗證結果,包括離差平方和、AIC值。其中,計算賠付頻率的離散平方和時,“每個數(shù)據(jù)”指每個賠付頻率值,均值為賠付頻率的均值;計算賠付強度的離散平方和時,“每個數(shù)據(jù)”指每個賠付強度值,均值為賠付強度的均值。賠付頻率及賠付強度擬合優(yōu)度比較如表3 所示。從表3檢驗結果可知,對于泊松分布來說,其離差平方和低于正態(tài)分布,說明泊松分布對于樣本數(shù)據(jù)擬合效果優(yōu)于正態(tài)分布;另外,在使用赤池信息量準則進行檢驗時,泊松分布的AIC 值較低,說明其在擬合精度和復雜度之間的平衡關系做的更好。同樣,從表3 檢驗結果可知,賠付強度采用伽瑪分布擬合優(yōu)度優(yōu)于正態(tài)分布。
(2)退票險純保費的有效性驗證。用傳統(tǒng)的迭代法與廣義線性模型的方法進行比較驗證。采用差值比對有效性進行驗證,差值比D計算式為
圖3 賠付頻率及賠付強度的密度分布Fig.3 Density distribution of compensation frequency and compensation intensity
式中:IGLM為退票險費率計算模型計算的純保費;Iite為迭代法計算的純保費。
以2017 年、2018 年同一線路列車樣本數(shù)據(jù)為數(shù)據(jù)源,采用基于廣義線性模型的方法進行純保費計算后,與對應各退票險風險類別的迭代法純保費進行比較,退票純保費有效性驗證如圖4 所示。其中橫坐標為退票險風險因素的各種分類類別,如“高速鐵路列車/一等座/春運/1 ~1 000 km/0 ~ 300 元/互聯(lián)網(wǎng)購票”、“高速鐵路列車/ 一等座/ 春運/1 001 ~ 2 000 km/301 ~ 600 元/互聯(lián)網(wǎng)購票”等。
從圖4 可以得出基于目前的實驗數(shù)據(jù),除個別高額票價的類別外,差值比基本在[-0.1,0.1]之間,客票票價目前都是以元或者0.5 元為單位,在純保費計算時同樣以此為單位,因而差值為1 元或者0.5元是合理的,2 種方法計算的純保費差別不大。在實驗中傳統(tǒng)迭代法采用邊際總和法,迭代法的原理簡單,但是風險因素較多時迭代公式復雜,計算量非常大,效率較低。用廣義線性模型的方法比邊際總和法節(jié)省3 倍左右時間,因而依據(jù)廣義線性模型方法計算退票險費率合理有效。
表2 參數(shù)估計結果Tab.2 Result of parameters estimation
表3 賠付頻率及賠付強度擬合優(yōu)度比較Tab.3 Comparison on the fit goodness of compensation frequency and compensation intensity
隨著高速鐵路的快速發(fā)展,旅客的出行越來越便利,由于出行前突發(fā)情況的難預測性,旅客需要為無法出行的退票行為承擔經(jīng)濟損失,退票險的推進可以轉移由于退票行為產(chǎn)生的經(jīng)濟損失的風險。制定退票險費率是退票險業(yè)務應用的基礎,結合鐵路旅客退票行為的實際和特點,研究鐵路退票險費率計算模型,有助于加快鐵路退票險費率出臺。退票險費率是退票險保費計算的依據(jù),購買退票險后,發(fā)生退票時需要按照規(guī)則進行賠付,因而還應研究退票損失補償體系,構建全面的退票險體系。
圖4 退票純保費有效性驗證Fig.4 Validity verification of pure premium on refund