劉新紅 孟生旺
摘要在假設(shè)各個業(yè)務線的增量已決賠款服從伽瑪分布、逆高斯分布和對數(shù)正態(tài)分布的基礎(chǔ)上, 建立了各個業(yè)務線增量已決賠款的GAMLSS模型, 并將此模型應用于一組具有明顯異方差的車險數(shù)據(jù), 擬合效果優(yōu)于均值回歸模型. 另外, 在多個業(yè)務線的準備金估計中, 不同業(yè)務線之間的相依性通過藤Copula函數(shù)來描述. 用D藤Copula描述相依關(guān)系的GAMLSS模型對準備金的評估結(jié)果既優(yōu)于獨立假設(shè)下的GAMLSS模型和鏈梯法對準備金的評估結(jié)果,同時還刻畫了不同業(yè)務線之間的尾部相依性.
關(guān)鍵詞非壽險;準備金;相依風險;藤Copula;GAMLSS模型
中圖分類號F222.3 文獻標識碼A
AbstractUnder the assumption that the incremental paid claims of every line of business follow gamma distribution, inverseGaussian distribution and lognormal distribution, respectively, the corresponding GAMLSS models were established. The models were applied to a heteroscedastic data set of auto insurance claims, and the result shows that GAMLSS models are superior to mean regression models in predicting outstanding claim reserve. In practice, different lines of insurance business are, to some extent and their dependence can be captured by Vine Copula functions. The corresponding Vine Copula and GAMLSS models were established. The result shows that D Vine Copulabased GAMLSS model is superior to independent GAMLSS models and Chain Ladder method in claims reserving, and it also describes the tail dependence of different lines of business.
Key words nonlife insurance; reserve; dependent risks; Vine Copula; GAMLSS
1引言
非壽險公司資產(chǎn)負債表上金額最大的負債項目是賠款準備金. 鏈梯法、案均賠款法、準備金進展法、BF法和廣義線性模型等都是針對單個保險業(yè)務的準備金評估方法, 這些方法的一個共同特點是僅對賠款準備金的均值進行預測沒有考慮數(shù)據(jù)中的異方差性. 本文對單個保險業(yè)務的準備金評估采用基于位置、尺度、形狀參數(shù)的廣義可加模型(GAMLSS)1, 從而可以處理數(shù)據(jù)中的異方差現(xiàn)象. GAMLSS模型假定響應變量服從比指數(shù)分布族更廣的一類分布, 系統(tǒng)部分可建立位置、尺度和形狀參數(shù)與解釋變量的回歸模型.
在多個業(yè)務線的準備金估計中, 通常假設(shè)不同業(yè)務線之間相互獨立, 事實上它們之間往往存在一定的相依關(guān)系. 如Braun、Schmidt、Merz、Zhang等2-5針對累積已決賠款采用多元鏈梯法、多元加性方法等評估未決賠款準備金. 而針對增量已決賠款, Peng和Frees6通過Copula回歸模型解決了兩個業(yè)務線在相依情況下的準備金評估問題; Jong7通過Copula函數(shù)和因子分析法研究了多個業(yè)務線的準備金評估問題. Copula是一種通過單個變量的邊緣分布構(gòu)造多個變量的聯(lián)合分布的數(shù)學方法, 可以將多元隨機變量的邊緣分布和它們之間的相關(guān)結(jié)構(gòu)分開研究, 相關(guān)結(jié)構(gòu)不受邊緣分布的限制. 多元Gaussian Copula和多元t Copula描述的相關(guān)結(jié)構(gòu)是對稱的, 并且Gaussian Copula沒有尾部相依特征;在多元阿基米德Copula函數(shù)中, 一個或者兩個參數(shù)就代表了任意兩個變量之間的相關(guān)結(jié)構(gòu), 且相關(guān)結(jié)構(gòu)相同. 可見常用的多元Copula函數(shù)解決多個變量之間的相依關(guān)系存在著很多限制. 又由于多元問題存在著高維災難, Joe8、Bedford和Cooke9提出了基于二元Copula函數(shù)(即PairCopulas)的藤Copula, 它通過將多元分布分解為多個PairCopulas函數(shù), 有效解決了多個隨機變量之間的相依性, 結(jié)構(gòu)更加靈活. 藤Copula在實際領(lǐng)域的應用已經(jīng)受到一定關(guān)注, 可參見Aas和Czado10, Brechmann和Schepsmeier11.
本文將藤Copula應用于國內(nèi)汽車保險的賠款數(shù)據(jù). 在汽車保險中, 保險公司通常會同時承保交強險、商業(yè)三責險、車損險和其他各種附加險. 由于每個業(yè)務線的增量已決賠款都具有異方差性, 本文假設(shè)每個業(yè)務線的增量已決賠款分別服從伽瑪分布、逆高斯分布和對數(shù)正態(tài)分布的基礎(chǔ)上, 建立了兩類GAMLSS模型, 并應用藤Copula描述不同業(yè)務線之間的相依關(guān)系. PairCopulas主要采用Gaussian Copula、t Copula、Clayton Copula、Gumble Copula、Frank Copula、Joe Copula、BB1 Copula、BB6 Copula、BB7 Copula和BB8 Copula以及它們的旋轉(zhuǎn)Copula. 本文將GAMLSS模型與藤Copula結(jié)合, 建立了基于藤Copula的GAMLSS模型, 并通過實例驗證了此模型的優(yōu)越性. 目前所知, 在現(xiàn)有的文獻中尚未看到基于藤Copula的GAMLSS模型及其對多個業(yè)務線準備金進行預測的研究成果.
2單個業(yè)務線的準備金評估與GAMLSS模型
2.1準備金評估的基本假設(shè)
傳統(tǒng)的非壽險準備金評估都是分別對每個業(yè)務線建模, 建模的數(shù)據(jù)通常以流量三角形的形式給出. 本文使用的原始數(shù)據(jù)是我國某財險公司的車險業(yè)務數(shù)據(jù), 包括機動車輛法定第三者責任險(簡稱交強險)、機動車輛商業(yè)第三者責任險(簡稱商業(yè)三責險)、機動車輛車體損失險(簡稱車損險)和機動車輛其他附加險(簡稱其他附加險). 數(shù)據(jù)是從2007年1月到2009年12月再保前的已賺保費和累積已決賠款. 評估日為2009年12月, 事故期和進展期的長度都為一個季度.
在上述三個分布中, μ是位置參數(shù), σ是尺度參數(shù). 尺度參數(shù)可以用于描述數(shù)據(jù)的分散程度和厚尾性. 在通常的準備金評估模型中, 僅對均值參數(shù)建立回歸模型, 而假設(shè)尺度參數(shù)是恒定的. 但從表1可以明顯看出, 四條業(yè)務線在各個事故季的樣本方差存在明顯差異. 若僅對均值參數(shù)建立回歸模型, 則意味著尺度參數(shù)和形狀參數(shù)都是常數(shù), 這與實際數(shù)據(jù)的特點不符. 本文將采用GAMLSS模型, 同時建立位置參數(shù)和尺度參數(shù)的回歸模型.在假設(shè)交強險、商業(yè)三責險、車損險和其他附加險的增量已決賠款分別服從對數(shù)正態(tài)分布、伽瑪分布、對數(shù)正態(tài)分布和對數(shù)正態(tài)分布的條件下, 選取擬合效果最好的GAMLSS模型. 在該估計中, 增量已決賠款的回歸模型中解釋變量包括進展季和事故季, 基準時間是事故季1和進展季1, 回歸系數(shù)顯著不為零. 前23個解釋變量為均值提供解釋, 后23個解釋變量為尺度參數(shù)提供解釋. 從估計結(jié)果可以看出, 隨著進展季的發(fā)展, 增量已決賠款呈現(xiàn)遞減趨勢, 而隨著事故季的增加, 增量已決賠款呈現(xiàn)出震蕩變化形態(tài).
4.24條業(yè)務線增量已決賠款的相依關(guān)系
在汽車保險實務中, 條業(yè)務線之間的增量已決賠款往往是相關(guān)的. 隨機變量之間的聯(lián)合分布可以應用藤Copula函數(shù)來刻畫, 相關(guān)性的大小可通過Kendalls τ相關(guān)系數(shù)來衡量.
對于本文研究的汽車保險賠款數(shù)據(jù), 表3的上三角形中給出了4條業(yè)務線增量已決賠款之間的Pearson相關(guān)系數(shù), 表3的下三角形中給出了4條業(yè)務線增量已決賠款的Kendalls τ相關(guān)系數(shù). 所有相關(guān)系數(shù)的值都表明, 4條業(yè)務線之間的增量已決賠款是高度正相關(guān)的. 這種現(xiàn)象很可能是由于一些共同影響因素造成的, 如日歷年的通貨膨脹、保險政策等都會導致增量賠款的正向相依性.
增量已決賠款之間的正向相依關(guān)系, 可以通過藤Copula函數(shù)進行描述. 在不同的藤結(jié)構(gòu)圖中,4個業(yè)務線都需要6個PairCopulas來描述它們之間的兩兩相依關(guān)系. 通過逐個試驗, 本文選取了使似然函數(shù)達到最大的6個PairCopulas函數(shù), 如表4所示. 二元Copula函數(shù)的名稱及括號內(nèi)的數(shù)字表示這兩個變量之間的相依關(guān)系通過此Copula函數(shù)來描述. 根據(jù)圖1, 在C藤結(jié)構(gòu)中的隨機變量1、2、3和4分別表示其他附加險、車損險、交強險和商業(yè)三責險的增量已決賠款. 在C藤結(jié)構(gòu)中, 旋轉(zhuǎn)90°的Joe(23|1)表示在其他附加險增量已決賠款給定的條件下, 車損險增量已決賠款和交強險增量已決賠款之間的相依關(guān)系通過旋轉(zhuǎn)90°的Joe Copula函數(shù)來描述. PairCopulas函數(shù)中的參數(shù)估計方法使用了序列似然估計法和最大似然估計法. 序列似然估計法是從藤結(jié)構(gòu)的最上層出發(fā), 依次得到每個二元Copula參數(shù)的極大似然估計值; 最大似然估計法是直接寫出所有樣本的似然函數(shù), 在最大化似然函數(shù)的條件下估計其中的所有參數(shù). 兩種方法的估計結(jié)果非常接近, 如表4所示. 由PairCopulas函數(shù)中的參數(shù)估計值可以得到每對相依關(guān)系的kendalls τ值, 即表4中T值. 在C藤結(jié)構(gòu)中, 如果給定其他附加險的已決賠款, 則車損險與交強險、車損險與商業(yè)三責險的增量已決賠款之間的kendalls τ值分別為-0.080 4和 -0.047 9. 其他業(yè)務線之間存在著一定的正相依關(guān)系. 根據(jù)圖2, 在D藤結(jié)構(gòu)中隨機變量1、2、3和4分別表示車損險、商業(yè)三責險、交強險和其他附加險的增量已決賠款. 在D藤結(jié)構(gòu)中, 業(yè)務線之間都存在著一定的正相依關(guān)系.
AIC值分別為-25.227 8、-25.798 6、-25.801 9和-26.050 0. 從AIC的角度看, D藤與C藤沒有顯著差異, 但考慮到D藤結(jié)構(gòu)比C藤結(jié)構(gòu)更加靈活, 所以本文選取D藤結(jié)構(gòu)描述不同業(yè)務線之間的相依關(guān)系. 根據(jù)Joe等14的結(jié)論, 只要第一層的PairCopulas中有反映尾部相依性的Copula函數(shù), 那么藤結(jié)構(gòu)的多元隨機變量的相依關(guān)系中就能體現(xiàn)出尾部相依. 在C藤結(jié)構(gòu)中, 第一層的PairCopulas中沒有反映尾部相依性的Copula函數(shù), 藤結(jié)構(gòu)的多元隨機變量的相依關(guān)系沒能體現(xiàn)出尾部相依. 而在D藤結(jié)構(gòu)中, 第一層的Joe Copula和Survial Gumble Copula都有尾部相關(guān)系數(shù). 交強險和商業(yè)三責險的增量已決賠款的下尾相關(guān)系數(shù)為0.270 1, 說明交強險的增量已決賠款出現(xiàn)較小值時, 商業(yè)三責險的增量已決賠款出現(xiàn)較小值的概率為0.270 1. 商業(yè)三責險和車損險的增量已決賠款的上尾相關(guān)系數(shù)為0.156 9, 說明商業(yè)三責險出現(xiàn)大額增量已決賠款時, 車損險以0.156 9的概率出現(xiàn)大額增量已決賠款.
4.34條業(yè)務線未決賠款準備金的評估
聯(lián)合式(1)、式(2)、表2和表4的結(jié)果, 即可得到基于藤Copula的GAMLSS模型, 并可以應用IFM方法15估計藤Copula和GAMLSS模型中的參數(shù). 本文使用兩種方法分別對4條業(yè)務線的未決賠款準備金進行了預測. 其中“D”表示基于D藤結(jié)構(gòu)的GAMLSS模型II對準備金的預測值, “L”表示鏈梯法對準備金的預測值. 基于D藤結(jié)構(gòu)的GAMLSS模型結(jié)果是通過蒙特卡洛方法模擬100 000組數(shù)據(jù)得到的. 聯(lián)合表2和表4的結(jié)果,4條業(yè)務線的增量未決賠款如表5所示.
若采用GAMLSS模型II, 但不考慮4條業(yè)務線之間的相依關(guān)系, 使用前文給每個業(yè)務線選定的最優(yōu)分布假設(shè), 可以求得對數(shù)正態(tài)回歸模型對交強險準備金的預測值為59 175千元, 伽瑪回歸模型對商業(yè)三責險準備金的預測值為20 623千元, 對數(shù)正態(tài)回歸模型對車損險準備金的預測值為16 118千元, 對數(shù)正態(tài)回歸模型對其他附加險準備金的預測值為8 850千元. 在相互獨立的假設(shè)下, 4個業(yè)務線的未決賠款準備金之和為104 766千元, 這比基于D藤結(jié)構(gòu)的GAMLSS模型II的預測值少36千元. 若采用GAMLSS模型I, 不考慮4個業(yè)務線之間的相依關(guān)系, 并使用最優(yōu)分布假設(shè), 則伽瑪回歸模型對交強險準備金的預測值為55 696千元, 伽瑪回歸模型對商業(yè)三責險準備金的預測值為21 132千元, 對數(shù)正態(tài)回歸模型對車損險準備金的預測值為17 207千元, 對數(shù)正態(tài)回歸模型對其他附加險準備金的預測值為10 504千元. 在相互獨立的假設(shè)下, 四個業(yè)務線的未決賠款準備金之和為104 539千元, 這比基于D藤結(jié)構(gòu)的GAMLSS模型II的預測值少了263千元. 可見, 忽略業(yè)務線之間正向相依關(guān)系的準備金預測結(jié)果都是偏低的.
對于存在正向相依關(guān)系的風險, 各種風險的VaR值之和會大于獨立假設(shè)下的VaR值之和16. 如果忽略不同業(yè)務線之間的相依性, 就有可能低估實際的準備金風險. 基于D藤結(jié)構(gòu)的GAMLSS模型II既考慮了4個業(yè)務線之間的相依性, 又考慮了數(shù)據(jù)之間的異方差性, 因此對準備金的預測結(jié)果更加合理.
5結(jié)論
在汽車保險中, 如果假設(shè)交強險、商業(yè)三責險、車損險和其他附加險相互獨立, 并且分別估計它們的準備金, 則很有可能會低估保險公司面臨的未決賠款準備金風險. 本文通過一個實例驗證了汽車保險的4個業(yè)務線之間存在正向相依關(guān)系, 并利用C藤和D藤結(jié)構(gòu)的PairCopulas函數(shù)刻畫了它們之間的相依關(guān)系. 由于在D藤結(jié)構(gòu)的第一層中存在著反映尾部相依關(guān)系的二元PairCopulas, 所以選取D藤結(jié)構(gòu)也體現(xiàn)了4個業(yè)務線增量已決賠款的尾部相依性. 本文應用汽車保險的實際賠款數(shù)據(jù), 將基于D藤結(jié)構(gòu)的GAMLSS模型II、獨立假設(shè)下的GAMLSS模型II、GAMLSS模型I和鏈梯法進行了比較, 結(jié)果表明, D藤結(jié)構(gòu)可以較好地描述4個業(yè)務線之間的相依關(guān)系, 而GAMLSS模型可以解決具有異方差的準備金數(shù)據(jù), 因此, 基于D藤結(jié)構(gòu)的GAMLSS模型對準備金的預測結(jié)果要優(yōu)于獨立假設(shè)下的GAMLSS模型和鏈梯法.
參考文獻
1.R A RIGBY, D M STASINOPOULOS. Generalized additive models for location, scale and shape (with discussion)J.. Applied Statistics, 2005, 54(3): 507-554.
2.Yanwei ZHANG. A general multivariate chain ladder modelJ.. Insurance: Mathematics & Economics, 2010, 46(3): 588-599.
3.M MERZ, M WUTHRICH. Prediction error of the multivariate chain ladder reserving methodJ.. North American Actuarial Journal, 2008, 12(2): 175-197.
4.C BRAUN. The prediction error of the chain ladder method applied to correlated runoff trianglesJ.. Astin Bulletin, 2004, 34(2):399-423.
5.K T HEES, K D SCHMIDT, M ZOCHER. Multivariate loss prediction in the multivariate additive model. Insurance: Mathematics & Economics, 2006, 39(2): 185-191.
6.Peng SHI, E W FREES. Dependent loss reserving using copulasJ.. Astin Bulletin, 2011, 41(2): 449-486.
7.P D JONG. Modeling dependence between loss trianglesJ.. North American Actuarial Journal, 2012, 16(1): 74-86.
8.H JOE. Families of mvariate distributions with given margins and m(m-1)/2 bivariate dependence parametersR.. Hayward: Institute of Mathematical Statistics, 1996.
9.T BEDFORD, R M COOKE. Vinea new graphical model for dependent random variablesJ.. Annals of Statistics, 2002, 30(4): 1031-1068.
10.K AAS, C CZADO, A FRIGESSI, et al. Paircopula constructions of multiple dependenceJ.. Insurance: Mathematics & Economics, 2009, 44(2): 182-198.
11.E C BRECHMANN, U SCHEPSMEIER. Modeling dependence with Cand DVine Copulas: the r package CDVineJ.. Journal of Statistical Software, 2013, 52(3): 1-27.
12.M STASSINOPOULOS, B RIGBY. Generalized Additive Models for Location Scale and Shape(GAMLSS) in RJ.. Journal of Statistical Software, 2007, 23(7):1-46.
13.R B NELSEN. An introduction to copulasM.. New York: Springer,2006.
14.H JOE, H LI, A K NIKOLOULOPOULOS. Tail dependence functions and vine copulasJ.. Journal of Multivariate Analysis, 2010, 101(1): 252-270.
15.H JOE. Multivariate models and dependence conceptsM.. London: Chapman and Hall, 1997.
16.M DENUIT, J DHAENE, M GOOVAERTS, et al. Actuarial theory for dependent risks: measures, orders and modelsM.. New York:John Wiley & Sons Inc, 2005.