劉曼莉,李興緒
(云南財(cái)經(jīng)大學(xué) 統(tǒng)計(jì)與數(shù)學(xué)學(xué)院,昆明650221)
非壽險(xiǎn)精算中的數(shù)據(jù)尾部擬合與保費(fèi)厘定
劉曼莉,李興緒
(云南財(cái)經(jīng)大學(xué) 統(tǒng)計(jì)與數(shù)學(xué)學(xué)院,昆明650221)
文章討論了極值分布對(duì)非壽險(xiǎn)精算中損失數(shù)據(jù)尾部的擬合和保費(fèi)厘定方法,并進(jìn)行了實(shí)例計(jì)算。研究表明:必須對(duì)應(yīng)用極值分布的條件進(jìn)行檢驗(yàn);對(duì)門(mén)限值確定的三種方法中自適應(yīng)選擇算法是較好方法;廣義帕累托分布參數(shù)MLE估計(jì)能得到比較精確的估計(jì)結(jié)果。文章還給出了非壽險(xiǎn)損失的超賠再保險(xiǎn)純保費(fèi)的計(jì)算方法。
廣義帕累托分布;尾部擬合;保費(fèi)厘定;非壽險(xiǎn)
非壽險(xiǎn)是指除人身保險(xiǎn)以外的保險(xiǎn)業(yè)務(wù),主要包括財(cái)產(chǎn)保險(xiǎn)、責(zé)任保險(xiǎn)、信用保險(xiǎn)、保證保險(xiǎn)等,在我國(guó)通常把非壽險(xiǎn)稱為財(cái)產(chǎn)保險(xiǎn),也就是采用了所謂的廣義的財(cái)產(chǎn)保險(xiǎn)的概念。非壽險(xiǎn)產(chǎn)品的設(shè)計(jì)以非壽險(xiǎn)精算為基礎(chǔ)。非壽險(xiǎn)精算主要是以非壽險(xiǎn)中的不確定性為研究對(duì)象,通過(guò)建立隨機(jī)模型對(duì)險(xiǎn)種損失進(jìn)行刻畫(huà),研究未來(lái)的理賠規(guī)律,在此基礎(chǔ)上建立費(fèi)率厘定和準(zhǔn)備金提取等方面的理論基礎(chǔ);通過(guò)對(duì)險(xiǎn)種的賠付數(shù)據(jù)進(jìn)行收集和分析,確定未來(lái)的費(fèi)率結(jié)構(gòu),根據(jù)歷史數(shù)據(jù)利用合理方法確定準(zhǔn)備金提取的額度及安排合理的再保險(xiǎn)方式等。精算在險(xiǎn)種的開(kāi)發(fā)設(shè)計(jì)、費(fèi)率厘定到準(zhǔn)備金的提取以及再保險(xiǎn)等方面都起到了核心作用。
非壽險(xiǎn)精算工作的基礎(chǔ)是損失數(shù)據(jù)分布擬合,在對(duì)非壽險(xiǎn)損失數(shù)據(jù)分布擬合中,經(jīng)常會(huì)遇到一些損失數(shù)額巨大的觀測(cè)值,一般的方法只能對(duì)數(shù)據(jù)分布的中心部分得到一個(gè)精確的數(shù)據(jù)生成過(guò)程,而不能很好擬合數(shù)據(jù)的尾部,即那些損失數(shù)額巨大的觀測(cè)并沒(méi)有得到精確的數(shù)據(jù)生成過(guò)程。面對(duì)這樣的問(wèn)題,將那些損失數(shù)額巨大的觀測(cè)值視為異常點(diǎn)而不予考慮,固然可以得到一個(gè)相對(duì)漂亮的模型,但對(duì)非壽險(xiǎn)企業(yè)的全面、客觀的風(fēng)險(xiǎn)控制和精算過(guò)程來(lái)說(shuō)卻是極為不科學(xué)的。王新軍[1](2001)對(duì)非壽險(xiǎn)中的損失分布擬合方法進(jìn)行了討論,但沒(méi)有考慮數(shù)據(jù)尾部的擬合方法;Alexander J.McNeil[2](1997)利用極值理論討論了非壽險(xiǎn)數(shù)據(jù)的尾部擬合問(wèn)題,但沒(méi)有對(duì)極值理論的應(yīng)用條件進(jìn)行檢驗(yàn);Alexander J.McNeil[3](1998)還進(jìn)一步研究了利用極值理論和超越門(mén)限值的方法(Peak Over Threshold,簡(jiǎn)稱POT)對(duì)非壽險(xiǎn)數(shù)據(jù)尾部擬合的有效性。已有的研究成果,強(qiáng)調(diào)利用極值理論來(lái)擬合非壽險(xiǎn)數(shù)據(jù)尾部,而忽視了對(duì)其應(yīng)用條件的檢驗(yàn)和最優(yōu)門(mén)限值的選取研究。本文擬結(jié)合實(shí)際數(shù)據(jù),重點(diǎn)討論非壽險(xiǎn)數(shù)據(jù)尾部擬合中極值理論應(yīng)用條件檢驗(yàn)和最優(yōu)門(mén)限值的選取問(wèn)題,給出險(xiǎn)位超賠再保險(xiǎn)的純保費(fèi)計(jì)算方法,以期能對(duì)非壽險(xiǎn)損失的精算問(wèn)題有所借鑒。
在非壽險(xiǎn)損失分布的擬合過(guò)程,首先要做的工作是判斷損失數(shù)據(jù)是否存在一個(gè)厚尾,如果損失數(shù)據(jù)不具有厚尾,一般的正態(tài)分布或者對(duì)數(shù)正態(tài)分布就能夠?qū)p失數(shù)據(jù)的尾部進(jìn)行精確的描述;其次,一旦確定損失數(shù)據(jù)的尾部的確存在厚尾,方法之一是應(yīng)用極值理論中的廣義帕累托分布來(lái)擬合損失數(shù)據(jù);但并不是所有存在厚尾的數(shù)據(jù)都可以應(yīng)用廣義帕累托分布來(lái)擬合,必須進(jìn)行應(yīng)用條件的最大吸引域條件檢驗(yàn);再次,在確定可以使用廣義帕累托分布來(lái)擬合存在厚尾的數(shù)據(jù)之后,一個(gè)重要的問(wèn)題就是對(duì)損失數(shù)據(jù)進(jìn)行分割,即找到一個(gè)科學(xué)的、適當(dāng)?shù)拈T(mén)限值。只有找到了一個(gè)恰當(dāng)?shù)拈T(mén)限值,對(duì)廣義帕累托分布的參數(shù)估計(jì)才能得到一個(gè)合理的結(jié)果。
對(duì)損失數(shù)據(jù)是否存在厚尾的檢測(cè)方法主要有:指數(shù)QQ圖和平均超出函數(shù)。
(1)指數(shù)QQ圖。對(duì)損失數(shù)據(jù)與標(biāo)準(zhǔn)的指數(shù)分布作QQ圖是判斷損失數(shù)據(jù)是否存在厚尾的重要方法之一,它可以直觀的檢驗(yàn)損失數(shù)據(jù)是否來(lái)自于指數(shù)分布的原假設(shè)。QQ圖可以寫(xiě)為下面的形式:
其中,Xk,n表示順序統(tǒng)計(jì)量,G0,1-1表示指數(shù)分布 (或者廣義帕累托分布)。
如果損失數(shù)據(jù)來(lái)自于一個(gè)指數(shù)分布,那么QQ圖將近似于一條直線。一般地,一個(gè)凹面的偏離直線的QQ圖被認(rèn)為是損失數(shù)據(jù)存在厚尾的分布特性;一個(gè)凸面的偏離直線的QQ圖被認(rèn)為是損失數(shù)據(jù)存在短尾的分布特性。
(2)平均超出函數(shù)。平均超出函數(shù)是對(duì)損失數(shù)據(jù)厚尾進(jìn)行檢測(cè)的方法之一。定義為:
其中,F(xiàn)u(x)=F[u](x+u)=,x≥0
當(dāng)平均超出函數(shù)表現(xiàn)為一條直線時(shí),認(rèn)為損失數(shù)據(jù)存在厚尾。但平均超出函數(shù)總體上是未知的,在實(shí)際應(yīng)用中用樣本平均超出函數(shù)來(lái)近似。樣本平均超出函數(shù)為:
{(u,en(u)),Xn,n
其中,en(u)=,Xn,n為順序統(tǒng)計(jì)量。
在對(duì)樣本極值進(jìn)行研究中被證明十分重要的分布是極值分布族。這個(gè)極值分布族可以表示為:
其中 γ,-∞<μ<∞,∞>0,這個(gè)模型有三個(gè)參數(shù):位置參數(shù)μ,刻度參數(shù)σ,形狀參數(shù)γ。形狀參數(shù)γ稱為廣義極值分布(GEV)的極值指數(shù),也稱為尾指數(shù);作為廣義極值分布的三個(gè)特例,當(dāng) γ>0時(shí)為 Fréchet分布;當(dāng) γ<0時(shí)為 Weibull分布;當(dāng)γ=0時(shí)為Gumbel分布。在廣義極值分布中,我們的任務(wù)就變?yōu)橥ㄟ^(guò)數(shù)據(jù)推斷極值指數(shù),而不需要預(yù)先確定極值分布的形式。
Fisher-Tippett定理 假設(shè)有來(lái)自分布F的相互獨(dú)立的隨機(jī)觀測(cè)X1,X2…Xn…,將前n個(gè)觀測(cè)值的最大值表示為Mn=max(X1…Xn),那么如果存在適當(dāng)?shù)某?shù)列an>0和bn,使得正態(tài)化的極大值序列(Mn-bn)/an,收斂到下面的非退化分布G(x),即有成立。如果這個(gè)條件成立,則稱分布F屬于極值分布G(x)的最大吸引域,表示為F∈MDA(G)。Fisher-Tippett[6](1928)年證明:
F∈MDA(G)圯G對(duì)于某個(gè)形狀參數(shù)γ成立
使得條件(1)成立的分布F有很多,但是并不是所有的分布都能滿足條件(1),例如poisson分布和幾何分布就不屬于極值分布的最大吸引域。
在上面的定義下,極值最大吸引域檢驗(yàn)的原假設(shè)可以表述為:
H0:F∈D(Gγ)for somereal γ
Dietrich et al[7](2002)年提出了一個(gè)檢驗(yàn)統(tǒng)計(jì)量,記為En,這個(gè)統(tǒng)計(jì)量定義為:
對(duì)于某個(gè)η>0,統(tǒng)計(jì)量En收斂到下面的分布
其中 γ+=max(γ,0),γ-=min(γ,0),W 是一個(gè)布朗運(yùn)動(dòng),隨機(jī)變量 P 和 P 是與布朗運(yùn)動(dòng)有關(guān)的積分。和分別是對(duì) γ+和γ-的估計(jì)量,在這里估計(jì)方法被指定為矩估計(jì)。因此,隨機(jī)變量Eγ只與γ和η的取值有關(guān)。為了完成檢驗(yàn),首先必須選擇一個(gè)適當(dāng)?shù)摩侵?,這個(gè)問(wèn)題Dietrich et al(2002)只討論了η=2 的情況,Jürg Hüsler和 Deyuan Li[8](2006)對(duì)最優(yōu) η 的選擇問(wèn)題進(jìn)行了詳細(xì)討論。在確定了η的值之后,必須利用矩估計(jì)計(jì)算和,然后計(jì)算(2)中的檢驗(yàn)統(tǒng)計(jì)量。接下來(lái)要計(jì)算分布 E贊對(duì)應(yīng)的分位數(shù) Q贊,如果贊<0,必須利用 線 性插值來(lái) 計(jì)
γ1-α,γ算分位數(shù) Q1-α,γ贊。
其中,γ贊=γ贊++γ贊-。 最后,將檢驗(yàn)統(tǒng)計(jì)量的值與臨界值比較,α 為置信水平,如果En>Q1-α,γ贊,那么在犯第一類(lèi)錯(cuò)誤為 α 的水平下,拒絕原假設(shè)。
門(mén)限值的選取在廣義帕累托模型建立中具有十分重要的地位,如果門(mén)限值選取的過(guò)大,那么模型將建立在極少的觀測(cè)點(diǎn)上,結(jié)果通常是偏差比較小,卻存在這很大的方差;如果門(mén)限值選取的過(guò)小,那么模型將建立在比較多的觀測(cè)點(diǎn)之上,隨之而來(lái)的一個(gè)問(wèn)題是雖然估計(jì)有比較小的方差,但偏差卻可能很大。因此,對(duì)門(mén)限值的選取一直是一個(gè)難點(diǎn)和熱點(diǎn)。
常用的門(mén)限值選取方法就是樣本平均超出函數(shù)。當(dāng)樣本平均函數(shù)尾部在超過(guò)某一個(gè)點(diǎn)后呈現(xiàn)為一個(gè)正斜率的直線時(shí),通常認(rèn)為損失數(shù)據(jù)存在尾部,并且將這個(gè)拐點(diǎn)作為門(mén)限值。
對(duì)門(mén)限值選取的另一種方法就是觀測(cè)Hill指數(shù)圖。Hill指數(shù)圖就是不同的門(mén)限值與相對(duì)應(yīng)的Hill估計(jì)繪制的圖形,通過(guò)觀測(cè)Hill指數(shù)圖中門(mén)限值從大到小時(shí),所對(duì)應(yīng)的Hill估計(jì)的第一個(gè)平穩(wěn)區(qū)域來(lái)選擇門(mén)限值。Bruce.M.Hill[9](1975)年在γ>0的條件下構(gòu)造的形狀參數(shù)的非參數(shù)化估計(jì)方法,Hill估計(jì)的形式為:
Hill估計(jì)γ贊nH既可以基于最大似然估計(jì)得到(Hill(1975)),也可以通過(guò)平均超出函數(shù)得到(P.Embrechts[10]等人(1997))。本文應(yīng)用超越門(mén)限值數(shù)據(jù)個(gè)數(shù)的自適應(yīng)選擇算法來(lái)選擇門(mén)限值。令γk,n表示基于k個(gè)超越門(mén)限值的數(shù)據(jù)個(gè)數(shù)的形狀參數(shù)估計(jì)值,用med(γ1,n,…γk,n)表示這組形狀參數(shù)估計(jì)的中位數(shù),通過(guò)最小化下式就可以選擇出一個(gè)k*:
在極值理論中對(duì)超越一定門(mén)限值的數(shù)據(jù)進(jìn)行描述的一個(gè)分布是廣義帕累托分布,它可以表示為下式:
廣義帕累托分布也可以表示為三個(gè)子分布:在γ=0時(shí)為指數(shù)(Exponential)分布,當(dāng) γ>0 時(shí)為帕累托(Pareto)分布,當(dāng)γ<0 時(shí)為貝塔(Beta)分布。
Balkema-de Haan-Pickands定理 定義分布F的右端點(diǎn)為ω(F):=sup(x:F(x)<1),那么超越一個(gè)門(mén)限值之后的截?cái)喑介T(mén)限值u分布函數(shù)可以定義為:
對(duì)于0≤x<ω(F)-u成立。Balkema和de Haan[11](1974),Pickands[12](1975)證明了在滿足極值理論最大吸引域條件下,當(dāng)門(mén)限值趨于分布的右端點(diǎn)時(shí),廣義帕累托分布是這些超越門(mén)限值數(shù)據(jù)的極限分布。即有:
|Fu(x)-Wγ,u,σu(x)|→0,u→ω(F)當(dāng)且僅當(dāng)F∈MDA(G)時(shí)成立。
在X1…Xn獨(dú)立且服從廣義帕累托分布的條件下,廣義帕累托分布的極大似然估計(jì)方法必須在一個(gè)迭代算法下才能得到結(jié)果,有關(guān)帕累托分布的極大似然估計(jì)方法請(qǐng)參考Prescott,P.and Walden,A.T[13](1980)。 此外,Smith[14](1985)詳細(xì)研究了這個(gè)問(wèn)題并得到了如下結(jié)論:
當(dāng)γ>-0.5時(shí),最大似然估計(jì)是正則的,在這個(gè)意義下具有通常的漸近性質(zhì)。在廣義帕累托分布中,(γ,σ)的極大似然估計(jì)具有漸近正態(tài)性,其具有方差協(xié)方差矩陣為∑/k。其中:
如果 γ>1/2,γ贊k的漸近方差為(1+γ)2/k。 當(dāng)-1<γ<-0.5 時(shí),最大似然估計(jì)一般可以得到,但不具有標(biāo)準(zhǔn)的漸近性質(zhì);當(dāng)γ<-1時(shí),最大似然估計(jì)一般不可能得到;幸運(yùn)的是,在實(shí)際建模中,γ<-0.5很難碰到,特別是在保險(xiǎn)中,均有γ>0。所以最大似然估計(jì)在理論上的局限性并不妨礙其在保險(xiǎn)精算實(shí)務(wù)中的應(yīng)用。
如果可以用一個(gè)廣義帕累托分布來(lái)擬合超越門(mén)限值u之后的截?cái)喑介T(mén)限值的條件分布函數(shù),Resis和Thomas[15](1996)證明也可以用廣義帕累托分布來(lái)描述損失數(shù)據(jù)分布的尾部,即有:
F(x)=P(X≤x)=(1-P{X≤u})Fu(x-u)+P{X≤u}(x≥u)
在門(mén)限值趨于右端點(diǎn)的條件下,可以用一個(gè)廣義帕累托分布Wγ,u,σu(x)來(lái)估計(jì)Fu(x-u)。此外可以用經(jīng)驗(yàn)分布函數(shù)來(lái)估計(jì)P{X≤u}。那么在x≥u條件下,就可以得到損失數(shù)據(jù)分布函數(shù)的尾部估計(jì)為:
很顯然,F(xiàn)(x)也是一個(gè)廣義帕累托分布,并且與超越門(mén)限值之后的截?cái)喑介T(mén)限值分布函數(shù)有相同的形狀參數(shù),只不過(guò)位置參數(shù)和刻度參數(shù)進(jìn)行了適當(dāng)?shù)恼{(diào)整。
表1 描述統(tǒng)計(jì)表
假設(shè)所研究的保單是同質(zhì)的,并且其理賠次數(shù)分布服從泊松分布,而理賠額分布在超越門(mén)限值后服從廣義帕累托分布。那么,可以計(jì)算險(xiǎn)位超賠再保險(xiǎn)(Excess of loss)的純保費(fèi)。所謂險(xiǎn)位超賠再保險(xiǎn)就是如果發(fā)生的保險(xiǎn)賠款在保險(xiǎn)公司的自負(fù)金額之內(nèi),則由保險(xiǎn)公司自己負(fù)責(zé)賠償;若發(fā)生的保險(xiǎn)賠款超過(guò)了保險(xiǎn)公司的自負(fù)額,則由再保險(xiǎn)公司賠付。
令F=Wγ,u,σ是一個(gè)廣義帕累托分布,E(X)是廣義帕累托分布的均值。那么復(fù)合泊松分布的均值,即純保費(fèi)就是:
從式(5)就可以看出,要計(jì)算純保費(fèi),我們必須得到參數(shù)λ,γ,σ的估計(jì)值。注意到索賠次數(shù)的均值λ=E(N),可以由下面公式估計(jì):
如果用γN(T)和σN(T)表示廣義帕累托分布的形狀參數(shù)和刻度參數(shù),那么廣義帕累托分布WγN(T),u,σN(T)的均值可以表示為:
注意到此時(shí)的廣義帕累托分布就是理賠額分布,那么表達(dá)式(7)實(shí)際上給出了相應(yīng)的再保險(xiǎn)公司平均理賠額。因此,在復(fù)合泊松假設(shè)下,再保險(xiǎn)公司的純保費(fèi)可以由下面公式給出:
數(shù)據(jù)來(lái)源于云南省職工醫(yī)療互助中心2006年共9193個(gè)損失數(shù)據(jù)(不包括損失少于1000元的數(shù)據(jù)),首先對(duì)數(shù)據(jù)的基本統(tǒng)計(jì)特征進(jìn)行分析。
平均來(lái)說(shuō),損失額的均值為9.85千元 。通過(guò)對(duì)1/4分位數(shù)、1/2分位數(shù)和3/4分位數(shù)的比較不難看出,1/2分位數(shù)與3/4分位數(shù)之間的變動(dòng)比1/4分位數(shù)與1/2分位數(shù)之間的變動(dòng)要大;數(shù)據(jù)最大值為781.70千元,顯然這是十分巨大的損失數(shù)據(jù),是平均損失的數(shù)十倍;此外,從偏度系數(shù)和峰度系數(shù)可以看出,數(shù)據(jù)是右偏且尖峰的。所有的這些特征說(shuō)明,數(shù)據(jù)是一個(gè)尖峰的、右偏的、具有典型的非壽險(xiǎn)損失分布形狀的分布。
對(duì)損失數(shù)據(jù)作指數(shù)QQ圖(見(jiàn)圖1)??梢钥闯?,損失數(shù)據(jù)與指數(shù)分布之間存在這一個(gè)凹面的偏離,這說(shuō)明數(shù)據(jù)存在這厚尾特征。
下面給出平均超出函數(shù)圖與損失數(shù)據(jù)的樣本平均超出函數(shù)圖(見(jiàn)圖2)。
從平均超出函數(shù)圖與樣本平均超出函數(shù)圖可以看出尾部損失數(shù)據(jù)應(yīng)該可以用一個(gè)廣義帕累托分布來(lái)擬合。
通過(guò)上面的指數(shù)QQ圖和樣本平均超出函數(shù)圖可以初步判斷,損失分布具有一個(gè)厚尾特征并可以用廣義帕累托分布來(lái)擬合。
利用Dietrich et al(2002)年提出了一個(gè)檢驗(yàn)統(tǒng)計(jì)量,記為En,來(lái)檢驗(yàn)是否滿足極值分布的最大吸引域問(wèn)題。在計(jì)算檢驗(yàn)統(tǒng)計(jì)量的時(shí),令k為升序順序統(tǒng)計(jì)后部觀測(cè)的個(gè)數(shù)。在這里令最小的k=20,因?yàn)槿绻岛苄?,將得到方差很大的形狀參?shù)估計(jì)值,最大的k=1000,它大約占總觀測(cè)個(gè)數(shù)的10.88%。因?yàn)槿绻^(guò)大,將不能滿足極值定理成立的條件。并讓以等差為5的序列遞增,并計(jì)算相應(yīng)的檢驗(yàn)統(tǒng)計(jì)量。
從圖3可以看出,當(dāng)k的取值比較小的時(shí)候,沒(méi)有充分的理由拒絕分布屬于極值分布的最大吸引域的原假設(shè),即認(rèn)為 F∈MDA(Gγ)成立,為了能夠準(zhǔn)確的確定使 F∈MDA(Gγ)成立的K值,可參見(jiàn)圖4對(duì)應(yīng)的數(shù)據(jù)表,其中給出了升序順序統(tǒng)計(jì)量后部數(shù)據(jù)的個(gè)數(shù)k,正態(tài)化參數(shù),an,bn檢驗(yàn)統(tǒng)計(jì)量等值。從表中可以看出滿足極值分布最大吸引域的k值為345。因此,En統(tǒng)計(jì)量也為選取符合極值分布最大吸引域條件的最大k值選取提供了重要信息。
由上面的檢驗(yàn)結(jié)果可以看出,選擇的k值小于等于345的時(shí)候,可以認(rèn)為損失分布的潛在分布屬于極值分布的最大吸引域,即 F∈MDA(Gγ)成立。
圖1 指數(shù)QQ圖
圖2 平均超出函數(shù)圖(左)與樣本平均超出函數(shù)圖(右)
圖 3 En檢驗(yàn)統(tǒng)計(jì)量圖
一個(gè)常用的直觀的門(mén)限值選擇方法就是樣本平均超出函數(shù),圖2已經(jīng)給出了全部損失數(shù)據(jù)的樣本平均超出函數(shù)圖。下面對(duì)樣本升序順序統(tǒng)計(jì)量的后1000個(gè)數(shù)據(jù)作平均超出函數(shù)圖(見(jiàn)圖4),以期能對(duì)數(shù)據(jù)尾部有一個(gè)更加準(zhǔn)確的把握,之所以選擇K=1000,是因?yàn)樗s占總樣本的10.88%。一般認(rèn)為,K選取應(yīng)該滿足使它占總樣本的比例在10%左右。
從圖5可以看出,總的來(lái)說(shuō)損失數(shù)據(jù)的尾部平均超出函數(shù)圖比較復(fù)雜,從右向左看,從最右端點(diǎn)到圖形中“▽”所表示的點(diǎn)的位置之間似乎有一個(gè)相同的斜率;而從“▽”到“◇”之間的點(diǎn)似乎有一個(gè)更大的斜率;通過(guò)計(jì)算找出對(duì)應(yīng)的門(mén)限值依次為41.6和38.6;相應(yīng)的升序順序統(tǒng)計(jì)后部數(shù)據(jù)點(diǎn)個(gè)數(shù)依次為158和186,并不能確定到底選取哪個(gè)門(mén)限值比較合適。
圖4 k=1000時(shí)的樣本平均超出函數(shù)圖
圖5 Hill指數(shù)圖
對(duì)門(mén)限值選取的另一中方法就是通過(guò)觀測(cè)Hill圖。對(duì)=1000時(shí)的數(shù)據(jù)作Hill圖,(見(jiàn)圖5)所示,從圖中可以看出,“□”內(nèi)所標(biāo)識(shí)的部分是Hill估計(jì)的第一個(gè)比較平穩(wěn)的部分,此外圖中還給出了Hill估計(jì)的95%的置信區(qū)間,我們選擇估計(jì)值比較平穩(wěn)而且標(biāo)準(zhǔn)差比較小的點(diǎn)作為門(mén)限值。通過(guò)Hill估計(jì)表可以得到這個(gè)穩(wěn)定區(qū)域?qū)?yīng)的門(mén)限值為(37.01,40.28),相應(yīng)的 k 值為(206,165)。 此外,值得注意的是,在這個(gè)門(mén)限值區(qū)間內(nèi)對(duì)應(yīng)的尾指數(shù)α的估計(jì)值取值在(2.42,2.37)之間。
綜合樣本平均超出函數(shù)圖和尾指數(shù)的Hill估計(jì)圖,可以對(duì)門(mén)限值的選取有一個(gè)初步的判斷,可以初步判定門(mén)限值應(yīng)該位于(37.01,41.58)之間。本文利用自適應(yīng)選擇算法,且形狀參數(shù)估計(jì)γk,n使用最大似然估計(jì),對(duì)門(mén)限值的選取結(jié)果為41.12(k=162),在樣本平均超出函數(shù)圖和尾指數(shù)的Hill估計(jì)圖判定的門(mén)限值區(qū)間內(nèi)。
通過(guò)前文研究,可以認(rèn)為職工醫(yī)療互助損失數(shù)據(jù)具有厚尾特征,通過(guò)最大吸引域檢驗(yàn)認(rèn)為可以用極值理論的分布來(lái)擬合尾部數(shù)據(jù),利用樣本平均超出函數(shù)圖、尾指數(shù)的Hill估計(jì)圖和自適應(yīng)選擇算法確定了數(shù)據(jù)尾部的門(mén)限值。下面利用極大似然估計(jì)法來(lái)估計(jì)數(shù)據(jù)尾部的廣義帕累托模型參數(shù)(見(jiàn)表 2)。
表2 廣義帕累托模型的極大似然估計(jì)結(jié)果
可以通過(guò)截?cái)喾植紨M合、尾分布擬合、殘差分布以及殘差擬合等來(lái)進(jìn)行進(jìn)一步的檢驗(yàn)?zāi)P蛿M合情況。
其他估計(jì)方法的估計(jì)效果比較見(jiàn)圖7。極大似然估計(jì)(MLE)最接近樣本平均超出函數(shù),Dress-Pickands估計(jì)和Moment估計(jì)分別位于樣本平均超出函數(shù)的上部和下部,Hill估計(jì)顯然低估了尾部的厚尾程度。總的來(lái)說(shuō),用極大似然估計(jì)得到了比較精確的估計(jì)結(jié)果。此外,從圖7可以看出樣本平均超出函數(shù)雖然有一些波動(dòng),但是總的趨勢(shì)是向上的,這保證了廣義帕累托分布擬合的有效性。
圖 6 截?cái)喾植紨M合圖(1)、尾部分布擬合圖(2)、殘差分布圖(3)、殘差擬合檢驗(yàn)圖(4)
圖7 不同估計(jì)方法下的廣義帕累托分布所對(duì)應(yīng)的平均超出函數(shù)
在職工醫(yī)療互助損失數(shù)據(jù)尾部廣義帕累托分布擬合的基礎(chǔ)上,計(jì)算尾部損失數(shù)據(jù)的純保費(fèi),首先給出平均理賠次數(shù)的估計(jì)(0.0678),然后利用公式(7)和(8)估計(jì)純保費(fèi),估計(jì)結(jié)果為:再保險(xiǎn)公司的平均理賠額為74.59千元,再保險(xiǎn)純保費(fèi)為5.06千元。
論文對(duì)非壽險(xiǎn)精算中損失數(shù)據(jù)尾部的擬合方法和保費(fèi)厘定進(jìn)行了研究,貢獻(xiàn)在于:第一,系統(tǒng)地介紹了非壽險(xiǎn)精算中損失數(shù)據(jù)尾部的擬合和保費(fèi)厘定方法,并給出了實(shí)例計(jì)算;第二,認(rèn)為在用極值理論的分布族中的分布來(lái)擬合尾部數(shù)據(jù)時(shí),必須對(duì)應(yīng)用極值理論的條件進(jìn)行檢驗(yàn),論文系統(tǒng)介紹了最大吸引域的條件檢驗(yàn)方法;第三,對(duì)門(mén)限值得三種方法 (樣本平均超出函數(shù)圖、Hill指數(shù)圖和自適應(yīng)選擇算法)進(jìn)行了比較,認(rèn)為自適應(yīng)選擇算法選取方法是最優(yōu)的選取方法,利用這一方法給出的最優(yōu)門(mén)限值將能充分保證廣義帕累托分布中形狀參數(shù)估計(jì)的穩(wěn)定性;第四,結(jié)合實(shí)例對(duì)數(shù)據(jù)尾部的廣義帕累托分布參數(shù)估計(jì)方法(Dress-Pickands估計(jì)、Moment估計(jì)、Hill估計(jì)和MLE估計(jì))進(jìn)行了比較,認(rèn)為MLE估計(jì)得到了比較精確的估計(jì)結(jié)果;第五,充分利用廣義帕累托分布的性質(zhì)和優(yōu)點(diǎn)給出了非壽險(xiǎn)巨額損失的超賠再保險(xiǎn)的純保費(fèi)計(jì)算方法。本文的研究對(duì)于實(shí)際工作者來(lái)說(shuō)具有一定的參考價(jià)值,但論文沒(méi)有對(duì)非壽險(xiǎn)損失分布的厚尾在不能利用極值分布時(shí)的擬合問(wèn)題開(kāi)展討論,這是一個(gè)有待進(jìn)一步研究的問(wèn)題,也是筆者將進(jìn)一步研究的方向。
[1]王新軍.財(cái)產(chǎn)保險(xiǎn)中損失分布建模的方法研究[J].統(tǒng)計(jì)研究,2002,(11).
[2]Alexander J.Mcneil.Estimating the Tails of Loss Severity Distribution Using Extreme Value Theory[J].ASTIN Bulleitin,1997,27.
[3]Alexander J.McNeil,Thomas Saladin.Developing Scenarios for Future Extreme Losses Using the POT Model[J].Extremes and Integrated Rist Managemeat,1998.
[4]Fisher,R.A,Tippet,L.H.C.Limiting Forms of the Frequency Distribution of the Largest of Smallest Member of a Sample[J].Proc.Camb.Phil.Soc,1928,24.
[5]Dietrich,D.,de Haan,L.,Hǜsler,J.Testing Extreme Value Conditons[J].Extremes,2002,5.
[6]Jürg Hüsler.,Deyuan Li.On Testing Extreme Value Conditions[J].Extremes,2006,(9).
[7]Hill,B.M.A Simple General Approach to Inference about the Tail of a Distribution[J].Ann.Statist,1975,(3).
[8]Embrechts,P.,Kluppelberg,C.,Mikosch,T.Modelling Extremal Events for Insurace and Finance[M].New York:Springer,1997.
[9]Balkema,A.A.,de Haan,L.Residual Life Time at Great Age[J].Ann.Probab,1974,(2).
[10]J.Pickands.Statistical Inference Using Extreme Value Order Statistic[J].Ann.Statist,1975,3.
[11]Prescott,P.,Walden,A.T.Maximum Likelihood Estimation of the Parameters of the Generalized Extreme-Value Distribution[J].Biometrika,1980,67.
[12]Smith,R.L.Maximum Likelihood Estimation in a Class of Nonregular Cases[J].Biometrika,1985,72.
[13]R.D.Reiss,M.Thomas,Statistical Analysis of Extreme Values with Applications to Insurance,Finance,Hydrology and other Fields[M].Switzerland:Springer Science,2007.
(責(zé)任編輯/亦 民)
O21
A
1002-6487(2011)04-0014-05