劉維奇,張丹青
(1.山西大學(xué) 數(shù)學(xué)科學(xué)學(xué)院,山西 太原 030006;2.山西大學(xué) 管理與決策研究所,山西 太原 030006)
假設(shè)X1,…,Xn是一列獨立同分布的隨機(jī)變量序列,具有共同的分布函數(shù)F,設(shè)X1,n≤…≤Xn,n為其遞增的次序統(tǒng)計量。若F∈D(Gr),則存在常數(shù)列an>0,bn∈R,對任意的x∈R,當(dāng)n趨于無窮時,有P,其中
由于對極端事件的關(guān)注,重尾現(xiàn)象出現(xiàn)在越來越多的領(lǐng)域,如,金融學(xué),保險業(yè),計算機(jī)科學(xué),水文學(xué)以及氣象學(xué)等,為了了解尾部的全部信息,故對重尾指數(shù)γ的估計也就成了重中之重。事實上,學(xué)者們對重尾指數(shù)γ的估計也進(jìn)行了廣泛的研究,如要求γ>0的Hill估計[1],Hill估計具有強相合性和漸近正態(tài)性[2]。根據(jù)Hill估計,Dekkers等[3]提出了適用于γ∈R的矩估計,并在(1)式二階正則條件下證明其漸近性質(zhì)
此時,γ>0,ρ<0,A(t)∈RVρ.又如Pickands提出的 Pickands估計[4],Davison[5]的極大似然估計,Csorgo等[6]的核估計,F(xiàn)raga Alves等[7]提出的 MM 混合矩估計,Kratz和 Resnick[8]提出的qq-plot估計,Gomes和Martins[9]提出的 GJ估計,Beirlant等[10]提出的廣義 Hill估計,Gomes等[11-12]提出的修正 CM 估計,Davydov等[13]提出的DPR樣本分塊估計等等,劉維奇,邢紅衛(wèi)在此基礎(chǔ)上進(jìn)一步闡明了重尾指數(shù)估計的研究進(jìn)展[14],位置不變和降偏差成為尾指數(shù)近年來研究的熱點,如Brahim等[15]的降偏差估計,本文提出的估計量是基于Gomes和 Martins[16]提出的概括化估計量:
在上述經(jīng)典估計中,位置不變的估計量很少,大部分估計均是非位置不變的,即對樣本進(jìn)行位置變換后不滿足位置不變性,而在實際問題中,我們往往需要對樣本進(jìn)行位置變換。因此,位置不變的重尾估計也就成為重尾研究的熱點之一。如Frage Alves[17]提出的位置不變的Hill估計,
Ling等[18-19]提出的位置不變矩估計:
其中,
收斂于Γ(α+1)γα,而k0和k是整數(shù)序列,也就是說,
類似的還有Li等[20-21]提出的一類位置不變的Hill型估計。除以上方法外,還有學(xué)者用X*i=Xi-X[np]+1,n,(0≤p<1,1≤i≤n)來代替原始樣本Xi,如 Araujo Santos等[22]提出的幾類位置不變重尾估計,稱為PORT(Peaks Over Random Threshold)方法,及Gomes等[11-12]提出的估計,F(xiàn)raga和 Gomes等[7]提出的位置不變混合矩估計,此外還有Falk[23]提出的NH估計,Peng和Nadarajah[24]提出的 Weiss類Pickands估計等,而Ling等[25]則巧妙地結(jié)合了兩種位置不變估計,本文利用統(tǒng)計量M(α)n(k0,k)和Gomes,Martin[16]中的估計提出一類新的概括化位置不變的重尾指數(shù)估計
其中,RVβ表示在無窮遠(yuǎn)處極值指數(shù)β的一類正則變化函數(shù)。為了方便理論計算的證明,做如下記號:
為了研究估計量的漸近性質(zhì),我們還需如下二階條件:假設(shè)存在函數(shù)a(t)>0,可測函數(shù)=0,有[26],
表1 α=α0γ = α0∶b-γα =0Table 1 α=α0(γ)={α0∶b(-γ,α)=0}
圖1表示估計量無偏時,即b(-γ,α)=0,知α0(γ)是γ的減函數(shù),并在表1中列舉了幾種特殊的γ值和其對應(yīng)的α0(γ)值以便后面更進(jìn)一步的研究。
Fig.1 (1+γ)1-α0+γ(α0-2)=1圖1 (1+γ)1-α0+γ(α0-2)=1
接下來,選擇Burr(1,-1)模型,當(dāng)b(-γ,α)=0時,由表1得出α0(1)=2.7,選取樣本量為2 500,α的值為1,2,2.7,4,分別比較畫出(k0,k)(k0,k),(k0,k),和(k0,k)的路徑圖,由圖2可以看出α0(1)=2.7藍(lán)色的線有最小的偏差,效果最好,與γ的真值最接近。
Fig.2 Sample paths of(k0,k)(k0,k)(k0,k),and(k0,k)for Burr(1,-1)model with sample size n=2 500圖2 Burr模型下,樣本2 500時(k0,k),^(k0,k)(k0,k)(k0,k)的樣本路徑圖
由定理1.2我們得到γnk0k的漸近偏差與漸近方差:
圖3中,上圖可以看出,對于每一個固定的α,隨著γ的增大,b(-γ,α)越來越??;同樣,由下圖可以看出,對于每一個固定的γ,隨著α的增大,b(-γ,α)先減小再增大。
Fig.3 b(-γ,α)as a function ofγ(up)andα(down)圖3 b(-γ,α)分別于γ(上)和α(下)的函數(shù)圖像
Fig.4 Image of Squared Bias b2(-1,α)(left)and Variance(right)of(k0,k)圖4 (k 0,k)偏差平方b2(-1,α)(左)和方差(右)的圖像
圖5為Frechet,Burr和Pareto三種分布模型下)(虛線)的路徑圖。取5 000個隨機(jī)數(shù),令,由于k≤16時,k<k0,而k0是從k中選取的,故k>k0,所以我們不考慮圖中前一小部分的異常值,從k≥17來看(k0,k)的穩(wěn)健性相當(dāng)好,幾乎接近于真值。
圖6同樣表示在Frechet(2)模型下,將1 500個樣本復(fù)制500次,分別模擬出新估計量(k0,k)與傳統(tǒng)經(jīng)典位置不變估計量(k0,k)和(k0,k)的均值和均方誤差,新估計量的模擬結(jié)果最好,類似的研究如圖7和圖8。
Fig.5 Sample paths of(k0,k)(solid line)and(dotted line)for Frechet(left),Burr(middle)and Pareto(right)withα=2.7圖5 α=2.7時,三種分布Frechet(左),Burr(中)和 Pareto(右)下^(k0,k)(實線)和(k)(虛線)的樣本路徑圖
表2 Frechet(2)模型下(k0,k)的MSETable 2 MSE of(k 0,k)for Frechet(2)model
表2 Frechet(2)模型下(k0,k)的MSETable 2 MSE of(k 0,k)for Frechet(2)model
2.4 100 0.142 8 0.112 38 0.119 11 0.129 39 0.144 14 0.n α=1 α=1.3 α=1.4 α=1.5 α=1.8 α=2 α=146 41 0.167 13 200 0.071 733 0.061 121 0.058 653 0.074 096 0.088 059 0.095 715 0.121 85 300 0.051 492 0.046 104 0.043 908 0.054 046 0.067 707 0.075 477 0.100 46 400 0.044 2 0.040 185 0.034 834 0.046 941 0.057 409 0.063 704 0.088 653 500 0.045 064 0.034 365 0.029 281 0.041 439 0.049 067 0.055 774 0.078 601 600 0.040 129 0.031 033 0.027 877 0.038 802 0.043 867 0.050 554 0.071 08 700 0.038 835 0.031 532 0.026 943 0.036 013 0.040 067 0.046 865 0.065 743 800 0.038 282 0.032 458 0.025 244 0.034 047 0.03 6 072 0.041 814 0.056 687 1 000 0.035 589 0.032 888 0.025 34 0.031 617 0.03 7 681 0.043 816 0.060 054 900 0.037 977 0.033 308 0.025 184 0.032 705 0.03 4 421 0.040 11 0.052 109
Fig.6 Mean value and MSE of(k0,k),(k 0,k)and(k 0,k)for Frechet(2)model with sample size n=1 500 and 500 replications圖6 Frechet(2)模型下,樣本量n=2 500時(k0,k),(k 0,k)(k0,k)的均值和均方誤差
表3 Burr 1-1模型下k 0 k 的MSETable 3 MSE of(k0,k)for Burr(1,-1)model
表3 Burr 1-1模型下k 0 k 的MSETable 3 MSE of(k0,k)for Burr(1,-1)model
2.7 100 0.235 79 0.072 093 0.063 015 0.053 17 0.047 9 n α=1 α=2 α=2.1 α=2.2 α=2.3 α=2.5 α=39 0.048 96 0.060 85 200 0.112 34 0.040 333 0.036 843 0.032 76 0.031 796 0.035 458 0.050 127 300 0.074 785 0.029 031 0.027 188 0.024 829 0.025 724 0.029 386 0.042 021 400 0.059 031 0.023 214 0.021 879 0.020 756 0.022 128 0.024 523 0.036 507 500 0.048 345 0.019 617 0.018 686 0.017 743 0.019 397 0.022 015 0.033 66 600 0.040 853 0.017 067 0.016 354 0.015 573 0.017 36 0.019 706 0.029 847 700 0.036 659 0.015 272 0.014 692 0.014 057 0.015 784 0.018 153 0.027 203 800 0.033 398 0.013 85 0.013 35 0.012 821 0.014 6 3 652 0.015 531 0.023 988 1 000 0.027 231 0.011 795 0.011 434 0.011 184 0.0 35 0.016 769 0.025 446 900 0.029 645 0.012 727 0.012 308 0.011 935 0.01 12 829 0.014 552 0.022 569
Fig.7 Mean value and MSE of(k0,k)(k0,k)and(k0,k)for Burr(1,-1)model with sample size n=1 500 and 500 replications圖7 Burr(1,-1)模型下,樣本量n=2 500時(k0,k)(k 0,k)(k0,k)的均值和均方誤差
表4 Pareto(0.5)模型下(k 0,k)的MSETable 4 MSE of(k0,k)for Pareto(0.5)model
表4 Pareto(0.5)模型下(k 0,k)的MSETable 4 MSE of(k0,k)for Pareto(0.5)model
3.2 100 0.399 84 0.138 2 0.049 927 0.022 689 0.010 80 n α=1 α=2 α=2.5 α=2.9 α=3 α=3.1 α=2 0.014 763 0.016 534 200 0.216 04 0.083 452 0.032 163 0.016 932 0.006 8153 0.0103 49 0.015 522 300 0.169 04 0.065 0.026 146 0.014 385 0.005 8638 0.009 631 0.013 017 400 0.143 1 0.054 25 0.022 544 0.013 092 0.005 338 0.009 040 0.012 165 500 0.127 55 0.047 639 0.020 37 0.011 213 0.004 863 8 0.008 607 0.010 213 600 0.109 87 0.043 025 0.018 99 0.010 397 0.004 465 9 0.007 458 0.010 314 700 0.098 987 0.039 601 0.017 506 0.009 724 4 0.004 163 3 0.006 921 0.009 581 800 0.089 145 0.036 55 0.016 586 0.009 175 6 0.00 03 838 6 0.006 545 0.008 251 1 000 0.077 517 0.032 3 0.014 664 0.007 939 7 0.00 3 949 7 0.006 540 0.008 279 900 0.082 474 0.034 461 0.015 429 0.008 559 2 0.0 3 622 4 0.006 390 0.007 840
為證明主要結(jié)果,我們需要如下結(jié)論。
Fig.8 Mean value and MSE of(k0,k)(k0,k)and(k0,k)for Pareto(0.5)model with sample size n=1 500 and 500 replications圖8 Pareto(0.5)模型下,樣本量n=2 500時(k 0,k)(k0,k),(k 0,k)的均值和均方誤差
[1] Hill B.A Simple General Approach to Inference About the Tail of a Distribution[J].Annals of Statistics,1975,3:1163-1174.
2 de Haan.Extreme Value Statistics C Galambos J Lechner J Simiu E.eds.Extreme Value Theory and Applications Kluwer Academic Publications,Dordrecht,1994:93-122.
[3] Dekkers A,Einmahl J,de Haan L.A Moment Estimator for the Index of an Extreme-value Distribution[J].Annals of Statistics,1989,17:1833-1855.
[4] Pickands J.Statisticla Inference Using Extreme Order Statistic[J].Annals of Statistics,1975,3:119-131.
[5] Davison A C.Modelling Excesses Over High Thresholds[C]//Tiago de Oliveira J.(Ed),Statistical Extremes and Application.Reidel,Dordrecht,1984:461-482.
[6] Csorgo S,Deheuvels P,Mason D.Kernel Estimates of the Tail Index of a Distribution[J].Annals of Statistics,1985,13(3):1050-1077.
[7] Fraga Alves M I,Gomes M I,de Haan L,et al.Mixed Moment Estimator and Location Invariant Alternatives[J].Extremes,2009,12:149-185.
[8] Kratz M,Resnick S.The qq-estimator and Heavy Tails[J].Stochastic Models,1996,12(4):699-724.
[9] Gomes M I,Martins M J.“Asymptotically Unbiased”Estimators of the Tail Index Based on External Estimation of the Second Order Parameter[J].Extremes,2002,5(1):5-31.
[10] Beirlant J,Dierckx G,Guillou A.Estimation of the Extreme Value Index and Generalized Quantile Plots[J].Bernoulli,2005,11(6):949-970.
[11] Gomes M I,F(xiàn)raga Alves M I,Araújo Santos P.PORT Hill and Moment Estimators for Heavy-tailed Models[J].Communications in Statistics Simulationand Computation,2008a,37:31-53.
[12] Gomes M I,F(xiàn)raga Alves M I,Araújo Santos P.PORT Hill and Moment Estimators for Heavy-tailed Models[J].Communications in Statistics Simulation and Computation,2008b,37:1281-1306.
[13] Davydov Y,Paulauskas V,Rackauskas A.More on P-stable Convex Sets in Banach Spaces[J].Journal of Theoretical Probability,2003,13:39-64.
[14] 劉維奇,邢紅衛(wèi).重尾分布尾指數(shù)估計研究進(jìn)展[J].山西大學(xué)學(xué)報:自然科學(xué)版,2012,5:163-173.
[15] Brahim B,Djamel M,Abdelhakim N,et al.A Bias-reduced Estimator for the Mean of a Heavy-tailed Distribution with an Infinite Second Moment[J].Journal of Statistical Planning and Inference,2013,143(6):1064-1081.
[16] Gomes M I,Martins M J.Generalizations of the Hill Estimator-asymptotic Versus Finite Sample Behaviour[J].Statistics Plan Inference,2001,93(1-2):161-180.
[17] Fraga Alves M I.A Location Invariant Hill-type Estimator[J].Extremes,2001,4(3):199-217.
[18] Ling C,Peng Z,Nadarajah S.A Location Invariant Moment-type EstimatorⅠ[J].Theory of Probability and Mathematical Statistics,2007,76:23-31.
[19] Ling C,Peng Z,Nadarajah S.A Location Invariant Moment-type EstimatorⅡ[J].Theory of Probability and Mathematical Statistics,2007,77:177-189.
[20] Li J,Peng Z,Nadarajah S.A Class of Unbiased Location Invariant Hill-type Estimators for Heavy Tailed Distributions[J].Electronic Journal of Statistics,2008:829-847.
[21] Li J,Peng Z,Nadarajah S.Asymptotic Normality of Location Invariant Heavy Tail Index Estimators[J].Extremes,2010,13:269-290.
[22] Araújo Santos P,F(xiàn)raga Alves M I,Gomes M I.Peaks Over Random Threshold Methodology for Tail Index and Quantile Estimation[J].Revstat 4,2006:227-247.
[23] Falk M.Some Best Parameter Estimates for Distributions with Finite Endpoint[J].Statistics,1995,27:115-125.
[24] Peng Z,Nadarajah S.The Pickands’Estimator of the Negative Extreme Value Index[J].Acta Scientiarum Naturalium Universitatis Pekinensis,2001,37:12-19.
[25] Ling C,Peng Z,Nadarajah S.Location Invariant Weiss-Hill Estimator[J].Extremes,2012,15:197-230.
[26] de Haan,Stadtmüller.Generalized Regular Variation of Second Order[J].Australian Mathematical Society,1996,61:381-395.
[27] Peng L.Asymptotically Unbiased Estimators for the Extreme-value Index[J].Statistics and Probability Letters,1998,38(2):107-115.