羅金炎, 徐 飛, 李 燕, 吳嘉穎, 沈 煜
(1.閩江學院 數(shù)學與數(shù)據(jù)科學學院, 福州 350108;2.閩江學院 新華都商學院, 福州 350108)
福建省地處沿海,其海岸線長度位居全國第二位,陸地海岸線長達3 751.5 km,其受臺風侵擾較為頻繁,從1945—2018年在福建省登陸的臺風多達130多起,造成直接經(jīng)濟損失513.1億元。經(jīng)濟發(fā)展的同時,臺風帶來的直接經(jīng)濟損失也越來越高,臺風等氣象災害已經(jīng)成為制約福建省社會經(jīng)濟發(fā)展的主要因素。因此,在面臨巨大的自然災害時,如何基于預報信息和觀測數(shù)據(jù)對其可能造成的經(jīng)濟損失分布進行研究是十分必要的.
極值理論創(chuàng)立之初常用來分析具有極端概率罕見的情況[1],如海嘯、地震、臺風等。后來在1990年左右,極值理論被證實能有效擬合出金融資產(chǎn)報酬率分布的厚尾特征,在貨幣和信用危機對金融市場的沖擊下,極值理論被廣泛應(yīng)用于金融市場[2]的極端價格波動,因而極值理論的主要研究對象也變成了金融收益的尾部特征[3].我國對極值理論的研究起步較晚,現(xiàn)有的參考文獻相對較少。2006年李曉渝等[3]使用極值理論方法研究了期貨保證金設(shè)定的實證研究;2013年陸靜、張佳等[1]使用極值理論和多元Copula函數(shù)的商業(yè)銀行操作風險計量研究。
本文使用復合模型(POT模型與對數(shù)正態(tài)分布)對福建省1992—2018年臺風災害的經(jīng)濟損失額進行擬合研究,分析福建省歷年臺風巨災損失的厚尾特征。因受極值數(shù)據(jù)的影響,福建省歷年臺風災害損失不符合傳統(tǒng)正態(tài)分布,所以使用廣義帕累托分布(GPD)與對數(shù)正態(tài)分布的復合分布來對樣本數(shù)據(jù)進行擬合,充分體現(xiàn)在極值數(shù)據(jù)影響下的優(yōu)勢。為今后的氣象災害損失額度的分析、金融產(chǎn)品開發(fā)等提供科學依據(jù),具有重要的實際意義。
極值理論[4]是次序統(tǒng)計學的重要分支之一,主要用于研究具有極端變異性的數(shù)據(jù)并進行建模,能有效的處理與概率分布均值偏離極大的數(shù)據(jù)。極值理論經(jīng)多年的繼承和發(fā)展,現(xiàn)今超閾值模型(POT)和區(qū)間極大值模型(BMM)已較為成熟。POT模型與BMM模型都是根據(jù)樣本數(shù)據(jù)對分布的尾部進行擬合,與慣用的整體建模不同,主要差異在于樣本數(shù)據(jù)的選取方式。POT模型是設(shè)定一個閾值,選取超出閾值的樣本數(shù)據(jù)進行建模,該模型可用廣義帕累托分布(GPD)[4]擬合,但廣義帕累托分布(GPD)閾值的選取方法有多種,因此在選取閾值時使用的方法具有一定的主觀性,從而易導致閾值設(shè)定不合理。綜上所述,POT模型能彌補BMM模型的缺陷且所需的樣本數(shù)據(jù)量較少,在生產(chǎn)應(yīng)用中更為有效。
超閾值模型(Peaks Over Threshold,POT)[4]基于廣義帕累托分布擬合超限分布。換言之也是對閾值(Threshold)超出額的所有觀測樣本數(shù)據(jù)來建模,從而漸近刻畫分布的尾部特征。
POT模型能最大限度的使用極值數(shù)據(jù)且其分布一般具有厚尾性[5]。缺失的數(shù)據(jù)與總體分布對POT模型影響比較小,但是POT模型在擬合福建省臺風災害損失分布時,選取的閾值具有較大的主觀性,而對數(shù)正態(tài)分布對福建省臺風災害損失分布的擬合有輔助作用,能彌補POT模型存在的一些缺陷。因此本文使用復合模型(對數(shù)正態(tài)分布模型與POT模型)來研究福建省臺風巨災的損失分布,能讓擬合更加準確和有效。
以福建省1992—2018年臺風造成的直接經(jīng)濟損失作為直接觀測值。對數(shù)據(jù)進行整理優(yōu)化, 剔除了一些殘缺的數(shù)據(jù),總共留下有效數(shù)據(jù)47組。因為數(shù)據(jù)時間的間隔比較大,為消除一些不必要的影響因素如物價水平,本文將以福建省1992年的真實發(fā)展指數(shù)GPI(1992=100)為指定基指數(shù),對福建省歷年每次臺風造成的損失數(shù)據(jù)進行優(yōu)化調(diào)整,優(yōu)化調(diào)整所需要的數(shù)據(jù)來自福建省統(tǒng)計局網(wǎng)站。
本文采用的優(yōu)化調(diào)整公式[6]為
(1)
其中S=GPI(1992=100),調(diào)整后的數(shù)據(jù)為Yi(i=1,2,3,…),歷年臺風災害損失數(shù)據(jù)為Xi(i=1,2,3,…)。調(diào)整完成后用SPSS軟件對福建省1922—2018年臺風造成的直接經(jīng)濟損失數(shù)據(jù)進行基本的統(tǒng)計描述,詳細情況見數(shù)據(jù)表1。
表1 福建省1992—2018年臺風災經(jīng)濟損失額基本統(tǒng)計描述(億元)
經(jīng)過基本統(tǒng)計描述,由表1可以看出,福建省臺風災害經(jīng)濟損失額的偏度和峰度分別為3.19、14.48,而正態(tài)分布的值偏度為0,峰度為3,由此可知福建省1992—2018年臺風災害經(jīng)濟損失額明顯偏離了正態(tài)分布。
其中峰度公式為
(2)
當Kurt=3時為正態(tài)分布,當Kurt>3時表現(xiàn)為厚尾,當Kurt<3時表現(xiàn)為薄尾。
使用SPSS軟件的正態(tài)P-P圖和頻率直方圖對福建省臺風災害損失額進行厚尾檢驗,畫出福建省臺風災害損失額的P-P圖和頻率直方圖,如圖1和圖2所示。
圖1 1992—2018年福建省臺風災害損失額正態(tài)P-P圖
圖2 1992—2018年福建省臺風災害損失額頻率直方圖
由圖2頻率直方圖可知,福建省1992—2018年臺風災害損失額有明顯的“厚尾、尖峰、右偏”等特征。為提高檢驗的可信度和證明福建省臺風災害損失額的厚尾特征,綜合圖1觀察可得,P-P圖偏離正態(tài)直線向下凸,福建省臺風災害損失額觀測的累積概率與期望的累積概率近似分布對角線在上,由此可知福建省臺風災害損失額符合厚尾特征。由于受極值數(shù)據(jù)的影響,單一的使用正態(tài)分布來擬合福建省臺風災害損失額已不適合,所以將使用廣義帕累托分布(GPD)與對數(shù)正態(tài)分布復合模型來對樣本數(shù)據(jù)進行擬合。
對樣本數(shù)據(jù)進行帕累托分布檢驗,將使用檢驗工具帕累托檢驗紙,其檢驗原理是在其變換下讓符合帕累托分布的函數(shù)表現(xiàn)出一條為直線的圖形。若樣本數(shù)據(jù)xi(i=1,2,3,…)來自帕累托分布,樣本數(shù)據(jù)經(jīng)過標準化后得到y(tǒng)i=(xi-μ)/σ,則有點(xi,yj)組成一條近似直線。
使用電子表格Excel對福建省臺風災害損失額進行帕累托分布檢驗,觀察圖3可以看出福建省臺風災害損失額近似一條直線,滿足帕累托分布的前提假設(shè),福建省臺風災害損失額滿足帕累托分布。
圖3 帕累托分布檢驗
對數(shù)正態(tài)分布檢驗只能使用SPSS軟件中的P-P圖或者Q-Q圖,本文使用P-P圖進行對數(shù)正態(tài)分布檢驗。P-P圖檢驗對數(shù)正態(tài)分布主要看其殘差圖形狀是否有規(guī)律,而不僅僅看其波幅,至于波幅在什么范圍并沒有一個通用的標準,一般波幅最大不超過0.06,其對應(yīng)的累積百分點在0.6以上。對于樣本數(shù)據(jù),數(shù)據(jù)點基本緊緊地圍繞在P-P圖的45度線上,基本上就符合對數(shù)正態(tài)分布。
本文使用樣本數(shù)據(jù)47組,為了提高檢驗的準確性,在進行對數(shù)正態(tài)分布檢驗時,將剔除樣本數(shù)據(jù)的異常值,即5組最大值和5組最小值。使用Excel對37組福建省臺風災害損失額取對數(shù),再使用SPSS軟件對福建省臺風災害損失額的對數(shù)進行正態(tài)分布檢驗并繪制出檢驗的Q-Q圖,如表2、圖4所示。
圖4 1992—2018福建省臺風災害損失額對數(shù)正態(tài)檢驗Q-Q圖
表2 臺風災害損失額對數(shù)正態(tài)性檢驗
由表2可知,sig.=0.2>0.005,福建省臺風災害損失額的對數(shù)服從正態(tài)分布,進一步觀察其Q-Q圖確認,可見樣本點基本在直線附近,福建省臺風災害損失額的對數(shù)服從正態(tài)分布[7]。
POT模型閾值選取采用平均超出量函數(shù)(Mean Excess Function,MEF)[4]。當0<ζ
(3)
由式(3)可以看出超均值函數(shù)為閾u值的線形函數(shù)[8]。將福建省臺風災害損失額的47組數(shù)據(jù)導入到統(tǒng)計軟件R.studio中并畫出其平均超限函數(shù)圖和POT模型的Hill圖。如圖5福建省臺風災害損失數(shù)據(jù)的MEF圖可以看出,福建省歷年臺風災害損失數(shù)據(jù)觀測樣本的超額均值有明顯的上升趨勢,分析得出觀測樣本符合廣義帕累托分布(形狀參數(shù)ζ>0)。觀察圖6,看出尾部指數(shù)大概超過15個樣本數(shù)據(jù)以后變得相當平穩(wěn)。綜上,可以將最初閾值u確定為45.07億元,小于閾值(u=45.07億元)的臺風損失認為是正常,超出閾值(u=45.07億元)的臺風損失將視為極值。
圖5 福建省臺風災害損失數(shù)據(jù)的MEF圖
圖6 福建省臺風災害損失數(shù)據(jù)的Hill圖
由于涉及的總體樣本極值數(shù)據(jù)量較小,所以將采用基于GPD分布的極大似然估計法進行相關(guān)參數(shù)的估計[9]。
使用MATLAB軟件進行擬合計算,得形狀參數(shù)ζ為0.493,尺度參數(shù)β為43.21。1992—2018年福建省臺風災害經(jīng)濟損失分布函數(shù)為
(4)
文獻[6]給定某個p值,得出高分位數(shù)點的估計[7]公式:
(5)
由式(5),通過Excel分析計算得到結(jié)果,如表3所示。從分位數(shù)的統(tǒng)計角度觀察,福建省臺風災害損失額小于等于147.38億元的概率為0.95,小于等于335.96億元的概率為0.99,小于等于462.42億元的概率為0.995,小于等于828.85億元的概率為0.999。
表3 福建省臺風災害損失額的高分位數(shù)點估計
受極值數(shù)據(jù)的影響,福建省1992—2018年臺風災害損失額明顯不符合傳統(tǒng)正態(tài)分布,因此本文使用了超閾值模型復合對數(shù)正態(tài)模型對福建省歷年臺風災害損失額進行了分析研究。選取的POT模型能最大限度的使用極值數(shù)據(jù)并且缺失的數(shù)據(jù)對POT模型影響比較小,總體分布對其沒有影響,復合的對數(shù)正態(tài)分布能改善POT模型選取閾值具有的較大主觀性,因此復合模型能充分體現(xiàn)在極值數(shù)據(jù)影響下的優(yōu)勢。結(jié)合復合模型對福建省1992—2018年臺風災損失額進行了對數(shù)正態(tài)分析、帕累托分析和高分位估計,并使用參數(shù)估計得出進行臺風巨災金融產(chǎn)品開發(fā)的相關(guān)參數(shù)??蔀榻窈蟮臍庀鬄暮p失額度的分析、巨災類金融產(chǎn)品開發(fā)提供科學依據(jù)[10]。
致謝感謝閩江學院校長基金項目(103952019031)的資助。