【摘要】本文在極值理論的GPD模型基礎上,引入了變點統(tǒng)計方法,對GPD模型的閾值進行了定量選擇,從而減少了一般極值理論因主觀判斷所引起的閾值選取的偏差。最后,將此方法建立的模型應用到日元/美元匯率風險價值VaR和CVaR的計算中,取得了良好的效果。
【關鍵詞】GPD模型 變點 閾值 VaR CVaR
一、引言
風險度量是金融風險管理的基礎,而風險價值(VaR)及由此衍生的條件風險價值(CVaR)是當今金融風險測量的主流方法,是應用最廣泛的一種工具。傳統(tǒng)的VaR和CVaR計算方法一般都要對金融收益的分布類型進行假設,這降低了模型的可信性。以極值理論為基礎的GPD模型并不假設金融收益的整體服從某一分布,而只是研究分布的尾部特征,這樣就避免了模型風險。因此,近幾年來,GPD模型越來越廣泛地應用于金融風險的測量之中。
但在實際處理風險度量中的厚尾問題時,閾值的選取是GPD模型的一個關鍵環(huán)節(jié),閾值選擇過大,則可用的數據就會很少,參數估計的方差偏大;若選擇過小,則導致參數估計有偏或不相合。為此,很多學者在閾值的選擇上作了大量的研究,Embrechts(1997)[2]建議使用模擬法,通過研究在不同閾值的情況下極值指數的形狀來確定閾值的大?。籇rees和Kaufmann(1998)[3]提出了利用重對數構造Hill估計的樣本最優(yōu)分割的停止時間以此選取閾值。本文在以上研究的基礎上,引入變點統(tǒng)計理論進行定量化的閾值選取,建立GPD變點統(tǒng)計模型,并將此方法應用到風險價值的計算中,以驗證其有效性。
二、廣義Pareto分布與閾值選取
設X1,X2,…,Xn是獨立同分布的隨機變量序列,分布函數F支撐的上端點為x*,對某固定的大值u
■(x;μ,σ,ξ)=(1+ξ■■,ξ≠01-exp(-■),ξ=0 (1)
當ξ>0,分布具有厚尾特征,大部分金融數據都呈現出這種厚尾特征,α=1/ξ稱為尾部指標,一般用Hill估計量來估計尾部指標。將X1,X2,…,Xn按照升序排列,得到次序統(tǒng)計量x(i),滿足x(i)?叟x(i-1),i=1,2…,n。Hill(1975)提出了以下尾部指標α的Hill估計量:
α(k)=■■logx■-logx■,k=1,2,…,n-1 (2)
通過Hill估計法來選取閾值最常用的方法是作樣本的Hill圖,其定義為(k,α(k)):k=2,…,n的集合。閾值u要選擇Hill圖中呈現平穩(wěn)線性狀態(tài)的最大k值對應的數據Xk。觀察Hill圖是一種很便捷的閾值選取方法,但在實際應用中會存在兩個問題:一是如何界定序列的平穩(wěn)性?二是如何選擇跳點?依賴于主觀判斷來解決這兩個問題,通常會存在一定的偏差,這使得閾值的具體數值選取可能因人而異,同時難以通過計算機程序實現。為此,本文引入斜率變點,通過尋找直線中斜率發(fā)生結構性突變的點k來界定Hill估計的平穩(wěn)線性狀態(tài),此點位置所對應的數值即為所求的閾值。
三、斜率變點的估計
有關變點統(tǒng)計的理論和變點的檢測方法可見文獻[4]和[6],這里假定確有變點。按照文獻[6]中斜率變點的估計方法,本文給出σ在某點前后變化最大的點,將該點作為斜率變點的估計。本文直接引用文獻[6]中提出的簡單模型:
y■=a■+σ■x■+ε■,1?燮i?燮k■a■+σ■x■+ε■,k■
這里斜率的變點為k0。假定在第k0個數據時將數據分成兩段,且兩段數據得到的回歸系數值分別為σ■■,σ■■,并計算前后系數的差值,記為
Δ■=σ■■-σ■■ (4)
那么斜率變點的估計為Δ■達到最大的點,即k0=arg(■Δ■),如果有幾個點同時達到最大,則以最臨近的點作為斜率變點的估計。
四、基于變點統(tǒng)計方法的GPD模型
通過上面的討論,可以考慮直線中斜率發(fā)生結構性突變的點k來界定GPD模型中Hill估計的平穩(wěn)線性狀態(tài),以此建立改進的GPD模型,并將其用于VaR及CVaR的計算中,其具體實現步驟如下:
首先,通過(2)式計算GPD分布的尾部指標α的Hill估計量;
其次,通過(3)式找到使(4)達到最大的點,該點即為斜率變點所在的位置;
再次,根據斜率變點所在的位置確定GPD模型的閾值u;
最后,根據選定的閾值u,應用極值統(tǒng)計方法估計GPD模型的未知參數,并代入以下計算式中,得出VaR和CVaR:
VaR■=u+■■(1-p)■-1 (5)
CVaR■=■+■ (6)
其中p為顯著性水平。
五、應用實例
本文以日元/美元匯率為例,檢驗上節(jié)所提方法應用于金融風險價值計算的有效性。采用的歷史數據為1973年1月1日至2012年7月31共10422個數據(數據來源:美國聯(lián)邦儲備局INTERNET網站)。
(一)VaR和CVaR的計算
首先,根據極值理論,并借助R統(tǒng)計軟件中的極值統(tǒng)計包evir中的hill函數,得到相應的Hill值,再利用變點統(tǒng)計理論對Hill估計的斜率變點進行檢驗可知,通過(4)中Δ■達到最大,搜索得到變點位置k0=10224,即在第10224個數據時Hill估計斜率發(fā)生了結構性變化,由此得所求閾值為u=1.5811。
根據選定的閾值,超過閾值u的樣本數的個數為198個,為了提高估計的精確度,采用Bootstrap再抽樣的方法,即根據這198個數據構造經驗分布,再從這個分布中抽取10000個樣本,一共抽10組,分別用這10組樣本用極大似然估計對參數進行估計,得到σ和ξ的估計值分別為0.5142和0.1829,其標準差分別為0.05504和0.08110。再利用(5)式和(6)式得到在不同的置信水平下的VaR和CVaR,如表1。
表1 GPD模型下的VaR和CVaR
注:一般GPD模型下VaR和CVaR的計算直接引用文獻[1]中的方法計算得到。
從表1可以看出,基于變點統(tǒng)計方法的GPD模型計算得到的不同置信水平下的VaR和CVaR值均明顯大于一般極值理論建立的GPD模型所計算的VaR和CVaR值,這表明一般極值理論建立的GPD模型存在著低估風險的可能,而通過變點定量選取閾值的方法能更為精確的刻畫風險程度,增加模型的靈敏度。
(二)模型的有效性檢驗
為檢驗模型的有效性,需要檢驗計算的VaR對實際損失的覆蓋程度。根據樣本計算出損失超過VaR值的天數t,進一步計算溢出率E=t/n。并將E值與顯著性水平p進行比較。若E>p,說明模型低估了風險,反之表明預測結果覆蓋了實際的損失,但是如果E太小則說明估計過于保守。下表給出了檢驗的結果:
表2 模型計算的VaR的檢驗結果
從上表可以看出,兩個模型計算出實際溢出率E
六、結語
本文利用變點統(tǒng)計方法改進了一般極值理論下的GPD模型,該方法能定量地確定GPD模型的閾值,克服了利用Hill估計等傳統(tǒng)方法在選取閾值時過于依賴于主觀判斷的缺陷,并將建立的模型應用于金融風險度量和管理中,使得極值理論在金融風險的應用中更為精確地度量VaR和CVaR。
但是,由于本文用于實證所收集的日元/美元匯率數據可能只是實際數據的一部分,還不能完全反映數據的真實情況,因此應用上述估算的實證結果只是基于收集數據的反映,不一定能完全反映實際情況。如何在不完整數據及小樣本條件下,更合理、科學和準確地估算和預測VaR和CVaR,還有一些關鍵問題值得做進一步探討。
參考文獻
[1]史道濟.實用極值統(tǒng)計方法[M].天津:天津科學技術出版社,2005:42-106.
[2]Embrechts P,et al.Modelling extreme events for insurance and finance[M].Springer Verlag,1997.
[3]Drees H,et al. Selecting the optimal sample fraction in univariate extreme value estimation[J].Stochastic Processes and their Applications,1998:149-172.
[4]陳希孺.變點統(tǒng)計分析簡介:(I)問題的提法[J].數理統(tǒng)計與管理,1991,(1):52-58.
[5]葉五一,繆柏其,譚常春.基于分位點回歸模型變點檢測的金融傳染分析[J].數量經濟技術經濟研究,2007,24(10):151-160.
基金項目:西藏民族學院青年項目(10myQ03);國家社科基金西部項目(11XJY011)。
作者簡介:汪朋(1983-),男,湖北武漢人,數理統(tǒng)計學碩士,講師,統(tǒng)計師,研究方向:統(tǒng)計決策和計量經濟學。