章溢,龔海林
(江西師范大學(xué)a.計算機信息工程學(xué)院;b.數(shù)學(xué)與信息科學(xué)學(xué)院,南昌330022)
方法應(yīng)用
偏度系數(shù)的近似線性貝葉斯估計
章溢a,b,龔海林b
(江西師范大學(xué)a.計算機信息工程學(xué)院;b.數(shù)學(xué)與信息科學(xué)學(xué)院,南昌330022)
在概率統(tǒng)計中,偏度系數(shù)反映了隨機變量的密度曲線的對稱特征。由于偏度系數(shù)涉及到分布的前三階矩,因此得到好的估計有一定的難度。文章建立貝葉斯模型,對偏度系數(shù)提出近似線性貝葉斯估計,并在多條數(shù)據(jù)結(jié)構(gòu)下,對先驗分布的超參數(shù)提出合適的估計,得到偏度系數(shù)的經(jīng)驗貝葉斯估計。
偏度系數(shù);近似線性貝葉斯估計;超參數(shù);經(jīng)驗貝葉斯估計
偏度系數(shù)是概率統(tǒng)計度量隨機變量分布的對稱性的一個重要的特征[1,2]。偏度系數(shù)不僅在數(shù)理統(tǒng)計中得到廣泛的關(guān)注和研究,而且被運用到金融風(fēng)險管理與決策、保險精算、時間序列預(yù)測等方面[3-8]。
設(shè)隨機變量X的分布函數(shù)為F(x),則該隨機變量的偏度系數(shù)定義為:
上式中的偏度系數(shù)γ涉及到分布的前三階矩,因此對偏度系數(shù)γ有一定的難度,見Yevjevich and Jayantha[9]。為了得到偏度系數(shù)γ的一個好的估計,需要充分利用已知的所有統(tǒng)計信息。一般地,所謂的統(tǒng)計信息包括樣本信息和先驗信息。樣本信息即抽樣得到的樣本,記為。而先驗信息是獲得樣本試驗信息之前擁有的經(jīng)驗或歷史資料,其主要來源于主觀的判斷、經(jīng)驗或歷史資料,所有的先驗信息在概率統(tǒng)計中用某個分布來刻畫,這個分布稱為先驗分布,記為π(θ)。貝葉斯統(tǒng)計就是利用樣本信息和先驗信息對感興趣的參量進(jìn)行統(tǒng)計推斷的學(xué)科。在貝葉斯框架下,樣本可以看成在先驗參數(shù)θ給定下的n次獨立觀測,具有概率密度函數(shù)f(x|θ)。此時樣本偏度與先驗參數(shù)θ有關(guān),記為γ(θ)。根據(jù)貝葉斯定理,所有的統(tǒng)計推斷可以在后驗分布上進(jìn)行。在平方損失函數(shù)下,總體的偏度系數(shù)γ(θ)的最優(yōu)估計為它的后驗均值。但是,由于后驗分布不僅依賴于樣本分布的具體信息,而且還依賴于先驗分布的具體形式。而這些信息,特別是先驗分布的具體形式,在實際中很難獲取,在很多情況下帶有主觀因素。
本文將建立貝葉斯模型,研究偏度系數(shù)的貝葉斯估計,線性貝葉斯估計和近似貝葉斯估計,并利用經(jīng)驗貝葉斯方法估計超參數(shù),進(jìn)而得到這些估計的經(jīng)驗貝葉斯估計。并利用數(shù)值模擬的方法比較這些估計的優(yōu)劣。
在貝葉斯決策理論中,樣本信息X1,X2,…,Xn可以看成在先驗參數(shù)θ給定條件下的樣本。而先驗參數(shù)θ假設(shè)服從某個概率分布密度π() θ。為書寫的方便,記,則總體的偏度系數(shù)為:
而樣本偏度為:
且引入下面的記號:
以及:
不僅依賴于樣本的具體分布,而且依賴于先驗分布的具體形式。而這些信息,特別是先驗分布的具體形式,在實際中很難獲取,并且即使對先驗分布有合理的假設(shè),結(jié)合樣本分布也很難得到的顯示表達(dá)式。解決這個問題的方法之一就是利用線性貝葉斯理論。它將需要估計的量限定在樣本的某類線性函數(shù)中,在均方誤差最小的意義下得到最優(yōu)估計。即求解下面的最小化問題:
得到下面的定理。
定理2:在貝葉斯模型下,求解最小化問題(6)式得到偏度系數(shù)γ(θ)的最優(yōu)線性貝葉斯估計:
γn一般不等于γ(θ),但是當(dāng)樣本容量較大時,由于γn是γ(θ)的強相合估計,即有在某種正規(guī)條件下,有。如果假設(shè)γn(θ) =γ(θ),再次求解(6)式,得到的估計稱之為近似線性貝葉斯估計。敘述為下面的定理。
定理3:若γn(θ)=γ(θ),求解最小化問題(6)式,得到γ(θ)的近似線性貝葉斯估計為:
證明:類似于定理2的證明,在γn(θ)=γ(θ)條件下,有γ=γ0,以及ρ=δ=Vаr(γ(θ)),因此(9)式為:
則γ(θ)的近似線性貝葉斯估計為:
注:偏度系數(shù)γ(θ)的近似貝葉斯估計表達(dá)為樣本偏度γn和γ0的加權(quán)形式,這種形式類似于信度理論中的信度估計,這時Z∈(0,1)稱為信度因子。
與定理2的結(jié)論相比,近似線性貝葉斯估計有較為簡單的形式,且有較少的結(jié)構(gòu)參數(shù)。對近似貝葉斯估計有下面的大樣本性質(zhì)。
從上文中得到偏度系數(shù)γ(θ)的線性貝葉斯估計和近似線性貝葉斯估計,但這些估計中仍然含有一些未知的參數(shù),例如近似貝葉斯估計中的γ0,λ,ρ。對這些參數(shù)的估計,需要有多個θ值下的樣本信息。
設(shè)θ有K個觀測值θ1,…,θK,在θi下有容量為n的樣本。對每個i,有樣本偏度γin,由于,由矩估計方法容易得到γ0和ρ的估計:
將超參數(shù) γ0,λ,ρ 的估計分別代入(8)式,得到的估計記為:稱為偏度系數(shù)的經(jīng)驗貝葉斯估計,在實際中可以直接運用。
而 γ(θ)的線性貝葉斯估計和經(jīng)驗貝葉斯估計分別為:
以及:
在模擬中,取 α=2,β=1,在不同 θ 值下,考慮不同的n,重復(fù)5000次模擬,計算以及在5000次模擬中的平均值及其均方誤差得到如表1和表2所示。
表1 當(dāng)樣本容量為n=30的估計值及其均方誤差(括號內(nèi))
表2 當(dāng)樣本容量為n=200的估計值及其均方誤差(括號內(nèi))
從上面的模擬可以看出,在均方誤差意義下,當(dāng)樣本容量增大時,都能收斂到總體的偏度系數(shù)γ(θ)。當(dāng)樣本容量較小時,是最優(yōu)估計,依次為以及出以及γn,然而從上文中可以看是最方便應(yīng)用的估計,而且從表1和表2可以看出在中等樣本容量(n=30)時比γn較好。
[1]王學(xué)民.偏度和峰度概念的認(rèn)識誤區(qū)[J].統(tǒng)計與決策,2008,(12).
[2]邵建平,鄧兆卉.分配公平性的分布偏度與峰度描述研究[J].統(tǒng)計與決策,2008,(3).
[3]余婧.均值-方差-近似偏度投資組合模型和實證分析[J].運籌學(xué)學(xué)報,2010,(1).
[4]傅俊輝,張衛(wèi)國,陸倩,梅琴.考慮偏度風(fēng)險和峰度風(fēng)險的非線性期貨套期保值模型[J].系統(tǒng)工程,2009,(10).
[5]王建華,彭勇杰,王玉潔.偏度和峰度調(diào)整下Black-Scholes模型及實證分析[J].武漢理工大學(xué)學(xué)報,2009,(4).
[6]王鵬,王建瓊,魏宇.自回歸條件方差-偏度-峰度:一個新的模型[J].管理科學(xué)學(xué)報,2009,(5).
[7]Conrad J,Dittmar R F,Ghysels E.Ex Ante Skewness and Expected Stock Returns[J].Journal of Finance.VOL.LXVIII,2013.
[8]Grigoletto M,Lisi F.Looking for Skewness in Financial Time Series [J].Econometrics Journal.Volume,2009,(12).
[9]Yevjevich V,Jayantha T.B.Estimation of Skewness of Hydrologic Variables[J].Water Resources Research,1984.
[10]Ferguson T S.A Course in Large-sample Theory[M].New York: Chapman&Hall,1996.
[11]Efron B,Tibshirani R J.An Introduction to the Bootstrap[M].New York:Chapman&Hall,1993.
(責(zé)任編輯/易永生)
Approximate Linear Bayesian Estimation of Skewness Coefficient
Zhang Yia,b,Gong Hailinb
(a.School of Mathematics and Information Science; b.School of Computer and Information Engineering,Jiangxi Normal University,Nanchang 330022,China)
In probability and statistics,skewness coefficient reflects the symmetry characteristics of density curve of the random variable.As the skewness coefficient is involved in the first three moments of the distribution,it is very difficult to get good estimates for skewness coefficient.This paper builds Bayes model and proposes approximate linear Bayesian estimation for skewness coefficient.In addition,the hyper-parameters of prior distribution are estimated in the multitude data structure,thus deriving the empirical Bayes estimator of skewness coefficient.
skewness coefficient;approximate linear Bayesian estimation;hyper-parameter;empirical Bayes estimation
O21
A
1002-6487(2017)10-0078-03
國家自然科學(xué)基金資助項目(71361015);教育部人文社科基金資助項目(15YJC910010);江西省自然科學(xué)基金資助項目(20142BAB201013)