左衛(wèi)兵, 蔡曉奕
(華北水利水電大學(xué) 數(shù)學(xué)與統(tǒng)計學(xué)院,河南 鄭州 450046)
Poisson回歸模型是一類重要的廣義線性模型,該模型在社會科學(xué)、生物醫(yī)學(xué)和工程技術(shù)等領(lǐng)域有廣泛的應(yīng)用[1]。Poisson回歸模型最早由文獻(xiàn)[2]總結(jié)提出,而后眾多學(xué)者對其進(jìn)行了研究,其中文獻(xiàn)[3]針對Poisson回歸模型存在測量誤差提出修正分?jǐn)?shù)估計,并證明估計具有強(qiáng)相合性;文獻(xiàn)[4]在二次損失函數(shù)下提出Poisson回歸模型的近似Bayes估計;文獻(xiàn)[5]針對Poisson回歸模型存在隨機(jī)系數(shù)提出擬極大似然估計,并通過設(shè)計優(yōu)化估計的性質(zhì)。
在實際應(yīng)用中,解釋變量之間往往存在復(fù)共線性,已有結(jié)果不盡如人意。針對此問題,文獻(xiàn)[6]利用嶺估計解決Poisson回歸模型中的復(fù)共線性問題;文獻(xiàn)[7]提出Poisson回歸模型的Liu估計,并給出參數(shù)d的一些選擇方法;文獻(xiàn)[8]將線性模型中刀切嶺估計擴(kuò)展到Poisson回歸模型中,并給出了參數(shù)k的幾種估計方法;文獻(xiàn)[9]結(jié)合文獻(xiàn)[6-7]提出Poisson回歸模型的兩參數(shù)估計,在均方誤差矩陣意義下證明所提估計的優(yōu)良性;文獻(xiàn)[10]給出了Poisson回歸模型中嶺參數(shù)的幾種估計方法;文獻(xiàn)[11]針對偏差較小的情況,提出新的Poisson回歸嶺估計,研究了新估計的偏差、方差及均方誤差;文獻(xiàn)[12]將兩參數(shù)估計擴(kuò)展到負(fù)二項和Poisson回歸模型上,給出了參數(shù)的幾種估計方法,并在均方誤差準(zhǔn)則下研究了估計的性質(zhì);文獻(xiàn)[13]在文獻(xiàn)[7]的基礎(chǔ)上提出幾個新的參數(shù)估計方法;文獻(xiàn)[14]提出了Poisson回歸模型的懲罰嶺型收縮估計,并研究估計的漸進(jìn)性質(zhì)。
上述方法均是通過引入偏差來減小均方誤差,有可能導(dǎo)致估計的偏差很大,因此本文在文獻(xiàn)[7]的基礎(chǔ)上,結(jié)合幾乎無偏估計的思想,提出Poisson回歸模型中參數(shù)的幾乎無偏Liu估計。
考慮廣義線性模型[15],設(shè)(Yi;Xi1,Xi2,…,Xip),i=1,2,…,n,為因變量Y和自變量X1,X2,…,Xp的觀測值,若
1)Y1,Y2,…,Yn相互獨(dú)立,且對每個i,Yi服從指數(shù)族分布,即
2)設(shè)μi為對應(yīng)的Yi的數(shù)學(xué)期望值μi=E(Yi),i=1,2,…,n,存在單調(diào)可導(dǎo)數(shù)g,使得
則稱Yi與X1,X2,…,Xp服從廣義線性模型。
假定觀測值服從泊松分布,令連接函數(shù)g(μi)=lnμi,則利用觀測值Yi和Xi1,Xi2,…,Xip可建立廣義線性模型
此時該模型稱為Poisson回歸模型。
在廣義線性模型中通常采用極大似然估計來估計模型的參數(shù),假設(shè)觀測值是獨(dú)立的,相應(yīng)的Poisson分布的對數(shù)似然函數(shù)可寫為
利用迭代加權(quán)最小二乘法對對數(shù)似然函數(shù)求極值可得β的極大似然估計,其表達(dá)式為
(1)
文獻(xiàn)[7]提出Poisson回歸模型的Liu估計,定義為
其中參數(shù)0 (2) 本文針對Poisson回歸模型,在Liu估計的基礎(chǔ)上結(jié)合幾乎無偏的思想[16],提出幾乎無偏Liu估計,定義為 (3) 其中 在均方誤差準(zhǔn)則下討論P(yáng)oisson回歸模型的幾乎無偏Liu估計的性質(zhì)。 令 因為f(s)是開口向下的,所以可以得到,當(dāng)0 令 可以看出g(s)是關(guān)于參數(shù)s的一元二次方程,其正根為 其中 Δ=((λj+1)(λj+mj))2+8mj(λj+mj)(λj+1)2=(λj+1)2(λj+mj)(λj+9mj), 因為g(s)是開口向下的,所以可以得到,當(dāng)0 Poisson回歸模型的因變量是通過Po(μi)生成的偽隨機(jī)數(shù)[17],其中 μi=exp(β0+β1xi1+…+βpxip),i=1,2,…,p。 (4) 其中zij是代表標(biāo)準(zhǔn)正態(tài)分布生成的偽隨機(jī)數(shù),ρ表示解釋變量之間的相關(guān)程度。對于參數(shù)d,選擇0≤d≤1,樣本量n分別為60、80和100。計算各Liu參數(shù)下的均方誤差,借助R軟件討論極大似然估計、Liu估計以及幾乎無偏Liu估計均方誤差變化規(guī)律。 為研究ML估計、Liu估計以及幾乎無偏Liu估計的性能,使用公式 從表1~表9可以看出,Liu估計及幾乎無偏Liu估計的均方誤差均小于極大似然估計,因此對于復(fù)共線性問題,有偏估計是一個很好的解決方法;當(dāng)樣本量n固定隨著ρ的增加3個估計優(yōu)良性發(fā)生變化,尤其當(dāng)ρ=0.99時,此時參數(shù)d取0或0.1值,幾乎無偏Liu估計優(yōu)于Liu估計;當(dāng)樣本量n和參數(shù)d不變時,隨著ρ的增加三個估計的均方誤差均有變大趨勢。 表1 n=60, ρ=0.8,對于不同d,各個估計的均方誤差Tab.1 The estimated MSE values for different d when n=60 and ρ=0.8 表2 n=60, ρ=0.9,對于不同d,各個估計的均方誤差 表3 n=60, ρ=0.99,對于不同d,各個估計的均方誤差 表4 n=80, ρ=0.8,對于不同d,各個估計的均方誤差Tab.4 The estimated MSE values for different d when n=80 and ρ=0.8 表5 n=80, ρ=0.9,對于不同d,各個估計的均方誤差 表6 n=80, ρ=0.99,對于不同d,各個估計的均方誤差 表7 n=100, ρ=0.8,對于不同d,各個估計的均方誤差 表8 n=100, ρ=0.9,對于不同d,各個估計的均方誤差 表9 n=100, ρ=0.99,對于不同d,各個估計的均方誤差 本文針對Poisson回歸模型中解釋變量存在復(fù)共線性問題,提出了參數(shù)的幾乎無偏Liu估計。在均方誤差準(zhǔn)則下,得到該估計優(yōu)于極大似然估計以及Liu估計的充分條件,最后通過蒙特卡羅模擬方法驗證了其優(yōu)良性??紤]其他評估準(zhǔn)則,從不同角度對估計的性質(zhì)進(jìn)行研究是筆者下一步研究的重點(diǎn)。2 估計的性質(zhì)
0。3 蒙特卡羅模擬
4 結(jié)論
——以多重共線性內(nèi)容為例