溫錄亮,陳平炎
(1.佛山科學(xué)技術(shù)學(xué)院, 廣東 佛山 528225;2.暨南大學(xué), 廣州 510632)
基于正態(tài)分布的推廣和應(yīng)用一直是統(tǒng)計學(xué)領(lǐng)域的熱點研究問題,如2021年,魏正元等[1]提出了離散alpha偏正態(tài)分布,并分析了其性質(zhì)和參數(shù)估計問題。對正態(tài)分布進(jìn)行拓展,可以得到對數(shù)正態(tài)分布,目前對數(shù)正態(tài)分布已廣泛應(yīng)用于生命科學(xué)的不同領(lǐng)域,包括生物學(xué)、生存分析以及金融和風(fēng)險分析等[2-3]。2005年,Nadarajah[4]提出并研究了廣義正態(tài)分布的相關(guān)性質(zhì),并討論了極大似然估計,給出了信息矩陣。在此研究基礎(chǔ)上,2009年,Martín等[5]提出了廣義對數(shù)正態(tài)分布,利用貝葉斯方法進(jìn)行參數(shù)估計,并應(yīng)用于分析生命周期數(shù)據(jù)。2012年,Singh等[6]對廣義對數(shù)正態(tài)分布的極大似然估計和貝葉斯估計進(jìn)行了對比研究。2013年,Toulias等[7]和Kleiber[8]討論了廣義對數(shù)正態(tài)分布不同條件下的矩求解問題。2017年,Li等[9]提出使用Jeffreys先驗,比較了廣義對數(shù)正態(tài)分布在已知先驗和極大值條件下的貝葉斯估計性能。2020年,Tomazella等[10]提出了一種新的貝葉斯方法,估計了廣義對數(shù)正態(tài)分布的參數(shù)并應(yīng)用于生存數(shù)據(jù)分析。綜上所述,相關(guān)學(xué)者針對廣義對數(shù)正態(tài)分布的參數(shù)估計,主要采用極大似然估計或貝葉斯估計方法。為此,提出廣義對數(shù)正態(tài)分布形狀參數(shù)一種新的強(qiáng)相合的點估計量,并和極大似然估計、貝葉斯估計結(jié)果進(jìn)行對比,評估新提出的點估計方法的性能。
在內(nèi)容的編排上,第1節(jié)給出了廣義對數(shù)正態(tài)分布的定義和期望方差;第2節(jié)將提出廣義對數(shù)正態(tài)分布形狀參數(shù)υ和σ的一種新的點估計量,給出具體的證明過程和逆變換抽樣方法;第3節(jié)進(jìn)行數(shù)值模擬,驗證第2節(jié)定理的結(jié)論;第4節(jié)將提出的點估計和極大似然估計、貝葉斯估計結(jié)果進(jìn)行對比,評估點估計性能;第5節(jié)給出結(jié)論。
如果一個隨機(jī)變量X服從廣義對數(shù)正態(tài)分布,則其概率密度函數(shù)可以寫為:
(1)
圖1 廣義對數(shù)正態(tài)分布的概率密度函數(shù)曲線(μ=0,σ=1)
參考文獻(xiàn)[8,11],當(dāng)υ>1時,可以推導(dǎo)出廣義對數(shù)正態(tài)分布k階原點矩。
命題1設(shè)隨機(jī)變量X的概率密度函數(shù)為式(1),則X的k階原點矩為:
(2)
證明根據(jù)計算公式,有:
將式(1)代入,得出:
從而可以寫出廣義對數(shù)正態(tài)分布的期望和方差為:
利用矩估計時要注意,以上是當(dāng)υ>1時的k階原點矩。當(dāng)υ<1時,k階原點矩不存在;當(dāng)υ=1時,由上述推導(dǎo)可知,當(dāng)且僅當(dāng)kσ<1時存在k階原點矩。
本節(jié)通過來自廣義對數(shù)正態(tài)分布總體樣本的極值來估計形狀參數(shù),并證明此估計量是強(qiáng)相合的。具體地,設(shè)總體X服從廣義對數(shù)正態(tài)分布,即其概率密度函數(shù)為式(1),X1,X2,…,Xn為來自總體X容量為n的樣本,則形狀參數(shù)υ的估計量為:
若υ已知,則σ的估計量為:
下面的結(jié)論表明這2個估計量都是強(qiáng)相合的。
定理1設(shè)隨機(jī)變量X服從廣義對數(shù)正態(tài)分布,X1,X2,…,Xn為來自總體X容量為n的樣本,則:
(3)
下面給出定理1的證明,先介紹一些記號和必要的引理。
設(shè){An,n≥1}是一個事件序列,參考文獻(xiàn)[12],記
表示事件序列{An,n≥1}發(fā)生無窮多次。
運(yùn)用翻轉(zhuǎn)課堂是一種培養(yǎng)學(xué)生自主性的有效方式?!胺D(zhuǎn)教室”這一名詞最早起源于美國,其具體形式為:首先學(xué)生在課外通過網(wǎng)絡(luò)平臺,觀看學(xué)習(xí)老師做的教學(xué)視頻,然后再由教師在課堂上進(jìn)行測試,并討論了課前記憶的知識,最后幫學(xué)生們將知識轉(zhuǎn)為內(nèi)化[3]。顯而易見,將知識共享并實現(xiàn)內(nèi)化是老師和學(xué)生在課堂上互相協(xié)助實現(xiàn)的?!胺D(zhuǎn)課堂”的特點十分明顯,學(xué)生和老師的角色互換的傳統(tǒng)教學(xué)過程是教師集中作業(yè),學(xué)生的學(xué)習(xí)任務(wù)是事先不可知的。但在“翻轉(zhuǎn)課堂”教學(xué)形式中,學(xué)生可以提前學(xué)習(xí)知識,之后在課堂上教師和學(xué)生共同學(xué)習(xí)的一種新穎方式。這樣更加注重學(xué)生的自主性及在課堂上的研究,討論與同伴以及老師的協(xié)作、交流以及反思。
下面的引理1可參考文獻(xiàn)[13],引理2可參考文獻(xiàn)[4]。
(4)
引理2如果隨機(jī)變量X服從廣義對數(shù)正態(tài)分布,可以得到:
(5)
命題2設(shè){X,Xn,n≥1}是獨(dú)立且恒等分布的序列,假設(shè)X服從廣義對數(shù)正態(tài)分布,則可以得到:
(6)
證明不失一般性,可以假設(shè)μ=0,首先證明:
等價于證明:
對任意的ε>0,通過引理1可以得到:
P{logXn≥(1+ε)1/υσ(logn)1/υi.o.}=0
根據(jù)Borel-Cantelli引理,要證明上式,只需證明:
通過引理2,可以得到:
根據(jù)Borel-Cantelli引理,要證明上式,只要證明對任意的ε>0,有:
已知對任意的x>0,有1-x [1-P{logX≥(1-ε)1/υσ(logn)1/υ}]n< e-nP{log X≥(1-ε)1/υσ(log n)1/υ} 通過引理2可以得到: nP{logX≥(1-ε)1/υσ(logn)1/υ}~ 上式中的不等式對于足夠大的n成立。 綜上可以得到: 定理1的證明由上面推導(dǎo)得知當(dāng) 因此: 為了對定理1進(jìn)行數(shù)值模擬,需要產(chǎn)生相應(yīng)的隨機(jī)數(shù)。下面的逆變換抽樣方法借鑒了文獻(xiàn)[5,14]的思想方法。 設(shè)X、U、V是隨機(jī)變量,抽樣算法流程為: 步驟1設(shè)U~Γ(1+1/υ,1),產(chǎn)生隨機(jī)數(shù); 步驟2設(shè)V~Uniform (-1,1),產(chǎn)生隨機(jī)數(shù); 步驟3令X=exp(σU1/υV+μ),可以得到服從廣義對數(shù)正態(tài)分布的隨機(jī)數(shù)。 利用以上算法流程,選取500個隨機(jī)數(shù),可以畫出抽樣概率密度曲線和真實概率密度曲線的對比圖。通過圖2可以發(fā)現(xiàn),υ取不同值時的抽樣概率密度曲線和真實概率密度曲線重合度都很高,說明通過命題3提出的逆變換方法對廣義對數(shù)正態(tài)分布進(jìn)行抽樣,效果是理想的。 圖2 廣義對數(shù)正態(tài)分布的抽樣概率密度曲線和真實概率密度曲線(μ=0,σ=1) 本節(jié)進(jìn)行數(shù)值模擬,評估廣義對數(shù)正態(tài)分布的點估計性能。首先給出偏度和均方誤差的公式: (7) 表1 關(guān)于廣義對數(shù)正態(tài)分布參數(shù)υ的點估計結(jié)果 圖3 關(guān)于廣義對數(shù)正態(tài)分布參數(shù)υ的點估計量收斂效果圖 nσ=1σ=2σ=3估計值偏度均方誤差901.340 82.711 54.051 20.340 80.711 51.051 20.106 30.526 11.373 2估計值偏度均方誤差9001.179 92.357 43.520 40.179 90.357 40.520 40.045 90.038 40.261 8 nσ=1σ=2σ=3估計值偏度均方誤差9 0001.065 32.131 53.198 10.065 30.131 50.198 10.007 71E-40.058 4估計值偏度均方誤差90 0000.980 41.980 22.966 00.019 60.019 80.034 02E-40.001 20.020 6 圖4 關(guān)于廣義對數(shù)正態(tài)分布參數(shù)σ的點估計量收斂效果圖 第3節(jié)對定理1的結(jié)論進(jìn)行了數(shù)值模擬驗證,本節(jié)對點估計和極大似然估計、貝葉斯估計的結(jié)果進(jìn)行對比。固定μ=0,σ=1,取υ=2,3,利用點估計方法仿真實驗重復(fù)進(jìn)行100次,求平均值得到估計結(jié)果,并和Li等[9]提出的極大似然估計、貝葉斯估計結(jié)果進(jìn)行對比,如表3和表4所示。 表3 關(guān)于參數(shù)υ=2的點估計和極大似然估計、貝葉斯估計的結(jié)果 表4 關(guān)于參數(shù)υ=3的點估計和極大似然估計、貝葉斯估計的結(jié)果 通過表3和表4可以發(fā)現(xiàn),針對參數(shù)υ,在樣本量分別為n=25,50,100的情況下,利用提出的點估計方法,得出參數(shù)估計結(jié)果的偏度值明顯大于極大似然估計和貝葉斯估計得出的結(jié)果。所以說,如果樣本量較小,利用極大似然估計或貝葉斯估計是合適的,而利用點估計則會產(chǎn)生較大誤差。如果樣本量較大(如超過10 000),建議考慮選用點估計方法。相對于其他估計方法,提出的這種新點估計方法更加簡單易算。 提出了廣義對數(shù)正態(tài)分布形狀參數(shù)υ和σ的一種新的點估計量,給出了推導(dǎo)證明過程,利用逆變換抽樣方法進(jìn)行數(shù)值模擬,可以看到隨著樣本量n的增大,估計值越來越收斂于真實值,和定理1的結(jié)論一致。和廣義對數(shù)正態(tài)分布的極大似然估計、貝葉斯估計結(jié)果進(jìn)行對比,發(fā)現(xiàn)這種新的點估計方法不適用小樣本估計,而適用于大樣本估計,在進(jìn)行相關(guān)大數(shù)據(jù)分布模型參數(shù)估計時,具有推廣應(yīng)用價值。3 數(shù)值模擬
4 參數(shù)估計效果對比
5 結(jié)論