【摘要】本文綜述了正態(tài)分布的最新發(fā)展?fàn)顩r,給出了正態(tài)分布的概念和公式,主要論述了正態(tài)分布的各種擴(kuò)展,包括漸近正態(tài)分布、二元正態(tài)分布、離散正態(tài)分布、廣義正態(tài)分布、對(duì)數(shù)正態(tài)分布、多元正態(tài)分布、廣義逆正態(tài)分布、偏正態(tài)分布和截尾正態(tài)分布等,并論述了其最新進(jìn)展和應(yīng)用動(dòng)態(tài).
【關(guān)鍵詞】正態(tài)分布;廣義正態(tài)分布;多維正態(tài)分布;偏正態(tài)分布
一、正態(tài)分布及其應(yīng)用
1.正態(tài)分布定義和性質(zhì)
生產(chǎn)與科學(xué)實(shí)驗(yàn)中很多隨機(jī)變量的概率分布都可以近似地用正態(tài)分布來描述,正態(tài)分布是當(dāng)今應(yīng)用最為廣泛的連續(xù)概率分布.17世紀(jì),棣莫弗和拉普拉斯最早使用了正態(tài)分布,18世紀(jì)早期德國(guó)數(shù)學(xué)家高斯研究了正態(tài)分布的性質(zhì)并應(yīng)用正態(tài)分布分析了天文數(shù)據(jù),所以在科學(xué)界正態(tài)分布也叫作高斯分布.正態(tài)分布的概率密度函數(shù)為:f(x)=
2.正態(tài)分布的應(yīng)用
由于正態(tài)分布具有很多優(yōu)良性質(zhì),根據(jù)中心極限定理,諸多數(shù)據(jù)集合可以用它來近似擬合,所以生產(chǎn)與科學(xué)實(shí)驗(yàn)中很多隨機(jī)變量的概率分布都可以近似地用正態(tài)分布來描述.例如,在生產(chǎn)條件不變的情況下,產(chǎn)品的口徑、長(zhǎng)度等指標(biāo),同一種生物體的身長(zhǎng)、體重等指標(biāo).一般來說,如果一個(gè)量是由許多微小的獨(dú)立隨機(jī)因素影響的結(jié)果,那么就可以認(rèn)為這個(gè)量具有正態(tài)分布,還有一些常用的概率分布也是由它衍生而來的,例如對(duì)數(shù)正態(tài)分布、t分布、F分布等.
二、正態(tài)分布的新發(fā)展
實(shí)際應(yīng)用中由于正態(tài)分布的不易滿足性,故針對(duì)不同問題對(duì)正態(tài)分布進(jìn)行了擴(kuò)展,在一般正態(tài)分布的基礎(chǔ)上,導(dǎo)出了漸近正態(tài)分布、二元正態(tài)分布、離散正態(tài)分布、廣義正態(tài)分布、廣義逆正態(tài)分布、對(duì)數(shù)正態(tài)分布、多元正態(tài)分布、偏正態(tài)分布和截尾正態(tài)分布等,各擴(kuò)展有不同的特點(diǎn)和應(yīng)用.
1.漸近正態(tài)分布
漸近正態(tài)分布在因子分析中應(yīng)用很廣泛,因子分析主要用在行為和社會(huì)科學(xué),如隨著年齡的增長(zhǎng),兒童的身高、體重會(huì)隨著變化,因?yàn)橛绊懮砀吲c體重的生長(zhǎng)因子相同故有一定的相關(guān)性.漸近正態(tài)分布主要用于弱假設(shè)情況下的最大似然因子分析,通過漸近正態(tài)性可以使因子分析適用于更廣泛數(shù)據(jù)分布的分析.因子分析模型對(duì)于p可觀測(cè)隨機(jī)向量xα可以表示為:xα=μ+Λfa+ua (α=1,…,N) (7),其中μ是p維向量參數(shù),Λ是p×k階因子載荷矩陣,fα是非觀測(cè)可能包含隨機(jī)誤差的k階向量,uα是一個(gè)非觀測(cè)隨機(jī)誤差向量,而且fα和uα互相獨(dú)立.
Anderson和Amemiya分別在1956年和1987年討論了最大似然估計(jì)在弱假設(shè)情況下的性質(zhì),后者指出對(duì)于探索性因子分析,如果uα服從正態(tài)分布,因子載荷和誤差的漸近分布將對(duì)fα有更好的適應(yīng)性.對(duì)于因子分析模型,Aerson和Rubin在1956年通過最大似然估計(jì)得出漸近正態(tài)分布統(tǒng)計(jì)量上提出一般性結(jié)論,指出用漸近分布來做一般分布的因子和誤差分析的可靠性.隨后在1988年Anderson 和Amemiya對(duì)該結(jié)論做了證明,并把模型拓展到Λ是λ的非線性函數(shù)上這種更一般的情況.
2.二元正態(tài)分布
二元正態(tài)分布是多元正態(tài)分布的一個(gè)特例,它的很多性質(zhì)可從多元正態(tài)分布中推出.定義:兩個(gè)連續(xù)的隨機(jī)變量x和y,x~N(μx,σ2x),y~N(μy,σ2y),它們的聯(lián)合概率密度可用下式表示:
它是左截尾的離散正態(tài)分布,同時(shí)像半邊連續(xù)正態(tài)分布一樣也是有確定期望和方差的最大熵分布.Kemp同時(shí)推出半邊正態(tài)分布是qhyperPoissonI分布,說明它和M/M/1 隊(duì)列的關(guān)系,推導(dǎo)了它的期望和圖形的單峰性質(zhì).
4.廣義正態(tài)分布
廣義正態(tài)分布在1972年最早由Miller et.al提出,它是作為一個(gè)非隨機(jī)誤差的模型用于粗差探測(cè)模型.它具有對(duì)稱的單峰概率密度曲線,很多其他的分布通過它概率密度式參數(shù)的指數(shù)衰減推導(dǎo)而出.由于廣義正態(tài)分布的強(qiáng)適應(yīng)性、穩(wěn)定性,只需一個(gè)參數(shù)就可確定和可逼近大批量數(shù)據(jù),所以它在各個(gè)領(lǐng)域獲得了廣泛應(yīng)用.
【參考文獻(xiàn)】
[1] Wassily Hoeffding.A Class of Statistics with AsyMptotically Normal Distribution.Institute of Statistics.
[2] T.W.Anderson,Yasuo AmeMiya.The AsyMptotic Normal Distribution of Estimators In Factor Analysis Under General Conditions.The Annals of Statistics,1988,Vol.16,No.2,159-771.
[3] P.Blaesild.Conditioning With Conic Sections In The TwoDimensional Normal distribution.The Annals of Statistics[J].1979,vol 7,No 3,169-670.
[4] ManLai Tang,WaiYin Poon.Statistical inference for equivalence trials with ordinal responses: Alatent normal distribution approach.Computational Statistics Data Analysis[J].2007,vol 51,5918-5926.
[5] D.Marcottea,E.Henry.Automatic joint set clustering using a mixture of bivariate normal distributions.International.Rock Mechanics Mining Sciences[J].2002,vol 39,323–334.
[6] S.J.van Albada,P.A.Robinson.Transformation of arbitrary distributions to the normal distribution with application to EEG testretest reliability Neuroscience Methods[J].2007,vol 161,205-211.
[7] N.E.Savin,Henry B.,Iowa City.Semiparametric Estimation of the BoxCox Model.Preliminary and Incomplete.Tippie College of Business[J].2001,vol 30.