趙紅妮
西安思源學(xué)院基礎(chǔ)部 陜西西安 710000
概率論中假定隨機(jī)變量的分布是在已知的基礎(chǔ)上研究隨機(jī)變量的性質(zhì)以及數(shù)字特征,而在現(xiàn)實(shí)生活中要研究的對(duì)象的概率往往是完全未知的,需要對(duì)研究對(duì)象進(jìn)行多次大量重復(fù)試驗(yàn)觀察得到數(shù)據(jù),對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)推斷或者預(yù)測(cè),從而就有了數(shù)理統(tǒng)計(jì)這門課程。
在實(shí)際問題中對(duì)樣本直接進(jìn)行推斷不符合實(shí)際,由于樣本數(shù)據(jù)比較零亂,信息比較分散,因此對(duì)樣本定義了一個(gè)新的函數(shù),即統(tǒng)計(jì)量。統(tǒng)計(jì)量本身就是隨機(jī)變量,在使用它進(jìn)行統(tǒng)計(jì)推斷時(shí),需要預(yù)先知道所采用的統(tǒng)計(jì)量的分布,而定義統(tǒng)計(jì)量的分布叫抽樣分布。當(dāng)總體的分布函數(shù)已知時(shí),抽樣分布是確定的,但對(duì)于統(tǒng)計(jì)量的精確分布很難計(jì)算。而抽樣分布均是基于正態(tài)分布總體的基礎(chǔ)上,因此接下來逐一介紹正態(tài)分布與抽樣分布。
在統(tǒng)計(jì)推斷中,正態(tài)分布主要應(yīng)用于推斷正態(tài)總體X的樣本均值與樣本方差的分布。
性質(zhì)1:告訴我們可以將任何一組服從正態(tài)分布的隨機(jī)變量對(duì)其樣本均值恒等變形,最后均可轉(zhuǎn)化為服從標(biāo)準(zhǔn)正態(tài)分布。
性質(zhì)2:已知兩組不同隨機(jī)變量服從正態(tài)分布,它們樣本均值恒等變形后服從標(biāo)準(zhǔn)正態(tài)分布。
對(duì)于統(tǒng)計(jì)量的分布,在這里介紹三種常見的類型的分布。
1.χ2分布的概念
圖1 χ2分布的概率密度函數(shù)
2.χ2分布的性質(zhì)
②若χ2~χ2(n),則E(χ2)=n,D(χ2)=2n。
結(jié)論根據(jù)χ2分布的定義即可得到,證明過程在這里就不詳細(xì)列舉。
1.t分布的概念
根據(jù)函數(shù)表達(dá)式hn(t)本身是偶函數(shù),即關(guān)于直線x=0(y軸)對(duì)稱,形狀與標(biāo)準(zhǔn)正態(tài)分布曲線相類似,其概率密度函數(shù)圖像如圖2所示。
圖2 t分布的概率密度函數(shù)
通過圖像可以看出n越大,圖形越尖,圖像和正態(tài)分布圖像很類似,但是通過t分布的圖像觀察尾部要比標(biāo)準(zhǔn)正態(tài)分布的尾部要厚,換言之就是X取特別小值或者X非常大值時(shí),t分布對(duì)應(yīng)的概率要比正態(tài)分布的概率大。
2.t分布的性質(zhì)
①t分布的概率密度曲線關(guān)于直線t=0對(duì)稱。
t分布部分表
從上表中可以看出α取值都比較小,可以借助概率密度函數(shù)是偶函數(shù),對(duì)于α比較大時(shí),其上的α分位點(diǎn)tα(n)滿足t1-α(n)=-tα(n)來進(jìn)行計(jì)算,這樣就可以求在任意分位點(diǎn)處的值,比如t0.85(12)=-t0.15(12)=-1.083。
t分布主要應(yīng)用于推斷正態(tài)總體的均值。
F分布是一種非負(fù)連續(xù)型隨機(jī)變量的分布,它的密度函數(shù)中含有兩個(gè)參數(shù)m和n,其曲線的形狀與χ2分布相似,F(xiàn)~F(m,n)分布的概率密度φ(y)的圖像如圖3所示:
圖3 F分布的概率密度函數(shù)
設(shè)總體X~N(0,σ2),樣本X1,X2,…X6來自總體X,設(shè)Y=(X1+X2+X3)2+(X4+X5+X6)2,求c使cY服從χ2分布,并求自由度。
已知隨機(jī)變量X~t(n),證明X2~F(1,n)。