石撿情, 劉繼成, 劉顯明
(華中科技大學 數(shù)學與統(tǒng)計學院,武漢430074)
設(shè)X1,…,Xn為正態(tài)總體X~N(μ,σ2)的樣本容量為n的簡單隨機樣本,樣本均值和樣本方差分別記為
在總體方差σ2已知和未知兩種情況下,總體期望μ的置信水平為1-α的置信區(qū)間分別是(文獻[1]P194(7.10)和P196(7.13))
分析L1和L2的表達式,易知tα/2(n-1)>uα/2,通過Cauchy-Schwartz不等式得到E(Sn)<σ,文獻[2]從數(shù)值上得出L1小于E(L2),本文的目的是嚴格證明L1 定理1對于任意n≥2,L1 為證定理1,只需等價證明σ·uα/2 回顧自由度為n-1的t分布的密度函數(shù)fn-1(x)和標準正態(tài)分布的密度函數(shù)φ(x) 對密度函數(shù)fn-1(x)在分位數(shù)下做變換,可得到另一概率密度函數(shù)記為gn-1(x),其上側(cè)α/2分位數(shù)正是Cn·tα/2(n-1),最后通過探究概率密度函數(shù)φ(x)與gn-1(x)的圖像交點問題來證明定理1成立.值得注意的是,為使E(Sn)的取值有意義,n的取值應不小于2,本文約定n≥2. 下面的引理來自文獻[2],討論了樣本標準差Sn的數(shù)學期望和性質(zhì). ② E(Sn)關(guān)于n單調(diào)遞增且收斂到σ. 文獻[2]計算了E(Sn)的精確數(shù)值表示,且對E(Sn)的極限和單調(diào)性進行了計算與探討. 由引理1中E(Sn)的表達式,記E(Sn)與σ的比值 (1) 即Cn是n的函數(shù).E(Sn)單調(diào)遞增且收斂到σ,則Cn關(guān)于n單調(diào)遞增收斂到1.定義 (2) 下面的命題說明了gn-1(x)的性質(zhì). 命題1(i)gn-1(x)是一概率密度函數(shù); (ii)Cn·tα/2(n-1)是概率密度函數(shù)gn-1(x)的上側(cè)α/2分位點; (iii)gn-1(x)收斂到標準正態(tài)分布的概率密度函數(shù)φ(x); 證對自由度為n-1的t分布的概率密度函數(shù)fn-1(x)做積分變換. 根據(jù)式(1) 由上側(cè)分位數(shù)的定義(文獻[3], P131(2.7.5)),有 令x=Cn·t得到 (3) 即 取α=1,注意到tα/2(n-1)=0,有 (4) 即 (i) 易知gn-1(x)>0且為偶函數(shù),由公式(4)可證gn-1(x)是一概率密度函數(shù); (ii) 由公式(3)和上分位點的定義,Cn·tα/2(n-1)是概率密度函數(shù)gn-1(x)的上側(cè)α/2分位點; (iii) 由于t分布收斂到φ(x),且當n→∞時, 已知Cn·tα/2(n-1)與uα/2分別是概率密度函數(shù)gn-1(x)與φ(x)的上側(cè)α/2分位點,為此下面證明這兩個函數(shù)圖像在x正半軸只有一個交點. 命題2函數(shù)φ(x)與gn-1(x)在(0,+∞)上有唯一的交點.即存在K0,當x∈(0,K0),φ(x)>gn-1(x);當x∈(K0,+∞)時φ(x) 證原問題等價于方程φ(x)=gn-1(x)在(0,+∞)上有且僅有一個解.由對數(shù)函數(shù)的單調(diào)性,方程兩邊取對數(shù)化簡,也等價于函數(shù) 在x正半軸有唯一零點. 首先證明函數(shù)m(x)在x正半軸至多有一個零點.對函數(shù)m(x)求導 記 下面證明函數(shù)m(x)在x軸正半軸有且只有一個零點.論文中,前面已經(jīng)有下面符號和結(jié)論 因為 (5) 注意到m(0)=0,因此m(x)在x正半軸有且只有一個零點,函數(shù)φ(x)與gn-1(x)在(0,+∞)上只有一個交點,記為K0. 最后,比較gn-1(x)與φ(x)在(0,+∞)上的大小關(guān)系. 由于gn-1(x)與φ(x)在(0,+∞)均單調(diào)遞減且在[0,+∞)上有且只有兩個交點:0和K0,由式(5)知當x∈(0,K0)時,φ(x)>gn-1(x);當x∈(K0,+∞)時,φ(x) 下面來證明定理1. 概率密度函數(shù)gn-1(x)與φ(x)的累積分布函數(shù)分別記為Gn-1(x)與Φ(x),兩者的概率密度函數(shù)圖像和累積分布函數(shù)圖像分別如圖1和圖2. 圖1 概率密度函數(shù)圖像 圖2 累積分布函數(shù)圖像 即 當x>0時,此時uα/2,Cn·tα/2(n-1)>0,Φ(x)>Gn-1(x),根據(jù)概率分布函數(shù)的單調(diào)性,所以有uα/2 定理1的等價形式得到了證明,因此定理1成立,即L1 本文證明了正態(tài)總體在方差已知和未知兩種情況下,方差未知時的置信區(qū)間長度的期望要大.與直觀一致,當方差σ已知時,關(guān)于正態(tài)總體可以利用的信息更多,更有利于區(qū)間的準確估計;當方差σ未知時,隨著樣本量的增多,樣本中包含總體的信息增多,樣本方差更加趨近于總體方差,兩個置信區(qū)間估計精度的差別也越小.且當n→∞時,概率密度函數(shù)gn-1(x)趨于標準正態(tài)分布的概率密度函數(shù),分位數(shù)Cn·tα/2(n-1)也將趨于uα/2. 另外,眾所周知t分布是小樣本分布,在n較小時與標準正態(tài)分布存在較大的區(qū)別,尤其是尾部概率要更大,tα/2(n-1)遠大于uα/2.本文中得出的概率密度函數(shù)gn-1(x)是一個有趣的分布,比t分布更接近于標準正態(tài)分布,可以替代t分布來對小樣本進行估計. 致謝作者非常感謝相關(guān)文獻對本文的啟發(fā)以及審稿專家提出的寶貴意見.2 分位數(shù)下的積分變換
3 兩個概率密度函數(shù)的比較
4 定理1的證明
5 結(jié) 論