【摘要】假設(shè)檢驗是統(tǒng)計學(xué)課程中十分重要的內(nèi)容。假設(shè)檢驗教學(xué)中的難點是單尾檢驗。本文闡述了如何通過分析專門設(shè)計的實例以及運用統(tǒng)計分析軟件等方法講解單尾檢驗的原理,以使學(xué)生能更深入地理解這部分內(nèi)容。
【關(guān)鍵詞】假設(shè)檢驗單尾檢驗統(tǒng)計分析軟件
【中圖分類號】G642.4【文獻標(biāo)識碼】A 【文章編號】2095-3089(2014)05-0209-01
統(tǒng)計假設(shè)檢驗是統(tǒng)計學(xué)中重要而又獨特的一種思維方式,也是在實際中應(yīng)用十分廣泛的統(tǒng)計分析方法。筆者在多年的統(tǒng)計類課程的教學(xué)中發(fā)現(xiàn),假設(shè)檢驗中的單尾假設(shè)檢驗(one?鄄tailed hypothesis test)是教學(xué)中的一個難點。單尾假設(shè)檢驗指要檢驗總體參數(shù)值不大于或不小于某個特定值時所使用的一種假設(shè)檢驗方法;因其拒絕域只是在抽樣分布的一側(cè)(左尾或右尾),故稱單尾檢驗。對于單尾檢驗,學(xué)生通常覺得最難理解的是如何設(shè)定零假設(shè)(H0)和備擇假設(shè)(H1),比如,對一個給定的關(guān)于均值假設(shè)檢驗的實際問題,是應(yīng)設(shè)定H0:μ≥μ0,H1:μ<μ0;還是設(shè)定H0:μ≤μ0, H1:μ>μ0。另外,對于使用兩種不同的設(shè)定而得出的不一致的結(jié)果應(yīng)如何解釋,學(xué)生一般也覺得較難理解。
筆者運用了結(jié)合對特別設(shè)計的實例進行深入分析和應(yīng)用統(tǒng)計分析軟件SPSS輔助教學(xué)的方法來解決這一難題,取得了良好的效果。
一、運用實際例子深入剖析原理
在講了單尾檢驗的概念之后,給出如下例子。
例1. 一個汽車輪胎制造廠商聲稱,該廠一等品輪胎的平均壽命在一定的汽車重量和正常行駛條件下大于25000公里。而某批發(fā)商提出,如果使用隨機樣本的檢驗結(jié)果能充分支持該廠商的說法,他將購買大批這種輪胎。對一個由15個輪胎組成的隨機樣本作了試驗,得到的輪胎壽命(公里)分別為:24500、27230、21900、28900、32500、23200、25950、26620、21060、30500、31900、29200、27890、22530、24100。假定輪胎壽命近似服從正態(tài)分布,試問能否從這些數(shù)據(jù)做出結(jié)論:該廠商的產(chǎn)品同他所說的標(biāo)準(zhǔn)相符?(顯著性水平α=0.05)
首先讓學(xué)生試做這一例子。為了便于計算,給出樣本均值=26532和樣本標(biāo)準(zhǔn)差=3627。
試做的結(jié)果,大家的做法大致可歸納為兩種。
第一種,做出如下假設(shè):
H0:μ≤25000 , H1:μ>25000。
應(yīng)用t-檢驗,在這種假設(shè)下,拒絕域為T≥t0.05(14)=1.761,而實際計算的T值為:T=1.636;因而,結(jié)論是不拒絕H0。
第二種,做出如下假設(shè):
H0:μ≥25000 ,H1:μ<25000 。
在這種假設(shè)下,拒絕域為T≤-t0.05(14)=-1.761,實際的T值同樣為1.636;因而,結(jié)論是不拒絕H0。
接下來,讓學(xué)生思考:如何解釋這兩種看起來“矛盾”的結(jié)論?在討論中引導(dǎo)學(xué)生認(rèn)識這樣一點:由于這兩種做法的結(jié)果都是不拒絕H0,因而兩者都有可能犯第二類錯誤(即“取偽錯誤”),而且第二類錯誤的概率通常比第一類錯誤(棄真錯誤)的概率大,并且難以事先控制;從這個角度看,我們并沒有得出完全矛盾的結(jié)論。
至此,大家很自然就會提出:到底能否判斷哪種作法才是“對”的?實際中我們應(yīng)如何在兩種不同的假設(shè)中做出選擇?
在對這些問題的討論中,應(yīng)引導(dǎo)學(xué)生認(rèn)識選擇假設(shè)的一般原則是“將‘有很高可靠度才愿意接受’的結(jié)論放到H1”。原因在于,當(dāng)拒絕H0(接受H1)時,犯錯誤的概率被控制在α(即顯著性水平,通常是很小的數(shù),如,0.05)之內(nèi),即很有把握據(jù)此做出正確決策。但當(dāng)不拒絕H0(實際決策則為接受H0)時,犯錯誤的概率通常較大且難以確定,即并非很有把握據(jù)此做出正確決策。
因此,最后應(yīng)指出的是,選擇哪種假設(shè)歸結(jié)為一個“立場”問題(在本例中,即:是站在“買家”還是“賣家”的立場)。對于“買家”而言,他們會選擇第一種假設(shè)方式;因為他們的想法是:要很有把握我才愿意購買這種輪胎。而對于“賣家”而言,他們愿意選擇第二種假設(shè)方式;因為他們認(rèn)為:你要很有把握才說我的輪胎質(zhì)量不行。
二、運用SPSS加深對問題的理解
由上所述,可以看出,“買家”與“賣家”存在一個“矛盾域”,即如果T值落在區(qū)間(-1.761,1.761)之中,則雙方會有矛盾的結(jié)論。(如果T值不小于1.761,“買家”也會認(rèn)為輪胎質(zhì)量不錯,而如果T值不大于-1.761,“賣家”也不得不承認(rèn)質(zhì)量不行。)
通過增大樣本容量n,可緩解雙方的矛盾。從“矛盾域”的范圍來看,若n不是15而是20,則存在矛盾的區(qū)間變?yōu)椋ǎ?.729,1.729);若n為30,則區(qū)間變?yōu)椋ǎ?.699,1.699)。而n的增大對緩解雙方矛盾的更主要作用體現(xiàn)在它使實際T值的絕對值增大(T值與n的平方根成正比)。兩個不同容量的樣本,即使其均值和標(biāo)準(zhǔn)差都相同,其實際T值也不同,從而可能導(dǎo)致不同的檢驗結(jié)論。
筆者運用統(tǒng)計分析軟件SPSS設(shè)計出第二個例子,其樣本容量n=20,而樣本均值、標(biāo)準(zhǔn)差都與例1相同。通過使用SPSS對這兩個例子進行對比分析,使學(xué)生充分認(rèn)識樣本容量在單尾檢驗中扮演的角色,從而更深入理解單尾檢驗的原理。
由于兩個例子中的樣本均值都大于檢驗值(25000),故第二種假設(shè)的檢驗結(jié)果必然都是不拒絕H0。下面我們對第一種假設(shè)進行分析。
運用SPSS進行t-檢驗的步驟為:
菜單操作:Analyze→Compare Means→One-Sample T Test→把要檢驗的變量選入變量框→在檢驗值框中輸入25000。
結(jié)果分析:例1的運行結(jié)果為:T值=1.636,Sig.(2-tailed)=0.124。
SPSS的Sig.值即通常說的p-值,應(yīng)注意的是,由于系統(tǒng)中的Sig.值為雙尾的,故在做單尾檢驗時,應(yīng)取該值的一半作為單尾的p-值。因而,在這一例子中,p-值為0.062;按照當(dāng)p-值小于α值(在本例中為0.05)時拒絕H0的原則,檢驗結(jié)論為不拒絕H0。
例2. 在例1的基礎(chǔ)上,再隨機抽取5個輪胎,其壽命(公里)分別為:29720、24430、25445、21532、31533。以20個輪胎為樣本進行檢驗。(α=0.05)
用SPSS對例2進行分析,運行結(jié)果為:
T值=1.889;Sig.(2-tailed)=0.074。即,在例2中,單尾的p-值為0.037,故檢驗結(jié)論為拒絕H0。也就是說,接受輪胎平均壽命大于25000公里的結(jié)論。
注意到例2中的樣本均值=26532,樣本標(biāo)準(zhǔn)差=3627,與例1完全相同。但由于n的不同,導(dǎo)致T值和p-值都不相同,結(jié)論也完全不同。由此,可以看到n的增大對“買家”與“賣家”的矛盾有緩解作用,我們還可以將此與日常生活中的相應(yīng)情形聯(lián)系起來理解——“你如果還不相信,就再多試幾次嘛”。
這樣的統(tǒng)計分析軟件演示不但使學(xué)生更深入地理解了假設(shè)檢驗的原理,而且也理解了樣本量在統(tǒng)計分析中的作用和重要性。
參考文獻:
[1]陳秀虎,楊敏,白厚義.單尾假設(shè)檢驗假設(shè)設(shè)置的探討[J].統(tǒng)計教育.2007(2):8-9.
[2]鐘路.對參數(shù)單尾假設(shè)檢驗中存在的問題的探討[J].統(tǒng)計與決策.2004(11):27-28.
[3](美)戴維 R.安德森 等 著.張建華 等 譯.商務(wù)與經(jīng)濟統(tǒng)計(第11版)[M].北京:機械工業(yè)出版社.2012.