詹曉琳,沈薇薇
顯著性假設(shè)檢驗(yàn)中原假設(shè)的建立
詹曉琳,沈薇薇
(上海第二工業(yè)大學(xué)理學(xué)院,上海 201209)
從假設(shè)檢驗(yàn)的基本原理出發(fā),從雙側(cè)檢驗(yàn)入手,得到了雙側(cè)檢驗(yàn)原假設(shè)的兩個(gè)建立原則,并將該原則用于單側(cè)檢驗(yàn),從而解決了單側(cè)假設(shè)檢驗(yàn)中原假設(shè)的建立問題。
假設(shè)檢驗(yàn);原假設(shè);單側(cè)假設(shè);雙側(cè)假設(shè)
假設(shè)檢驗(yàn)是統(tǒng)計(jì)推斷的重要內(nèi)容。關(guān)于參數(shù)的假設(shè)檢驗(yàn)是一種應(yīng)用非常廣泛的統(tǒng)計(jì)推斷方法。它是對(duì)總體參數(shù)的取值給出某種假設(shè),然后根據(jù)樣本的信息來判斷所做假設(shè)是否成立,最后作出決策的一種推斷方法。目前,該方法應(yīng)用廣泛。國內(nèi)外各種科學(xué)領(lǐng)域,如生物、醫(yī)學(xué)、化學(xué)、數(shù)學(xué)等都需要進(jìn)行適當(dāng)?shù)募僭O(shè)檢驗(yàn)來證明得到的結(jié)論。各種產(chǎn)品檢驗(yàn)、地質(zhì)探測、抽樣調(diào)查等也都離不開假設(shè)檢驗(yàn)。
假設(shè)檢驗(yàn)的步驟一般分四步:(1) 根據(jù)實(shí)際問題的要求提出原假設(shè)H0和備擇假設(shè)H1;(2) 根據(jù)問題條件構(gòu)造檢驗(yàn)統(tǒng)計(jì)量;(3) 選取適當(dāng)?shù)娘@著性水平,也就是α值,確定H0的拒絕域;(4) 根據(jù)樣本觀測值進(jìn)行判斷是否拒絕H0。在實(shí)際工作中,建立原假設(shè)H0和備擇假設(shè)H1是第一步。在樣本容量和顯著性水平α一定的情況下,原假設(shè)會(huì)對(duì)結(jié)論產(chǎn)生影響,在某些情況下甚至?xí)玫酵耆喾吹慕Y(jié)論,因此,原假設(shè)和備擇假設(shè)的建立尤為重要,特別對(duì)于單側(cè)假設(shè)檢驗(yàn),問題顯得更為明顯。
不可否認(rèn),假設(shè)檢驗(yàn)的基本思想就是要尋找充分的證據(jù)來推翻原假設(shè),因此原假設(shè)的建立本身帶有一種主觀色彩,往往是基于研究者本人的某種信念和偏愛。所以,在面對(duì)同一問題時(shí),由于不同的研究者有不同的研究目的,即使針對(duì)同一問題也可能提出截然相反的原假設(shè)和備擇假設(shè)。但這里仍需要一些原則來幫助研究者如何根據(jù)研究目的來正確地建立原假設(shè)。關(guān)于原假設(shè)的建立原則,在很多文獻(xiàn)中都有過討論[1-4],但本文認(rèn)為在這些文獻(xiàn)中所提原則不夠深刻,不夠全面,缺乏操作性。
因此,本文對(duì)該問題進(jìn)行了分析,探討了假設(shè)檢驗(yàn)中原假設(shè)的建立問題。同時(shí),本文得到的原假設(shè)的建立原則,同樣適用于沒有任何先驗(yàn)經(jīng)驗(yàn),完全客觀的情況下原假設(shè)的選取。
小概率事件原理應(yīng)用廣泛,是統(tǒng)計(jì)學(xué)中假設(shè)檢驗(yàn)的理論依據(jù),也是統(tǒng)計(jì)學(xué)存在和發(fā)展的理論基礎(chǔ)。所謂小概率原理,究其本質(zhì)就是“小概率事件在一次實(shí)驗(yàn)中幾乎不可能發(fā)生”。假設(shè)檢驗(yàn)的原理就是基于小概率原理的“概率性質(zhì)的反證法”,即假設(shè)H0為檢驗(yàn)中的原假設(shè),是正確的,在此條件下構(gòu)造事件A,該事件是一個(gè)小概率事件,現(xiàn)在進(jìn)行一次試驗(yàn),如果實(shí)驗(yàn)結(jié)果是小概率事件A發(fā)生了,那么這與小概率事件原理“小概率事件在一次試驗(yàn)中幾乎不可能發(fā)生”相矛盾,因此這就表明“原假設(shè)H0正確”是錯(cuò)誤的,有理由拒絕H0,反之則只能接受H0。為什么我們可以有理由拒絕H0,是因?yàn)槿绻鸋0是對(duì)的,則A一定是小概率事件,既然A是小概率事件,在做一次試驗(yàn)時(shí)它就不該發(fā)生,現(xiàn)在僅做一次試驗(yàn),事件A就發(fā)生了,這與小概率事件原理相矛盾,從而拒絕H0。
利用小概率事件原理解決問題,我們可能會(huì)犯錯(cuò)誤。在原假設(shè)H0為真的情況下,統(tǒng)計(jì)量落入拒絕域從而得到了拒絕H0的結(jié)果,這就是假設(shè)檢驗(yàn)中可能犯的第一類錯(cuò)誤,稱為“棄真錯(cuò)誤”。顯而易見,犯該錯(cuò)誤的概率就是統(tǒng)計(jì)量落在拒絕域的概率α。另一類,在原假設(shè)H0錯(cuò)誤時(shí),而統(tǒng)計(jì)量落在接受域從而得到了接受H0的結(jié)果,這時(shí)犯了第二類錯(cuò)誤,稱作“取偽錯(cuò)誤”。設(shè)犯這一錯(cuò)誤的概率為β。需要注意的是,當(dāng)H1成立時(shí),普遍情況下并不知道檢驗(yàn)統(tǒng)計(jì)量的確切分布是什么,即使知道分布類型,也不知道分布中的參數(shù)到底取什么值,因此很難簡單地計(jì)算β的值到底有多大。
解決問題時(shí),我們當(dāng)然希望α,β越小越好,這樣結(jié)論不容易出錯(cuò)。但經(jīng)過一系列的深入計(jì)算研究,表明在固定的樣本容量下,當(dāng)α增加時(shí),β減??;而α減小時(shí),β卻增大。只有在無限增大樣本容量的情況下,才有可能實(shí)現(xiàn)α,β同時(shí)變小,而這在實(shí)際操作中是不可能的,同時(shí)這樣做也已經(jīng)失去了假設(shè)檢驗(yàn)的意義。NEYMAN和PEARSON提出的原則(簡稱奈曼皮爾遜原則)使得解決問題得到了簡化,即控制犯第一類錯(cuò)誤的最大概率α,在此條件下,盡量使犯第二類錯(cuò)誤的概率β減小。進(jìn)行假設(shè)檢驗(yàn)時(shí),只對(duì)可以人為控制的第一類錯(cuò)誤概率α加以限制,而忽略無法控制的第二錯(cuò)誤概率β。稱這種統(tǒng)計(jì)假設(shè)檢驗(yàn)問題為顯著性檢驗(yàn),并將犯第一類錯(cuò)誤的最大概率α稱為假設(shè)檢驗(yàn)的顯著性水平。本文討論的原則均在顯著性假設(shè)檢驗(yàn)的范圍內(nèi)。
雙側(cè)檢驗(yàn)的假設(shè)形式:一般根據(jù)實(shí)際問題提出原假設(shè)H0和備擇假設(shè)H1,參數(shù)θ的假設(shè)檢驗(yàn)原假設(shè)H0用參數(shù)θ的等式表示,相應(yīng)的備擇假設(shè)用θ的不等式表示。比如一個(gè)正態(tài)總體均值的檢驗(yàn)H0:θ=θ0,H1:θ≠θ0;兩個(gè)正態(tài)總體均值差的檢驗(yàn)H0:θ1?θ2=θ0,H1:θ1?θ2≠θ0。為什么我們要把帶有等號(hào)的參數(shù)形式作為原假設(shè)H0,為什么H0不能取θ≠θ0和θ1?θ2≠θ0呢?從表面上看這個(gè)提法無可非議,因?yàn)閮煞N提法實(shí)質(zhì)上看起來只是表述方式不同而已,但事實(shí)上,對(duì)于原假設(shè)我們是需要根據(jù)某些原則建立的。本文將原則總結(jié)為兩個(gè):保護(hù)原則和拒絕原則。以下通過實(shí)例具體說明這兩個(gè)原則。
例1 甲、乙兩廠生產(chǎn)同一種產(chǎn)品,其質(zhì)量指標(biāo)分別服從正態(tài)分布N(μ1,σ2)和N(μ2, σ2),現(xiàn)在從該廠分別抽出若干件產(chǎn)品測得其指標(biāo)值如下(α=0.05):
甲廠 2.74 ,2.75 ,2.72 ,2.69(X1,???,X4)
乙廠 2.75 ,2.78 ,2.74 ,2.76 ,2.72(Y1,???,Y5)
問兩廠的產(chǎn)品質(zhì)量是否存在顯著差異。
分析:代入樣本數(shù)據(jù)得X=2.725,Y=2.75。因計(jì)算得到Y(jié)>X,從抽樣樣本看兩廠產(chǎn)品質(zhì)量確實(shí)存在一定差異,但這還不能令人信服,因?yàn)檫@個(gè)差距也可以是因?yàn)槌闃拥碾S機(jī)性帶來的隨機(jī)誤差,因此它并不能作為有力的證據(jù)。一方面,統(tǒng)計(jì)推斷的任務(wù)就是去判斷這個(gè)差異到底是隨機(jī)誤差還是兩個(gè)總體確實(shí)存在差異而帶來的不同。只有甲乙兩廠之間的樣本差異超出某一個(gè)范圍時(shí),我們才相信他們之間確實(shí)存在不是隨機(jī)誤差帶來的差異。另一方面,從假設(shè)檢驗(yàn)的原理來看,否定原假設(shè)的概率只有α大小,接受原假設(shè)的概率有1?α,所以不會(huì)輕易否定原假設(shè)。結(jié)合以上兩方面,本例中,因?yàn)椴荒茌p易否定的是甲乙兩廠無差異,所以原假設(shè)應(yīng)該是H0:μ1=μ2。將以上分析總結(jié)為一個(gè)原則,可以稱之為“保護(hù)原則”:根據(jù)研究問題的目的,將需要被保護(hù)的結(jié)論作為原假設(shè)即可。
同時(shí),可以換一個(gè)角度考慮這個(gè)問題。NEYMAN和PEARSON提出的“在控制犯第一類錯(cuò)誤的最大概率α的條件下,盡量使犯第二類錯(cuò)誤的概率β減小”原則在解決問題時(shí)只限制α的大小而忽略β,這實(shí)際上隱含了一個(gè)原則:在假設(shè)檢驗(yàn)時(shí)更傾向拒絕H0而不是接受。這是因?yàn)槿绻芙^了H0,就有1-α把握相信H0為偽,即只有α的概率大小犯錯(cuò)誤。另一方面,從某種意義上說,任何一個(gè)檢驗(yàn)都可以理解為顯著性檢驗(yàn),但顯著性檢驗(yàn)這個(gè)名詞最常用于有關(guān)某種效應(yīng)或者差異是否存在的那種問題,且主觀上是希望該效應(yīng)存在的,從實(shí)際上說就是因?yàn)槭孪纫呀?jīng)對(duì)H0產(chǎn)生了懷疑而純粹為了推翻或拒絕它。所以,可以簡單地把“顯著性檢驗(yàn)”理解為“希望原假設(shè)被否定的那種檢驗(yàn)”。如果將這一思想總結(jié)為一個(gè)原則,可以簡稱“拒絕原則”。根據(jù)這一原則,一般“將希望得到的結(jié)果的對(duì)立面作為原假設(shè)”建立原假設(shè)。本例中,因?yàn)樗闃颖揪挡⒉坏?,因此,我們已?jīng)對(duì)兩廠產(chǎn)品質(zhì)量相等產(chǎn)生懷疑,希望看到“兩廠質(zhì)量存在顯著差異”這個(gè)結(jié)果,于是將“兩廠質(zhì)量存在顯著差異”的對(duì)立面“兩廠產(chǎn)品質(zhì)量并無顯著差異”(μ1=μ2)作為原假設(shè)H0。
不同于雙側(cè)檢驗(yàn),由于單側(cè)假設(shè)檢驗(yàn)的形式是大于等于號(hào)或者小于等于號(hào),這就決定了它的一個(gè)特點(diǎn),不確定性。同樣的問題,可以有兩種不同的假設(shè),而其結(jié)論也會(huì)因此不同。
因?yàn)榧僭O(shè)檢驗(yàn)中雙側(cè)檢驗(yàn)和單側(cè)檢驗(yàn)在原理上是一致的,所以可以將上文總結(jié)的兩個(gè)原則同樣應(yīng)用于單側(cè)檢驗(yàn)。下面通過具體實(shí)例詳細(xì)分析。
例2:已知某農(nóng)場生產(chǎn)的豌豆籽粒重量(mg)服從正態(tài)分布N(μ,42),μ≤377.2 mg。為了提高豌豆產(chǎn)量,農(nóng)場采用了新的栽培方法,并從中隨機(jī)地抽取了9粒,測得樣本平均值μ=379.2 mg,假設(shè)在新方法下總體標(biāo)準(zhǔn)差仍為4,問用新的栽培方法生產(chǎn)的豌豆籽粒重量是否有顯著提高(取顯著性水平α=0.05)?
分析:這是一個(gè)關(guān)于單個(gè)正態(tài)總體均值的單側(cè)檢驗(yàn)問題,可以設(shè)立的兩種假設(shè)分別是1)H0:μ≤377.2;2)H0:μ≥377.2。
首先,可根據(jù)保護(hù)原則,原假設(shè)應(yīng)該是過去經(jīng)驗(yàn)與已獲得的信息的總結(jié),是一個(gè)需要加以保護(hù)的假設(shè),沒有充足的理由就不能輕易否定它。只有當(dāng)新栽培方法種的豌豆的質(zhì)量與過去質(zhì)量之差高過計(jì)算得出的隨機(jī)誤差區(qū)間,才能承認(rèn)它確實(shí)有顯著提高,否則只能認(rèn)為是改變?cè)耘喾椒ê蟮馁|(zhì)量提高是不可避免的誤差帶來的。因此,基于這一點(diǎn)應(yīng)將“μ≤377.2”作為原假設(shè)。經(jīng)過計(jì)算可以得到X?377.2≤μα?σ/n=1.645? 4/3=2.19,此數(shù)據(jù)表明,新栽培方法的重量與原方法的重量之間的誤差范圍為(-∞,2.19],只有新舊的重量之差高于原重量超過2.19,才能承認(rèn)新方法是有效的。
如果根據(jù)拒絕原則,我們可以簡單的把“顯著性檢驗(yàn)”理解為“希望原假設(shè)被否定的那種檢驗(yàn)”。這里采用新的栽培方法是為了提高豌豆籽粒重量,“μ>377.2”是我們通過檢驗(yàn)希望得到的結(jié)論,那么相對(duì)的就把“μ>377.2”這個(gè)結(jié)論的對(duì)立面“μ≤377.2”(希望看到它被否定)作為原假設(shè)。
單側(cè)檢驗(yàn)較之雙側(cè)檢驗(yàn)在運(yùn)用建立原則時(shí)需要考慮問題的背景,即根據(jù)不同背景建立原假設(shè)才能得到正確的結(jié)論。有時(shí)保護(hù)原則可以更方便地建立原假設(shè);有時(shí)拒絕原則可以更有利于解釋原假設(shè)的建立。通過以下兩例具體說明:例3采用保護(hù)原則建立原假設(shè);例4采用拒絕原則建立原假設(shè)。
例3:假定某工廠生產(chǎn)的一種產(chǎn)品,其質(zhì)量指標(biāo)服從正態(tài)分布N(θ, σ2),且假定σ2已知。θ為平均質(zhì)量指標(biāo),設(shè)θ越大質(zhì)量越好,而θ0為達(dá)到優(yōu)級(jí)的界限。某商店經(jīng)常從該廠進(jìn)貨,那么商店應(yīng)該如何選擇原假設(shè)進(jìn)行檢驗(yàn)?zāi)兀?/p>
分析:顯然該題可建立這樣兩種原假設(shè):1)H0:θ≥θ0;2)H0:θ≤θ0。遇到此類問題,為了確保結(jié)論的可靠性,詳細(xì)地了解背景是非常有必要的。
首先分析第一種原假設(shè):如果過去較長一段時(shí)期的記錄,商店相信該廠產(chǎn)品質(zhì)量總的說是好的,當(dāng)然這不排斥偶而也出現(xiàn)較差的貨批,那么可以根據(jù)保護(hù)原則把θ≥θ0作為原假設(shè)并選定一定較低的檢驗(yàn)水平α,例如α=0.05或者0.01。這樣做對(duì)工廠有利,保證了優(yōu)質(zhì)的貨批(即θ≥θ0的批)只以很低的概率α被拒收,而非優(yōu)質(zhì)的貨批仍能以不是很小的概率被接受。從商店角度考慮,這樣設(shè)立也并非不利,因?yàn)樵搹S產(chǎn)品質(zhì)量一貫表現(xiàn)好,故檢驗(yàn)可放寬些,即要有很強(qiáng)的證據(jù)才能否定θ≥θ0。反之第二種原假設(shè):若以往一段時(shí)期的記錄表明,工廠產(chǎn)品質(zhì)量并不很好,根據(jù)保護(hù)原則,這樣商店就應(yīng)該堅(jiān)持以θ≤θ0作為原假設(shè),并選定較低的檢驗(yàn)水平α。這樣做表明,商店要求有較強(qiáng)的證據(jù)(反應(yīng)在具體數(shù)據(jù)上)才能相信這批產(chǎn)品質(zhì)量為優(yōu),好比一個(gè)人一向表現(xiàn)不好,就必須有較為顯著的好表現(xiàn)才能讓人相信他確實(shí)有進(jìn)步。這樣做就達(dá)到了至少把100(1?α)%的非優(yōu)貨批拒之門外的目的。
例4 某工廠生產(chǎn)金屬絲,產(chǎn)品指標(biāo)為折斷力。折斷力的方差被用作工廠精度的表征:方差越小,表明精度越高。以往工廠一直把方差保持在64及以下。最近從一批產(chǎn)品中抽取10根做折斷力試驗(yàn),測得的結(jié)果(單位:千克)如下:578, 572, 570, 568, 572, 570, 572, 596, 584, 570。由上述樣本數(shù)據(jù)算得:x=572.2,S2=75.74(α=0.05)。
為此,廠方懷疑金屬絲折斷力的方差是否變大了,如確實(shí)增大了,表明生產(chǎn)精度不如以前了,于是就需要對(duì)生產(chǎn)流程做一番檢查,以發(fā)現(xiàn)生產(chǎn)環(huán)節(jié)中存在的問題。
分析:初步觀題會(huì)認(rèn)為這題與前一題類似也是單側(cè)產(chǎn)品檢驗(yàn)問題,但仔細(xì)讀完全題就會(huì)發(fā)現(xiàn)最后一段話給我們解題帶來了一些啟示。對(duì)于這類問題,本文建議使用拒絕原則來考慮原假設(shè)。從題中不難發(fā)現(xiàn),檢驗(yàn)結(jié)果非常重要,一旦做出確實(shí)變大的結(jié)論就必須對(duì)生產(chǎn)流程做檢查,防止精度降低,而因?yàn)闄z測的數(shù)據(jù)(方差)確實(shí)大于了標(biāo)準(zhǔn),因此不得不懷疑生產(chǎn)精度不如從前,而作為廠方看到檢測結(jié)果自然是擔(dān)心的,希望找出方差變大的原因。所以將“希望拒絕的結(jié)果”作為原假設(shè)在此題中就理解為將“方差并未變大”作為原假設(shè),轉(zhuǎn)化成假設(shè)檢驗(yàn)的數(shù)學(xué)符號(hào)可建立原假設(shè):H:σ2≤64。
0
本文總結(jié)得到的保護(hù)原則和拒絕原則使得假設(shè)檢驗(yàn)中原假設(shè)的建立問題變得簡單、清晰、易于操作。這兩個(gè)原則只是考慮的出發(fā)點(diǎn)不同,但所得結(jié)論相同,所以兩個(gè)原則并不矛盾,而是互為補(bǔ)充?;旧纤械募僭O(shè)檢驗(yàn)都可以用原假設(shè)建立的保護(hù)原則,但運(yùn)用拒絕原則時(shí),對(duì)題目背景條件要求較高。對(duì)于雙側(cè)假設(shè)檢驗(yàn),其原假設(shè)的建立相對(duì)明確;對(duì)于單側(cè)假設(shè)檢驗(yàn),其原假設(shè)的建立必須基于題目的背景和正確的原則才能做出符合研究目的的假設(shè)的檢驗(yàn)。
同時(shí),對(duì)于假設(shè)檢驗(yàn)的結(jié)果,我們應(yīng)該知道,統(tǒng)計(jì)上的顯著差異并不一定有現(xiàn)實(shí)的重要性[5]。因?yàn)榻y(tǒng)計(jì)上的顯著差異是指:在給定的水平上,差異已不能用隨機(jī)誤差解釋,所以,統(tǒng)計(jì)上顯著的差異不一定意味著數(shù)據(jù)的差異確實(shí)很大。
[1] 徐大申,李國東, 臧鴻雁.假設(shè)檢驗(yàn)中的保護(hù)原則[J]. 北華大學(xué)學(xué)報(bào):自然科學(xué)版, 2004,5(5):395-397.
[2] 任永泰.關(guān)于假設(shè)檢驗(yàn)中原假設(shè)的提出[J]. 大學(xué)數(shù)學(xué), 2005, 21(5):121-124.
[3] 呂亞芹.對(duì)假設(shè)檢驗(yàn)的幾點(diǎn)思考[J]. 北京建筑工程學(xué)院學(xué)報(bào), 2006, 22(2):60-62.
[4] 李曉紅.假設(shè)檢驗(yàn)中原假設(shè)的選取問題[J]. 平原大學(xué)學(xué)報(bào), 2006, 23(6):122-124.
[5] 陳希孺.概率論與數(shù)理統(tǒng)計(jì)[M]. 合肥:中國科學(xué)技術(shù)大學(xué)出版社,1996.
The Establishing of the Original Hypothesis in Significant Hypothesis Test
ZHAN Xiao-lin,SHEN Wei-wei
(School of Science, Shanghai Second Polytechnic University, Shanghai 201209, P. R.China)
The basic theory of hypothesis testing is introduced and two-sided hypothesis testing is discussed. Two principles to build original hypothesis are obtained. By being applied with these two principles, the problem of how to set up a one-sided hypothesis testing is addressed.
hypothesis test; original hypothesis; one-sided original hypothesis;two-sided original hypothesis
O212
A
1001-4543(2010)02-0156-04
2009-10-27;
2010-01-14
詹曉琳(1978- ),女,安徽蚌埠人,講師,主要研究領(lǐng)域是概率統(tǒng)計(jì),電子郵件:xlzhan@sf.sspu.cn