朱 海
(重慶工商大學(xué) 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,重慶 400067)
近年來,有很多國內(nèi)外學(xué)者都研究了區(qū)間估計(jì)與假設(shè)檢驗(yàn)的關(guān)系.學(xué)者吳純[1]通過證明提到:“一般情況下,利用假設(shè)檢驗(yàn)可以建立區(qū)間估計(jì),反之亦然”、“假設(shè)檢驗(yàn)和區(qū)間估計(jì)的結(jié)果在解釋上可以有差別”等結(jié)論,告誡大家統(tǒng)計(jì)學(xué)上的結(jié)論一定要注意其實(shí)質(zhì),不能只停留在問題表面;學(xué)者王建華[2]通過論證,糾正了“區(qū)間估計(jì)和假設(shè)檢驗(yàn)是統(tǒng)一的,是一個(gè)問題的兩個(gè)方面”這個(gè)似是而非的說法,說明了區(qū)間估計(jì)和假設(shè)檢驗(yàn)既有聯(lián)系,又有區(qū)別;也有學(xué)者通過“順推法”和“反推法”[3]進(jìn)行區(qū)間估計(jì)和假設(shè)檢驗(yàn)關(guān)系的研究,最終確定了兩者的區(qū)別和聯(lián)系.現(xiàn)在,區(qū)間估計(jì)和假設(shè)檢驗(yàn)的應(yīng)用極為廣泛,去年國外一篇論文發(fā)表出來,論文題目為:In‐fluence of multiple hypothesis testing on reproducibility in neuroimaging research: A simulation study and Python-based software[4],講的是神經(jīng)影像研究中多重假設(shè)檢驗(yàn)對再現(xiàn)性的影響,整篇文章圍繞假設(shè)檢驗(yàn)進(jìn)行了一系列模擬分析,這從側(cè)面說明了假設(shè)檢驗(yàn)應(yīng)用范圍之大.
本文對區(qū)間估計(jì)和假設(shè)檢驗(yàn)的關(guān)系探究源自教材《概率論與數(shù)理統(tǒng)計(jì)教程第二版》(茆詩松,高等教育出版社,2011 年)中數(shù)理統(tǒng)計(jì)部分,該書在介紹參數(shù)估計(jì)和假設(shè)檢驗(yàn)時(shí),很多知識(shí)點(diǎn)覆蓋面很廣,但都只是單一的指出基本概念,至于其中多種統(tǒng)計(jì)推斷方法是否有聯(lián)系并未做過多介紹,比如在談及區(qū)間估計(jì)和假設(shè)檢驗(yàn)的關(guān)系之時(shí),所用篇幅較少,只是談及了區(qū)間估計(jì)時(shí)的樞軸量和假設(shè)檢驗(yàn)時(shí)的檢驗(yàn)統(tǒng)計(jì)量相同并非偶然,當(dāng)然,樞軸量和檢驗(yàn)統(tǒng)計(jì)量的相同的確很大程度的說明了區(qū)間估計(jì)和假設(shè)檢驗(yàn)的關(guān)系匪淺.但是,區(qū)間估計(jì)和假設(shè)檢驗(yàn)關(guān)系僅僅如此嗎?區(qū)間估計(jì)中的置信水平和假設(shè)檢驗(yàn)中的顯著性水平有聯(lián)系嗎?區(qū)間估計(jì)和假設(shè)檢驗(yàn)方法選擇有啥參照嗎?本文在此基礎(chǔ)上,大篇幅地探究了兩者的關(guān)系,包括區(qū)間估計(jì)和假設(shè)檢驗(yàn)的基本概念、應(yīng)用方面、優(yōu)劣方面、聯(lián)系及不同以及相關(guān)問題的深度剖析,都進(jìn)行了總結(jié)和討論,并通過一些例子對一些問題進(jìn)行舉例論證,并查閱了一些相關(guān)書籍和文獻(xiàn),整理結(jié)論并討論,使得大家對這兩種統(tǒng)計(jì)推斷方法更加熟悉和深層次了解,一定程度上,能夠幫助讀者在處理相關(guān)問題時(shí)避免一些錯(cuò)誤.
區(qū)間估計(jì),顧名思義,是包含一個(gè)區(qū)間的估計(jì),這個(gè)區(qū)間是用來度量一個(gè)點(diǎn)估計(jì)的精度.參數(shù)的點(diǎn)估計(jì)經(jīng)計(jì)算得到了一個(gè)具體的數(shù)值,這樣一個(gè)具體的數(shù)值方便計(jì)算和使用.但計(jì)算出來的點(diǎn)估計(jì)精度如何,點(diǎn)估計(jì)本身并不能說明,需要依靠對應(yīng)的分布去反映,現(xiàn)實(shí)中,我們通常用一個(gè)區(qū)間去覆蓋已知的點(diǎn)估計(jì),也可以說求得點(diǎn)估計(jì)的取值范圍,它應(yīng)該是一個(gè)區(qū)間,下面給出具體定義[5]:
設(shè)θ是總體的一個(gè)參數(shù),x1,x2,…,xn是樣本,求得統(tǒng)計(jì)量θL(x1,x2,…,xn),θU(x1,x2,…,xn),使得θL<θU,得到樣本觀測值之后,便把θ估計(jì)在區(qū)間[θL,θU]內(nèi) . 由于樣本具有隨機(jī)性,區(qū)間 [θL,θU]覆蓋參數(shù)θ的可能性并不確定,這里通常需要我們?nèi)藶榻o定一個(gè)概率,誠然,我們肯定想?yún)^(qū)間覆蓋θ的概率P越大越好,但是這必然會(huì)導(dǎo)致區(qū)間長度增大,這里把區(qū)間[θL,θU]覆蓋住θ的概率給定為 1 ?α,則有Pθ( )θL≤θ≤θU≥ 1 ?α,則 稱隨機(jī)區(qū)間[θL,θU]為θ的置信水平為 1 ?α的置信區(qū)間,θL和θU分別稱為θ的(雙側(cè))置信下限和置信上限.
通常,要計(jì)算置信區(qū)間,一個(gè)最常用的方法就是樞軸量法[5].對于這種方法,尋找置信區(qū)間最關(guān)鍵的步驟就是要找準(zhǔn)未知參數(shù)所對應(yīng)的合適的樞軸量,這里記G為樞軸量,構(gòu)造一個(gè)樣本和未知參數(shù)θ的函數(shù)G(x1,…,xn,θ)使得G的分布不依賴于未知參數(shù)θ.另外樞軸量的尋找一般從θ的點(diǎn)估計(jì)入手.
區(qū)間估計(jì)適用范圍:在參數(shù)的點(diǎn)估計(jì)不易計(jì)算,或者探究點(diǎn)估計(jì)精度如何時(shí),區(qū)間估計(jì)往往能起到至關(guān)重要的作用,它能夠指定概率(即置信水平)求得相應(yīng)比較精確的區(qū)間進(jìn)行估計(jì),這些都是點(diǎn)估計(jì)無法做到的.例如眾多分布中最常用的雙參數(shù)正態(tài)分布,記正態(tài)總體為N(μ,σ2),在一個(gè)參數(shù)已知,另一個(gè)參數(shù)未知時(shí),都可以求得未知參數(shù)對應(yīng)的置信區(qū)間,得到對應(yīng)的區(qū)間估計(jì).
所謂假設(shè)檢驗(yàn),顧名思義,就是一個(gè)檢驗(yàn)假設(shè)是否成立的過程,又稱統(tǒng)計(jì)假設(shè)檢驗(yàn).它是用來判斷樣本與樣本之間、樣本與總體之間的差異到底是由抽樣誤差引起,還是由樣本之間本質(zhì)差異造成的一種統(tǒng)計(jì)推斷方法.假設(shè)檢驗(yàn)有很多方法,顯著性檢驗(yàn)作為一種最常用的假設(shè)檢驗(yàn)方法,其基本原理是先根據(jù)一些非樣本信息對總體某個(gè)參數(shù)做出某種假設(shè),然后通過對抽樣信息的統(tǒng)計(jì)推理,對這個(gè)假設(shè)是否應(yīng)該被拒絕做出判斷.一些常用的假設(shè)檢驗(yàn)方法有Z檢驗(yàn)、T檢驗(yàn)、卡方檢驗(yàn)、F檢驗(yàn)等.一個(gè)很經(jīng)典的假設(shè)檢驗(yàn)問題,例如女士品茶試驗(yàn)[5],女士每次猜對的概率為0.5,10 次都猜中概率為 2?10,很小的概率,幾乎不可能發(fā)生的事件,竟然發(fā)生了,這樣一個(gè)小概率原理,偉大的費(fèi)希爾對這一試驗(yàn)諸多細(xì)節(jié)進(jìn)行研究,最終形成了假設(shè)檢驗(yàn)理論.
ⅰ.建立假設(shè):根據(jù)要求對參數(shù)設(shè)置原假設(shè)H0和備擇假設(shè)H1.如一對假設(shè)為
原假設(shè)有簡單原假設(shè)和復(fù)雜原假設(shè),相應(yīng)的備擇假設(shè)也有簡單備擇假設(shè)和復(fù)雜備擇假設(shè)之分,其界限是考慮到假設(shè)里面θ0和θ1所包含的點(diǎn)的個(gè)數(shù).因而整個(gè)假設(shè)又有雙側(cè)假設(shè)和單側(cè)假設(shè)之分.
ⅱ.選擇檢驗(yàn)統(tǒng)計(jì)量,給出拒絕域形式:記W為檢驗(yàn)的拒絕域,而Wˉ為檢驗(yàn)的接受域.
ⅲ.選擇顯著性水平:一個(gè)是α,稱犯第一類錯(cuò)誤(也稱棄真錯(cuò)誤)的概率;另一個(gè)是β,稱犯第二類錯(cuò)誤(也稱納偽錯(cuò)誤)的概率.
ⅳ.確定拒絕域:根據(jù)假設(shè)單側(cè)或雙側(cè)檢驗(yàn),給出相應(yīng)的拒絕域.
ⅴ.進(jìn)行判斷:通過樣本觀測值,觀察相應(yīng)參數(shù)值是否落在給出的拒絕域內(nèi).
(1)檢驗(yàn)的p值:一個(gè)假設(shè)檢驗(yàn)問題中,利用樣本觀測值能夠作出拒絕原假設(shè)H0的最小顯著性水平.每一個(gè)假設(shè)檢驗(yàn)問題都對應(yīng)一個(gè)確定的p值.
(2)檢驗(yàn)的p值與人們心目中的顯著性水平α進(jìn)行比較可以對假設(shè)檢驗(yàn)做出判斷:
ⅰ.若α≥p,則拒絕原假設(shè).
ⅱ.若α
區(qū)間估計(jì)主要是根據(jù)一個(gè)樣本的觀測數(shù)據(jù)得到參數(shù)的估計(jì)范圍,在這個(gè)范圍內(nèi),參數(shù)落在區(qū)間中的概率已知(一般人為給出),不僅能夠很直觀的檢驗(yàn)對未知參數(shù)所做的點(diǎn)估計(jì)的準(zhǔn)確性,也可以在大樣本的情況下對參數(shù)進(jìn)行估計(jì),所得到的估計(jì)值應(yīng)落于所得到的區(qū)間內(nèi);而假設(shè)檢驗(yàn)首先則主要是對總體參數(shù)做出一個(gè)假設(shè),然后利用樣本信息和相關(guān)檢驗(yàn)統(tǒng)計(jì)量的分布特征去檢驗(yàn)這個(gè)假設(shè),最終做出是否接受原假設(shè)的結(jié)論.如此看來,區(qū)間估計(jì)和假設(shè)檢驗(yàn)在主要功能方面還是有交叉之處,都可以對參數(shù)的準(zhǔn)確性進(jìn)行判定.但要說明的是,假設(shè)檢驗(yàn)是統(tǒng)計(jì)推斷中的一項(xiàng)重要內(nèi)容,它是根據(jù)原有資料作出一個(gè)對總體指標(biāo)的限定,某一隨機(jī)變量是否服從某種概率分布的假設(shè),然后利用樣本數(shù)據(jù),采用合理的統(tǒng)計(jì)方法,計(jì)算出相關(guān)假設(shè)的檢驗(yàn)統(tǒng)計(jì)量,然后依據(jù)小概率事件原理,以較小的風(fēng)險(xiǎn)度去判斷估計(jì)值與總體值是否存在顯著差異,是否應(yīng)當(dāng)接受原假設(shè)的一種檢驗(yàn)方法.但是,在面對樣本指標(biāo)和總體指標(biāo)時(shí),一味地用樣本指標(biāo)去估計(jì)總體指標(biāo),其結(jié)果并非完全可靠,換句話說,對于諸多假設(shè)檢驗(yàn)問題,不同問題具有不同程度上的可靠性,需要我們進(jìn)一步對檢驗(yàn)結(jié)果去加以檢驗(yàn)和論證.通過對問題的檢驗(yàn),對樣本指標(biāo)與總體指標(biāo)之間是否存在差異作出正確的判斷,是否應(yīng)該接受原假設(shè).當(dāng)然,這里也必須明確,進(jìn)行假設(shè)檢驗(yàn)的目的不是驗(yàn)證樣本指標(biāo)本身是否出錯(cuò),而是為了分析樣本指標(biāo)與總體指標(biāo)之間是否存在顯著差異.從這個(gè)實(shí)際意義出發(fā),假設(shè)檢驗(yàn)又稱為顯著性檢驗(yàn),這在統(tǒng)計(jì)學(xué)意義上與區(qū)間估計(jì)有所不同.區(qū)間估計(jì)重在估計(jì),是參數(shù)估計(jì)的一項(xiàng)重要內(nèi)容,它為總體參數(shù)服務(wù),但凡數(shù)理統(tǒng)計(jì)書中,首先總是會(huì)引入統(tǒng)計(jì)量的概念,讓學(xué)者們第一時(shí)間弄懂統(tǒng)計(jì)量的相關(guān)知識(shí),其目的在于對一些深層次問題進(jìn)行統(tǒng)計(jì)推斷,而在實(shí)際生活中,我們往往會(huì)向眾多分布中的未知參數(shù)靠近,這樣一來,區(qū)間估計(jì)出現(xiàn)也不足為奇了.
區(qū)間估計(jì)不僅是統(tǒng)計(jì)推斷中的重要內(nèi)容,也可以應(yīng)用于抽樣推斷.根據(jù)區(qū)間估計(jì)和假設(shè)檢驗(yàn)的定義以及步驟來看,對于這兩種統(tǒng)計(jì)推斷方法,在應(yīng)用領(lǐng)域方向,不僅僅是書本上的理論推理,現(xiàn)實(shí)中也可以運(yùn)用于科學(xué)研究、醫(yī)療衛(wèi)生、金融投資等各個(gè)方面.但是若真要比較兩種方法的用途誰廣泛,還真得分類討論.對于區(qū)間估計(jì)來說,它是一個(gè)非常依賴樣本信息的一種推斷方法,樣本信息包含越全面、越準(zhǔn)確,得到的置信區(qū)間也就越精確,這樣一來,便對研究者提出了要求,如果樣本信息量足夠說明真實(shí)情況,此時(shí)使用區(qū)間估計(jì)便沒什么問題.對于假設(shè)檢驗(yàn)而言,首先在人們拿到一個(gè)假設(shè)檢驗(yàn)時(shí),必須根據(jù)需要設(shè)置一對假設(shè),原假設(shè)H0和備擇假設(shè)H1,然后根據(jù)得到的數(shù)據(jù)信息,對假設(shè)進(jìn)行判斷.然而,假設(shè)檢驗(yàn)人為的確定的假設(shè)必須要避免偏差,否則會(huì)對結(jié)果產(chǎn)生巨大影響,甚至可能導(dǎo)致判斷偏差.假設(shè)檢驗(yàn)一般而言是研究者偏向于拒絕域進(jìn)行統(tǒng)計(jì)推斷方法,由于原假設(shè)與樣本信息無多大關(guān)系,故而假設(shè)檢驗(yàn)對樣本信息的敏感度沒有區(qū)間估計(jì)那般強(qiáng)烈.綜上,區(qū)間估計(jì)和假設(shè)檢驗(yàn)的應(yīng)用各有側(cè)重,當(dāng)研究者所研究的問題需要確切的樣本信息時(shí),這時(shí)候選擇區(qū)間估計(jì)較好;當(dāng)研究者所研究的問題需要較多非樣本信息(如前人經(jīng)驗(yàn)、無法看做樣本信息的信息)時(shí),建議選用假設(shè)檢驗(yàn).
(1)區(qū)間估計(jì)屬于參數(shù)估計(jì)的一種,參數(shù)估計(jì)是以樣本數(shù)據(jù)為基礎(chǔ),進(jìn)而去準(zhǔn)確的估計(jì)總體參數(shù)的確定值;然而假設(shè)檢驗(yàn)則是以樣本數(shù)據(jù)的相關(guān)信息去檢驗(yàn)總體參數(shù)原始假設(shè)是否成立.
(2)區(qū)間估計(jì)事先需要給定一定概率(也稱置信水平),區(qū)間估計(jì)要求概率越大越好,得到的估計(jì)區(qū)間會(huì)更加精確;而假設(shè)檢驗(yàn)是在小概率原理上立足的,最終所求的概率p值越小越顯著.
(3)區(qū)間估計(jì)最終得到的是雙側(cè)置信區(qū)間;而假設(shè)檢驗(yàn)會(huì)根據(jù)題意確定雙側(cè)檢驗(yàn)或者單側(cè)檢驗(yàn).
通過下文區(qū)間估計(jì)和假設(shè)檢驗(yàn)應(yīng)用舉例可以看出,區(qū)間估計(jì)所使用的樞軸量與假設(shè)檢驗(yàn)所使用的檢驗(yàn)統(tǒng)計(jì)量是一樣的.這是為什么呢?現(xiàn)從假設(shè)檢驗(yàn)的右側(cè)、左側(cè)、雙側(cè)分三種情況進(jìn)行討論(假設(shè)σ已知,樣本為x1,x2,...,xn來自正態(tài)總體N(μ,σ2):
3.4.1 右側(cè)檢驗(yàn)
3.4.2 左側(cè)檢驗(yàn)
3.4.3 雙側(cè)檢驗(yàn)
綜上所述,正態(tài)總體參數(shù)的置信區(qū)間與假設(shè)檢驗(yàn)問題的檢驗(yàn)存在非常密切的聯(lián)系,樞軸量與檢驗(yàn)統(tǒng)計(jì)量的相同不是偶然,而是這兩種統(tǒng)計(jì)推斷方法中存在一一對應(yīng)關(guān)系,兩種問題可以相互轉(zhuǎn)化,假設(shè)檢驗(yàn)問題能夠成為區(qū)間估計(jì)問題,區(qū)間估計(jì)也能夠成為假設(shè)檢驗(yàn)問題.
3.5.1 置信區(qū)間誤區(qū)
以下文例1 為例,有些熟悉區(qū)間估計(jì)定義的人可能會(huì)說:“題中得到的95% 置信區(qū)間為[12.282,12.518],它是以0.95 的概率覆蓋總體均值(即題目中的平均長度)”,其實(shí),仔細(xì)琢磨,這種說法欠妥.為什么呢?因?yàn)樵谶@里,如果換成是在大量樣本中得到的置信區(qū)間,只能說大約95%會(huì)覆蓋總體均值,題目中只是由一個(gè)樣本得到的置信區(qū)間,到底包含或者不包含總體均值,沒有概率可言.我們都知道,總體均值其實(shí)是一個(gè)固定的數(shù)值,而求得的置信區(qū)間也是一對固定的數(shù)值,這里不存在隨機(jī)變量,故而不可能存在覆蓋的概率,最初的隨機(jī)區(qū)間一旦實(shí)現(xiàn),就變成了兩個(gè)固定數(shù)字,便失去了隨機(jī)性,進(jìn)而也無法談及概率.
3.5.2 假設(shè)檢驗(yàn)誤區(qū)
(1)大家都知道,做假設(shè)檢驗(yàn)的目的是從假設(shè)中找到需要的答案,所以說拒絕原假設(shè)的顯著性水平α的選擇很重要[6].拋開書本理論,選擇α?xí)r必須與實(shí)際問題相結(jié)合,具體問題具體分析,課程當(dāng)中的例子過于理想化,很多影響問題的敏感因素都未曾給出,但是在實(shí)際生活中往往缺乏可信度.比如警察在通過DNA 或者指紋去判斷作案兇手、血緣關(guān)系時(shí),對于這種非常敏感的問題,α取值稍微過大,都會(huì)使得到的結(jié)果可信度大打折扣,此時(shí)α應(yīng)該是一個(gè)非常小的數(shù).相反,如果實(shí)際要求α不宜過小,α就應(yīng)該取相對大,否則,一些大的影響因素可能就會(huì)錯(cuò)過.總之,α的大小選擇并不能簡單的全默認(rèn)看成是0.01、0.05、0.1,應(yīng)該靈活處理.
(2)通常我們在面對假設(shè)檢驗(yàn)結(jié)果的時(shí)候,認(rèn)為落入了拒絕域,則表示拒絕原假設(shè),這個(gè)判斷沒有錯(cuò)誤;但是反之,當(dāng)我們不能拒絕原假設(shè)的時(shí)候,很多人就會(huì)很自然的認(rèn)為應(yīng)該接受原假設(shè),這便是不夠嚴(yán)謹(jǐn)了.舉一個(gè)例子如下:判斷一個(gè)罪犯是小偷,設(shè)置原假設(shè)為H0:不是小偷,備擇假設(shè)H1:是小偷.當(dāng)在小偷身上或家里發(fā)現(xiàn)別人的東西,在幾乎不太可能( )p→0有一模一樣的東西的前提下,這時(shí)候就拒絕原假設(shè):不是小偷,認(rèn)為他是小偷.當(dāng)在小偷身上或家里沒有發(fā)現(xiàn)別人的東西,就說明沒有證據(jù)說明拒絕原假設(shè):不是小偷,但是這不能說明小偷從未偷過東西,只是證據(jù)不足而已.因此,證據(jù)不足接受原假設(shè)和實(shí)際上就接受原假設(shè)是有差別的.
例:某公司規(guī)定一批零件直徑為10cm時(shí)為合格,現(xiàn)在隨機(jī)抽取50 個(gè)零件作為樣本進(jìn)行檢測,根據(jù)樣本數(shù)據(jù)顯示,得到樣本均值xˉ= 10.2,已知標(biāo)準(zhǔn)差為0.4,假設(shè)取α= 0.05,檢驗(yàn)這批零件是否合格.
(1)區(qū)間估計(jì)法
(2)假設(shè)檢驗(yàn)法
根據(jù)題意設(shè)置假設(shè) :H0:μ0= 10vsH1:μ0≠ 10 ,
綜上可知,在同樣的顯著性水平下,區(qū)間估計(jì)和假設(shè)檢驗(yàn)的結(jié)果一樣,說明這兩種方法可以相通.
5.1.1 區(qū)間估計(jì)中
顯著性水平是估計(jì)總體未知參數(shù)落在某一區(qū)間內(nèi)的一個(gè)概率,也表示為可能犯錯(cuò)誤的概率,一般用α表示,但是,通常以置信水平(1 ?α)為蓋住區(qū)間的概率而被我們事先給定.
5.1.2 假設(shè)檢驗(yàn)中
根據(jù)人們做判斷時(shí)誤判的錯(cuò)誤類型,將犯第一類錯(cuò)誤概率(即棄真錯(cuò)誤)叫做顯著性水平,用α表示 .
相同問題條件下,區(qū)間估計(jì)中1 ?α置信區(qū)間問題與顯著性水平為α的假設(shè)檢驗(yàn)問題一一對應(yīng),且判斷結(jié)果相同.
假設(shè)檢驗(yàn)過程中,在選擇顯著性水平時(shí),引入了兩類錯(cuò)誤:第一類錯(cuò)誤(棄真錯(cuò)誤),用α表示,第二類錯(cuò)誤(納偽錯(cuò)誤),用β表示.任何一個(gè)假設(shè)檢驗(yàn)問題,我們不可能找到一個(gè)檢驗(yàn)同時(shí)使這兩類錯(cuò)誤都盡可能小,只能選擇其中一種錯(cuò)誤,讓它盡可能小.書中引入功效函數(shù)[7]進(jìn)行說明兩類錯(cuò)誤的關(guān)系,結(jié)果是α與β中一個(gè)減小必然導(dǎo)致另一個(gè)增大,但是α+β并不一定等于1,且這個(gè)結(jié)論具有一般性.那么為什么要選擇α作為顯著性水平,而不是β呢?原因有以下幾點(diǎn):
(1)從心理學(xué)角度來看,第一類錯(cuò)誤為棄真錯(cuò)誤,認(rèn)為本來原假設(shè)是真的,卻被拒絕,這會(huì)讓人懊悔不已;第二類錯(cuò)誤為納偽錯(cuò)誤,認(rèn)為原假設(shè)不是真的,卻被接受,這種錯(cuò)誤即使發(fā)生了,頂多就說判斷錯(cuò)誤,或者說找“學(xué)藝不精”的理由,相對來說,犯第一類錯(cuò)誤更不能讓人接受;從現(xiàn)實(shí)危害角度來看,犯第一類錯(cuò)誤可能會(huì)產(chǎn)生巨大影響,它的不良后果會(huì)更加大于犯第二類錯(cuò)誤,比如所有人都犯了第一類錯(cuò)誤,后面人可能一直無法找到真的;相反,犯第二類錯(cuò)誤之后,如果重新設(shè)計(jì)實(shí)驗(yàn)便可能快速發(fā)現(xiàn)問題所在.
(2)一般而言,第二類錯(cuò)誤概率對具體參數(shù)要求頗高,相比較于α來說,β在不少場合不容易求出,產(chǎn)生β的原因多與實(shí)驗(yàn)設(shè)計(jì)、樣本數(shù)據(jù)、處理效應(yīng)等因素有關(guān),α更容易被計(jì)算出.
此處對顯著性水平的進(jìn)一步分析并非偶然,而是通過對顯著性水平的了解,我們能夠?qū)^(qū)間估計(jì)和假設(shè)檢驗(yàn)的關(guān)系更加明確,雖說兩處定義不一樣,但是只有在α一定的情況下,研究區(qū)間估計(jì)和假設(shè)檢驗(yàn)才有價(jià)值;再者顯著性水平的選擇存在很多誤區(qū),能夠很好的了解它,就能更好的學(xué)習(xí)假設(shè)檢驗(yàn).
從上述分析有如下結(jié)論:區(qū)間估計(jì)和假設(shè)檢驗(yàn)可以應(yīng)用于金融、醫(yī)藥、農(nóng)業(yè)等各個(gè)領(lǐng)域;區(qū)間估計(jì)問題和假設(shè)檢驗(yàn)問題可以相互轉(zhuǎn)化;選擇區(qū)間估計(jì)和假設(shè)檢驗(yàn)方法時(shí)應(yīng)該觀察問題本身是否與樣本信息相關(guān)聯(lián);顯著性水平在兩種統(tǒng)計(jì)推斷方法起重要樞紐作用等.通過討論,可以看出這兩種統(tǒng)計(jì)推斷方法在理論和實(shí)際中的應(yīng)用都非常復(fù)雜,日常生活中,有些人對兩種方法認(rèn)識(shí)不夠,存在個(gè)別誤區(qū);在解決一個(gè)實(shí)際問題時(shí),并未首先關(guān)注問題的實(shí)質(zhì),以致于容易犯錯(cuò).在處理任何一個(gè)問題時(shí),均需要對兩種方法足夠熟悉,才能更好地避免犯錯(cuò).統(tǒng)計(jì)學(xué)作為一門學(xué)科,但并非是一門獨(dú)立的學(xué)科,它依賴于很多數(shù)學(xué)、計(jì)算機(jī)等專業(yè)知識(shí);要想做好統(tǒng)計(jì)研究,必須具備豐富的專業(yè)知識(shí)以及較強(qiáng)的邏輯分析能力,不能一貫地參考經(jīng)驗(yàn),也不能一味地關(guān)注樣本本身,要學(xué)會(huì)具體問題具體分析.通過本文的討論,我們能夠?qū)^(qū)間估計(jì)和假設(shè)檢驗(yàn)這兩種推斷方法更加熟悉和了解,能夠?qū)⑦@兩種方法應(yīng)用于一些實(shí)際問題之中.
四川職業(yè)技術(shù)學(xué)院學(xué)報(bào)2021年4期