孫辰展
摘 要:假設(shè)檢驗(yàn)是數(shù)理統(tǒng)計(jì)學(xué)中由樣本推斷總體的一種常見方法。本文主要研究了假設(shè)檢驗(yàn)的基本思想和原理,并列舉了包括均值檢驗(yàn)、比例檢驗(yàn)、方差檢驗(yàn)三種常見的檢驗(yàn)方法,并以具體案例探討了假設(shè)檢驗(yàn)方法的實(shí)際計(jì)算與運(yùn)用。
關(guān)鍵詞:假設(shè)檢驗(yàn) 基本思想 運(yùn)用
引言
客觀世界是復(fù)雜的,人類探索未知世界的歷程,正是不斷提出猜想,并驗(yàn)證一個(gè)個(gè)主觀假設(shè)的過程。而統(tǒng)計(jì)學(xué)中的推斷方法,正是輔助人類進(jìn)行科學(xué)、理性判斷的重要利器。
一、假設(shè)檢驗(yàn)的基本思想
1.基本概念
一般來說,我們可以把統(tǒng)計(jì)學(xué)分類為描述統(tǒng)計(jì)和推斷統(tǒng)計(jì)兩種類別,而假設(shè)檢驗(yàn)正是一種常見的推斷統(tǒng)計(jì)方法。假設(shè)檢驗(yàn)(Hypothesis Testing)是一種利用樣本推斷總體的推斷統(tǒng)計(jì),首先會(huì)對(duì)總體的某個(gè)參數(shù)提出假設(shè),在設(shè)定原假設(shè)成立的情況下進(jìn)行取樣并計(jì)算樣本發(fā)生的概率,如果發(fā)生概率足夠小,則認(rèn)為原假設(shè)不成立。假設(shè)檢驗(yàn)利用了“小概率”的數(shù)學(xué)思想,在科學(xué)界得到了廣泛運(yùn)用。
假設(shè)檢驗(yàn)起源于國外著名的“品茶試驗(yàn)”。著名的統(tǒng)計(jì)學(xué)家Fisher在論文中提到:在一場英式下午茶中,一位女士告訴大家她有一項(xiàng)神奇的本領(lǐng),即她可以通過品茶來辨別奶茶制作過程中牛奶和茶倒入杯中的先后順序。為了驗(yàn)證女士的神奇能力,F(xiàn)isher為她設(shè)定了一個(gè)檢驗(yàn)方式:調(diào)配了6杯除了倒入順序不同,其他條件完全一樣的奶茶讓女士進(jìn)行辨別,以判斷女士是否說謊。
Fisher利用了這樣的思想,首先他假設(shè):女士沒有這樣的能力,這樣的原假設(shè)顯然符合大家的常識(shí)判斷。在這個(gè)假設(shè)成立的情況下,女士所謂的“品茶”實(shí)則便是毫無依據(jù)的瞎猜了。在這樣的情況下,女士如果猜對(duì)的杯數(shù)足夠多,那說明在原假設(shè)的情況下發(fā)生了一個(gè)小概率的事件,我們傾向于認(rèn)為我們的原假設(shè)是存在錯(cuò)誤的,即否定我們的原假設(shè),認(rèn)為該女士存在這樣的能力。實(shí)驗(yàn)的結(jié)果令人吃驚,該女士真的把6杯奶茶的倒入順序全都答對(duì)了。不難計(jì)算,如果是瞎猜的話,全猜對(duì)的概率為1/64,這顯然是一個(gè)小概率事件。因此,F(xiàn)isher推翻了原假設(shè),認(rèn)為該女士確實(shí)存在這樣的神奇能力。
2.基本步驟
不難發(fā)現(xiàn),在實(shí)際運(yùn)用中,假設(shè)檢驗(yàn)方法有其固定的操作步驟,基本流程分別為:
(1)提出原假設(shè)和備則假設(shè)。
原假設(shè)一般用H0表示,備則假設(shè)使用H1表示,需要注意的是,原假設(shè)和備則假設(shè)都是對(duì)于總體特征的假設(shè),它們是相互聯(lián)系且互相對(duì)立的假設(shè);
(2)選定檢驗(yàn)方法,構(gòu)造合適檢驗(yàn)統(tǒng)計(jì)量。
檢驗(yàn)統(tǒng)計(jì)量是根據(jù)抽取樣本所構(gòu)造出的隨機(jī)變量,包含了所要檢驗(yàn)的總體參數(shù),以便用于檢驗(yàn)原假設(shè)是否成立。需要特別注意的是,檢驗(yàn)統(tǒng)計(jì)量一般在原假設(shè)成立時(shí)服從特定的分布,從而便于計(jì)算樣本概率。
(3)確定顯著性水平a,計(jì)算P值,做出判斷。
根據(jù)上面的“品茶”案例我們發(fā)現(xiàn),小概率事件的判定是具有主觀性的,這一標(biāo)準(zhǔn)稱為顯著性水平a。顯著性水平的定義將直接影響到推斷結(jié)果。在上個(gè)案例中,在女士成功品出六杯奶茶后,如果我們把顯著性水平定為0.05,則小概率事件發(fā)生了,我們需要拒絕原假設(shè);而當(dāng)我們把顯著性水平定為0.01,則小概率事件并未發(fā)生,我們需要接受原假設(shè)。P值,則是檢驗(yàn)統(tǒng)計(jì)量超過樣本觀測值的概率,也即是能夠拒絕原假設(shè)的最小顯著性水平。當(dāng)我們計(jì)算出P值后,當(dāng) 時(shí),我們便拒絕原假設(shè),反之則接受原假設(shè)。
3.假設(shè)檢驗(yàn)中的兩類錯(cuò)誤
由于假設(shè)檢驗(yàn)總是利用有限的樣本信息對(duì)總體進(jìn)行推斷,檢驗(yàn)和推斷中是可能發(fā)生錯(cuò)誤的。一般來說,假設(shè)檢驗(yàn)可能會(huì)犯兩種錯(cuò)誤,分別為第一類錯(cuò)誤和第二類錯(cuò)誤。
一般來說,我們主要控制第一類錯(cuò)誤發(fā)生的概率,即顯著性水平a。
二、假設(shè)檢驗(yàn)的常見類型
1.均值檢驗(yàn)
(1)基本方法
均值檢驗(yàn)主要檢驗(yàn)的是總體的均值是否符合我們的假設(shè),這里主要列舉當(dāng)總體服從正態(tài)分布,且總體方差已知的情況。
通過查表可知 則 ,檢驗(yàn)統(tǒng)計(jì)量落入了拒絕域,則拒絕原假設(shè),認(rèn)為該機(jī)器已經(jīng)不符合生產(chǎn)標(biāo)準(zhǔn)。
2.比例檢驗(yàn)
(1)基本方法
比例檢驗(yàn)主要檢驗(yàn)的是總體中符合某些特征的個(gè)體占比是否符合我們的假設(shè)。當(dāng)樣本數(shù)量較大時(shí),假設(shè)檢驗(yàn)可以幫助我們進(jìn)行某些特定比例的檢驗(yàn)。
我們使用π表示總體比例,其中π0為已知常數(shù),給出原假設(shè)和備則假設(shè):
此時(shí),確定顯著性水平a,則當(dāng) 時(shí),我們拒絕原假設(shè),反之,我們則接受原假設(shè)。
(2)實(shí)際案例
一款手機(jī)app負(fù)責(zé)人聲稱其受眾有60%為女性,為了驗(yàn)證這一判斷,調(diào)查者隨機(jī)抽取了100位用戶進(jìn)行驗(yàn)證,發(fā)現(xiàn)有50人為女性。設(shè)定顯著性水平a為0.05,試問該負(fù)責(zé)人的說法是否準(zhǔn)確?
通過查表可知 則 ,檢驗(yàn)統(tǒng)計(jì)量落入了拒絕域,則拒絕原假設(shè),認(rèn)為該負(fù)責(zé)人的說法不夠準(zhǔn)確。
3.方差檢驗(yàn)
(1)基本方法
方差檢驗(yàn)主要檢驗(yàn)的是總體的方差或者標(biāo)準(zhǔn)差是否符合我們的假設(shè),這里主要列舉一個(gè)總體的情況。
已知 ,μ未知,其中 為已知常數(shù),需要檢驗(yàn)總體方差:
我們只需取總體的隨機(jī)樣本 ,由于樣本方差 是 的無偏估計(jì),當(dāng)原假設(shè)為真,即 時(shí),構(gòu)造檢驗(yàn)統(tǒng)計(jì)量 :
此時(shí),確定顯著性水平a。由于卡方分布是大于零的單側(cè)分布,則當(dāng) 或 時(shí),我們拒絕原假設(shè),反之,我們則接受原假設(shè)。
(2)實(shí)際案例
白酒生產(chǎn)企業(yè)采用機(jī)械化生產(chǎn)線,生產(chǎn)標(biāo)準(zhǔn)規(guī)定每瓶酒的裝填量的標(biāo)準(zhǔn)差應(yīng)該維持在4ml附近。為了檢驗(yàn)每瓶酒的裝填量的誤差,工廠負(fù)責(zé)人設(shè)計(jì)了一個(gè)假設(shè)檢驗(yàn):隨機(jī)抽取了10瓶酒,發(fā)現(xiàn)樣本標(biāo)準(zhǔn)差s=3.9ml,假設(shè)顯著性水平為0.1,請(qǐng)問該生產(chǎn)線是否符合標(biāo)準(zhǔn)?
首先,設(shè)定原假設(shè)和備則假設(shè):
檢驗(yàn)統(tǒng)計(jì)量:
通過查表可知 ,則檢驗(yàn)統(tǒng)計(jì)量8.556并未落入拒絕域,因此接受原假設(shè),認(rèn)為生產(chǎn)線符合生產(chǎn)標(biāo)準(zhǔn)。
結(jié)語
假設(shè)檢驗(yàn)是一種理性科學(xué)的推斷方法,在數(shù)據(jù)有效性、質(zhì)量控制等領(lǐng)域起到了重大效用,因而廣泛運(yùn)用于學(xué)界、工業(yè)界。合理掌握假設(shè)檢驗(yàn)方法,有助于輔助人類決策,避免主觀誤差,提高管理效率。
參考文獻(xiàn)
[1]吳啟富,張玉春.統(tǒng)計(jì)假設(shè)檢驗(yàn)中小概率原理的辨析[J].統(tǒng)計(jì)與決策,2012(17):70-71.
[2]魏立力,張定強(qiáng).確定假設(shè)檢驗(yàn)拒絕域的證據(jù)原理[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2018,48(16):196-200.
[3]康鐵祥.深入理解假設(shè)檢驗(yàn)原理[J].統(tǒng)計(jì)教育,2001(01):22-23.