【摘要】針對選修23《獨立性檢驗》中有關χ2統(tǒng)計量計算結果解釋的若干問題進行了探討,給出一個在教學中較為恰當?shù)慕忉尫绞?,有助于學生對于獨立性檢驗有較為全面的認識.
【關鍵詞】χ2統(tǒng)計量;獨立性檢驗;統(tǒng)計推斷
在人民教育出版社編寫的普通高中課程標準實驗教科書《數(shù)學》B版選修23中的《獨立性檢驗》一章中,對于統(tǒng)計檢驗結果的描述有若干需要商榷的地方.
1.在教科書中有如下描述(P78):
經過對χ2統(tǒng)計量分布的研究,已經得到了兩個臨界值:3.841與6.635.當根據(jù)具體的數(shù)據(jù)算出的χ2>3.841時,有95%的把握說A與B有關;當χ2>6.635時,有99%的把握說事件A與B有關.當χ2≤3.841時,認為事件A與B是無關的.
2.我們有95%(或99%)的把握說事件A與B有關,是指推斷犯錯誤的可能性為5%(或1%),這也常常說成是“以95%(或99%)的概率”,其含義是一樣的.
我們說,高中教科書中所介紹的獨立性檢驗的思想,相當于運用統(tǒng)計學的知識發(fā)現(xiàn),在假設事件A與B獨立的前提下,所得樣本的χ2>3.841的概率為5%,χ2>6.635的概率為1%,即P(χ2>6.635)|P(AB)=P(A)P(B))=0.05,P(χ2>3.841)|P(AB)=P(A)P(B))=0.01. 從而我們現(xiàn)有的樣本χ2統(tǒng)計量大于臨界值,則說明一個小概率事件發(fā)生了,于是我們認為,很有可能是我們的假設有誤,即A,B很可能不獨立. 需要注意的是,這里的5%(1%)不是我們推斷犯錯誤的概率.
教科書提到的,所謂推斷犯錯誤的概率,應當是對于一個χ2>3.841的樣本,如果我們下一個推斷:A與B不獨立,那么,我們犯錯誤的概率(即A,B其實是獨立),即P(P(AB)=P(A)P(B)|χ2>3.841|). 顯然,從條件概率的角度,這與之前計算的5%或者1%是不同的.我們只能說,針對1%的情況,我們推斷犯錯誤的概率比5%的情況要小.于是我們僅用所謂99%的把握和95%的把握來描述我們所做推斷,這個并不是教科書上所提到的“概率”[1].
同時,當樣本的χ2統(tǒng)計量小于臨界值的時候,說明在獨立假設的前提下,得到這種χ2值的可能性比較大,但是,這并不意味著獨立假設成立的可能性大.因為,我們并不知道,在不獨立的假設下,產生這種樣本χ2值的概率,如果這個概率也較大,我們就不能確定是否這個樣本是來自于哪種假設,此時,只能說我們沒有理由,或沒有足夠的證據(jù)說明A,B有關,例如,教科書(P79)的描述,“應為3689<3841,我們沒有理由說暈機與否跟男女性別有關,盡管這次航班中男性暈機的比例比女性暈機的比例高”.
需要注意的是,我們同時也沒有理由,或沒有足夠的證據(jù)說明A,B無關,即,也沒有理由說暈機與否跟男女性別無關,而不是教科書上(P78)提到的當χ2≤3.841時,認為事件A與B是無關的.
舉例來說:在羽毛球雙打比賽中,若A球員擊球,得分的概率較大,B球員擊球,得分的概率也較大,當我們發(fā)現(xiàn)有一個球員擊球得分了(但沒有看清是誰),我們就無法判斷是A還是B擊球. 只有在我們已知A球員擊球,得分的概率較小時,若發(fā)現(xiàn)一球員擊球得分,我們推測較可能不是A球員擊球,即B球員擊球.當然,也有可能若A球員擊球, B球員擊球,得分的概率都較小,此時,我們不易判斷擊球的球員.
這在統(tǒng)計中是很常見的現(xiàn)象. 因為統(tǒng)計學本身就是利用樣本分析、推斷總體的科學,即,用部分信息來推測全部信息,就難免出現(xiàn)信息不足無法得出結論的情況.
參考文獻
[1]李勇, 張淑梅. 關于高中教材中獨立性檢驗知識呈現(xiàn)方式的思考[J]. 數(shù)學通報, 2010, 49(11):25-26.
作者簡介王立東(1983—),黑龍江人,教育學博士,北京師范大學中國基礎教育質量監(jiān)測協(xié)同創(chuàng)新中心師資博士后,中學一級教師,主要從事數(shù)學教學論、教育測量評價的研究與實踐.endprint