阮征 孔德飛
【摘 要】本文基于P值在統(tǒng)計學(xué)中的特殊意義,從假設(shè)檢驗、正態(tài)分布、P值的含義、統(tǒng)計顯著性四個維度出發(fā),結(jié)合某個披薩店平均配送時間是否會大于30分鐘的具體案例,對P值的統(tǒng)計學(xué)意義進(jìn)行分析闡述,最后指出P值還在SPSS軟件分析問卷數(shù)據(jù)等方面發(fā)揮著的不可替代的作用,它所蘊(yùn)含的重要價值值得廣大研究者對其進(jìn)行更多角度的深度挖掘。
【關(guān)鍵詞】假設(shè)檢驗;正態(tài)分布;P值;統(tǒng)計顯著性
【中圖分類號】G633.6? 【文獻(xiàn)標(biāo)識碼】A? 【文章編號】1671-8437(2019)34-0021-02
在統(tǒng)計學(xué)P中,P值具有特殊的意義,在解析幾何乃至某些實驗中,P值同樣成為決策工具的一部分,如當(dāng)超過的閾值時,意味著P值為0.0000003才能確認(rèn)發(fā)現(xiàn)了希格斯玻色子。下面將分別從假設(shè)檢驗、正態(tài)分布、P值的含義、統(tǒng)計顯著性這四個方面解釋P值的意義以及如何在統(tǒng)計學(xué)中使用P值。
1? 假設(shè)檢驗
在假設(shè)檢驗中,通常采用P值來確定結(jié)果的統(tǒng)計顯著性[1]。由于最終目標(biāo)是確定結(jié)果的統(tǒng)計顯著性,統(tǒng)計顯著性需要建立在假設(shè)檢驗、正態(tài)分布、P值這三個簡單概念之上。所以,假設(shè)檢驗是通過一組數(shù)據(jù)檢驗零假設(shè)的有效性,倘若零假設(shè)不成立,此時就會相信備擇假設(shè)。換句話說,就是需要提出零假設(shè),并用樣本數(shù)據(jù)來檢驗聲明是否有效。倘若零假設(shè)無效,則選擇備擇假設(shè)。而要想確定零假設(shè)是否有效,就要運(yùn)用P值來衡量證據(jù)的強(qiáng)度,從而了解它是否有統(tǒng)計顯著性。如果證據(jù)支持備擇假設(shè),那么就會拒絕零假設(shè)并接受備擇假設(shè)。
舉個典型的例子:假設(shè)某個披薩店聲稱他們的平均配送時間小于或等于30分鐘,但這里認(rèn)為他們的配送時間不止30分鐘,所以做了假設(shè)檢驗,對配送時間采用隨機(jī)采樣來檢驗這一說法:零假設(shè)——平均配送時間小于等于30分鐘;備擇假設(shè)——平均配送時間大于30分鐘。這里的目標(biāo)是確定樣本數(shù)據(jù)中的證據(jù)能更好地支持哪種假設(shè)(零假設(shè)還是備擇假設(shè))。本例中使用的是單尾檢驗,這里只想知道平均配送時間是否多于30分鐘,因為配送時間小于或等于30分鐘都是可以接受的,因此可忽略另一個方向的可能性,換句話說就是想弄清楚披薩店是否在某種角度上欺騙了消費者。
2? 正態(tài)分布
正態(tài)分布是一種用來觀察數(shù)據(jù)分布的概率密度函數(shù),它包含兩個參數(shù)——平均值μ和標(biāo)準(zhǔn)差σ。其中,平均值代表著數(shù)據(jù)分布的集中趨勢,決定了正態(tài)分布峰值的位置;標(biāo)準(zhǔn)差則是衡量可變性的標(biāo)準(zhǔn),決定了均值的下降幅度。正態(tài)分布通常68-95-99.7和規(guī)則相關(guān):68%的數(shù)據(jù)在平均值μ±1個標(biāo)準(zhǔn)差σ內(nèi);95%的數(shù)據(jù)在平均值μ±2個標(biāo)準(zhǔn)差σ內(nèi);99.7%的數(shù)據(jù)在平均值μ±3個標(biāo)準(zhǔn)差σ內(nèi)。
Z分?jǐn)?shù)越高,結(jié)果就越不可能偶然發(fā)生;Z分?jǐn)?shù)越低,結(jié)果就越可能有意義。但多高或多低才足以說明結(jié)果是有意義的呢?這就是解決這個難題的最后一片拼圖——P值,需要根據(jù)實驗開始前設(shè)定的顯著水平檢驗結(jié)果是否具有統(tǒng)計學(xué)意義。
3? ?P值的含義
對披薩配送時間隨機(jī)采樣的目的是檢查平均配送時間是否大于30分鐘,如果最終的結(jié)果支持披薩店的說法,即平均配送時間小于或等于30分鐘,那就表示接受零假設(shè),否則就是拒絕零假設(shè)。假如生活在披薩配送時間小于或等于30分鐘,即零假設(shè)成立的世界中,那在真實世界中得到的證據(jù)有多令人驚訝?P值用數(shù)字(概率)回答了這一問題:P值越低,證據(jù)越令人驚訝、零假設(shè)越荒謬。當(dāng)零假設(shè)很荒謬的時候還能做什么?可以拒絕零假設(shè)并選擇備擇假設(shè),如果P值低于之前定義的顯著水平,那么它屬于荒謬閾值,可以拒絕零假設(shè)。
如現(xiàn)在已經(jīng)抽樣得到了一些配送時間,計算后發(fā)現(xiàn)平均配送時間要多10分鐘,P值為0.03,這意味著在比薩配送時間小于或等于30分鐘的世界中,由于隨機(jī)噪聲的影響,有3%的概率會看到比薩配送時間延長了至少10分鐘。由于P值越低,結(jié)果越有意義,所以它不太可能是由噪聲引起的。很多人對P值存在誤解:P值為0.03意味著有3%的概率是偶然決定的——這是錯誤的,因為P值不能證明任何事,它只是一種根據(jù)驚訝程度做出合理決策的基礎(chǔ)方法。那么利用0.03的P值來做出合理決策則需要以下幾步:①想象生活在平均配送時間小于或等于30分鐘的世界。②分析收集的配送時間樣本后,P值為0.03,低于0.05的置信水平,因此可以說結(jié)果是具有統(tǒng)計顯著性的。③因為一直相信比薩店可以在30分鐘內(nèi)配送比薩,現(xiàn)在需要考慮的是這一信念是否仍然有意義,因為結(jié)果說明了比薩店沒能兌現(xiàn)承諾,而且結(jié)果是具有統(tǒng)計學(xué)意義的。④這時先試著用各種方法使初始信念成立,但由于比薩店的口碑越來越差,因此決定拒絕零假設(shè)。⑤最終做出不再從這家比薩店買比薩的合理決定。
不難發(fā)現(xiàn)在上面的例子中,P值不能證明或決定任何事。當(dāng)結(jié)果有統(tǒng)計學(xué)意義時,P值可以作為挑戰(zhàn)初始信念的工具。假設(shè)P值表明結(jié)果具有統(tǒng)計顯著性,在認(rèn)為信念荒謬的那一刻就放棄了自己的初始信念,即拒絕零假設(shè),并做出了更合理的決定。
4? ?統(tǒng)計顯著性
通過對上述假設(shè)檢驗、正態(tài)分布、P值含義、統(tǒng)計顯著性四個維度的分析可知P值在統(tǒng)計學(xué)中具有非凡的意義,更是SPSS軟件分析問卷數(shù)據(jù)時的重要指標(biāo),值得廣大研究者對其進(jìn)行深入探究。
【參考文獻(xiàn)】
[1]阮征.影響初中生數(shù)學(xué)運(yùn)算能力提升的因素調(diào)查研究[D].合肥:合肥師范學(xué)院,2018.
[2]衛(wèi)德彬,阮征,陳方勇,等.智慧學(xué)校環(huán)境下習(xí)題課教學(xué)與初中生數(shù)學(xué)成績關(guān)聯(lián)性實驗研究[J].中小學(xué)電教,2019(6).
【作者簡介】
阮征(1992~),女,漢族,學(xué)歷:碩士研究生,研究方向:數(shù)學(xué)課程與教學(xué)論。
孔德飛(1977~),男,漢族,中學(xué)一級教師,研究方向:初中數(shù)學(xué)教學(xué)。