胡良平
(1.軍事科學(xué)院研究生院,北京 100850;2.世界中醫(yī)藥學(xué)會(huì)聯(lián)合會(huì)臨床科研統(tǒng)計(jì)學(xué)專業(yè)委員會(huì),北京 100029*通信作者:胡良平,E-mail:lphu927@163.com)
涉及一個(gè)未知總體率與一個(gè)已知總體率比較時(shí),需要借助二項(xiàng)分布原理進(jìn)行計(jì)算,也可以采用正態(tài)近似法來(lái)實(shí)現(xiàn);而涉及兩個(gè)總體率比較時(shí),其統(tǒng)計(jì)分析方法有χ2檢驗(yàn)(包括未校正的、校正的、似然比、連續(xù)校正的χ2檢驗(yàn))、Fisher’s精確檢驗(yàn)以及基于標(biāo)準(zhǔn)正態(tài)分布的Z檢驗(yàn)。本文將著重介紹基于標(biāo)準(zhǔn)正態(tài)分布的方法,同時(shí),也給出用其他類似統(tǒng)計(jì)分析方法計(jì)算的結(jié)果。
在某些統(tǒng)計(jì)學(xué)教科書上,把“一個(gè)未知總體率與一個(gè)已知總體率比較”表述為“樣本率與總體率比較”,這種簡(jiǎn)化的表述存在欠妥之處。因?yàn)椤皹颖尽迸c“總體”是不對(duì)等的兩個(gè)事物,故它們之間是沒有可比性的。類似地,“樣本均數(shù)與總體均數(shù)比較”“兩樣本率比較”“多個(gè)樣本率比較”“兩樣本標(biāo)準(zhǔn)化率比較”等表述也是欠妥的。雖然“A樣本率”與“B樣本率”是對(duì)等的兩個(gè)事物,但通常兩個(gè)“樣本率”在數(shù)量上一般都是不等的,故無(wú)需再做比較。統(tǒng)計(jì)學(xué)的價(jià)值就在于基于“樣本所提供的信息去推論所討論的問題在總體中的規(guī)律”,就是從兩個(gè)“樣本率”出發(fā)來(lái)推斷它們各自所代表的“總體率”之間的數(shù)量關(guān)系。其目的是進(jìn)行“兩總體率比較”,而非“兩樣本率比較”。
【例1】文獻(xiàn)[1]的目的是探討新冠肺炎(COVID-19)疫情期間居家兒童青少年焦慮癥狀檢出率及影響因素,為給予其心理支持提供參考。采用電子問卷調(diào)查方式,共收回有效問卷5 392份,其中焦慮組1 045人(19.4%),非焦慮組4 347人(80.6%)。由此可知,COVID-19疫情期間居家隔離兒童青少年焦慮癥狀檢出率為19.4%。同時(shí),文獻(xiàn)[1]還援引了其他文獻(xiàn)報(bào)道的同類檢出率大約為22.0%~36.9%?,F(xiàn)以后者的平均值29.45%為“已知總體率”,試問:
問題1:文獻(xiàn)[1]的總體率(未知)與已知總體率之間的差別是否具有統(tǒng)計(jì)學(xué)意義?
問題2:文獻(xiàn)[1]的總體率(未知)是否明顯低于已知總體率?
【統(tǒng)計(jì)分析方法的選擇】此問題屬于“一個(gè)未知總體率與一個(gè)已知總體率比較的問題”,可以運(yùn)用二項(xiàng)分布原理進(jìn)行計(jì)算,也可以采取正態(tài)近似法進(jìn)行計(jì)算。對(duì)“問題1”而言,屬于“雙側(cè)檢驗(yàn)”問題;而對(duì)“問題2”而言,則屬于“下單側(cè)檢驗(yàn)”問題。
1.3.1 基于二項(xiàng)分布原理的假設(shè)檢驗(yàn)方法
由于對(duì)每位受試者來(lái)說(shuō),其調(diào)查結(jié)果都是“二值變量(是否出現(xiàn)焦慮)”的一種取值,要么是“出現(xiàn)焦慮”,要么是“未出現(xiàn)焦慮”,這是一個(gè)“兩點(diǎn)分布”問題。多個(gè)兩點(diǎn)分布疊加起來(lái)就形成了一個(gè)“二項(xiàng)分布”。此分布可用作研究“率或比”比較的最直接方法[2-4],但其計(jì)算原理比較深?yuàn)W,因篇幅所限,此處從略。
1.3.2 基于標(biāo)準(zhǔn)正態(tài)分布原理的假設(shè)檢驗(yàn)方法
1.3.2.1 檢驗(yàn)統(tǒng)計(jì)量
由于滿足一定條件的二項(xiàng)分布的計(jì)算問題可以采用正態(tài)分布來(lái)近似計(jì)算,而標(biāo)準(zhǔn)正態(tài)分布應(yīng)用廣泛,且其檢驗(yàn)統(tǒng)計(jì)量形式簡(jiǎn)單、計(jì)算方便。對(duì)于“一個(gè)未知總體率與一個(gè)已知總體率比較”的檢驗(yàn)統(tǒng)計(jì)量[2-4]分別見式(1)和式(2):
式(1)和式(2)中的Z服從標(biāo)準(zhǔn)正態(tài)分布,式(1)屬于未校正的公式,而式(2)屬于校正公式。其中,X為樣本陽(yáng)性數(shù)、n為樣本含量、P為樣本率、P0為已知總體率,而式(2)分子上的“0.5”為連續(xù)性校正數(shù),當(dāng)|X-nP0|≤0.5時(shí)不適合進(jìn)行校正。
1.3.2.2 前提條件
當(dāng)P0很小時(shí),可基于Poisson分布原理進(jìn)行檢驗(yàn);當(dāng)P0不太靠近0或1時(shí),可基于二項(xiàng)分布原理進(jìn)行檢驗(yàn);而當(dāng)樣本含量n足夠大時(shí),可基于標(biāo)準(zhǔn)正態(tài)分布原理進(jìn)行檢驗(yàn)。事實(shí)上,當(dāng)nP0≥5且n(1-P0)≥5時(shí),用標(biāo)準(zhǔn)正態(tài)分布取代二項(xiàng)分布進(jìn)行計(jì)算,其誤差極小。
SAS程序如下:
【程序說(shuō)明】第2個(gè)“注釋語(yǔ)句”之前為“基于標(biāo)準(zhǔn)正態(tài)分布進(jìn)行二項(xiàng)分布的近似計(jì)算”,而該語(yǔ)句之后為“基于二項(xiàng)分布進(jìn)行精確計(jì)算,同時(shí),也包括基于標(biāo)準(zhǔn)正態(tài)分布進(jìn)行二項(xiàng)分布的近似計(jì)算”。前者是基于公式手工編程計(jì)算的,而后者是直接使用SAS中的“FREQ過程”并添加一些“選項(xiàng)”來(lái)完成的。其中,“exact語(yǔ)句”的作用是實(shí)現(xiàn)精確檢驗(yàn);而“tables語(yǔ)句”中“選項(xiàng)”的作用是估計(jì)精確置信區(qū)間。
【SAS主要輸出結(jié)果及解釋】
第1部分(基于公式編程計(jì)算)SAS程序的輸出結(jié)果如下:
因Z1=Z2,說(shuō)明此資料不符合進(jìn)行校正計(jì)算的條件;P<0.0001,說(shuō)明文獻(xiàn)[1]的調(diào)查樣本所來(lái)自的總體的焦慮檢出率與已知的總體率29.45%之間的差別具有統(tǒng)計(jì)學(xué)意義。因樣本率19.40%小于已知的總體率29.45%,說(shuō)明文獻(xiàn)[1]的調(diào)查樣本所來(lái)自的總體的焦慮檢出率明顯偏低。
第2部分(基于FREQ過程計(jì)算)SAS程序的輸出結(jié)果如下:
以上是關(guān)于“未知總體率是否等于已知總體率”的兩種假設(shè)檢驗(yàn)結(jié)果,“H0檢驗(yàn):比例=0.2945”部分是基于標(biāo)準(zhǔn)正態(tài)分布近似法得到的結(jié)果,Z=-16.2214(注:SAS軟件在計(jì)算時(shí),未取絕對(duì)值),無(wú)論是基于單側(cè)檢驗(yàn)還是雙側(cè)檢驗(yàn),都得到P<0.0001的結(jié)果,即未知總體率不等于已知總體率,結(jié)合具體的樣本率數(shù)據(jù)可知,未知總體率小于已知總體率?!熬_檢驗(yàn)”部分是基于二項(xiàng)分布進(jìn)行精確計(jì)算得到的結(jié)果,單側(cè)檢驗(yàn)的概率和雙側(cè)檢驗(yàn)的概率都極小,說(shuō)明樣本(注:樣本率為19.38%)所對(duì)應(yīng)的總體率(未知)小于已知總體率29.45%。
【結(jié)論】文獻(xiàn)[1]中COVID-19疫情期間居家隔離兒童青少年總體焦慮癥狀檢出率(未知)低于其他文獻(xiàn)報(bào)導(dǎo)的相應(yīng)檢出率(29.45%)。
【例2】文獻(xiàn)[1]中COVID-19疫情期間居家隔離兒童青少年焦慮癥狀男性檢出率為16.81%,女性檢出率為22.45%。試問:
問題1:兩性別焦慮癥狀總體檢出率之間的差別是否具有統(tǒng)計(jì)學(xué)意義?
問題2:女性焦慮癥狀總體檢出率是否一定高于男性?
【統(tǒng)計(jì)分析方法的選擇】此問題屬于“兩未知總體率比較的問題”,可以運(yùn)用二項(xiàng)分布原理進(jìn)行計(jì)算,也可以采取正態(tài)近似法進(jìn)行計(jì)算。對(duì)“問題1”而言,屬于“雙側(cè)檢驗(yàn)”問題;而對(duì)“問題2”而言,則屬于“上單側(cè)檢驗(yàn)”問題。
2.2.1 檢驗(yàn)統(tǒng)計(jì)量
依據(jù)兩率差的標(biāo)準(zhǔn)誤計(jì)算方法和是否進(jìn)行校正,對(duì)于“兩個(gè)未知總體率比較”的檢驗(yàn)統(tǒng)計(jì)量有4個(gè)計(jì)算公式,分別見式(3)~式(6):
情形一,按各自率求率差的標(biāo)準(zhǔn)誤且不校正,見式(3):
情形二,按各自率求率差的標(biāo)準(zhǔn)誤且要校正,見式(4):
情形三,按平均率求率差的標(biāo)準(zhǔn)誤且不校正,見式(5):
情形四,按平均率求率差的標(biāo)準(zhǔn)誤且要校正,見式(6):
以上各式中的檢驗(yàn)統(tǒng)計(jì)量(Z1~Z4)均服從標(biāo)準(zhǔn)正態(tài)分布;PC為兩樣本率的平均率;0.5為連續(xù)性校正數(shù)。
2.2.2 Z檢驗(yàn)統(tǒng)計(jì)量與χ2檢驗(yàn)統(tǒng)計(jì)量之間的關(guān)系
由于“兩率之間的一般差異性檢驗(yàn)問題”可以轉(zhuǎn)化為“非配對(duì)設(shè)計(jì)四格表資料的獨(dú)立性檢驗(yàn)問題”,后者可以采用χ2檢驗(yàn)。事實(shí)上,由χ2分布的定義可知,當(dāng)自由度為1時(shí),Z2=χ2。
SAS程序如下:
由于SAS中FREQ過程的計(jì)算結(jié)果中包含了“基于標(biāo)準(zhǔn)正態(tài)分布近似法計(jì)算”和“基于二項(xiàng)分布原理計(jì)算”兩種結(jié)果,又因篇幅所限,故第1部分“基于公式編程實(shí)現(xiàn)正態(tài)近似法的SAS程序”及其輸出結(jié)果均從略。
【程序說(shuō)明】第2部分SAS程序較簡(jiǎn)潔,第1個(gè)過程步的關(guān)鍵在于在“tables語(yǔ)句”中使用了兩個(gè)選項(xiàng),即“chisq”和“riskdiff(equal)”。前者進(jìn)行卡方檢驗(yàn),后者進(jìn)行正態(tài)近似計(jì)算;而第2個(gè)過程步的選項(xiàng)中增加了“correct”,即求置信區(qū)間時(shí)進(jìn)行“校正”,連續(xù)性校正的WALD置信限按下面的公式計(jì)算(基于四格表而言)[3]:
在式(7)中,cc為校正數(shù),對(duì)于第1行風(fēng)險(xiǎn)率,cc=1/2n1;對(duì)于第 2行風(fēng)險(xiǎn)率,cc=1/2n2;對(duì)于風(fēng)險(xiǎn)率差,cc=(1/n1+1/n2)/2。對(duì)于第1列和第2列風(fēng)險(xiǎn)率,使用與前面類似的校正數(shù)。n1和n2分別為第1行與第2行的合計(jì)頻數(shù)。
【SAS主要輸出結(jié)果及解釋】
因篇幅所限,第1部分輸出結(jié)果從略。
由第1部分輸出結(jié)果(未顯示)可知,無(wú)論“是否使用平均率”和“是否進(jìn)行校正”,Z檢驗(yàn)統(tǒng)計(jì)量的數(shù)值相差無(wú)幾,雙側(cè)概率P<0.0001,說(shuō)明男性與女性的焦慮癥狀總體陽(yáng)性率不等,結(jié)合樣本率數(shù)據(jù)可知,女性的總體焦慮率高于男性的總體焦慮率。
第2部分未使用校正的輸出結(jié)果:
首先輸出的是卡方檢驗(yàn)結(jié)果,χ2=27.2127,P<0.0001,說(shuō)明男、女總體焦慮檢出率不等。接著輸出Fisher’s精確檢驗(yàn)結(jié)果,雙側(cè)概率P<0.0001,說(shuō)明男、女總體焦慮檢出率不等。此處省略了“與總體率置信區(qū)間估計(jì)”有關(guān)的輸出結(jié)果和結(jié)果解釋。
最后輸出的是基于標(biāo)準(zhǔn)正態(tài)分布近似法進(jìn)行兩未知總體率比較的結(jié)果,Z=-5.1788(注意:未取絕對(duì)值),雙側(cè)概率P<0.0001。
第2部分使用校正算法的輸出結(jié)果(因篇幅所限,這部分輸出結(jié)果從略)。
可用于兩率比較的統(tǒng)計(jì)分析方法很多,其中最精確的方法是基于二項(xiàng)分布原理推導(dǎo)出的計(jì)算方法和Fisher’s精確檢驗(yàn)法,其次是卡方檢驗(yàn)和Z檢驗(yàn)兩種方法。然而,這些統(tǒng)計(jì)分析方法之間還是存在區(qū)別的。若僅關(guān)注“一般差異性檢驗(yàn)”,則“基于二項(xiàng)分布原理推導(dǎo)出的計(jì)算方法”是最合理的選擇;若考慮其他檢驗(yàn)類型(例如非劣效性檢驗(yàn)、優(yōu)效性檢驗(yàn)或等效性檢驗(yàn)),適合選擇“Z檢驗(yàn)”。
本文涉及“正態(tài)分布”“二項(xiàng)分布”“卡方分布”和“超幾何分布(Fisher’s精確檢驗(yàn)法的理論依據(jù))”等概率分布知識(shí),需要了解這方面知識(shí)的讀者,可參閱文獻(xiàn)[5-6]。因篇幅所限,這些內(nèi)容此處從略。
本文結(jié)合兩個(gè)實(shí)例,介紹了“一個(gè)未知總體率與一個(gè)已知總體率比較的Z檢驗(yàn)”和“兩未知總體率比較的Z檢驗(yàn)”的基本原理和SAS實(shí)現(xiàn)。同時(shí),還給出了“基于二項(xiàng)分布原理”“卡方分布原理”和“超幾何分布原理”實(shí)現(xiàn)統(tǒng)計(jì)計(jì)算的SAS程序和輸出結(jié)果。由本文的做法和輸出結(jié)果可知:相對(duì)于“基于計(jì)算公式,用SAS語(yǔ)言編程”來(lái)說(shuō),直接使用SAS中的FREQ過程來(lái)完成率的比較,不僅更加簡(jiǎn)潔和方便,而且還能提供更多的算法和相應(yīng)的輸出結(jié)果。