胡良平
(1.軍事科學(xué)院研究生院,北京 100850;2.世界中醫(yī)藥學(xué)會聯(lián)合會臨床科研統(tǒng)計學(xué)專業(yè)委員會,北京 100029*通信作者:胡良平,E-mail:lphu927@163.com)
涉及一個未知總體率與一個已知總體率比較時,需要借助二項分布原理進行計算,也可以采用正態(tài)近似法來實現(xiàn);而涉及兩個總體率比較時,其統(tǒng)計分析方法有χ2檢驗(包括未校正的、校正的、似然比、連續(xù)校正的χ2檢驗)、Fisher’s精確檢驗以及基于標(biāo)準(zhǔn)正態(tài)分布的Z檢驗。本文將著重介紹基于標(biāo)準(zhǔn)正態(tài)分布的方法,同時,也給出用其他類似統(tǒng)計分析方法計算的結(jié)果。
在某些統(tǒng)計學(xué)教科書上,把“一個未知總體率與一個已知總體率比較”表述為“樣本率與總體率比較”,這種簡化的表述存在欠妥之處。因為“樣本”與“總體”是不對等的兩個事物,故它們之間是沒有可比性的。類似地,“樣本均數(shù)與總體均數(shù)比較”“兩樣本率比較”“多個樣本率比較”“兩樣本標(biāo)準(zhǔn)化率比較”等表述也是欠妥的。雖然“A樣本率”與“B樣本率”是對等的兩個事物,但通常兩個“樣本率”在數(shù)量上一般都是不等的,故無需再做比較。統(tǒng)計學(xué)的價值就在于基于“樣本所提供的信息去推論所討論的問題在總體中的規(guī)律”,就是從兩個“樣本率”出發(fā)來推斷它們各自所代表的“總體率”之間的數(shù)量關(guān)系。其目的是進行“兩總體率比較”,而非“兩樣本率比較”。
【例1】文獻[1]的目的是探討新冠肺炎(COVID-19)疫情期間居家兒童青少年焦慮癥狀檢出率及影響因素,為給予其心理支持提供參考。采用電子問卷調(diào)查方式,共收回有效問卷5 392份,其中焦慮組1 045人(19.4%),非焦慮組4 347人(80.6%)。由此可知,COVID-19疫情期間居家隔離兒童青少年焦慮癥狀檢出率為19.4%。同時,文獻[1]還援引了其他文獻報道的同類檢出率大約為22.0%~36.9%?,F(xiàn)以后者的平均值29.45%為“已知總體率”,試問:
問題1:文獻[1]的總體率(未知)與已知總體率之間的差別是否具有統(tǒng)計學(xué)意義?
問題2:文獻[1]的總體率(未知)是否明顯低于已知總體率?
【統(tǒng)計分析方法的選擇】此問題屬于“一個未知總體率與一個已知總體率比較的問題”,可以運用二項分布原理進行計算,也可以采取正態(tài)近似法進行計算。對“問題1”而言,屬于“雙側(cè)檢驗”問題;而對“問題2”而言,則屬于“下單側(cè)檢驗”問題。
1.3.1 基于二項分布原理的假設(shè)檢驗方法
由于對每位受試者來說,其調(diào)查結(jié)果都是“二值變量(是否出現(xiàn)焦慮)”的一種取值,要么是“出現(xiàn)焦慮”,要么是“未出現(xiàn)焦慮”,這是一個“兩點分布”問題。多個兩點分布疊加起來就形成了一個“二項分布”。此分布可用作研究“率或比”比較的最直接方法[2-4],但其計算原理比較深奧,因篇幅所限,此處從略。
1.3.2 基于標(biāo)準(zhǔn)正態(tài)分布原理的假設(shè)檢驗方法
1.3.2.1 檢驗統(tǒng)計量
由于滿足一定條件的二項分布的計算問題可以采用正態(tài)分布來近似計算,而標(biāo)準(zhǔn)正態(tài)分布應(yīng)用廣泛,且其檢驗統(tǒng)計量形式簡單、計算方便。對于“一個未知總體率與一個已知總體率比較”的檢驗統(tǒng)計量[2-4]分別見式(1)和式(2):
式(1)和式(2)中的Z服從標(biāo)準(zhǔn)正態(tài)分布,式(1)屬于未校正的公式,而式(2)屬于校正公式。其中,X為樣本陽性數(shù)、n為樣本含量、P為樣本率、P0為已知總體率,而式(2)分子上的“0.5”為連續(xù)性校正數(shù),當(dāng)|X-nP0|≤0.5時不適合進行校正。
1.3.2.2 前提條件
當(dāng)P0很小時,可基于Poisson分布原理進行檢驗;當(dāng)P0不太靠近0或1時,可基于二項分布原理進行檢驗;而當(dāng)樣本含量n足夠大時,可基于標(biāo)準(zhǔn)正態(tài)分布原理進行檢驗。事實上,當(dāng)nP0≥5且n(1-P0)≥5時,用標(biāo)準(zhǔn)正態(tài)分布取代二項分布進行計算,其誤差極小。
SAS程序如下:
【程序說明】第2個“注釋語句”之前為“基于標(biāo)準(zhǔn)正態(tài)分布進行二項分布的近似計算”,而該語句之后為“基于二項分布進行精確計算,同時,也包括基于標(biāo)準(zhǔn)正態(tài)分布進行二項分布的近似計算”。前者是基于公式手工編程計算的,而后者是直接使用SAS中的“FREQ過程”并添加一些“選項”來完成的。其中,“exact語句”的作用是實現(xiàn)精確檢驗;而“tables語句”中“選項”的作用是估計精確置信區(qū)間。
【SAS主要輸出結(jié)果及解釋】
第1部分(基于公式編程計算)SAS程序的輸出結(jié)果如下:
因Z1=Z2,說明此資料不符合進行校正計算的條件;P<0.0001,說明文獻[1]的調(diào)查樣本所來自的總體的焦慮檢出率與已知的總體率29.45%之間的差別具有統(tǒng)計學(xué)意義。因樣本率19.40%小于已知的總體率29.45%,說明文獻[1]的調(diào)查樣本所來自的總體的焦慮檢出率明顯偏低。
第2部分(基于FREQ過程計算)SAS程序的輸出結(jié)果如下:
以上是關(guān)于“未知總體率是否等于已知總體率”的兩種假設(shè)檢驗結(jié)果,“H0檢驗:比例=0.2945”部分是基于標(biāo)準(zhǔn)正態(tài)分布近似法得到的結(jié)果,Z=-16.2214(注:SAS軟件在計算時,未取絕對值),無論是基于單側(cè)檢驗還是雙側(cè)檢驗,都得到P<0.0001的結(jié)果,即未知總體率不等于已知總體率,結(jié)合具體的樣本率數(shù)據(jù)可知,未知總體率小于已知總體率?!熬_檢驗”部分是基于二項分布進行精確計算得到的結(jié)果,單側(cè)檢驗的概率和雙側(cè)檢驗的概率都極小,說明樣本(注:樣本率為19.38%)所對應(yīng)的總體率(未知)小于已知總體率29.45%。
【結(jié)論】文獻[1]中COVID-19疫情期間居家隔離兒童青少年總體焦慮癥狀檢出率(未知)低于其他文獻報導(dǎo)的相應(yīng)檢出率(29.45%)。
【例2】文獻[1]中COVID-19疫情期間居家隔離兒童青少年焦慮癥狀男性檢出率為16.81%,女性檢出率為22.45%。試問:
問題1:兩性別焦慮癥狀總體檢出率之間的差別是否具有統(tǒng)計學(xué)意義?
問題2:女性焦慮癥狀總體檢出率是否一定高于男性?
【統(tǒng)計分析方法的選擇】此問題屬于“兩未知總體率比較的問題”,可以運用二項分布原理進行計算,也可以采取正態(tài)近似法進行計算。對“問題1”而言,屬于“雙側(cè)檢驗”問題;而對“問題2”而言,則屬于“上單側(cè)檢驗”問題。
2.2.1 檢驗統(tǒng)計量
依據(jù)兩率差的標(biāo)準(zhǔn)誤計算方法和是否進行校正,對于“兩個未知總體率比較”的檢驗統(tǒng)計量有4個計算公式,分別見式(3)~式(6):
情形一,按各自率求率差的標(biāo)準(zhǔn)誤且不校正,見式(3):
情形二,按各自率求率差的標(biāo)準(zhǔn)誤且要校正,見式(4):
情形三,按平均率求率差的標(biāo)準(zhǔn)誤且不校正,見式(5):
情形四,按平均率求率差的標(biāo)準(zhǔn)誤且要校正,見式(6):
以上各式中的檢驗統(tǒng)計量(Z1~Z4)均服從標(biāo)準(zhǔn)正態(tài)分布;PC為兩樣本率的平均率;0.5為連續(xù)性校正數(shù)。
2.2.2 Z檢驗統(tǒng)計量與χ2檢驗統(tǒng)計量之間的關(guān)系
由于“兩率之間的一般差異性檢驗問題”可以轉(zhuǎn)化為“非配對設(shè)計四格表資料的獨立性檢驗問題”,后者可以采用χ2檢驗。事實上,由χ2分布的定義可知,當(dāng)自由度為1時,Z2=χ2。
SAS程序如下:
由于SAS中FREQ過程的計算結(jié)果中包含了“基于標(biāo)準(zhǔn)正態(tài)分布近似法計算”和“基于二項分布原理計算”兩種結(jié)果,又因篇幅所限,故第1部分“基于公式編程實現(xiàn)正態(tài)近似法的SAS程序”及其輸出結(jié)果均從略。
【程序說明】第2部分SAS程序較簡潔,第1個過程步的關(guān)鍵在于在“tables語句”中使用了兩個選項,即“chisq”和“riskdiff(equal)”。前者進行卡方檢驗,后者進行正態(tài)近似計算;而第2個過程步的選項中增加了“correct”,即求置信區(qū)間時進行“校正”,連續(xù)性校正的WALD置信限按下面的公式計算(基于四格表而言)[3]:
在式(7)中,cc為校正數(shù),對于第1行風(fēng)險率,cc=1/2n1;對于第 2行風(fēng)險率,cc=1/2n2;對于風(fēng)險率差,cc=(1/n1+1/n2)/2。對于第1列和第2列風(fēng)險率,使用與前面類似的校正數(shù)。n1和n2分別為第1行與第2行的合計頻數(shù)。
【SAS主要輸出結(jié)果及解釋】
因篇幅所限,第1部分輸出結(jié)果從略。
由第1部分輸出結(jié)果(未顯示)可知,無論“是否使用平均率”和“是否進行校正”,Z檢驗統(tǒng)計量的數(shù)值相差無幾,雙側(cè)概率P<0.0001,說明男性與女性的焦慮癥狀總體陽性率不等,結(jié)合樣本率數(shù)據(jù)可知,女性的總體焦慮率高于男性的總體焦慮率。
第2部分未使用校正的輸出結(jié)果:
首先輸出的是卡方檢驗結(jié)果,χ2=27.2127,P<0.0001,說明男、女總體焦慮檢出率不等。接著輸出Fisher’s精確檢驗結(jié)果,雙側(cè)概率P<0.0001,說明男、女總體焦慮檢出率不等。此處省略了“與總體率置信區(qū)間估計”有關(guān)的輸出結(jié)果和結(jié)果解釋。
最后輸出的是基于標(biāo)準(zhǔn)正態(tài)分布近似法進行兩未知總體率比較的結(jié)果,Z=-5.1788(注意:未取絕對值),雙側(cè)概率P<0.0001。
第2部分使用校正算法的輸出結(jié)果(因篇幅所限,這部分輸出結(jié)果從略)。
可用于兩率比較的統(tǒng)計分析方法很多,其中最精確的方法是基于二項分布原理推導(dǎo)出的計算方法和Fisher’s精確檢驗法,其次是卡方檢驗和Z檢驗兩種方法。然而,這些統(tǒng)計分析方法之間還是存在區(qū)別的。若僅關(guān)注“一般差異性檢驗”,則“基于二項分布原理推導(dǎo)出的計算方法”是最合理的選擇;若考慮其他檢驗類型(例如非劣效性檢驗、優(yōu)效性檢驗或等效性檢驗),適合選擇“Z檢驗”。
本文涉及“正態(tài)分布”“二項分布”“卡方分布”和“超幾何分布(Fisher’s精確檢驗法的理論依據(jù))”等概率分布知識,需要了解這方面知識的讀者,可參閱文獻[5-6]。因篇幅所限,這些內(nèi)容此處從略。
本文結(jié)合兩個實例,介紹了“一個未知總體率與一個已知總體率比較的Z檢驗”和“兩未知總體率比較的Z檢驗”的基本原理和SAS實現(xiàn)。同時,還給出了“基于二項分布原理”“卡方分布原理”和“超幾何分布原理”實現(xiàn)統(tǒng)計計算的SAS程序和輸出結(jié)果。由本文的做法和輸出結(jié)果可知:相對于“基于計算公式,用SAS語言編程”來說,直接使用SAS中的FREQ過程來完成率的比較,不僅更加簡潔和方便,而且還能提供更多的算法和相應(yīng)的輸出結(jié)果。