胡良平
(1.軍事科學(xué)院研究生院,北京 100850;2.世界中醫(yī)藥學(xué)會聯(lián)合會臨床科研統(tǒng)計學(xué)專業(yè)委員會,北京 100029*通信作者:胡良平,E-mail:lphu927@163.com)
當(dāng)研究者收集到單組設(shè)計或成組設(shè)計一元定量資料時,若分析目的是對定量的效應(yīng)指標(biāo)(通常為均值)進(jìn)行一般差異性檢驗,此時,人們依據(jù)定量資料所滿足的前提條件,擬從以下幾種假設(shè)檢驗方法中選擇一個最合適的,即“Z檢驗”“t檢驗”或“秩和檢驗”。本文將重點闡述選擇“Z檢驗”的要領(lǐng)和用SAS實現(xiàn)計算的方法。
【例1】文獻(xiàn)[1]的目的是探討新冠肺炎疫情期間封閉管理精神科醫(yī)護(hù)人員焦慮抑郁癥狀及相關(guān)因素,為改善其心理健康狀況提供參考。通過問卷調(diào)查的方式收集了包括“性別、年齡、職業(yè)、受教育程度”等12個變量(即項目)及其取值,涉及到兩個量表,分別為“廣泛性焦慮量表(簡稱GAD-7)”和“患者健康問卷抑郁量表(簡稱PHQ-9)”。共發(fā)放問卷124份,回收有效問卷121份?,F(xiàn)假定全部121例受試者的PHQ-9評分的樣本均值=5.12,該定量指標(biāo)總體方差σ2=22;進(jìn)一步假定PHQ-9評分的總體均值μ0=5.10。
針對評價指標(biāo)“PHQ-9”,設(shè)文獻(xiàn)[1]中樣本(指n=121例受試者的PHQ-9測定值)所抽自的總體均值為μ(未知),試回答下列3個問題。
問題1:μ是否小于或等于μ0?
問題2:μ是否大于或等于μ0?
問題3:μ是否等于μ0?
以上3個問題可以采用統(tǒng)計學(xué)上“零假設(shè)”與“備擇假設(shè)”嚴(yán)格地呈現(xiàn)出來:
式(1)叫做上(或右)單側(cè)檢驗,式(2)叫做下(或左)單側(cè)檢驗,而式(3)叫做雙側(cè)檢驗。這里的“名詞概念(指上、下、雙側(cè)檢驗)”是基于“備擇假設(shè)”而得出的。
解決上述3個問題都可采用Z檢驗,其檢驗統(tǒng)計量完全相同,但拒絕域(概念詳見后文)是不同的;使用Z檢驗的前提條件:樣本所抽自的總體為正態(tài)分布(但總體均值μ是未知的),總體方差為已知的常數(shù)(例如在題干中已假定σ2=22);同時,還需要給定待檢驗的總體均值(例如在題干中已假定μ0=5.10)。
【例2】假定文獻(xiàn)[1]中全部121例受試者中“行為類型”為“B型和中間型”的PHQ-9評分的樣本均值±s1=4.41,n1=98;“A型”的PHQ-9評分的樣本均值±s2=8.18,n2=23。進(jìn)一步假定:該定量指標(biāo)在兩個總體中的方差分別為。
針對評價指標(biāo)“PHQ-9”,設(shè)文獻(xiàn)[1]中兩組樣本分別為:
第1組樣本(指n=98例“B型和中間型”受試者的PHQ-9評分)所抽自的總體均值μ1;第2組樣本(指n=23例“A型”受試者的PHQ-9評分)所抽自的總體均值μ2。
試回答下列3個問題:
問題4:μ1是否小于或等于μ2?
問題5:μ1是否大于或等于μ2?
問題6:μ1是否等于μ2?
以上3個問題可以采用統(tǒng)計學(xué)上“零假設(shè)”與“備擇假設(shè)”嚴(yán)格地呈現(xiàn)出來:
式(4)叫做上(或右)單側(cè)檢驗,式(5)叫做下(或左)單側(cè)檢驗,而式(6)叫做雙側(cè)檢驗。這里的“名詞概念(指上、下、雙側(cè)檢驗)”是基于“備擇假設(shè)”而得出的。
解決上述3個問題都可以采用Z檢驗,其檢驗統(tǒng)計量是完全相同的,但拒絕域(概念詳見后文)是不同的;使用Z檢驗的前提條件:各樣本均抽自正態(tài)分布總體(但各總體均值μ1、μ2都是未知的),各總體方差均為已知的常數(shù)(例如,在題干中已假定兩個總體的方差分別為)。
對服從正態(tài)分布的單組設(shè)計一元定量資料進(jìn)行均值比較,若已知總體方差并給定定量評價指標(biāo)的標(biāo)準(zhǔn)值(即理論均值μ0)時,其對應(yīng)的檢驗統(tǒng)計量見下式:
式(7)中的Z~N(0,1)。
依據(jù)隨機(jī)變量的概率分布(本文指“標(biāo)準(zhǔn)正態(tài)分布”),在其橫坐標(biāo)軸上確定一個范圍或區(qū)間,當(dāng)檢驗統(tǒng)計量所代表的隨機(jī)變量(本文指“Z”)的取值落入該區(qū)間內(nèi)時,就有充足的理由(以一個較大的概率值來說話,單、雙側(cè)檢驗時均為“1-α”,其中,“α”為事先設(shè)定的檢驗水平)拒絕H0,從而接受H1。在統(tǒng)計學(xué)上,就稱該區(qū)間為與特定檢驗假設(shè)對應(yīng)的“拒絕域”。
與式(1)對應(yīng)的拒絕域W見下式[2]:
與式(2)對應(yīng)的拒絕域W見下式:
與式(3)對應(yīng)的拒絕域W見下式:
【說明】在上面的三個式子中,不等號之后的內(nèi)容均為標(biāo)準(zhǔn)正態(tài)分布橫坐標(biāo)軸上的“分位數(shù)”,其位置在標(biāo)準(zhǔn)正態(tài)分布曲線下左側(cè)尾端概率分別為“1-α”、“α”和“1-α/2”的橫坐標(biāo)軸上。
SAS程序如下:
【程序說明】“%let”定義“宏變量”,用戶可根據(jù)資料的實際情況修改宏變量的取值;“&”后接宏變量名,表示引用宏變量;“absz”代表 z的絕對值;“za、z1_a、z1_ha”都是標(biāo)準(zhǔn)正態(tài)分布橫坐標(biāo)軸上的分位數(shù)(對應(yīng)于標(biāo)準(zhǔn)正態(tài)分布曲線下左側(cè)的概率分別為α、1-α、1-α/2);“α”為事先給定的顯著性水平;PU、PL和PT分別代表上單側(cè)、下單側(cè)和雙側(cè)檢驗的概率。
輸出結(jié)果的第1部分[回答上述式(1)所提出的問題]是“上單側(cè)檢驗的結(jié)果”。上單側(cè)檢驗結(jié)果的判定:若 z>z1_a,則接受(H1:μ>μ0);否則,就接受(H0:μ≤μ0);PU為上單側(cè)概率。因檢驗統(tǒng)計量z=0.046904<1.64485,故只能接受“H0:μ≤μ0”,即認(rèn)為樣本所抽自的總體均值μ小于等于給定的均值μ0=5.10(P=0.48129>0.05)。
輸出結(jié)果的第2部分[回答上述式(2)所提出的問題]是“下單側(cè)檢驗的結(jié)果”。下單側(cè)檢驗結(jié)果的判定:若 z<za,則接受(H1:μ<μ0);否則,就接受(H0:μ≥μ0);PL為下單側(cè)概率。因檢驗統(tǒng)計量z=0.046904>-1.64485,故只能接受“H0:μ≥μ0”,即認(rèn)為樣本所抽自的總體均值μ大于等于給定的均值μ0=5.10(P=0.51871>0.05)。
輸出結(jié)果的第3部分[回答上述式(3)所提出的問題]是“雙側(cè)檢驗的結(jié)果”。雙側(cè)檢驗結(jié)果的判定:若|z|>z1_ha,則接受(H1:μ≠μ0);否則,就接受(H0:μ=μ0);PT為雙側(cè)概率。因檢驗統(tǒng)計量|z|=0.046904<1.95996,故只能接受“H0:μ=μ0”,即認(rèn)為樣本所抽自的總體均值μ等于給定的均值μ0=5.10(P=0.96259>0.05)。
對服從正態(tài)分布的成組設(shè)計一元定量資料進(jìn)行均值比較,若已知兩總體方差時,其對應(yīng)的檢驗統(tǒng)計量見下式:
式(11)中的Z~N(0,1)。
與式(4)對應(yīng)的拒絕域W見下式[2]:
與式(5)對應(yīng)的拒絕域W見下式:
與式(6)對應(yīng)的拒絕域W見下式:
SAS程序如下:
【程序說明】顯著性水平alpha=0.01,其他同“例1中的SAS程序說明”,從略。
輸出結(jié)果的第1部分[回答上述式(4)所提出的問題]是“上單側(cè)檢驗的結(jié)果”。上單側(cè)檢驗結(jié)果的判定:若 z>z1_a,則接受(H1:μ1>μ2);否則,就接受(H0:μ1≤μ2);PU為上單側(cè)概率。因檢驗統(tǒng)計量z=-5.24819<2.32635,故只能接受“H0:μ1≤μ2”,即認(rèn)為受試者中“行為類型”為“B型和中間型”的PHQ-9評分的總體均值小于或等于“A型”的PHQ-9評分的總體均值(P=1>0.05)。
輸出結(jié)果的第2部分[回答上述式(5)所提出的問題]是“下單側(cè)檢驗的結(jié)果”。下單側(cè)檢驗結(jié)果的判定:若 z<za,則接受(H1:μ1<μ2);否則,就接受(H0:μ1≥μ2);PL 為下單側(cè)概率。因檢驗統(tǒng)計量z=-5.24819<-2.32635,故拒絕“H0:μ1≥μ2”,接受“H1:μ1<μ2”,即認(rèn)為受試者中“行為類型”為“B型和中間型”的PHQ-9評分的總體均值小于“A型”的PHQ-9評分的總體均值(P=7.6799E-8<0.01)。
輸出結(jié)果的第3部分[回答上述式(6)所提出的問題]是“雙側(cè)檢驗的結(jié)果”。雙側(cè)檢驗結(jié)果的判定:若|z|>z1_ha,則接受(H1:μ1≠μ2);否則,就接受(H0:μ1=μ2);PT為雙側(cè)概率。因檢驗統(tǒng)計量|z|=5.24819>2.57583,故拒絕“H0:μ1=μ2”,接受“H1:μ1≠μ2”,即認(rèn)為受試者中“行為類型”為“B型和中間型”的PHQ-9評分的總體均值不等于“A型”的PHQ-9評分的總體均值。再結(jié)合實際數(shù)據(jù),可得出結(jié)論:前者均值小于后者均值(P=0.000000154<0.01)。
在解決實際問題時,一般對同一個問題只需要實施上述三個檢驗(指“上單側(cè)”“下單側(cè)”和“雙側(cè)”檢驗)中的某一個,而不是三個都同時要實施。一般來說,僅在已知總體服從正態(tài)分布且總體方差已知的條件下,均值比較才適合選用“Z檢驗”,否則,應(yīng)根據(jù)具體情況,選擇“t檢驗”或“秩和檢驗”[3]。
通常情況下,進(jìn)行一般差異性檢驗時都采取“雙側(cè)檢驗”,因為雙側(cè)檢驗比單側(cè)檢驗保守一些。而僅在有“專業(yè)知識為依據(jù)的場合下”,才可以采取“單側(cè)檢驗”。例如,若在臨床上可以認(rèn)為“某兩種藥合用的效果”肯定比“單用其中一種藥的效果”好,進(jìn)行一般差異性檢驗時,可以考慮選用“單側(cè)檢驗”(若擬進(jìn)行非劣效性檢驗或優(yōu)效性檢驗,其本身就要求進(jìn)行單側(cè)檢驗)。在選擇采取“上單側(cè)檢驗”還是“下單側(cè)檢驗”時,需結(jié)合具體問題以及將何者視為第1組,在此基礎(chǔ)上,再結(jié)合“備擇假設(shè)”來確定“具體方向(指‘上’還是‘下’單側(cè)檢驗)”。實際問題提示的方向應(yīng)與“備擇假設(shè)的方向”一致。例如,在本文例2中,若有理由進(jìn)行單側(cè)檢驗,則宜選用“下單側(cè)檢驗”。
本文結(jié)合兩個實例,介紹了單組設(shè)計和成組設(shè)計條件下一元定量資料一般差異性Z檢驗及SAS實現(xiàn)。對常規(guī)的“雙側(cè)檢驗”及兩種“單側(cè)檢驗”都進(jìn)行了介紹,以期為實際工作者合理選擇假設(shè)檢驗方法開闊了思路、提供更多的備選方案。雖然本文所介紹的方法計算量并不大,但不便于直接采用國際通用的統(tǒng)計軟件(SAS、SPSS、R等)[4-7]來實現(xiàn)。