胡良平,郭辰儀(軍事醫(yī)學(xué)科學(xué)院科技部生物醫(yī)學(xué)統(tǒng)計學(xué)咨詢中心,北京100850)
上期介紹了配對設(shè)計定量資料的一般處理方法,所處理的數(shù)據(jù)存在某種一一對應(yīng)的聯(lián)系,例如同一批對象試驗前后的數(shù)據(jù)。但在有些試驗中,有時很難找到滿足配對要求的樣本,例如想要比較兩種藥物治療效果的優(yōu)劣,但兩種藥物作用在同一個病人身上會相互影響。最恰當(dāng)?shù)姆椒ň褪沁x擇病情相近的病人若干,隨機分成兩組,分別接受不同藥物治療,比較最終治療效果。對于這樣的問題,需要采用成組設(shè)計資料的分析方法。下面看一個例子。
例1 某試驗研究一種藥物治療急性腦出血的療效,試驗前進行臨床病史資料收集和CT檢查,選取符合標(biāo)準(zhǔn)者,并隨機分組。為確保對照組和治療組病人條件一致,排除非試驗因素干擾,分別測定治療前兩組病人的出血量,如表1所示[1]。
類似例1的問題在臨床科研中經(jīng)常會遇到。如果兩組對象在基線水平上存在差異,那對于試驗結(jié)果會產(chǎn)生很大的影響,導(dǎo)致試驗結(jié)果的不可信。分析兩組定量數(shù)據(jù)均值之間的差異是否具有統(tǒng)計學(xué)意義,可采用成組設(shè)計定量資料假設(shè)檢驗方法進行統(tǒng)計分析。
1.1 成組設(shè)計的定義和特點 試驗中,如果只涉及一個具有兩水平的試驗因素,即受試對象接受兩種不同的處理,而無法采用配對設(shè)計時,可采用成組設(shè)計。若試驗因素獨立于受試對象,成組設(shè)計將全部受試對象完全隨機地均分入該試驗因素的兩個水平組中,即采用完全隨機的方法分配受試對象;反之,將從兩個特定的子總體中隨機抽取受試對象。像這樣,觀測兩組受試對象接受不同處理后,比較某一觀測指標(biāo)之間差異的試驗安排方法,稱為成組設(shè)計。成組設(shè)計的正規(guī)名稱為單因素兩水平設(shè)計。
成組設(shè)計的特點是:僅涉及一個試驗因素,且該試驗因素只有兩個水平,未對其他任何重要非試驗因素進行有計劃的安排,希望通過隨機化分組或隨機抽樣來平衡所有非試驗因素在兩組間對觀測結(jié)果的干擾和影響。常見成組設(shè)計包括一元定量/定性資料成組設(shè)計和多元定量/定性資料成組設(shè)計,本文僅對定量資料成組設(shè)計進行分析解釋。
1.2 成組設(shè)計定量資料統(tǒng)計分析方法的合理選用 (1)確定試驗僅受一個因素影響,且所觀測值為定量數(shù)據(jù);(2)檢測兩組定量資料是否分別滿足正態(tài)性要求,若滿足則采用t檢驗(方差不齊時采用近似t檢驗);若有任一組定量資料不滿足正態(tài)性,則采用秩和檢驗。(3)當(dāng)檢測的是在專業(yè)上有聯(lián)系的多個定量指標(biāo)時,需采用成組設(shè)計定量資料多元方差分析。
2.1 應(yīng)用 SAS軟件分析成組設(shè)計一元定量資料 例2 沿用例1中的資料,試問兩組受試對象治療前的平均出血量之間的差異是否有統(tǒng)計學(xué)意義?對問題的分析與SAS實現(xiàn) 此資料僅有兩組病人,涉及一個具有兩水平的試驗因素。兩個水平分別為“對照組”和“試驗組”;只有一個定量指標(biāo)為“出血量”,兩組數(shù)據(jù)相互獨立,不存在關(guān)聯(lián)關(guān)系,故此定量資料屬于成組設(shè)計一元定量資料。對兩組病人的出血量分別進行正態(tài)性檢驗,若都服從正態(tài)分布,可采用成組設(shè)計一元定量資料的 t檢驗;反之,可采用成組設(shè)計一元定量資料的秩和檢驗。應(yīng)用SAS進行分析,程序如下。表中數(shù)據(jù)以空格隔開,換行無要求;注意每組水平標(biāo)志后的數(shù)據(jù)個數(shù)要與實際相符,否則程序會出錯。
/*第1步導(dǎo)入數(shù)據(jù)*/ data a; input group$n; do i=1 to n; input x@@; output; end; cards; first 20 31.31 30.85 3.43 36.26 16.30 20.54 0.43 19.91 12.76 16.36 27.05 12.93 31.67 30.87 19.65 31.60 15.39 31.69 20.25 4.765 second 26 5.80 31.04 8.28 16.49 28.83 24.74 13.53 26.82 14.06 20.49 5.75 11.59 22.83 47.27 41.03 32.65 37.70 30.42 27.81 6.65 2.84 47.18 30.18 22.60 19.52 46.38 ; run; /*第2步正態(tài)性檢驗*/ proc univariate normal noprint; var x;by group;
output out=AAA normal=W probn=P; run; ods html; /*第3步輸出正態(tài)性檢驗結(jié)果*/ proc print data=AAA noobs; var group W P; run; /*第4步輸出t檢驗結(jié)果*/ proc t test cochran data=a; class group;var x; run; /*第5步輸出秩和檢驗結(jié)果*/ proc npar1way wilcoxon data=a; class group; var x; run; ods html close;
程序說明:第1步建立數(shù)據(jù)集,“input”語句表明從數(shù)據(jù)cards中讀取相應(yīng)的數(shù)據(jù)賦值給變量;“group”用來標(biāo)記數(shù)據(jù)x是屬于哪個組;“n”表示每個組的數(shù)據(jù)數(shù)分別是多少。第2步調(diào)用univariate過程,對數(shù)據(jù)資料進行正態(tài)性檢驗;“noprint”選項表明不需要輸出結(jié)果;后面在第3步中會提取這部分的結(jié)果精簡輸出。觀察第3步結(jié)果,當(dāng)兩組數(shù)據(jù)都滿足正態(tài)性的前提下,進行第4步t檢驗。若有任何一組數(shù)據(jù)不滿足正態(tài)性,則略過第4步結(jié)果,查看第5步結(jié)果。另外,ods html語句用來將統(tǒng)計分析結(jié)果輸出成網(wǎng)頁格式。
以下為SAS輸出結(jié)果及結(jié)果解釋。
第3步輸出:
組別 W P第1組 0.927 56 0.138 57第2組 0.956 38 0.325 33
從結(jié)果可以看到,第1組和第2組正態(tài)性檢驗P值均>0.05,因此可采用第4步的t檢驗(若不滿足正態(tài)性,請參看例3非參數(shù)檢驗輸出結(jié)果)。
第4步輸出:
SAS系統(tǒng)t檢驗過程
由方差齊性檢驗結(jié)果可知,P值為0.304 2>0.05,因此認(rèn)為兩組數(shù)據(jù)所對應(yīng)的總體方差相等。在t檢驗結(jié)果中,參看方差相等的檢驗方法Pooled即可。t檢驗結(jié)果,P=0.376 3>0.05,所以可以認(rèn)為兩組數(shù)據(jù)之間的差異無統(tǒng)計學(xué)意義。本例中參看第4步結(jié)果即可,下面將第5步結(jié)果也展示出來:
SAS系統(tǒng)NPAR1WAY過程
如果上面兩組有任何一組不滿足正態(tài)性,則需參看這部分輸出結(jié)果。這是在成組設(shè)計一元定量資料秩和檢驗統(tǒng)計量基礎(chǔ)上,采用兩種近似檢驗方法(正態(tài)近似法與t近似法)求出近似檢驗統(tǒng)計量的 Z值和P值。若此處“Two-SidedPr>|Z|”的 P<0.05,則可認(rèn)為兩者之間有顯著性差異。統(tǒng)計結(jié)論: Z=-0.587 2,P=0.557 1>0.05,故按α=0.05水準(zhǔn),認(rèn)為兩組出血量的平均值之間的差異無統(tǒng)計學(xué)意義。專業(yè)結(jié)論:因兩組病人治療前出血量可認(rèn)為基本相同,當(dāng)出血量被認(rèn)為是對試驗結(jié)果唯一的重要非試驗因素時,這兩組病人之間的均衡性很好,可以接受不同水平的試驗因素的處理。
2.2 應(yīng)用 SAS軟件分析成組設(shè)計多元定量資料 上面的例子中只涉及到一個定量觀測指標(biāo),當(dāng)有多個在專業(yè)上有聯(lián)系的定量觀測指標(biāo)時,則需要采用成組設(shè)計定量資料多元方差分析方法,聯(lián)合考查兩組受試者在多個定量指標(biāo)的平均值(稱為均值向量)之間的差異是否具有統(tǒng)計學(xué)意義。
例3 比較帕羅西汀治療單純抑郁癥和抑郁合并焦慮癥病人的療效[2],選取2003年8月-12月在上海幾所三級甲等綜合性醫(yī)院就診的抑郁癥病人。在基期時已服用與未服用帕羅西汀的病人的各項SF-36評分?jǐn)?shù)據(jù)見表2(本文為突出顯示SAS分析方法[3],僅選取其中兩項指標(biāo)),試問這些病人是否能被共同用于試驗研究,還是要區(qū)分開試驗?
對問題的分析與SAS實現(xiàn) 例3中測量兩個定量指標(biāo),有兩組受試對象,屬于成組設(shè)計二元定量資料,采用成組設(shè)計定量資料二元方差分析,實現(xiàn)此分析的SAS程序如下。表中數(shù)據(jù)以空格隔開,換行無要求;注意每組編號后的數(shù)據(jù)個數(shù) n要與實際相符,否則程序會出錯。受文章篇幅限制,此處略去一些數(shù)據(jù),用“…”表示。
表2 病人在基期的生活質(zhì)量aTable 2 Patients’quality of life before treatment
/*第1步導(dǎo)入數(shù)據(jù)*/ data b; input group$n; do i=1 to n; input x1 x2@@; output; end; cards; first 20 75.23 29.57 75.27 30.22…second 18 83.22 30.70 78.81 31.12…; run; /*第2步方差分析*/ ODS html; proc glm; class group; model x1 x2=group/ss3 nouni; manova H=group; means group; run; ODS html close;
程序說明:程序中第1步是數(shù)據(jù)步,“x1”和“x2”分別代表兩個指標(biāo)生理功能A和生理功能B;第2步是過程步,是二元方差分析過程步,調(diào)用一般線性模型過程(GLM過程)對“x1”和“x2”進行二元方差分析,“ss3”表示應(yīng)用 GLM過程中第3種算法。此過程中“manova H=group”語句是進行多元方差分析,以分組為影響因素進行分析。
SAS輸出結(jié)果及結(jié)果解釋:
SAS系統(tǒng)一般線性模型過程多元方差分析
這部分給出了成組設(shè)計定量資料二元方差分析結(jié)果,同時考慮兩項指標(biāo),采用了4種統(tǒng)計分析方法,通常只看第1種。Wilks’λ=0.798,對應(yīng)的F=4.44,分子和分母自由度分別為2和35,對應(yīng)的P=0.019 1<0.05,說明就兩個指標(biāo)整體而言,兩組數(shù)據(jù)的均值向量之間的差異有統(tǒng)計學(xué)意義。
專業(yè)及統(tǒng)計結(jié)論:針對兩個指標(biāo)整體而言,基期時已服用與未服用帕羅西汀病人的各項SF-36評分?jǐn)?shù)據(jù)存在差異,其差異有統(tǒng)計學(xué)意義(Wilks’λ= 0.798,F=4.44,P<0.05)。因此,兩組病人的兩項定量指標(biāo)的平均水平不等,故不適合把它們放一起進行該試驗,需在不同組內(nèi)分別進行。
[1] 陸 磊,孫曉江,張 進,等.鹽酸甲氯芬酯治療急性腦出血的療效評價[J].藥學(xué)服務(wù)與研究,2007,7(4):271-273.
Lu Lei,Sun XiaoJiang,Zhang Jin,et al.The clinical efficacy of meclofenoxate hydrochloride in treatment of patients with acute intracerebral hemorrhage[J].Pharm Care Res,2007,7 (4):271-273.Chinese with abstract in English.
[2] 周學(xué)東,陳興寶,季建林,等.帕羅西汀治療單純抑郁癥和抑郁合并焦慮癥病人的療效比較[J].藥學(xué)服務(wù)與研究,2007,7(2): 90-93.
Zhou XueDong,Chen XingBao,Ji JianLin,et al.Comparison of the efficacy of paroxetine in treatment of pure depression and depression combined with anxiety[J].Pharm Care Res,2007,7 (2):90-93.Chinese with abstract in English.
[3] 胡良平.醫(yī)學(xué)統(tǒng)計學(xué):運用三型理論分析定量與定性資料[M].北京:人民軍醫(yī)出版社,2009:40-85.
Hu LiangPing.Medical statistics-analysis of quantitative and qualitative data with triple-type theory[M].Beijing:People’s Military Medical Press,2009:40-85.Chinese.