郭晉,胡良平,高輝,李長平
析因設(shè)計(jì)是生物醫(yī)學(xué)科研資料中常見的一種定量資料實(shí)驗(yàn)設(shè)計(jì)類型,本文使用國際上著名的統(tǒng)計(jì)分析系統(tǒng) SAS(statistical analysis system)軟件對析因設(shè)計(jì)定量資料進(jìn)行統(tǒng)計(jì)分析,分析實(shí)例均來自于生物學(xué)、醫(yī)學(xué)領(lǐng)域,SAS 程序編寫簡明扼要,旨在迅速提高科研工作者使用 SAS 分析、處理生物醫(yī)學(xué)科研資料的能力。
析因設(shè)計(jì)又稱全因子實(shí)驗(yàn)設(shè)計(jì),是在實(shí)驗(yàn)因素的個數(shù)≥ 2,各因素在實(shí)驗(yàn)中同時實(shí)施且所處的地位基本平等,因素之間存在一級、二級甚至更復(fù)雜的交互作用,且需要加以全面考察時所采用的一種多因素實(shí)驗(yàn)設(shè)計(jì)類型。這種設(shè)計(jì)要求將全部實(shí)驗(yàn)因素的水平進(jìn)行全面組合,每種組合叫做一個實(shí)驗(yàn)點(diǎn)(或?qū)嶒?yàn)條件),在各實(shí)驗(yàn)點(diǎn)上要求至少做 2 次以上獨(dú)立的重復(fù)實(shí)驗(yàn)。通常應(yīng)將全部受試對象完全隨機(jī)地均分入各實(shí)驗(yàn)條件所對應(yīng)的組中。顯然,該實(shí)驗(yàn)設(shè)計(jì)的實(shí)驗(yàn)次數(shù)很多,但可以對各因素之間各級交互作用的效應(yīng)估計(jì)得比較準(zhǔn)確。
當(dāng)實(shí)驗(yàn)因素的個數(shù)不少于2個且各因素之間的各級交互作用不可忽視時,在研究者的時間、人力、經(jīng)費(fèi)等條件允許的情況下,應(yīng)選用此設(shè)計(jì)。而當(dāng)實(shí)驗(yàn)中所涉及的實(shí)驗(yàn)因素及其水平數(shù)非常多(實(shí)驗(yàn)因素個數(shù)大于6)、每次實(shí)驗(yàn)時間較長或花費(fèi)較多時,不適宜選用此設(shè)計(jì)。
當(dāng)實(shí)驗(yàn)按照析因設(shè)計(jì)安排,只有一個定量觀測指標(biāo)時,所得到的實(shí)驗(yàn)結(jié)果就稱作析因設(shè)計(jì)一元定量資料。若資料滿足獨(dú)立性、正態(tài)性和方差齊性,則可以采用析因設(shè)計(jì)定量資料一元方差分析進(jìn)行處理。例1 研究銅(Cu)和維生素 E(VE)對四氯化碳(CCl4)所致肝損傷的聯(lián)合保護(hù)作用。實(shí)驗(yàn)動物為健康雄性 Wistar大鼠,共 60只,體重(190.2±25.3)g,隨機(jī)均分為10組。VE組,VE 150 mg/kg 灌胃;Cu組,分 4個劑量組,即0.05、0.10、0.20、0.40 mg/kg(以 Cu 計(jì))CuSO4·3H2O 灌胃;VE和Cu 聯(lián)合組,分 4個劑量組,即 0.05、0.10、0.20、0.40 mg/kg(以 Cu 計(jì))CuSO4·3H2O 分別與150 mg/kg VE共同灌胃;CCl4組,生理鹽水灌胃。以上各組每天定時灌胃 1 次,連續(xù) 7 d,于第 8 天各組腹腔注射玉米油溶解的CCl4230 mg/kg,6 h 后斷頭處死,立即取血和肝臟,測定血清酶學(xué)指標(biāo) GPT和GOT、組織酶學(xué)指標(biāo) SOD。測得的SOD 數(shù)據(jù)如表1 所示,并假定資料滿足參數(shù)檢驗(yàn)的前提條件,試對資料進(jìn)行統(tǒng)計(jì)分析[1]。
表1 Cu和VE 對 CCl4染毒大鼠肝臟 SOD的影響
分析與SAS:實(shí)現(xiàn)本研究確實(shí)涉及到 2個實(shí)驗(yàn)因素,即“Cu 劑量”和“VE 劑量”?!癈u 劑量”有 5個水平,即 0、0.05、0.10、0.20、0.40 mg/kg,“VE 劑量”有 2個水平,即 0、150 mg/kg,2個因素的各水平全面組合正好形成 10個組。又由于沒有專業(yè)依據(jù)表明“Cu 劑量”和“VE劑量”對指標(biāo) SOD的影響哪一個是主要因素,且 2個因素同時作用于受試對象,因此本研究所對應(yīng)的實(shí)驗(yàn)設(shè)計(jì)類型為兩因素(或 5×2)析因設(shè)計(jì)。本研究觀測指標(biāo)只有一個,即“組織酶學(xué)指標(biāo) SOD”,假定數(shù)據(jù)滿足各種參數(shù)檢驗(yàn)所需要的前提條件,故可選用兩因素(或 5×2)析因設(shè)計(jì)定量資料的一元方差分析對資料進(jìn)行處理。
具體 SAS 程序:
DATA A1;DO Cu=0.00,0.05,0.10,0.20,0.40;DO VE=0,150;DO i=1 to 6;INPUT SOD @@; OUTPUT;END;END;END;CARDS;485.6516.4485.9505.4507.1474.9474.6455.5464.4412.4488.6462.8509.8552.0498.6476.5574.9515.2;RUN;Ods html;PROC GLM DATA=A1;
343.8331.6318.1338.6360.3356.3465.2457.7449.5462.0475.3472.9430.0417.0419.3408.6405.2399.0584.5570.0576.7537.3595.1575.5448.1413.1454.4428.0424.0375.6604.3531.4605.0630.7650.9552.4517.8360.2468.7443.7412.3516.1 CLASS CU VE;MODEL SOD=CU VE CU*VE / SS3;LSMEANS CU*VE / TDIFF PDIFF;RUN; QUIT;Ods html close;
SAS 輸出結(jié)果與結(jié)果解釋:
SAS 系統(tǒng)
以上是兩因素析因設(shè)計(jì)定量資料的方差分析結(jié)果,可知Cu 劑量和VE 劑量對指標(biāo) SOD的影響都有統(tǒng)計(jì)學(xué)意義(F=21.67、P<0.0001;F=192.59、P<0.0001);兩因素之間的交互作用(Cu * VE)也有統(tǒng)計(jì)學(xué)意義(F=10.31、P<0.0001)。
Least squares means for effect Cu * VE
以上是 10個均值之間兩兩比較的結(jié)果,橫向與縱向的編號都是 1 ~ 10號,橫向與縱向交叉處就是相應(yīng)的2個均值比較的結(jié)果,上行數(shù)值代表 t 統(tǒng)計(jì)量的數(shù)值,下行數(shù)值代表相應(yīng)的概率 P 值。注意:此處“t 檢驗(yàn)”的實(shí)質(zhì)仍是方差分析,t 值平方就是方差分析中的F 值。
專業(yè)結(jié)論:Cu和VE 對 CCl4所致肝損傷大鼠肝臟的SOD 含量均有影響,且兩者的影響具有相互聯(lián)系。根據(jù)具體數(shù)據(jù)可以發(fā)現(xiàn),在Cu 所取的5個水平上,VE 使用與否對 SOD 值影響較大,且均是使用 VE 各組的SOD 均值較高;在不用 VE 時,SOD 均值隨 Cu 劑量的增加而增大,但在用 VE的情況下,Cu 劑量取 0.1 mg/kg 時 SOD均值最高。
分析表明:Cu和VE 對 CCl4所致肝損傷大鼠的肝臟具有聯(lián)合保護(hù)作用,從本例的實(shí)驗(yàn)數(shù)據(jù)來看,當(dāng) Cu 劑量取 0.1 mg/kg、VE 劑量取 150 mg/kg 時 SOD 均值最高,保護(hù)效果最好。
對于析因設(shè)計(jì)定量資料,如果有 2個或以上觀測指標(biāo)在專業(yè)上存在相互聯(lián)系或影響,對資料進(jìn)行統(tǒng)計(jì)分析時需要同時予以考慮,則此時的統(tǒng)計(jì)分析方法就叫做析因設(shè)計(jì)定量資料的多元方差分析。
例2 調(diào)查某地 1981 — 1988年出生的近百名正常與肥胖兒童,按性別分別從兩類兒童中各隨機(jī)抽取 5 名,測定他們的5 項(xiàng)血脂指標(biāo),即 Y1(甘油三脂)、Y2(膽固醇)、Y3(低密度脂蛋白)、Y4(極低密度脂蛋白)、Y5(高密度脂蛋白),數(shù)據(jù)如下。假定數(shù)據(jù)滿足參數(shù)檢驗(yàn)的前提條件,試分析肥胖與否、性別及其交互作用對這 5 項(xiàng)觀測指標(biāo)的影響是否具有統(tǒng)計(jì)學(xué)意義[2]。
Y1 Y2 Y3 Y4 Y5正常男童: 32.04 169.86 144.53 24.78 31.6455.92 175.87 136.62 11.18 28.0755.15 138.02 101.04 11.03 25.9681.83 162.08 121.73 16.37 23.9865.43 155.00 112.42 13.09 29.88正常女童: 21.84 173.85 144.95 4.37 24.5350.16 192.68 156.19 10.03 26.46140.67 135.19 77.98 28.14 29.0837.35 172.46 143.80 6.33 22.33176.37 133.30 80.99 35.27 17.03肥胖男童: 28.57 170.75 146.62 5.71 18.4131.63 190.80 159.55 6.33 24.9241.43 148.48 110.89 8.27 29.3160.41 179.61 138.83 12.08 28.6970.05 174.80 127.45 14.01 32.54肥胖女童: 107.64 144.87 95.49 21.35 27.8571.83 121.26 53.37 14.37 53.5273.47 176.47 142.01 14.69 19.7676.59 142.30 70.73 15.32 56.2532.86 153.60 122.17 6.57 24.86
分析與SAS 實(shí)現(xiàn):該資料涉及到 2個因素,一個為“兒童是否肥胖”,另一個為“兒童性別”。由于沒有專業(yè)依據(jù)來判斷“兒童是否肥胖”和“兒童性別”哪一個因素對結(jié)果變量的影響更為重要,所以認(rèn)為兩個因素對結(jié)果變量的影響同等重要,即認(rèn)為兩個因素的地位平等。因此本例資料所對應(yīng)的實(shí)驗(yàn)設(shè)計(jì)類型為兩因素(或 2×2)析因設(shè)計(jì)。
由于該資料涉及到 Y1(甘油三脂)、Y2(膽固醇)、Y3(低密度脂蛋白)、Y4(極低密度脂蛋白)、Y5(高密度脂蛋白)5個定量的結(jié)果變量,而且 5個結(jié)果變量在專業(yè)上明顯存在著相互聯(lián)系或影響,因此對資料進(jìn)行統(tǒng)計(jì)分析時宜將這 5個結(jié)果變量同時予以考慮,進(jìn)行多元統(tǒng)計(jì)分析。由于假定資料滿足參數(shù)檢驗(yàn)的前提條件,故對本例資料可采用兩因素(或 2×2)析因設(shè)計(jì)五元定量資料的方差分析處理。
具體 SAS 程序:
DATA A2;DO FAT=1 TO 2;DO SEX=1 TO 2;DO REP=1 TO 5;INPUT Y1-Y5; OUTPUT;END; END; END;CARDS;32.04 169.86 144.53 24.78 31.6455.92 175.87 136.62 11.18 28.0755.15 138.02 101.04 11.03 25.9681.83 162.08 121.73 16.37 23.9865.43 155.00 112.42 13.09 29.8821.84 173.85 144.95 4.37 24.5350.16 192.68 156.19 10.03 26.46140.67 135.19 77.98 28.14 29.0837.35 172.46 143.80 6.33 22.33176.37 133.30 80.99 35.27 17.0328.57 170.75 146.62 5.71 18.4131.63 190.80 159.55 6.33 24.9241.43 148.48 110.89 8.27 29.3160.41 179.61 138.83 12.08 28.6970.05 174.80 127.45 14.01 32.54107.64 144.87 95.49 21.35 27.8571.83 121.26 53.37 14.37 53.5273.47 176.47 142.01 14.69 19.7676.59 142.30 70.73 15.32 56.2532.86 153.60 122.17 6.57 24.86;RUN;Ods html;PROC GLM DATA=A2;CLASS FAT SEX;MODEL Y1-Y5=FAT SEX FAT*SEX / SS3;MANOVA H=FAT SEX FAT*SEX;LSMEANS FAT*SEX / SLICE=FAT;LSMEANS FAT*SEX / SLICE=SEX;LSMEANS FAT*SEX / TDIFF PDIFF;RUN; QUIT;Ods html close;
SAS 輸出結(jié)果與結(jié)果解釋:
The GLM procedure Dependent variable: Y1
Dependent variable: Y2
Dependent variable: Y3
Dependent variable: Y4
Dependent variable: Y5
以上是一元方差分析的結(jié)果,兩實(shí)驗(yàn)因素及其交互作用對 5 項(xiàng)指標(biāo)的影響均無統(tǒng)計(jì)學(xué)意義。
Multivariate analysis of variance
以上是多元方差分析的結(jié)果,兩個因素及其交互作用對5 項(xiàng)指標(biāo)整體的影響無統(tǒng)計(jì)學(xué)意義。
Least squares means
以上是兩因素各水平組合下 5 項(xiàng)指標(biāo)的校正均數(shù)。
專業(yè)結(jié)論:正常與肥胖兒童以及不同性別兒童的甘油三脂、膽固醇、低密度脂蛋白、極低密度脂蛋白、高密度脂蛋白指標(biāo)檢測結(jié)果差別不明顯,需要注意的一個問題是,本例每個實(shí)驗(yàn)點(diǎn)下僅隨機(jī)抽取了 5 例兒童進(jìn)行各項(xiàng)指標(biāo)的測量,所取的樣本較小,加之個體之間這些指標(biāo)的變異度較大,因此結(jié)論還需進(jìn)一步實(shí)驗(yàn)驗(yàn)證。
[1]Hu LP.Medical statistics quantitative and qualitative data analysis using triple-type theory.Beijing: People's Military Medical Press,2009:131-135.(in Chinese)胡良平.醫(yī)學(xué)統(tǒng)計(jì)學(xué)-運(yùn)用三型理論分析定量與定性資料.北京:人民軍醫(yī)出版社, 2009:131-135.
[2]Hu LP.The practical course in the statistical analysis for windows SAS, version 6.12 & 8.0.Beijing: Press of Military Medical Sciences,2001:270-274.(in Chinese)胡良平.Windows SAS 6.12&8.0實(shí)用統(tǒng)計(jì)分析教程.北京: 軍事醫(yī)學(xué)科學(xué)出版社, 2001:270-274.