胡純嚴(yán) ,胡良平 ,2*
(1.軍事科學(xué)院研究生院,北京 100850;2.世界中醫(yī)藥學(xué)會(huì)聯(lián)合會(huì)臨床科研統(tǒng)計(jì)學(xué)專業(yè)委員會(huì),北京 100029*通信作者:胡良平,E-mail:lphu927@163.com)
對(duì)于列聯(lián)表資料而言,最常見的統(tǒng)計(jì)分析目的是“獨(dú)立性檢驗(yàn)(其本質(zhì)仍屬于差異性檢驗(yàn))”。但針對(duì)某些特殊的列聯(lián)表資料,其分析目的也可以是“相關(guān)分析(例如,可用Kendall’s Tau-b秩相關(guān)分析處理配對(duì)設(shè)計(jì)擴(kuò)大形式的二維列聯(lián)表資料;可用Spearman’s秩相關(guān)分析處理雙向有序二維列聯(lián)表資料)”,還可以是“線性趨勢(shì)檢驗(yàn)”(例如,可分別用Cochran-Armitage’s線性趨勢(shì)檢驗(yàn)和Lee’s線性趨勢(shì)檢驗(yàn)處理單向有序二維列聯(lián)表資料)。本文將介紹兩種單向有序二維列聯(lián)表資料及其線性趨勢(shì)檢驗(yàn)的原理和軟件實(shí)現(xiàn)的方法。
【例1】文獻(xiàn)[1]中有一個(gè)單向有序的R×2表資料,見表1。
表1 家庭月收入(元)與有無自殺意念之間關(guān)系的調(diào)查結(jié)果
【例2】文獻(xiàn)[2]中有一個(gè)單向有序的2×C表資料,見表2。
表2 治療4周末兩組臨床療效觀測(cè)結(jié)果
1.3.1 以表1資料為分析對(duì)象
若分析目的是考察“家庭月收入”與“有無自殺意念”之間是否獨(dú)立,需要選擇χ2檢驗(yàn)或Fisher’s精確檢驗(yàn);若分析目的是比較5種家庭月收入的受試對(duì)象“有自殺意念的發(fā)生率”之間的差異是否具有統(tǒng)計(jì)學(xué)意義,仍需要選擇χ2檢驗(yàn)或Fisher’s精確檢驗(yàn);若分析目的是考察“有自殺意念的發(fā)生率”是否隨著“家庭月收入的減少”而呈線性遞增或遞減趨勢(shì),則需選擇Cochran-Armitage’s線性趨勢(shì)χ2檢驗(yàn)。
【說明】對(duì)于表1資料而言,上面描述的前兩個(gè)分析目的在本質(zhì)上是完全相同的,故可選用的統(tǒng)計(jì)分析方法相同。因篇幅所限,本文只進(jìn)行Cochran-Armitage’s線性趨勢(shì)χ2檢驗(yàn)。
1.3.2 以表2資料為分析對(duì)象
若分析目的是考察“組別”與“療效”之間是否獨(dú)立,需要選擇χ2檢驗(yàn)或Fisher’s精確檢驗(yàn);若分析目的是比較兩組療效之間的差異是否有統(tǒng)計(jì)學(xué)意義,需要選擇秩和檢驗(yàn);若分析目的是考察研究組在四種“療效”等級(jí)上的“相對(duì)比例”從“痊愈”到“無效”是否呈線性遞減或遞增趨勢(shì),需要選擇Lee’s線性趨勢(shì)χ2檢驗(yàn)。
【說明】因篇幅所限,本文只進(jìn)行Lee’s線性趨勢(shì)χ2檢驗(yàn)。
表3 R×2列聯(lián)表資料的表達(dá)模式
2.2.1 檢驗(yàn)假設(shè)
設(shè)置顯著性水平為:α=0.05。
2.2.2 檢驗(yàn)統(tǒng)計(jì)量
Cochran-Armitage’sχ2檢驗(yàn)的檢驗(yàn)統(tǒng)計(jì)量[3]見下式:
【例3】沿用例1的資料,試基于SAS軟件檢驗(yàn)“有自殺意念的發(fā)生率”是否隨著“家庭月收入的減少”而呈線性遞增或遞減趨勢(shì)。
【分析與解答】為了回答所提出的問題,可選用Cochran-Armitage’sχ2檢驗(yàn),設(shè)所需要的 SAS 程序如下:
【程序說明】“tables語句”中的選項(xiàng)“trend”要求采用近似方法進(jìn)行線性趨勢(shì)檢驗(yàn);而“exact trend;”語句則要求采用精確方法進(jìn)行線性趨勢(shì)檢驗(yàn)。
【SAS輸出結(jié)果及解釋】
以上結(jié)果表明:SAS給出的檢驗(yàn)統(tǒng)計(jì)量為Z(它服從標(biāo)準(zhǔn)正態(tài)分布),但Z的平方就是自由度為1的χ2檢驗(yàn)統(tǒng)計(jì)量的值;無論采用漸近檢驗(yàn)還是精確檢驗(yàn),也無論選用單側(cè)檢驗(yàn)還是雙側(cè)檢驗(yàn),對(duì)應(yīng)的P值均大于0.05,即“有自殺意念的發(fā)生率”不會(huì)隨著“家庭月收入的減少”而呈線性遞增或遞減趨勢(shì)。
【例4】沿用例1的資料,試基于R軟件檢驗(yàn)“有自殺意念的發(fā)生率”是否隨著“家庭月收入的減少”而呈線性遞增或遞減趨勢(shì)。
【分析與解答】為了回答所提出的問題,可選用Cochran-Armitage’sχ2檢驗(yàn),設(shè)所需要的R程序如下:
【程序說明】第1行輸入表1資料的第1列數(shù)據(jù);第2行輸入表1資料的縱向合計(jì)列數(shù)據(jù);實(shí)現(xiàn)Cochran-Armitage’sχ2檢驗(yàn)的R函數(shù)為“prop.trend.test()”。
以上結(jié)果表明:χ2=1.0414,P=0.3075(注意:此計(jì)算結(jié)果與SAS輸出結(jié)果略有差別),結(jié)論同上(參見第2.3節(jié)),此處從略。
單向有序2×C表資料的表達(dá)模式見表4。
表4 結(jié)果變量為有序變量2×C列聯(lián)表資料的表達(dá)模式
3.2.1 檢驗(yàn)假設(shè)
設(shè)置顯著性水平為:α=0.05。
【說明】πj(j=1,2,…,C)代表第j列上的總體的發(fā)生率;H1a代表各列上的“總體率”呈線性遞增變化趨勢(shì);H1b代表各列上的“總體率”呈線性遞減變化趨勢(shì)。
3.2.2 檢驗(yàn)統(tǒng)計(jì)量
Lee’s線性趨勢(shì)檢驗(yàn)統(tǒng)計(jì)量[5]見下式:
由 χ2分布的定義[4]可知,上式中的“ZLinear”平方為服從自由度為1的χ2分布,即有下式成立:
【例4】沿用例2的資料,試基于SAS軟件檢驗(yàn)研究組在四種“療效”等級(jí)上的“相對(duì)比例”從“痊愈”到“無效”是否呈線性遞減或遞增趨勢(shì)。
【分析與解答】為了回答所提出的問題,可選用Lee’s χ2檢驗(yàn),設(shè)所需要的SAS程序如下:
【程序說明】“n=87”代表表2資料中的總頻數(shù);“n1=45”代表表2資料中第1行的合計(jì)頻數(shù);“cards語句”后的3列數(shù)據(jù)分別是:第1列為4個(gè)療效等級(jí)的“分值”;第2列為表2資料中的第1行頻數(shù);第3列為表2資料中的橫向合計(jì)行上的4個(gè)頻數(shù)。
結(jié)果表明:Z=-1.565746(χ2=2.452),P=0.058704,說明研究組在四種“療效”等級(jí)上的“相對(duì)比例”從“痊愈”到“無效”不呈線性遞減或遞增趨勢(shì)。
【例5】沿用例2的資料,試基于R軟件檢驗(yàn)研究組在四種“療效”等級(jí)上的“相對(duì)比例”從“痊愈”到“無效”是否呈線性遞減或遞增趨勢(shì)。
【分析與解答】為了回答所提出的問題,可選用Lee’s χ2檢驗(yàn),設(shè)所需要的R程序[6-7]如下:
【程序說明】以上程序各語句之前都省略了R軟件提示符“>”;第1行為4個(gè)療效等級(jí)的“分值”;第2行為表2資料中的第1行頻數(shù);第3行為表2資料中的第2行頻數(shù)。
結(jié)果表明:Z=-1.565746(χ2=2.452),P=0.058704,說明研究組在四種“療效”等級(jí)上的“相對(duì)比例”從“痊愈”到“無效”不呈線性遞減或遞增趨勢(shì)。
單向有序R×2表資料的線性趨勢(shì)檢驗(yàn)(簡(jiǎn)稱“前者”)與單向有序2×C表資料的線性趨勢(shì)檢驗(yàn)(簡(jiǎn)稱“后者”)在以下兩個(gè)方面存在區(qū)別。其一,變量的性質(zhì)及其水平數(shù)不同:前者的“原因變量”為“R值有序變量(R>2)”、“結(jié)果變量”為“二值變量”;而后者的“原因變量”為“二值變量”、“結(jié)果變量”為“C值有序變量(C>2)”。其二,構(gòu)建線性趨勢(shì)檢驗(yàn)統(tǒng)計(jì)量的統(tǒng)計(jì)學(xué)原理不同。前者是利用加權(quán)回歸分析的思想[8],將由R×2列聯(lián)表資料計(jì)算得到的總χ2值分解為“線性回歸分量A”和“偏離線性回歸分量B”兩部分。若A有統(tǒng)計(jì)學(xué)意義、B無統(tǒng)計(jì)學(xué)意義,說明原因變量與結(jié)果變量之間存在線性關(guān)系;若A與B都有統(tǒng)計(jì)學(xué)意義,說明原因變量與結(jié)果變量之間可能存在某種非線性關(guān)系。而后者是基于多項(xiàng)分布原理進(jìn)行推導(dǎo),構(gòu)造出檢驗(yàn)統(tǒng)計(jì)量[5,8],因篇幅所限,此處從略。
盡管SAS軟件在給出Cochran-Armitage’s線性趨勢(shì)檢驗(yàn)結(jié)果時(shí),呈現(xiàn)了單側(cè)檢驗(yàn)和雙側(cè)檢驗(yàn)兩種結(jié)果。但由于其備擇假設(shè)有兩種可能情況,而且,在一個(gè)實(shí)際問題中,只能選擇其一(遞增趨勢(shì)或遞減趨勢(shì)),故基于常識(shí)可知,線性趨勢(shì)檢驗(yàn)更適合選擇“單側(cè)檢驗(yàn)”,而不是雙側(cè)檢驗(yàn)。
值得一提的是:在對(duì)以上兩種列聯(lián)表資料進(jìn)行線性趨勢(shì)檢驗(yàn)時(shí),都涉及到如何給有序變量的各水平進(jìn)行賦值。一般來說,直接賦值“1、2、3、……”即可;若有專業(yè)知識(shí)為依據(jù),可給有序變量的各水平賦值為非連續(xù)的自然數(shù),例如 1、3、8、15、27、……對(duì)于同一個(gè)資料不同的賦值方法,所得的計(jì)算結(jié)果會(huì)略有差別,但一般不會(huì)明顯改變最終的結(jié)論。
本文呈現(xiàn)了兩種單向有序二維列聯(lián)表資料的實(shí)例和模式,給出了對(duì)其進(jìn)行線性趨勢(shì)檢驗(yàn)的原理和計(jì)算公式;基于SAS和R軟件實(shí)現(xiàn)了統(tǒng)計(jì)計(jì)算,對(duì)統(tǒng)計(jì)軟件的輸出結(jié)果進(jìn)行了解釋,并做出了統(tǒng)計(jì)結(jié)論和專業(yè)結(jié)論。