濰坊醫(yī)學院公共衛(wèi)生學院流行病與衛(wèi)生統(tǒng)計學研究所(261053)
李志華△ 劉洪慶
·方法介紹·
1:M配比病例對照研究資料分析方法的探討*
濰坊醫(yī)學院公共衛(wèi)生學院流行病與衛(wèi)生統(tǒng)計學研究所(261053)
李志華△劉洪慶
目的 通過對幾種分析方法的比較,探討1:M配比病例對照研究資料分析便捷實現(xiàn)形式。方法 以《流行病學》教材給出的病例對照研究實例和相關文獻報道為資料,采用《醫(yī)學統(tǒng)計學與電腦實驗》、《流行病學研究方法與應用》、Pike與Morrow介紹的方法進行驗證比較,對χ2檢驗公式整合與分解,采用Excel軟件編制χ2檢驗和OR估計值的計算表。結(jié)果 《流行病學研究方法與應用》介紹的方法與Pike與Morrow(1970)報道的方法驗證結(jié)果相同,分析原理相同。《醫(yī)學統(tǒng)計學與電腦實驗》介紹的方法是建立在病例對照研究分層分析法總χ2值的計算,且沒有進行連續(xù)的校正,χ2值偏高。結(jié)論 通過對χ2檢驗公式的整合與分解,采用Excel軟件編制χ2檢驗和OR值計算表,可以便捷分析1:M配比病例對照研究的資料。
1:M配比的病例對照研究χ2檢驗 分析方法
病例對照研究是流行病學常用的研究方法之一,是臨床流行病學研究罕見病病因的最佳方法?!读餍胁W》第5版[1]、第6版[2]和第7版[3]在研究實例部分均介紹了美國Vincent紀念醫(yī)院的Herbst醫(yī)生對陰道腺癌病因研究的例子。該報道是采用1:4配比的病例對照研究方法,并指出資料分析采用Pike和Morrow(1970)非參數(shù)檢驗[4]。我們先后采用《醫(yī)學統(tǒng)計學與電腦實驗》(第二版)[5]、《流行病學研究方法與應用》(第二版)[6]、Pike與Morrow[7]介紹的方法進行了驗證,發(fā)現(xiàn)按照分層分析的原理分析1:M配比的病例對照研究資料,不同程度地高估了暴露效應。本文就1:M配比資料的χ2檢驗和OR值的估計方法進行了探討。
1.《流行病學》教材給出的實例[1-3]和Herbst文獻報道[4]
美國Vincent紀念醫(yī)院的Herbst醫(yī)生對陰道腺癌病因研究,病例組和對照組的母親部分主要暴露因素的分析結(jié)果,見表1。
2.分析方法
分別采用方積乾主編《醫(yī)學統(tǒng)計學與電腦實驗》、趙仲堂主編《流行病學研究方法與應用》和Pike 和Morrow關于1:M配比設計的資料分析方法[5-7]。
1.分析結(jié)果
以表1為例,除母親年齡外,其他因素分別采用上述3種分析方法,結(jié)果見表2。
注①Herbst報道中未見OR值。②P值按分布臨界值表估計。③Pike與Morrow在該文獻中沒有給OR計算方法。
從表2結(jié)果可以看出,4種分析方法對各個因素的統(tǒng)計學意義影響不大,但是《醫(yī)學統(tǒng)計學與電腦實驗》介紹的方法所計算的值明顯高于其他方法,也就是說實際對應的P值減小。
2.原理分析
(1)《醫(yī)學統(tǒng)計學與電腦實驗》1:M配比設計的資料分析原理
當危險因素按二項分類時,1:M配比的可能結(jié)果有2(M+1)種。設全部資料共有k個配比組。對第i個配比組的結(jié)果表達,見表3。
分析原理:Yi為指示變量,當病例接觸危險因子時,令Yi=1,否則令Yi=0;Xi表示在M個對照中接觸危險因子的例數(shù)。
(1)
(2)
式中符號對應表3所示之含義。
(3)
式中ai、bi、ci、di分別代表第i層四個格子的數(shù),n1i、n0i、m1i、m0i分別代表四格表的行與列合計,ni代表第i層樣本總例數(shù)。
2.《流行病學研究方法與應用》關于1:M配比資料的分析[6]
資料整理成表4。
(1)估計優(yōu)勢比(OR):
(4)
(5)
其中:
(3)Pike與Morrow介紹的方法[7]
根據(jù)Pike與Morrow的文獻報道,資料整理成表5。
表和公式中的m表示配比數(shù),在無效假設前提下,自由度v=1時,總的χ2檢驗近似公式是:
(6)
其中:
E(mm,i)=nm,i×i/(m+1)
V(mm,i)=nm,i×i×(m+1-i)/(m+1)2
3.χ2檢驗公式的整合與分解
根據(jù)Pike與Morrow以及近些年來國內(nèi)學者的意見,依據(jù)表5資料整理格式,將檢驗公式(6)整合成公式(7),然后分解成公式(8)。按照公式(8)和公式(4),采用Excel軟件編制了χ2檢驗和OR估計值的計算表,以“以往流產(chǎn)史與她們的女兒發(fā)生陰道腺癌的關系”為例,見表7。
(7)
∑[nc,i×i×(c+1)-nc,i×i2]
(8)
*:χ2=7.16,OR=10.50,95%CI(1.88,58.74)
結(jié)論:χ2所得值與《流行病學研究方法與應用》1:M配比資料的分析結(jié)果完全一致,統(tǒng)計學意義無需贅述。
在罕見病病因的研究中,由于病例數(shù)極少,采用配比的方法能夠提高檢驗效率,王天根認為1:1配比是最浪費信息的設計,當病例是罕見的疾病而對照相對較易獲得的時候,常采用1:M配比,其設計一般最多配比數(shù)為4,配比數(shù)量繼續(xù)增加,檢驗效能增加幅度將越來越低[8]。
通過查閱1980年以來國內(nèi)相關文獻,發(fā)現(xiàn)按照分層分析的方法,不但每層的例數(shù)僅有1+4個,而且四格表中每個格子的理論值將均小于5,有的甚至小于1,按照卡方檢驗的基本原理,應該采用確切概率法直接求P值。Mantel-Haenszel(1959)提出了直接進行卡方檢驗的方法。Pike與Morrow在1970基于卡方檢驗的基本原理提出了本文前述的分析方法。
按照分層分析法計算的χ2值均大于其他方法,Pike與Morrow分析方法是基于χ2檢驗的基本原理,即(實際頻數(shù)-理論頻數(shù))/方差,符合1:M配比資料中每個對子實際暴露數(shù)多小于5的資料。前者在計算公式中沒有使用連續(xù)校正,是不符合于檢驗的基本原理的。
OR95%置信區(qū)間的估計,一般采用Woolf自然對數(shù)轉(zhuǎn)換法和Miettnen氏卡方值法,與王書平[11]采用SAS自編程序比較,Miettnen氏卡方值法估計的置信區(qū)間的范圍比較窄,因此其計算置信區(qū)間的精確度比較高。Woolf自然對數(shù)轉(zhuǎn)換法是建立在OR方差的基礎上,主要使用表格中的原始數(shù)據(jù),而Miettnen氏卡方值法與卡方值的聯(lián)系比較大。因此本文例題中OR95%置信區(qū)間的估計均采用Miettnen氏卡方值法。
[1]李立明,主編.流行病學.第5版.北京:人民衛(wèi)生出版社,2003,81-82.
[2]李立明,主編.流行病學.第6版.北京:人民衛(wèi)生出版社,2007,86-87.
[3]詹思延,主編.流行病學.第7版.北京:人民衛(wèi)生出版社,2012,101-102.
[4]Herbst AL,Ulfelder H,Poskanze DC.Adenocarcinoma of the Vagina -Association of Maternal Stilbestrol Therapy with Tumor Appearance in Young Women.N Engl J Med,1971,284(15):878-881.
[5]方積乾,主編.醫(yī)學統(tǒng)計學與電腦實驗.第2版.北京:人民衛(wèi)生出版社,2001:319-323.
[6]趙仲堂,主編.流行病學研究方法與應用.第2版.北京:人民衛(wèi)生出版社,2005:89-90.
[7]Pike MC,Morrow RH.Statistical analysis of patient-control studies factor under investigation an all-or-none variable.Brit J Prev Soc Med,1970,24(1):42-44.
[8]王天根,主編.流行病學研究方法.北京:人民衛(wèi)生出版社,1991,83-119.
[9]魏承毓,張漢民,李遂初,等,主編.實用流行病學.蘭州:甘肅科學技術出版社,1989:81-114.
[10]沈福民,主編.流行病學原理與方法.上海:復旦大學出版社,2001:37-53.
[11]王書平.1:M配對病例-對照研究中兩種可信區(qū)間的SAS 分析方法.中國衛(wèi)生統(tǒng)計,2011,28(5):606-607.
(責任編輯:郭海強)
2013年濰坊醫(yī)學院科技創(chuàng)新研究基金資助(K1301008)
△通信作者:李志華