南昌大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生統(tǒng)計教研室(330006) 俞慧強(qiáng) 鄭輝烈 李 悅 劉 勇
Meta分析是一種定量綜合文獻(xiàn)資料的統(tǒng)計學(xué)分析方法,其以同一研究的多項(xiàng)獨(dú)立研究的結(jié)果為研究對象,在嚴(yán)格設(shè)計的基礎(chǔ)上,運(yùn)用適當(dāng)?shù)慕y(tǒng)計學(xué)方法對多個研究結(jié)果進(jìn)行系統(tǒng)、客觀、定量的綜合分析。隨著循證醫(yī)學(xué)在醫(yī)學(xué)領(lǐng)域的迅速興起,Meta分析研究的結(jié)論在有關(guān)疾病或醫(yī)學(xué)健康問題的預(yù)防、治療和病因研究方面越來越受到重視。由于Meta分析的研究對象是已發(fā)表的文獻(xiàn),即使采用最完備的文獻(xiàn)檢索策略,其研究結(jié)論也易受到發(fā)表偏倚的影響。所以,對于Meta分析研究,識別其納入文獻(xiàn)是否存在發(fā)表偏倚是一項(xiàng)重要的基礎(chǔ)工作。目前,診斷發(fā)表偏倚的常用方法有〔1-6〕:漏斗圖法、Egger回歸法、Begg 秩相關(guān)法、Macaskill回歸法、Richy法等方法,這些方法均是利用研究的效應(yīng)尺度與其誤差信息之間的關(guān)系所提供的信息,對Meta分析是否存在發(fā)表偏倚做出判斷。本研究擬利用文獻(xiàn)的發(fā)表時間順序和效應(yīng)尺度間的關(guān)系構(gòu)建一種新的Meta分析發(fā)表偏倚診斷方法,并與傳統(tǒng)的Egger回歸法和Begg秩相關(guān)法的診斷效果進(jìn)行比較。
在Meta分析中,其分析對象為同一研究的多個相互獨(dú)立的研究結(jié)果,每一個獨(dú)立研究稱為子研究。子研究的結(jié)果效應(yīng)(Y)圍繞其總體效應(yīng)(μY)隨機(jī)波動,且這種波動與子研究(文獻(xiàn))的發(fā)表時間順序(T)無關(guān)。利用這一規(guī)律,如以Meta分析研究子研究的發(fā)表時間順序(T)為橫坐標(biāo),以研究效應(yīng)(Y)為縱坐標(biāo)繪制散點(diǎn)圖,則散點(diǎn)隨著發(fā)表時間順序以直線Y=μY(μY=總體效應(yīng))為中心上下隨機(jī)波動,兩者相互獨(dú)立,子研究效應(yīng)量隨著發(fā)表時間順序的變化呈隨機(jī)分布,沒有趨勢性(圖1)。
基于此,我們構(gòu)建一種新的診斷發(fā)表偏倚的方法,稱為發(fā)表時間順序與效應(yīng)尺度回歸模型法,以下簡稱新方法。具體為:以文獻(xiàn)發(fā)表時間順序(T)為自變量,以子研究效應(yīng)(Y)為應(yīng)變量建立線性回歸模型E(Y)=A+βT,若無發(fā)表偏倚,則總體回歸系數(shù)β=0,反之若存在發(fā)表偏倚,則總體回歸系數(shù)β≠0。故新方法實(shí)際是通過對總體回歸系數(shù)β是否為零的檢驗(yàn),做出某Meta分析是否存在發(fā)表偏倚的診斷。
圖1 不存在發(fā)表偏倚時效應(yīng)尺度隨著發(fā)表時間順序的分布圖
新方法診斷準(zhǔn)確度的評價,需要大量的存在和不存在發(fā)表偏倚的Meta分析數(shù)據(jù)。本研究擬通過模擬得到研究數(shù)據(jù)。
(1)模擬數(shù)據(jù)的要求
本研究Meta分析效應(yīng)量選用病例對照設(shè)計的Ln(OR)。故每個模擬的子研究數(shù)據(jù)應(yīng)包含如下信息:病例組、對照組的樣本例數(shù),本研究假定兩組例數(shù)相等均用n表示;病例組的暴露例數(shù)a;對照組的暴露例數(shù)c;發(fā)表的時間順序t。
(2)模擬數(shù)據(jù)的產(chǎn)生
第一步:產(chǎn)生包含子研究的樣本例數(shù)n和發(fā)表時間順序t的模擬數(shù)據(jù)
一般來說,隨著時間的推移,同一科學(xué)問題的研究一般會出現(xiàn)樣本含量逐漸增加的趨勢,故本研究分13個時段產(chǎn)生子研究樣本例數(shù)。假定每個時段樣本例數(shù)均服從正態(tài)分布 n~N(μK,σ2)(k=1,2,…,13),每個時段分別模擬產(chǎn)生 1500、1700、1900、2100、2300、2500、2300、1700、1500、1300、1100、1100、1100 個子研究,故13個時段共產(chǎn)生22100個子研究。并記錄每個子研究模擬產(chǎn)生的先后次序?yàn)樵撟友芯康陌l(fā)表順序t。如此即得到了22100個子研究,每個子研究包含ni和ti(i=1,2,…,22100)信息的模擬數(shù)據(jù)。上述模擬數(shù)據(jù)的產(chǎn)生利用Matlab軟件的normrnd函數(shù)完成。
第二步:產(chǎn)生包含病例組暴露例數(shù)a與對照組暴露例數(shù)c的模擬數(shù)據(jù)
假定病例組和對照組的總體暴露率分別為πa和πc,利用第一步產(chǎn)生的 ni,則有 ai~ B(ni,πa)(i=1,2,…,22100),ci~ B(ni,πc)(i=1,2,…,22100)。以此參數(shù)設(shè)置分別調(diào)用Matlab軟件的Binornd函數(shù),即得ai和ci,同時記錄其產(chǎn)生的次序?yàn)閠i。重復(fù)上述過程22100次,即得22100個包含ai,ci,ti的子研究模擬數(shù)據(jù)。
第三步:無發(fā)表偏倚模擬數(shù)據(jù)抽樣框的產(chǎn)生
將第一步和第二步產(chǎn)生的模擬數(shù)據(jù)集按ti匹配合并得 22100 個含 ni,ai,ci,ti信息的子研究數(shù)據(jù)集,此即研究所用無發(fā)表偏倚數(shù)據(jù)抽樣框。
第四步:有發(fā)表偏倚模擬數(shù)據(jù)抽樣框的產(chǎn)生
對無發(fā)表偏倚數(shù)據(jù)抽樣框中的22100個子研究均進(jìn)行H0:OR=1(α=0.05)的假設(shè)檢驗(yàn),依其是否拒絕H0可將22100個子研究分成兩部分。一部分為拒絕H0的子研究,即所謂陽性結(jié)果數(shù)據(jù)集,另一部分為不拒絕H0的子研究,即所謂的陰性結(jié)果數(shù)據(jù)集。由于發(fā)表偏倚產(chǎn)生的最主要原因就是陽性結(jié)果較陰性結(jié)果有更高的發(fā)表比例。故通過設(shè)置陽性數(shù)據(jù)集和陰性數(shù)據(jù)集不同的發(fā)表比例即可得到有發(fā)表偏倚數(shù)據(jù)集。本過程利用Matlab軟件的unifrnd函數(shù)完成。由于研究是分13個時段產(chǎn)生模擬數(shù)據(jù),故陽性數(shù)據(jù)集和陰性數(shù)據(jù)集也是分13個時段設(shè)置發(fā)表比例,具體發(fā)表比例設(shè)置為:
陽性數(shù)據(jù)集:0.90,0.90,0.90,0.92,0.92,0.92,0.94,0.94,0.94,0.96,0.96,0.96,0.96
陰性數(shù)據(jù)集:0.10,0.10,0.10,0.20,0.20,0.20,0.30,0.30,0.30,0.40,0.40,0.40,0.40
第五步:抽樣產(chǎn)生Meta分析模擬數(shù)據(jù)
獲得無偏和有偏Meta分析模擬數(shù)據(jù)抽樣框后,利用unifrnd函數(shù),從抽樣框中進(jìn)行有返回的抽樣,獲得包含k個子研究的無發(fā)表偏倚或有發(fā)表偏倚的Meta分析模擬數(shù)據(jù)。
(3)參數(shù)設(shè)置
不同的參數(shù)設(shè)置,將得到不同的模擬數(shù)據(jù)。本研究變動參數(shù)設(shè)置見表1。
表1 研究變動參數(shù)設(shè)置
為考察模擬獲得的有發(fā)表偏倚數(shù)據(jù)抽樣框是否有效,本研究分析了13個時段樣本例數(shù)總體均數(shù)為(20,40,60,80,100,120,140,160,180,200,220,240,260)標(biāo)準(zhǔn)差等于15時,有偏和無偏模擬數(shù)據(jù)抽樣框中效應(yīng)值平均數(shù)和假設(shè)檢驗(yàn)P值的平均數(shù)大小,結(jié)果見表2。
表2 有偏和無偏抽樣框子研究ln(OR)值的平均值及P值均值比較
結(jié)果顯示,無偏抽樣框的子研究ln(OR)值的平均值與總體值非常接近,而有偏抽樣框的子研究ln(OR)值的平均值與總體值則相差較大;相對于無偏抽樣框,有偏抽樣框中子研究的P值的平均值更小。由此可見,本研究模擬獲得的有發(fā)表偏倚數(shù)據(jù)抽樣框是存在發(fā)表偏倚的。
由參數(shù)設(shè)置可知,樣本例數(shù)總體均數(shù)有3種設(shè)置、標(biāo)準(zhǔn)差有3種設(shè)置、子研究個數(shù)有5種設(shè)置,共得45種參數(shù)組合。病例組與暴露組5種不同的總體暴露率,對應(yīng)總體 ln(OR)取值分別為 0,0.1633,0.3272,0.4922,0.6590。固定總體ln(OR),對上述45種參數(shù)組合,每種組合模擬抽樣1000次,共得45000個Meta分析模擬數(shù)據(jù)進(jìn)行準(zhǔn)確度分析,詳見表3。表中靈敏度分析用有發(fā)表偏倚模擬數(shù)據(jù),特異度分析用無發(fā)表偏倚模擬數(shù)據(jù)(下同)。結(jié)果顯示新方法除在ln(OR)取值較小的情況下靈敏度高于傳統(tǒng)方法外,其余情況靈敏度、特異度均低于傳統(tǒng)方法。
表3 ln(OR)的不同取值條件下的靈敏度和特異度分析
由參數(shù)設(shè)置可知,總體ln(OR)有5種設(shè)置、樣本例數(shù)標(biāo)準(zhǔn)差有3種設(shè)置、子研究個數(shù)有5種設(shè)置,共得75種參數(shù)組合。固定樣本例數(shù)總體均數(shù),對上述75種參數(shù)組合,每種組合模擬抽樣1000次,共得75000個Meta分析模擬數(shù)據(jù)進(jìn)行準(zhǔn)確度分析,詳見表4。結(jié)果顯示新方法靈敏度與傳統(tǒng)方法相近,特異度低于傳統(tǒng)方法。
表4 樣本例數(shù)總體均數(shù)不同取值條件下的靈敏度和特異度分析
由參數(shù)設(shè)置可知,總體ln(OR)有5種設(shè)置、樣本例數(shù)總體均數(shù)有3種設(shè)置、子研究個數(shù)有5種設(shè)置,共得75種參數(shù)組合。固定樣本標(biāo)準(zhǔn)差,對上述75種參數(shù)組合,每種組合模擬抽樣1000次,共得75000個Meta分析模擬數(shù)據(jù)進(jìn)行準(zhǔn)確度分析,詳見表5。結(jié)果顯示新方法靈敏度與傳統(tǒng)方法相近,特異度低于傳統(tǒng)方法。
由參數(shù)設(shè)置可知,總體ln(OR)有5種設(shè)置、樣本例數(shù)總體均數(shù)有3種設(shè)置、樣本標(biāo)準(zhǔn)差有3種設(shè)置,共得45種參數(shù)組合。固定子研究個數(shù),對上述45種參數(shù)組合,每種組合模擬抽樣1000次,共得45000個Meta分析模擬數(shù)據(jù)進(jìn)行準(zhǔn)確度分析,詳見表6。結(jié)果顯示新方法靈敏度與傳統(tǒng)方法相近,特異度低于傳統(tǒng)方法。
表5 樣本例數(shù)標(biāo)準(zhǔn)差不同取值條件下的靈敏度和特異度分析
表6 子研究個數(shù)不同取值條件下的靈敏度和特異度分析
Meta分析是循證醫(yī)學(xué)研究中重要的數(shù)量化分析工具,發(fā)表偏倚是Meta分析最常見的偏倚之一,故發(fā)表偏倚的診斷在Meta分析中占有重要地位。常用的診斷發(fā)表偏倚的漏斗圖法、Egger法、Begg法均是以效應(yīng)量與其誤差信息之間的關(guān)系判斷是否存在發(fā)表偏倚。
本研究利用發(fā)表時間順序和效應(yīng)尺度間的關(guān)系構(gòu)建一種新的Meta分析發(fā)表偏倚診斷方法,通過對模擬數(shù)據(jù)分析顯示,新方法具有一定的診斷發(fā)表偏倚的能力,但與傳統(tǒng)方法相比,新方法除在OR值較小的參數(shù)條件下靈敏度優(yōu)于傳統(tǒng)方法外,其余參數(shù)條件下診斷準(zhǔn)確度均低于傳統(tǒng)方法。
本方法首次將文獻(xiàn)發(fā)表時間順序參數(shù)引入發(fā)表偏倚診斷模型,分析原理與傳統(tǒng)方法有較大差別,這就為研究發(fā)表偏倚的診斷方法提供了一種新的研究思路。總體來看,新方法的診斷準(zhǔn)確度相對于傳統(tǒng)方法沒有提高,但由于新方法與傳統(tǒng)方法診斷“發(fā)表偏倚”的理論基礎(chǔ)不同,故將兩者進(jìn)行聯(lián)合診斷有可能改善目前新舊方法診斷發(fā)表偏倚靈敏度均較低的現(xiàn)狀。另新方法原理簡單易理解,計算較簡便,利于推廣使用。
由于本研究是利用模擬數(shù)據(jù)進(jìn)行分析,故產(chǎn)生模擬數(shù)據(jù)的參數(shù)設(shè)置對分析結(jié)果有較大影響。由于本研究參數(shù)設(shè)置組合并不完全,如有偏數(shù)據(jù)產(chǎn)生過程中各時段發(fā)表比例的設(shè)置、不同的Meta分析效應(yīng)量的設(shè)置均無給予過多考慮,故本研究結(jié)果只是新方法診斷價值的初步結(jié)論。如需最終評價新方法的診斷價值,還需完善參數(shù)設(shè)置組合進(jìn)一步深入研究。
1.Light RJ,Pillemer DB.Summing Up:The Science of Reviewing Research.Cambridge MA:Harvard University Press,1984.
2.Egger M,Smith GD,Schneider M,et al.Bias in meta-analysis detected by a simple,graphical test.British Medical Journal,1997,315:629-634.
3.Begg CB,Mazumdar M.Operating characteristics of a rank correlation test for publication bias.Biometrics,1994,50:1088-1101.
4.Macaskill P,Walter SD,Irwig L.A comparison of methods to detect publication bias in meta-analysis.Stat Med,2001,20:641-654.
5.Richy F,Reginster JY.A simple method for detecting and adjusting meta-analyses for publication bias.The Internet Journal of Epidemiology,2006,3(2).
6.王珍,張永紅,徐巧巧.幾種發(fā)表性偏倚評估方法介紹.中國衛(wèi)生統(tǒng)計,2009,26(5):539-541.