張?zhí)灬?,孫鳳,董圣杰,楊智榮,武珊珊,田金徽
Meta分析可以定量、科學(xué)地整合研究結(jié)果,已在許多科學(xué)領(lǐng)域取得顯著成果[1],在醫(yī)學(xué)領(lǐng)域中??捎糜诒容^不同干預(yù)措施有益還是有害。在臨床中,針對同一種疾病常存在多種干預(yù)措施,醫(yī)師決策時需根據(jù)所有可獲得的證據(jù)對不同干預(yù)措施進(jìn)行全面比較,但在實(shí)際情況下,干預(yù)措施的療效間往往缺乏可靠證據(jù)或尚無直接比較證據(jù),該問題可能需要通過兩種途徑解決:一是開展同時評估多種干預(yù)措施利弊的隨機(jī)對照臨床試驗(yàn),但存在諸多困難,可行性較差;二是通過網(wǎng)絡(luò)Meta分析(network meta-analyses,NMA)在一個證據(jù)體中同時評估多個干預(yù)措施,通過合成直接和間接比較的證據(jù),可獲得證據(jù)體中任一對比較的干預(yù)措施之間更為精確的相對效應(yīng)估計,并根據(jù)測量結(jié)局(如有效性和安全性)的優(yōu)劣進(jìn)行排序[2],由于NMA的上述優(yōu)勢,越來越多方法學(xué)團(tuán)隊(duì)聚焦于直接和間接證據(jù)整合理論和方法,自Lumley[3]提出NMA的概念及Meta回歸分析策略以來,基于不同的學(xué)術(shù)觀點(diǎn),已有多個研究團(tuán)隊(duì)提出各自的NMA模型和分析策略,如貝葉斯分層模型、頻率學(xué)方法、圖論法等[4],并可由諸多強(qiáng)力軟件實(shí)現(xiàn)[5],如WinBUGS、R、Stata、SAS、Stan等。本文通過文獻(xiàn)梳理NMA相關(guān)理論進(jìn)展,對NMA統(tǒng)計模型、建模策略、分析策略和統(tǒng)計軟件進(jìn)行總結(jié),并給出選擇建議和注意事項(xiàng)。
1.1 觀測數(shù)據(jù)和缺失數(shù)據(jù)大多數(shù)NMA統(tǒng)計模型(如經(jīng)典Lu & Ades模型[6]),均以觀測到的數(shù)據(jù)(observed data)建模;而Zhang等[7]認(rèn)為,一般情況下,納入NMA中的每個研究只是對所有干預(yù)措施中感興趣的子集(如2個或3個干預(yù)措施)進(jìn)行比較,因此表示成為典型“研究×干預(yù)措施”矩陣的數(shù)據(jù)結(jié)構(gòu)非常稀疏,并以一項(xiàng)NMA研究[8]為例說明這一問題。該研究共納入117個隨機(jī)對照研究來比較12種新型抗抑郁藥物的療效,其中114個是兩臂研究,3個是三臂研究,很顯然是具有顯著缺失的不完全塊結(jié)構(gòu)數(shù)據(jù)。如果忽略了非完全隨機(jī)產(chǎn)生的缺失數(shù)據(jù),僅依賴觀測到或未觀測到的數(shù)據(jù)信息,則估計會產(chǎn)生偏倚[9]。Zhang等建議可以從不完全數(shù)據(jù)中獲得附加信息,把研究中未觀測到的臂作為缺失數(shù)據(jù),然后借用其他研究中觀測到的相關(guān)信息,基于馬爾可夫鏈蒙特卡洛(Markov chain Monte Carlo,MCMC)算法填補(bǔ),從而建立了一種新的缺失數(shù)據(jù)框架建模方法[7,9]。
1.2 數(shù)據(jù)類型與效應(yīng)尺度選擇與經(jīng)典Meta分析相同[10],根據(jù)測量結(jié)局的不同,NMA的數(shù)據(jù)類型一般也分為二分類數(shù)據(jù)(dichotomous data)、連續(xù)型數(shù)據(jù)(continuous data)、有序數(shù)據(jù)(ordinal data)、計數(shù)數(shù)據(jù)(count data)和時間事件數(shù)據(jù)(time-to-event data)等五大類。二分類數(shù)據(jù)是NMA中最常用的數(shù)據(jù)類型,一項(xiàng)調(diào)查研究表明[11],共納入186個NMA研究,其中測量結(jié)局?jǐn)?shù)據(jù)類型報告為二分類數(shù)據(jù)者111個(60%)、連續(xù)型數(shù)據(jù)者53個(28%)、時間事件數(shù)據(jù)者17個(9%)、有序數(shù)據(jù)者5個(3%);二分類數(shù)據(jù)效應(yīng)量選擇比值比(odds ratio,OR)者66個(35%)、危險比(risk ratio,RR)者44個(23%)、危險差(risk difference,RD)者0個(0%)、同時報告OR、RR、RD者1個(1%),連續(xù)型數(shù)據(jù)效應(yīng)量選擇均數(shù)差(mean difference,MD)者43個(23%)、標(biāo)化均數(shù)差(standardized mean difference,SMD)者9個(5%)、均數(shù)比(ratio of means,RoM)者1個(1%),時間事件數(shù)據(jù)效應(yīng)量選擇風(fēng)險比(hazard ratio,HR)者17個(9%),計數(shù)數(shù)據(jù)效應(yīng)量選擇率比(rate ratio,RR)者5個(3%)。
目前尚無明確的選擇效應(yīng)量的理論原則可供參考。一般認(rèn)為,根據(jù)不同測量結(jié)局?jǐn)?shù)據(jù)類型,從可解釋性和數(shù)學(xué)特性等角度考慮,選擇合適的效應(yīng)尺度[11]。以二分類數(shù)據(jù)為例,因OR具有良好的數(shù)據(jù)特性,Coory等[13]推薦在間接比較中選擇使用OR,一些學(xué)者則推薦使用RR[14],Caldwell[11]則認(rèn)為OR有時會因呈現(xiàn)大的效應(yīng)量出現(xiàn)錯誤解釋,建議采用HR(如果事件時間研究的結(jié)果是二分類數(shù)據(jù),也可由四格表計算出HR)。
建議在進(jìn)行NMA時,可以基于各種因素合理選擇效應(yīng)量:①測量結(jié)局?jǐn)?shù)據(jù)類型;②干預(yù)效應(yīng)的可交換性及可加性,在進(jìn)行Meta分析時,效應(yīng)尺度假設(shè)觀測到的干預(yù)效應(yīng)是線性可加并假設(shè)在研究間是可交換的[15];③科學(xué)依據(jù),如有時獲益危險比(RRb)和損害危險比(RRh)可能提供不同量級和方向的結(jié)果[11],再如在合并不同基線風(fēng)險的研究時,選擇RR、OR和RD等不同效應(yīng)量可能會影響干預(yù)排序等[16];④直接比較的研究間異質(zhì)性,如RD比RR、OR更容易出現(xiàn)異質(zhì)性等;⑤必要時可選擇不同效應(yīng)量,作為敏感性分析。
1.3 數(shù)據(jù)格式NMA中待分析的數(shù)據(jù),按格式一般分為標(biāo)準(zhǔn)化數(shù)據(jù)(normalized data)和非標(biāo)準(zhǔn)化數(shù)據(jù)(non-normalized data)兩種,適用于不同建模模型和擬合模型軟件要求。前者又稱為長數(shù)據(jù)或窄數(shù)據(jù),是每個研究中每個臂占一行,主要變量有研究名稱、每個臂發(fā)生事件人數(shù)和總?cè)藬?shù);后者稱為短數(shù)據(jù)或?qū)挃?shù)據(jù),是每個研究占一行,主要變量有研究名稱、所有干預(yù)措施的事件發(fā)生數(shù)和總?cè)藬?shù)。
因?yàn)镹MA部分相關(guān)術(shù)語沒有完全統(tǒng)一,為了便于后續(xù)討論,在此我們介紹和區(qū)別幾個術(shù)語:①干預(yù)(treatment)和臂(arm):前者是指待評估的藥物或醫(yī)療設(shè)備,而后者是指關(guān)于單個研究中被隨機(jī)分配到的藥物或醫(yī)療設(shè)備的患者資料(組)。②參照干預(yù)(reference treatment)和基線干預(yù)(baseline treatment):前者是指標(biāo)準(zhǔn)對照干預(yù)如安慰劑,可用于與其他陽性干預(yù)進(jìn)行比較;后者是指在每個研究中被指定為對照臂的干預(yù)。兩者在大多數(shù)情況下相同,但也可能不同。③設(shè)計(design):是僅指某試驗(yàn)中相比較干預(yù)措施組合,如Hasselblad[17]研究分析過的“AHCPR Smoking Cessation Guideline Panel”戒煙數(shù)據(jù)中共含有24個研究,有“未干預(yù)(No intervention)”、“自助(Self-help)”、“個體輔導(dǎo)(Individual counselling)”、“小組輔導(dǎo)(Group counselling)”等四種干預(yù)措施,假設(shè)分別以A、B、C、D表示,則Gritz 1992研究中含有干預(yù)措施A、B,則稱為AB設(shè)計;Cottraux 1983研究中含有干預(yù)措施A、C、D,則稱為ACD設(shè)計,依次類推,該概念在設(shè)計×干預(yù)交互模型(designby-treatment interaction model)中非常重要。
2.1 基本原理假設(shè)NMA中共含有S個研究,T個干預(yù)措施,N個直接配對比較,干預(yù)措施k相對于干預(yù)措施c(中k,c=1,2,…,T)的相對效應(yīng)為μck,實(shí)際上并不需要計算所有μck,只需要估計部分基本參數(shù)即可,基本參數(shù)μt(t=1,2,…,T-1)表示(-1)個相互獨(dú)立的合并干預(yù)效應(yīng)。簡單方法,通過選擇T個干預(yù)措施中某一個為參照(如A),則每個μt代表干預(yù)措施t相對于A(t=1,2,…,T;t≠A),所以,NMA需要估計所有μtS,因此,所有其他比較(功能參數(shù))的合并效應(yīng)則可以通過一致性等式μck=μAk-μAc=μk-μc獲得。
2.2 主要的統(tǒng)計模型簡單的網(wǎng)絡(luò)結(jié)構(gòu)為由A、B、C三個干預(yù)措施構(gòu)成的星形結(jié)構(gòu),假設(shè)有“A vs. C”和“B vs. C”直接比較的證據(jù),則可以通過校正間接比較(adjusted indirect comparison,AIC)方法按NMA一致性等式獲得“A vs. B”的證據(jù),即是最初用NMA統(tǒng)計分析的Bucher法。后來逐漸發(fā)展起來并在當(dāng)前最為流行的NMA數(shù)據(jù)統(tǒng)計分析模型如層次模型、多元Meta分析模型、Meta回歸模型、兩步策略線性模型等都是基于NMA基本原理中一致性等式,最小化需要待估計的參數(shù)數(shù)量,雖然模型各異,實(shí)質(zhì)上是等效的[18],基本上是廣義線性模型的拓展,沒有優(yōu)劣之分。在實(shí)際中,應(yīng)根據(jù)軟件實(shí)現(xiàn)模型的能力及研究者專業(yè)知識和技能來選擇的相應(yīng)的模型,基于此,本文主要介紹兩種最為流行的結(jié)構(gòu)模型(structural models):層次模型和多元Meta分析模型。
2.2.1 層次模型層次模型(hierarchical models)是NMA最常用的數(shù)據(jù)分析模型[11,18],由Lu與Ades[6]、Salanti[19]、Dias[20]等提出并不斷完善,建模靈活、易于擴(kuò)展,是目前眾多貝葉斯NMA的基礎(chǔ),核心為廣義線性模型(generalized linear model,GLM),可以通過不同的連接函數(shù)擬合服從二項(xiàng)分布、正態(tài)分布、泊松分布等指數(shù)分布的數(shù)據(jù)。英國國家健康與臨床研究所(National institute for health and clinical excellence,NICE)決策支持機(jī)構(gòu)(Decision Support Unit,DSU)制作的技術(shù)支持文檔(Technical Support Documents,TSDs)中提供了層次模型針對不同數(shù)據(jù)類型的貝葉斯NMA代碼,有興趣的讀者可以從DSU官網(wǎng)(nicedsu.org.uk)上下載學(xué)習(xí)。
設(shè)有N(i=1,2,...,N)個研究,每個研究有k(k=1,2,...,K)個干預(yù)措施(臂),第i個研究中的干預(yù)措施組合為Di(即是前文所謂的設(shè)計),第i個研究第k個臂中感興趣的參數(shù)為ηik,該參數(shù)可由不同度量模型(measurement model)用來描述數(shù)據(jù),對于二類數(shù)據(jù),以pik表示第i個研究第k個干預(yù)措施組事件發(fā)生概率,總?cè)藬?shù)ηik,發(fā)生的事件人數(shù)為rik,rik服從二項(xiàng)分布:rik~Binomial(pik,nik),而概率。
層次模型有兩種建模策略,第一種為Ades、Salanti、Dias等提出的基于對比(contrastbased)模型[21-23],指定每個研究中的臂bi作為基線參照,則有nik=μibi+δibik(k=Di)。式中μibi稱為研究截距,是固定效應(yīng),針對二分類數(shù)據(jù)表示第i個研究中臂bi的發(fā)生事件(戒煙數(shù)據(jù)中戒煙成功)比數(shù)的自然對數(shù)。δibik表示第i個研究中臂k(k=Di)相對于bi比較的特定比較效應(yīng),相應(yīng)為比數(shù)比的自然對數(shù)(lnOR),當(dāng)k=bi時,δibik=0;若k≠bi,則隨機(jī)效應(yīng)模型為模型中μ1k關(guān)鍵參數(shù),表示如果以干預(yù)措施1為參照干預(yù),對于k>1(表示在1之后)的臂k與1比較的平均干預(yù)效應(yīng),顯然μ11=0。若為固定效應(yīng)模型,則有δibik=μbik=μk=μbi。
A systematic literature search was conducted using Pubmed and EMBASE with the terms of “complete mesocolic excision”, ”CME”, “anatomy of CME”, “l(fā)aparoscopic CME” as well as “colon surgery”. Many related studies were found and we summarized and presented the findings with our clinical experience.
式中ai(ai=2,3…)表示第i研究的臂的數(shù),μti1tik=μ1tik-μ1ti1;由δi的方差-協(xié)方差矩陣可知,對于任意兩個臂之間的協(xié)方差為σ2/2。根據(jù)多元正態(tài)分布的條件分布公式可得每一個δi,1k條件分布為:
第二種為Hong[9]、Hawkins等[23]提出的基于臂(arm-based)建模策略。仍假設(shè)有N(i=1,2,...,N)個研究,每個研究有k(k=1,2,...,K)個干預(yù)措施(臂),第i個研究中臂的總數(shù)為K,s[k]表示研究中臂k,t[k]表示該臂施加給患者的干預(yù)措施,dt表示干預(yù)措施t相對于參照干預(yù)(t=1)的干預(yù)效應(yīng),顯然有d1=0,臂k事件發(fā)生數(shù)與未發(fā)生數(shù)的比值對數(shù)為ηk,μs[k]表示參照干預(yù)的研究特定測量結(jié)果,根據(jù)異質(zhì)性假設(shè)不同可分為固定效應(yīng)模型和隨機(jī)效應(yīng)模型[23]:一是,假定不同隨機(jī)效應(yīng)方差發(fā)生個體干預(yù)措施水平則為具有干預(yù)措施特定方差隨機(jī)效應(yīng)模型(Random treatment effects with treatment-specific variance),ηk=μs[k]+δs[k],t[k],式中;二是,假定所有比較間隨機(jī)效應(yīng)方差相同,則為共方差隨機(jī)干預(yù)效應(yīng)模型(random treatment effects with common variance),ηk=μs[k]+δs[k],t[k],式中;二是,如果研究間無異質(zhì)性,則為固定效應(yīng)模型ηk=μs[k]+dt[k]。
2.2.2 多元Meta分析模型多元Meta分析模型(multivariate meta-analysis model)由White等[25]在Salanti等工作基礎(chǔ)上提出,假設(shè)整個網(wǎng)絡(luò)中含有T個干預(yù)措施,研究i均為兩臂研究,其觀察效應(yīng)為yi,設(shè)T-1個基本參數(shù)μt表示tA間比較的效應(yīng),為每個研究中的系列子集,隨機(jī)項(xiàng)為δi,隨機(jī)誤差為εi;如果某些研究中不含參照干預(yù)措施A,可采用數(shù)據(jù)填補(bǔ)技術(shù)給予臂A一個極小的數(shù)據(jù)信息,NMA中所有比較均可通過基本對比來表達(dá),每個研究中報告一個或多個測量結(jié)局yitA=yit,則一致性模型為。該模型適合任意測量結(jié)局,如MD、SMD、lnRR、lnOR等??梢钥闯?,對于比較組不含臂A的研究,通過數(shù)據(jù)填補(bǔ)變?yōu)橹辽俸腥鄣难芯?,因此在每個研究中不同干預(yù)措施間的滿足方差-協(xié)方差的多元正態(tài)分布[26]。
設(shè)計×干預(yù)交互模型基于本模型發(fā)展而來[25,27],衍生出固定效應(yīng)和隨機(jī)效應(yīng)不一致性模型等。仍假設(shè)某NMA網(wǎng)絡(luò)含有T個干預(yù)措施A,B,C等等,令A(yù)作為共同參照,首先,假設(shè)納入Meta分析的研究中均含有A(對于不含臂A的研究,可通過數(shù)據(jù)填補(bǔ));令d=1,2……,D表示設(shè)計類型,假設(shè)在第d個設(shè)計(d=1至D)第i個試驗(yàn)(i=1至nd)中,干預(yù)措施J(J=B,C,……)與A比較的結(jié)果為可表示任一測量結(jié)局,如MD,SMD,logRR,logOR等等,則不一致性模型為[28]:
模型中,δAJ表示J與A間對比的總效應(yīng),可視為固定參數(shù),為感興趣的參數(shù)。表示異質(zhì)性,是指同一設(shè)計真實(shí)治療效應(yīng)的變異,一般視其為隨機(jī)效應(yīng)該模型對Σ無約束,作為非結(jié)構(gòu)化模型,在模型中,J-A對比研究間方差為K-J對比(J,K≠A)研究間方差為不同對比研究間方差確實(shí)各異。對于Σ還存在兩種可能的結(jié)構(gòu)化異質(zhì)性模型,在全結(jié)構(gòu)化異質(zhì)性模型中,假設(shè)所有干預(yù)對比有相同的研究間方差τ2,考慮J-A對比研究間方差,對于所有J允許ΣJJ=τ2,考慮K-J對比研究間方差,同樣允許ΣJK=τ2/2(J≠K),因此有Σ=τ2P(0.5),此處P(ρ)為矩陣,其對角元素等于1,遠(yuǎn)離對角元素等于項(xiàng)表示設(shè)計間不一致性,一般作為固定效應(yīng)處理[25],也可以作為隨機(jī)效應(yīng)模型處理[28],假定ωd: ~Nc(0,Σω),式中Σω為矩形矩陣,其對角線數(shù)值為對角線外其他數(shù)據(jù)為在一致性模型中,設(shè)表示研究內(nèi)誤差,假設(shè)εdi:N(0,Sdi),而假定Sdi已知。
NMA中同質(zhì)性假設(shè)和一致性假設(shè)是兩個非常重要的假設(shè)?;谕|(zhì)性假設(shè)衍生出固定效應(yīng)模型(fixed-effect model)和隨機(jī)效應(yīng)模型(random-effects model),基于一致性假設(shè)衍生出一致性模型(consistency model)和不一致性模型(inconsistency model),這些不同的模型體現(xiàn)在結(jié)構(gòu)模型中,在實(shí)際應(yīng)用中,可以結(jié)合數(shù)據(jù)特點(diǎn)、模型特點(diǎn)及擬合數(shù)據(jù)的不同模型擬合優(yōu)度來選擇。
2.3 建模策略雖然NMA統(tǒng)計模型有多種,但建模策略即是NMA的度量模型(measurement model)分為兩種:基于臂(arm-based,AB)和基于對比(contrast-based,CB),為了避免引起術(shù)語混淆,本文采用AB似然和CB似然,兩者的主要區(qū)別有:①兩者假設(shè)不同,Shuster[29]介紹了Meta分析中研究隨機(jī)(studies at random,SR)和效應(yīng)隨機(jī)(effects at random,ER)兩種隨機(jī)效應(yīng)方式,前者假設(shè)納入Meta分析中的每個研究是獨(dú)立的,后者假定每個研究的效應(yīng)是隨機(jī)的。CB似然需要ER類假設(shè),而AB需要SR類假設(shè)[7]。②兩者估計方法不同,CB似然采用近似正態(tài)來產(chǎn)生每一相對干預(yù)合并效應(yīng)量及其方差;而AB似然則可直接對每個臂的絕對效應(yīng)如ln(odds)建模[30]。③AB似然處理隨機(jī)干預(yù)效應(yīng)為臂水平治療反應(yīng)的變異[23]。
貝葉斯統(tǒng)計學(xué)與經(jīng)典統(tǒng)計學(xué)是統(tǒng)計學(xué)兩個主要學(xué)派,兩者對概率定義有所區(qū)別,而NMA也主要有貝葉斯和頻率學(xué)兩大分析策略。
3.1 貝葉斯分析框架貝葉斯統(tǒng)計綜合了未知參數(shù)的總體信息、樣本信息及先驗(yàn)信息,根據(jù)貝葉斯定理,獲得未知參數(shù)的后驗(yàn)分布,進(jìn)而對未知參數(shù)進(jìn)行統(tǒng)計推斷,因其靈活性強(qiáng),廣泛應(yīng)用于科學(xué)研究中。貝葉斯NMA全面考慮了參數(shù)的不確定性,可以用直接概率來描述這些參數(shù)(如,一種干預(yù)措施優(yōu)于另一種干預(yù)措施的概率)。貝葉斯NMA中主要采用MCMC和集成嵌套拉普拉斯近似(integrated nested Laplace approximations,INLA)兩種算法,在使用MCMC算法時要注意幾個主要問題[2]:
一是對模型中的參數(shù)合理指定先驗(yàn)分布。先驗(yàn)分布可以允許利用先驗(yàn)信息確定,但在先驗(yàn)信息或知識缺乏的情況下,常用的處理方法[31,32]:對絕對或相對效應(yīng)測量(位置參數(shù))選擇指定無信息或模糊正態(tài)先驗(yàn)分布;根據(jù)測量結(jié)局類型,對研究間異質(zhì)性標(biāo)準(zhǔn)差τ(尺度參數(shù))指定為弱信息通常是均勻先驗(yàn)分布。在NMA文獻(xiàn)中[32],無論是固定效應(yīng)模型還是隨機(jī)效應(yīng)模型,對所有研究中每個干預(yù)效應(yīng)(如μib)和基本參數(shù)(如假定以A為參照,dAB,dAC,K)通常指定的先驗(yàn)分布為正態(tài)分布Normal(0,103~5);對于隨機(jī)效應(yīng)模型中,研究間異質(zhì)性標(biāo)準(zhǔn)差τ的先驗(yàn)分布指定為均勻分布uniform(0,2~10),如果配對比較的研究稀疏,則可以指定半正態(tài)分布HN(0.5)或HN(1)[33]。二是若在后驗(yàn)分布中使用馬爾科夫蒙特卡羅鏈模擬,則判斷檢驗(yàn)馬爾科夫鏈?zhǔn)諗渴种匾?;需要指出的是,與MCMC算法相比,INLA算法費(fèi)時短且不需要收斂性診斷。三是通常使用偏差信息準(zhǔn)則(Deviance information criterion,DIC)對模型進(jìn)行比較并評估其擬合度,公式為:DIC=pD+D-,式中,pD又稱為參數(shù)的有效數(shù)量,D-用于測量模型復(fù)雜程度, 用于測量模型的擬合優(yōu)度,由偏差D(θ)度量。DIC值越小說明模型越好,一般認(rèn)為不同模型的DIC的差值在3個或以上單位即為重要差異[2,20]。四是貝葉斯模型因其復(fù)雜性和指定先驗(yàn)分布潛在的主觀性,可能會影響到研究的結(jié)果。
3.2 頻率學(xué)分析框架頻率學(xué)分析框架廣泛應(yīng)用經(jīng)典Meta分析中,但近年來涌現(xiàn)出的Meta回歸及多元Meta分析等NMA模型和方法等,均可由頻率學(xué)分析框架實(shí)現(xiàn),且具有計算速度快、不需要為參數(shù)指定先驗(yàn)、可避免蒙特卡洛誤差分析、可由Stata、R、SAS等通用軟件輕松實(shí)現(xiàn)等優(yōu)點(diǎn),也得到廣泛應(yīng)用[2,26]。在NMA中,頻率學(xué)分析方法的估計和推斷常是基于最大似然(maximum likelihood)等算法[21]。頻率學(xué)分析框架是觀察數(shù)據(jù)在假設(shè)參數(shù)值的樣本分布下的概率,得到的參數(shù)估計比貝葉斯方法更間接[34]。
因?yàn)镹MA許多技術(shù)及相關(guān)統(tǒng)計軟件,最初建立和開發(fā)時均基于貝葉斯方法,當(dāng)前大多數(shù)NMA文獻(xiàn)都是采用貝葉斯分析框架;同時,相對于頻率學(xué)方法,貝葉斯方法在處理復(fù)雜或稀疏數(shù)據(jù)時更有價值[34],因此,在NMA的數(shù)據(jù)分析時,建議首選貝葉斯方法,以頻率學(xué)方法作為敏感性分析,但對于非統(tǒng)計學(xué)專業(yè)研究者而言可能會存在不少困難。
可實(shí)NMA的軟件或程序大體可以分為三類:一是,貝葉斯統(tǒng)計分析軟件,如WinBUGS、OpenBUGS、JAGS、Stan等,可以實(shí)現(xiàn)貝葉斯NMA;二是,通用分析軟件,如Stata、R、SAS等,既可以實(shí)現(xiàn)貝葉斯NMA,也可以實(shí)現(xiàn)頻率學(xué)NMA;三是NMA專用分析包或程序,如ADDIS、GeMTC 、ITC、某些Excel插件如NetmetaXL和MetaXL等。決定進(jìn)行NMA后,需要根據(jù)數(shù)據(jù)類型、效應(yīng)量、證據(jù)類型等情況確定合適的統(tǒng)計模型和分析框架,然后再選擇合適的計算軟件,具體如表1所示[2,26]。
根據(jù)建模數(shù)據(jù)、軟件功能特點(diǎn)及易用性等方面考慮,建議WinBUGS、Stata、R等三個主要NMA軟件兩兩配合使用或三者聯(lián)用:
(1)WinBUGS是NMA中最為常用的軟件包[34,35],但對于初學(xué)者而言,學(xué)習(xí)和理解其模型代碼是一個挑戰(zhàn),且該軟件在數(shù)年操作、數(shù)據(jù)注釋和繪圖制圖等方面的功能有所欠缺[35]。建議使用JAGS,它是一個采用MCMC算法擬合貝葉斯層次模型的程序,與BUGS語言同源,但與OpenBUGS和WinBUGS有些小差異,并可由其他軟件如R調(diào)用。
(2)Stata軟件的mvmeta命令和network組命令均可擬合多元Meta分析模型[2,26],其中mvmeta功能強(qiáng)大,但在數(shù)據(jù)預(yù)處理、模型參數(shù)設(shè)置、結(jié)果圖示化等方面,需要一定的數(shù)學(xué)及統(tǒng)計學(xué)技能,初學(xué)者不易掌握;network組命令提供了數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)分析、繪制相關(guān)圖形、干預(yù)措施效果排序等功能,特別是最新版本可通過調(diào)用mvmeta命令或WinBUGS軟件等實(shí)現(xiàn)頻率學(xué)及貝葉斯NMA,分別擬合,操作方便,建議使用network組命令。這兩個命令均可在聯(lián)網(wǎng)情況下,在Stata命令輸入窗口鍵入命令:net from http://www.homepages.ucl.ac.uk/~rmjwiww/stata/,按提示完成安裝,具體使用方法,可以閱讀相關(guān)文獻(xiàn)[2,26,36]。
(3)R軟件除了有通過調(diào)用WinBUGS(如R2WinBUGS)、OpenBUGS軟件(R2OpenBUGS、BRugs、rbugs)、JAGS軟件(如R2jags、rjags、runjags)、Stan軟件(如rstan)進(jìn)行NMA的擴(kuò)展包外,還有g(shù)emtc、pcnetmeta、bnma、netmeta等幾個NMA專用包。gemtc包基于層次模型、采用對比似然建模策略,但因檢查出的錯誤未及時修改而于2020年5月28日從R綜合檔案網(wǎng)絡(luò)(comprehensive R Archive Network,CRAN)鏡像倉庫中移除。pcnetmeta包是基于臂建模策略[36],通過調(diào)用JAGS軟件,可以對二分類數(shù)據(jù)、連續(xù)型數(shù)據(jù)、計數(shù)數(shù)據(jù)等不同數(shù)據(jù)類型進(jìn)行NMA,如針對二分類數(shù)據(jù),可以計算絕對風(fēng)險(absolute risk,AR)、RD、lnOR、lnRR、OR、RR等效應(yīng)量,指定Probit連接函數(shù)建模[37,38]。bnma包用于擬合Dias[20]提出的層次模型,基于對比策略建模,通過調(diào)用JAGS軟件進(jìn)行NMA,但不需要用戶編寫JAGS代碼和設(shè)定初始值等,使用方便。
表1 網(wǎng)絡(luò)Meta分析模型及常用實(shí)現(xiàn)軟件
本文針對典型數(shù)據(jù)的NMA主流統(tǒng)計模型進(jìn)行了梳理和介紹,并給出相關(guān)的選擇和使用建議,不正之處,敬請斧正。NMA作為一種新技術(shù)和方法發(fā)展迅速,在實(shí)施時會面臨著更多的挑戰(zhàn),一些重要問題尚未完美解決,如,NMA滿足同質(zhì)性、相似性(可傳遞性)、一致性等假設(shè)的證明問題;效應(yīng)調(diào)節(jié)因子影響干預(yù)效應(yīng)大小、干預(yù)措施療效排序等問題??傊?,NMA可以對多個干預(yù)措施的有效性和安全性等進(jìn)行比較,是一種具有廣闊前景的技術(shù)和方法,但研究者在應(yīng)用時也必須注意其不足之處。