黃 橋,鄺心穎,童鐵軍,毛 智,鄭 亮,陳 昊,賀小峰,董圣杰,張 超,仇成鳳,翁 鴻,桂裕亮,任學(xué)群*,曾憲濤,,*
1.武漢大學(xué)中南醫(yī)院循證與轉(zhuǎn)化醫(yī)學(xué)中心(武漢 430071)
2.武漢大學(xué)第二臨床學(xué)院循證醫(yī)學(xué)與臨床流行病學(xué)教研室(武漢 430071)
3.日本圣路加國際大學(xué)看護(hù)學(xué)研究科全球健康看護(hù)系(日本東京 1040045)
4.香港浸會大學(xué)數(shù)學(xué)系(香港 999077)
5.中國人民解放軍總醫(yī)院重癥醫(yī)學(xué)科(北京 100853)
6.同濟(jì)大學(xué)附屬東方醫(yī)院轉(zhuǎn)化醫(yī)學(xué)中心(上海 200120)
7.南京中醫(yī)藥大學(xué)針灸推拿學(xué)院針灸臨床教研室(南京 210029)
8.長治醫(yī)學(xué)院附屬和平醫(yī)院科教科(山西長治 046000)
9.長治醫(yī)學(xué)院第一臨床學(xué)院教學(xué)科研科(山西長治 046000)
10.煙臺市煙臺山醫(yī)院骨關(guān)節(jié)科(山東煙臺 264001)
11.十堰市太和醫(yī)院(湖北醫(yī)藥學(xué)院附屬)循證醫(yī)學(xué)中心(湖北十堰 442000)
12.南華大學(xué)附屬懷化市第一人民醫(yī)院循證醫(yī)學(xué)與臨床研究中心(湖南懷化 418000)
13.河南大學(xué)循證醫(yī)學(xué)與臨床轉(zhuǎn)化研究院(河南開封 475000)
14.武漢大學(xué)中南醫(yī)院人事處(武漢 430071)
15.武漢大學(xué)全球健康研究中心(武漢 430072)
連續(xù)變量是臨床研究中非常常見的資料類型,如血壓和空腹血糖測量值。對于連續(xù)變量的集中趨勢和變異趨勢進(jìn)行描述統(tǒng)計學(xué)時,正態(tài)分布的數(shù)據(jù)常采用均數(shù)±標(biāo)準(zhǔn)差進(jìn)行描述,偏態(tài)分布數(shù)據(jù)常采用中位數(shù)(四分位間距)或中位數(shù)(第一四分位數(shù)~第三四分位數(shù))進(jìn)行描述[1]。一般情況下,當(dāng)文獻(xiàn)中匯報效應(yīng)量為中位數(shù)時,表明文獻(xiàn)的作者知曉正態(tài)分布對連續(xù)變量描述統(tǒng)計的重要意義,根據(jù)數(shù)據(jù)的分布形態(tài)采用合適的方法。
Meta分析是循證醫(yī)學(xué)中系統(tǒng)評價的定量合成的重要部分,而數(shù)據(jù)提取是Meta分析中的重要步驟。Meta分析的制作者需要首先根據(jù)“PICO原則”和數(shù)據(jù)的類型明確收集效應(yīng)量指標(biāo)的類型,并制定詳細(xì)的提取流程。效應(yīng)量的數(shù)據(jù)主要來源于已發(fā)表的相關(guān)文獻(xiàn)、書籍、會議摘要等。目前在Meta實踐中,對于連續(xù)變量信息,制作者?;诰鶖?shù)或標(biāo)準(zhǔn)化均數(shù)及其置信區(qū)間的數(shù)據(jù)信息進(jìn)行數(shù)據(jù)合并,當(dāng)原始研究未提供均數(shù)(標(biāo)準(zhǔn)差)而僅提供中位數(shù)(四分位間距)時,常采用的策略:(1)嘗試聯(lián)系作者索取詳細(xì)數(shù)據(jù)后重新計算;(2)Meta分析時排除該文獻(xiàn);(3)根據(jù)中位數(shù)(四分位間距等)估計均數(shù)和標(biāo)準(zhǔn)差。其中,簡單轉(zhuǎn)化的策略為使用中位數(shù)代替均值,根據(jù)四分位間距計算標(biāo)準(zhǔn)差(標(biāo)準(zhǔn)差=四分位間距/1.35),但是明確獲取的數(shù)據(jù)為偏態(tài)分布,均數(shù)和中位數(shù)相差較大,四分位間距計算標(biāo)準(zhǔn)差時要求樣本量足夠大同時滿足正態(tài)分布時才能計算。Hozo SP及羅德惠等基于結(jié)局變量為正態(tài)分布的假設(shè)實現(xiàn)從樣本量、中位數(shù)、極值或四分位數(shù)到均數(shù)與標(biāo)準(zhǔn)差的估算[2-3],估算基于復(fù)雜的數(shù)學(xué)公式進(jìn)行。此外,當(dāng)樣本數(shù)據(jù)已經(jīng)確定為偏態(tài)分布,對均值和標(biāo)準(zhǔn)進(jìn)行近似估計時受數(shù)據(jù)分布的偏度影響較大,不可避免存在一定的偏差,在Meta分析中進(jìn)行多個中位數(shù)的轉(zhuǎn)換后進(jìn)行Meta合并,對結(jié)果的大小和方向可能產(chǎn)生無法預(yù)估的影響。
均數(shù)和中位數(shù)均是連續(xù)性資料的效應(yīng)量的估計和表達(dá),均可計算相應(yīng)的置信區(qū)間[4],為Meta分析進(jìn)行的效應(yīng)量合并提供可能。2018年,McGrath S等提出一系列方法實現(xiàn)單組的中位數(shù)效應(yīng)合并和兩組中位數(shù)差值的Meta合并(對應(yīng)于兩組均數(shù)差的Meta合并)[5-6],并開發(fā)相應(yīng)metamedian程序包,本文將為實現(xiàn)的原理以及實現(xiàn)方法進(jìn)行解讀,并介紹metamedian包的使用方法。
中位數(shù)是對連續(xù)變量集中趨勢的統(tǒng)計量,可進(jìn)行統(tǒng)計描述,相應(yīng)的置信區(qū)間可用于統(tǒng)計推斷。中位數(shù)與均數(shù)應(yīng)用場景不同,但具有相同的統(tǒng)計地位。
研究者根據(jù)研究目的設(shè)計并完成數(shù)據(jù)收集后,首先需要區(qū)分?jǐn)?shù)據(jù)中各個變量的類型。連續(xù)變量是常見的變量類型,在進(jìn)行描述統(tǒng)計前,需要先正態(tài)分布檢驗,其常見的方法有圖示法、Shapiro-Wilk檢驗和Kolmogorov-Smirnov檢驗。若證據(jù)顯示數(shù)據(jù)呈現(xiàn)為偏態(tài)分布,研究者常見的匯報顯示為以下三種:S1={中位數(shù)、第一四分位數(shù)、第三四分位數(shù)、樣本量},S2={中位數(shù)、最小值、最大值、樣本量},S3={中位數(shù)、第一四分位數(shù)、第三四分位數(shù)、最小值、最大值、樣本量}。
當(dāng)進(jìn)行統(tǒng)計推斷時,若連續(xù)變量的分布不滿足參數(shù)分布的形態(tài),常采用非參數(shù)檢驗方法,推斷總體分布位置和已知分布位置、兩個和多個總體分布位置是否有差異,對效應(yīng)量進(jìn)行點(diǎn)估計時,不再采用均值,而是中位數(shù),例如配對樣本的符號秩和檢驗、兩獨(dú)立樣本的秩和檢驗。單個樣本(配對樣本)的中位數(shù)可通過簡單排序方法獲得,2個獨(dú)立樣本差值的中位數(shù)常采用Hodges-Lehmann(HL)法進(jìn)行估計,需要注意的是進(jìn)行2個獨(dú)立樣本的分布位置差異的估計時,不是先計算各組中位數(shù)后計算差異,而是估計各組間差異后再計算中位數(shù)。
均值的置信區(qū)間估計基于明確的概率分布和大樣本,但中位數(shù)的分布未知,置信區(qū)間估計方法有所不同。目前常用基于樣本數(shù)據(jù)模擬抽樣的Bootstrap法,根據(jù)bootstrap樣本統(tǒng)計量的分布可以估計總參參數(shù)(中位數(shù)),然后根據(jù)百分位數(shù),如2.5%~97.5%對應(yīng)95%置信區(qū)間,或者BCa(bias corrected,accelerated)法等構(gòu)建置信區(qū)間[7]。R軟件中的“rcompanion”和“boot”等程序包可進(jìn)行單組和成組數(shù)據(jù)的中位數(shù)的置信區(qū)間的估計。需要注意的是,對于等級資料,特別是小樣本且等級水平較少時,基于Boostrap法估計的置信區(qū)間可能不可信。
當(dāng)原始研究采用均數(shù)和標(biāo)準(zhǔn)差進(jìn)行匯報時,常采用的效應(yīng)量為未標(biāo)準(zhǔn)化均數(shù)差或標(biāo)準(zhǔn)化均數(shù)差,效應(yīng)量估計的精確性采用方差進(jìn)行衡量,可進(jìn)一步計算出對應(yīng)的置信區(qū)間。根據(jù)研究設(shè)計類型常分為兩種情況:
2.1.1 成組設(shè)計
原始研究常報告各組的均數(shù)、標(biāo)準(zhǔn)差、樣本量。
其中n1和n2是各組樣本量,S1和S2是各組的標(biāo)準(zhǔn)差。
2.1.2 配對設(shè)計
Sd為前后測量差值的標(biāo)準(zhǔn)差,r為前后測量的相關(guān)系數(shù)。
因其方差的計算較為復(fù)雜,在此不作呈現(xiàn),具體可參考相關(guān)書籍。計算每個納入的原始研究的均數(shù)差和方差后,再基于倒方差法采用固定效應(yīng)模型或隨機(jī)相應(yīng)模型進(jìn)行均值差的合并,得出合并效應(yīng)的點(diǎn)估計和置信區(qū)間估計。
當(dāng)原始研究采用S1、S2或S3進(jìn)行匯報時,常采用的效應(yīng)量為中位數(shù)。合并效應(yīng)量的點(diǎn)估計和置信區(qū)間根據(jù)研究設(shè)計類型可歸納為以下2大類[5]:
2.2.1 成組設(shè)計
原始研究常報告各組的中位數(shù)、分位數(shù)、極值等,有3種估計方法。
第一,基于HL法和符號檢驗的方法,該方法未采用倒方差法進(jìn)行效應(yīng)合并。合并效應(yīng)計算中位數(shù)差值的中位數(shù)(Median of the Difference of Medians,MDM)進(jìn)行估計,主要采用HL法,具體實現(xiàn)如下:共納入k個研究,每個研究有2個組,從原始研究中觀測值主要采用中位數(shù)M1i,M2i(i=1,2,3,…k),計算M1i和M2i之間所有的差值,共k×k個,計算k2個差值的中位數(shù),即為合并效應(yīng)的點(diǎn)估計值,然后采用符號檢驗(sign test)構(gòu)建相應(yīng)的置信區(qū)間。因為符號檢驗基于離散數(shù)據(jù)的二項式分布(i=1,2,3,…k)計算累積概率,尋找第k個數(shù)滿足條件,如5%累積概率,所以采用該方法估計的95%置信區(qū)間可能不完全等于95%,受納入Meta研究個數(shù)的影響較大。
第二,基于線性分位數(shù)混合效應(yīng)模型(Linear quantile mixed model,LQMM) 進(jìn)行估計,相比于分位數(shù)回歸允許納入隨機(jī)效應(yīng),相比于線性混合效應(yīng)模型的非參數(shù)的方法,實現(xiàn)基于中位數(shù)的效應(yīng)合并。在進(jìn)行Meta合并時,將每個研究的中位數(shù)的差值作為因變量,設(shè)置隨機(jī)截距(random effect),這意味著默認(rèn)每個研究的效應(yīng)之間存在差異,由固定效應(yīng)部分和隨機(jī)效應(yīng)部分構(gòu)成,隨機(jī)部分滿足均數(shù)為0,方差為σ2的正態(tài)分布,估計截距的固定效應(yīng)部分和95%置信區(qū)間即為Meta合并效應(yīng)及其95%置信區(qū)間。
第三,基于分位數(shù)估計(Quantile estimation,QE)的方差估計。原始研究中的2組(一般為試驗組和對照組)均采用S1或S2或S3的方式進(jìn)行統(tǒng)計描述,基于現(xiàn)有信息擬合正態(tài)分布、對數(shù)正態(tài)分布、Weibull分布和Gamma分布4種參數(shù)分布,其概率密度函數(shù)為f(*),計算基于參數(shù)分布的分位數(shù)和已觀察樣本中分位數(shù)之間的差異的平方和,根據(jù)差異最小法確定最合適的參數(shù)和分布類型。中位數(shù)的差值滿足近似正態(tài)分布(公式1),則可以計算每個研究中位數(shù)差值的方差,最后采用倒方差的方法進(jìn)行效應(yīng)量的合并和置信區(qū)間的估計。
mi1、ni1、f(mi1)為第i個研究的組1的中位數(shù)、樣本量、估計的最合適概率密度函數(shù)。
2.2.2 配對設(shè)計
原始研究常報告單組中位數(shù)、分位數(shù)、極值等,有3種估計方法。第一、基于中位數(shù)的中位數(shù)(Median of Medians,MM)估計。合并效應(yīng)的點(diǎn)估計采用納入研究的中位數(shù)效應(yīng)的中位數(shù),置信區(qū)間的估計采用符號檢驗(sign test),因為符合檢驗基于P=0.5的二項式分布,當(dāng)實驗次數(shù)較大時,二項分布趨近正態(tài)分布(Normal approximation),當(dāng)采用漸近正態(tài)分布時,將納入的效應(yīng)從小到大排序(m1≤m2≤m3…mk),然后計算以下百分位數(shù)(公式2)作為95%置信區(qū)間。當(dāng)其估計其 他置信區(qū)間范圍時,替換其中的Z0.025即可。采用該方法估計的95%置信區(qū)間為漸近區(qū)間。
k為納入Meta分析的研究個數(shù),Z0.025為標(biāo)準(zhǔn)正態(tài)分布的97.5%對應(yīng)的Z分?jǐn)?shù)。
第二、基于中位數(shù)的加權(quán)中位數(shù)(Weighted Median of Medians,WMM)估計,相比前一種方法考慮權(quán)重對合并效應(yīng)估計的影響,常用的權(quán)重wi為各研究樣本量所占的比例(公式3)。按照第一種方法計算所需的分位數(shù),根據(jù)加權(quán)分位數(shù)法計算合并效應(yīng)的點(diǎn)估計值和置信區(qū)間。其中,加權(quán)分位數(shù)法首先將納入的效應(yīng)從小到大排序(m1≤m2≤m3…..mk),根據(jù)排序后的中位數(shù)對應(yīng)的權(quán)重用階梯函數(shù)繪制經(jīng)驗累積概率分布,x軸為中位數(shù)效應(yīng),y軸為累積概率,最后按y軸對比前述的分位數(shù)確定合并效應(yīng)的點(diǎn)估計和置信區(qū)間。
第三、基于分位數(shù)估計(Quantile estimation,QE)的方差估計,實現(xiàn)思路與成組設(shè)計中的QE法類似,不在進(jìn)行闡述。
對納入研究的異質(zhì)性進(jìn)行評價是Meta分析中的重要步驟,它決定我們收集的原始資料能否進(jìn)行合并。在基于中位數(shù)的Meta分析中,QE法計算出每個研究的中位數(shù)效應(yīng)量及對應(yīng)的方差,根據(jù)DerSimonian-Laird法進(jìn)行異質(zhì)性評價,可計算常見異質(zhì)性評價指標(biāo)τ2和I2等。其他方法,如MM、WMM和MDM暫未提供合適的異質(zhì)性評價。
為保證程序的正常運(yùn)行,建議從https://www.r-project.org/下載R軟件[8],選擇國內(nèi)鏡像下載安裝文件(https://mirrors.tuna.tsinghua.edu.cn/CRAN/)。本文選擇R 3.5.3版本,在64位的win10系統(tǒng)上進(jìn)行安裝,建議讀者選擇安裝RStudio。它是針對R開始的IDE,能有效編寫和存儲R腳本,管理數(shù)據(jù)、R程序包和繪制的圖片等。在菜單欄找到R x64 3.5.3并啟動,在交互式窗口(R-GUI)中的提示符“>”后輸入命令install.packages("metamedian"),安裝時會自動安裝“estmeansd”,“Hmisc”,“metafor”和“stats”程序包,等待數(shù)分鐘后完成[9]。
metamedian程序包中主要有pool.med和qe兩個函數(shù),經(jīng)過對源代碼分析和閱讀幫助文檔,pool.med函數(shù)可實現(xiàn)MM、WMM和MDM三種方法,用于合并來自配對設(shè)計和成組設(shè)計中獲取的單組的中位數(shù)效應(yīng)。qe函數(shù)采用QE法進(jìn)行單組數(shù)據(jù)和2組獨(dú)立數(shù)據(jù)的中位數(shù)效應(yīng)量合并,其先調(diào)用qe.study.level函數(shù)計算各研究效應(yīng)的方差,然后調(diào)用metafor程序包中的rma.uni函數(shù)實現(xiàn)效應(yīng)量合并。成組設(shè)計中的MDM法和LQMM法未在該程序包實現(xiàn),但MDM法可結(jié)合pool.med函數(shù)中的代碼和HL法修改完成,LQMM法則可在lqmm程序包中實現(xiàn)。
3.2.1 單組數(shù)據(jù)的合并
數(shù)據(jù)來源于metamedian程序包的幫助文件,提供單組數(shù)據(jù)表示效應(yīng)量,采用MM、WMM和qe三種方法實現(xiàn)效應(yīng)量的合并。代碼如下:
分析結(jié)果詳見表1。需要注意的是:在pool.med函數(shù)中設(shè)置norm.approx中設(shè)置為FALSE時,表明置信區(qū)間的估計不采用漸近正態(tài)分布估計,而采用符號檢驗。此時,如果納入的研究小于6,程序會提示“Not enough studies for exact coverage >= 95% CI”,該警告未在幫助文件中說明。此外,當(dāng)使用加權(quán)分位數(shù)估計法時,文獻(xiàn)中說明權(quán)重是與納入研究的樣本量成比例且之和為1,但在實際的R實踐中因pool.med函數(shù)調(diào)用的是“Hmisc”程序包中的wtd.quantile函數(shù),需要公式3中的權(quán)重乘以100后作為參數(shù)傳入。
3.2.2 成組數(shù)據(jù)的合并
數(shù)據(jù)來源于metamedian程序包的幫助文件,常見S1、S2或S3的格式進(jìn)行匯報時,本例以S1格式的數(shù)據(jù)為例,其他形式僅修改和添加對應(yīng)參數(shù)即可,代碼如下:
分析結(jié)果見表2。其中,qe函數(shù)中可通過single.family參數(shù)指定兩組的參數(shù)分布是否一致,默認(rèn)為FALSE。loc.shift參數(shù)指定兩組的參數(shù)分布的差異是否僅限定為位置參數(shù)偏倚,而不考慮參數(shù)分?jǐn)?shù)的其他特征,默認(rèn)為FALSE。loc.shift參數(shù)指定兩組的參數(shù)分布的差異是否僅限定為位置參數(shù)偏倚,而不考慮參數(shù)分?jǐn)?shù)的其他特征,默認(rèn)為FALSE。
表1 三種方法實現(xiàn)單組中位數(shù)數(shù)據(jù)的Meta合并Table 1.Three methods to achieve meta-analysis of single group median data
表2 QE法實現(xiàn)成組數(shù)據(jù)的中位數(shù)Meta合并Table 2.Performing meta-analysis of group median data using the QE method
隨著生物統(tǒng)計分析在研究報告規(guī)范中的不斷強(qiáng)化,強(qiáng)調(diào)針對數(shù)據(jù)的分布形態(tài)采用合適的方法進(jìn)行統(tǒng)計描述和統(tǒng)計推斷。循證醫(yī)學(xué)的快速發(fā)展,Meta分析的需求越來越多,針對連續(xù)變量的效應(yīng)量合并時,目前大部分研究采用均數(shù)(標(biāo)準(zhǔn)差)的效應(yīng)量進(jìn)行Meta合并。而當(dāng)納入的文獻(xiàn)因數(shù)據(jù)為非正態(tài)分布時,匯報的中位數(shù)(四分位間距等)為效應(yīng)量,對Meta分析造成一定困擾。均數(shù)和中位數(shù)均為連續(xù)變量集中趨勢的體現(xiàn),均可計算相應(yīng)的置信區(qū)間,從而衡量效應(yīng)量的大小、準(zhǔn)確度和精度。目前對中位數(shù)作為效應(yīng)量進(jìn)行Meta研究不多,本文基于前人研究對中位數(shù)合并的原理進(jìn)行總結(jié),并對技術(shù)細(xì)節(jié)進(jìn)行闡述,以幫助讀者理解實現(xiàn)的前提、原理和常用方法。成組設(shè)計的數(shù)據(jù)中的Meta合并主要有MDM、LQMM和QE三種方法,單組設(shè)計的數(shù)據(jù)中主要有MM、WMM和QE三種方法[5]。QE法適用廣泛,基于4種參數(shù)分布進(jìn)行嘗試,選擇最佳的參數(shù)分布來估計每個研究效應(yīng)的方差,可實現(xiàn)異質(zhì)性的定性定量評價。
R軟件作為一款免費(fèi)的統(tǒng)計分析及繪圖軟件,其開放性使得研究者能快速實現(xiàn)不同算法并分享,越來越受到研究者的青睞。R軟件中有metafor和metaplus等程序包可以實現(xiàn)均數(shù)(標(biāo)準(zhǔn)差)效應(yīng)的Meta合并[10-11]。本文對R軟件metamedian程序包實現(xiàn)中位數(shù)效應(yīng)量的分析過程和結(jié)果進(jìn)行了展示。讀者在實際操作過程中根據(jù)納入數(shù)據(jù)的不同形態(tài)可進(jìn)行亞組分析,效應(yīng)量為均數(shù)及95% CI和效應(yīng)量為中位數(shù)及95% CI分別進(jìn)行合并。目前該程序包中還未加入森林圖和異質(zhì)性的圖形評價的繪制,讀者可根據(jù)forest等程序包實現(xiàn)?;赗的開源特征,metamedian程序包的功能會在未來逐步完善。
利益沖突:所有作者聲明不存在利益沖突。