許楊鵬,喻亞宇,付文杰,陶圓,吳君怡,何倩,張超
· 循證理論與實踐 ·
Meta分析中缺失標準差換算與標準化均數(shù)差估計方法簡介
許楊鵬1,2,喻亞宇1,2,付文杰1,2,陶圓1,3,吳君怡1,2,何倩1,2,張超1
系統(tǒng)評價/Meta分析通過合并多個相似研究來擴大樣本量及提高統(tǒng)計學精度,從而給出更為可靠的結(jié)果與結(jié)論,然而往往由于原始研究文獻結(jié)果報告之間差異性與不規(guī)范性,致使相關(guān)的原始數(shù)據(jù)存在不同類型的缺失,其中以連續(xù)性資料數(shù)據(jù)中標準差缺失較為常見。標準差對連續(xù)性資料中標準化均數(shù)差合并是不可或缺的,當前,方法學家就標準差缺失給出了相應(yīng)估算方法,如P值、四分位數(shù)及樣本量轉(zhuǎn)換因子等方法均較為常見。本文就連續(xù)性資料標準差與標準化均數(shù)差估計方法作簡要匯總。
Meta分析;連續(xù)性資料;標準差;標準化均數(shù)差;轉(zhuǎn)換因子
在系統(tǒng)評價中,對于研究通常用效應(yīng)量(effect size,ES)衡量干預(yù)大小。Meta分析基于效應(yīng)量匯總效益風險來指導證據(jù)的科學使用,該統(tǒng)計方法理論上基于多個樣本的匯總形式來增大統(tǒng)計精度,得出更為可靠準確的結(jié)果。然而,隨著納入研究的報道形式的差異性或多樣化導致了部分研究可能存在一定的結(jié)果報道缺失,如連續(xù)性資料中標準差(standard deviation,SD)較為常見?;谙到y(tǒng)評價/Meta分析基本原理,本文將通過實例來演示多種方法對于缺失SD的估計,以求獲取更大樣本量研究來增大合并結(jié)果可靠性與精度。
效應(yīng)量SMD的算法如下:
通過下面的公式ES的標準誤[1](standard error,SE)能夠被計算出來。
N1和N2分別是試驗組和對照組的樣本量ES和它的95%置信區(qū)間(confidence interval,CI)能夠被得到為:ES -1.96SE到ES +1.96SE。
下面要介紹的這個方法基于觀測到的范圍分布是試驗樣本量的函數(shù)。尤其當樣本量變得很大的時候,更加極限的值被觀測到有更大的可能性,相應(yīng)的被期望的值的范圍也增長了。如果能假設(shè)數(shù)據(jù)的潛在分布,就能通過樣本量和SD[2]的函數(shù)計算出被期望的值的范圍。尤其是當數(shù)據(jù)被假定為正常分布時,可以通過被制成表格的轉(zhuǎn)換因子f根據(jù)觀測到的范圍轉(zhuǎn)換出相對應(yīng)的被估算的SD。通過下面的公式:
1925年Tippett首先把通過樣本量為N且正常分布的數(shù)據(jù)估算出來的SD的范圍計算了出來并制成了表格。大量關(guān)于1/f的表格是可以使用的,包括Pearson和Hartley給出的樣本量的范圍從2到1000的詳細的結(jié)果。表1顯示了一些f的值。當樣本量很大時,如果被期望的樣本量的范圍增長了,那么相對應(yīng)的f的值就會減小。當樣本量很小時,轉(zhuǎn)換因子f的變化就很快了。對于大的樣本量,沒有被明確的制成表格,這時需要插入或者制作更加精確的表格。盡管樣本量的范圍沒有直接提供SD的信息,但是可以通過前面的方法很好的估算出來,在統(tǒng)計學上很接近最大似然估計[3]的SD,特別是當樣本量很小時。
表1 基于樣本量的轉(zhuǎn)換因子估計
表2給出了報道在Hill等[4]的研究中的3個臨床相關(guān)結(jié)果,其中總結(jié)出了被觀測的樣本量的范圍,因此可以通過上面的方法得出SD的大約值。在該研究中,對照組的24個周關(guān)節(jié)指標的范圍為58,基于一個樣本量NC為42。表1中沒有關(guān)于這個特別的數(shù)字的值,但是在40和50之間通過線性的插入得出了大約值為:0.231-(0.231-0.222) ×2÷10=0.229。因此在對照組中被評估的SD的值大約為0.229×58=13.282。對于試驗組的SD的估算使用相似的方法即可,基于它的樣本量NE=38。然后通過公式ES=(XE-XC)/SDpooled可以算出SMD=-0.188,它的95%CI為(-0.641,0.265),對于其他兩個臨床結(jié)果的ES值被顯示在表2中,通過相同的方法即可導出。
在Weber等[5]的研究中,作者報道了10到12個月CD4的中值和臨床結(jié)果的范圍:干預(yù)組中值為407.5,范圍為95到1796,樣本量NC為25。在進行對數(shù)轉(zhuǎn)換后,中值為6.01而范圍為5.31到6.86。對照組相對應(yīng)的中值為6.19,范圍為4.55到7.49。在原始數(shù)據(jù)中,中值離被觀測值的最小值比離被觀測值的最大值更近,被觀測的數(shù)據(jù)分布有歪斜。相比之下,被對數(shù)轉(zhuǎn)換的值離它的最大值和最小值差距差不多相同,顯示被轉(zhuǎn)換的數(shù)據(jù)分布更對稱。因此,我們在這里視被轉(zhuǎn)換的中值為大約的平均數(shù),在使用公式計算ES時,用它們代替原始數(shù)據(jù)中的平均數(shù)。例如之前的,我們用線性插入獲得f和相關(guān)聯(lián)的ES值。
若原始研究僅提供了組間均數(shù)差(mean difference,MD)以及SE、可信區(qū)間、t值或P值,也可以換算出SD。此時,需假設(shè)各組的SE相等,且進行Meta分析時計算出的SE將被同時應(yīng)用到試驗組和對照組,即輸入的兩組的SE是同一個值。其方法如下:
2.1 通過P值計算SD需要3步第一步通過P值計算t值[6]。若已知P值和各組樣本量(NE,實驗組;NC,對照組),則t值可以利用在Excel表格中輸入“=tinv(概率,自由度)”獲得,其中概率即為P值,自由度=(NE+NC-2)[7]。有時,研究并未報告具體的P值,而是報告P<0.05或0.01,此時可用P值的上限做概率估計,即P=0.05或0.01;但須注意的是,若組間差異無統(tǒng)計學意義,即僅報告P>0.05或0.01時,但未報告具體的P值此時則無法計算t值。第二步通過t值計算SE。將上一步計算出的t值帶入公式,計算出SE。第三步通過SE計算SD。將上一步計算出的SE代入組間SD的計算公式,計算出SD。
2.2 通過t值計算SD若研究中直接報告了t值,則重復方法二中的第二步和第三步,就可以計算出SD。
2.3 通過可信區(qū)間計算SD若試驗組和對照組的樣本量大,則,其中CI2和CI1分別是可信區(qū)間的上下限(此處默認為95%可信區(qū)間,N=NE+Nc)。
若為90%可信區(qū)間,則將3.92換為3.29;若為99%可信區(qū)間,則將3.92換為5.15。如試驗組和對照組樣本量較小,則;t值可以利用在Excel表格中輸入“=tinv(概率,自由度)”獲得,其中概率=1-0.95(當為95%可信區(qū)間時),自由度=(NE+Nc-2)。
表2 關(guān)于根據(jù)報告的樣本量范圍計算效應(yīng)量的值的例子
利用均數(shù)的可信區(qū)間計算SD,但須注意的是此處的可信區(qū)間是指試驗組或?qū)φ战M組內(nèi)均數(shù)的可信區(qū)間。一般而言,可信區(qū)間通常是指95%可信區(qū)間。若數(shù)據(jù)符合正態(tài)分布,即均值與可信區(qū)間下限的差值近似于可信區(qū)間上限與均數(shù)的差值,則可以使用以下方法計算SD:
若數(shù)據(jù)不符合正態(tài)分布,則需要考慮進行數(shù)據(jù)轉(zhuǎn)換[8](如計算原始數(shù)據(jù)的對數(shù)值);若轉(zhuǎn)換后的數(shù)據(jù)符合正態(tài)分布,則可考慮用上述方法進行轉(zhuǎn)換。
通過模擬在抗抑郁藥上的療效的相關(guān)Meta分析,在此提出兩種估算法。系統(tǒng)評價很適合這個目的,因為Hamilton Rating Scale For Depression(HRSD)[9]實際上在癥狀評估是標準的而且被用在很多被鑒定的抑郁試驗中。
4.1 從過去的Meta分析中估算在調(diào)查抗抑郁類藥物療效比較[10]的研究時,通常會采用HRSD(包括17條目或21條目)來進行抗抑郁藥物評價,且往往其評分變化的SD無法獲取,但當回顧既往類似的Meta分析時,我們發(fā)現(xiàn)相關(guān)研究已經(jīng)得出對應(yīng)部分SD,為了提供更為充足可靠的SD,此時可采用相應(yīng)部分的SD結(jié)果來估算合并的SD值。具體公式,如下:
基于1732個患者的6個研究,合并的SD對于17條的HRSD是7.6?;诎藗€研究中2129個受試者,其21條HRSD對應(yīng)的SD是8.2。
4.2 從相同的Meta分析中估算我們模擬一個在小樣本量試驗中,Meta分析估算缺失的SD在所有其他研究在相同的Meta分析中通過“l(fā)eaving-oneout”法[11]。換句話說,通過計算合并的SD為每一個試驗估算SD在相同的且使用了相同的HRSD的Meta分析中(例如17和21條),然后使用Meta分析分析這些被估算的效應(yīng)量。
應(yīng)用這兩種估算法到一個綜合的關(guān)于弗洛汀的Meta分析中,最廣泛規(guī)定的可選擇的血清素再攝取的抗抑郁藥抑制劑[12],一個經(jīng)典的抗抑郁藥阿米替林[13],在實際值和估算值之間做了下面的比較。
單獨的RCT中第j個的SMD被下面的公式計算出:
Meancj是對照組的HRSD的端點平均值,Meanaj是試驗組的HRSD的端點平均值。合并的SMD取決于隨機效應(yīng)模型[14,15]。使用ANOVA同類相關(guān)系數(shù)(intracity correlation coefficient,ICC)[16]可以檢查單個的SMD之間的一致性。利用Cochrane Collaboration的Meta分析軟件Review Manager 4.2[17]可以計算出隨機效應(yīng)模型的SMD。也可以通過固定效應(yīng)模型合并估算SMDs,其結(jié)果幾乎是一樣的,我們在此報告的結(jié)果只取決于隨機效應(yīng)模型。
當有缺失SDs的RCTs的數(shù)量小而且總的RCTs的數(shù)量大的時候,從所有其他可利用的RCTs的相同的Meta分析中去使用合并的SDs。通過比較那些已經(jīng)報告了SDs的試驗的SMDs相對于基于估算的SDs的相同試驗假設(shè)的SMDs,它是可行的而且在這里被推薦去檢測估算的合適性。當有缺失SDs的RCTs的數(shù)量大或者當所有的RCTs的數(shù)量小時,從過去的系統(tǒng)評價中借用SDs。因為小的樣本量可能容許偶然的偏差。在這個例子中Meta分析的發(fā)現(xiàn)的可信性是不安全的。
有相關(guān)研究報告中位數(shù)和四分位數(shù)間距[18],而不是直接報告均數(shù)和SD。在這種情況下,若是數(shù)據(jù)符合正態(tài)分布,則中位數(shù)和均數(shù)非常接近,可以直接用中位數(shù)代替均數(shù)進行Meta分析;但如果數(shù)據(jù)呈非正態(tài)分布,則中位數(shù)和均數(shù)相差很大,就不能用中位數(shù)代替均數(shù)。須注意的是,大多數(shù)情況下,若原始研究中采用中位數(shù)描述數(shù)據(jù)的均值,通常提示數(shù)據(jù)呈非正態(tài)分布。
四分位數(shù)間距(interquartile range,IQR)是指上四分位數(shù)和下四分位數(shù)的差值,IQR反映偏態(tài)分布數(shù)據(jù)的離散程度,類似于正態(tài)分布數(shù)據(jù)的標準差。若原始研究中采用IQR數(shù)據(jù)的離散程度,通常表明數(shù)據(jù)呈偏態(tài)分布。若研究的樣本量很大且數(shù)據(jù)分布接近正態(tài)分布,則IQR≈1.35× SD,通過此公式可以計算出SD;若不滿足上述條件,則無法通過IQR計算SD。
基于不同的SD缺失情形,可選取不同方法來進行效應(yīng)量SMD獲取。第一種方法在數(shù)據(jù)呈正態(tài)分布時,且報告了樣本量范圍和數(shù)據(jù)的最大值就可以通過轉(zhuǎn)換因子求得相對應(yīng)的SD,且樣本量越服從正態(tài)分布精確度相對越高。第二種方法需假設(shè)各組的SE相等,且進行Meta分析時計算出的SE將被同時應(yīng)用到試驗組和對照組,即輸入的兩組的SE是同一個值,此時可通過P值或t值或可信區(qū)間來計算單個研究的SD。第三種方法利用均數(shù)的可信區(qū)間計算SD,但須注意的是此處的可信區(qū)間是指試驗組或?qū)φ战M組內(nèi)均數(shù)的可信區(qū)間,當數(shù)據(jù)服從正態(tài)分布時此法很方便。第四種方法需要借助HRSD量表,在抑郁病相關(guān)的某些研究中可以使用這個方法。第五種方法需要中位數(shù)和四分位數(shù)間距,在數(shù)據(jù)呈正態(tài)分布且樣本量大時精確度越高。上述方法各具優(yōu)缺點,但正確使用仍需操作者依據(jù)不同的情形來進行方法學擇選。
[1] Barde Mohini P,Barde Prajakt J. What to use to express the variability of data: Standard deviation or standard error of mean?[J]. Perspect ClinRes,2012,3(3):113-6.
[2] George A Kelley,Kristi S Kelley. Statistical methods for meta-analysis: A brief tutorial[J]. World J Methodol,2014,2(4):27-32.
[3] Kung TL,Parhi KK. Optimized joint timing synchronization and channel estimation for communications systems with multiple transmit antennas[J]. Eurasip Journal on Advances in Signal Processing,2013, 2013(1):1-12.
[4] Hill J,Bird H,Johnson S. Effect of patient education on adherence to drug treatment for rheumatoid arthritis: a randomised controlled trial[J]. Ann Rheum Dis,2001,60(9):869-75.
[5] Weber R,Christen L,Christen S,et al. Effect of individual cognitive behaviour intervention on adherence to antiretroviral therapy: prospective randomized trial. Antivir Ther,2004,9(1):85-95.
[6] Maggio S,Sawilowsky SS. A New Maximum Test via the Dependent Samples t-Test and the Wilcoxon Signed-Ranks Test[J]. Applied Mathematics,2014,5(01):110-4.
[7] Ponton JW. Degrees of freedom analysis in process control[J]. Chemical Engineering Science,1994, 49(13):2089-95.
[8] Tu X,Zhang JJ,Shults J,et al. Power analyses for longitudinal study designs with missing data[J]. Statistics in Medicine,2007,26(15):2958-81.
[9] Knapskog AB,Barca ML,Engedal K. A comparison of the cornell scale for depression in dementia and the Montgomery-Aasberg depression rating scale in a memory clinic population[J]. Dementia & Geriatric Cognitive Disorders,2013,35(5-6):256-65.
[10] Joffe R,Sokolov S,Streiner D. Antidepressant treatment of depression: a metaanalysis[J]. Canadian Journal of Psychiatry Revue Canadienne De Psychiatrie,1997,41(10):613-6.
[11] Feng D,Chen F,Xu W. Efficient Leave-One-Out Strategy for Supervised Feature Selection[J]. Tsinghua Science & Technology,2013, 18(6):629-35.
[12] Cipriani A,Brambilla P,Barbui C,et al. Fluoxetine versus other types of pharmacotherapy for depression[J]. Cochrane Database of Systematic Reviews,2005,7(4):CD004185-CD004185.
[13] Guaiana G,Barbui C,Hotopf M,et al. Amitriptyline versus other types of pharmacotherapy for depression (Cochrane Review)[J]. Cochrane Database Syst Rev,2003,(2):CD004186.
[14] DerSimonian R,Laird N. Meta-analysis in clinical trials[J]. Control Clin Trials,1986,7(3):177-88.
[15] Furukawa TA,Guyatt GH,Grifith LE,et al. Can we individualize the number needed to treat , An empirical study of summary effect measures in meta-analyses[J]. Int J Epidemiol,2002,31(1):74-6.
[16] Gaddis ML. Statistical methodology: IV. Analysis of variance, analysis of covariance, and multivariate analysis of variance[J]. Acad Emerg Med,1998,5(3):258-65.
[17] 徐世俠,湯先華,陳海青,等. Meta分析及RevMan軟件介紹[J]. 中華醫(yī)學圖書情報雜志,2009, 8(13):62-4.
[18] 鐘振宇,蔣佩英. 中位值和穩(wěn)健四分位數(shù)間距的直觀應(yīng)用[J]. 中國科技投資,2013,(17):123-4.
本文編輯:姚雪莉
Introduction of methods for estimating standardized mean difference when missing standard deviation conversion in Meta-analysis
XU Yang-peng*, YU Ya-yu, FU Wun-jie, TAO Yuan, WU Jun-yi, HE Qian, ZHANG Chao.*Center for Evidence-Based Medicine and Clinical Research, Taihe Hospital, Hubei University of Medicine, Shiyan 442000, China. Corresponding author: ZHANG Chao, E-mail: zhangchao0803@126.com
System review/Meta-analysis get more reliable results and conclusions through combining multiple similar studies to enlarge the sample size and improve the accuracy of statistics. However, difference and non-normative among original research result documents result in the absence of different types of raw data, in which the most common absence is missing of standard deviation in continuous data. Standard deviation is necessary for pooling the standard deviation in continuous data. At present, as to the lack of the standard deviation, methodologists have provided relevant estimate methods, such as methods of P values, quartile and sample size conversion factors. In this paper, a brief summary of estimate methods for standard deviation and standardized mean differences in continuous data were made.
Meta-analysis; Continuous data; Standard deviation; Standardized mean difference; Conversion factors
R4
A
1674-4055(2016)12-1412-04
十堰市太和醫(yī)院院級項目課題(2016JJXM070)
1442000 十堰,十堰市太和醫(yī)院(湖北醫(yī)藥學院附屬)循證醫(yī)學中心;2442000 十堰,湖北醫(yī)藥學院口腔醫(yī)學院12級;3442000十堰,湖北醫(yī)藥學院影像醫(yī)學院12級
共同第一作者:許楊鵬,喻亞宇
張超,E-mail:zhangchao0803@126.com
10.3969/j.issn.1674-4055.2016.12.02