趙曉蒙,李炳海,王素珍#,任艷峰,王小禮
1)濰坊醫(yī)學(xué)院公共衛(wèi)生學(xué)院衛(wèi)生統(tǒng)計學(xué)教研室 濰坊 261053 2)濰坊醫(yī)學(xué)院財務(wù)處 濰坊 261053 3)山東省腫瘤醫(yī)院放療科 濟南 250117
基于傾向指數(shù)匹配法的局限期小細胞肺癌的生存分析*
趙曉蒙1),李炳海2),王素珍1)#,任艷峰1),王小禮3)
1)濰坊醫(yī)學(xué)院公共衛(wèi)生學(xué)院衛(wèi)生統(tǒng)計學(xué)教研室 濰坊 261053 2)濰坊醫(yī)學(xué)院財務(wù)處 濰坊 261053 3)山東省腫瘤醫(yī)院放療科 濟南 250117
#通訊作者,女,1967年1月生,博士,教授,研究方向:臨床試驗設(shè)計方法及信息處理,E-mail: wangsz@wfmc.edu.cn
傾向指數(shù);匹配法;局限期小細胞肺癌;生存分析
目的:應(yīng)用傾向指數(shù)匹配法均衡組間的協(xié)變量,評價單純應(yīng)用放療(CRT)與三維適形放療聯(lián)合化療(CCRT)對局限期小細胞肺癌(LD-SCLC)的治療效果。方法LD-SCLC患者224例,其中CRT 109例,CCRT 115例。基線資料包括性別(1=男,0=女)、年齡、吸煙(1=是,2=否)、結(jié)核(1=有,2=無)、家族史(1=有,2=無)、TNM分期(1=Ⅰ期,2=Ⅱ期, 3=ⅢA期,4=ⅢB期)、血清神經(jīng)元特異性烯醇化酶(NSE)水平、KPS評分、腫瘤數(shù)量(1=單個,2=多個)等。以分組變量為因變量,以協(xié)變量為自變量,建立logistic回歸模型,計算傾向指數(shù),然后按照傾向指數(shù)進行組間卡鉗匹配。分別對匹配前后的數(shù)據(jù)進行生存分析。結(jié)果匹配前CRT組和CCRT組的中位生存期(95%置信區(qū)間)分別為2.15(1.96~2.48)和2.37(2.06~2.72) a,1 a生存率分別為82.65%和83.36%,2 a生存率分別為59.02%和64.30%,3 a生存率分別為25.28%和29.34%,兩組生存曲線差異無統(tǒng)計學(xué)差異(χ2=2.173,P=0.186)。兩組共94對匹配成功。匹配后CRT組和CCRT組的中位生存期(95%置信區(qū)間)分別為2.14(1.75~2.44)和2.75(2.38~2.92) a,1 a生存率分別為82.24%和85.36%,2 a生存率分別為56.39%和66.20%,3 a生存率分別為23.44%和34.37%,兩組生存曲線差異有統(tǒng)計學(xué)意義(χ2=11.045,P=0.008)。結(jié)論采用傾向指數(shù)匹配法能有效降低非隨機化臨床試驗數(shù)據(jù)的混雜偏倚。
小細胞肺癌(small cell lung cancer, SCLC)占肺癌的15%~20%,其中局限期小細胞肺癌(limited disease SCLC,LD-SCLC)約占SCLC的1/3。盡管LD-SCLC對初始化療和放療高度敏感,但因緩解期短、容易局部復(fù)發(fā)或遠處轉(zhuǎn)移,故預(yù)后較非小細胞肺癌差?;熓荢CLC的標準治療方案,而胸部放療的加入是SCLC治療史上的里程碑。20世紀90年代進行的幾項meta分析數(shù)據(jù)已證明胸部放療能將LD-SCLC患者的2 a生存率提高5%~7%,并使局部復(fù)發(fā)率降低25%~30%[1-2]。但放療與化療結(jié)合的時機和方式等問題仍有待進一步探討。傾向指數(shù)是Rosenbaum和Rubin[3]于1983年提出的估計不完全隨機試驗處理效應(yīng)的一種方法,通過平衡組間的協(xié)變量,降低偏倚。作者以從山東省腫瘤醫(yī)院收集的單純放療(CRT)及三維適形放療聯(lián)合化療(CCRT)治療的LD-SCLC患者的臨床隨訪資料為基礎(chǔ)(患者在選擇治療方案時并未經(jīng)過嚴格的隨機化[4-6]),應(yīng)用傾向指數(shù)匹配法對兩個處理組的協(xié)變量進行均衡化處理,并對匹配前后的生存情況進行對比分析,評價兩種治療方法的臨床療效。
1.1病例資料病例均來自于2005年至2011年山東省腫瘤醫(yī)院收治且確診的LD-SCLC患者,排除惡性胸腔積液患者,患者均無嚴重的可能影響治療計劃實施的內(nèi)科疾病、嚴重的心肝腎等疾病及骨髓功能障礙。其中CRT組109例,CCRT組115例,基線資料包括性別(1=男,0=女)、年齡、吸煙(1=是,2=否)、結(jié)核(1=有,2=無)、家族史(1=有,2=無)、TNM分期(1=Ⅰ期,2=Ⅱ期, 3=ⅢA期,4=ⅢB期)、血清神經(jīng)元特異性烯醇化酶(NSE)水平(u/mL)、KPS評分、腫瘤數(shù)量(1=單個,2=多個)等。在山東省腫瘤醫(yī)院隨訪科的配合下,通過電話、書信和電子郵件隨訪獲得生存資料,隨訪時間為5 a。
1.2研究方法傾向指數(shù)匹配法是以治療方式為因變量,以協(xié)變量為自變量,建立logistic模型,根據(jù)模型計算每個LD-SCLC患者的傾向指數(shù);采用傾向指數(shù)最近距離匹配法對組間相同或相近的個體進行配對,并將差值設(shè)定在某個范圍內(nèi),即為卡鉗匹配[7-8],該研究中卡鉗值設(shè)置為0.20[9]。匹配前后,分別對兩組間協(xié)變量的分布進行比較,定量變量采用兩獨立樣本t檢驗或者t′檢驗,定性變量采用χ2檢驗;采用Kaplan-Meier 法繪制生存曲線,采用log-rank檢驗比較兩組的生存曲線。傾向指數(shù)的匹配以及所有的統(tǒng)計分析均采用SAS 9.2編程完成[10-11]。檢驗水準α=0.05。
2.1匹配之前分析結(jié)果原始資料中納入模型的協(xié)變量[7]共有性別、年齡、吸煙、結(jié)核、家族史、TNM分期、血清NSE水平、KPS評分、腫瘤數(shù)量。采用傾向指數(shù)匹配之前, 吸煙、KPS評分、腫瘤數(shù)量3個協(xié)變量在組間分布不均衡,檢驗結(jié)果見表1;生存分析結(jié)果表明兩組的生存曲線差異無統(tǒng)計學(xué)意義,見表2。
表1 傾向指數(shù)匹配前兩組患者的協(xié)變量分布
表2 傾向指數(shù)匹配前兩組生存資料的比較
2.2匹配之后分析結(jié)果采用傾向指數(shù)法對兩組數(shù)據(jù)進行卡鉗匹配,共有94對匹配成功。匹配之后,納入模型的9個協(xié)變量組間分布差異均無統(tǒng)計學(xué)意義,結(jié)果見表3。用匹配之后的94對新樣本進行生存分析,結(jié)果見表4,從表4可以看出,兩組生存曲線差異有統(tǒng)計學(xué)意義,CCRT的治療效果優(yōu)于CRT。
表3 傾向指數(shù)匹配后兩組患者的協(xié)變量分布
表4 傾向指數(shù)匹配后兩組生存資料的比較
在非隨機化或隨機化遭到破壞的醫(yī)學(xué)研究中,兩個處理組之間的多個協(xié)變量分布往往是不均衡的,要正確評價兩種處理的效果,必須考慮處理組之間協(xié)變量分布不均衡對結(jié)果的影響。在觀察性研究及其他非隨機化研究中,可以考慮運用傾向指數(shù)匹配法平衡協(xié)變量。傾向指數(shù)匹配法就是調(diào)整觀測數(shù)據(jù)中的混雜因素,做類似隨機化的均衡處理[8,12-13]。傾向指數(shù)匹配法能夠減少觀察性研究和非隨機化研究中的選擇性偏倚,該方法易于理解,結(jié)果便于解釋,研究步驟標準化程度高,不需要構(gòu)建明確的線性模型,且檢驗方法簡單。Logistic回歸分析是非隨機化研究中處理二分類資料的常用方法。Logistic回歸用于分析結(jié)局變量與協(xié)變量之間的定量關(guān)系,推斷的是關(guān)聯(lián)關(guān)系,而傾向指數(shù)匹配法推斷的是因果關(guān)系,在因果關(guān)系論證強度上大于logistic回歸分析。傾向指數(shù)匹配法同樣適用于混雜因素很多,結(jié)局變量發(fā)生率很低的情況,而logistic回歸法并不適合[14]。由于傾向指數(shù)是協(xié)變量的一個函數(shù),協(xié)變量不論多少都可以綜合成為一個傾向得分來表示,實際上起到了降維的作用,而且傾向指數(shù)匹配法操作簡便,容易理解,能夠很好地對結(jié)果進行解釋。另外,某些非隨機化臨床試驗,如醫(yī)療器械的臨床評價、Ⅳ期臨床試驗等,可以通過傾向得分方法進行分析[15]。
該研究中兩個處理組多個協(xié)變量的組間分布并不均衡,而這些協(xié)變量對LD-SCLC患者的生存時間、預(yù)后等均有較大影響,忽略這些協(xié)變量的影響,生存分析的結(jié)果就會有較大的偏倚。通過采用傾向指數(shù)匹配法均衡協(xié)變量,兩組除了處理因素和結(jié)果變量分布不同外,其他協(xié)變量均衡可比,使數(shù)據(jù)達到了“接近隨機分配數(shù)據(jù)”的效果[14-17],增強了兩組的可比性,消除了混雜因素對結(jié)果的影響。生存分析結(jié)果表明,化療聯(lián)合放療治療LD-SCLC,其效果優(yōu)于單純放療。放療聯(lián)合化療的綜合治療可以大大提高LD-SCLC患者的生存期,值得在臨床上廣泛應(yīng)用。該研究也表明,在無法實現(xiàn)隨機化的臨床試驗研究中,采用傾向指數(shù)匹配法平衡組間協(xié)變量的不均衡不失為一種好的方法。
[1]Pignon JP,Arriagada R,Ihde DC,et al.A meta-analysis of thoracic radiotherapy for small-cell lung cancer[J].N Engl J Med,1992,327(23):1618
[2]Warde P,Payne D.Does thoracic irradiation improve survival and local control in limited-stage small-cell carcinoma of the lung:a meta-analysis[J].J Clin Oncol,1992,10(6):890
[3]Rosenbaum PR,Rubin DB.The central role of the propensity score in observational studies for causal effects[J].Biometrika,1983,70(1):41
[4]Hong S,Youn YN,Yi G,et al.Long term results of ST-segment elevation myocardial infarction versus non-ST-segment elevation myocardial infarction after off-pump coronary artery bypass grafting: propensity score matching analysis[J].J Korean Med Sci,2012,27(2):153
[5]Berger JS,Herout PM,Harshaw Q,et al.Bleeding-associated outcomes with preoperative clopidogrel use in on- and off-pump coronary artery bypass[J].J Thromb Thrombolysis,2012,34(1):56
[6]Choi AH,Barnholtz-Sloan JS,Kim JA.Effect of radiation therapy on survival in surgically resected retroperitoneal sarcoma: a propensity score-adjusted SEER analysis[J].Ann Oncol,2012,23(9):2449
[7]Linden A,Adams JL.Combining the regression discontinuity design and propensity score-based weighting to improve causal inference in program evaluation[J].J Eval Clin Pract,2012,18(2):317
[8]Austin PC,Mamdani MM.A comparison of propensity score methods: a case-study estimating the effectiveness of post-AMI statin use[J].Stat Med,2006,25(12):2084
[9]王永吉,蔡宏偉,夏結(jié)來,等.傾向指數(shù)第二講:傾向指數(shù)常用研究方法[J].中華流行病學(xué)雜志,2010,31(5):584
[10]Carpenter A.Carpenter's complete guide to the SAS macro language[M].2nd ed.SAS Institute,2004.
[11]Brookhart MA,Schneeweiss S,Rothman KJ,et al.Variable selection forpropensity score models[J].Am J Epidemiol,2006,163(12):1149
[12]Hullsiek KH,Louis TA.Propensity score modeling strategies for the causal analysis of observational data[J].Biostatistics,2002,3(2):179
[13]Scrutinio D,Passantino A,Catanzaro R,et al.Inpatient cardiac rehabilitation soon after hospitalization for acute decompensated heart failure: a propensity score study[J].J Cardiopulm Rehabil Prev,2012,32(2):71
[14]Foody JM,Cole CR,Blackstone EH,et al.A propensity analysis of cigarette smoking and mortality with consideration of the effects of alcohol[J].Am J Cardiol,2001,87(6):706
[15]Yaginuma K,Kasai T,Miyauchi K,et al.Propensity score analysis of 10-year long-term outcome after bypass surgery or plain old balloon angioplasty in patients with metabolic syndrome[J].Int Heart J,2011,52(6):372
[16]王永吉,蔡宏偉,夏結(jié)來,等.傾向指數(shù)匹配法與Logistic回歸分析方法對比研究[J].現(xiàn)代預(yù)防醫(yī)學(xué),2011,38(12):2217
[17]王永吉,蔡宏偉,夏結(jié)來,等.傾向指數(shù)第一講:傾向指數(shù)的基本概念和研究步驟[J].中華流行病學(xué)雜志,2010,31(3):347
(2013-04-24 收稿 責任編輯 王 曼)
Survival analysis for limited disease small cell lung cancer based on propensity score matching method
ZHAOXiaomeng1),LIBinghai2),WANGSuzhen1),RENYanfeng1),WANGXiaoli3)
1)DepartmentofHealthStatistics,FacultyofPreventativeMedicine,WeifangMedicalCollege,Weifang261053 2)FinancialDepartment,WeifangMedicalCollege,Weifang261053 3)DepartmentofRadiotherapy,TumorHospitalofShandongProvince,Jinan250117
propensity score; matching method; limited disease small cell lung cancer; survival analysis
Aim: To compare the effects of single chemotherapy (CRT) and conformal radiotherapy combined with chemotherapy(CCRT) on limited disease small cell lung cancer(LD-SCLC) patients after balancing the covariates by propensity score. Methods: A total of 224 LD-SCLC patients were subjected,among which,109 accepted CRT, and 115 accepted CCRT. A logistic regression model was established,and the treatment assignment was taken as the dependent variable and the covariates as the independent variables. For each LD-SCLC patient, the propensity score was calculated for caliper matching and a survival analysis of the matched data was carried out.Results: Before matching, the median survival time (95%CI) of CRT and CCRT were 2.15(1.96-2.48) and 2.37(2.06-2.72) years,respectively; one-, two-, and three-year survival rates were 82.65% and 83.36%, 59.02% and 64.30%,25.28% and 29.34%, respectively. There was no significant difference in survival curve between the two groups (χ2=2.173,P=0.186). A total of 94 pairs patients were matched by propensity score. After matching, the median survival time(95%CI) of CRT and CCRT were 2.14(1.75-2.44) and 2.75(2.38-2.92) years; One-, two-, and three-year survival rates were 82.24% and 85.36%, 56.39% and 66.20%, 23.44% and 34.37%, respectively. There was a significant difference in survival curve between the two groups (χ2=11.045,P=0.008). Conclusion: Propensity score matching can effectively reduce the confounding bias of non-randomized clinical observational data.
*國家自然科學(xué)基金項目 81141112,81101290;山東省自然科學(xué)基金項目 ZR2009CM117
R734.2
10.3969/j.issn.1671-6825.2014.01.017