濰坊醫(yī)學(xué)院公共衛(wèi)生學(xué)院衛(wèi)生統(tǒng)計學(xué)教研室(261053) 呂軍城 王素珍
傾向指數(shù)匹配法在肺癌化療效果評價中的應(yīng)用*
濰坊醫(yī)學(xué)院公共衛(wèi)生學(xué)院衛(wèi)生統(tǒng)計學(xué)教研室(261053) 呂軍城 王素珍△
目的收集臨床肺癌病人觀測資料,按照臨床化療方法不同將肺癌病人分為NP方案(長春瑞濱+順鉑)和TP方案(紫杉醇+順鉑)兩組,用傾向指數(shù)匹配法均衡兩組間的混雜因素,比較匹配前后差異,評價兩種治療方案的效果。方法采用logistic回歸計算肺癌病人的傾向指數(shù),按照傾向指數(shù)進行組間卡鉗匹配,采用Kaplan-Meier法對匹配后的數(shù)據(jù)進行分析,用log-rank檢驗比較兩組生存差異。結(jié)果匹配前協(xié)變量在兩組中不均衡,NP方案組和TP方案組的中位生存期分別為2.360年和2.100年,兩組生存率無統(tǒng)計學(xué)差異(P=0.0516),匹配后協(xié)變量在兩組中得到很好均衡,NP方案組和TP方案組的中位生存時間分別變?yōu)?.560年和2.180年,生存率間有統(tǒng)計學(xué)差異(P=0.0134)。結(jié)論傾向指數(shù)法能夠彌補臨床觀測數(shù)據(jù)的不足,通過匹配可有效降低組間混雜偏倚,有利于對肺癌患者不同治療方案療效做出更準(zhǔn)確評價。
傾向指數(shù) 匹配法 肺癌 生存分析
評價藥物或者治療方法的最佳方案是隨機對照的臨床試驗(random ized controlled trial,RCT),然而在實際臨床中,受倫理學(xué)和病人病情等因素的限制,不可能在治療之前規(guī)定患者嚴(yán)格按照隨機化臨床試驗方案進行治療,也就是說隨機化的實施往往面臨較大困難[1-3]。當(dāng)隨機化試驗在臨床上難以實現(xiàn)時,混雜因素在組間的不平衡性就會影響療效的評價,導(dǎo)致對不同治療方案的效果評價出現(xiàn)偏倚。為了對組間差異做出正確的評價,需首先將組間混雜因素平衡,然后再進行統(tǒng)計分析評價,傾向指數(shù)法(propensity score)是解決此問題的一種實用方法[4-5]。近年來得到越來越多的關(guān)注。
1.資料來源
本研究肺癌患者臨床觀測數(shù)據(jù)來自2007-2012年山東省內(nèi)多家醫(yī)院和腫瘤科室。收集的指標(biāo)有性別、年齡、職業(yè)、吸煙史、結(jié)核病史、癌胚抗原(CEA)、家族史、神經(jīng)特異性希酸化酶(NSE)、病灶數(shù)目、是否轉(zhuǎn)移、病理類型、臨床分期(cTNM)以及治療方式。其中,化療方式分為NP方案(長春瑞濱+順鉑)和TP方案(紫杉醇+順鉑)兩種。共收集肺癌患者386例,排除信息不全或邏輯錯誤病例36例,最后NP方案患者159例,TP方案患者191例。在醫(yī)院隨訪科室的配合下,根據(jù)患者病歷登記的電話和地址,采用電話隨訪或書信隨訪方式獲得患者生存結(jié)局及生存時間。
2.分析方法
由于臨床獲得的患者觀測數(shù)據(jù)并非由隨機化臨床試驗得到,多個協(xié)變量在兩組間的分布不均衡。為了減少協(xié)變量分布不平衡對生存分析結(jié)果的影響,采用傾向指數(shù)匹配法均衡協(xié)變量,達(dá)到近似隨機化目的。
傾向指數(shù)匹配法是在通過模型估計傾向指數(shù)后,從對照組中選出與暴露組傾向指數(shù)相同或相近的個體進行配對,達(dá)到均衡組間協(xié)變量的目的[6]。匹配時如果將暴露組與對照組個體傾向指數(shù)差值設(shè)定在某個范圍內(nèi),即為卡鉗匹配[7]。傾向指數(shù)匹配及所有的統(tǒng)計分析均采用SAS9.2編程完成[8-9]。
1.匹配前兩組協(xié)變量比較
原始資料中入選的協(xié)變量有:性別、年齡、職業(yè)、吸煙史、結(jié)核病史、癌胚抗原(CEA)、家族史、神經(jīng)特異性希酸化酶(NSE)、病灶數(shù)目、是否轉(zhuǎn)移、病理類型、臨床分期(cTNM)。傾向指數(shù)匹配前,對兩組間的協(xié)變量進行統(tǒng)計分析,其中定量指標(biāo)根據(jù)方差是否齊,采用兩組獨立樣本t檢驗和t′檢驗;采用χ2或其校正公式對定性指標(biāo)進行統(tǒng)計分析。檢驗結(jié)果如表1所示。
專業(yè)考慮協(xié)變量中吸煙史、結(jié)核病史、家族史、神經(jīng)特異性希酸化酶(NSE)、是否轉(zhuǎn)移、臨床分期(cTNM)六個協(xié)變量在兩個組中分配均衡性有統(tǒng)計學(xué)意義。若不對這些協(xié)變量進行有效統(tǒng)計學(xué)均衡處理,必將影響統(tǒng)計分析結(jié)果的準(zhǔn)確性。
2.匹配后兩組協(xié)變量比較
以治療方案為因變量,以可能的混雜因素為自變量,采用logistic回歸計算每個患者的傾向指數(shù)。likelihood ratio結(jié)果顯示logistic回歸方程有統(tǒng)計學(xué)意義,擬合優(yōu)度指標(biāo)顯示方程擬合度較好。計算的傾向指數(shù)的均數(shù)和標(biāo)準(zhǔn)差為0.454±0.011。采用SAS9.2編程法對兩組數(shù)據(jù)進行卡鉗匹配,共有127對匹配成功。兩組肺癌病人協(xié)變量的均衡性比較顯示,匹配前不均衡的吸煙史、結(jié)核病史、家族史、神經(jīng)特異性希酸化酶(NSE)、是否轉(zhuǎn)移、臨床分期(cTNM)六個協(xié)變量,統(tǒng)計分析結(jié)果P均大于0.05,無統(tǒng)計學(xué)差異,表明經(jīng)匹配后在兩組的分配達(dá)到很好平衡,結(jié)果見表1。
表1 傾向指數(shù)匹配前、后兩組肺癌患者協(xié)變量分布
3.匹配前、后生存率比較
對傾向指數(shù)匹配前、后的兩組臨床觀測數(shù)據(jù)資料進行生存分析,結(jié)果如表2所示。
表2 傾向指數(shù)匹配前、后兩組肺癌病人生存率比較
由表2可知,未作匹配之前的原始資料中,NP方案組和TP方案組的中位生存期分別為2.360年和2.100年;95%置信區(qū)間分別為2.170~2.780年和1.833~2.470年,log-rank檢驗結(jié)果表明兩組生存率間無統(tǒng)計學(xué)差異(P=0.0516>0.05)。
用傾向指數(shù)卡鉗法對匹配之后的127對新樣本進行生存分析,結(jié)果見表2。兩化療組間協(xié)變量被均衡后,NP方案組和TP方案組的中位生存時間分別變?yōu)?.560年和2.180年;95%置信區(qū)間分別為2.167~3.040年和1.958~2.550年;log-rank檢驗結(jié)果表明兩組生存率之間差別有統(tǒng)計學(xué)意義(P=0.0134<0.05)。說明在治療肺癌病人的實際臨床過程中,NP方案的療效好于TP方案。經(jīng)傾向指數(shù)匹配前后兩組肺癌病人的生存曲線見圖1,圖2。由生存曲線圖可以看出,在沒有進行傾向指數(shù)匹配前兩種方法生存曲線存在多次相交現(xiàn)象,而采用傾向指數(shù)匹配后除開始之后兩生存曲線沒有出現(xiàn)再次相交現(xiàn)象,也表明傾向指數(shù)匹配法對兩組進行了較好的匹配。
圖1 匹配前兩組化療肺癌病人的生存曲線圖
圖2 匹配后兩組化療肺癌病人的生存曲線圖
當(dāng)隨機化試驗在臨床上難以實現(xiàn)或僅獲得臨床觀測性數(shù)據(jù)時,混雜因素在組間的不平衡性導(dǎo)致難以對不同治療方案效果做出準(zhǔn)確的評價,傾向指數(shù)法是平衡組間協(xié)變量不均衡的一種有效方法[10-11]。本研究采用卡鉗匹配法對肺癌化療病人的臨床觀測數(shù)據(jù)進行匹配研究,比較不同化療方式肺癌病人預(yù)后情況,為醫(yī)生及病人選擇合適的臨床治療方案提供智力支持和理論依據(jù);同時也為以后正確應(yīng)用傾向指數(shù)法處理非隨機化臨床試驗數(shù)據(jù)提供實踐經(jīng)驗。傾向指數(shù)方法在處理非隨機臨床觀測數(shù)據(jù)方面體現(xiàn)出它的明顯優(yōu)勢。
傾向指數(shù)法盡管有其特有優(yōu)勢,但亦有不足之處,如需較全面的臨床專業(yè)知識,在分析之前找準(zhǔn)、找全混雜因素;受配對條件的限制,需較大樣本量觀測數(shù)據(jù)等特點;在實際應(yīng)用過程中應(yīng)加以注意。
1.Hong S,Youn YN,YiG,et al.Long Term Results of ST-Segment Elevation Myocardial Infarction versus Non-ST-Segment Elevation Myocardial Infarction after Off-Pump Coronary Artery Bypass Grafting:Propensity Score Matching Analysis.JKorean Med Sci,2012,27(2):153-159.
2.Berger JS,Herout PM,Harshaw Q.Bleeding-associated outcomes w ith preoperative clopidogrel use in on-and off-pump coronary artery bypass.Thromb Thrombolysis,2012,34(1):56-64.
3.Choi AH,Barnholtz-Sloan JS,Kim JA.Effect of radiation therapy on survival in surgically resected retroperitoneal sarcoma:a propensity score-adjusted SEER analysis.Ann Oncol,2012,23(9):2449-2457.
4.W isnivesky JP,Halm EA,Bonom i M,et al.Postoperative radiotherapy for elderly patientswith stage III lung cancer.Cancer,2012,118(18):4478-4485.
5.Oh KH,Hwang YH,Cho JH,etal.Outcome of early initiation of peritoneal dialysis in patientswith end-stage renal failure.JKorean Med Sci,2012,27(2):170-176.
6.王永吉,蔡宏偉,夏結(jié)來,等.第二講傾向指數(shù)常用研究方法.中華流行病學(xué)雜志,2010,31(5):584-585.
7.王永吉,蔡宏偉,夏結(jié)來,等.第一講傾向指數(shù)的基本概念和研究步驟.中華流行病學(xué)雜志,2010,31(3):99-100.
8.SAS 9.2 Macro Language Reference,SAS Institute Inc,2008.
9.Art Carpenter.Carpenter′s Complete Guide to the SASMacro Language(2nd Edition)SASPublishing,2004.
10.Walsh P,Shanholtzer L,Loewen M,et al.A matched case control study w ith propensity score balancing exam ining the protective effect of paracetamol against parentally reported apnoea in infants.Resuscitation,2010,83(4):440-446.
11.Apolone G,Deandrea S,MontanariM,etal.Evaluation of the comparative analgesic effectivenessof transdermal and oral opioids in cancer patients:A propensity score analysis.Eur JPain,2012,16(2):229-238.
(責(zé)任編輯:劉 壯)
The Application of Propensity Score M atching in Evaluating Chemotherapeutic Effect of Lung Carcinoma
Lyu Juncheng,Wang Suzhen.(Health Statistics Department,School of Public Health,Weifang Medical University)
ObjectiveThe clinical observation data of lung Carcinoma patient were divided into two groups:NP group and TP group according to clinical chemotherapymethod.Compared and evaluate treatmenteffectof two chemotherapy after using propensity score matching method to balance the confounding factors between groups.MethodsCalculated each patient′s propensity score by logistic regressionmodel,and made calipermatching according to the propensity score.The Kaplan-Meiermethod was applied tomake the survival analysis.ResultsThe survival ratewas not statistically significantbetween groups beforematching(P=0.0516),and themedian survival time of two groups were 2.360Y and 2.100Y.The survival rate was statistically significant after matched by the Propensity Score(P=0.0134),and themedian survival time of two groupswere 2.560 Y and 2.180 Y.ConclusionPropensity scorematchingmethod can effectively reduce the confounding bias of non-random ized clinical observational data,and help us evaluate the therapeutic effect of Lung Carcinoma patients correctly.
Propensity Score;Matching Method;Lung Carcinoma;Survival Analysis
*國家自然科學(xué)基金資助項目(81141112);山東省自然科學(xué)基金資助項目(ZR2013HM045)。
△通信作者,王素珍,E-mail:wangsz@w fmc.edu.cn。