濰坊醫(yī)學(xué)院(261053)
田 野 馬 潔 黃 璐 杜澤玉 呂軍城 石福艷 孟維靜 王素珍△ 潘慶忠△
隊(duì)列研究是臨床流行病學(xué)重要的研究方法之一,在研究反應(yīng)變量與處理因素之間關(guān)系的因果推斷中,隨機(jī)對(duì)照試驗(yàn)(randomized controlled trials,RCT)被視為評(píng)價(jià)臨床試驗(yàn)干預(yù)措施的金標(biāo)準(zhǔn)。但在實(shí)際的臨床實(shí)踐中,由于受樣本量、研究費(fèi)用、持續(xù)時(shí)間以及倫理學(xué)等方面的因素影響,隨機(jī)對(duì)照試驗(yàn)的實(shí)施受到很大的制約[1]。近年來(lái),非隨機(jī)對(duì)照研究、隊(duì)列研究、臨床數(shù)據(jù)挖掘等臨床流行病學(xué)方法在循證醫(yī)學(xué)領(lǐng)域廣受關(guān)注。觀察性臨床研究不同于RCT臨床試驗(yàn)可以按照試驗(yàn)設(shè)計(jì)進(jìn)行隨機(jī)分組從而減少混雜因素所產(chǎn)生的偏倚。如果在回顧性隊(duì)列研究資料進(jìn)行分組后直接比較處理效應(yīng),所做出的統(tǒng)計(jì)結(jié)論容易增大犯II類錯(cuò)誤的概率,當(dāng)協(xié)變量數(shù)目較多且無(wú)法精確獲知其對(duì)處理分配和生存結(jié)局的影響時(shí),直接估計(jì)未調(diào)Kaplan-Meier值及生存曲線會(huì)導(dǎo)致偏倚,因此,對(duì)于傳統(tǒng)的傾向性評(píng)分(propensity score,PS)方法如匹配法、分層法、加權(quán)法等應(yīng)用于生存資料分析時(shí)并不容易實(shí)現(xiàn)[2]。
基于PS雙穩(wěn)健半?yún)⒛P头ㄊ菍?duì)傳統(tǒng)PS方法的改進(jìn),自20世紀(jì)90年代Scharfstein[3]首次引入雙重穩(wěn)健模型的概念以來(lái),近些年其得到了眾多的關(guān)注和研究[4]。有研究結(jié)果顯示,在生存資料分析時(shí)應(yīng)用雙穩(wěn)健模型可以直接估計(jì)出處理(暴露)對(duì)生存結(jié)局的絕對(duì)和相對(duì)效應(yīng)[5],最大程度地減小混雜偏倚。本文以乳腺癌患者常用的CAF(環(huán)磷酰胺、多柔比星、氟尿嘧啶)和TAC(多西他賽、多柔比星、環(huán)磷酰胺)兩種化療方案為例,運(yùn)用基于PS的 IPTW和DRIPTW、SMRW和DRSMRW(IPTW:inverse probability of treatmentweighting;SMRW:Standardized mortality ratio weighting;DRIPTW:Doubly robustinverse probability of treatmentweighting;DRSMRW:Doubly robust Standardized mortality ratio weighting)等多種PS改進(jìn)模型分析不同化療方案對(duì)乳腺癌患者的因果效應(yīng)和預(yù)后結(jié)果的影響,從而使研究結(jié)果更接近“真實(shí)世界(realword,RW)”的實(shí)際干預(yù)效果,最終為臨床實(shí)踐提供可靠的循證依據(jù)。
從美國(guó)SEER(surveillance,epidemiology,and end results)腫瘤患者縱向數(shù)據(jù)庫(kù)中,選擇2000年到2012年12年間的乳腺癌患者作為研究對(duì)象,排除無(wú)法使用的病例,共計(jì)800例,其中CAF組513例,TCA組287例。收集的指標(biāo)有:手術(shù)類型(1:CAF方案,2:TAC方案)、年齡(歲)、婚姻狀況(1:單身,2:已婚,3:離婚,4:喪偶,5:未知)、偏側(cè)化(1:乳房左側(cè),2:乳房右側(cè),3:雙側(cè))、腫瘤性質(zhì)(1:原位癌,2:惡性轉(zhuǎn)移癌)、分期(1:Ⅰ期,2:Ⅱ期,3:Ⅲ期,4:Ⅳ期)、腫瘤大小(mm)、癌胚抗原CEA(1:有,2:無(wú))、糖類抗原CA15-3(1:有,2:無(wú))、生存狀態(tài)(0:生存,1:死亡)、生存時(shí)間(月)等。
Rosenbaum和Rubin[6]把PS定義為:在可觀察的協(xié)變量(Xi)條件下,研究對(duì)象i(i= 1,2,…,N)接受某種處理(或暴露)因素(Zi=1)而非對(duì)照因素(Zi=0)的條件概率,計(jì)算公式為:
e(X)=Pr(Z=1|X=Xi)
如果協(xié)變量Xi為分組變量Zi相互獨(dú)立,那么對(duì)任意Xi,有:
e(X)或者P,即傾向性評(píng)分PS。
由公式可得,PS實(shí)際上是一個(gè)綜合多個(gè)協(xié)變量的函數(shù),其值在0和1之間[7]。傾向評(píng)分PS方法可以平衡協(xié)變量的影響,在組間協(xié)變量均衡的前提下,對(duì)平均因果效應(yīng)(average causal effect,ACE)做出推斷。實(shí)際上,傾向評(píng)分是用一個(gè)函數(shù)表示多個(gè)協(xié)變量共同作用的結(jié)果,可以“降維”。經(jīng)過(guò)傾向評(píng)分調(diào)整后,協(xié)變量均衡可比,只有干預(yù)因素和治療效果不同,出現(xiàn)“事后隨機(jī)化”的效果。
傾向性評(píng)分加權(quán)法先將主要混雜變量的信息綜合成一個(gè)變量?jī)A向評(píng)分,然后運(yùn)用標(biāo)準(zhǔn)化法的原理將所得的傾向評(píng)分進(jìn)行加權(quán),通過(guò)各對(duì)比組中傾向評(píng)分分布一致來(lái)達(dá)到使各混雜因素在各比較組中分布一致的目的[8]。該方法將每一觀察單位看作一層,不同傾向評(píng)分值預(yù)示這一觀察單位在兩組中的概率不同。在假定不存在未識(shí)別混雜因素的條件下,加權(quán)調(diào)整是基于在一定條件下的兩種相反事件的對(duì)比來(lái)對(duì)數(shù)據(jù)進(jìn)行調(diào)整的,即假設(shè)使每個(gè)觀察對(duì)象均接受處理因素和使每個(gè)觀察對(duì)象均不接受處理因素兩種相反情況。利用傾向評(píng)分估計(jì)的權(quán)重對(duì)各觀察單位加權(quán)產(chǎn)生一個(gè)虛擬的標(biāo)準(zhǔn)人群,在虛擬人群中,兩組的混雜因素趨于一致,均近似于某一預(yù)先選定的標(biāo)準(zhǔn)人口分布[8]。
傾向性評(píng)分加權(quán)法的關(guān)鍵在于對(duì)權(quán)重的計(jì)算。IPTW是以所有受試者(試驗(yàn)組和對(duì)照組合并的人群)為“標(biāo)準(zhǔn)人群”進(jìn)行調(diào)整。Robins[9]等給出的加權(quán)方法得到的人群往往與原人群數(shù)量不同,因此虛擬人群各變量的方差大小發(fā)生變化。為了得到與原人群的樣本量相同的標(biāo)準(zhǔn)人群,Hernan[10]等對(duì)計(jì)算方法進(jìn)行了調(diào)整,將整個(gè)研究人群的處理率和非處理率加入公式進(jìn)行調(diào)整得到穩(wěn)定權(quán)重。具體方法是:試驗(yàn)組觀察單位的權(quán)重Wt=Pt/PS,對(duì)照組觀察單位的權(quán)重Wc=(1-Pt)/(1-PS)。Pt為整個(gè)人群中接受處理因素的比例。SMRW法是將處理組觀察對(duì)象作為“標(biāo)準(zhǔn)人群”進(jìn)行調(diào)整。Sato和Matsuyama[11]給出的加權(quán)系數(shù)計(jì)算方法是:試驗(yàn)組觀察單位的權(quán)重Wt=1,對(duì)照組觀察單位的權(quán)重Wc=PS/(1-PS)。同樣,由于對(duì)照組得到的人群數(shù)與處理組樣本量一致,而與原對(duì)照組樣本量不同,因此需要進(jìn)一步作如下調(diào)整,計(jì)算其穩(wěn)定權(quán)重:Wc=[PS(1-Pt)]/[(1-PS)Pt]。
雙穩(wěn)健半?yún)⒛P头ㄊ菍?duì)傳統(tǒng)PS法的改進(jìn),將PS加權(quán)法(邊際結(jié)構(gòu)模型)和半?yún)ox回歸模型相結(jié)合。具體實(shí)施步驟:第一步:估計(jì)傾向性評(píng)分,包括模型和變量的選擇;第二步:計(jì)算權(quán)重,包括逆概率處理和標(biāo)化死亡比權(quán)重;第三步:均衡性診斷;第四步:生存結(jié)局的處理效應(yīng)估計(jì),包括相對(duì)處理效應(yīng)和絕對(duì)處理效應(yīng)。其中,相對(duì)處理效應(yīng)是將權(quán)重進(jìn)行加權(quán),后估計(jì)經(jīng)加權(quán)調(diào)整樣本的調(diào)整 Kaplan-Meier 估計(jì)值(adjusted Kaplan-Meier estimator,AKME)及其方差和加權(quán) log-rank 檢驗(yàn);絕對(duì)處理效應(yīng)是雙穩(wěn)健半?yún)⒛P头ǖ臉?gòu)建,將Zi和對(duì)結(jié)局有影響的基線協(xié)變量與權(quán)重共同納入半?yún)ox回歸模型進(jìn)行分析,估計(jì)HR及其置信區(qū)間,起到雙穩(wěn)健的作用。
定性或等級(jí)資料采用構(gòu)成比描述,定量資料采用均數(shù)±標(biāo)準(zhǔn)差表示,兩組定性或等級(jí)資料比較采用χ2檢驗(yàn),兩組定量資料比較采用t檢驗(yàn)。PS法分別采用匹配法、加權(quán)法和回歸調(diào)整法,匹配法采用卡鉗匹配,卡鉗值設(shè)為0.02;加權(quán)法采用逆概率處理加權(quán)法(IPTW)和標(biāo)準(zhǔn)化死亡比加權(quán)法(SMRW),并對(duì)加權(quán)之后的樣本進(jìn)行調(diào)整 Kaplan-Meier估計(jì)值及其方差和加權(quán)l(xiāng)og-rank 檢驗(yàn),同時(shí),將各個(gè)模型分別與Cox回歸模型相結(jié)合進(jìn)行比較。雙穩(wěn)健半?yún)⒛P头ǖ乃薪y(tǒng)計(jì)分析均采用SAS 9.4編程完成,以P<0.05為差異有統(tǒng)計(jì)學(xué)意義,檢驗(yàn)水準(zhǔn)均為α=0.05。
原始資料入選的協(xié)變量有:年齡(歲)、婚姻狀況、偏側(cè)化、腫瘤性質(zhì)、腫瘤分期、腫瘤大小(mm)、癌胚抗原CEA、糖類抗原CA153等。在TAC方案組和CAF方案組的基線資料中,兩組乳腺癌患者的年齡、婚姻狀況、腫瘤性質(zhì)在匹配前不均衡(P<0.05),而兩組患者的腫瘤大小、腫瘤偏側(cè)化情況、腫瘤分期、癌胚抗原CEA含量、糖類抗原CA153含量分布均衡(P>0.05)。在匹配和加權(quán)之后,對(duì)兩組乳腺癌患者協(xié)變量進(jìn)行檢驗(yàn)可知,匹配前不均衡的協(xié)變量,如年齡、婚姻狀況、腫瘤性質(zhì)等變量經(jīng)匹配和加權(quán)之后在兩組的分配達(dá)到了平衡(P>0.05),結(jié)果見(jiàn)表1~2。
表1 不同方法處理不同樣本基線資料之間均衡性情況[n(%)]
表2 不同方法處理基線資料組間均衡性比較情況統(tǒng)計(jì)量,P值
(1)絕對(duì)處理效應(yīng)估計(jì)匹配、穩(wěn)定逆概率處理加權(quán)、穩(wěn)定標(biāo)化死亡比加權(quán)后的樣本TAC與CAF組的生存曲線差異均有統(tǒng)計(jì)學(xué)意義,見(jiàn)圖1(log-rank檢驗(yàn):χ2=25.60,P<0.001;穩(wěn)定逆概率處理加權(quán)l(xiāng)og-rank檢驗(yàn):z=2.326,P=0.043;穩(wěn)定標(biāo)化死亡比加權(quán)l(xiāng)og-rank檢驗(yàn):z=1.154,P=0.014)。從生存曲線中可以看出,匹配之后的生存曲線相較于加權(quán)調(diào)整之后的曲線,其CAF組生存率下降的更快,TAC組與CAF組生存率曲線間存在較大差異。與之相比,加權(quán)調(diào)整之后的PS-TPTW和PS-SMRT模型中TAC組與CAF組的生存曲線更加穩(wěn)健。
圖1 匹配、穩(wěn)定逆概率處理加權(quán)穩(wěn)定標(biāo)化死亡比加權(quán)后的樣本中TAC與CAF組的生存曲線
(2)相對(duì)處理效應(yīng)估計(jì)在乳腺癌患者中,以生存結(jié)局為因變量,Zi為自變量,進(jìn)行Cox回歸分析估計(jì)θ為0.627。以生存結(jié)局為因變量,以Zi和對(duì)結(jié)局有影響的基線協(xié)變量為自變量,進(jìn)行調(diào)整Cox回歸分析,估計(jì)的HR及其置信區(qū)間為1.797(1.378,2.344),相對(duì)偏倚為0.065;在IPTW樣本和DRIPW樣本中,加權(quán)Cox回歸分析估計(jì)的HR及其置信區(qū)間分別為1.725(1.335,2.230)和1.813(1.389,2.366),相對(duì)偏倚分別為0.131和0.051。在SMRW樣本和DRSMRW樣本中,加權(quán)Cox回歸分析估計(jì)的HR及其置信區(qū)間分別為1.766(1.365,2.285)和1.830(1.430,2.341),相對(duì)偏倚分別為0.093和0.037。在匹配之后的樣本中,Cox回歸分析估計(jì)的HR及其置信區(qū)間為1.800(1.394,2.324),相對(duì)偏倚為0.062。
表3 各種PS模型對(duì)TAC方案組和CAF方案組Cox回歸分析
雙穩(wěn)健半?yún)⒛P头ㄗ鳛榭刂苹祀s因素的模型,在臨床流行病學(xué)研究中應(yīng)用越來(lái)越廣泛。本研究的主要目的是通過(guò)多種PS模型比較對(duì)處理效應(yīng)估計(jì)的優(yōu)劣,其中均衡性診斷是判斷模型正確性的一個(gè)重要方法。雙穩(wěn)健半?yún)⒛P头▽?duì)于PS模型的指定如果正確,那么在匹配、加權(quán)之后的樣本中試驗(yàn)組與對(duì)照組間基線協(xié)變量分布應(yīng)該相同[12]。本文結(jié)果表明,在原始數(shù)據(jù)中TAC方案組和CAF方案組乳腺癌患者的年齡、婚姻狀況、腫瘤性質(zhì)在匹配前不均衡,在匹配、加權(quán)之后得到均衡,經(jīng)過(guò)log-rank檢驗(yàn)兩組生存曲線之間差別有統(tǒng)計(jì)學(xué)意義(P<0.05),且結(jié)果均顯示TAC化療方案治療乳腺癌的效果優(yōu)于CAF化療方案,與趙璐[13-15]等人的研究結(jié)果相同。同時(shí),通過(guò)對(duì)不同模型之間的比較,利用DRIPTW模型和DRSMRW模型得出的處理效應(yīng)的偏倚顯著減小,且減小偏倚的效果優(yōu)于與之相對(duì)的IPTW和SMRW法,同時(shí)也優(yōu)于匹配法和回歸調(diào)整法,其中DRSMRW模型法最優(yōu),相對(duì)偏倚為0.037。由本次研究得知,在臨床實(shí)踐中,TAC方案中將蒽環(huán)類化療藥物聯(lián)合紫杉類化療藥物化療效果更好。
本研究顯示,雙穩(wěn)健半?yún)⒛P头ㄝ^傳統(tǒng)PS法具有明顯的優(yōu)勢(shì)。第一,該方法是基于PS加權(quán)(基于個(gè)體的標(biāo)準(zhǔn)化法的邊際結(jié)構(gòu)模型),與估計(jì)邊際效應(yīng)的PS匹配法相比,適用于數(shù)據(jù)中包含時(shí)依性暴露或混雜變量的研究,也可用于更為復(fù)雜的研究設(shè)計(jì)[8];第二,該方法與回歸調(diào)整法相比,避免了效應(yīng)估計(jì)時(shí)參數(shù)過(guò)多及共線性的問(wèn)題所導(dǎo)致的偏倚,易于比較加權(quán)調(diào)整前后的均衡程度[16];第三,該方法相對(duì)于傳統(tǒng)分層法而言,其將多個(gè)協(xié)變量綜合為一個(gè)均衡分值,將每一觀察單位看作一層,避免了協(xié)變量較多或存在連續(xù)變量時(shí)無(wú)法解決的過(guò)度匹配或過(guò)度分層問(wèn)題[5];第四,該方法不要求試驗(yàn)組的樣本量小于對(duì)照組的樣本量等。此外,僅通過(guò)計(jì)算一次 PS,就可以構(gòu)造一個(gè)均衡的加權(quán)樣本,在此樣本中能分析多重結(jié)局。同時(shí),雙穩(wěn)健半?yún)⒛P头ㄒ泊嬖诓蛔阒?第一,該方法依賴于構(gòu)造一個(gè)加權(quán)樣本,均衡化原理不如匹配、分層等方法易于理解;第二,該方法對(duì)于PS模型錯(cuò)誤指定更為敏感[17]等。下一步,我們將繼續(xù)針對(duì)計(jì)算PS模型進(jìn)行比較研究,如利用貝葉斯、隨機(jī)森林、神經(jīng)網(wǎng)絡(luò)等提升雙穩(wěn)健半?yún)⒛P偷姆€(wěn)健性。
綜上所述,在回顧性隊(duì)列研究中對(duì)于基線不均衡的生存分析數(shù)據(jù)而言,隨訪期較長(zhǎng),混雜或處理(暴露)因素中很有可能包括時(shí)依性變量,可采用基于PS的雙穩(wěn)健模型法進(jìn)行分析,得到類似于RCTs報(bào)告中的相對(duì)和絕對(duì)處理效應(yīng)結(jié)果。因此,雙穩(wěn)健模型法更適用于生存數(shù)據(jù)的研究。
中國(guó)衛(wèi)生統(tǒng)計(jì)2019年1期