摘要:目的 探究針對長期生存數(shù)據(jù)的Cox比例風(fēng)險模型的Taylor拓展調(diào)整(Cox-TEL)方法在含治愈患者的生存數(shù)據(jù)下的適用條件與適用范圍。方法 基于Weibull分布模擬生存數(shù)據(jù)方法,模擬生成不同治愈率、刪失率和治愈率差值的生存數(shù)據(jù)。然后基于Cox-TEL方法進(jìn)行分析,獲得Ⅰ類錯誤和檢驗效能對其表現(xiàn)性能進(jìn)行評價。結(jié)果 針對模型的未治愈部分,Cox-TEL方法的Ⅰ類錯誤略高于0.05,其檢驗效能在樣本量較大、治愈率差值較大時較為理想。針對治愈部分,Cox-TEL方法的Ⅰ類錯誤能夠較好的控制在0.05左右,且在大多數(shù)情況下都能保持較高的檢驗效能。結(jié)論 Cox-TEL方法在多數(shù)情況下,比如樣本量較大、刪失率較低、組間治愈率差值較大時,能有效分析未治愈患者數(shù)據(jù),得到較可靠的風(fēng)險比HR值;在不同的樣本量、刪失率和治愈率下,該方法都能較準(zhǔn)確地估計出治愈患者兩組治愈率差值。
關(guān)鍵詞:Cox-TEL;治愈模型;生存分析;檢驗效能
Cox比例風(fēng)險模型[1]是生存分析方法中最經(jīng)典、最常用的方法,其應(yīng)用前提是需要滿足等比例風(fēng)險假定。然而,實踐中常常會出現(xiàn)生存曲線存在治愈患者導(dǎo)致生存曲線尾部出現(xiàn)平臺期的情況,這些情況可能會違背等比例風(fēng)險假定[2, 3]。雖然已有作者提出限制性平均生存時間(RMST)[4-8]、治愈模型[9-14]等一系列方法能夠?qū)Υ嬖谥斡颊叩牟粷M足等比例風(fēng)險假定的生存數(shù)據(jù)進(jìn)行有效分析,但在已發(fā)表的文獻(xiàn)中仍存在較多誤用Cox比例風(fēng)險模型分析此類數(shù)據(jù)的情況[15-17]。針對存在一定比例治愈患者的情況,Hsu等[18]在2021年提出長期生存數(shù)據(jù)的Cox 比例風(fēng)險模型的Taylor 拓展調(diào)整(Cox-TEL)方法,該方法只需基于文獻(xiàn)中的HR值及其95%置信區(qū)間和KM曲線所估計的生存率,即可在沒有原始數(shù)據(jù)的情況下,獲得近似治愈模型分析所得的結(jié)果[19, 20]。然而,Cox-TEL方法的作者未明確說明其適用條件,其估計結(jié)果的可靠性及準(zhǔn)確性尚未得到證實。因此,本研究擬通過蒙特卡羅模擬,探究該方法應(yīng)用于不同情況下含治愈患者生存數(shù)據(jù)時的Ⅰ類錯誤和檢驗效能,為研究者能正確使用Cox-TEL方法以便利獲得HR值以及組間治愈率差值(DP)提供參考。
1 方法
1.1 PHMC模型
治愈模型主要分為兩類,混合治愈模型和非混合治愈模型[21, 22]。混合治愈模型通常假定研究人群中存在治愈和未治愈兩種不同類型的患者,并分別對這兩類患者進(jìn)行建模[23, 24]。其中,針對未治愈患者,計算試驗組相對于對照組的HR值,針對治愈患者,計算治愈率差值(DP)。DP值為試驗組治愈率與對照組治愈率的差值。混合治愈模型的表達(dá)形式為:
S (t|x,z ) = π (z ) S (t|x) + 1 - π (z )
其中π (z)是患者未治愈的概率,S (t|x,z )是未治愈患者的生存概率,x和z是協(xié)變量的觀測值。π (z )通常被稱為模型的incidence部分,S (t|x)被稱為模型的latency部分,描述未治愈患者生存時間的分布。在混合治愈模型中,當(dāng)latency部分使用PH(Proportion Hazard)模型時,即為PHMC模型[25]。PHMC模型的表達(dá)式如下:
S (t|x,z ) = π (z ) S0(t )exp ( βx) + 1 - π (z )
S0(t )是未治愈患者在協(xié)變量x = 0 時的基線生存函數(shù)。
PHMC模型等治愈模型不僅考慮組間的短期生存率差異,同時也考慮長期生存者比例在組間的差異,即治愈率差值。因此針對存在平臺期的數(shù)據(jù)利用治愈模型分析能得到更加準(zhǔn)確的結(jié)論。
1.2 Cox-TEL方法
Cox-TEL方法主要針對KM生存曲線存在平臺期的情況,即研究人群中存在一定比例的治愈患者,這類患者永遠(yuǎn)不會經(jīng)歷研究中感興趣事件[18, 26]。Cox-TEL方法通過泰勒展開式找出Cox比例風(fēng)險模型與PHMC模型之間的數(shù)學(xué)關(guān)系,再以此關(guān)系為基礎(chǔ),將Cox比例風(fēng)險模型所估計的結(jié)果轉(zhuǎn)換為近似PHMC模型估計的結(jié)果。Cox-TEL法不需要獲取文獻(xiàn)中所使用的原始數(shù)據(jù),僅需要文獻(xiàn)中Cox模型所估計出的HR值及其95%置信區(qū)間和KM曲線所估計的生存率即可獲得近似PHMC模型的結(jié)果,這些值通??芍苯訌奈墨I(xiàn)中獲得。
1.3 Engauge Digitizer軟件
生存分析相關(guān)文獻(xiàn)幾乎都會報告該研究對應(yīng)的生存曲線圖供讀者參考。研究者可以通過EngaugeDigitizer軟件從生存曲線中提取有價值的信息[27]。
2 模擬與實例
2.1 模擬步驟
基于已有的生存數(shù)據(jù)模擬方法[28-31],結(jié)合具有治愈患者的生存數(shù)據(jù)的特點,生成不同情況下包含治愈患者的生存數(shù)據(jù)??疾霤ox-TEL方法的Ⅰ類錯誤和檢驗效能。本研究的所有統(tǒng)計分析與模擬研究部分均使用R4.2.3完成。具體模擬參數(shù)見表1。
2.2 模擬結(jié)果
2.2.1 Cox-TEL方法HR值的Ⅰ類錯誤
大多數(shù)情況下,Cox-TEL方法HR值的Ⅰ類錯誤均略高于0.05,但Ⅰ類錯誤的大小并沒有隨著樣本量、刪失率、治愈率的變化而發(fā)生明顯的變化(表2)。
2.2.2 Cox-TEL 方法HR 值的檢驗效能
當(dāng)樣本量較大,治愈率差值較大時,檢驗效能大于0.8且檢驗效能隨著樣本量和治愈率差值的增大而增大(表3)。此外,在其他條件相同的情況下,刪失率越低,檢驗效能越高。
2.2.3 Cox-TEL方法DP值的Ⅰ類錯誤
Ⅰ類錯誤基本控制在0.05左右;當(dāng)治愈率較低時,Ⅰ類錯誤較小,結(jié)果偏向于保守;隨著治愈率的增大,Ⅰ類錯誤略有增大,但都基本控制在0.05左右(表4)。
2.2.4 Cox-TEL方法DP值的檢驗效能
治愈率差值稍大(如≥0.020)時,檢驗效能基本都大于0.8且檢驗效能隨著樣本量和治愈率差值的增大而增大(表5)。
2.3 實例分析
某項臨床研究的目的是探討與安慰劑相比,腎切除術(shù)后使用帕博利珠單抗治療是否會改善患有透明細(xì)胞腎細(xì)胞癌并且有中高復(fù)發(fā)風(fēng)險或高復(fù)發(fā)風(fēng)險患者的結(jié)局[32]。KM生存曲線表明,在研究時間段內(nèi)Cox HR 為0.54(95% CI,0.30~0.96),提示使用帕博利珠單抗治療更有利于患者的生存(圖1)。
考慮使用Cox-TEL方法,重新對上述研究進(jìn)行分析。利用Engauge digitizer軟件提取生存曲線圖中相關(guān)點對應(yīng)的生存率和時間,并使用提取的數(shù)據(jù)進(jìn)行分析。
由表6 可見兩種方法結(jié)果存在差異,Cox-TEL HR值的95% CI包含1,在未治愈患者部分中,并不能認(rèn)為安慰劑組和帕博利珠單抗治療組之間的差異具有統(tǒng)計學(xué)意義。Cox-TEL DP值為0.04(95% CI,-0.12~0.20),尚不能認(rèn)為兩組中治愈患者占比差異有統(tǒng)計學(xué)意義。
3 討論
本文通過模擬生成生存數(shù)據(jù),探討在不同治愈率、刪失率和治愈率差值的情況下,Cox-TEL方法的Ⅰ類錯誤和檢驗效能。結(jié)果表明,多數(shù)情況下Cox-TEL方法HR 值的Ⅰ類錯誤略大于0.05,檢驗效能可以保持較高水平。但在樣本量較少(如lt;200)、治愈率差值較?。ㄈ鏻t;0.2)的情況下檢驗效能偏低。Cox-TEL方法DP值的Ⅰ類錯誤基本能夠控制在0.05左右,且檢驗效能在大多數(shù)情況下也能保持在gt;0.8的較高水平。該方法能有效分析未治愈患者數(shù)據(jù),得到較為可靠的HR值,并且能較準(zhǔn)確地估計出治愈患者兩組治愈率差值。
在生存分析中,經(jīng)典方法為Cox比例風(fēng)險模型,但實際應(yīng)用中常會出現(xiàn)生存曲線交叉或存在平臺期的情況,此時使用Cox 比例風(fēng)險模型得出的結(jié)論存疑[15-17]。這些已發(fā)表的研究文獻(xiàn)中一般無法獲得原始數(shù)據(jù),但通常會給出相應(yīng)的生存曲線。此時,可先使用Cox-TEL方法對HR值進(jìn)行估計,再結(jié)合已有的Cox比例風(fēng)險模型的HR值,確定真實HR值的大致范圍,以供后繼研究者參考。實際運用中,若不滿足比例風(fēng)險假定,但能獲得原始數(shù)據(jù),則可在使用Cox-TEL 方法前考慮用PHMC模型[14]或其他更加適合的模型進(jìn)行分析[5]。在刪失率較高(如gt;0.3)、組間治愈率差值較大(如gt;0.2)的情況下,Cox-TEL方法可靠性較差。
Cox-TEL方法不需原始數(shù)據(jù),僅從文獻(xiàn)給出的生存曲線和部分指標(biāo)就可獲得具有一定準(zhǔn)確度的HR值和DP值結(jié)果,使后續(xù)研究者能正確看待前人不適當(dāng)使用Cox比例風(fēng)險模型的研究結(jié)果并能相對簡便地獲得更接近真實的結(jié)果。本研究存在以下不足,Cox-TEL方法是將Cox 比例風(fēng)險模型所估計的結(jié)果轉(zhuǎn)換為近似PHMC模型估計的結(jié)果,但在本研究中,只探討了Cox-TEL方法的性能,并未研究其與PHMC模型分析結(jié)果的一致性。此外,該研究模擬時僅考慮了一個二分類處理因素的情況,尚未延伸到多個處理因素的情況。
參考文獻(xiàn):
[1] Cox DR. Regression models and life-tables[J]. J R Stat Soc Ser BStat Methodol, 1972, 34(2): 187-202.
[2] Jayk Bernal A, Gomes da Silva MM, Musungaie DB, et al.Molnupiravir for oral treatment of covid-19 in nonhospitalizedpatients[J]. N Engl J Med, 2022, 386(6): 509-20.
[3] Tawbi HA, Schadendorf D, Lipson EJ, et al. Relatlimab andnivolumab versus nivolumab in untreated advanced melanoma[J].N Engl J Med, 2022, 386(1): 24-34.
[4] 康 佩, 許 軍, 黃福強(qiáng), 等. Adaptive Elastic Net結(jié)合加速失效時間模型在亞組識別中的應(yīng)用[J]. 南方醫(yī)科大學(xué)學(xué)報, 2019, 39(10):1200-6.
[5] El Sharouni MA, Ahmed T, Varey AHR, et al. Development andvalidation of nomograms to predict local, regional, and distantrecurrence in patients with thin (T1) melanomas[J]. J Clin Oncol,2021, 39(11): 1243-52.
[6] An SL, Zhang P, Fang HB. Subgroup identification in survivaloutcome data based on concordance probability measurement[J].Mathematics, 2023, 11(13): 2855.
[7] 黃福強(qiáng), 康 佩, 劉穎欣, 等. 含治愈個體生存資料的亞組識別研究[J]. 中國衛(wèi)生統(tǒng)計, 2020, 37(5): 672-7.
[8] 韋紅霞, 康 佩, 劉穎欣, 等. 基于Adaptive Elastic Net與加速失效時間模型的亞組識別方法的應(yīng)用拓展[J]. 南方醫(yī)科大學(xué)學(xué)報, 2021,41(3): 391-8.
[9] Peng Y, Dear KB. A nonparametric mixture model for cure rateestimation[J]. Biometrics, 2000, 56(1): 237-43.
[10]Sy JP, Taylor JM. Estimation in a Cox proportional hazards curemodel[J]. Biometrics, 2000, 56(1): 227-36.
[11] Lo SN, Scolyer RA, Thompson JF. Long-term survival of patientswith thin (T1) cutaneous melanomas: a Breslow thickness cut pointof 0.8mm separates higher-risk and lower-risk tumors[J]. Ann SurgOncol, 2018, 25(4): 894-902.
[12]Lu WB. Maximum likelihood estimation in the proportional hazardscure model[J]. Ann Inst Stat Math, 2008, 60(3): 545-74.
[13]Royston P, Parmar MK. Restricted mean survival time: analternative to the hazard ratio for the design and analysis ofrandomized trials with a time-to-event outcome[J]. BMC Med ResMethodol, 2013, 13(1): 152.
[14]Ghobadi KN, Roshanaei G, Poorolajal J, et al. The estimation oflong and shrt term survival time and associated factors of HIVpatients using mixture cure rate models[J]. BMC Med ResMethodol, 2023, 23(1): 123.
[15]Castellino SM, Pei QL, Parsons SK, et al. Brentuximab vedotin withchemotherapy in pediatric high-risk Hodgkin's lymphoma[J]. NEngl J Med, 2022, 387(18): 1649-60.
[16]Mirza MR, Chase DM, Slomovitz BM, et al. Dostarlimab forprimary advanced or recurrent endometrial cancer[J]. N Engl JMed, 2023, 388(23): 2145-58.
[17]Gounder M, Ratan R, Alcindor T, et al. Nirogacestat, a γ-secretaseinhibitor for desmoid tumors[J]. N Engl J Med, 2023, 388(10):898-912.
[18]Hsu CY, Lin EPY, Shyr Y. Development and evaluation of a methodto correct misinterpretation of clinical trial results with long-termsurvival[J]. JAMA Oncol, 2021, 7(7): 1041-4.
[19]Lin EP, Hsu CY, Berry L, et al. Analysis of cancer survivalassociated with immune checkpoint inhibitors after statisticaladjustment: a systematic review and meta-analyses[J]. JAMA NetwOpen, 2022, 5(8): e2227211.
[20]Lin EPY, Hsu CY, Chiou JF, et al. Cox proportional hazard ratiosoverestimate survival benefit of immune checkpoint inhibitors: cox-TEL adjustment and meta-analyses of programmed death-ligand 1expression and immune checkpoint inhibitor survival benefit[J]. JThorac Oncol, 2022, 17(12): 1365-74.
[21]Othus M, Barlogie B, Leblanc ML, et al. Cure models as a usefulstatistical tool for analyzing survival[J]. Clin Cancer Res, 2012, 18(14): 3731-6.
[22]Webb A, Ma J, L? SN. Penalized likelihood estimation of a mixturecure Cox model with partly interval censoring-An application to thinmelanoma[J]. Stat Med, 2022, 41(17): 3260-80.
[23]Zhou XX, Song XY. Mediation analysis for mixture Coxproportional hazards cure models[J]. Stat Methods Med Res, 2021,30(6): 1554-72.
[24]Wang SF, Zhang JJ, Lu WB. Sample size calculation for theproportional hazards cure model[J]. Stat Med, 2012, 31(29):3959-71.
[25]Cai C, Zou YB, Peng YW, et al. Smcure: an R-package forestimating semiparametric mixture cure models[J]. ComputMethods Programs Biomed, 2012, 108(3): 1255-60.
[26]Kuk AYC, Chen CH. A mixture model combining logistic regressionwith proportional hazards regression[J]. Biometrika, 1992, 79(3):531-41.
[27]Xue YY, Li GP, Xie T, et al. Concurrent chemoradiotherapy versusradiotherapy alone for stage II nasopharyngeal carcinoma in the eraof intensity-modulated radiotherapy[J]. Eur Arch Otorhinolaryngol,2023, 280(7): 3097-106.
[28]肖媛媛, 陳 瑩, 何利平, 等. 不同刪失比例下AFT模型與Cox模型表現(xiàn)比較的模擬研究[J]. 中國衛(wèi)生統(tǒng)計, 2017, 34(4): 676-80.
[29]錢 俊, 劉國慶, 周業(yè)明. 不同刪失比例下生存數(shù)據(jù)模擬生成的方法[J]. 數(shù)理醫(yī)藥學(xué)雜志, 2013, 26(6): 644-6.
[30]肖媛媛, 許傳志, 趙耐青. 含特定比例均勻隨機(jī)刪失生存數(shù)據(jù)的SAS模擬實現(xiàn)[J]. 中國衛(wèi)生統(tǒng)計, 2016, 33(6): 1058-9, 1062.
[31]蔡麗馨, 仲子航, 楊 旻, 等. 指定刪失比例的生存數(shù)據(jù)模擬及R實現(xiàn)[J]. 中國衛(wèi)生統(tǒng)計, 2022, 39(1): 143-8.
[32]Choueiri TK, Tomczak P, Park SH, et al. Adjuvant pembrolizumabafter nephrectomy in renal-cell carcinoma[J]. N Engl J Med, 2021,385(8): 683-94.
(編輯:吳錦雅)
基金項目:廣東省自然科學(xué)基金(2022A1515012152);南方醫(yī)科大學(xué)2022 年度大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計劃項目(S202212121135)