吳潔菡 宋家偉 徐暢 王偉 楊成文 劉桂芝 劉寧波
局限期小細胞肺癌(limit-stage small cell lung cancer,LS-SCLC)細胞增殖快、易轉(zhuǎn)移,治療后易復發(fā)[1],患者預后差,5 年生存率低于25%[2]。同步放、化療是LS-SCLC 的標準治療手段,但小細胞肺癌(small cell lung cancer,SCLC)腫瘤細胞異質(zhì)性強,部分患者表現(xiàn)為難治性SCLC,具有先天性或獲得性治療抵抗,目前尚缺乏可靠的療效預測手段。影像組學是從高通量醫(yī)學影像中提取某些特征并將其量化,利用機器學習等對特征進行篩選分析的技術[3]?;谟跋窠M學對SCLC 患者的預后預測的研究尚鮮有研究報道。
本研究利用影像組學方法分析放療定位CT 影像,根據(jù)獲得的臨床隨訪結(jié)果,構(gòu)建LS-SCLC 總生存期(overall survival,OS)、無進展生存期(progressionfree survival,PFS)的預后模型,為臨床中更準確地判斷預后、優(yōu)化治療方案提供更多依據(jù)。
回顧性分析天津醫(yī)科大學腫瘤醫(yī)院2013 年9 月至2019 年12 月193 例接受胸部放療LS-SCLC 患者影像資料。納入標準:1)病理證實為SCLC;2)增強CT 行放療前定位;3)CT 定位前未接受過放療;4)經(jīng)多種影像包括骨掃描、PET-CT、MRI、增強CT 等確認為局限期。排除標準:1)患者相關臨床資料不全;2)患者未接受30 次胸部放療。
1.2.1 圖像采集 采用GE Discovery CT590 RT 型大孔徑CT 對患者進行增強掃描,患者經(jīng)體位固定后,采用碘對比劑80~100 mL,速率2.0~3.0 mL/s,由高壓注射器經(jīng)肘靜脈注入,掃描延遲時間50 s[4],掃描過程中要求患者屏氣。掃描上界為乳突上1 cm,下界至膈下1 cm。
1.2.2 圖像分析 193 例患者影像資料均采用Pinnacle(版本3.2.0.27)進行分析,包括病灶位置、形態(tài)、邊界、密度等。感興趣區(qū)(region of interest,ROI)分別在縱隔窗(窗寬350 HU,窗位40 HU)、肺窗(窗寬1 000 HU,窗位-650 HU)勾畫,以腫瘤靶區(qū)(gross tumor volume,GTV)為ROI。借助3D Slicer(版本4.11.20210226)提取影像特征(圖1)。具體流程設計及參數(shù)見圖2。
圖1 影像特征提取示意圖
圖2 特征提取及模型構(gòu)建流程圖
1.2.3 隨訪 通過電話隨訪與病歷查詢相結(jié)合的方式,了解患者生存情況。隨訪時間3.97~75.63 個月,中位隨訪時間42.73 個月。隨訪截至2020 年9 月。
采用Python(版本3.8.8)進行隨機分組、特征篩選及模型構(gòu)建,采用MedCalc(版本19.4.1)軟件計算受試者工作特征曲線(receiver operating characteristic curve,ROC)。按照7∶3 對符合條件患者進行隨機分組,得到訓練組和測試組并構(gòu)建預測模型。在每一標準中,臨床因素符合正態(tài)分布采用t檢驗,非正態(tài)分布采用非參數(shù)檢驗,篩選影像特征應用t檢驗及LASSO 回歸,并采用交叉驗證法選定最優(yōu)的λ 值,選擇對應的LASSO 回歸模型。輸出準確率、曲線下面積(area under the receiver operating characteristic curve,AUC)、靈敏度和特異度評估模型效能。以P<0.05 為差異具有統(tǒng)計學意義。
共193 例患者納入研究,中位OS 為29.77 個月,中位PFS 為14.03 個月。男性150 例,年齡23~79歲,中位年齡59 歲;女性43 例,年齡40~81 歲,中位年齡60 歲。吸煙史:有141 例,無52 例;預防性腦照射:有77 例,無116 例;放療后腦轉(zhuǎn)移:有52 例,無141 例;誘導化療超2 周期:有119 例,無74 例;同步化療:有114 例,無79 例;鞏固化療:有111 例,無82 例;治療技術:固定野調(diào)強放療139 例,容積調(diào)強放療54 例。見表1。
表1 患者基本特征
以是否死亡、是否進展、OS≤1 年或OS≥5 年、OS≤1 年或OS≥3 年、PFS≤6 個月或PFS≥24 個月、PFS≤12 個月或PFS≥18 個月對患者進行篩選,訓練組和測試組在患者性別、年齡、OS、PFS、吸煙史、KPS 評分、分期、劑量、調(diào)強技術、是否進行預防性腦照射、是否腦轉(zhuǎn)移、是否接受超過2 個周期誘導化療、是否接受同步化療、是否接受鞏固化療等方面差異均無統(tǒng)計學意義(均P>0.05)。
每組影像在原始影像和派生圖像的基礎上共提取到包括一階特征、形狀特征、紋理特征、灰度共生矩陣(gray level cooccurence matrix,GLCM)、灰度依賴性矩陣(gray level dependence matrix,GLDM)、灰度級運行長度矩陣(gray level run length matrix,GLRLM)、灰度及帶矩陣(gray level size zone matrix,GLSZM)、相鄰灰度差分矩陣(neighbouring gray tone difference matrix,NGTDM))在內(nèi)的1 037 個特征。
在不同分類標準下,篩選所得特征有較大差異。以是否死亡為標準共篩選到9 個特征,分布在一階特征、GLSZM、GLCM、GLRLM 和NGTDM,在模型構(gòu)建中參數(shù)wavelet-LLH_glszm_SmallAreaEmphasis 重復出現(xiàn),與是否死亡密切相關。按照OS≤1 年或OS≥5 年為標準篩選到7 個特征,分布在一階特征、GLCM、GLSZM 和NGTDM,參數(shù)original_ngtdm_Strength在3 次提取特征重要性前列中重復出現(xiàn),且與模型構(gòu)建關系最為緊密。按照OS≤1 年或OS≥3 年為標準篩選到6 個特征,分布在一階特征、GLCM、GLSZM和NGTDM,其中參數(shù)wavelet-HHL_ngtdm_Busyness 在3 次重要性輸出中均被提出構(gòu)建新的模型。
PFS 方面以是否進展為標準,提取到10 個特征,分布在一階特征、形狀特征、GLCM、GLSZM 和NGTDM,此標準下不存在特定特征被納入構(gòu)建新的模型。以PFS≤6 個月或PFS≥24 個月為標準篩選出6 個特征,分布在一階特征、GLCM 和GLSZM,其中參數(shù)wavelet-LLH_glcm_ClusterShade 和wavelet-LLH_glcm_Correlation 被用于構(gòu)建新模型。以PFS≤12 個月或PFS≥18 個月作標準篩選到11 個特征,分布在一階特征、形狀特征、GLCM、GLRLM 和GLDM,其中參數(shù)wavelet-HHL_gldm_SmallDependenceHighGrayLevelEmphasis 作為重要特征3 次被納入新模型構(gòu)建。
以是否死亡為標準(68 例生存、119 例死亡)對病例分類并在訓練組納入全部篩選特征構(gòu)建模型,在測試組中輸出準確率均值為62.9%且相對穩(wěn)定,3 次輸出特征重要性分別構(gòu)建新模型,以測試組為基礎輸出準確率、AUC、靈敏度和特異度。新構(gòu)建模型以AUC≥0.7 為標準評估,不存在可靠結(jié)果。
以OS≤1 年(n=20)或OS≥5 年(n=19)為標準對病例分類并在訓練組中納入全部篩選特征,所得模型準確率均值為0.677 且相對穩(wěn)定。以original_ngtdm_Strength、wavelet-HLH_glszm_GrayLevelVariance、wavelet-HHL_glcm_MCC 構(gòu)建模型AUC 均值為0.7(95%CI:0.549~1.031)。以original_ngtdm_Strength、wavelet-HHL_glcm_MCC、wavelet-LLL_glcm_ClusterProminence 構(gòu)建模型AUC均值為0.84(95%CI:0.624~0.957)。
以OS≤1 年(n=20)或OS≥3 年(n=58)為標準對病例分類并在訓練組中納入全部篩選特征,所得模型準確率均值為79.5% 且相對穩(wěn)定。以wavelet-LLH_glcm_ClusterShade、wavelet-LLH_glszm_SizeZoneNonUniformity、wavelet-HHL_ngtdm_Busyness 構(gòu)建模型的AUC 均值為0.73(95%CI:0.549~0.911)。以original_ngtdm_Strength、wavelet-HHL_glcm_Correlation、wavelet-HHL_ngtdm_Busyness 構(gòu)建模型的AUC 均值為0.74(95%CI:0.561~0.914)。以wavelet-LLH_glcm_ClusterShade、wavelet-HHL_ngtdm_Busyness、wavelet-HHL_glcm_Correlation 構(gòu)建模型的AUC 均值為0.78(95%CI:0.611~0.949)。見表2。
表2 患者總生存期模型結(jié)果
以是否進展為標準(48 例無進展、138 例進展)對病例分類并在訓練組納入全部篩選特征構(gòu)建模型,在測試組中輸出準確率均值為74.6%且相對穩(wěn)定,3 次輸出特征重要性分別構(gòu)建新模型,以測試組為基礎輸出準確率、AUC、靈敏度和特異度。重復輸出最重要的3 個特征構(gòu)建模型,以AUC≥0.7 為標準評估,新模型不存在可靠結(jié)果。
以PFS≤6 個月(n=19)或PFS≥24 個月(n=57)為標準對病例分類并在訓練組中納入全部篩選特征,所得模型準確率均值為73.6%。以wavelet-LLH_glcm_ClusterShade、wavelet-LLH_glcm_Correlation、wavelet-HHH_glcm_MCC 構(gòu)建模型AUC 平均為0.70(95%CI:0.513~0.887)。
以PFS≤12 個月(n=69)或PFS≥18 個月(n=75)為標準對病例分類并在訓練組中納入全部篩選特征,所得模型準確率均值為82.3%。新構(gòu)建模型AUC 均無法達到要求(表3)。
表3 患者無進展生存期模型結(jié)果
隨機選取各標準下某一陽性結(jié)果繪圖(圖3)。
圖3 預測模型受試者工作特征曲線
近年來,LS-SCLC 的治療進展較慢,雖然部分早期患者可以行手術切除,但多數(shù)仍需術后化療或放化療等輔助治療,同步放、化療仍是多數(shù)LS-SCLC 的標準治療。但SCLC 細胞惡性度高,異質(zhì)性強,不同患者間療效差異較大、預后差異也較大。本研究進一步證實,多數(shù)患者在治療后很快復發(fā),中位PFS 僅為14.03 個月。但仍有少部分LS-SCLC 患者可以達到長期生存,中位OS 為29.77 個月,5 年生存率達到9.8%。提示對于LS-SCLC 患者,可能需要對預后進行分層分析。不同預后的SCLC,可能具有不同基因背景。因此,能否采用影像手段對SCLC 進行分類,研究影響預后的影像組學特點對于指導臨床診療具有重要意義。
目前,影像組學在SCLC 方面的研究較為局限,主要集中在對疾病分型[5-10],研究預后的模型較少。部分已發(fā)表的組學研究均未區(qū)分局限期或廣泛期,且總病例數(shù)過少。Gkika 等[11]納入LS-SCLC 患者47 例、廣泛期患者51 例,基于CT 提取影像特征72 個,分別與OS、PFS 行相關性分析,取相關性最高的特征納入Cox 風險比例模型。影像特征僅有original_glcm_Imc1、original_glcm_Imc2 和original_shape_Maximum2DDiameterColumn 可認為中度相關,但影像特征建立的模型無法預測生存情況。本研究的193例均為LS-SCLC 患者,病例更多、研究結(jié)果更為可靠。
本研究的影像特征提取來自放療定位CT,較診斷CT 是LS-SCLC 患者最接近治療前的影像結(jié)果,每例患者均提取1 037 個特征用于篩選,其中包括了基于原始圖像的一階特征、形狀特征、紋理特征和小波特征。Jiao 等[12]以早期NSCLC 患者為研究對象進行預后預測,同樣以GTV 為ROI 所提取的特征數(shù)為每組680 個特征,其中包含一階特征、形狀特征及部分紋理特征,模型一致性指數(shù)0.734,而Gkika 等[11]僅提取了72 個影像特征,研究結(jié)果可信度一般。本研究在機器學習基礎上,提取特征數(shù)目更多、種類更全,對于預后的預測更為準確。
有研究報道,特征篩選應用LASSO 篩選,并進行Cox 分析[13]。部分研究也未對特征進行前期篩選,而是選擇納入全部特征進行分析,然后再選取最相關的特征納入Cox 分析判斷是否能夠預測預后[11]。本研究結(jié)合了t檢驗、LASSO 篩選特征和隨機森林分類器構(gòu)建預測模型,并選擇最重要的3 個特征重新構(gòu)建模型。CT 影像具有較好的空間分辨率,且以灰度來代表不同的組織結(jié)構(gòu),影像的紋理與腫瘤異質(zhì)性有關,也可能預測腫瘤的生物學行為[14],本研究篩選獲得的特征大多為腫瘤區(qū)紋理特征,與上述研究結(jié)果相符。OS 部分以OS≤1 年或OS≥5 年和以OS≤1 年或OS≥3 年為標準構(gòu)建最終模型時,original_ngtdm_Strength和wavelet-HHL_ngtdm_Busyness 3 次被認定為重要特征,兩者均屬于NGTDM 特征,刻畫了一個像素與周圍像素值的關系,可用于衡量組織的異質(zhì)性;PFS 部分以PFS ≤6 個月或PFS ≥24 個月為標準,wavelet-LLH_glcm_ClusterShade、wavelet-LLH_glcm_Correlation 被3 次用于構(gòu)建新模型,兩者屬于GLCM 特征,用于描述具有某種空間關系的兩個像素的聯(lián)合分布,wavelet-LLH_glcm_ClusterShade 反映影像的均勻度、wavelet-LLH_glcm_Correlation 反映圖像紋理的一致性,也可表示組織的同質(zhì)性。本研究篩選獲得的特征參數(shù)與臨床現(xiàn)狀保持一致,具有更高的可信度。
影響LS-SCLC 療效的因素眾多,長期以來,預測LS-SCLC 的OS 十分困難,目前已獲得的模型多AUC<0.7。本研究中以OS≤1 年或OS≥5 年和以OS≤1 年或OS≥3 年為標準獲得的模型進一步在測試組中進行結(jié)果驗證所得AUC≥0.7,預測效果良好,具有進一步擴大樣本研究的價值。本研究在生存標準下得到具有預測效能的模型,但以是否生存為標準無法獲得期待模型,與Gkika 等[11]在OS 部分無法構(gòu)建具有預測效果的模型結(jié)果相似。這可能與OS 與患者整體情況、治療方案有關,SCLC 通常接受化療、放療聯(lián)合治療,影響因素眾多,單純以影像特征進行預測較為困難。Jain 等[15]借助影像組學構(gòu)建了預測接受鉑類藥物化療SCLC 患者預后模型,測試組模型一致性指數(shù)為0.69,也證實了上述推斷。
本研究對PFS 的結(jié)果同樣進行了多種分組研究,其中僅有以PFS≤6 個月或≥24 個月納入患者構(gòu)建模型所得AUC=0.70。以是否進展和PFS≤12 個月或PFS≥18 個月標準納入患者所構(gòu)建模型AUC 達不到標準,認為模型預測效果不佳。目前多數(shù)借助影像組學對SCLC 進行預后預測的研究[11]中PFS 部分單因素分析所得均差異無統(tǒng)計學意義,無法進行多因素分析并構(gòu)建方程,與本研究結(jié)果類似。提示SCLC 生物學特性復雜,難以用單一影像方法預測局部控制療效,這也與SCLC 易復發(fā),易轉(zhuǎn)移的臨床特點吻合。
綜上所述,本研究結(jié)果表明影像組學在SCLC 的預后預測方面可構(gòu)建具有較好預測效果的模型,但SCLC 生物學特性復雜,單一的影像特征難以描述,納入臨床因素、腫瘤標志物或分子指標等構(gòu)建融合模型,是下一步研究的方向。