管超,李夢玲,蔣禮青,李思敏,張宇沖,張博,李智,趙明芳
(中國醫(yī)科大學 1.附屬第一醫(yī)院腫瘤內科,沈陽 110001;2.附屬盛京醫(yī)院腫瘤科,沈陽 110004;3.附屬第一醫(yī)院臨床流行病學與循證醫(yī)學教研室,沈陽 110001)
肺癌是全球范圍內發(fā)病率和死亡率最高的惡性腫瘤。作為非小細胞肺癌(non-small cell lung cancer,NSCLC)的主要亞型之一,肺鱗狀細胞癌(簡稱鱗癌)約占肺癌的25%~30%[1-2]。因肺鱗癌獨特的臨床病理和生物學特征,部分患者可獲益于免疫治療。但免疫治療并非對所有患者有效[3],因此,迫切需要尋找到免疫治療的生物標志物。目前,最常用的2種生物標志物為程序性死亡配體1(programmed cell death-ligand 1,PD-L1)和腫瘤突變負荷(tumor mutational burden,TMB)[4-5]。有研究[6]表明,TMB在預測免疫檢查點抑制劑(immune checkpoint inhibitors,ICIs)治療方面優(yōu)于PD-L1。但由于侵入性活檢及全外顯子組測序(whole exome sequencing,WES)的高成本等因素,阻礙了TMB檢測的大規(guī)模推廣。
放射組學作為一個快速崛起的領域,已在預測肺癌的診斷、預后和最佳治療方面顯示出重要作用[7]。有研究[8-9]顯示,以CT為基礎的影像組學在體細胞突變[如NSCLC的表皮生長因子受體(epithelial growth factor receptor,EGFR)和間變性大細胞淋巴瘤激酶(anaplastic lymphoma kinase,ALK)突變]中存在潛在的預測價值。此外,有研究[10]顯示影像組學可以預測早期肺腺癌患者的TMB狀態(tài)。
本研究旨在探討從CT圖像中提取的放射組學特征預測肺鱗癌患者TMB狀態(tài)的價值,并基于放射組學數(shù)據(jù)開發(fā)TMB的預測模型。
共納入35例初治肺鱗癌患者。納入標準:(1)病理結果為肺鱗癌;(2)在癌癥影像數(shù)據(jù)庫(the cancer imaging archive,TCIA)中可下載胸部CT原發(fā)病灶全部影像。從TCIA數(shù)據(jù)庫下載TCGA-LUSC數(shù)據(jù)集中37例患者的全部CT影像,其中1例因病灶邊緣過于模糊無法勾畫靶病灶,另1例因存在多個原發(fā)病灶而被排除。
本研究以開源醫(yī)學圖像處理軟件(3D Slicer,版本4.11.0,http://www.slicer.org)為分析平臺,從而實現(xiàn)圖像分割及影像特征提取。將下載的普通CT圖像加載到3D Slicer軟件,調整肺窗(窗口寬度:1 400,窗位:-500),以實現(xiàn)圖像統(tǒng)一化處理。由2名具有9年工作經(jīng)驗的放射科醫(yī)生沿CT橫軸位病灶最大層面輪廓進行三維半自動分割,并手動逐層修改以勾畫感興趣區(qū)(region of interest,ROI),盡量避開血管、氣管、神經(jīng)等正常組織。再由1名具有15年以上工作經(jīng)驗的高級放射科醫(yī)生核實并確認 ROI。
采用 3D-Slicer 軟件中的 Pyradiomics 包提取851個ROI 的放射組學特征。所有分割數(shù)據(jù)都用1 mm×1 mm×1 mm的體素重采樣進行標準化,以減少圖像采集異質性的影響。
從TCGA數(shù)據(jù)庫下載肺鱗癌SNV數(shù)據(jù)集,用R軟件計算下載數(shù)據(jù)中每個樣品的TMB值,以數(shù)據(jù)集的TMB中位數(shù)為界,≤中位數(shù)的樣品為低TMB組,>中位數(shù)的樣品為高TMB組。
采用SPSS 25.0 軟件和R4.0.2軟件對影像組學數(shù)據(jù)進行處理。采用LASSO回歸篩選影像學特征。采用logistic回歸對得到的影像學特征建立模型。所得受試者操作特征(receiver operating characteristic,ROC)曲線和曲線下面積(area under the curve,AUC)用于評價所建模型的診斷效能。臨床決策曲線(decision curve analysis,DCA)用于評估預測模型的臨床實用性。
本研究采用 3D-Slicer 軟件對35例初治肺鱗癌患者CT影像的原發(fā)病灶進行三維圖像立體分割,主要方法為沿CT橫軸位病灶最大層面輪廓邊緣進行三維半自動分割,并逐層手動修改,從而獲得原發(fā)病灶的三維立體圖像即放射組學的ROI。
采用 3D-Slicer 軟件中的 Pyradiomics 包對獲得的35個ROI進行影像組學特征提取,共獲得851個ROI 的影像組學特征,其中包括shape、firstorder、glcm、gldm、glrlm、glszm和ngtdm 7種類型。
圖1 原發(fā)灶的三維立體圖像Fig.1 Three-dimensional image of the primary foci
從TCGA數(shù)據(jù)庫共下載491例肺鱗癌SNV數(shù)據(jù)集,采用R軟件(maftools包)計算每個樣品的TMB值,從而得出TMB的中位數(shù)為3.64/MB(圖2)。然后與從TCIA下載的35例肺鱗癌樣本進行匹配,得到35例TCIA肺鱗癌樣本的TMB分組情況。
圖2 TMB分組情況Fig.2 TMB grouping
采用LASSO回歸對851個特征進行降維處理,篩選出與TMB相關的影像學特征。根據(jù)最優(yōu)λ值(圖3),最終篩選出9個相關的影像學特征,分別為wavelet-HHH_ glcm_Correlation,wavelet-HHL_glcm_Imc1,wavelet-LLH_glcm_MCC,wavelet-HHL_glszm_LowGrayLevelZoneEmphasis,wavelet-HHH_glszm_Zone Variance,wavelet-HHL_gldm_LargeDependenceHigh GrayLevelEmphasis,wavelet-LLH_ngtdm_Busyness,wavelet-HLL_firstorder_MeanAbsoluteDeviation和wavelet-LLL_glcm_MCC。
圖3 三折交叉驗證圖Fig.3 Tri-fold cross-validation diagram
將篩選的9個影像學特征與TMB同時納入logistic回歸方程,進行逐步回歸,最后篩選得到預測模型的3個影像學特征,分別為wavelet-HHH_glcm_Correlation、wavelet-HHL_gldm_Large Dependence High Gray Level Emphasis和wavelet-LLL_glcm_MCC(表1)。繪制3個影像學特征與TMB的nomogram圖(圖4)。繪制3個影像學特征預測的ROC 曲線(圖5),AUC可達0.882,說明此模型預測TMB精度良好。利用logistic回歸模型進行建模,繪制DCA對臨床預測模型進行評價。DCA顯示,當閾值取0.10~1.00時,影像組學模型預測效能良好,見圖6。
表1 篩選預測模型的影像學特征Tab.1 Imaging characteristics of the screening prediction model
圖4 預測TMB的影像組學nomogram圖Fig.4 Imaging nomogram of predicted TMB
圖5 影像學組學預測模型的ROC曲線Fig.5 ROC curves for the imaging histological features of prediction models
圖6 影像組預測模型的DCAFig.6 DCA of the image group prediction model
NSCLC患者經(jīng)過ICIs治療后,僅有一小部分人群臨床獲益。除了PD-L1、MSI等預測ICIs療效的生物標志物,近年來,越來越多的數(shù)據(jù)證實TMB越高的腫瘤抗原負荷越高,更有可能從ICIs 治療中獲益,因此,TMB受到的臨床關注度逐漸升高。
TMB是一種廣泛用于ICIs治療獨立的療效預測生物標志物。TMB首次在2014年黑色素瘤的研究[11]中被證實與CTLA-4抗體的療效存在相關性。2017年發(fā)現(xiàn)TMB對27種腫瘤的免疫治療研究[12-13]有顯著的療效預測作用,奠定了其作為預測泛癌種治療探索的基礎。
盡管TMB具有前景的預測價值,但TMB檢測仍面臨著一些挑戰(zhàn),包括肺癌患者動態(tài)獲取活檢組織的可行性差,重癥患者無法獲取活檢組織,以及WES檢查的高成本等。本研究基于CT影像組學預測TMB,可以彌補傳統(tǒng)TMB檢測方法的不足。
放射組學研究因其獲取全面圖像信息方面的優(yōu)勢而在廣泛腫瘤研究領域迅速發(fā)展[14]。在NSCLC中,影像學組在預測病理和分子分型[15-16]、器官特異性轉移[17-18]、復發(fā)和總生存[19-20]等方面表現(xiàn)出潛力。因此,假設放射組學特征可用于通過預測高TMB的概率來選擇臨床上最需要的患者群體進行TMB檢測。此外,對于那些無法接受昂貴WES測試的人群來說,放射組學可以作為 TMB 檢測的替代或輔助診斷。
本研究中,TMB預測模型通過列線圖可視化,可以方便地計算肺鱗癌患者高TMB的可能性。該研究有可能幫助臨床醫(yī)生篩選出TMB檢測的最佳候選人,即最有可能具有高TMB的患者。另一方面,本研究的模型也可以作為TMB的替代品,用于無法負擔昂貴的TMB檢測或沒有可獲取的組織樣本進行檢測的患者。與傳統(tǒng)的TMB檢測方法相比,本研究放射組學TMB預測模型為完全非侵入性。此外,由于大多數(shù)肺鱗癌患者在初始診斷之前或初始診斷時已經(jīng)接受了胸部CT掃描,因此,基于影像組學的TMB預測模型幾乎不需要額外的檢查。
本研究存在一定的局限性。首先,本研究數(shù)據(jù)來自TCIA數(shù)據(jù)庫,樣本量相對較小,因此不可避免的會存在與回顧性研究相關的缺點;其次,由于目前對肺鱗癌中TMB的最佳臨界值沒有達成共識,選擇了通過R包(maftools包)計算得出的中位TMB來定義TMB的高、低組;第三,影像組學預測肺鱗癌患者TMB能力背后的生物學解釋尚不清楚,還需要進一步深入研究。最后,本研究缺乏外部數(shù)據(jù)對預測模型進行驗證。
本研究結果顯示,從胸部CT中提取的影像組學特征與TMB之間存在內在聯(lián)系。因此建立了一個基于放射組學特征的TMB預測模型,通過本研究證明了采用放射組學預測TMB的可行性。并且,基于影像組學特征建立的預測模型對TMB狀態(tài)有較高的預測價值,有待進一步研究探索。