趙帥, 孟令思, 郭君武
孤立性肺結(jié)節(jié)(solitary pulmonary nodule,SPN)指單一、邊界清晰、影像不透明、直徑≤30 mm,周圍含氣肺組織所包繞的病灶[1]。目前,臨床上SPN的診斷鑒別涉及多種良惡性病變,包括原發(fā)性肺癌以及錯(cuò)構(gòu)瘤[2]??焖僮R(shí)別并切除惡性SPN可提升非小細(xì)胞肺癌患者5年生存率至60%~80%[3],同時(shí)術(shù)前對(duì)于患者SPN良惡性的診斷有助于臨床治療決策的快速評(píng)估,優(yōu)化醫(yī)療資源的配置。目前,SPN良惡性的診斷金標(biāo)準(zhǔn)仍為病理活檢,病理活檢仍存在并發(fā)感染、侵襲性且滯后性等問題[4]。 CT目前廣泛用于臨床上無侵襲性定性評(píng)估SPN[5],CT可通過直觀的視覺分辨腫瘤大小、腫瘤密度以及腫瘤邊緣[6]。然而相比較常規(guī)的CT掃描,CT靶掃描確保CT征象明顯豐富,不僅可在形態(tài)學(xué)上提供高清CT特征,同時(shí)其CT密度值更為精確,可用于CT圖像的進(jìn)一步科學(xué)研究[7]。
CT對(duì)于SPN的良惡性的誤診率接近60%[8]。然而由于腫瘤異質(zhì)性,腫瘤紋理的變化與腫瘤基因組學(xué)的變化具有直接相關(guān)性[9]。2012年Lambin提出影像組學(xué)(Radiomics)至今[10],Radiomics類似于圖像的“基因組學(xué)”,聯(lián)合患者多模態(tài)臨床信息構(gòu)建模型無侵襲性定量評(píng)估患者疾病[11]。因此,本研究的目的在于基于CT靶掃描圖像進(jìn)行影像組學(xué)特征提取聯(lián)合CT征象構(gòu)建聯(lián)合模型評(píng)估SPN的良惡性。
1.研究對(duì)象
納入2018年1月-2020年7月在鄭州大學(xué)第二附屬醫(yī)院行胸部CT檢查診斷為肺結(jié)節(jié)患者?;颊呷虢M標(biāo)準(zhǔn): ①肺內(nèi)孤立性結(jié)節(jié);②患者需經(jīng)過穿刺或手術(shù)切除后明確病理類型,是否良惡性; ③CT成像確診病灶位于肺部;④結(jié)節(jié)橫向最大直徑≤30 mm;⑤CT上無明顯淋巴增大,胸腔積液征象,無肺不張;患者篩除標(biāo)準(zhǔn):①患者于CT成像前行穿刺活檢術(shù);②CT成像前患者已經(jīng)接受化療、放療或藥物治療等腫瘤相關(guān)治療方案;③患者CT圖像質(zhì)量不滿足感興趣區(qū)域分割?;仡櫺约{入患者資料時(shí),需跟患者溝通本組研究?jī)?nèi)容,并確?;颊吆炇鹗跈?quán)書。
2.胸部CT檢查方法
采用Siemens Somatom Definition Flash螺旋CT掃描儀進(jìn)行常規(guī)胸部掃描(管電壓100 kV,電流260 mAs,掃描層厚5 mm,矩陣512×512)。發(fā)現(xiàn)病灶后縮小掃描視野(FOV),以病灶為中心行薄層靶掃描(管電壓140 kV,電流576 mAs,掃描層厚0.6 mm,矩陣512×512,F(xiàn)OV為20 cm)。將掃描獲得的影像資料傳入后處理工作站(Syngo MMWP VE40A,Siemens)行多平面重建(MPR)、容積再現(xiàn)(VR)、表面投影顯示(SSD)、最大密度投影(MIP)和最小密度投影(MinIP)等各種重建技術(shù)。
3.圖像評(píng)價(jià)方法
每例患者由本科室從事CT影像診斷10年經(jīng)驗(yàn)的醫(yī)師遵循單盲原則(無臨床資料、無病理結(jié)果對(duì)照)獨(dú)立評(píng)估患者CT征象。①結(jié)節(jié)病發(fā)部位:右肺上葉、右肺下葉、左肺上葉、左肺下葉;②結(jié)節(jié)橫斷面最大直徑;③病變邊緣:是否出現(xiàn)分葉征;④病變內(nèi)部征象:是否出現(xiàn)空泡征、空氣支氣管征、鈣化;⑤病變周邊:胸膜凹陷征、血管聚集征、直邊征。分葉征即結(jié)節(jié)的輪廓非圓形或橢圓形態(tài),其表面由多個(gè)凹凸不平的弧形組成;空泡征即結(jié)節(jié)內(nèi)出現(xiàn)直徑約為1~2 mm的點(diǎn)狀低HU值的透亮影,形似空泡;空氣支氣管征即病變周圍的肺組織出現(xiàn)透亮的支氣管影;胸膜凹陷征即患者胸膜凹向結(jié)節(jié);血管聚集征即血管向結(jié)節(jié)聚集。
4.影像組學(xué)特征提取
由本科室具有5~10年CT診斷經(jīng)驗(yàn)的醫(yī)師利用ITK-SNAP 3.6.0進(jìn)行感興趣區(qū)域分割(region of intest,ROI)。具體分割:首先將薄層靶掃描肺部CT圖像導(dǎo)入ITK-SNAP軟件中,在含有結(jié)節(jié)的每一個(gè)層面沿結(jié)節(jié)病灶邊緣勾畫ROI(避開血管、壞死以及鈣化區(qū)域),并最終合成3D ROI。其次,按照?qǐng)D像標(biāo)志物標(biāo)準(zhǔn)協(xié)會(huì)對(duì)影像組學(xué)特征要求標(biāo)準(zhǔn),利用Anaconda prompt 3導(dǎo)入Pyradiomics包按照exmaple CT特征表提取影像組學(xué)參數(shù)共計(jì)987個(gè)影像組學(xué)特征[12,13]。
5.病理診斷
根據(jù)肺癌組織學(xué)分類標(biāo)準(zhǔn)2015版,由病理醫(yī)師進(jìn)行結(jié)節(jié)良惡性評(píng)估,并診斷患者具體病理類型。
6.統(tǒng)計(jì)分析
采用R 4.0.3和R studio進(jìn)行統(tǒng)計(jì)分析,采用tidyverse、caret、pROC、rms、Publish、glmnet、ModelGood、ggpubr、rmda、DescTools、mRMR程輯包。首先,按照隨機(jī)分層原則,以7:3比例將良惡性患者分為訓(xùn)練組和測(cè)試組,以訓(xùn)練組患者SPN良惡性為研究標(biāo)簽,對(duì)影像組學(xué)特征進(jìn)行取冗除雜,先采用最小冗余最大相關(guān)(min redundancymax relevance,mRMR)進(jìn)行特征降維,保留30個(gè)特征;繼而采用套索模型(least absolute shrinkage and selection operator,LASSO)構(gòu)建影像組學(xué)標(biāo)簽(radiomics signature,Rad-score),并采用受試者曲線(receiver operating characteristic curve,ROC)評(píng)估訓(xùn)練組和測(cè)試組中影像組學(xué)標(biāo)簽Rad-score鑒別良惡性SPN的診斷效能。最后以訓(xùn)練組患者信息納入CT征象特征與影像組學(xué)標(biāo)簽Rad-score構(gòu)建多元邏輯回歸模型評(píng)估患者SPN的良惡性,采用Nomogram可視化該多元邏輯回歸模型,并采用ROC評(píng)估Nomogram在訓(xùn)練組和測(cè)試組鑒別患者SPN良惡性的效能,利用C-index、Hosmer-Lemeshow、DCA評(píng)估模型。P<0.05差異具有統(tǒng)計(jì)學(xué)意義。
1.臨床資料
本組研究共計(jì)納入82名SPN患者,其中38名患者接受手術(shù),44名患者接受穿刺活檢。所有SPN均經(jīng)病理驗(yàn)證,其中惡性結(jié)節(jié)共計(jì)43例患者,良性結(jié)節(jié)39名患者。惡性結(jié)節(jié)患者中男28人,女15人;良性結(jié)節(jié)患者中男23人,女16人,惡性結(jié)節(jié)患者與良性結(jié)節(jié)患者性別無統(tǒng)計(jì)學(xué)差異(P=0.651,表1)。
惡性結(jié)節(jié)患者與良性結(jié)節(jié)患者年齡無統(tǒng)計(jì)學(xué)差異(P=0.202,表1)。然而惡性結(jié)節(jié)患者的結(jié)節(jié)病發(fā)部位與良性結(jié)節(jié)患者的結(jié)節(jié)病發(fā)部位具有統(tǒng)計(jì)學(xué)差異(P=0.026,表1)。CT征象結(jié)果顯示惡性結(jié)節(jié)患者的結(jié)節(jié)直徑顯著大于良性結(jié)節(jié)(P=0.031,表1);同時(shí)惡性結(jié)節(jié)患者22名出現(xiàn)分葉,顯著高于良性結(jié)節(jié)患者(P<0.001,表1);惡性結(jié)節(jié)22名患者結(jié)節(jié)出現(xiàn)毛刺,36名患者出現(xiàn)血管聚集,22名出現(xiàn)胸膜凹陷,20名出現(xiàn)空氣支氣管均顯著高于良性結(jié)節(jié)患者(表1),然而惡性結(jié)節(jié)患者僅3例出現(xiàn)鈣化現(xiàn)象,顯著低于良性結(jié)節(jié)患者(P=0.009,表1);兩組患者CT征象中出現(xiàn)空泡、以及直邊無顯著差異(P=0.172,1.000,表1)。
表1 良惡性孤立性結(jié)節(jié)患者的臨床資料以及CT征象
2.影像組學(xué)標(biāo)簽構(gòu)建
按照7:3的比例將惡性SPN患者和良性SPN患者分為訓(xùn)練組和測(cè)試組,訓(xùn)練組中59例患者,其中31例惡性,28例良性;測(cè)試組中23例患者,其中12例惡性,11例良性。以訓(xùn)練組患者SPN是否惡性作為研究標(biāo)簽,采用mRMR進(jìn)行去冗除雜后,保留30個(gè)特征,繼而采用LASSO,取最小懲罰系數(shù)時(shí)構(gòu)建的影像組學(xué)標(biāo)簽Rad-score其二項(xiàng)式偏差最小(圖1a),此時(shí)log(λ)=0.048 (圖1b),構(gòu)建Rad-score影像組學(xué)特征的權(quán)重系數(shù)如圖1c。Rad-score公式如下:Rad-score=-0.447×log_sigma_4_0_mm_3D_gldm_LowGrayLevelEmphasis-0.211×wavelet_HHH_firstorder_Mean-0.238×original_firstorder_Mean+0.219×wavelet_LHL_glszm_LargAraHighGrayLev-elEmphasis+0.334×log_sigma_2_0_mm_3D_firstorder_Kurtosis+0.367×wavelet_HHL_firstorder_Mean+0.063×wavelet_HLH_firstorder_Kurtosis-0.08×wavelet_HHH_firstorder_Median+0.018×log_sigma_2_0_mm_3D_glszm_SizeZoneNonUniformity+0.266×wavelet_HHL_glcm_Correlation+0.091
圖1 良惡性SPN鑒別影像組學(xué)標(biāo)簽構(gòu)建。a) 采用LASSO進(jìn)行特征降維,橫坐標(biāo)表示懲罰系數(shù)值,縱坐標(biāo)表示隨著懲罰系數(shù)值 的改變,二項(xiàng)式偏差大小的改變; b) 采用LASSO進(jìn)行特征降維,下方橫坐標(biāo)表示log(λ)值,上方橫坐標(biāo)表示log(λ)對(duì)應(yīng)的特征個(gè)數(shù),縱坐標(biāo)表示每個(gè)特征的權(quán)重系數(shù); c) 采用LASSO進(jìn)行特征降維后構(gòu)建Rad-score時(shí),不同的影像組學(xué)參數(shù)的系數(shù)值。
3.影像組學(xué)標(biāo)簽診斷良惡性SPN效能
基于Rad-score公式計(jì)算訓(xùn)練組和測(cè)試組患者的Rad-score值,訓(xùn)練組中惡性SPN患者與良性SPN患者Rad-score具有顯著性差異(P<0.000),然而測(cè)試組中惡性SPN患者與良性SPN患者Rad-score差異不顯著(P=0.079)。訓(xùn)練組中Rad-score診斷效能AUC=0.89 (圖2a),95%置信區(qū)間:0.81~0.97,陽性預(yù)測(cè)率PPV為0.774,陰性預(yù)測(cè)率為0.857;測(cè)試組中Rad-score診斷效能AUC=0.72 (圖2b),95%置信區(qū)間為0.49~0.95,陽性預(yù)測(cè)率0.857,陰性預(yù)測(cè)率0.687(表2)。
表2 Rad-score、CT征象和Nomogram鑒別SPN良惡性的良惡性的診斷效能
4.CT征像聯(lián)合影像組學(xué)標(biāo)簽構(gòu)建聯(lián)合模型評(píng)估良惡性SPN
基于訓(xùn)練組中患者CT征像進(jìn)行Mann-WhitneyU檢驗(yàn)篩選在良惡性SPN患者中有統(tǒng)計(jì)學(xué)差異的參數(shù)后, 對(duì)參數(shù)之間進(jìn)行Spearman相關(guān)性分析,剔除CT征像之間相關(guān)性>0.6的參數(shù)。最終保留血管聚集、毛刺和分葉3個(gè)CT征像參數(shù)并聯(lián)合Rad-score構(gòu)建鑒別良惡性SPN的多元邏輯回歸模型, 公式如下:
同時(shí)采用Nomogram可視化該模型 (圖3a)。Nomogram使用方式為通過計(jì)算患者的Rad-score代入圖中找到對(duì)應(yīng)值并以Points做垂直線獲取對(duì)應(yīng)Points線上的得分,并同時(shí)將患者的是否出現(xiàn)血管聚集,是否出現(xiàn)毛刺,是否出現(xiàn)分葉定義為0和1,0為否、1為是。代入患者以上CT征像值后均按照相同方法以Points做垂直線獲取對(duì)應(yīng)Points線上的得分;最終將4個(gè)參數(shù)的Points得分相加獲得Total points上的總分,并向Risk上做垂直線獲取Risk值,即為患者是否惡性的風(fēng)險(xiǎn)值。通過比較CT征象、Rad-score和Nomogram的診斷效能,訓(xùn)練組中Nomogram的AUC值高于CT征象高于Rad-score (0.96 vs 0.90 vs 0.89,表2,圖3b)。測(cè)試組中Nomogram的AUC值高于CT征象高于Rad-score (0.88 vs 0.87 vs 0.72,表2,圖3c)。
圖3 CT征象聯(lián)合Rad-score構(gòu)建Nomogram以及診斷效能比較。a) 征象聯(lián)合Rad-score構(gòu)建多元邏輯回歸模型,并采用Nomogram進(jìn)行可視化;b) Nomogram、CT征象(CT findings)以及Radiomics在訓(xùn)練組中評(píng)估SPN良惡性的診斷效能; c) Nomogram、CT征象(CT findings)以及Radiomics在驗(yàn)證組中評(píng)估SPN良惡性的診斷效能。 圖4 Nomogram術(shù)前鑒別SPN良惡性的模型評(píng)估。a、b) 訓(xùn)練組以及測(cè)試組Nomogram鑒別SPN良惡性的C-index圖; c) Nomogram鑒別SPN良惡性的臨床決策線分析。橫坐標(biāo)示患者是惡性結(jié)節(jié)的風(fēng)險(xiǎn)值; 縱坐標(biāo)代表從不同鑒別方法中評(píng)估患者是否為惡性結(jié)節(jié)的臨床收益;藍(lán)色線 (ALL) 即代表采用隨機(jī)的方案進(jìn)行惡性結(jié)節(jié)評(píng)估時(shí)的臨床收益;黑色線 (None) 即代表不采用任何方案進(jìn)行惡性結(jié)節(jié)評(píng)估時(shí)的臨床收益始終為0;紅線代表采用Nomogram (with Radscore)進(jìn)行良惡性評(píng)估時(shí)的臨床收益; 綠線代表采用CT findings (without Radscore)時(shí)評(píng)估SPN惡性患者的臨床收益。
5.Nomogram模型擬合評(píng)估
Nomogram在訓(xùn)練組和測(cè)試組中與患者實(shí)際情況擬合程度由C-index曲線表達(dá)(圖4a、b),訓(xùn)練組以及測(cè)試組中Hosmer-Lemeshow分析結(jié)果為P=0.6006 vs 0.4092,即Nomogram在訓(xùn)練組和測(cè)試組中評(píng)估患者是惡性SPN的模型結(jié)果與實(shí)際病理檢測(cè)標(biāo)準(zhǔn)結(jié)果無顯著差異。臨床決策線結(jié)果顯示當(dāng)患者為惡性SPN的風(fēng)險(xiǎn)<0.83時(shí),患者從Nomogram上獲取的臨床收益>CT征象。
本組研究通過對(duì)SPN患者進(jìn)行CT靶掃描,采用病灶3D分割后提取影像組學(xué)參數(shù),構(gòu)建影像組學(xué)標(biāo)簽Rad-score。繼而聯(lián)合Rad-score以及CT征象構(gòu)建聯(lián)合模型定量評(píng)估患者是否惡性SPN的風(fēng)險(xiǎn)幾率。研究結(jié)果發(fā)現(xiàn)聯(lián)合CT征象以及Radiomics構(gòu)建Nomogram進(jìn)行SPN良惡性鑒別時(shí)具有較好的鑒別能力。此外,我們首次基于CT靶掃描圖像進(jìn)行肺結(jié)節(jié)相關(guān)的影像組學(xué)研究。
患者原始圖像是基于radiomics研究的重要原始數(shù)據(jù),影像組學(xué)創(chuàng)始人Lambin提出非標(biāo)準(zhǔn)化的醫(yī)學(xué)圖像本身會(huì)對(duì)影像組學(xué)的研究造成不可避免的系統(tǒng)誤差[11]。相比較傳統(tǒng)CT掃描成像CT靶掃描具有薄層掃描(≤0.635 mm)、FOV顯著縮小(200~230 mm)、肺結(jié)節(jié)邊緣更清晰等優(yōu)點(diǎn)[14]。國(guó)內(nèi)外關(guān)于SPN良惡性的影像組學(xué)研究大多基于常規(guī)CT掃描[15,16]。本組研究中則是嘗試在SPN的影像組學(xué)研究中引入CT靶掃描圖像進(jìn)行Radiomics的相關(guān)研究。
我們利用CT靶掃描圖像提取海量影像組學(xué)后進(jìn)行特征去冗除雜構(gòu)建影像組學(xué)標(biāo)簽,Rad-score用以評(píng)估SPN良惡性,通過LASSO進(jìn)行特征降維構(gòu)建Rad-score的計(jì)算公式獲得該公式后可對(duì)新收入的患者在未獲取病理結(jié)果前通過CT靶圖像提取該公式中的10個(gè)Radiomics特征,從而計(jì)算出Rad-score的值。研究發(fā)現(xiàn)基于Rad-score進(jìn)行SPN良惡性評(píng)估時(shí)AUC值在訓(xùn)練組中可達(dá)到0.89,測(cè)試組中可達(dá)到0.72。晏睿瀅等[15]研究中則基于CT特征構(gòu)建模型納入年齡、空泡、血管聚集、空氣支氣管、胸膜牽拉、GCO成分,CT特征模型在訓(xùn)練組AUC為0.860,驗(yàn)證集為0.864,高于Rad-score。繼而我們納入CT特征聯(lián)合Rad-score構(gòu)建聯(lián)合模型,聯(lián)合模型在訓(xùn)練組AUC為0.96,測(cè)試組中AUC為0.88。同時(shí),我們的聯(lián)合模型中也納入了血管聚集該項(xiàng)指標(biāo),與晏睿瀅研究結(jié)果相似。然而我們的聯(lián)合模型中同時(shí)納入了毛刺、分葉,單文莉[17]研究提出惡性征象的CT特征風(fēng)險(xiǎn)因素可能與是否分葉、是否毛刺高度相關(guān),跟我們的研究結(jié)果相符。因此,CT征象聯(lián)合影像組學(xué)可用于嘗試提高CT評(píng)估的SPN良惡性的效能。
目前影像組學(xué)乃至人工智能的發(fā)展始終存在一個(gè)問題,即如何讓復(fù)雜的數(shù)學(xué)模型高效的應(yīng)用與臨床實(shí)際工作中,因此,我們根據(jù)已有Radiomics的成熟研究選擇Nomogram對(duì)最終的聯(lián)合模型進(jìn)行可視化[18]。Nomogram可在獲取患者是否血管聚集、是否毛刺、是否分葉、以及Rad-score值代入公式中獲取患者為惡性的風(fēng)險(xiǎn)值,從而協(xié)助臨床非侵襲性的評(píng)估患者SPN為惡性的可能性。
本研究尚存在許多不足之處:采用多元邏輯回歸模型,而未比較如隨機(jī)森林、SVM等分類器模型;缺乏多中心病例,目前影像組學(xué)研究中大多采用本醫(yī)院的病例,而缺乏多中心的數(shù)據(jù),從而導(dǎo)致模型的推廣性無法保證。
綜上所述,本組研究基于CT靶掃描提取影像組學(xué)特征并聯(lián)合CT征象構(gòu)建多元邏輯回歸模型,該模型可在獲取患者病理檢測(cè)信息前嘗試用于協(xié)助臨床無侵襲性的評(píng)估SPN的良惡性,該模型具有一定程度的參考價(jià)值,然而,如果需要在臨床上實(shí)際推廣應(yīng)用起來,仍需要不斷的擴(kuò)大樣本進(jìn)行深入研究。