陳歡,梁明柱,雷益,李昕,謝傳淼,張?zhí)m軍,柳學(xué)國
肺癌是我國發(fā)病率及死亡率最高的癌癥,其中男性中肺癌的發(fā)病率及死亡率高居首位,女性中肺癌的發(fā)病率居第二位,但死亡率高居首位[1-2]。肺腺癌是肺癌最常見的組織學(xué)亞型,其發(fā)病率逐年上升,其中80%以上的肺腺癌屬于混合型。2011年新的肺腺癌分級系統(tǒng)中引入了原位腺癌(adenocarcinoma in situ,AIS)和微浸潤腺癌(microinvasive adenocarcinoma,MIA)的概念。浸潤性肺腺癌的分類以癌細(xì)胞的主要生長方式命名,其分型包括貼壁為主型、腺泡為主型、乳頭為主型、實性為主型和微乳頭為主型,提倡對浸潤性腺癌進(jìn)行完整、詳細(xì)的組織學(xué)診斷模式[3-4]。肺腺癌的組織學(xué)異質(zhì)性是腫瘤預(yù)后的重要影響因素[5]。
影像組學(xué)指從醫(yī)學(xué)影像圖像(CT、MRI、PET等)中高通量地提取大量影像信息,深層次挖掘、預(yù)測和分析影像信息,輔助醫(yī)師做出最準(zhǔn)確的診斷。影像組學(xué)的理論假設(shè)是微觀層面的基因或蛋白質(zhì)模式改變可在宏觀影像學(xué)特征上有所表達(dá),已經(jīng)在一系列研究中得到初步驗證[6-10]。Choi等[11]和等Bae[12]基于全瘤體ROI法分析了實體腫瘤的影像組學(xué)特征與肺腺癌病理分級、組織學(xué)異質(zhì)性的的相關(guān)性。顯微病理上肺腺癌與正常肺組織之間存在不同程度的移行帶,范圍約1~5 mm,平均3.5 mm[13],含有與淋巴管、血管浸潤相關(guān)的豐富信息,與病變的轉(zhuǎn)移和預(yù)后密切相關(guān)[5,14]。此外,腫瘤的預(yù)后與免疫微環(huán)境相關(guān),腫瘤周圍的移行帶內(nèi)可見參與免疫應(yīng)答反應(yīng)的炎性細(xì)胞,如巨噬細(xì)胞和T淋巴細(xì)胞[15-16]。腫瘤可見邊緣向內(nèi)外擴展3和6mm組織的影像組學(xué)模型對預(yù)測腫瘤預(yù)后、指導(dǎo)治療方案的制訂等具有重要的臨床意義[17]。
本研究中通過在勾畫ROI時自動沿腫瘤可見邊緣外擴5 mm,利用包含有腫瘤周邊微環(huán)境信息的瘤周影像組學(xué)模型來預(yù)測肺腺癌的病理分級并與瘤內(nèi)影像組學(xué)模型進(jìn)行對比,旨在探討這種方法對預(yù)測肺腺癌病理分級的效能。
回顧性分析2012年1月-2017年10月在中山大學(xué)附屬腫瘤醫(yī)院經(jīng)手術(shù)病理證實的肺癌患者的臨床資料及CT圖像。納入標(biāo)準(zhǔn):經(jīng)病理證實為肺腺癌,且結(jié)節(jié)直徑≥5 mm且≤30 mm;具有完整的術(shù)前薄層增強CT圖像;臨床資料完整;具有完整的病理檢查資料包括基于國際肺癌研究學(xué)會(International Association for the Study of Lung Cancer,IASLC),美國胸科學(xué)會(American Thoracic Society,ATS)和歐洲呼吸學(xué)會(European Respiratory Society,ERS)國際多學(xué)科新分類標(biāo)準(zhǔn)對腫瘤進(jìn)行病理分級。排除標(biāo)準(zhǔn):術(shù)前接受放化療;圖像上有明顯呼吸或金屬偽影,影響對病灶的觀察;臨床及病理資料不完整。
使用Siemens Somatom Sensation 64或Disco-very CT750 HD螺旋CT機。掃描掃描:120 kV,220 mAs,重建層厚1~2 mm,算法B30,注射對比劑后延遲60~70 s采集CT增強圖像。采用窗寬1500 HU、窗位-600 HU進(jìn)行圖像的觀察。
采用IASLC,ATS,ERS多學(xué)科肺腺癌病理分類標(biāo)準(zhǔn)對每個切除標(biāo)本(整個腫瘤)進(jìn)行組織學(xué)分型,以5%增量半定量記錄腫瘤的成份[3-4]。
根據(jù)組織學(xué)轉(zhuǎn)移潛能及預(yù)后,將肺腺癌分為3級[4,18-21]。1級:低轉(zhuǎn)移潛能,包括AIS、MIA和貼壁為主型腺癌;2級:中間轉(zhuǎn)移潛能,包括腺泡為主型腺癌和乳頭為主型腺癌;3級:高轉(zhuǎn)移潛能,包括實性為主型腺癌和微乳頭為主型腺癌[4]。
由一位放射科醫(yī)師(醫(yī)師A)在術(shù)前胸部增強CT圖像上根據(jù)肺結(jié)節(jié)的邊緣手動逐層勾畫ROI,并將肺結(jié)節(jié)所有層面的二維ROI進(jìn)行融合處理,獲得肺結(jié)節(jié)的三維容積感興趣區(qū)(volume of interest,VOI)。將上述步驟中得到的瘤內(nèi)組VOI導(dǎo)入軟件(Analysis-Kinetic Version 1.0.3,GE公司),軟件根據(jù)腫瘤邊緣自動外擴5 mm作為含瘤周組VOI,當(dāng)結(jié)節(jié)毗鄰肋骨、胸膜等結(jié)構(gòu)時候,通過手工調(diào)整去除非瘤周的肺組織,如圖1所示。將薄層的肺窗增強CT圖像和VOIs同時導(dǎo)入Analysis-Kinetic軟件自動匹配并進(jìn)行計算,每例患者基于VOI可得到385個定量的影像組學(xué)特征。
按照以上方法,隨機選擇入組的30例肺腺癌,由放射科醫(yī)生A(有3年胸部影像診斷經(jīng)驗)和放射科醫(yī)生B(11年胸部影像診斷經(jīng)驗)及放射科醫(yī)生A間隔3個月后分別獨立進(jìn)行ROI的勾畫,得到四組放射組學(xué)特征的數(shù)據(jù),對反映病灶形態(tài)的組學(xué)特征(3D最大直徑,表面積和體積)進(jìn)行觀察者間和觀察者內(nèi)一致性的分析。余下病例由放射科醫(yī)師A進(jìn)行病灶ROI的勾畫和測量。
本研究中對測量數(shù)據(jù)的處理和分析主要分為四個步驟。
①數(shù)據(jù)預(yù)處理:本研究中總樣本量為173例肺癌,病理分級為1級51例、2級114例、3級8例,樣本量分布不均衡,病理分級為1級的樣本量少,僅占總樣本量的5%。因此,對瘤內(nèi)組及含瘤周組均采用SMOTE過采樣算法[22]對訓(xùn)練集里樣本量較少的類別進(jìn)行過采樣,合成新的樣本量分布來緩解數(shù)據(jù)的不平衡問題,將原樣本量分布51:114:8調(diào)整至58:58:58,再按照7:3的比例將總樣本量劃分為訓(xùn)練集和測試集。
②特征的降維:每個VOI提取385個定量組學(xué)特征, 采用Shapiro-wilk正態(tài)分布檢驗、 Bartlett方差齊性檢驗和t檢驗,篩選出有統(tǒng)計學(xué)意義的特征,然后采用單因素Logistic回歸分析和Spearman相關(guān)系數(shù)去除數(shù)據(jù)冗余,以相關(guān)系數(shù)大于0.9作為篩選標(biāo)準(zhǔn),最終得到非冗余定量組學(xué)特征。
③模型的建立:瘤內(nèi)組及含瘤周組均采用隨機森林法進(jìn)行模型的建立,共建1000棵樹。每棵樹所要用到的特征數(shù)是隨機森林建模法最重要的參數(shù)之一,采用交叉驗證法為這一參數(shù)確定最佳數(shù)值。
④模型的驗證:分別對瘤內(nèi)組及含瘤周組基于放射組學(xué)特征建立的模型進(jìn)行驗證,即將模型對肺腺癌病理分級的預(yù)測與實際手術(shù)切除后病理檢查結(jié)果進(jìn)行比較。采用混淆矩陣及其衍生的診斷符合率、敏感度和特異度指標(biāo)來評估兩組的影像組學(xué)模型的診斷效能,將瘤內(nèi)組混淆矩陣的診斷效能作為理論值,利用三階卡方檢驗分析含瘤周組與瘤內(nèi)組各項數(shù)據(jù)間的差異有無統(tǒng)計學(xué)意義。
特征數(shù)的篩選、降維和模型建立采用R軟件3.0.1版(http://www.R-project.org)進(jìn)行統(tǒng)計分析。所有P值均為雙側(cè)檢驗結(jié)果,以P<0.05為差異有統(tǒng)計學(xué)意義。
不同病理分級、訓(xùn)練集及驗證集的一般資料的比較,首先進(jìn)行正態(tài)分布檢驗,符合正態(tài)分布且方差齊的定量資料,采用獨立樣本t檢驗;不符合正態(tài)分布的定量資料,采用非參數(shù)秩和檢驗;定性資料,采用二分類資料的卡方檢驗。
可信度分析:計算組內(nèi)和組間相關(guān)系數(shù)(intraclass correlation coefficient,ICC)來分別分析醫(yī)師A不同時間兩次勾畫ROI及醫(yī)師A與醫(yī)師B勾畫ROI獲得的反映病灶形態(tài)的組學(xué)特征的一致性。以ICC>0.80為一致性很好,0.61~0.80為中等,0.41~0.60為一般,0.11~0.40為較低,0.10以下為無一致性。
共納入173例肺癌患者,年齡33~84歲,平均60歲;女96例,男77例。實性結(jié)節(jié)102例,亞實性結(jié)節(jié)71例。按照結(jié)節(jié)的直徑進(jìn)行分組,5.0~9.9mm有16例,10.0~19.9mm有88例,20.0~30.0mm有69例。臨床分期:Ⅰ期134例,Ⅱ期18例,Ⅲ期21例;伴有淋巴結(jié)轉(zhuǎn)移者39例,淋巴結(jié)未轉(zhuǎn)移者134例。根據(jù)肺腺癌的病理分級,將患者分為3組,3組患者的基本臨床資料及比較結(jié)果見表1。三組間患者性別、年齡的差異無統(tǒng)計學(xué)意義(P>0.05),肺結(jié)節(jié)大小及臨床分期有顯著統(tǒng)計學(xué)差異(P<0.05)。
訓(xùn)練集及測試集中患者的各項臨床資料中,性別、年齡、結(jié)節(jié)大小及臨床分期間的差異均無統(tǒng)計學(xué)意義(P>0.05)。
ROI提取的關(guān)于形態(tài)的影像組學(xué)特征的觀察者間和觀察者內(nèi)ICC分別為0.793~0.859和0.773-0.806。因此,所有后續(xù)數(shù)據(jù)的分析都基于醫(yī)師A勾畫的ROI。
表1 不同分級組中臨床資料和病灶的基本特征
基于VOI提取的影像組學(xué)特征經(jīng)降維后,瘤內(nèi)組和含瘤周組分別得到61和36個非冗余組學(xué)特征。其中特征為8個時,瘤內(nèi)組影像組學(xué)模型的準(zhǔn)確性最高;而影像組學(xué)特征數(shù)為12個時,含瘤周組影像組學(xué)模型的準(zhǔn)確性最高。
影像組學(xué)模型的驗證:瘤內(nèi)組和含瘤周組影像組學(xué)模型的驗證集混淆矩陣(Random Forest)見表2~3。影像組學(xué)模型預(yù)測肺腺癌的病理分級(圖2~5),瘤內(nèi)組的訓(xùn)練集和驗證集的符合率分別為90.83%和90.74%;含瘤周組分別為92.61%和94.44%。
表2 瘤內(nèi)組影像組學(xué)模型驗證集的混淆矩陣 (例)
表3 含瘤周組影像組學(xué)模型驗證集的混淆矩陣 (例)
通過卡方檢驗比較瘤內(nèi)組及含瘤周組影像組學(xué)模型的準(zhǔn)確性,在驗證集中,兩組間的差異無統(tǒng)計學(xué)意義(χ2=13.19,P>0.05)。
瘤內(nèi)組和含瘤周組在訓(xùn)練集和驗證集中對病理分級為1~3級肺癌的診斷敏感度和特異度見表4~5。在訓(xùn)練集中,瘤內(nèi)組及含瘤周組影像組學(xué)模型的敏感度在檢出病理分級為1級的肺癌中最高;特異度在診斷病理分級為3級的肺癌中最高。在測試集中,瘤內(nèi)組和含瘤周組影像組學(xué)模型的敏感度分別在檢出病理分級為1級和2級的肺癌中最低,診斷特異度則分別在病理分級為2級和1級肺癌中最低。
表4 兩組的影像組學(xué)模型在訓(xùn)練集中對不同病理分級的診斷效能
表5 兩組的影像組學(xué)模型在驗證集中對不同病理分級的診斷效能
本研究結(jié)果表明影像組學(xué)模型可預(yù)測肺腺癌病理分級,并表現(xiàn)出良好的診斷效能。與瘤內(nèi)組相比,含瘤周組的影像組學(xué)模型預(yù)測肺腺癌病理分級的符合率略高(90.74% vs. 94.44%)。含瘤周組影像組學(xué)特征在無監(jiān)督共識聚類中得到與病理金標(biāo)準(zhǔn)高度一致的分類結(jié)果。筆者的初步研究結(jié)果提示結(jié)合了瘤周影像學(xué)信息特征的影像組學(xué)模型可以為病理分類提供更準(zhǔn)確和更全面的信息。已有研究結(jié)果證實基于病灶邊緣分割法的影像組學(xué)特征對預(yù)測肺腺癌病理分級具有一定價值,但尚未見含瘤周影像組學(xué)特征在預(yù)測肺結(jié)節(jié)病理分級中的應(yīng)用價值的相關(guān)報道。
腫瘤內(nèi)部和腫瘤周邊移行帶中組織病理學(xué)特點決定了腫瘤異質(zhì)性,具有預(yù)測預(yù)后和治療反應(yīng)的潛能[5,15]。肺腺癌瘤周區(qū)域?qū)Ψ蜗侔┑倪h(yuǎn)處轉(zhuǎn)移、療效評估等具有重要意義[14-16]。以往的研究中容易忽略瘤周影像組學(xué)特征對腫瘤定性診斷、預(yù)后預(yù)測、療效反應(yīng)評價的作用。有學(xué)者初步應(yīng)用瘤內(nèi)及瘤周的紋理特征鑒別肺癌的良惡性[23]。亦有研究結(jié)果顯示,瘤周的影像組學(xué)特征可預(yù)測非小細(xì)胞肺癌(Non-Small Cell Lung Cancer,NSCLC)的局部進(jìn)展[17]。與本研究結(jié)果相互應(yīng)證。
可見邊緣外擴5mm的依據(jù)是文獻(xiàn)報道肺腺癌過渡帶為2~5 mm,筆者采用最大值,期望能盡可能地包含過渡區(qū)[13]。有研究者比較了基于腫瘤可見邊緣的組學(xué)模型與基于6 mm邊緣圈(可見邊緣向內(nèi)、外各擴展3 mm)預(yù)測非小細(xì)胞肺癌遠(yuǎn)處轉(zhuǎn)移的效能,證實腫瘤周邊6 mm邊緣圈的預(yù)測準(zhǔn)確性高于腫瘤可見邊緣[17],進(jìn)一步證明了包含瘤周過渡區(qū)的信息對診斷的價值。至于是外擴3 mm還是5 mm最佳的問題有待后序研究。
本研究顯示含瘤周影像組學(xué)特征可能提供了腫瘤微環(huán)境的影像學(xué)信息,肺腺癌與周圍組織間存的過渡帶對預(yù)測腫瘤預(yù)后及治療反應(yīng)的評價能提供更多有價值的信息[14-16]。但是,與瘤內(nèi)影像組學(xué)特征相比,含瘤周影像組學(xué)模型未能顯示出更明顯的優(yōu)勢,可能與本研究中納入的樣本量不足有關(guān),尤其是病理分級為3級的病例數(shù)明顯偏少,無法更全面地體現(xiàn)含瘤周影像組學(xué)特征對預(yù)測肺腺癌病理分級的作用。
Bae等[12]對91例早期肺腺癌采用以結(jié)節(jié)可見邊緣勾畫ROI的方法所建立的影像組學(xué)模型能較準(zhǔn)確地預(yù)測肺結(jié)節(jié)的組織病理學(xué)分級和侵襲性,預(yù)測病理分級為1~3級的ROC曲線下面積分別為0.9307、0.8610和0.8345。該研究中病理分級為3級者只有7例,該樣本屬于不均衡樣本,但在該研究中并沒有運用相應(yīng)的統(tǒng)計學(xué)方法來處理這一問題。本研究中肺腺癌病理分級為1級54例、2級114例、3級8例,各級別分布不均,尤其是3級的樣本量僅為8例(占5%),亦屬于不均衡樣本,我們采用SMOTE過采樣算法對訓(xùn)練集里樣本數(shù)量較少的級別進(jìn)行過采樣,合成新的樣本來改善各級別分布的不平衡性,提高了模型的準(zhǔn)確性[22]。
本研究有以下幾點局限性:首先,本研究為回顧性單中心小樣本研究,由于CT平掃圖像不完整,僅采用增強掃描肺窗圖像進(jìn)行分析,而有研究者指出非增強CT圖像的定量組學(xué)特征比增強CT圖像更能反映腫瘤的異質(zhì)性[13];第二,本研究中由放射科醫(yī)師手動勾畫ROI,有可能在一定程度上受到觀察者個體差異的影響,有待將來與半自動分割法進(jìn)行對比分析;第三,本研究沒有在病理切片上測量每例的過渡區(qū)范圍和平均大小,也沒有觀察過渡區(qū)內(nèi)腫瘤浸潤程度、有無血管和淋巴管侵犯及其程度、炎癥反應(yīng)的類型和程度等信息,以解釋含瘤周帶組學(xué)特征的病理基礎(chǔ)。
綜述所述,影像組學(xué)特征可預(yù)測肺腺癌的病理分級;與瘤內(nèi)組相比,含瘤周的影像組學(xué)模型可略提高預(yù)測肺腺癌病理分級的準(zhǔn)確性。