邢倩,張曉東,王霄英
隨著肺癌CT篩查的廣泛普及,不確定肺結(jié)節(jié)的數(shù)量不斷增加,這為肺結(jié)節(jié)的診斷和管理帶來了相當(dāng)大的挑戰(zhàn)。對胸部CT檢查中發(fā)現(xiàn)的肺結(jié)節(jié),進(jìn)行標(biāo)準(zhǔn)、合理的分類,對結(jié)節(jié)的處理方案有極重要的意義。有研究表明,肺結(jié)節(jié)的影像學(xué)性質(zhì)比結(jié)節(jié)大小對預(yù)后有更為重要的意義。
本研究以讀片者的判斷作為金標(biāo)準(zhǔn),對肺結(jié)節(jié)的影像學(xué)性質(zhì)進(jìn)行分類——實性結(jié)節(jié)(solid nodule,SN)、部分實性結(jié)節(jié)(part-solid nodule,PSN)及純磨玻璃密度結(jié)節(jié)(pure ground glass nodule,pGGN),這一分類通過兩個分類模型完成,先進(jìn)行實性結(jié)節(jié)與亞實性結(jié)節(jié)的分類,再將亞實性結(jié)節(jié)進(jìn)一步分為部分實性結(jié)節(jié)與磨玻璃密度結(jié)節(jié)。均通過對興趣區(qū)的勾畫,使用影像組學(xué)的方法,建立判斷結(jié)節(jié)性質(zhì)的組學(xué)模型,并分別得到兩個組學(xué)模型的平均受試者操作特征(receiver operating characteristic,ROC)曲線下面積(area under curve,AUC)、敏感度、特異度及符合率。本研究旨在將建立的組學(xué)模型與肺結(jié)節(jié)CAD輔助診斷軟件聯(lián)合應(yīng)用于臨床工作中,將組學(xué)模型結(jié)果輸入結(jié)構(gòu)式報告,從而實現(xiàn)自動發(fā)現(xiàn)結(jié)節(jié)并對肺結(jié)節(jié)進(jìn)行Lung-RADS分類的目的。
1.病例資料
回顧性收集2018年10月-12月于本院行CT胸部平掃檢查的患者。納入標(biāo)準(zhǔn)為:①影像檢查的圖像質(zhì)量滿足診斷;②圖像中含有一個或一個以上的肺結(jié)節(jié)(SN、PSN或pGGN)。
2.結(jié)節(jié)的分類原則
將所有納入分析的結(jié)節(jié)分為SN、PSN及pGGN。每類結(jié)節(jié)中,依據(jù)結(jié)節(jié)大小分為大結(jié)節(jié)組(1.0cm<直徑<3.0cm)及小結(jié)節(jié)組(0.4cm≤直徑≤1.0cm)[1],保證每類結(jié)節(jié)中大結(jié)節(jié)與小結(jié)節(jié)的數(shù)目相近,在筆者類似的關(guān)于肺結(jié)節(jié)影像組學(xué)的研究中,發(fā)現(xiàn)目標(biāo)病灶的像素值對影像組學(xué)分類的準(zhǔn)確性存在影響,因而對肺結(jié)節(jié)的大小進(jìn)行分類可以平均掉這種差異,確保該模型對任何體積的結(jié)節(jié)均適用。
結(jié)節(jié)的影像學(xué)性質(zhì)由2名胸部CT診斷經(jīng)驗分別為3年(讀片者A)及20年(讀片者B)的影像科醫(yī)師共同閱片決定,當(dāng)兩人意見不一致時,商議決定結(jié)節(jié)性質(zhì)。
結(jié)節(jié)性質(zhì)的評估標(biāo)準(zhǔn),結(jié)合文獻(xiàn)的6類分類方法[2]在肺窗觀察,窗位-600HU,窗寬2000HU[3],評估結(jié)節(jié)的最大層面、實性成分及磨玻璃密度成分是否存在及其范圍、以及結(jié)節(jié)的均勻性(圖1)。其中1類、2類結(jié)節(jié)密度均勻,不含實性成分,2類較1類密度略高;3類及4類結(jié)節(jié)密度不均勻,實性成分均<50%,3類由實性成分及周圍磨玻璃密度暈組成,4類由磨玻璃密度及含有充氣支氣管影的實性部分組成;5類及6類主要由實性成分構(gòu)成,5類的實性成分周圍伴少許磨玻璃密度成分,而6類僅由實性成分構(gòu)成。將1~2類歸為pGGN,3~5類歸為PSN,6類為SN。
3.圖像分割
在CT胸部平掃的薄層橫軸面圖像上,使用ITKSNAP軟件(version 3.6.0)對病灶進(jìn)行手工分割。由一位具有3年胸部影像診斷經(jīng)驗的醫(yī)師勾畫。大結(jié)節(jié)組,沿病灶邊緣進(jìn)行分割,共勾畫該病灶的最大層面及其上下各1層。小結(jié)節(jié)組,由于病灶體積小,所含有的像素值較少,因而沿病灶邊緣分割,勾畫含有病灶的所有層面(分割方法見圖2)。
使用沿結(jié)節(jié)邊緣分割的方法,可以盡可能避免病灶周圍肺內(nèi)成分,如血管、索條或胸膜等成分的干擾。對于磨玻璃密度結(jié)節(jié),盡可能避開穿行其中的血管、索條等成分;對于部分實性結(jié)節(jié),要勾畫到其含實性成分的層面。
4.特征提取及選擇
在人工分割的3D病灶中提取所有特征,從薄層胸部CT圖像中提取非紋理特征:體積(volume)、面積(size)、實性度(solidity)以及偏心率(eccentricity)和紋理特征:基于直方圖的全局紋理特征及基于灰度的紋理特征包括以下4項:灰度共生矩陣(GLCM)、灰度行程長度矩陣(GLRLM)、基于灰度區(qū)域尺度矩陣(GLSZM)、鄰域灰度差分矩陣(NGTDM)。
使用機(jī)器學(xué)習(xí)的方法提取常見的影像組學(xué)特征,在得到多個特征后,運用前向特征選擇機(jī)制算法進(jìn)行特征降維,消除高度相關(guān)的特征。繼而利用Spearman秩相關(guān)及最大信息系數(shù)(maximal information coefficient,MIC)評估特征間的冗余度及特征預(yù)測能力。
5.建立模型
在本研究中需要使用二分類的方法,先建立一個判斷實性結(jié)節(jié)與亞實性結(jié)節(jié)(含全部部分實性結(jié)節(jié)及純磨玻璃密度結(jié)節(jié))的模型,隨后再建立一個將亞實性結(jié)節(jié)二分類的模型,判斷部分實性結(jié)節(jié)與純磨玻璃密度結(jié)節(jié),從而實現(xiàn)肺結(jié)節(jié)影像學(xué)性質(zhì)的分類。
在特征降維后,通過最大化0.632+自舉驗證(the 0.632+bootstrap[4])AUC度量,逐步進(jìn)行特征選擇,得到結(jié)合1~20個變量(模型階數(shù))的紋理模型,選取分類性能最優(yōu)的簡約特征子集。這些模型的建立是使用預(yù)測曲線最高而模型階數(shù)最低的影像組學(xué)特征集建立的。
隨后采用不平衡調(diào)整邏輯回歸IALR構(gòu)建預(yù)測模型。利用在100個自舉檢測樣本中,得到的平均AUC值、符合率、敏感度和特異度作為模型的預(yù)測效能[5],公式如下:
其中B為自舉檢查樣本的數(shù)目,在本研究中設(shè)為100,p代表模型階數(shù),而j=0代表模型模型g(xi)的偏倚。
此后,再使用sigmoid函數(shù),將相應(yīng)的預(yù)測輸出值轉(zhuǎn)換為概率相關(guān)指標(biāo)P(i):
其中x表示預(yù)測模型的輸出值,Pi表示結(jié)節(jié)變化可能性的概率。
第一個模型記亞實性結(jié)節(jié)為0,實性結(jié)節(jié)為1,Sigmoid函數(shù)的輸出值為0~1之間的任意數(shù),輸出值即為判斷值,其中間值是0.5,則認(rèn)為結(jié)果在0~0.5屬于亞實性結(jié)節(jié),0.5~1屬于實性結(jié)節(jié)。
第二個模型記磨玻璃密度結(jié)節(jié)為0,部分實性結(jié)節(jié)為1,Sigmoid函數(shù)的輸出值為0~1之間的任意數(shù),輸出值即為判斷值,其中間值是0.5,則認(rèn)為結(jié)果在0~0.5屬于純磨玻璃密度結(jié)節(jié),0.5~1屬于部分實性結(jié)節(jié)。
6.模型效能判斷
AUC被認(rèn)為是評價分類器性能的最佳度量之一[6]。當(dāng)模型的AUC值為0.5~0.7時,有較低準(zhǔn)確性,0.7~0.9時有一定的準(zhǔn)確性,AUC在0.9以上時有較高準(zhǔn)確性。
1.一般資料
共計285個患者納入分析,總結(jié)節(jié)數(shù)為315個,患者年齡24~93歲,平均(63.2±12.2)歲,共有實性結(jié)節(jié)106個、部分實性結(jié)節(jié)110個、純磨玻璃密度結(jié)節(jié)99個。其中大結(jié)節(jié)組結(jié)節(jié)數(shù)共148個,實性結(jié)節(jié)51個,部分實性結(jié)節(jié)52個,純磨玻璃密度結(jié)節(jié)45個;小結(jié)節(jié)組結(jié)節(jié)數(shù)共167個,實性結(jié)節(jié)55個,部分實性結(jié)節(jié)58個,純磨玻璃密度結(jié)節(jié)54個(表1)。
其中大結(jié)節(jié)組實性結(jié)節(jié)長徑11~34mm,短徑7~26mm;部分實性結(jié)節(jié)長徑11~34mm,短徑7~22mm;磨玻璃密度結(jié)節(jié)長徑11~29mm,短徑7~24mm。小結(jié)節(jié)組實性結(jié)節(jié)長徑4~12mm,短徑4~10mm;部分實性結(jié)節(jié)長徑4~12mm,短徑范4~10mm;磨玻璃密度結(jié)節(jié)長徑4~10mm,短徑4~10mm(表2)。
表1 大結(jié)節(jié)組與小結(jié)節(jié)組的三種類型肺結(jié)節(jié)組成
表2 不同類型肺結(jié)節(jié)的大小
2.影像組學(xué)特征
兩個組學(xué)模型分別提取特征數(shù)973個(圖3),記二分類實性結(jié)節(jié)與亞實性結(jié)節(jié)為分類1,亞實性結(jié)節(jié)分為部分實性結(jié)節(jié)與純磨玻璃密度結(jié)節(jié)為分類2。分別通過提取1~20個變量的紋理模型,發(fā)現(xiàn)分類1在選擇6個特征時,模型達(dá)到最優(yōu)效能,分類2在選擇14個特征時,模型達(dá)到最優(yōu)效能。
分類1與分類2選擇的特征見表3。
表3 分類1與分類2選擇的模型特征
3.影像組學(xué)模型判斷結(jié)果
應(yīng)用影像組學(xué)分類1模型,在所有315個結(jié)節(jié)中輸出值與實際情況一致的結(jié)節(jié)有288個。準(zhǔn)確判斷的實性結(jié)節(jié)97個,亞實性結(jié)節(jié)191個,其中部分實性結(jié)節(jié)106個,純磨玻璃密度結(jié)節(jié)85個。
應(yīng)用影像組學(xué)模型分類2模型,在209個亞實性結(jié)節(jié)中輸出值與實際情況一致的的結(jié)節(jié)有169個,其中部分實性結(jié)節(jié)83個,純磨玻璃密度結(jié)節(jié)86個(圖4)。
4.影像組學(xué)效能
圖1 結(jié)節(jié)影像學(xué)性質(zhì)6分類。a)1類;b)2類;c)3類;d)4類;e)5類;f)6類。
分類1的敏感度、特 異度分別達(dá)到9 0.0%及90.2%,符合率達(dá)到90.1%,其AUC值為0.961,可信度極高。
分類2的敏感度、特異度分別達(dá)到73.2%及75.6%,符合率達(dá)到74.2%,其AUC值為0.822,可信度較高。
影像組學(xué)模型對實性結(jié)節(jié)中的大結(jié)節(jié)有最高的預(yù)測效能,在兩個組學(xué)模型中,大結(jié)節(jié)均較同分類中的小結(jié)節(jié)有更高的預(yù)測效能(表4)。
1.影像組學(xué)模型對肺結(jié)節(jié)影像學(xué)性質(zhì)判斷能力的整體分析
圖2 結(jié)節(jié)影像學(xué)性質(zhì)判斷的興趣區(qū)分割方法。a~d為小結(jié)節(jié)組,e~h為大結(jié)節(jié)組。a)右肺上葉磨玻璃密度結(jié)節(jié);b)沿結(jié)節(jié)邊緣勾畫;c)確定興趣區(qū);d)病灶的整體情況顯示;e)右肺下葉部分實性結(jié)節(jié);f)沿結(jié)節(jié)邊緣勾畫;g)確定興趣區(qū);h)病灶的整體情況顯示。
圖3 肺結(jié)節(jié)影像學(xué)性質(zhì)分類研究,分類1與分類2分別提取的影像特征及不同特征的預(yù)測能力排序。a)分類1及分類2提取同樣數(shù)目的影像組學(xué)特征;b)分類1及分類2的特征計算方法;c)分類1研究中不同特征預(yù)測能力排序;d)分類2研究中不同特征預(yù)測能力排序。
分類1作為區(qū)分實性與亞實性結(jié)節(jié)的模型有很好的效能,判斷的符合率高達(dá)90.1%,其AUC值也高達(dá)96.1%,可信度極高。其敏感度(對實性結(jié)節(jié)的判斷)為90.0%,略低于特異度(對亞實性結(jié)節(jié)的判斷)90.2%,仍然處于較高的水平。在臨床工作中,亞實性結(jié)節(jié)作為一種特殊的肺結(jié)節(jié)亞群,其特征與實性結(jié)節(jié)不同,尤其在生長速度和惡性風(fēng)險方面[7],因而準(zhǔn)確地將亞實性結(jié)節(jié)與實性結(jié)節(jié)區(qū)分的意義更為重要。而在后續(xù)研究中,由于分類1效能較高,探討在分類1模型使用后得到亞實性結(jié)節(jié)的基礎(chǔ)上,進(jìn)一步使用分類2模型來區(qū)分純磨玻璃密度結(jié)節(jié)及部分實性結(jié)節(jié)的方法是可行的。分類2作為區(qū)分純磨玻璃密度結(jié)節(jié)與部分實性結(jié)節(jié)的模型也有較好的效能,其AUC值為82.2%,可信度較高。其特異度(對純磨玻璃密度結(jié)節(jié)的判斷)75.6%略高于敏感度(對部分實性結(jié)節(jié)的判斷)73.2%。
2.影像組學(xué)模型對不同體積肺結(jié)節(jié)判斷能力的分析
分類1中,輸出結(jié)果與金標(biāo)準(zhǔn)對照,判斷錯誤的結(jié)節(jié)共27個,其中大結(jié)節(jié)僅4個,其中1例為部分實性結(jié)節(jié),3例為純磨玻璃密度結(jié)節(jié)。判斷錯誤的實性結(jié)節(jié)全部為小結(jié)節(jié)。
分類2中,輸出結(jié)果與金標(biāo)準(zhǔn)對照,判斷錯誤的結(jié)節(jié)共40個,其中27例部分實性結(jié)節(jié)中,9例為大結(jié)節(jié),18例為小結(jié)節(jié);磨玻璃密度結(jié)節(jié)13例判斷錯誤,5例為大結(jié)節(jié),8例為小結(jié)節(jié)。
分類1與分類2中大結(jié)節(jié)與小結(jié)節(jié)判斷的情況具體見表4。從該表中可以看出實性結(jié)節(jié)中的大結(jié)節(jié)組預(yù)測效能最好,高達(dá)100%,在每一分類中,其內(nèi)部的大結(jié)節(jié)組均較同分類中的小結(jié)節(jié)組有更高的預(yù)測準(zhǔn)確數(shù)目。這可能與大結(jié)節(jié)有更多的體素,能夠提取到更多紋理信息有關(guān)。
3.臨床應(yīng)用價值分析
當(dāng)前隨著肺結(jié)節(jié)計算機(jī)輔助診 斷(computer-aided diagnosis,CAD)軟件的開發(fā)及應(yīng)用,臨床工中可以由機(jī)器輔助識別肺內(nèi)病灶。CAD輔助診斷軟件有較好的檢出效能[8],能夠較準(zhǔn)確地檢出病灶,測量病灶大小,但在病灶的影像學(xué)性質(zhì)分類上,其能力尚不足以準(zhǔn)確判斷。
本研究使用影像組學(xué)的方法,對肺結(jié)節(jié)的影像學(xué)性質(zhì)進(jìn)行判斷,并將結(jié)果輸入結(jié)構(gòu)式報告中(圖5),并結(jié)合CAD輔助診斷軟件自動判斷結(jié)節(jié)位置及大小的結(jié)果,從而自動得到該結(jié)節(jié)的Lung-RADS分類,并將Lung-RADS指南對應(yīng)的處理意見或復(fù)查時間自動反饋在報告中,給患者一個清晰明了的指導(dǎo)方案,同時大大提升影像科醫(yī)師的工作效率及判斷的符合率。
肺結(jié)節(jié)的影像學(xué)性質(zhì)在肺結(jié)節(jié)的診斷、評估及處理方式選擇中有極重要的意義。相同大小的病灶,在不同的影像學(xué)性質(zhì)下,其背后的組織學(xué)成分也有很大的差異。以Lung-RADS指南為代表的多個肺結(jié)節(jié)處理指南,都需要對肺結(jié)節(jié)的大小及影像學(xué)性質(zhì)進(jìn)行評估。
隨著肺結(jié)節(jié)計算機(jī)輔助診斷軟件的開發(fā)及應(yīng)用,在機(jī)器能夠自動檢出病灶,并測量病灶大小的基礎(chǔ)上,可以結(jié)合判斷肺結(jié)節(jié)影像學(xué)性質(zhì)的組學(xué)模型,對肺結(jié)節(jié)的影像學(xué)性質(zhì)進(jìn)行判斷,從而自動得到該結(jié)節(jié)的Lung-RADS分類,實現(xiàn)機(jī)器對病灶的初步識別與判斷,這將是人工智能在胸部CT篩查與診斷方面的一大進(jìn)步。
表4 結(jié)節(jié)大小與預(yù)測符合率的關(guān)系
圖4 肺結(jié)節(jié)影像學(xué)性質(zhì)分類研究。a)分類1在不同模型階數(shù)下的預(yù)測效能;b)分類2在不同模型階數(shù)下的預(yù)測效能。
圖5 肺結(jié)節(jié)影像學(xué)性質(zhì)分類研究的結(jié)果在結(jié)構(gòu)式報告中的輸出部位。