李炳淑,呂 楠,孫福振
(1.山東理工大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,山東 淄博 255000; 2. 山東省慢性病醫(yī)院(山東省康復(fù)中心),山東 青島 266071)
肺癌是臨床致病率、致死率較高的癌癥,對(duì)肺結(jié)節(jié)進(jìn)行良惡性分類是針對(duì)肺癌早期診斷的重要環(huán)節(jié),臨床上常采用計(jì)算機(jī)斷層掃描(computer tomography,CT)圖像對(duì)肺部的肺結(jié)節(jié)進(jìn)行診斷[1]。但人工診斷肺結(jié)節(jié)過程需依賴臨床醫(yī)生的診斷經(jīng)驗(yàn)且過程耗時(shí)耗力,采用計(jì)算機(jī)輔助診斷系統(tǒng)進(jìn)行肺結(jié)節(jié)良惡性自動(dòng)分類已經(jīng)成為主流。
深度學(xué)習(xí)方法被越來越多的研究者應(yīng)用到肺結(jié)節(jié)良惡性分類中。Song等[2]采用經(jīng)典卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行肺結(jié)節(jié)良惡性分析。Nibali等[3]以殘差神經(jīng)網(wǎng)絡(luò)(residual neural network,ResNet)架構(gòu)為基礎(chǔ),分別結(jié)合課程學(xué)習(xí)、轉(zhuǎn)移學(xué)習(xí)和不同網(wǎng)絡(luò)深度,對(duì)比不同網(wǎng)絡(luò)結(jié)構(gòu)下肺結(jié)節(jié)良惡性的分類性能。為了驗(yàn)證不同網(wǎng)絡(luò)結(jié)構(gòu)性能,Agnes等[4]對(duì)比了循環(huán)神經(jīng)網(wǎng)絡(luò)、長(zhǎng)短時(shí)記憶力網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)等多種深層網(wǎng)絡(luò)結(jié)構(gòu)。Shen等[5]使用參數(shù)共享卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)肺結(jié)節(jié)圖像特征提取以及多任務(wù)分類。為了解決樣本量小的問題,王桂棠等[6]提出一種聯(lián)合生成對(duì)抗網(wǎng)絡(luò)與卷積神經(jīng)網(wǎng)絡(luò)的分類結(jié)構(gòu),使用漸進(jìn)式訓(xùn)練模式生成清晰圖像作為擴(kuò)充樣本,并在公開數(shù)據(jù)集上驗(yàn)證了模型的可行性和有效性。Zhao等[7]使用多個(gè)網(wǎng)絡(luò)進(jìn)行特征融合實(shí)現(xiàn)肺結(jié)節(jié)分類。朱輝等[8]提出一種改進(jìn)的U-Net卷積神經(jīng)網(wǎng)絡(luò)肺結(jié)節(jié)檢測(cè)算法,采用卷積操作與池化操作獲取高層特征,通過密集連接使特征信息在輸入層和輸出層之間流通,并結(jié)合膨脹卷積提高肺結(jié)節(jié)低層特征的利用率。楊楊等[9]采用多視角結(jié)合擠壓激勵(lì)模塊構(gòu)建多視角肺結(jié)節(jié)良惡性識(shí)別模型以解決多視角差異性問題。Kalaivani等[10]提出一種采用密集連接卷積神經(jīng)網(wǎng)絡(luò)和自適應(yīng)增強(qiáng)算法對(duì)肺部圖像進(jìn)行良惡性分類的方法。He等[11]提出基于改進(jìn)的Shapley加法擴(kuò)展解釋模型指導(dǎo)的肺部分類方法,通過使用醫(yī)學(xué)先驗(yàn)知識(shí)和圖像學(xué)習(xí)提取圖像特征。Liu等[12]提出一種多模型集成學(xué)習(xí)架構(gòu),該架構(gòu)將結(jié)節(jié)掩碼對(duì)應(yīng)的強(qiáng)度圖像、原始圖像和增強(qiáng)圖像拼接后進(jìn)行輸入,提取圖像的高級(jí)特征,并通過動(dòng)態(tài)選擇不同結(jié)節(jié)大小所對(duì)應(yīng)的模型進(jìn)行預(yù)測(cè)。Yu等[13]通過改進(jìn)ResNet50,用三維卷積層代替二維卷積層,減小部分卷積核的大小,得到用于肺結(jié)節(jié)良惡性診斷的三維ResNet50網(wǎng)絡(luò)。盡管現(xiàn)有方法已取得較好的肺結(jié)節(jié)良惡性分類結(jié)果,但由于肺結(jié)節(jié)一般具有不同尺寸大小,基于固定感受野的網(wǎng)絡(luò)結(jié)構(gòu)無法充分捕獲圖像的多尺度特征。與此同時(shí),如何更加有效地學(xué)習(xí)肺結(jié)節(jié)圖像中的全局和局部特征是提升肺結(jié)節(jié)良惡性分類性能的重要方面。文獻(xiàn)[14]設(shè)計(jì)了多尺度特征融合網(wǎng)絡(luò),但未考慮網(wǎng)絡(luò)因?qū)哟巫兓鴰淼亩喑叨忍卣鞑町悺?/p>
近年來,在提升分類算法準(zhǔn)確度上研究人員提出一種借鑒人類視覺的注意力機(jī)制。注意力機(jī)制可以根據(jù)特征的重要性動(dòng)態(tài)調(diào)整特征權(quán)重,使模型能夠關(guān)注圖像的重點(diǎn)區(qū)域,減少不必要信息干擾。Jiang等[15]提出一種基于注意機(jī)制以及上下文特征信息提取深層次特征的方法,實(shí)現(xiàn)肺結(jié)節(jié)智能化診斷,分類結(jié)果準(zhǔn)確度較高。Huang等[16]提取肺結(jié)節(jié)不同尺度特征并結(jié)合通道注意力和混合損失實(shí)現(xiàn)多種抽象圖形特征學(xué)習(xí),提高小惡性結(jié)節(jié)的預(yù)測(cè)精度。Fu等[17]提出一種跨任務(wù)網(wǎng)絡(luò),通過注意力模塊分析肺結(jié)節(jié)在CT圖像上的不同臨床特征屬性,實(shí)現(xiàn)高準(zhǔn)確度良惡性分類。Liu等[18]設(shè)計(jì)了Res-trans網(wǎng)絡(luò)學(xué)習(xí)肺結(jié)節(jié)局部和全局特征,對(duì)CT掃描中的肺結(jié)節(jié)進(jìn)行分類,并在LIDC-IDRI數(shù)據(jù)集上驗(yàn)證了網(wǎng)絡(luò)有效性。Al-Shabi等[19]提出一種具有通道注意力和課程學(xué)習(xí)漸進(jìn)生長(zhǎng)網(wǎng)絡(luò)的方法,通過學(xué)習(xí)肺結(jié)節(jié)全局特征,提升模型分類性能。
盡管上述方法在肺結(jié)節(jié)智能診斷任務(wù)上取得較好效果,但均未同時(shí)考慮多尺度、全局和局部特征,影響了網(wǎng)絡(luò)對(duì)于不同尺度以及感受野下的特征學(xué)習(xí)。為此,本研究提出一種基于多尺度結(jié)合全局和局部注意力的肺結(jié)節(jié)良惡性分類網(wǎng)絡(luò),通過設(shè)計(jì)的多尺度層提取肺結(jié)節(jié)圖像的多尺度特征,并結(jié)合注意力機(jī)制層學(xué)習(xí)肺結(jié)節(jié)圖像的全局和局部特征。在公開數(shù)據(jù)集LIDC-IDRI上的測(cè)試結(jié)果證明,所提出的分類網(wǎng)絡(luò)在準(zhǔn)確度、敏感度、特異性和接收者操作特征曲線下面積等方面均獲得良好的分類性能。
本研究提出的基于多尺度結(jié)合全局和局部注意力的肺結(jié)節(jié)良惡性分類網(wǎng)絡(luò)(以下簡(jiǎn)稱本網(wǎng)絡(luò))結(jié)構(gòu)如圖1所示,通過有效學(xué)習(xí)輸入圖像的多尺度、全局和局部注意力特征提高分類性能。
圖1 基于多尺度結(jié)合全局和局部注意力的肺結(jié)節(jié)良惡性分類網(wǎng)絡(luò)結(jié)構(gòu)示意圖
對(duì)于輸入的肺結(jié)節(jié)圖像,網(wǎng)絡(luò)首先經(jīng)過卷積層提取淺層特征,卷積核大小和數(shù)量分別為3×3和64;然后通過設(shè)計(jì)的多尺度層,在不同感受野和深度網(wǎng)絡(luò)層級(jí)下學(xué)習(xí)圖像的多尺度特征,并通過連續(xù)的池化層、卷積層和多尺度層獲得高層次的語義特征。另外,為了使網(wǎng)絡(luò)能夠充分學(xué)習(xí)全局和局部的注意力特征,將獲取到的高層次語義特征輸入到設(shè)計(jì)的注意力機(jī)制層進(jìn)行特征增強(qiáng)。最后,將增強(qiáng)后的特征輸入到全連接層,并通過Softmax函數(shù)實(shí)現(xiàn)肺結(jié)節(jié)良惡性分類。網(wǎng)絡(luò)具體參數(shù)設(shè)定如表1所示。
表1 網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)設(shè)定
肺結(jié)節(jié)往往存在不同尺寸,傳統(tǒng)的網(wǎng)絡(luò)結(jié)構(gòu)無法充分學(xué)習(xí)肺結(jié)節(jié)的多尺度特征。因此,設(shè)計(jì)一種多尺度層,在不同的感受野和網(wǎng)絡(luò)深度下充分學(xué)習(xí)肺結(jié)節(jié)的多尺度特征,結(jié)構(gòu)如圖2所示。
圖2 多尺度層結(jié)構(gòu)示意圖
定義Fi為第i層卷積層的輸出,將Fi輸入到多尺度層中,并分別設(shè)定三條特征提取路徑,每條路徑設(shè)置卷積層的卷積核大小分別為{1×1,3×3,6×6}、{3×3,1×1,6×6}、{6×6,3×3,1×1}。這里{1×1}可以有效學(xué)習(xí)肺結(jié)節(jié)細(xì)節(jié)特征信息,{3×3}獲取中級(jí)尺寸特征信息,{6×6}學(xué)習(xí)較大尺寸特征信息。三條特征提取路徑分別表示為:
(1)
(2)
(3)
(4)
式中,Concat表示特征拼接。
1.2.1 通道注意力模塊
在肺結(jié)節(jié)分類任務(wù)中,為了使本網(wǎng)絡(luò)聚焦在肺結(jié)節(jié)主體區(qū)域,抑制非主體區(qū)域的影響,本研究使用加權(quán)通道注意力機(jī)制,動(dòng)態(tài)學(xué)習(xí)不同通道特征的重要性,增強(qiáng)主體區(qū)域的特征表達(dá),抑制非主體區(qū)域的特征表達(dá),使本網(wǎng)絡(luò)能夠有效地聚焦在全局重要信息,其結(jié)構(gòu)如圖3所示。
圖3 通道注意力模塊的結(jié)構(gòu)示意圖
首先,定義最后一層多尺度層的輸出為F∈RH×W×C,H、W和C分別表示特征F的高度、寬度、通道數(shù)。為了學(xué)習(xí)不同通道的重要性,增強(qiáng)有效信息,抑制無效信息,對(duì)于輸入F采用全局最大池化(global max pooling,GMP)和全局平均池化(global average pooling,GAP),得到:
mc=max(Fc(x,y)),
(5)
(6)
式中:mc和ac分別表示第c個(gè)特征通道的全局最大池化層權(quán)重和全局平均池化層權(quán)重,Fc(x,y)表示第c個(gè)特征通道(x,y)位置的特征像素。為了獲取更多的非線性信息,將mc和ac分別經(jīng)過2個(gè)全連接層(fully connected layers,FC)進(jìn)行處理,并加入ReLU非線性激活函數(shù)。這里定義非線性化處理后的特征輸出分別為FM和FA。為了獲得對(duì)應(yīng)權(quán)重矩陣,對(duì)FM和FA分別使用Sigmoid激活函數(shù)計(jì)算權(quán)重:
(7)
式中,v表示輸入特征FM和FA每個(gè)像素位置的具體值,則權(quán)重計(jì)算過程可以表示為:
Mw=σ(W2δ(W1mc)),
(8)
Aw=σ(W4δ(W3ac))。
(9)
式中:Mw和Aw分別表示所計(jì)算的全局最大池化層權(quán)重矩陣和全局平均池化層權(quán)重矩陣,δ為ReLU激活函數(shù),W1、W2、W3、W4分別表示全連接層的權(quán)重參數(shù)。
然后,將獲得的權(quán)重矩陣與輸入的多尺度特征進(jìn)行式(10)、式(11)的點(diǎn)乘運(yùn)算,以獲得增強(qiáng)后的通道注意力特征。
FM=F⊙Mw,
(10)
FA=F⊙Aw。
(11)
式中,⊙表示點(diǎn)乘運(yùn)算。
最后,由FM和FA共同連接組成通道注意力模塊的輸出特征FC,即:
FC=Concat(FM,FA)。
(12)
1.2.2 空間注意力模塊
為了使本網(wǎng)絡(luò)能夠充分學(xué)習(xí)肺結(jié)節(jié)的局部細(xì)節(jié)特征信息,設(shè)計(jì)一種空間注意力模塊,通過學(xué)習(xí)像素級(jí)空間注意力特征增強(qiáng)本網(wǎng)絡(luò)對(duì)肺結(jié)節(jié)細(xì)節(jié)信息的捕獲能力,其具體結(jié)構(gòu)如圖4所示。
圖4 空間注意力模塊的結(jié)構(gòu)
類似地,定義最后一層多尺度層的輸出為F∈RH×W×C,在對(duì)特征進(jìn)行處理前,首先進(jìn)行特征壓縮,即采用卷積核大小為1×1,通道數(shù)為1的卷積層對(duì)F進(jìn)行壓縮得到Fd,然后采用Sigmoid激活函數(shù)對(duì)Fd進(jìn)行權(quán)重計(jì)算:
(13)
式中,Wd表示所計(jì)算的位置權(quán)重矩陣。下一步將Wd和輸入的特征F進(jìn)行像素逐元素相乘,同時(shí)為進(jìn)一步提高本網(wǎng)絡(luò)的收斂性,采用殘差連接將特征進(jìn)行點(diǎn)加操作:
FP=F⊙Wd⊕F。
(14)
通過本節(jié)設(shè)計(jì)的空間注意力模塊,本網(wǎng)絡(luò)能夠更加高效地學(xué)習(xí)肺結(jié)節(jié)圖像的高層次位置以及細(xì)節(jié)特征信息,提高網(wǎng)絡(luò)對(duì)于肺結(jié)節(jié)局部信息的捕獲能力,提升網(wǎng)絡(luò)對(duì)于肺結(jié)節(jié)的分類性能。
經(jīng)過注意力機(jī)制層的特征學(xué)習(xí)后,將獲取的特征輸入到線性層中并使用Softmax激活函數(shù),進(jìn)行特征到類別的概率映射,其中Softmax函數(shù)σ定義為:
(15)
式中:K=2,表示類別總數(shù);σ(p)j表示第j個(gè)類別的概率,j=1,2。網(wǎng)絡(luò)在訓(xùn)練過程中采用交叉熵?fù)p失函數(shù)L進(jìn)行優(yōu)化,具體表達(dá)式為:
(16)
式中:Ln表示第n個(gè)樣本的損失,yn表示第n個(gè)樣本的真實(shí)標(biāo)簽,pn表示第n個(gè)樣本的預(yù)測(cè)概率。網(wǎng)絡(luò)訓(xùn)練過程中,采用Xavier算法初始化網(wǎng)絡(luò)學(xué)習(xí)參數(shù),使用隨機(jī)梯度下降法進(jìn)行網(wǎng)絡(luò)優(yōu)化。
本網(wǎng)絡(luò)在訓(xùn)練過程中,采用NVIDIA GTX 1080Ti進(jìn)行加速訓(xùn)練,運(yùn)行系統(tǒng)為L(zhǎng)inux Ubuntu 16,編程代碼平臺(tái)為Pytorch,在初始訓(xùn)練過程中設(shè)置學(xué)習(xí)率為0.000 1。當(dāng)在驗(yàn)證集上的損失經(jīng)過10個(gè)步長(zhǎng)不再變化時(shí),將學(xué)習(xí)率進(jìn)行衰減,為了防止本網(wǎng)絡(luò)過擬合,采用Dropout層進(jìn)行訓(xùn)練。
LIDC-IDRI公開數(shù)據(jù)庫(kù)共有1 018名患者的CT掃描圖像,每個(gè)患者CT圖像的切片厚度為0.6~5 mm,具體診斷信息由4位放射科醫(yī)生診斷標(biāo)注,標(biāo)注的信息包含肺結(jié)節(jié)的位置、直徑、良惡性、鈣化程度、毛刺程度等屬性特征。本網(wǎng)絡(luò)主要用于良惡性分類,在該數(shù)據(jù)集中對(duì)于良惡性的診斷分為1~5分。為了獲得每個(gè)肺結(jié)節(jié)最終的真實(shí)標(biāo)簽類別,采用投票策略進(jìn)行判定,即對(duì)于單一肺結(jié)節(jié),若專家有一半及以上人數(shù)打分大于3則認(rèn)定為惡性肺結(jié)節(jié),若專家有一半及以上人數(shù)打分小于3則認(rèn)定為良性肺結(jié)節(jié)。為了降低網(wǎng)絡(luò)復(fù)雜度,采用肺結(jié)節(jié)中心橫截面作為輸入圖像,在網(wǎng)絡(luò)的訓(xùn)練過程中,采用隨機(jī)旋轉(zhuǎn)、翻轉(zhuǎn)、放大和縮小等數(shù)據(jù)擴(kuò)增方法進(jìn)行數(shù)據(jù)擴(kuò)充。
為評(píng)估本網(wǎng)絡(luò)的性能,在實(shí)驗(yàn)部分采用準(zhǔn)確度(accuracy)、敏感度(sensitivity)、特異性(specificity)、接收者操作特征曲線(receiver operating characteristics,ROC)以及接收者操作特征曲線下面積(area under receiver operating characteristics curve,AUC)進(jìn)行量化評(píng)估。具體地,定義真陽性、假陽性、真陰性、假陰性分別表示為TP、FP、TN、FN。則準(zhǔn)確度為:
(17)
敏感度為:
(18)
特異性為:
(19)
3.3.1 多尺度層不同大小卷積組合的性能比較
為獲取不同層次的多尺度特征,在多尺度層中采用大小分別為{1×1,3×3,6×6}的卷積進(jìn)行特征學(xué)習(xí),同時(shí)將該層分別放在卷積層后和池化層前,以便隨著網(wǎng)絡(luò)深度增加不斷學(xué)習(xí)層次化抽象特征。本節(jié)設(shè)計(jì)了不同大小卷積組合,驗(yàn)證多尺度層中卷積大小對(duì)網(wǎng)絡(luò)性能的影響,具體對(duì)比結(jié)果如表2所示。表2中,“No Multi-Conv”表示無多尺度卷積層,“Multi-Conv(1)”“Multi-Conv(1,3)”“Multi-Conv(1,3,6)”分別表示多尺度卷積層卷積大小為1,1和3組合,1、3、6組合3種不同網(wǎng)絡(luò)設(shè)置。實(shí)驗(yàn)結(jié)果表明,隨著卷積組合增多,網(wǎng)絡(luò)的性能不斷提升,但考慮到網(wǎng)絡(luò)的復(fù)雜度,本網(wǎng)絡(luò)中采用卷積大小為(1,3,6)作為多尺度卷積層最終配置。
表2 多尺度層不同大小卷積組合的性能比較
3.3.2 不同網(wǎng)絡(luò)層的性能比較
本節(jié)通過消融實(shí)驗(yàn)驗(yàn)證本網(wǎng)絡(luò)中多尺度層和注意力機(jī)制層的作用。將多尺度層命名為“MSL”,通道注意力模塊命名為“CHA”,空間注意力模塊命名為“SSA”,對(duì)所設(shè)計(jì)的不同部分實(shí)驗(yàn)結(jié)果對(duì)比如表3所示。實(shí)驗(yàn)結(jié)果表明,通過增加任意一多尺度層或者注意力機(jī)制層都可以有效提升網(wǎng)絡(luò)的性能。與注意力機(jī)制層相比,多尺度層可以取得更好的分類結(jié)果,這表明在肺結(jié)節(jié)分類任務(wù)中多尺度特征對(duì)于良惡性分類具有重要的作用。同時(shí),從實(shí)驗(yàn)結(jié)果中還發(fā)現(xiàn),“CHA”的性能要高于“SSA”性能,表明全局特征在此次分類任務(wù)中具有更重要作用。
表3 不同網(wǎng)絡(luò)層的性能比較
3.3.3 不同圖像輸入尺寸的性能比較
為探尋不同圖像輸入尺寸對(duì)本網(wǎng)絡(luò)性能的影響,分別輸入圖像尺寸{32×32,64×64,128×128,256×256,512×512}進(jìn)行性能比較。為保證網(wǎng)絡(luò)的深度不受原始圖像分辨率影響,在網(wǎng)絡(luò)訓(xùn)練過程中只采用池化層對(duì)圖像特征進(jìn)行降維,不同圖像輸入尺寸對(duì)比實(shí)驗(yàn)結(jié)果如圖5所示。實(shí)驗(yàn)結(jié)果表明,網(wǎng)絡(luò)的性能隨著輸入尺寸的增加而提升,但當(dāng)圖像輸入尺寸達(dá)128×128時(shí),網(wǎng)絡(luò)的性能變化無太大差異,這是由于多尺度層在該尺寸下已經(jīng)充分學(xué)習(xí)多種不同尺度特征,因而隨著圖像輸入尺寸的增加而性能變化不大。因此,綜合考慮網(wǎng)絡(luò)的復(fù)雜度及性能,最終設(shè)定輸入尺寸為128×128。
圖5 不同圖像輸入尺寸的準(zhǔn)確度比較
3.3.4 注意力模塊在不同層位置性能比較
對(duì)注意力模塊在網(wǎng)絡(luò)中的位置性能進(jìn)行實(shí)驗(yàn)對(duì)比,將注意力模塊放在網(wǎng)絡(luò)的淺層、中層和深層,實(shí)驗(yàn)結(jié)果如圖6所示。實(shí)驗(yàn)結(jié)果表明,隨著注意力模塊的位置不斷加深,網(wǎng)絡(luò)的性能不斷提升,這可以解釋為越深層的注意力特征可以為肺結(jié)節(jié)的良惡性分類提供越抽象化的特征信息,從而提升網(wǎng)絡(luò)整體分類性能。最終,本研究將注意力模塊放在網(wǎng)絡(luò)深層,分類結(jié)果的準(zhǔn)確度、敏感度、特異性分別為90.9%、92.3%、94.9%。
圖6 注意力模塊在不同層位置的性能比較
3.3.5 與傳統(tǒng)分類方法的性能比較
將本網(wǎng)絡(luò)與傳統(tǒng)的深度學(xué)習(xí)網(wǎng)絡(luò)VGG、ResNet18、DenseNet進(jìn)行實(shí)驗(yàn)對(duì)比,對(duì)比時(shí)采用網(wǎng)絡(luò)原始參數(shù)和相同數(shù)據(jù)集,對(duì)比結(jié)果如圖7所示。對(duì)比結(jié)果表明,與傳統(tǒng)的分類網(wǎng)絡(luò)相比,本網(wǎng)絡(luò)性能更好,再次驗(yàn)證了注意力機(jī)制層和多尺度層的作用。
圖7 與不同網(wǎng)絡(luò)結(jié)構(gòu)對(duì)比的ROC曲線
3.3.6 與現(xiàn)有分類方法的性能比較
在相同數(shù)據(jù)集上與現(xiàn)有分類方法進(jìn)行性能比較,對(duì)比結(jié)果如表4所示??梢钥闯?本網(wǎng)絡(luò)在準(zhǔn)確度、敏感度、特異性、AUC上均取得較好的分類表現(xiàn)。特別是敏感度達(dá)到92.3%,相比其他方法有較大提升。圖8展示了本網(wǎng)絡(luò)方法對(duì)于不同肺結(jié)節(jié)預(yù)測(cè)的概率,概率越高表示惡性程度越大,從預(yù)測(cè)結(jié)果可以看出,本網(wǎng)絡(luò)方法能夠準(zhǔn)確地預(yù)測(cè)肺結(jié)節(jié)良惡性。
表4 不同分類方法的性能比較
圖8 不同肺結(jié)節(jié)良惡性預(yù)測(cè)結(jié)果以及對(duì)應(yīng)類別概率
本研究提出一種多尺度結(jié)合全局和局部注意力的肺結(jié)節(jié)分類網(wǎng)絡(luò),通過加入多尺度層和注意力機(jī)制層,學(xué)習(xí)肺結(jié)節(jié)的多尺度、全局和局部特征信息,提高網(wǎng)絡(luò)分類性能。在公開數(shù)據(jù)集LIDC-IDRI上驗(yàn)證表明,本網(wǎng)絡(luò)具有良好的分類效果。由于考慮到模型復(fù)雜性,本網(wǎng)絡(luò)僅采用二維結(jié)構(gòu)進(jìn)行特征學(xué)習(xí),在獲取肺結(jié)節(jié)空間特征方面有所缺失。下一步,將擴(kuò)展網(wǎng)絡(luò)到三維結(jié)構(gòu),并驗(yàn)證其有效性。