尤 堃,郝鵬翼,吳福理,張 繁,吳 健
基于三維卷積神經(jīng)網(wǎng)絡(luò)的肺結(jié)節(jié)假陽(yáng)性篩查
尤 堃1,3,郝鵬翼1,3,吳福理1,3,張 繁1,吳 健2,3
(1. 浙江工業(yè)大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,浙江 杭州 310023;2. 浙江大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,浙江 杭州 310058;3. 浙江大學(xué)睿醫(yī)人工智能研究中心,浙江 杭州 310000)
從CT影像中檢測(cè)肺結(jié)節(jié)在肺癌的早期診斷中至關(guān)重要,而肺結(jié)節(jié)假陽(yáng)性的篩查是提高肺結(jié)節(jié)檢測(cè)準(zhǔn)確度的重要一步。為了從大量候選結(jié)節(jié)中快速準(zhǔn)確地區(qū)分出真正的肺結(jié)節(jié),設(shè)計(jì)了一個(gè)3D卷積神經(jīng)網(wǎng)絡(luò)(CNN)篩查肺結(jié)節(jié)假陽(yáng)性。提出了網(wǎng)絡(luò)模型,通過(guò)恒等映射和殘差單元來(lái)加速模型訓(xùn)練,采用單連接路徑重復(fù)利用特征并重組新特征?;谠撃P偷姆谓Y(jié)節(jié)假陽(yáng)性篩查方法,與基于2D CNN的方法相比,不僅可以省略數(shù)據(jù)切片步驟,而且能夠充分利用CT影像的空間信息; 與其他基于3D CNN的方法相比,具有參數(shù)量小、模型訓(xùn)練快的優(yōu)點(diǎn)。該方法在LUNA16數(shù)據(jù)集中的假陽(yáng)性篩查中取得了較高的敏感度。
3D CNN;肺結(jié)節(jié);假陽(yáng)性篩查
隨著空氣質(zhì)量的惡化、二手煙危害的加深等原因,肺癌已成為世界范圍內(nèi)發(fā)病率及死亡率最高的惡性腫瘤[1]。肺癌中晚期的治療效果不理想,遠(yuǎn)期生存率很低,肺癌最常見(jiàn)的早期形態(tài)為肺結(jié)節(jié)(pulmonary nodule),此階段是進(jìn)行肺癌治療的最佳時(shí)期,所以對(duì)肺結(jié)節(jié)的檢測(cè)和診斷顯得尤為重要[2]。肺結(jié)節(jié)是肺組織內(nèi)部的肉芽腫性疾病,影像與肺部正常組織存在密度差異,其大小由3 ~30 mm不等。使用低劑量螺旋計(jì)算機(jī)斷層掃描(low-dose spiral computed tomography,LDCT)可以檢測(cè)到最小3 mm的肺結(jié)節(jié)。LDCT一次可以產(chǎn)生幾百?gòu)堓S向影像,篩查肺結(jié)節(jié)需要花費(fèi)大量時(shí)間。此外,根據(jù)肺結(jié)節(jié)的位置和表現(xiàn)形式不同,又可以將結(jié)節(jié)細(xì)分為孤立性、血管粘連性、胸膜粘連性、磨玻璃以及空洞性。肺結(jié)節(jié)具有體積小、形態(tài)不規(guī)則、周?chē)h(huán)境各異的特點(diǎn),進(jìn)一步增加了肺結(jié)節(jié)檢測(cè)難度[3]。
近二十年來(lái),研究人員不斷探索從醫(yī)學(xué)CT影像中檢測(cè)肺結(jié)節(jié)的方法。肺結(jié)節(jié)檢測(cè)主要分為2個(gè)階段,即檢測(cè)候選結(jié)節(jié)及在候選結(jié)節(jié)中篩查假陽(yáng)性(false positive)。假陽(yáng)性篩查是肺結(jié)節(jié)檢測(cè)的關(guān)鍵。候選檢測(cè)的主要目的是避免遍歷整個(gè)胸腔CT影像,減少檢測(cè)的時(shí)間成本。檢測(cè)通常根據(jù)結(jié)節(jié)類(lèi)似橢球體的外觀特點(diǎn),使用基于局部強(qiáng)度分布的方法。例如,TAN等[4]先歸一化CT影像的梯度,再根據(jù)其最小散度值進(jìn)行聚類(lèi)。
傳統(tǒng)肺結(jié)節(jié)檢測(cè)方法一般手工設(shè)計(jì)特征,然后利用此特征訓(xùn)練檢測(cè)模型。例如,JACOBS等[5]根據(jù)強(qiáng)度、形狀、紋理,并結(jié)合肺結(jié)節(jié)周?chē)慕馄式Y(jié)構(gòu)信息組成特征。MESSAY等[6]利用形狀、位置、強(qiáng)度信息以及梯度特征組成綜合特征。然而,手工設(shè)計(jì)特征的方式成本高,特征表達(dá)能力依賴(lài)特征描述符的選擇以及參數(shù)設(shè)置,無(wú)法很好應(yīng)對(duì)肺結(jié)節(jié)的多樣性。
近幾年,深度卷積神經(jīng)網(wǎng)絡(luò)(deep convolutional neural network,CNN)在圖像目標(biāo)檢測(cè)及分類(lèi)領(lǐng)域取得了極大的成功[7-8]。CNN利用大量數(shù)據(jù)訓(xùn)練獲取魯棒性和泛化性較好的特征提取能力,其特征表達(dá)能力遠(yuǎn)強(qiáng)于手工設(shè)計(jì)的特征。SETIO等[9]在假陽(yáng)性篩查階段使用了2D CNN,從不同方向提取了肺結(jié)節(jié)的二維切片,將其作為CNN的輸入,此方法在LIDC-IDRI數(shù)據(jù)集[10](lung image database donsortium-image database resource initiative)上實(shí)現(xiàn)了1 FFPS(false positive per scan)下85.4%的敏感度(sensitivity)。ROTH等[11]對(duì)三維VOI進(jìn)行多次二維正交采樣,構(gòu)造2.5D的肺結(jié)節(jié)表達(dá)并訓(xùn)練2D CNN,此方法在90個(gè)CT共388個(gè)肺結(jié)節(jié)以及86個(gè)CT共595個(gè)肺結(jié)節(jié)中,3 FPPS下分別達(dá)到了70%和83%的敏感度。CIOMPI等[12]將預(yù)先訓(xùn)練的過(guò)擬合CNN中最后一個(gè)卷積層輸出的特征圖作為對(duì)肺結(jié)節(jié)三維結(jié)構(gòu)的二維表達(dá)。由于CT數(shù)據(jù)均為三維,基于2D CNN的算法需要對(duì)原始數(shù)據(jù)進(jìn)行切片采樣,并不能充分利用的三維空間信息。
盡管三維醫(yī)學(xué)數(shù)據(jù)在臨床實(shí)踐中已經(jīng)相當(dāng)普遍,但3D CNN在肺結(jié)節(jié)檢測(cè)上的應(yīng)用研究依舊處于初級(jí)階段,研究成果較少。DOBRENKII等[13]設(shè)計(jì)了一種用于肺結(jié)節(jié)假陽(yáng)性篩查的3D CNN,直接以三維樣本為輸入,在LUNA16 (lung nodule analysis 2016)數(shù)據(jù)集中實(shí)現(xiàn)了8 FPPS下85.6%的敏感度。DOU等[14]同樣使用了LUNA16數(shù)據(jù),針對(duì)不同的肺結(jié)節(jié)尺寸采取不同尺寸的輸入樣本,分別設(shè)計(jì)并訓(xùn)練了3個(gè)3D CNN模型。與2D CNN相比,3D CNN可以編碼更加豐富的多級(jí)空間信息,提取更加全面的特征。然而,3D CNN所含參數(shù)量遠(yuǎn)高于2D CNN,需要占用更大的內(nèi)存,訓(xùn)練時(shí)間和難度都大大增加。其中,文獻(xiàn)[13]的CNN模型通過(guò)1 827輪次才完成訓(xùn)練。
本文提出了一種用于肺結(jié)節(jié)假陽(yáng)性篩查的3D CNN,該模型綜合了ResNet[15]重復(fù)使用特征、收斂速度快的特點(diǎn)與DenseNet[16]重組新特征的能力。與2D CNN相比,該模型可以省略數(shù)據(jù)切片步驟,充分利用三維數(shù)據(jù)的空間信息,提取更全面的特征表達(dá)。同時(shí),與其他3D CNN相比,該模型參數(shù)量少,與文獻(xiàn)[13]中的模型相比,節(jié)省了95.5%的參數(shù)量,參數(shù)利用率更高,訓(xùn)練難度更低。在LUNA16數(shù)據(jù)集中,實(shí)現(xiàn)了8 FPPS下89.97%的敏感度。
通過(guò)殘差路徑可以有效解決網(wǎng)絡(luò)過(guò)深帶來(lái)的梯度消失問(wèn)題,提高優(yōu)化效率和訓(xùn)練速度。通過(guò)分析殘差單元在CNN反向傳播過(guò)程中的作用原理,文獻(xiàn)[8]結(jié)合實(shí)驗(yàn)證明了當(dāng)映射和均為恒等映射時(shí)