張 俊,侯 聰,劉新疆 ,2
1濱州醫(yī)學(xué)院附屬醫(yī)院放射科,山東 濱州 256603;2上海市浦東醫(yī)院(復(fù)旦大學(xué)附屬浦東醫(yī)院)放射科,上海201399
肺癌是世界上發(fā)病率及死亡率最高的惡性腫瘤之一[1],全世界每年約有60萬的新發(fā)肺癌患者。降低肺癌死亡率,最關(guān)鍵的是早期發(fā)現(xiàn)及診斷,肺癌的早期多表現(xiàn)為肺內(nèi)小結(jié)節(jié),而CT尤其是薄層高分辨率CT使得肺結(jié)節(jié)的檢出率大大提高。但是薄層高分辨率CT會(huì)使影像圖像數(shù)量增加,從而增加了放射科醫(yī)師的工作量。由于診斷醫(yī)師的疲勞以及人為主觀性,有可能導(dǎo)致肺結(jié)節(jié)的漏診和誤診。近年來,人工智能(AI)發(fā)展迅速,為醫(yī)學(xué)圖像的自動(dòng)分析和輔助醫(yī)生實(shí)現(xiàn)疾病的高精度診斷提供了良好的機(jī)遇。AI技術(shù)是隨著大數(shù)據(jù)的進(jìn)步而興起的一門新興技術(shù),在醫(yī)學(xué)領(lǐng)域中得到廣泛應(yīng)用,尤其在肺結(jié)節(jié)的檢測(cè)方面具有較大進(jìn)展[2]。
基于AI的計(jì)算機(jī)輔助診斷(CAD)系統(tǒng)可以提高放射科醫(yī)師的工作效率和肺結(jié)節(jié)診斷的準(zhǔn)確性。當(dāng)前,深度學(xué)習(xí)(DL)是AI技術(shù)的研究熱點(diǎn),該技術(shù)可以有效地完成圖像檢測(cè)、識(shí)別和分類等任務(wù)。本文總結(jié)了DL的模型及其在肺結(jié)節(jié)領(lǐng)域中的研究進(jìn)展。
“AI”這一概念最初于1956年提出。AI是計(jì)算機(jī)科學(xué)的一個(gè)分支,是一門用于研究模仿和拓展人類智能的理論及應(yīng)用系統(tǒng)的新興技術(shù)類科學(xué)。AI技術(shù)能夠從圖像中獲得肉眼容易忽視和(或)無法提取的各種信息,從而提高對(duì)圖像的診斷效能,概括來說,AI代表了機(jī)器模仿人類認(rèn)知功能的能力。
ML是用來定義計(jì)算機(jī)從數(shù)據(jù)積累中自動(dòng)學(xué)習(xí)的AI領(lǐng)域。機(jī)器學(xué)習(xí)算法隨著數(shù)據(jù)的增加而進(jìn)化,它們并不是完全基于規(guī)則,而是隨著經(jīng)驗(yàn)的進(jìn)步,學(xué)會(huì)通過評(píng)估大量數(shù)據(jù)給出具體的答案。在醫(yī)學(xué)中,機(jī)器學(xué)習(xí)指的是一種能夠改進(jìn)和學(xué)習(xí)識(shí)別疾病特征模式的系統(tǒng)。
DL是ML的一個(gè)子集,實(shí)質(zhì)是通過構(gòu)建含大量隱藏層的ML模型。它可以通過海量訓(xùn)練集來學(xué)習(xí)有價(jià)值的特征,從而提升分類或診斷的準(zhǔn)確性。DL意味著計(jì)算機(jī)擁有多層算法,這些算法相互連接,并按重要性分層。這些層從輸入中積累數(shù)據(jù),并提供輸出,一旦AI系統(tǒng)從數(shù)據(jù)中學(xué)習(xí)到新的特征,輸出就會(huì)逐步改變。
ML是AI的一個(gè)分支,而DL則是ML的一種。概括來說,AI是使計(jì)算機(jī)或軟件模仿人類學(xué)習(xí)和解決問題等功能的技術(shù);ML是一種AI技術(shù),在沒有明確編程的情況下自動(dòng)學(xué)習(xí)與改進(jìn);DL是使用多層神經(jīng)網(wǎng)絡(luò)算法的ML技術(shù)。
DL模型通常分為監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí)兩種形式,其中監(jiān)督學(xué)習(xí)需要使用帶有分類標(biāo)簽的數(shù)據(jù),此類模型包括卷積神經(jīng)網(wǎng)絡(luò)(CNN)和海量訓(xùn)練人工神經(jīng)網(wǎng)絡(luò)(MTANN);非監(jiān)督學(xué)習(xí)則使用無標(biāo)簽數(shù)據(jù),此類模型包括自編碼器(AE)和深度信念網(wǎng)絡(luò)(DBN),目前最常用的模型是CNN。
CNN是監(jiān)督學(xué)習(xí)下的代表性深度學(xué)習(xí)模型,是端到端機(jī)器學(xué)習(xí)中的一種類型。它的主要構(gòu)成分為卷積層、池化層和全連接層。卷積層利用特定大小的卷積核對(duì)圖像卷積,從而學(xué)習(xí)和提取抽象的、深層次的特征。池化層常被放置在卷積層后,主要作用是對(duì)提取到的特征進(jìn)行壓縮和降維,從而減少運(yùn)算數(shù)據(jù)量。全連接層則主要將最終獲得的特征映射到輸出層。應(yīng)用于肺結(jié)節(jié)領(lǐng)域的的CNN主要包括二維CNN(2D-CNN)和三維CNN(3D-CNN)以及多流、多尺度的CNN(MMCNN)等。
2D-CNN是最早應(yīng)用于肺結(jié)節(jié)的深度網(wǎng)絡(luò)模型,其不受肺部CT圖像層厚的影響,且處理數(shù)據(jù)速度快,所需資源少。2D-CNN相比傳統(tǒng)神經(jīng)網(wǎng)絡(luò),增加了卷積層和降采樣層,有利于減少肺結(jié)節(jié)圖像的特征維數(shù),但2DCNN提取的是單張圖像的特征,這樣容易造成模型過度擬合,進(jìn)而導(dǎo)致診斷效能下降。而3D-CNN將單張的CT圖像堆積成連續(xù)的肺結(jié)節(jié)立方體,卷積核與每張圖像進(jìn)行連接并運(yùn)算,極大地提高了識(shí)別精度。因此,在使用相同網(wǎng)絡(luò)參數(shù)設(shè)置對(duì)相同的數(shù)據(jù)集進(jìn)行分類識(shí)別時(shí),3D-CNN比2D-CNN具有更高的準(zhǔn)確率。
Hua等[3]在2015年將2D-CNN應(yīng)用于肺結(jié)節(jié)的分類中,解決了傳統(tǒng)CAD性能穩(wěn)定性差、人工制定的診斷規(guī)則不全面和準(zhǔn)確率較低等問題;但2D-CNN會(huì)丟失肺結(jié)節(jié)的空間立體信息。有研究提出將3D-CNN應(yīng)用于肺結(jié)節(jié)分類的想法并設(shè)計(jì)了2個(gè)不同結(jié)構(gòu)的3D-CNN在相同的數(shù)據(jù)集進(jìn)行訓(xùn)練和測(cè)試,通過對(duì)實(shí)驗(yàn)結(jié)果所生成的受試者操作特征曲線進(jìn)行評(píng)估[4],該實(shí)驗(yàn)表明,3DCNN的效果較好,并且其不需要依靠特定的專業(yè)知識(shí),通過不斷學(xué)習(xí)便有助于系統(tǒng)的進(jìn)一步完善,從而提高了肺結(jié)節(jié)的診斷效率和準(zhǔn)確性,但是3D-CNN存在特征較多、數(shù)據(jù)量較大和計(jì)算時(shí)間較長(zhǎng)等問題。
有研究提出了一種基于MMCNN的肺結(jié)節(jié)檢測(cè)方法[5-6],此方法不需要進(jìn)行分割等預(yù)處理操作,可以直接處理原始數(shù)據(jù),相比于只能提取單一尺度特征的卷積神經(jīng)網(wǎng)絡(luò)。MMCNN方法能夠提取到多尺度的特征,從而更加有利于肺結(jié)節(jié)的分類。
MTANN是另一種類型的端到端的機(jī)器學(xué)習(xí),它包含多層人工神經(jīng)網(wǎng)絡(luò),全連接網(wǎng)絡(luò)是其核心處理單元。它的特點(diǎn)是直接以候選肺結(jié)節(jié)CT圖像的灰度值作為輸入,但它的輸出是一幅圖像。在得到輸出圖像后,采用加權(quán)和的方式進(jìn)行輸出圖像的量化。不同類型的肺結(jié)節(jié)有不同的分布特征,通過量化分析圖像像素的分布特征可將肺結(jié)節(jié)進(jìn)行分類,達(dá)到了圖像處理與模式識(shí)別的目的。該模型減少了由于特征提取和分析導(dǎo)致的誤差,非常適合在小樣本數(shù)據(jù)應(yīng)用[7]。有研究在肺結(jié)節(jié)檢測(cè)和分類方面,對(duì)MTANN和CNN的性能進(jìn)行比較[8],結(jié)果表明在使用有限的訓(xùn)練數(shù)據(jù)時(shí),MTANN的性能優(yōu)于CNN,但是隨著數(shù)據(jù)量的增加,CNN的性能逐漸提高。因此,在有限的訓(xùn)練樣本中,MTANN獲取的中、低等級(jí)的圖像特征可以滿足肺結(jié)節(jié)的檢測(cè)與分類。
AE是一種非監(jiān)督學(xué)習(xí)下的深度學(xué)習(xí)模型,包括輸入層、隱藏層和輸出層。輸入層壓縮圖像數(shù)據(jù),輸出層將其擴(kuò)展,中間的隱藏層學(xué)習(xí)圖像內(nèi)像素的復(fù)雜關(guān)系[9],可以對(duì)目標(biāo)特征進(jìn)行提取和降維,這相對(duì)于傳統(tǒng)的人工標(biāo)記提取更為客觀和可靠。為了實(shí)現(xiàn)分類,在AE的基礎(chǔ)上,相繼產(chǎn)生了稀疏自編碼(SAE)、去噪自編碼和堆棧去噪自編碼(SDAE)等深度模型。該類模型通過編碼與解碼過程,可以在較低維空間下對(duì)數(shù)據(jù)進(jìn)行分類。
SAE由Bengio等[10]提出,它在自編碼的基礎(chǔ)上加入了稀疏性的限制,引入糾正激活函數(shù),提高了算法的魯棒性,進(jìn)而有效提高了信息表達(dá)的準(zhǔn)確率和全面性。DAE由Vincent等[11]提出,它在自編碼器的基礎(chǔ)上,對(duì)輸入的數(shù)據(jù)加入噪聲以防止過度擬合,使所學(xué)的編碼器具有較強(qiáng)的魯棒性,增強(qiáng)了模型的泛化能力。Hinton等[12]提出堆棧自編碼器,它是一種從無標(biāo)簽數(shù)據(jù)中逐步多層地提取更抽象圖像特征的模型。當(dāng)多個(gè)降噪自編碼器疊加起來時(shí),也就是SDAE。SDAE將上層的隱層作為下層的輸入層,通過非監(jiān)督學(xué)習(xí)的逐層預(yù)訓(xùn)練來初始化深度網(wǎng)絡(luò)的參數(shù),大大提高了表征能力。
有學(xué)者使用5層的DAE對(duì)肺結(jié)節(jié)進(jìn)行診斷,得到的準(zhǔn)確率為75.01%,靈敏度為83.35%[13]。Mao等[14]建立了一種結(jié)合局部和全局特征的肺結(jié)節(jié)圖像模型,他將圖像分割為局部補(bǔ)丁后,在深度AE中提取局部特征構(gòu)建視覺詞匯袋,這樣可以獲取更詳細(xì)的特征信息。有研究提出一種改進(jìn)的深度半監(jiān)督稀疏自編碼器(SSAE)模型對(duì)肺結(jié)節(jié)進(jìn)行檢測(cè),與其他模型(SAE、SSAE、RBM)相比,該模型獲得了較高的準(zhǔn)確性、敏感性、特異性,更適用于肺結(jié)節(jié)的精準(zhǔn)檢測(cè)[15]。
DBN是一種生成模型,這一概念由Hinton等[16]提出。它通過訓(xùn)練神經(jīng)元間的權(quán)值,使整個(gè)神經(jīng)網(wǎng)絡(luò)按照最大概率生成訓(xùn)練數(shù)據(jù),用于特征識(shí)別、數(shù)據(jù)分類和數(shù)據(jù)生成。經(jīng)典的DBN由受限玻爾茲曼機(jī)和一層反向傳播組成,受限玻爾茲曼機(jī)可分為顯性神經(jīng)元和隱性神經(jīng)元[17]。顯性神經(jīng)元用于接收輸入,隱性神經(jīng)元用于提取特征,層與層之間的神經(jīng)元存在連接,但層內(nèi)的神經(jīng)元間不存在連接[18],這種連接方式是其高效性的基礎(chǔ)。2015年,Hua等[3]首次將DBN應(yīng)用在肺結(jié)節(jié)良惡性分類上,實(shí)驗(yàn)獲得了73.4%的敏感度和82.2%的特異度,超過了傳統(tǒng)的機(jī)器學(xué)習(xí)方法。有研究將DBN與極限學(xué)習(xí)機(jī)相結(jié)合,不僅提高了肺結(jié)節(jié)的診斷準(zhǔn)確率,而且大大縮短診斷時(shí)間[19]。
對(duì)于DL來說,高質(zhì)量標(biāo)注圖像模型的構(gòu)建很重要。當(dāng)前由于標(biāo)記肺結(jié)節(jié)圖像的不足,基于DL的網(wǎng)絡(luò)模型容易出現(xiàn)過擬合,準(zhǔn)確率有待進(jìn)一步提高。有學(xué)者將遷移學(xué)習(xí)應(yīng)用到肺結(jié)節(jié)的分類中,有效地解決了肺結(jié)節(jié)樣本缺乏標(biāo)注的問題,能夠大大提高分類的準(zhǔn)確度[20-21]。由于醫(yī)學(xué)圖像的復(fù)雜性,如何更有效地將遷移學(xué)習(xí)應(yīng)用于肺結(jié)節(jié)的分類中還需要進(jìn)一步的研究。另外,DL本身存在一些缺陷,神經(jīng)網(wǎng)絡(luò)只是將圖像和最終的輸出結(jié)果聯(lián)系起來,其中的分類過程不可知,雖然已有多個(gè)網(wǎng)絡(luò)模型學(xué)習(xí)分葉和惡性腫瘤等特征[22],但絕大部分特征仍是未知的。對(duì)于醫(yī)療這種要求特別嚴(yán)格的行業(yè)來說,模型可解釋性是非常重要的。臨床醫(yī)生在看模型結(jié)果的時(shí)候,更關(guān)注模型所產(chǎn)生結(jié)果的邏輯過程,所以對(duì)于模型可解釋性的探索是未來發(fā)展的一個(gè)方向。此外,盡管目前基于DL的肺結(jié)節(jié)檢測(cè)與診斷模型有很多,小規(guī)模的驗(yàn)證也可以達(dá)到較高的診斷性能,但缺乏統(tǒng)一的權(quán)威研究機(jī)構(gòu)對(duì)過程進(jìn)行評(píng)估和比較,也沒有統(tǒng)一的標(biāo)準(zhǔn)和大型的臨床試驗(yàn)證明DL算法在臨床應(yīng)用中的可靠性[23]。與此同時(shí),AI的倫理和法律問題也應(yīng)值得我們思考:在醫(yī)學(xué)應(yīng)用中安全性尤為重要,如何最大限度避免AI系統(tǒng)出現(xiàn)差錯(cuò),怎樣控制出錯(cuò)后的風(fēng)險(xiǎn)以及如何對(duì)此負(fù)責(zé)。
目前AI技術(shù)還處于深度研發(fā)階段,還不能作為直接的檢查診斷方法,結(jié)果還需要影像醫(yī)師進(jìn)行判斷審核。因此影像科醫(yī)師必須具備處理AI的技能,充分了解AI在影像學(xué)診斷中的優(yōu)缺點(diǎn)。但不可否認(rèn)的是,AI技術(shù)在病灶檢出率、縮短時(shí)間耗時(shí)等方面具有明顯優(yōu)勢(shì)。DL系統(tǒng)在進(jìn)行肺結(jié)節(jié)的檢測(cè)時(shí),也可以加入乳腺、胸膜、心臟和淋巴結(jié)等其他部位的檢測(cè),這種全面的檢測(cè)可以有效避免漏診和誤診。
綜上所述,基于DL的AI對(duì)于肺結(jié)節(jié)檢測(cè)和診斷具有非常重要意義,它能夠降低影像醫(yī)師及臨床醫(yī)師工作量,提高工作效率。相信隨著AI進(jìn)一步的深度學(xué)習(xí)、算法改進(jìn),對(duì)于病變識(shí)別的準(zhǔn)確性也一定會(huì)得到顯著提升。在未來的醫(yī)學(xué)影像學(xué)乃至整個(gè)醫(yī)學(xué)領(lǐng)域中,基于DL的AI將發(fā)揮關(guān)鍵作用。