王六一,宋文愛,林鑫山,岳 寧,楊吉江,王 青,雷 毅
1.中北大學(xué) 軟件學(xué)院,太原030051 2.中國醫(yī)學(xué)科學(xué)院 北京協(xié)和醫(yī)學(xué)院 研究生院,北京100730 3.中日友好醫(yī)院 呼吸中心呼吸與危重癥醫(yī)學(xué)科,北京100029 4.山東大學(xué)第二醫(yī)院 影像科,濟南250033 5.清華大學(xué) 自動化系,北京100089
支氣管擴張定義為支氣管的永久性擴張,臨床上表現(xiàn)為咳嗽、咳痰,常因感染而導(dǎo)致急性加重,并可引起肺通氣功能障礙[1]。現(xiàn)有關(guān)于支氣管擴張的流行病學(xué)調(diào)查顯示,支氣管擴張的患病率已經(jīng)超過5/10 000的罕見病歐盟定義[2],且其患病率及發(fā)病率呈現(xiàn)出逐年上升的趨勢。2013年,中國第一次進行了針對支氣管擴張患病情況的流行病學(xué)調(diào)查,調(diào)查顯示中國40歲以上人群經(jīng)醫(yī)師診斷支氣管擴張的患病率為1.2%[3]。
支氣管擴張癥的診斷以影像學(xué)為基礎(chǔ),CT檢查是診斷支氣管擴張的重要手段。目前常用的CT嚴重程度評估系統(tǒng)中,改良Reiff評分因其簡便性及有效性在臨床廣泛應(yīng)用,是支氣管擴張嚴重度指數(shù)(The Bronchiectasis Severity Index,BSI)的重要條目[4],依據(jù)改良Reiff總分可進行嚴重程度分級,其評分標準如表1。2018年推出的BRICS評分系統(tǒng)盡管因推出時間晚,尚未在臨床推廣,但仍具有較好的臨床應(yīng)用前景[5],其評分標準如表2。
表1 改良Reiff評分標準
表2 BRICS評分標準
支氣管擴張評分依據(jù)于醫(yī)生對CT圖像中支氣管擴張程度的判斷,要求醫(yī)生具有專業(yè)性,需要醫(yī)生對大量CT圖像進行支氣管擴張程度的判斷,且由于地域發(fā)展的不平衡,基層醫(yī)師更為缺乏,所以需要一套簡單易行且診斷準確度在一定水平之上的解決方案。隨著人工智能的發(fā)展,基于深度學(xué)習(xí)的圖像處理方案有了實現(xiàn)的可能。醫(yī)生根據(jù)輔助診斷系統(tǒng)給出的結(jié)果得到患者的支氣管擴張嚴重程度的評分,這種診斷方式大大減少了醫(yī)生的重復(fù)工作,提高了醫(yī)生的工作效率。該方式可有效向基層進行推廣,在此基礎(chǔ)上可獲得大量的數(shù)據(jù)并進一步提升診療識別能力,對緩解醫(yī)療資源不足問題有著重要意義。
當(dāng)前,支氣管擴張人工智能自動評分系統(tǒng)領(lǐng)域的研究非常少,我國目前仍缺乏支氣管擴張的患病數(shù)據(jù)。尤其是有影像學(xué)診斷證據(jù)支持的支氣管擴張研究基本上是空白的。在支氣管擴張檢測中,CT影像處理主要包含圖像降噪、肺實質(zhì)提取和肺葉分割三部分。計算機斷層掃描(CT)技術(shù)的不斷發(fā)展和在醫(yī)療實踐中的廣泛應(yīng)用引起了公眾對患者相關(guān)輻射劑量的關(guān)注,但降低輻射劑量可能導(dǎo)致噪聲和偽影增加[6]。Yang等[6]提出了一種基于生成對抗網(wǎng)絡(luò)的CT圖像降噪方法。將LDCT去噪問題視為從LDCT到NDCT圖像的轉(zhuǎn)換。Skourt等[7]提出了一種基于U-net架構(gòu)的肺部CT圖像分割方法用于肺實質(zhì)提取,利用很少的圖像進行端到端的訓(xùn)練,其結(jié)果十分優(yōu)異。Xie等[8]提出了一種新的用于肺葉分割的方法RTSU-Net,使用了一種新的神經(jīng)網(wǎng)絡(luò)模型來利用肺葉的結(jié)構(gòu)化關(guān)系分割肺葉,并且在由于感染新冠肺炎而導(dǎo)致嚴重肺部感染的病例中肺葉分割性能出色。
醫(yī)學(xué)圖像分析是深度學(xué)習(xí)的一個相當(dāng)活躍的研究領(lǐng)域,近年來深度學(xué)習(xí)尤其是計算機視覺在醫(yī)學(xué)領(lǐng)域中的發(fā)展尤為迅速,但支氣管擴張疾病方向尚未有成熟模型。Ali等[9]受AlphaGo的啟發(fā)設(shè)計了基于深度學(xué)習(xí)的肺結(jié)節(jié)檢測系統(tǒng),并在LIDC-IDRI數(shù)據(jù)集中得出了99.1%的總體準確率。儲春潔等[10]基于MaskR-CNN[14]框架,使用MSCOCO(Microsoft Commom Objects in Context)數(shù)據(jù)集來做肺結(jié)節(jié)目標檢測任務(wù),對最小的肺結(jié)節(jié)檢測率也達到了78%。席孝倩等[11]提出了肺結(jié)節(jié)輔助診斷系統(tǒng),該系統(tǒng)通過訓(xùn)練好的數(shù)據(jù)模型檢測肺部CT影像,盡可能簡化操作,實現(xiàn)人機交互式操作,減輕醫(yī)生的負擔(dān),降低肺結(jié)節(jié)診斷的誤診和漏診率。
基于深度學(xué)習(xí)方法對支氣管擴張自動評分目前有兩種主要思路,關(guān)鍵區(qū)別在于對數(shù)據(jù)的利用。
步驟類型1:
此類型使用監(jiān)督學(xué)習(xí),使用醫(yī)生標注好的數(shù)據(jù)進行訓(xùn)練預(yù)測模型。診斷流程如圖1所示。
圖1 輔助診斷流程圖類型1
(1)獲取原始LDCT(低劑量CT圖像),請醫(yī)生選擇一定數(shù)量的數(shù)據(jù)進行標記,將不同嚴重程度的支氣管擴張進行標注,進行必要的圖像預(yù)處理。
(2)對處理好的數(shù)據(jù)進行目標檢測任務(wù),生成目標檢測的預(yù)測模型。將肺部CT圖像輸入識別模型,對檢出的支氣管擴張進行打分并輸出結(jié)果。
步驟類型2:
此類型和類型1的區(qū)別在于是否可以利用大量的未標注數(shù)據(jù)。首先通過醫(yī)生標注的數(shù)據(jù)訓(xùn)練一個多示例學(xué)習(xí)的方法得到帶有粗糙標簽的圖像,再利用這些粗糙標簽訓(xùn)練一個有監(jiān)督學(xué)習(xí)的目標檢測模型以進行目標檢測任務(wù),診斷流程如圖2所示。
圖2 輔助診斷流程圖類型2
在本文接下來的內(nèi)容里,第3章詳細介紹了支氣管擴張檢測中的圖像預(yù)處理部分,主要包含了CT圖像降噪、肺實質(zhì)提取和肺葉分割三部分。第4章依據(jù)目前支氣管擴張檢測的兩種思路,分別介紹了監(jiān)督學(xué)習(xí)和弱監(jiān)督學(xué)習(xí)下的目標檢測方法。
圖像去噪的目的是在保留臨床細節(jié)的情況下抑制圖像中的噪聲,使圖像有助于診斷。隨著CT技術(shù)的發(fā)明,CT圖像的降噪研究應(yīng)運而生。CT圖像降噪方法評估中的一個非常重要的要求是必須保留所有臨床相關(guān)的圖像內(nèi)容,特別是圖像邊緣和小結(jié)構(gòu)。目前的圖像去噪算法可分為兩類,空域像素特征去噪算法和變換域去噪算法。
3.1.1 傳統(tǒng)方法
近年來,雙邊[12]和非局部均值(NLM)[13]濾波器在圖像去噪中非常流行。雙邊濾波是一種用于圖像去噪的非線性、邊緣保護的平滑濾波器。圖像中每個像素的亮度值被附近像素的亮度值的加權(quán)平均值代替。Giraldo等[14]對CT圖像的兩種降噪方法進行了比較研究。他們在真實的CT圖像和虛擬圖像上測試了他們的方法。他們的結(jié)論表明這兩種方法的去噪效果都非常好。
Ai等[15]提出了一種基于自適應(yīng)張量主成分分析(AT-PCA)算法的LDCT圖像去噪方案。使用鄰域像素來表示目標像素,使用自適應(yīng)搜索窗口來選擇補丁并且搜索相似的補丁。此外,基于張量的主成分分析用于獲得變換矩陣,其中系數(shù)按線性最小均方誤差順序縮小。獲得收縮的斑塊,并對所有收縮的斑塊進行聚集以獲得去噪圖像。該方法比NLM濾波能更有效地抑制噪聲,提高圖像質(zhì)量。
為了更好地保持邊緣細節(jié),Al-Ameen等[16]提出了一種保相去噪算法。傳統(tǒng)相位保持方法抑制了處理過的圖像中的特定細節(jié)。因此,他們使用2D高斯點擴散函數(shù)的維納濾波器對保相算法進行了改進。該算法的優(yōu)點是更好地保留了次要的醫(yī)學(xué)細節(jié),并改善了過度的噪聲抑制。同時保相去噪方法可以從較高層次的細節(jié)中去除具體細節(jié)。
同樣的,Duan等[17]提出了一種基于二階全廣義變分模式的醫(yī)學(xué)圖像去噪方案。他們結(jié)合了基于快速傅里葉變換的分裂布雷格曼算法,以提高計算效率。對合成醫(yī)學(xué)數(shù)據(jù)來說該方案比現(xiàn)有的最先進的降噪方法更好地抑制了噪聲。他們的方法有效地減少了噪聲,而不產(chǎn)生階梯效應(yīng)。
3.1.2 深度學(xué)習(xí)方法
隨著深度學(xué)習(xí)算法在圖像去噪方面的革命性發(fā)展,通過層次化的網(wǎng)絡(luò)概念提高了圖像高級特征的學(xué)習(xí)。圖像去噪已經(jīng)引入了Auto編碼器、堆疊稀疏去噪自編碼器(SSDA)及其變體等技術(shù)。它們具有利用強空間相關(guān)性來提高圖像去噪性能的強大能力。
Kang等[18]介紹了使用小波變換的卷積神經(jīng)網(wǎng)絡(luò)的更高層次版本。他們通過有限角度斷層成像減少了重建誤差,其中濾波后的反投影被用于降噪。Chen等[19]提出了一種基于輕量級卷積神經(jīng)網(wǎng)絡(luò)的CT圖像去噪方法,并取得了很好的結(jié)果。在進一步的延伸工作中,Chen等[20]使用反卷積網(wǎng)絡(luò)與CNN模型的快捷連接來增強CT圖像的去噪工作,CNN模型被稱為殘差編碼器解碼器卷積神經(jīng)網(wǎng)絡(luò)(RED-CNN)。同時,他們進行了有助于改善結(jié)果的基于補丁的訓(xùn)練。Gondara[21]首先提出了醫(yī)學(xué)圖像去噪,其中去噪自動編碼器使用卷積層。結(jié)論表示,在大多數(shù)其他去噪方法都失效的地方,他的方法可以抑制更高的噪聲,邊緣也被很好地保留了。一些CT降噪方法的比較如表3所示。
表3 一些CT降噪方法的比較
肺實質(zhì)的準確分割是肺部疾病診斷和治療的重要前置步驟。由于肺部區(qū)域存在不均勻性,動脈、靜脈、支氣管和細支氣管等肺部結(jié)構(gòu)具有相似的強度值,所以肺實質(zhì)分割是一項困難的任務(wù),它基本上是從肺部CT圖像中提取肺實質(zhì)部分,為后續(xù)步驟提供準確的感興趣區(qū)域。在支氣管擴張檢測中肺實質(zhì)分割是一個必不可少的步驟,且肺實質(zhì)分割是肺葉分割的前置操作。
3.2.1 傳統(tǒng)肺實質(zhì)分割方法
雖然傳統(tǒng)的肺實質(zhì)分割算法不具備基于神經(jīng)網(wǎng)絡(luò)的算法的準確率,但是對設(shè)備要求相對不高,且花費的時間較少。因此,傳統(tǒng)算法仍然有很大的價值。
Shariaty等[22]提出了一種新的基于閾值算法的CT圖像肺部分割方法,該方法通過重建操作檢測出附著的結(jié)節(jié)并將其添加到肺部掩膜中。Gopalakrishnan等[23]提出了一種方法,利用自適應(yīng)多級閾值法(Adaptive Multilevel Thresholding)來估計高斯分布的總數(shù)以及其初始參數(shù)。再對使用高斯混合模型(Gaussian Mixture model)分割的肺實質(zhì)使用自適應(yīng)形態(tài)濾波(Adaptive Morphological Filtering),以減少邊界誤差。
Zhang等[24]提出了一種新的改進GrabCut算法用于肺實質(zhì)分割,該算法可以自動選擇與肺實質(zhì)相關(guān)的合適邊界,然后使用GrabCut算法來提取肺實質(zhì)。該算法能夠適應(yīng)不同形態(tài)的肺實質(zhì),有效提高分割的準確性。Hao等[25]提出了一種基于信息熵和聯(lián)合向量的LBF主動輪廓模型的自動分割方法。該方法通過pet(正電子發(fā)射計算機斷層掃描)中的標準攝取值提取肺結(jié)節(jié)的感興趣區(qū)域,并利用自動閾值迭代粗略構(gòu)建初始輪廓。該方法對肺實質(zhì)的分割有很大的參考意義。
曲彥等[26]提出了一種使用閾值方法結(jié)合模糊C均值聚類的傳統(tǒng)方法。他們的方法可以準確區(qū)分左右肺,準確率分別為0.983 2和0.980 7。他們通過聚類、標記和合并相同類型的超像素子區(qū)域獲得了最終的肺實質(zhì)分割結(jié)果。他們的方法在肺部計算機斷層圖像分割的mAP(平均準確率)可以達到0.994 6。
Khan[27]提出了一種結(jié)合顏色特征和改進的模糊C均值聚類來分割肺實質(zhì)的新方法。這種方法解決了現(xiàn)有CT肺實質(zhì)分割技術(shù)的問題,因為它結(jié)合了整個圖像中存在的不同像素的顏色特征。改進的模糊聚類和顏色特征的結(jié)合是該方法的主要優(yōu)點。
Dharmalingham等[28]提出了一種獨特的病理肺分割方法,稱為基于參考模型的分割,它利用了人肺的形狀特性。該分割方法使用一種新的采樣線算法(Sampling Lines Algorithm)從輸入切片構(gòu)建參考肺模型,并提取形狀特征。
3.2.2 基于深度學(xué)習(xí)的肺實質(zhì)分割方法
近年來,卷積神經(jīng)網(wǎng)絡(luò)在圖像分類、目標檢測等領(lǐng)域取得了非常大的成功。許多網(wǎng)絡(luò)都將CNN作為一種特征提取方法,并且對網(wǎng)絡(luò)進行了改進,取得了很好的效果。目前,CNN在肺實質(zhì)提取方面取得了很大的成績。
袁甜等[29]提出了一種基于U-Net的肺部CT圖像自動分割算法。她們對原始的CT圖像進行高斯和拉普拉斯濾波。將原始圖像和預(yù)處理后的圖像分別作為輸入使用卷積神經(jīng)網(wǎng)絡(luò)進行分割。再將分割后的肺區(qū)使用線性回歸來融合并提取肺實質(zhì)區(qū)域。其中四類圖像分割的準確率分別達到0.991、0.978、0.983、0.997。Harrison等[30]提出了用于病理肺分割的網(wǎng)絡(luò)P-HNNs(Progressive Holistically-Nested Networks),這是一種基于自底向上的深度學(xué)習(xí)方法。這種方法最大的優(yōu)點在于不受肺部形狀變化的影響。P-HNNs結(jié)合了監(jiān)督學(xué)習(xí)框架。它通過一種簡單的、有效的多路徑方法得到增強,他們使用P-HNNs合并來自不同網(wǎng)絡(luò)級的輸出。一些肺實質(zhì)分割方法的比較如表4所示。
表4 肺實質(zhì)分割方法比較
人體的肺實質(zhì)可以分為五個功能相對獨立的解剖學(xué)區(qū)域——肺葉,相鄰肺葉間的物理邊界被稱為肺裂。在支氣管擴張程度兩種評分標準中,改良Reiff評分標準需要對每個肺葉中的支氣管擴張單獨打分并相加。肺葉的分割基于三個肺裂的檢測,需要肺實質(zhì)等傳統(tǒng)解剖學(xué)信息。因此首先要進行肺實質(zhì)提取。目前肺葉分割算法的思路大致相同:檢測屬于肺裂的像素點,使用檢測到的肺裂像素點生成肺裂面,進而得到五個肺葉。
以解剖學(xué)知識為先驗知識的肺葉分割,需要依賴肺部結(jié)構(gòu)解剖學(xué)知識。Kuhnigk等[31]基于肺裂附近通常沒有較大的血管的解剖學(xué)知識,利用交互式的三維分水嶺算法來檢測肺葉,接著利用肺葉的邊緣檢測來分割肺葉。Lassen等[32]在Kuhnigk的基礎(chǔ)上,將肺裂分割的信息和肺氣道分割的信息引入代價函數(shù),利用三維分水嶺算法來檢測和分割肺葉。Wei等[33]通過預(yù)先估計的裂縫方向搜索沒有氣管和呼吸道的平坦的感興趣區(qū)域(Region of Interest),然后使用2D小波變換檢測可能的肺裂,并給出了九名患者的肺葉分割結(jié)果。
圖譜引導(dǎo)(atlas-guided)方法是利用標準模板對醫(yī)學(xué)圖像進行分割,將圖像分割問題轉(zhuǎn)換為圖像配準問題,將標準圖譜通過線性或非線性映射到待分割的圖像上[34]。Zhang等[35]使用圖譜來初始化對感興趣裂隙區(qū)域的搜索。該圖譜由裂隙和肺邊界構(gòu)建,并初始化對包含傾斜裂隙的區(qū)域的模糊推理搜索。然后,使用基于結(jié)構(gòu)張量的裂隙點檢測和平滑約束,通過圖形搜索找到最佳裂隙曲線,進行肺葉分割。van Rikxoort等[36]使用基于圖譜的配準,基于使用監(jiān)督過濾器檢測到的肺邊界和裂點,分割肺裂。在兩個數(shù)據(jù)集上分別給出了定量和定性的結(jié)果。
George等[37]將深度學(xué)習(xí)與隨機游走(random walk)算法相結(jié)合,提出了一種新的肺葉分割方法。先使用P-HNN模型來識別潛在的肺葉邊界,再使用隨機游走算法生成肺葉分割的結(jié)果。他們是最先將深度學(xué)習(xí)應(yīng)用到肺葉分割的人。其優(yōu)點是增強了病變肺的穩(wěn)健性,且方法簡單,不會犧牲準確性,其準確性顯著勝過傳統(tǒng)方法。Tang等[38]提出了一種新的深度學(xué)習(xí)方法用于肺葉分割,在LUNA16數(shù)據(jù)集上隨機標記了50個CT掃描數(shù)據(jù),使用Dice系數(shù)差異函數(shù)來處理極端的數(shù)據(jù)不平衡問題和焦點損失。在LUNA16測試集和天池測試集的平均Dice系數(shù)分別達到91.48%和94.17%。Imran等[39]介紹了一種漸進性的深度學(xué)習(xí)方法Progressive Dense V-Network(PDV-Net)。CT影像只在一個單一的向前的網(wǎng)絡(luò)中進行處理,不依賴于先驗的肺部解剖學(xué)知識、不依賴于專業(yè)人員的專業(yè)知識介入,且在三個公開數(shù)據(jù)集中得到了很好的結(jié)果。一些肺葉分割方法的比較如表5所示。
表5 肺葉分割方法比較
目標檢測是計算機視覺領(lǐng)域中的一項重要課題,主要研究內(nèi)容是將圖像或視頻中的目標物體與其他信息進行切分,并獲得這一目標的類別信息和位置信息,其應(yīng)用范圍包括人臉檢測、自動駕駛、醫(yī)學(xué)圖像檢測等。在支氣管擴張診斷中有兩個主要任務(wù):檢測和分割,在CT圖像中檢測支氣管擴張后,依據(jù)支氣管擴張的位置與單獨得分,結(jié)合肺葉分割位置和兩大評分規(guī)則,可以得出病人在兩大評分標準:改良Reiff[4]和BRICS[5]下的支氣管擴張嚴重程度的最終得分。
傳統(tǒng)目標檢測的流程為:(1)確定滑動窗口后在圖像中的不同位置提取候選區(qū)域;(2)對候選區(qū)域進行特征提??;(3)利用事先訓(xùn)練好的分類器對特征信息進行分類。根據(jù)不同的應(yīng)用背景可以靈活選取不同的目標檢測方法,傳統(tǒng)目標檢測方法可以分為四類:基于像素分析的方法、基于特征匹配的方法、基于頻域的方法和基于識別的檢測方法[41]。傳統(tǒng)的目標檢測方法采用人工手動提取特征信息,無法避免在此過程中存在特征信息不完整的問題,從而導(dǎo)致識別效果較差。具體來說,傳統(tǒng)的目標檢測算法還存在以下問題:
(1)基于滑動窗口的候選區(qū)域選擇沒有明確的目標,時間復(fù)雜度高。
(2)手工設(shè)計的特征對于多樣性的變化沒有很好的魯棒性。
深度學(xué)習(xí)的方法自2012年AlexNet[42]提出以來就引發(fā)了研究熱潮,目標檢測領(lǐng)域也引入了深度學(xué)習(xí)方法。深度學(xué)習(xí)方法的優(yōu)勢在于模型抽取特征代替了傳統(tǒng)的手工設(shè)計特征,且可以實現(xiàn)端到端的訓(xùn)練方式。在醫(yī)學(xué)圖像處理的目標檢測任務(wù)中,由于醫(yī)學(xué)圖像的特殊性,后續(xù)的實現(xiàn)思路可以區(qū)分為監(jiān)督學(xué)習(xí)方法和弱監(jiān)督學(xué)習(xí)方法。
4.2.1 監(jiān)督學(xué)習(xí)的思路
監(jiān)督學(xué)習(xí),是機器學(xué)習(xí)中的一種思路,可以由標記好的訓(xùn)練集中建立一個模式或函數(shù),并依此模式或函數(shù)推測新的實例。在支氣管擴張的評估任務(wù)中需要對醫(yī)學(xué)圖像進行人工標注,且只依賴于標注的數(shù)據(jù),送入深度學(xué)習(xí)模型進行訓(xùn)練,并不斷地調(diào)參與調(diào)優(yōu),最終可以得到一個能夠?qū)]有任何標記的肺部CT圖像自動進行支氣管擴張檢測與分割的模型。
在當(dāng)前基于深度學(xué)習(xí)的目標檢測方法中,大體可以分為兩類:“two-stage”和“one-stage”。第一類思想的代表方法是Girshick等[43]在2014年提出的R-CNN。R-CNN的實現(xiàn)思路是首先通過選擇搜索提取一組候選區(qū)域,再將每個候選區(qū)域調(diào)整為固定的大小,然后進行特征提取。最后,利用線性SVM(Support Vector Machine)分類器識別目標檢測。Girshick[44]在2015年對R-CNN進一步改進,提出了Fast R-CNN。Fast R-CNN可以在相同的神經(jīng)網(wǎng)絡(luò)下同時訓(xùn)練檢測器和邊框回歸,進一步提升了目標檢測的精度。Ren等[45]在Fast R-CNN之后提出了FasterR-CNN算法。Faster R-CNN是第一個端到端的深度學(xué)習(xí)目標檢測方法。He等[46]提出的Mask R-CNN,融合了分割和檢測任務(wù),使用插值方法將ROI對齊,進一步提高了目標檢測準確度。Han等[47]使用了多條件生成對抗網(wǎng)絡(luò)(MCGAN)來生成近似真實結(jié)節(jié)的3D結(jié)節(jié),并置于真實肺部CT圖像上,再將肺部CT圖像輸入3D Faster R-CNN以進行結(jié)節(jié)檢測。他們的結(jié)果表明,3D卷積神經(jīng)網(wǎng)絡(luò)的檢測實現(xiàn)了更高的靈敏度,并解決了醫(yī)學(xué)數(shù)據(jù)匱乏的問題。
Liu等[48]使用Mask R-CNN用于肺結(jié)節(jié)檢測。由于正負樣本之間的不平衡,他們訓(xùn)練了基于塊的分類網(wǎng)絡(luò),并選擇了精度最高的分類網(wǎng)絡(luò)用作Mask R-CNN的骨干網(wǎng)絡(luò),該網(wǎng)絡(luò)在自然圖像上表現(xiàn)出色。最后,將在COCO數(shù)據(jù)集上訓(xùn)練的Mask R-CNN模型進行了微調(diào)用以檢測肺結(jié)節(jié)。獲得的平均精度為0.733 4 mAP。
第二類方法是one-stage算法。這類思想的代表方法是Redmon等[49]于2016年提出YOLO(You Only Look Once)。YOLO將單個神經(jīng)網(wǎng)絡(luò)應(yīng)用于目標檢測任務(wù)的整體上。YOLO將圖像分割成多個區(qū)域,并同時預(yù)測每個區(qū)域的邊界框和概率。接下來,Redmon等進一步提出了YOLOv2[50]和YOLOv3[51]版本,同最初的YOLO相比檢測精度進一步提高。Liu等[52]在2016年結(jié)合了R-CNN的錨點機制和YOLO的回歸思想,提出了SSD算法,引入了多尺度的檢測方法,即在每一個尺度提取的特征圖上都進行檢測,檢測速度和準確度同YOLO進一步提升。
George等[53]提出了一種用于肺結(jié)節(jié)定位的檢測系統(tǒng),該系統(tǒng)利用了基于YOLO的同時兼具魯棒性和性能的DetectNet網(wǎng)絡(luò)。不同于帶有滑動窗口的CNN分類器中那樣存在重疊窗口,因此該方法更快且計算效率更高。通過采用遷移學(xué)習(xí)來提高結(jié)節(jié)檢測系統(tǒng)的準確性,在每張圖像有6個假陽性的情況下具有89%的靈敏度。宋艷艷等[54]為了解決目標檢測的多尺度和多姿態(tài)的問題,在YOLOV3的基礎(chǔ)上進行了改進。添加了104×104尺度檢測層,通過K-means聚類分析得到適用于行人目標檢測數(shù)據(jù)集的邊界框尺寸,用于目標檢測以提高其網(wǎng)絡(luò)性能,改善了目標遮擋影響以提高檢測效果。在行人檢測數(shù)據(jù)集上的準確率分別為78.10%和80.53%,具有較好的檢測性能和魯棒性。
Khosravan等[55]提出了一種新的基于深度學(xué)習(xí)的肺結(jié)節(jié)檢測方法S4ND,以端到端的方式進行訓(xùn)練。他們分別與SSD網(wǎng)絡(luò)以及高效的肺結(jié)節(jié)檢測方法3D DCNN在來自LUNA的挑戰(zhàn)數(shù)據(jù)集上進行了肺結(jié)節(jié)檢測準確率的比較。依據(jù)實驗結(jié)果,他們提出的方法在效率和準確性方面均優(yōu)于其他兩種方法。
4.2.2 弱監(jiān)督學(xué)習(xí)思路
目標檢測模型的性能在很大程度上取決于有標簽的訓(xùn)練樣本數(shù)量,但是,圖像中目標邊界注釋框的收集是一項耗時的任務(wù),而且在一些特殊情況下,有監(jiān)督的訓(xùn)練樣本難以獲取。因此,一些學(xué)者開展了弱監(jiān)督目標檢測研究。弱監(jiān)督學(xué)習(xí)在醫(yī)學(xué)圖像中的主要思想是不完全監(jiān)督,指的是訓(xùn)練數(shù)據(jù)中部分數(shù)據(jù)帶有人工標注的標簽,而其他的大量數(shù)據(jù)都是原始數(shù)據(jù)。這不僅僅是因為標注工作的量大,還是因為某些領(lǐng)域的數(shù)據(jù)對于標注人員的要求極高。例如,在醫(yī)學(xué)領(lǐng)域中需要構(gòu)建大型的醫(yī)學(xué)圖像數(shù)據(jù)時,這就需要由專業(yè)的醫(yī)生進行標注,然而醫(yī)生對于數(shù)據(jù)科學(xué)的理解可能不夠,有些數(shù)據(jù)的標注無法達到一定的要求。
目前主流的弱監(jiān)督目標檢測算法是首先通過訓(xùn)練一個多示例學(xué)習(xí)的方法得到帶有粗糙標簽的圖像,然后利用這些粗糙標簽來訓(xùn)練一個監(jiān)督學(xué)習(xí)的目標檢測模型。這些粗糙的標簽也被稱為偽標簽。這是一個多階段的過程,容易造成的后果是由于算法具有非凸性因而使模型陷入局部極小值,從而造成不能檢測整個物體,Wan等[56]提出了C-MIL模型,將實例劃分為多個空間相關(guān)和類相關(guān)的子集,通過子集中一系列平滑損失函數(shù)來近似原始目標損失函數(shù),緩解了非凸性問題。Bilen等[57]提出WSDDN(Weakly Supervised Deep Detection Networks)方法,WSDDN是第一個可以實現(xiàn)端到端訓(xùn)練的弱監(jiān)督學(xué)習(xí)模型。
在利用其他弱監(jiān)督信息方面,Yang等[58]注意到物體的空間位置、外觀和運動與圖像中物體的動作密切相關(guān),提出了利用僅帶有動作標簽的樣本訓(xùn)練目標檢測模型,不僅在訓(xùn)練過程中減少了目標候選框的搜索范圍,還減少了目標檢測模型所需的監(jiān)督量,實現(xiàn)了一定程度的性能提升。近年來,新的弱監(jiān)督多層協(xié)作學(xué)習(xí)思路被提出,即將監(jiān)督學(xué)習(xí)和弱監(jiān)督學(xué)習(xí)相結(jié)合。同時給定兩個相關(guān)模型,一個是弱監(jiān)督模型,一個是監(jiān)督模型,通過協(xié)作模型將它們結(jié)合起來。Wang等[59]提出了弱監(jiān)督協(xié)作學(xué)習(xí)(WSCL)方法,將弱監(jiān)督學(xué)習(xí)網(wǎng)絡(luò)和監(jiān)督學(xué)習(xí)網(wǎng)絡(luò)整合為一個端到端的網(wǎng)絡(luò)。通過一致性損失約束監(jiān)督網(wǎng)絡(luò)和弱監(jiān)督網(wǎng)絡(luò),使其具有近似的結(jié)果,通過共享特征來保證監(jiān)督網(wǎng)絡(luò)和弱監(jiān)督網(wǎng)絡(luò)的一致性,來實現(xiàn)弱監(jiān)督協(xié)作學(xué)習(xí)。Desai等[60]提出了一種基于主動學(xué)習(xí)的自適應(yīng)弱監(jiān)督框架,將Faster R-CNN與PBAL(基于標準池的主動學(xué)習(xí))結(jié)合。他們與監(jiān)督學(xué)習(xí)下的目標檢測方法相比較,既保證了目標檢測的準確度,又減少了訓(xùn)練目標檢測模型的時間成本。他們證明了弱監(jiān)督學(xué)習(xí)和監(jiān)督學(xué)習(xí)可以進行協(xié)作學(xué)習(xí),為弱監(jiān)督技術(shù)與監(jiān)督學(xué)習(xí)的結(jié)合提出了新的思路。馬圓等[61]對基于深度信念網(wǎng)絡(luò)(DBN)的協(xié)作學(xué)習(xí)方法與SVM方法在肺結(jié)節(jié)良惡性檢測中進行對比,發(fā)現(xiàn)DBN識別肺結(jié)節(jié)良惡性的準確性高于SVM方法接近20%,且方便程度與準確程度都優(yōu)于SVM方法。DBN通過有監(jiān)督和無監(jiān)督學(xué)習(xí)過程的協(xié)作,能較好地完成目標檢測與分類任務(wù)。
當(dāng)前最新的弱監(jiān)督學(xué)習(xí)目標檢測框架依然達不到主流監(jiān)督學(xué)習(xí)目標檢測的準確度。因此,將弱監(jiān)督學(xué)習(xí)和監(jiān)督學(xué)習(xí)結(jié)合進行協(xié)作學(xué)習(xí)是弱監(jiān)督目標檢測的未來發(fā)展的趨勢。一些目標檢測方法的比較如表6所示。
表6 深度學(xué)習(xí)目標檢測模型
肺實質(zhì)提取、肺葉分割、目標檢測是做支氣管擴張評估的核心任務(wù),由優(yōu)秀的肺實質(zhì)提取算法得到準確的肺實質(zhì),再依據(jù)兩種評分標準,判斷是否需要分割肺葉,然后再基于數(shù)據(jù)集的情況進行目標檢測,最終得到醫(yī)療層面的支氣管擴張嚴重程度的評分,這是目前來看最具可行性的技術(shù)路線。監(jiān)督學(xué)習(xí)和弱監(jiān)督學(xué)習(xí)這兩種思路各有優(yōu)缺點,對于監(jiān)督學(xué)習(xí)的思路來說,對數(shù)據(jù)集的要求較高,需要專業(yè)的醫(yī)生來對數(shù)據(jù)進行標注,但在對支氣管擴張嚴重程度的檢測上準確度更好。對于弱監(jiān)督學(xué)習(xí)的思路來說,對標注數(shù)據(jù)的要求不高,但是對數(shù)據(jù)量有要求,且可以利用大量未標注的數(shù)據(jù)。
目前肺實質(zhì)提取和肺葉分割已經(jīng)有了準確度足夠高的方法。支氣管擴張AI診斷系統(tǒng)想要實現(xiàn)落地目標,其未來重點研究方向包含兩個層面:第一是盡管醫(yī)學(xué)圖像分析是深度學(xué)習(xí)的一個活躍的研究領(lǐng)域,但目前仍未有支氣管擴張診斷的研究應(yīng)用,支氣管擴張疾病方向尚未有成熟模型。第二是對于支氣管擴張診斷系統(tǒng)目前數(shù)據(jù)集缺失問題,目前還沒有公開的支氣管擴張的數(shù)據(jù)集??尚械慕鉀Q手段主要有兩種方式,第一類是通過與醫(yī)院加強合作,這樣可以直接獲得所需的數(shù)據(jù)集,但這樣得到的數(shù)據(jù)量可能存在限制,第二類是利用遷移學(xué)習(xí),但做遷移學(xué)習(xí)過程中可能會產(chǎn)生準確度下降的問題。
結(jié)合深度學(xué)習(xí)技術(shù)的特點和發(fā)展,提出支氣管擴張AI診斷系統(tǒng)未來的發(fā)展趨勢。第一是深度學(xué)習(xí)方法需要大量帶有精確標注的數(shù)據(jù),由于醫(yī)學(xué)影像數(shù)據(jù)的稀缺性和特殊性,數(shù)據(jù)的標注更是困難,所以基于弱監(jiān)督或協(xié)作學(xué)習(xí)的深度學(xué)習(xí)方法或許是解決這些問題的新思路。第二是隨著生成對抗網(wǎng)絡(luò)的蓬勃發(fā)展,可以生成逼真且有效的醫(yī)學(xué)影像數(shù)據(jù),可以有效降低醫(yī)學(xué)影像數(shù)據(jù)采集的成本,并結(jié)合弱監(jiān)督學(xué)習(xí)或協(xié)作學(xué)習(xí)來解決計算機輔助診斷系統(tǒng)存在的問題。
AI診斷系統(tǒng)的開發(fā)仍面臨著諸多難點,自動化診斷是其主流發(fā)展方向之一,通過建立數(shù)據(jù)采樣、數(shù)據(jù)分析、數(shù)據(jù)產(chǎn)出等自動化流程,可進一步實現(xiàn)技術(shù)落地和推廣,該技術(shù)的進一步發(fā)展可以輔助進行肺部支氣管擴張的甄別篩查工作,減輕了醫(yī)師的工作難度,對緩解醫(yī)療資源不足有著重要意義。