何炎柏
1引言
當前醫(yī)學的診斷給影像處理領(lǐng)域尤其是醫(yī)學影像的分割提出了更高的要求。近年來,深度學習在醫(yī)學影像處理上取得了顯著成果,其中卷積神經(jīng)網(wǎng)絡在醫(yī)學影像分割上的表現(xiàn)具有代表意義。列舉了用于醫(yī)學影像分割的卷積神經(jīng)網(wǎng)絡架構(gòu)及其優(yōu)化的發(fā)展歷程,并對深度學習在醫(yī)學影像上未來的發(fā)展方向與面臨的挑戰(zhàn)進行了展望與討論。
如今醫(yī)學影像處理主要集中表現(xiàn)在病變檢測、圖像分割、圖像配準及圖像融合4個方面。其中,醫(yī)學影像分割這一新應用領(lǐng)域引起了廣泛關(guān)注,尤其是卷積神經(jīng)網(wǎng)絡在醫(yī)學影像分割領(lǐng)域的表現(xiàn)是當前各種圖像分割算法中表現(xiàn)最佳的。自2015年糖尿病視網(wǎng)膜病變監(jiān)測挑戰(zhàn)賽中,參賽者對于眼底影像病變失明進行識別檢測,其中排名靠前的隊伍使用的大多是卷積神經(jīng)網(wǎng)絡的方法。同樣,隨著時間的發(fā)展,腦部腫瘤分割挑戰(zhàn)賽BraTS中,獲得第一名的參賽者網(wǎng)絡基本架構(gòu)也是基于卷積神經(jīng)網(wǎng)絡的編碼器-解碼器架構(gòu)。本文對于卷積神經(jīng)網(wǎng)絡在醫(yī)學影像分割上的應用與發(fā)展進行介紹。
2卷積神經(jīng)網(wǎng)絡
卷積神經(jīng)網(wǎng)絡是一個多層的神經(jīng)網(wǎng)絡,每一層都由多個平面組成,而每個平面由多個獨立神經(jīng)元組成。卷積神經(jīng)網(wǎng)絡之所以適合計算機視覺應用的神經(jīng)網(wǎng)絡,是因為它們可以使用局部操作對表征進行了分層抽象。能夠推動卷積架構(gòu)在計算機視覺領(lǐng)域的成功,主要有兩大關(guān)鍵設計思想。
首先是卷積神經(jīng)網(wǎng)絡利用了圖像的2D結(jié)構(gòu),并且在相鄰區(qū)域內(nèi)像素高度相關(guān),這就使得卷積神經(jīng)網(wǎng)絡不需要使用所有像素單元之間的一對一連接,而可以使用分組的局部連接。其次卷積神經(jīng)網(wǎng)絡架構(gòu)依賴于特征共享,每個通道(即輸出特征圖)是在所有位置使用同一個過濾器進行卷積而生成的。
3醫(yī)學影像分割。
在醫(yī)學影像處理與分析領(lǐng)域中,復雜而關(guān)鍵的步驟就是醫(yī)學影像分割,其目的是將醫(yī)學圖像中具有某些特殊含義的部分分割出來,并提取相關(guān)特征,為臨床診療和病理學研究提供可靠的依據(jù),輔助醫(yī)生做出更為準確的診斷。利用卷積神經(jīng)網(wǎng)絡等深度學習算法去優(yōu)化圖像分割算法是當前受到廣泛關(guān)注的研究方向。
近年來,卷積神經(jīng)網(wǎng)絡在醫(yī)學影像(MRI、CT、X射線等)分割領(lǐng)域與輔助診斷上取得巨大成功。例如,乳房X射線圖像中腫瘤分割的框架,結(jié)合了深度卷積網(wǎng)絡具有優(yōu)良特征表達能力的特性,將其整合到框架中作為勢函數(shù),用于基于像素點的和像素點之間邊的勢能轉(zhuǎn)換。卷積神經(jīng)網(wǎng)絡在醫(yī)學影像分割上的準確率是不容置疑的,并且當下依然有大量研究對卷積神經(jīng)網(wǎng)絡的架構(gòu)進行優(yōu)化,意圖繼續(xù)提高其準確率。除了對于分割的準確率的關(guān)注,診斷速度也是醫(yī)學影像處理中的一大關(guān)鍵點。研究人員對于卷積神經(jīng)網(wǎng)絡進行不斷優(yōu)化,縮短掃描圖像得到結(jié)果的時間。在乳腺癌的MRI診斷中,就使用了快速掃描卷積神經(jīng)網(wǎng)絡(FCNN)的方法診斷。主要是通過將最大池化層重新排列的方法去減少冗余計算,在不減少分割精度的條件下,大幅提高了圖像分割速度,滿足了實時診斷的需求。Olaf Ronneberger等提出的U-Net,是基于FCN的一種語義分割網(wǎng)絡,適合醫(yī)學圖像分割。因為其在醫(yī)學圖像分割領(lǐng)域的優(yōu)秀表現(xiàn),也已經(jīng)成為大多做醫(yī)學影像處理語義分割任務的基本架構(gòu),同時也啟發(fā)了大量的研究者思考U型分割網(wǎng)絡。針對卷積神經(jīng)網(wǎng)絡模塊設計,近年也提出利用空洞卷積的特征金字塔用于分割相關(guān)問題。
4對于未來挑戰(zhàn)的思考
卷積神經(jīng)網(wǎng)絡在醫(yī)學影像處理上可以很好地輔助醫(yī)生進行診斷。其未來的發(fā)展方向,大部分集中在網(wǎng)絡結(jié)構(gòu)設計、三維數(shù)據(jù)分割模型設計和損失函數(shù)設計三方面。通過對各種文獻的研讀,發(fā)現(xiàn)深度學習在醫(yī)學影像處理上也面臨著如下的挑戰(zhàn)。
第一是醫(yī)學影像處理對于圖像的精度要求極高。相關(guān)的深度學習模型使用時,通常會先對于圖像所得的數(shù)據(jù)進行預處理,而后搭建相關(guān)網(wǎng)絡,當達到特定精度后通過調(diào)整參數(shù)再繼續(xù)運行網(wǎng)絡。若通過調(diào)參,模型表現(xiàn)出更佳的性能,則無法判定究竟是得到了更佳性能還是因為過擬合的發(fā)生。
第二是醫(yī)學影像的獲取來源于醫(yī)療設備,而醫(yī)學圖像和相關(guān)信息的標準,CT/MRI機器的標注或者性能不統(tǒng)一。這可能會導致深度學習訓練好的模型只適用于特定的場景,又因為網(wǎng)絡不具有泛化能力,而容易從圖像中得到錯誤的特征。不過U-Net在對抗過擬合上可以得到一個較均衡的折中點,所以對于該挑戰(zhàn)具有較理想的表現(xiàn)。但是未來制定并實施統(tǒng)一醫(yī)學圖像標準,依然是極其必要的。
第三是不同的醫(yī)療設備會生成獨特且難以檢測的噪聲模式。這會對于模型推理的準確性造成影響,也使得模型難以應用到不同型號的設備上,從側(cè)面加大了收集設備產(chǎn)生數(shù)據(jù)的困難。
5結(jié)束語
從深度學習中的卷積神經(jīng)網(wǎng)絡的定義與結(jié)構(gòu)出發(fā),介紹了卷積神經(jīng)網(wǎng)絡在醫(yī)學影像分割應用,涉及到FCN、U-Net等網(wǎng)絡架構(gòu)與應用,最后講述了面臨的挑戰(zhàn)進行分析。當前人工智能的迅猛發(fā)展,深度學習與神經(jīng)網(wǎng)絡作為其兩大核心技術(shù)一定可以有更多的突破,并在智能醫(yī)療方面起到輔助與支持的作用。