李昊軒
(山東省龍口第一中學(xué),山東煙臺(tái),264000)
深度學(xué)習(xí)是近十年興起并飛速發(fā)展的一種仿生學(xué)技術(shù)。關(guān)于深度學(xué)習(xí),其起源是人工神經(jīng)網(wǎng)絡(luò),但由于其的諸多弊端,漸漸沒(méi)落。直到2006年,隨著科技的進(jìn)一步發(fā)展和完善,一位學(xué)者提出深度學(xué)習(xí)這一思想,進(jìn)而受到更多學(xué)者專家重視,深度學(xué)習(xí)開(kāi)始興起,慢慢的深度學(xué)習(xí)被廣泛應(yīng)用到包含計(jì)算機(jī)計(jì)算處理、部分商業(yè)等眾多領(lǐng)域且皆獲得可觀成績(jī)。深度學(xué)習(xí)相對(duì)傳統(tǒng)淺層學(xué)習(xí)會(huì)更加的復(fù)雜,因?yàn)槠鋵哟谓Y(jié)構(gòu)會(huì)更深一些,也正是因此,有利于其更好的對(duì)某些特征有重點(diǎn)進(jìn)行學(xué)習(xí)。將大量的數(shù)據(jù)輸入,使計(jì)算機(jī)進(jìn)行深度學(xué)習(xí)的訓(xùn)練,進(jìn)而便可提取獲得這些數(shù)據(jù)中相同特征。由深度學(xué)習(xí)完成這一任務(wù),相較于傳統(tǒng)方法將會(huì)更容易。由于屢次立下大功,深度學(xué)習(xí)已成為業(yè)內(nèi)學(xué)者關(guān)注熱點(diǎn),前景明亮廣闊,這將會(huì)再為機(jī)器學(xué)習(xí)領(lǐng)域翻開(kāi)一頁(yè)新篇章。
圖像分割是把圖像內(nèi)容作分類、作描述、作識(shí)別等作為任務(wù)的圖像分析的最重要基礎(chǔ),所有的特征提取、目標(biāo)識(shí)別、圖像識(shí)別和場(chǎng)景解析等圖像有關(guān)工作都需要先保證好它們上一步圖像分割的質(zhì)量。此項(xiàng)技術(shù)從從20世界70年代左右就引起領(lǐng)域?qū)W者們的高度重視,發(fā)展至今,閾值分割法[1]、邊緣檢測(cè)法、區(qū)域提取分割法和結(jié)合特定理論工具4大類型的圖像分割方式是最為當(dāng)代學(xué)者所熟知和常用的。但該課題還是擁有一定難度和深度。
圖像處理往往是離不開(kāi)圖像分割的。近年來(lái)涌現(xiàn)出一大批新的不同的分割方法,但是始終沒(méi)有找到一個(gè)既通用又足夠便捷方法,學(xué)界也沒(méi)能有明確的判斷分割結(jié)果好壞的合理標(biāo)準(zhǔn)[2]。
一張醫(yī)學(xué)圖像所包含的信息量是十分巨大的,但是當(dāng)醫(yī)生做診斷的時(shí)候,只需要其中一小部分組織或某一片特點(diǎn)區(qū)域的數(shù)據(jù),進(jìn)行分析和斷定病變情況。然而由于檢測(cè)設(shè)備和設(shè)備工作原理的不同,醫(yī)學(xué)圖像上難免會(huì)出現(xiàn)噪點(diǎn),如果噪點(diǎn)過(guò)多,將會(huì)對(duì)做診斷的醫(yī)生造成極大的阻礙,且增大的誤診幾率,誤診的后果于醫(yī)于患都是難以承擔(dān)的[3]。于是將圖像分割應(yīng)用到醫(yī)學(xué)領(lǐng)域引起計(jì)算機(jī)界和醫(yī)學(xué)界學(xué)者們的高度關(guān)注。以下列出醫(yī)學(xué)圖像分割幾點(diǎn)優(yōu)勢(shì):
(1)將人體內(nèi)器官,組織,病變部位等從醫(yī)學(xué)圖像中分割出來(lái),并對(duì)其進(jìn)行尺寸距離進(jìn)行精準(zhǔn)測(cè)量,將對(duì)醫(yī)生準(zhǔn)確確診進(jìn)行病狀分析,為患者高效準(zhǔn)確作出治療方案提供技術(shù)支持。
(2)為人體內(nèi)的三維重建提供材料素材,進(jìn)而在手術(shù)過(guò)程中為醫(yī)生提供輔助,可大大減少手術(shù)風(fēng)險(xiǎn),為醫(yī)生手術(shù)時(shí)減輕負(fù)擔(dān)。
(3)醫(yī)學(xué)圖像分割還可去除圖像中大量無(wú)用信息,只將有需求部分分割出來(lái)。這可以在不壓縮圖像的基礎(chǔ)上,減少圖片的數(shù)據(jù)數(shù)量,提高了效率和醫(yī)療水平。
閾值分割法是最早、最簡(jiǎn)單的一種分割方法。這里主要有兩種方法:其一、圖像中要識(shí)別物與背景在灰度值上差異懸殊,這時(shí)就該采用全局閾值分割的方法[4]。其二,當(dāng)圖像各個(gè)部分灰度差異并不明顯或圖像多處灰度值相當(dāng)?shù)臅r(shí)候,就該用局部的閾值分割取代全局的閾值分割。
對(duì)于閾值分割來(lái)說(shuō),其優(yōu)點(diǎn)是計(jì)算過(guò)程避免了其他方式的冗雜,進(jìn)行運(yùn)算工作的速度大大提高;但凡事皆有兩面性,其缺點(diǎn)也很明顯,主要表現(xiàn)為灰度值差異不明顯時(shí)分割不當(dāng),抗噪性能差。
邊緣檢測(cè)分割法是通過(guò)檢測(cè)邊界的方法來(lái)進(jìn)行的圖像分割[5]。由于一張圖片中灰度突變最明顯的地方在不同區(qū)域的邊緣,利用這一點(diǎn)便可進(jìn)行圖像分割。利用邊緣檢測(cè)分割法的要點(diǎn)在于協(xié)調(diào)好檢測(cè)精度和抗噪性能的相互作用。
基于區(qū)域的圖像分割的操作原理是通過(guò)連接輸入原圖像中大量相似像素點(diǎn),通過(guò)后續(xù)處理生成分割結(jié)果。其優(yōu)點(diǎn)是分割后的圖像在空間上是可以保證連續(xù)的,分割空間大。為人熟知的主要有區(qū)域生長(zhǎng)和區(qū)域合并與分離的分割方法。該方法也有缺點(diǎn),對(duì)大區(qū)域分割速度慢,抗噪性能差,可能過(guò)度分割。
綜合上文所述,這些傳統(tǒng)的方法進(jìn)行的圖像分割雖各有優(yōu)點(diǎn),但是這些圖像分割方法的弊端也不容小覷,但是基于深度學(xué)習(xí)的圖像分割方法卻可以將優(yōu)點(diǎn)最大化,相對(duì)于傳統(tǒng)方法大大縮小了其局限性影響。
2015年UC Berkeley的Jonathan Long等人提出了全卷積神經(jīng)網(wǎng)絡(luò)(FCN)[1]應(yīng)用到圖像分割領(lǐng)域。FCN由此誕生。
全卷積神經(jīng)網(wǎng)絡(luò)(FCN)與卷積神經(jīng)網(wǎng)絡(luò)(CNN)差別之處就在于全卷積神經(jīng)網(wǎng)絡(luò)(FCN)將卷積神經(jīng)網(wǎng)絡(luò)經(jīng)過(guò)卷積、池化的全連接層轉(zhuǎn)化成一個(gè)個(gè)卷積層。
我們可以知道,在卷積神經(jīng)網(wǎng)絡(luò)過(guò)程中,第1層到第5層皆為我們熟悉的卷積層,后面的第6層和第7層是擁有一定長(zhǎng)度的一維向量,到了第8層時(shí),則轉(zhuǎn)變?yōu)橐惠^短的一維向量,進(jìn)而通過(guò)全聯(lián)接層+softmax輸出結(jié)果。而FCN則是把最后3層皆轉(zhuǎn)為卷積層,這就意味著該方法是由卷積層組成的,而不存在CNN中一維向量,全卷積神經(jīng)網(wǎng)絡(luò)網(wǎng)絡(luò)(FCN)的名稱也就由此而來(lái)。
根據(jù)圖像,我們不難發(fā)現(xiàn),多次的卷積和池化是會(huì)犧牲圖像大小、圖像分辨率的。那么FCN應(yīng)該怎樣在這種情況下繼續(xù)完成圖像中各個(gè)像素點(diǎn)相關(guān)的分類呢?為了解決這個(gè)重大問(wèn)題,F(xiàn)CN又使用了upsample(上采樣)的方法。簡(jiǎn)單來(lái)說(shuō),即池化的逆過(guò)程,所以池化也可以說(shuō)為下采樣。既然池化的結(jié)果是數(shù)據(jù)的數(shù)量變少,那么不難理解上采樣起到的效果就是讓數(shù)據(jù)的數(shù)量變大,以起到解決問(wèn)題的目的。
圖1為上采樣示意圖。
作者在原論文中首先嘗試將第五層輸出反卷積到原圖的大?。ㄋM(jìn)行的是32倍放大),但是該輸出結(jié)果是不夠達(dá)到高度精確這一標(biāo)準(zhǔn)的,細(xì)節(jié)也有損失之處。面對(duì)這一問(wèn)題,作者將反卷積過(guò)程又?jǐn)U展到了第四層和第三層,最終結(jié)果不夠精準(zhǔn)精細(xì)的問(wèn)題也大大減輕了。
圖1 上采樣示意圖
請(qǐng)看下圖有關(guān) 32倍,16倍,8倍,三個(gè)上采樣過(guò)程如圖2所示。圖3為不同上采樣的FCN結(jié)果。
圖2 FCN中的上采樣
圖3 不同上采樣的結(jié)果
首先輸入的原圖像再進(jìn)行多次卷積操作和池化的操作(通過(guò)池化的過(guò)程可以使圖像縮小為原大小的一半)。圖中的nx為特征圖進(jìn)行放大n倍,而不是代指其有n個(gè)特征圖。
圖4中第一行代表FCN-32s;第二行代表FCN-16s;第三行代表FCN-8s。
圖4 FCN示意圖
現(xiàn)在通過(guò)第一行,我們介紹上采樣具體過(guò)程,只需關(guān)注第一行即可。這里有5個(gè)池化層,卷積7的特征圖為原圖像的1/32,在FCN的卷積中圖像大小不會(huì)受到影響而改變,像素難免會(huì)有損失,但是特征圖基本上是不會(huì)受到太大影響的。再通過(guò)32x的下采樣,圖像大小重新變回32x32。在這里加入一卷積將其大小進(jìn)行擴(kuò)大。若此卷積核的大小也恰好是為32,那需要反饋訓(xùn)練1024(32x32)個(gè)權(quán)重便可以完成一個(gè)32x的上采樣,也就是反卷積。
類似的,我們也就能了解到16倍和8倍操作的具體過(guò)程,原理同32倍是大同小異的。
通過(guò)三種上采樣結(jié)果的對(duì)比,我們不難發(fā)現(xiàn)得到的結(jié)果不再過(guò)度模糊,慢慢條理清晰,便于分辨。
將FCN與傳統(tǒng)的CNN方法對(duì)比,我們可以發(fā)現(xiàn)FCN的優(yōu)點(diǎn):一是其對(duì)輸入的圖片的尺寸大小沒(méi)有要求,在訓(xùn)練時(shí),可以放入不同尺寸的照片,可以大大增加選擇要訓(xùn)練的對(duì)象,更加便捷。二是FCN更加高效,避免了CNN對(duì)相似像素點(diǎn)計(jì)算卷積過(guò)程的大量重復(fù)。
萬(wàn)物皆有缺陷,F(xiàn)CN并不完美,一是其結(jié)果還是達(dá)不到我們追求的高度精準(zhǔn),雖然FCN-8s對(duì)比于FCN-32s有了很大提高,然而其結(jié)果仍略有模糊和平滑,對(duì)其中種種細(xì)節(jié)無(wú)法達(dá)到高度敏感。二是缺乏一定的空間一致性。
根據(jù)上文的描述,我們將利用全卷積網(wǎng)絡(luò)對(duì)人體內(nèi)拍攝到的圖片進(jìn)行語(yǔ)義分割。我們可以對(duì)人體內(nèi)的器官逐一進(jìn)行分割,從而可以讓機(jī)器了解人體內(nèi)部的結(jié)構(gòu)。然而特別之處在于我們會(huì)在語(yǔ)義分割的過(guò)程中,將疾病檢測(cè)的信息融入到圖像分割中,進(jìn)而疾病產(chǎn)生的部分單獨(dú)地在圖像中以單獨(dú)的語(yǔ)義標(biāo)注出來(lái),這樣的做法可以利于醫(yī)生在后續(xù)的檢查中清晰的看到疾病的位置,節(jié)約了醫(yī)生大量的精力和時(shí)間且大大減少誤診誤判造成的損失和影響。由此看來(lái),基于深度學(xué)習(xí)的圖像分割定能在醫(yī)學(xué)領(lǐng)域再次大放光彩!
本文將深度學(xué)習(xí)用于醫(yī)學(xué)圖像分割,理論上來(lái)講這可以極大地減輕醫(yī)生的人力和物力方面的支出。本文沒(méi)有做出完整的系統(tǒng),只是做了理論上的設(shè)計(jì)。后續(xù)的工作應(yīng)該去實(shí)際設(shè)計(jì)一套系統(tǒng)。