廣東工業(yè)大學(xué)自動(dòng)化學(xué)院 連偉烯
?
基于SAE的MRI圖像檢索系統(tǒng)
廣東工業(yè)大學(xué)自動(dòng)化學(xué)院 連偉烯
【摘要】提出了一種根據(jù)醫(yī)學(xué)專有名詞作為語義對具體人體組織進(jìn)行檢索的MRI圖像檢索方法。在構(gòu)建圖像檢索系統(tǒng)的特征提取方法上,采用了稀疏自動(dòng)編碼器模型,并通過多個(gè)稀疏自動(dòng)編碼器的堆疊構(gòu)建了深度學(xué)習(xí)網(wǎng)絡(luò),最后采用BP分類器構(gòu)建了整個(gè)MRI圖像檢索系統(tǒng)。實(shí)驗(yàn)結(jié)果表明,層疊自動(dòng)編碼器對于MRI圖像的高層特征具有很好的提取能力,同時(shí)避免人工選擇特征提取方法上的主觀性,具有較好的適應(yīng)性。
【關(guān)鍵詞】基于語義的圖像檢索;自動(dòng)編碼器;稀疏編碼;層疊自動(dòng)編碼器
在當(dāng)前情況下,醫(yī)院的影像科獲取到的全部MRI圖像主要是依靠人工方式進(jìn)行分類保存。按照這個(gè)方式在檢索圖像時(shí),在應(yīng)用過程就會(huì)有很多困擾:(1)在一次MRI成像中,我們需要從中找到感興趣區(qū)域,這就需要從這些斷層圖像中找到包含感興趣區(qū)域的圖像,再確定圖像中感興趣區(qū)域的位置。(2)隨著MRI圖像數(shù)據(jù)的膨脹,使得對MRI圖像的管理和存儲越來越困難。
基于語義的MRI圖像檢索系統(tǒng)是一種直觀、便捷、靈活的工具。利用醫(yī)學(xué)名詞上的語義定義,可迅速從MRI圖像中找到所屬的感興趣區(qū)域。首先,通過檢索可從眾多MRI圖像中找到包含對應(yīng)感興趣區(qū)域的MRI圖像。其次,從這些MRI圖像中標(biāo)注出該感興趣區(qū)域。這些都有利于醫(yī)生在診斷工作中減少相關(guān)工作量。本文提出一種基于層疊自動(dòng)編碼器(SAE,Stacked AutoEncoder)的MRI圖像檢索方法,該方法使用SAE作為圖像的特征提取工具,再結(jié)合BP分類器完成語義上的分類檢索工作,并進(jìn)行相關(guān)的實(shí)驗(yàn)分析工作。
本文的圖像檢索系統(tǒng)主要分為兩個(gè)模塊:特征提取和查詢模塊[2]。如圖1所示。該圖像檢索系統(tǒng)主要完成兩個(gè)方面的內(nèi)容:(1)對圖像數(shù)據(jù)中包含對應(yīng)語義的MRI圖像的檢索;(2)對檢索結(jié)果的MRI圖像對應(yīng)語義內(nèi)容的區(qū)域進(jìn)行標(biāo)識。其中,預(yù)處理步驟包括:(1)對不同尺寸大小的MRI圖像進(jìn)行格式和尺寸大小的統(tǒng)一;(2)對MRI圖像進(jìn)行分塊。特征提取步驟是對分塊圖像的特征提取,本文采用無監(jiān)督學(xué)習(xí)的SAE方法進(jìn)行特征提取并建立模型。在查詢模塊中,用戶使用指定的語義對欲查詢圖像數(shù)據(jù)進(jìn)行查詢,圖像數(shù)據(jù)在建立的特征提取模型進(jìn)行特征提取,并采用BP網(wǎng)絡(luò)對所提取的特征分類,最終返回符合語義的MRI圖像。
圖1 圖像檢索系統(tǒng)結(jié)構(gòu)
1.1SAE特征提取方法
SAE是一種無監(jiān)督學(xué)習(xí)的深度學(xué)習(xí)網(wǎng)絡(luò)模型。通過對若干自動(dòng)編碼器(AE,AutoEncoder)的級聯(lián)構(gòu)成多層神經(jīng)網(wǎng)絡(luò),它的輸出可看作是輸入數(shù)據(jù)經(jīng)過多次降維后的特征表示[3-5]。AE是一種單隱層無監(jiān)督學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),通過對輸入信號的近似復(fù)現(xiàn),從而得到輸入信號的表示,即特征。
利用線性代數(shù)中基的概念,即:
在自動(dòng)編碼器的基礎(chǔ)上加上一些L1的Regularity限制,這時(shí)公式(1)可以寫為:
此時(shí)我們得到即為稀疏自動(dòng)編碼器(Sparse AutoEncoder)。
把有m個(gè)輸入向量的稀疏編碼代價(jià)函數(shù)定義為:
其中第一項(xiàng)是重構(gòu)輸入數(shù)據(jù)x的代價(jià)值,它迫使稀疏編碼算法能為輸入向量x提供一個(gè)高擬合度的線性表達(dá)式,第二項(xiàng)即“稀疏懲罰”項(xiàng),S(.)是一個(gè)稀疏代價(jià)函數(shù),由它來對遠(yuǎn)大于零的進(jìn)行“懲罰”,它使x的表達(dá)式變得“稀疏”。常量λ是一個(gè)變換量,由它來控制這兩項(xiàng)式子的相對重要性。在實(shí)際中,稀疏代價(jià)函數(shù)S(.)的普遍選擇是L1范式代價(jià)函數(shù)及對數(shù)代價(jià)函數(shù)。
為了使分解系數(shù)中只有少數(shù)系數(shù)遠(yuǎn)遠(yuǎn)大于0,而不是大部分系數(shù)都比0大。我們對基集合中的值也做了一個(gè)約束。因此,在公式(3)的基礎(chǔ)上,要滿足:
對于無稀疏約束時(shí)網(wǎng)絡(luò)的損失函數(shù)表達(dá)式如下:
其中,第一項(xiàng)和第二項(xiàng)分別為輸入輸出的均方誤差約束和權(quán)值衰減約束。m,分別表示樣本數(shù),網(wǎng)絡(luò)層數(shù)和l層單元數(shù)W,b分別表示層間連接權(quán)重和l層的單元偏置。對于有稀疏約束的網(wǎng)絡(luò),需要在損失函數(shù)中加入一個(gè)額外的懲罰因子,這個(gè)罰因子基于相對熵 (KLdivergence):
1.2SAE結(jié)合BP分類器的MRI圖像檢索實(shí)現(xiàn)
SAE作為MRI圖像的特征提取工具,本身不具備分類檢索功能,要實(shí)現(xiàn)該功能,需要分類器對體征提取結(jié)果進(jìn)行分類[7]。本文采用了BP神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)MRI圖像檢索的分類工作。利用SAE提取圖像的底層特征作為網(wǎng)絡(luò)的輸入,用語義期望值作為網(wǎng)絡(luò)的輸出,并用BP算法來訓(xùn)練該網(wǎng)絡(luò)。具體步驟如下:
(1)用大量無標(biāo)簽原始輸入數(shù)據(jù)作為輸入,利用稀疏自動(dòng)編碼器訓(xùn)練出第一個(gè)隱含層結(jié)構(gòu)的網(wǎng)絡(luò)參數(shù),并將用訓(xùn)練好的參數(shù)算出第一個(gè)隱含層的輸出。
(2)根據(jù)SAE隱含層的層數(shù)重復(fù)步驟1,即將上一個(gè)隱含層的輸出作為下一個(gè)隱含層的輸入,逐層訓(xùn)練。
(3)將SAE最終的輸出作為多分類器BP網(wǎng)絡(luò)的輸入,然后利用原始數(shù)據(jù)標(biāo)簽來訓(xùn)練出BP的網(wǎng)絡(luò)參數(shù)。
(4)計(jì)算隱含層和BP分類器整個(gè)網(wǎng)絡(luò)的代價(jià)函數(shù),以及整個(gè)網(wǎng)絡(luò)的對每個(gè)參數(shù)的偏導(dǎo)函數(shù)值。
(5)用步驟1、2和3的網(wǎng)絡(luò)參數(shù)作為整個(gè)網(wǎng)絡(luò)初始化的值,然后利用梯度下降法迭代求出代價(jià)函數(shù)最小值附近的參數(shù)值,作為整個(gè)網(wǎng)絡(luò)的最優(yōu)參數(shù)值。
本文訓(xùn)練和測試數(shù)據(jù)圖像采用十組真實(shí)病人的大腦MRI圖像。我們對MRI圖像進(jìn)行分塊,并對分塊分為眼球、腦干、面聽神經(jīng)、小腦、輪廓、其他這5類語義進(jìn)行標(biāo)注,共有35604個(gè)數(shù)據(jù),其中3000個(gè)作為測試數(shù)據(jù)。
實(shí)驗(yàn)分別構(gòu)建了包含三層、四層和五層AE所級聯(lián)構(gòu)成隱含層的基于SAE的MRI圖像檢索系統(tǒng)。其中,三層隱含層的節(jié)點(diǎn)數(shù)分別為1500、800、200,四層隱含層的節(jié)點(diǎn)數(shù)分別為1500、800、400、200,五層隱含層的節(jié)點(diǎn)數(shù)分別為1500、1200、800、400、200。測試的結(jié)果如表2.1所示。
表2.1
實(shí)驗(yàn)結(jié)果表明,基于SAE的MRI圖像檢索系統(tǒng)能夠達(dá)到較好的準(zhǔn)確率,同時(shí)也表明了準(zhǔn)確率隨著網(wǎng)絡(luò)隱含層層數(shù)的增加而增加,這體現(xiàn)了SAE深度學(xué)習(xí)網(wǎng)絡(luò)可通過學(xué)習(xí)一種深層非線性網(wǎng)絡(luò)結(jié)構(gòu),實(shí)現(xiàn)復(fù)雜函數(shù)逼近,表征輸入數(shù)據(jù)分布式表示,并展現(xiàn)了強(qiáng)大的從少數(shù)樣本集中學(xué)習(xí)數(shù)據(jù)集本質(zhì)特征的能力[8]。隨著層數(shù)的增加,將樣本在原空間的特征表示變換到一個(gè)新特征空間,形成更加抽象的高層表示屬性類別或特征,從而使分類或預(yù)測更加容易。
本文提出了采用基于深度學(xué)習(xí)的SAE網(wǎng)絡(luò)作為MRI圖像的無監(jiān)督特征提取工具,并進(jìn)行了相關(guān)的實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,采用深度學(xué)習(xí)的SAE網(wǎng)絡(luò)能夠避免人工選取特征提取方法,從層疊的深層網(wǎng)絡(luò)中提取到更高層次的特征表達(dá),由于其無監(jiān)督的特性,因而具有較強(qiáng)的適應(yīng)性,結(jié)合BP分類器,能夠達(dá)到很好的檢索效果。
參考文獻(xiàn)
[1]N.Kumaran,R.Bhavani.MRI Image Retrieval Using Gabor Wavelet Based Texture Features.International Journal of advanced research in Science and Technology.Volume.2, Issue 1,2013,pp40-45.
[2]馬冬梅.基于深度學(xué)習(xí)的圖像檢索研究[D].內(nèi)蒙古大學(xué),2009.
[3]G.E.Hinton,R.R.Salakhutdinov.The.Reducing the dimensionality of data with neural networks.Science 28 July 2006:454-455.
[4]杜騫.深度學(xué)習(xí)在圖像語義分類中的應(yīng)用[D].華中師范大學(xué),2014.
[5]林少飛,盛惠興,李慶武.基于堆疊稀疏自動(dòng)編碼器的手寫數(shù)字分類[J].微處理機(jī),No.1 Feb.,2015,47-51.
[6]敖道敢.無監(jiān)督特征學(xué)習(xí)結(jié)合神經(jīng)網(wǎng)絡(luò)應(yīng)用于圖像識別[D].華南理工大學(xué),2014.
[7]曲建嶺,杜辰飛,邸亞洲,高峰,郭超然.深度自動(dòng)編碼器的研究與展望[J].計(jì)算機(jī)與現(xiàn)代化,2014,(8):128-129.