李炎
(北方民族大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院,銀川 750021)
傳統(tǒng)的醫(yī)學(xué)圖像檢索應(yīng)用中的相關(guān)模型存在以下幾個(gè)問題:(1)該領(lǐng)域只有少數(shù)研究需要進(jìn)行徹底的分析;(2)缺乏大規(guī)模藥物基準(zhǔn)數(shù)據(jù)集的獲?。唬?)即使通過訪問大型醫(yī)療數(shù)據(jù)集,也可能存在與數(shù)據(jù)分布有關(guān)的不平衡問題[1]。因此,如何設(shè)計(jì)深度學(xué)習(xí)模式來解決上述問題是重要的。在本文中,提出了利用深度神經(jīng)網(wǎng)絡(luò)彌合機(jī)器學(xué)習(xí)模型與人類操作員之間的語義鴻溝的方法[2]。
在本文中提出了一個(gè)不同訓(xùn)練的并行深層網(wǎng)絡(luò)的通用方法。本方法主要有兩個(gè)方面:(1)在非常不平衡的醫(yī)學(xué)基準(zhǔn)數(shù)據(jù)集上引入健壯的檢索系統(tǒng),該系統(tǒng)不僅效率高,而且也超越了文獻(xiàn)中的最佳準(zhǔn)確性和性能。(2)提出一個(gè)縮小的搜索空間,使用一個(gè)具有三個(gè)卷積網(wǎng)絡(luò)的集合模型,然后進(jìn)行三個(gè)轉(zhuǎn)換來檢索相關(guān)信息,從而提高醫(yī)療應(yīng)用的檢索精度。
LBP是一個(gè)眾所周知的視覺描述符,具有較低的計(jì)算消耗,并且具有相對(duì)不變性[3]。LBP已被廣泛應(yīng)用于醫(yī)療領(lǐng)域,通常將整個(gè)圖像分成區(qū)域(稱為單元格),并在每個(gè)像素周圍考慮圓形邊界。如果鄰域的值大于中心值,則將其替換為1,否則替換為0。LBP特征向量通過計(jì)算單元格上的可能狀態(tài)的對(duì)稱圖(每個(gè)值的迭代)來獲得。設(shè)P是相鄰像素的數(shù)量,R是半徑,則LBP算子定義為:
HOG是另一種類型的視覺特征描述符[4]。它可以計(jì)算整個(gè)圖像相對(duì)于x和y的梯度,并構(gòu)建梯度方向直方圖。然后在單元的直方圖上范數(shù)正態(tài)化。該HOG特征向量定義如下:
Iy,和Ix,是圖像I相對(duì)于y和x的梯度,x是每個(gè)像素及其左側(cè)的水平區(qū)分,y是每個(gè)像素之間的差異。LBP和HOG的組合可以使檢測的性能顯著提升。
Radon通過公式(3)整體轉(zhuǎn)換來從幾個(gè)θ角度計(jì)算圖像的信息總和。Radon轉(zhuǎn)換可以從不同的角度重建原始圖像,每個(gè)角度(θ)是一個(gè)信號(hào),角度越多就能得到更高亮度的圖像。
(ρ-xcosθ-ysinθ)指的是圖像的灰度強(qiáng)度,δ是三角運(yùn)算符,Radon變換用來重建原始圖像。
本文提出一個(gè)深度學(xué)習(xí)框架的檢索方法包含三個(gè)主要階段:(1)預(yù)處理;(2)收縮搜索空間;(3)基于內(nèi)容的圖像檢索。如圖1所示:
原始IRMA數(shù)據(jù)集的大小和分辨率各不相同,為了避免失真使用零填充,然后圖像調(diào)整到150×150像素創(chuàng)建兩個(gè)增強(qiáng)數(shù)據(jù)集[5]。最后對(duì)使用不同輸入的并行深層解決方案進(jìn)行了實(shí)驗(yàn)結(jié)果如下。
表1 每一階段的結(jié)果
表2 CNN最后一層的置信度與相應(yīng)層IRMA錯(cuò)誤之間的關(guān)系
從表1可以看出已經(jīng)可以將IRMA的誤差降低到166.84,這是所提出模型的五次運(yùn)行的平均值也是目前取得的最佳性能。表2顯示了不同的閾值分別導(dǎo)致不同的IRMA錯(cuò)誤,隨著置信度的提高,檢出零錯(cuò)誤的數(shù)量也會(huì)減少。結(jié)果證明施加高置信度閾值使得集合模型更加穩(wěn)健和準(zhǔn)確。
本文提出由三個(gè)不同訓(xùn)練的CNN組成的并行層次解決方法。首先通過提供一個(gè)小子集來縮小搜索空間,基于LBP、HOG和Radonfeatures的多次篩選,隨后選擇最佳匹配查詢圖像。在IRMA數(shù)據(jù)集上經(jīng)過實(shí)驗(yàn),所提出的方法通過預(yù)處理和PCA改進(jìn)的定制字典方法實(shí)現(xiàn)了最低的錯(cuò)誤率166.84(平均值),低于169.50。