薛 亮,姚光宇
(復旦大學附屬中山醫(yī)院,上海 200032)
醫(yī)學圖像分割作為機器人輔助診療肺部疾病的關鍵技術之一,該技術的發(fā)展對于病癥的識別診斷意義重大。近年來隨著人工智能技術在醫(yī)學圖像分割領域的廣泛應用,使得諸如眼底視網(wǎng)膜疾病識別、胰腺分割識別等領域獲得了極大的發(fā)展。雖然基于深度學習的方法在上述領域獲得了一定的成功,但是該類模型也存在一定的不足例如模型的訓練需要大量人工標注好的數(shù)據(jù)集,人工標注的過程不僅枯燥繁復,而且模型大大的限制了在缺乏大量原始圖像的領域的應用和推廣。
針對上述問題本文提出了基于視覺顯著性檢測的器官分割模型,該模型首先利用視覺顯著性檢測算法對醫(yī)學圖像進行顯著性檢測,然后將檢測結果進行正負樣本劃分,最后將劃分結果輸入到分類器中對分類器進行訓練。該模型克服了深度學習模型需要大量人工標注數(shù)據(jù)的問題,簡化了模型訓練的過程。模型的框架如圖1所示。
圖1 算法框架
在醫(yī)學領域中,由于深度學習模型缺少具有特定圖像特征的圖像數(shù)量,因此我們?yōu)榱双@取足夠多的數(shù)據(jù)對分類器進行訓練,需要根據(jù)現(xiàn)有圖像特征進行圖像增強與圖像變換。圖像變換的方法采用的是基于非剛性變換的方法生成,具體方法參考文獻[1]。
顯著性檢測模型主要分為三步:1)初始顯著性檢測結果的獲取;2)在多源初始顯著性檢測結果中提取前景和背景區(qū)域,并計算區(qū)域特征差異性和連通性;3)顯著性優(yōu)化策略。算法具體的流程描述如圖2所示;
圖2 顯著性檢測框架圖
顯著對象具有多個顯著屬性,在不同圖像中發(fā)揮顯著作用的屬性不同,因此基于單一屬性的顯著性檢測方法往往不能檢測出完整的顯著對象,為了克服這個問題,本文采用基于局部稀有性、全局稀有性以及背景稀有性的方法分別計算圖像的顯著性分布,然后根據(jù)這三個初始顯著性檢測結果獲得本文縮放模型的起始區(qū)域開始執(zhí)行縮放過程。在進行顯著性檢測之前首先對利用圖割方法對圖像進行區(qū)域分割,這樣不僅能將圖像中具有相同特征的區(qū)域進行合并同時還能提高算法的檢測效率,然后提取圖像特征構建超像素的特征描述。三種初始顯著性檢測的方法描述如下:
1)局部稀有性
局部稀有性定義為中心區(qū)域與周圍區(qū)域在特征空間的歐氏距離,針對區(qū)域ri其局部稀有性形式化描述為:
其中dist(ri,rj)定義為區(qū)域在特征空間的歐式距離。
根據(jù)人的視覺注意力機制,位于圖像中心位置區(qū)域的顯著性要高于其他區(qū)域,因此局部顯著性更新為:
其中Xc表示圖像的中心坐標,xi表示區(qū)域內部像素i 的坐標,ωi為區(qū)域ri內部像素的數(shù)量。
2)全局稀有性
全局稀有性是在局部稀有性的基礎上將對比范圍擴大到整張圖像獲得的,針對區(qū)域ri,其全局稀有性形式化描述為
其中φ(ri)表示ri,rj之間像素數(shù)量之比。
3)背景先驗
構建圖像的圖表達G=(V,E),其中V 為圖的頂點本文中由圖像分割后的區(qū)域表示,E 為圖的邊定義兩個區(qū)域之間的連接(本文定義相鄰區(qū)域之間存在邊連接),圖的權值矩陣表達為W,Wi,j定義為:
然后參考文獻[2]采用流形排序算法對圖像區(qū)域進行顯著性排序,流形排序的目標函數(shù)定義為:
為權重參數(shù)為查詢種子參考文獻[2]。求解上述函數(shù)獲得最優(yōu)解:
在多個初始顯著性檢測結果中,存在同一區(qū)域在多個顯著性檢測結果中同時是顯著區(qū)域、同時是背景區(qū)域以及即是背景也是顯著區(qū)域的情況。提取同時為顯著區(qū)域的區(qū)域作為前景種子F、同時是背景區(qū)域的區(qū)域為背景種子B,剩余區(qū)域定義為顯著擴散區(qū)域。在顯著擴散區(qū)域內部,一個區(qū)域可擴散為顯著區(qū)域或者背景區(qū)域是由該區(qū)域的差異性和連通性決定的,下面將詳細對這兩方面的特征進行闡述。
1)差異性
擴散區(qū)中的區(qū)域與前景種子的相似性以及與背景種子的差異性,決定了該區(qū)域屬于顯著對象的可能性,本文中區(qū)域的差異性定義SD(ri)。
其中FDb(ri)表示區(qū)域與背景之間的差異,F(xiàn)Df(ri)表示區(qū)域ri與前景區(qū)域的相似性。FDb(ri),F(xiàn)Df(ri)形式化為:
其中dgeo(ri,rj)=min∑(p,q)∈path(i,j)wp,q表示區(qū)域ri,rj之間的最短測地線距離。
2)連通性
顯著性檢測中,距離越近的區(qū)域對待測區(qū)域的影響越大。根據(jù)這一觀察,本文通過計算待測區(qū)域與前景背景之間的連通性,從另一個角度計算待測區(qū)域的顯著程度。區(qū)域之間的聯(lián)通性定義為:
其中Sbc(ri),Sfc(ri)分別表示區(qū)域ri與背景前景之間的連通性。L(ri)表示區(qū)域ri的周長,α為控制參數(shù)。待測區(qū)域與前景區(qū)域之間的連通性反映了其屬于前景的可能,與背景之間的連通性反映了區(qū)域與背景之間的相似性。因此基于連通性的區(qū)域顯著性計算形式化為:
區(qū)域連通性和差異性從兩個角度反映了其是否為顯著區(qū)域的可能,在顯著性擴散區(qū)域內,上述兩個指標決定了一個區(qū)域是否被重新定義為顯著區(qū)域。由于從單一角度上對擴散區(qū)域進行考量,都無法魯棒性的獲得更好的顯著檢測結果,因此本文區(qū)域被擴散的可能擴散率定義為:
當擴散區(qū)域內區(qū)域的擴散率超過整幅圖像平均擴散率2倍的情況下,執(zhí)行擴散過程。此時該區(qū)域的顯著性定義為:
顯著對象是一個完整的整體,以此顯著對象內部各分部之間應該具有相同的顯著值,然而大部分顯著性檢測算法往往只注重算法的準確率和錯誤率,忽視了顯著對象的一致性表達,為了克服這個問題本文采用元胞自動機理論對顯著性檢測結果進行優(yōu)化?;谠詣訖C理論的優(yōu)化策略形式化描述為:
其中adj(ri)表示ri的鄰接區(qū)域。
其中F*,C*,分別表示為影響矩陣和一致性矩陣。當目標函數(shù)收斂時系統(tǒng)停止更新。
醫(yī)學圖像處理的器官識別分割中,分類器的選擇是一個至關重要的因素。在這里,本文利用支持向量機分類器從眾多圖像特征中獲取器官的分類。在支持向量機模型中如果特征向量在高維空間是非線性可分的,那么支持向量機有助于使它們線性可分。對于支持向量機模型,每個數(shù)據(jù)點都表示為一個m維向量,通過將數(shù)據(jù)點放在一個超平面內實現(xiàn)特征分類。對于分類,將每個輸入轉化為n維空間中的一個點,每個屬性的值被描述為單個超平面坐標的值。分類通過優(yōu)化最能區(qū)分正負樣本的超平面來建立的。本文中顯著性檢測的結果為分類器提供正負樣本數(shù)據(jù)。分類器的分割結果如圖3所示。
圖3 器官分割結果
為了測試本文中所提模型的有效性,我們選擇精確度和召回率評價指標:
精度(P:Precision):該指標反映分割的正確性。
召回率(R:Recall):該指標反映模型的敏感度。
同時選擇ETIS-Larib database作為公共數(shù)據(jù)集為模型的評價提供數(shù)據(jù)支撐。
從表1可以看出本文提出的算法相對于對比算法來說,無論在精確度還是召回率方面都具有比較好的表現(xiàn)。同時由于本文提出的模型采用了顯著性檢測的方法來標記正負樣本,使得模型不僅克服了需要人工標記數(shù)據(jù)集的過程,同時使得模型能提取到更利于器官分割的特征。
表1 各模型在評價數(shù)據(jù)集上的實際分割結果
本文研究了基于視覺顯著性檢測的醫(yī)學圖像分割模型,該模型利用顯著性檢測算法自動區(qū)分正負樣本的能力,克服了機器學習分類模型需要大量人工標注數(shù)據(jù)的問題,簡化了模型訓練的過程。最后通過大量實驗證明,本文提出模型在精確度、召回率以及平均錯誤率方面都具有較好的表現(xiàn)。