石海,楊凡,黃嘉海,周潔
1.南京醫(yī)科大學(xué)第一附屬醫(yī)院 放射科,江蘇 南京 210029;2.泰康仙林鼓樓醫(yī)院 放射科,江蘇 南京 210000;3.南京醫(yī)科大學(xué)附屬蘇州醫(yī)院 放射科,江蘇 蘇州 215001
肺癌是對人類生命健康威脅最大的腫瘤之一,近年來中國肺癌的發(fā)病率居全球首位且逐年遞增[1-2],如何做到肺癌早期診斷是一個挑戰(zhàn)。隨著人工智能的興起,基于計算機技術(shù)的醫(yī)療輔助診斷工具開始應(yīng)用于肺癌鑒別,主要借助圖像分割算法提取肺癌病變區(qū)域。圖像分割是指把圖像分成各具特性的區(qū)域并提取出感興趣目標(biāo)的技術(shù)和過程[3]。幾乎所有的分割算法均是針對圖像灰度的連續(xù)性或不連續(xù)性進(jìn)行操作,比如傳統(tǒng)的閾值法、區(qū)域分割法、邊緣分割法,還有基于特定理論的聚類分析算法、模糊集理論、人工神經(jīng)網(wǎng)絡(luò)模型、遺傳算法等。實驗表明融合特定理論的分割算法優(yōu)于傳統(tǒng)算法的分割效果,其中聚類分析簡單易行,但易受噪聲與灰度不均影響較大,且串行處理能力有限;基于模糊集理論的分割精度較低;遺傳算法穩(wěn)定性強,時間復(fù)雜度較低,但容易過早收斂,陷入局部最優(yōu)解;人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)是一種應(yīng)用類似于大腦神經(jīng)突觸聯(lián)結(jié)的結(jié)構(gòu)進(jìn)行信息處理的數(shù)學(xué)模型,提取圖像的紋理具有較好的并行處理和數(shù)值逼近能力,非常適用于區(qū)分目標(biāo)與背景。
人工神經(jīng)網(wǎng)絡(luò)模型已顯示出對規(guī)則病灶較高鑒別率,其中Irianto等[4]采用基于紋理特征的ANN模型,得到肺癌鑒別準(zhǔn)確率為80%;Kohad等[5]采用蟻群優(yōu)化算法從250幅CT圖像中選取顯著紋理特征輸入ANN模型,獲得98.4%的準(zhǔn)確度和96%的敏感度。當(dāng)病灶區(qū)域不規(guī)則時,紋理分析不足以表征肺癌CT圖像的特性。本研究采用基于分形特征的ANN模型提取肺癌病灶區(qū)域,并與紋理特征的分割效果比較。
本研究提出的肺癌CT圖像分割算法流程,見圖1,其中圖像預(yù)處理采用維納濾波抑制圖像噪聲,模糊增強提高圖像對比度,然后從預(yù)處理圖像中提取紋理和分形特征,最后選取顯著性的特征輸入人工神經(jīng)網(wǎng)絡(luò)模型完成圖像分割。
圖1 肺癌CT圖像分割流程
CT圖像質(zhì)量往往受噪聲污染而下降,維納濾波器是經(jīng)典的線性去噪濾波器,常被用于從加性噪聲中恢復(fù)有用信號,是一種綜合退化函數(shù)和噪聲統(tǒng)計特征進(jìn)行復(fù)原處理的濾波方法。在濾波器輸出與期望輸出之間達(dá)到最小均方誤差,維納濾波可稱作是一個最優(yōu)濾波系統(tǒng)[6]。此外,肺部CT圖像特征由灰度、尺寸、形狀等差異構(gòu)成,容易造成圖像邊界與區(qū)域模糊,傳統(tǒng)的圖像增強方法難以區(qū)分模糊邊界區(qū)域。本研究采用模糊增強算法處理CT圖像不精確和模糊信息,增強圖像對比度。對于尺寸N×N的圖像I,首先計算圖像各像素模糊隸屬度,將圖像從空間域變換到模糊域,然后運用模糊增強算子回歸調(diào)用修正隸屬度,最后通過模糊域反變換將模糊隸屬度轉(zhuǎn)換成新的灰度級,映射到圖像的空間域,分別由公式(1)~(3)給出,其中Fe、Fd為變換系數(shù),pmax(i,j)圖像像素最大的灰度值,p(i,j)為圖像像素灰度值。u(i,j)表示p(i,j)的隸屬度,取值0~1。
紋理是一種反映圖像中同質(zhì)現(xiàn)象的視覺特征,體現(xiàn)物體表面具有緩慢變化或者周期性變化的表面結(jié)構(gòu)組織排列屬性[7]。常用統(tǒng)計方法灰度共生矩陣描述圖像像素灰度關(guān)于方向、相鄰間隔、變化幅度的綜合信息。由于紋理特征能提供獨特的區(qū)域像素空間多樣性信息,容易做到區(qū)分目標(biāo)與背景,適用于肺癌病灶提取。本研究共提取14個紋理特征,但顯著性特征僅有3個,分別為圖像慣性、均值和熵特征,由公式(4)~(6)求得[8]。
分形特征常被用來描述復(fù)雜非規(guī)則的醫(yī)學(xué)圖像特征[9-10],其中分形維度是刻畫非線性圖像復(fù)雜程度、不規(guī)則程度和空間分布變化趨勢的一個重要參數(shù),由差分盒維數(shù)法計算所得。主要思想為:對于一個尺寸為N×N的灰度圖像,把二維圖像視作三維空間的一個表面(i,j,p(i,j)),其中(i,j)代表像素空間位置,p(i,j)代表對應(yīng)位置灰度值,則圖像灰度的變化情況將以空間立體表面的粗糙程度反映,使用不同尺度度量該立體表面,得到的維數(shù)即為圖像分形維度。
具體步驟如下:將N×N圖像分割成s×s塊,2<s<N/2,令r=N/s,每個分塊包含一列s×s×h的盒子,h為單個盒子高度。采用一個5×5窗口在圖像上滑動,移動幅度為r,假設(shè)第(i,j)個分塊中最大灰度值和最小灰度值分別落在第k和l個盒子中,則覆蓋第(i,j)個分塊所需盒子數(shù)由公式(7)計算,覆蓋整幅圖像所需盒子數(shù)由公式(8)給出,此時對應(yīng)的分形維度FD由公式(9)給出。選取一組s,通過線性擬合即可求得分形維度FD。
采用公式(7)~(9)可從模糊增強圖像獲得12個肺癌病灶CT圖像分形特征ff1~ff12,其中10個分形特征具有顯著性。
被提取的紋理特征與分形特征存在冗余,需要從中選取顯著性特征作為人工神經(jīng)網(wǎng)絡(luò)模型的輸入。人工神經(jīng)網(wǎng)絡(luò)是由神經(jīng)元相互連接組成的網(wǎng)絡(luò),是一種模擬動物神經(jīng)網(wǎng)絡(luò)行為特征,進(jìn)行分布式并行數(shù)據(jù)處理的數(shù)學(xué)模型[11-12]。ANN具有自學(xué)習(xí)和自適應(yīng)的能力,可以通過預(yù)先訓(xùn)練樣本和預(yù)測樣本來確定兩者之間潛在的規(guī)律,利用訓(xùn)練階段形成的規(guī)則對新輸入樣本數(shù)據(jù)進(jìn)行推算。最常用的是后向傳播神經(jīng)網(wǎng)絡(luò)模型,能運用輸出結(jié)果產(chǎn)生的誤差進(jìn)行反向推敲,從而逐步優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)和網(wǎng)絡(luò)參數(shù)。結(jié)構(gòu)如圖2所示,最左邊是輸入層,中間是隱藏層,右側(cè)是輸出層,每個節(jié)點代表一種特定的輸出函數(shù),稱為激勵函數(shù),每兩個節(jié)點間的連接都代表一個對于通過該連接信號的加權(quán)值。
圖2 向后傳播神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)
利用ANN對圖像進(jìn)行分割時,將待分割圖像中的所有點聚類為目標(biāo)和非目標(biāo)的像素點,準(zhǔn)確聚類后去除非目標(biāo)像素點,從而得到目標(biāo)圖像。具體步驟如下。
(1)設(shè)有c層神經(jīng)網(wǎng)絡(luò),如在輸入層上加上輸入模式P,并設(shè)第z層y單位輸入的總和為輸出為由z-1層的第j個神經(jīng)元到z層的第x個神經(jīng)元的結(jié)合權(quán)值為Wxy。各個神經(jīng)元的輸入與輸出關(guān)系函數(shù)是f,則各變量間的關(guān)系見公式(10)~(12)。
(2)定義誤差函數(shù)E為期望輸出與實際輸出之差的平方和,見公式(13)。ANN學(xué)習(xí)過程即為求誤差函數(shù)極小值,采用非線形規(guī)劃的梯度下降法求得權(quán)值的更新量,見公式(14),ε為學(xué)習(xí)率,取值0~1。
(3)經(jīng)過較為復(fù)雜的求導(dǎo)運算,求得修正權(quán)值,見公式(15)和(16),完成算法收斂。
ANN性能主要取決于網(wǎng)絡(luò)參數(shù),包括輸入層、隱藏層、輸出層、學(xué)習(xí)速率和動量[13-14],其中低學(xué)習(xí)速率和高動量導(dǎo)致學(xué)習(xí)進(jìn)展緩慢,相反高學(xué)習(xí)速率和地動量導(dǎo)致學(xué)習(xí)停止。隱藏層數(shù)量較低時,導(dǎo)致隱藏層不穩(wěn)定,數(shù)量較高時,導(dǎo)致輸出不穩(wěn)定。為了避免過度擬合,采用公式(17)獲取隱藏層數(shù)量上限Nh,其中Ni表示輸入層神經(jīng)元數(shù)量,No輸出層神經(jīng)元數(shù)量,Ns代表訓(xùn)練樣本數(shù)量,α取值范圍為2~10,輸入和輸出的平均值作為隱藏層下限值。
采用平方根誤差(Mean Square Error,MSE)、敏感度(Sensitivity)、特異度(Specificity)、準(zhǔn)確度(Accuracy)評估本研究人工神經(jīng)網(wǎng)絡(luò)性能[15-17],見公式(18)~(21)。其中,target代表目標(biāo)區(qū)域,actual代表實測區(qū)域,TN、TP、FN和FP分別代表組織真陽性、真陰性、假陽性和假陰性數(shù)量。
本研究CT圖像源自46位男性與36位女性,其中包含48例肺癌患者和34例正常患者,提取出的背景、肺癌區(qū)域和邊界數(shù)量總計1150個,圖像尺寸大小為256×256×63個體素,所有的仿真實驗均在MATLAB R2013a平臺上實現(xiàn)。
圖像預(yù)處理結(jié)果如圖3所示,其中維納濾波消除圖像噪聲,模糊增強后圖像對比度顯著提升。
圖3 圖像預(yù)處理結(jié)果
圖4代表CT肺部圖像紋理和分形特征的特征值,可以看出14個紋理特征中僅3個(tf1,tf2,tf3)正常肺部與肺癌特征值無重疊,12個分形特中有10個(ff11,ff12,ff21,ff22,ff41,ff42,ff51,ff52,ff61,ff62)無重疊特征值,可作為顯著性特征。圖5和圖6分別為紋理特征與分形特征肺癌分類圖像,可以看出病灶被完整地提取。
圖4 正常肺部圖像與肺癌患者的紋理和分形特征值
圖5 顯著紋理特征
圖6 分形顯著特征
本研究獲得的紋理特征與分形特征作為訓(xùn)練數(shù)據(jù),選用多種訓(xùn)練函數(shù),學(xué)習(xí)速率和動量范圍0.3~0.9,帶入公式(15),輸入神經(jīng)元數(shù)目13,包括3個紋理特征,10個分形特征,隱藏層數(shù)1,輸出神經(jīng)元1個,α=2,隱藏神經(jīng)元數(shù)量范圍7~38,采用平方根誤差MSE評估各參數(shù)對ANN性能影響,結(jié)果顯示訓(xùn)練函數(shù)為列文伯格-馬夸爾特反向傳播函數(shù),隱藏神經(jīng)元數(shù)量為20,學(xué)習(xí)速率為0.3,動量為0.9,最大數(shù)目為1000時,ANN性能最佳,供測試階段使用。
圖7表示基于ANN的肺部病灶圖像分割,表1表示基于不同特征定量分析??梢钥闯霰狙芯刻岢龅腁NN算法能準(zhǔn)確快速的提取出肺癌病灶區(qū)域。訓(xùn)練階段靈敏度、特異度和準(zhǔn)確度可達(dá)98.4%(聯(lián)合特征)、100%(分形特征)和98.6%(聯(lián)合特征),同時測試階段對應(yīng)指標(biāo)分別可達(dá)90.9%(聯(lián)合特征)、100%(分形特征)和95.1%(分形特征),可以看出基于分形特征和聯(lián)合特征的定量指標(biāo)優(yōu)于紋理特征。
圖7 CT肺部病灶提取結(jié)果
表1 紋理特征、分形特征和聯(lián)合特征分類的結(jié)果比較(%)
本研究提出一種基于人工神經(jīng)網(wǎng)絡(luò)模型的肺癌CT圖像分割算法,其中維納濾波與模糊增強等預(yù)處理能有效地抑制圖像噪聲,提高圖像對比度;特征值不重疊法能準(zhǔn)確選取顯著的紋理特征和分形特征,平方根誤差能預(yù)測人工神經(jīng)網(wǎng)絡(luò)模型最佳參數(shù),快速準(zhǔn)確提取肺癌病灶區(qū)域,表明本研究提出的肺癌CT圖像分割算法具有可行性和實用性,可作為肺癌輔助診斷。