胡松濤
(河南建筑職業(yè)技術(shù)學(xué)院 河南 鄭州 450000)
圖像分割是提高圖像識(shí)別效果的關(guān)鍵步驟之一,通過(guò)將具有相同或者相似像素特性的子區(qū)域進(jìn)行分類(lèi)[1],最終以此為基礎(chǔ)將圖像劃分成若干個(gè)不同的部分[2]。這不僅對(duì)圖像信息提取具有重要的現(xiàn)實(shí)價(jià)值,同時(shí)對(duì)于圖像的特征識(shí)別、結(jié)構(gòu)分類(lèi)也極為重要[3]。但是受圖像基礎(chǔ)情況的差異影響,圖像分割的精確性難以得到保證[4]。特別是對(duì)于部分模糊圖像而言,像素特征被模糊化,對(duì)其的分類(lèi)難度較高,往往會(huì)導(dǎo)致分割結(jié)果出現(xiàn)像素的錯(cuò)誤劃分[5]。為此,諸多學(xué)者也進(jìn)行了相關(guān)研究,其中曾艷陽(yáng)等[6]將方向模糊導(dǎo)數(shù)結(jié)合直線(xiàn)截距直方圖算法,對(duì)圖像弱光部分進(jìn)行有效分割,保留圖像細(xì)節(jié)信息,抑制噪聲,利用ots 法得到精準(zhǔn)閾值分割結(jié)果,以此提高圖像弱光部分的分割精度,但無(wú)法滿(mǎn)足現(xiàn)階段的應(yīng)用需求。李巧蘭等[7]利用最大熵閾值處理算法實(shí)施對(duì)圖像的分割,通過(guò)歸一化處理圖像灰度直方圖,采用粒子群算法尋優(yōu)圖像分割閾值實(shí)現(xiàn)視頻圖像分割,該方法提高了分割效率,但效果并不理想。
深度神經(jīng)網(wǎng)絡(luò)作為機(jī)器學(xué)習(xí)方式的一種,可以用較少的參數(shù)表示復(fù)雜的函數(shù),具有學(xué)習(xí)能力強(qiáng)、覆蓋范圍廣、適應(yīng)性好、數(shù)據(jù)驅(qū)動(dòng)效果優(yōu)及可移植性穩(wěn)定的特點(diǎn)。深度神經(jīng)網(wǎng)絡(luò)具有較多的網(wǎng)絡(luò)層,可以映射到任意函數(shù),其制定的框架可以兼容很多平臺(tái),能夠有效解決復(fù)雜的圖像分割等問(wèn)題。深度神經(jīng)網(wǎng)絡(luò)上限高,數(shù)據(jù)依賴(lài)程度高,當(dāng)處理的數(shù)據(jù)數(shù)量越大時(shí),其處理表現(xiàn)效果就越優(yōu),因此在圖像識(shí)別、面部識(shí)別、NLP 等領(lǐng)域具有突出表現(xiàn)。同時(shí),深度神經(jīng)網(wǎng)絡(luò)在尋優(yōu)方面的優(yōu)越性對(duì)于提高模糊圖像像素識(shí)別具有重要的應(yīng)用價(jià)值。在此基礎(chǔ)上,本文提出基于深度神經(jīng)網(wǎng)絡(luò)的模糊圖像分割方法研究,并進(jìn)行了試驗(yàn)測(cè)試,分析驗(yàn)證了設(shè)計(jì)方法的有效性。
模糊圖像分割有利于在模糊復(fù)雜背景中提取所需目標(biāo),提高信息數(shù)據(jù)采集能力和應(yīng)用效果。利用空域?yàn)V波采集圖像的灰度值,采用頻域?yàn)V波進(jìn)行傅立葉變換處理,建立圖像像素映射關(guān)系。根據(jù)灰度值數(shù)值的特征,完成圖像噪聲預(yù)處理。通過(guò)深度神經(jīng)網(wǎng)絡(luò)構(gòu)建多層級(jí)的圖像分割處理任務(wù)層,提取圖像整體像素特征,建立目標(biāo)圖像特征映射關(guān)系,按照擬合程度實(shí)現(xiàn)圖像分割處理。模糊圖像精準(zhǔn)分割,可以有效提取圖像的幾何、灰度、紋理等特征,根據(jù)具體特征內(nèi)容選擇所需信息數(shù)據(jù),優(yōu)化信息應(yīng)用效果。
模糊圖像預(yù)處理有利于提高圖像目標(biāo)特征的降噪效果,通過(guò)計(jì)算灰度值實(shí)現(xiàn)圖像定量規(guī)劃,能夠?qū)崿F(xiàn)圖像信息應(yīng)用的延伸。為了實(shí)現(xiàn)對(duì)模糊圖像的精準(zhǔn)分割,本文首先對(duì)其進(jìn)行預(yù)處理,最大限度降低噪聲對(duì)圖像特征的影響,在具體的實(shí)施過(guò)程中,也主要采用空域?yàn)V波[8]和頻域?yàn)V波[9]兩種計(jì)算方式。
首先,采用空域?yàn)V波對(duì)圖像的降噪處理是在圖像的像素灰度空間上計(jì)算出關(guān)鍵灰度值,其計(jì)算方式可以表示為
其中,k 表示圖像的關(guān)鍵灰度值,c表示圖像模糊系數(shù),也就是在噪聲作用下圖像像素的混合系數(shù),y(ai)表示原始模糊圖像的像素矩陣。通過(guò)這樣的方式得到的關(guān)鍵灰度值是模糊圖像中范圍最大的灰度值。
其次,再采用頻域?yàn)V波對(duì)圖像進(jìn)行傅立葉變換處理,這樣做的目的是建立圖像像素值之間的映射關(guān)系,對(duì)應(yīng)的計(jì)算方式可以表示為
其中,E(ai)即為圖像的傅立葉變換處理后的映射結(jié)果,f(*)表示傅立葉函數(shù),κ表示傅立葉變換系數(shù)。
通過(guò)這樣的方式,將得到的關(guān)鍵灰度值作為輸入像素值,利用式(2)所示的映射關(guān)系實(shí)現(xiàn)對(duì)圖像噪聲污染的過(guò)濾處理,其計(jì)算方式可以表示為
其中,armin(*)表示映射關(guān)系函數(shù)的最小值。通過(guò)這樣的處理方式得到的圖像,可以有效提高后續(xù)圖像分割處理的可靠性。
在上述基礎(chǔ)上,為了實(shí)現(xiàn)對(duì)圖像的精確分割,本文利用深度神經(jīng)網(wǎng)絡(luò)執(zhí)行該過(guò)程。
首先,將模糊圖像的灰度值作為訓(xùn)練參數(shù),為了確保對(duì)目標(biāo)分割對(duì)象像素特征的有效提取,本文選取目標(biāo)像素點(diǎn)與八鄰域空間的像素點(diǎn)作為特征提取的基礎(chǔ),考慮到由于分割目標(biāo)在圖像中的位置分布不確定,當(dāng)目標(biāo)像素點(diǎn)處于圖像的4 條邊或者4 個(gè)角上時(shí),對(duì)應(yīng)的像素點(diǎn)八鄰域是不完整的,此時(shí)本文默認(rèn)缺少的鄰域點(diǎn)的像素值與對(duì)位鄰域點(diǎn)的像素值相同。利用得到的參數(shù)作為深度神經(jīng)網(wǎng)絡(luò)對(duì)圖像像素進(jìn)行分割識(shí)別的標(biāo)準(zhǔn)。
本文構(gòu)建的深度神經(jīng)網(wǎng)絡(luò)中,除輸入層和輸出層外,包含2 個(gè)卷積層、1 個(gè)池化以及1 個(gè)softmax 層。
當(dāng)預(yù)處理后的待分割圖像像素信息通過(guò)輸入層輸入到深度神經(jīng)網(wǎng)絡(luò)中后,第一卷積層通過(guò)SPReLU 激活函數(shù)執(zhí)行卷積操作[10],提取圖像的整體像素特征,此時(shí)對(duì)應(yīng)得到的特征有序數(shù)列可以表示為
其中,T表示選取目標(biāo)的特征參數(shù),T1、T2、T3、T4、T5分別表示圖像像素的中值、均值、最小值、均方差以及眾數(shù)值。需要特別注意的是,由于圖像的實(shí)際情況不同,在對(duì)其特征進(jìn)行提取的過(guò)程中,可能存在m(m>1)個(gè)像素出現(xiàn)次數(shù)相同且最多,此時(shí),本文將m個(gè)像素的均值作為T(mén)5的指標(biāo)參數(shù)。
之后將提取到的特征參數(shù)輸入到池化層,該階段主要是對(duì)其進(jìn)行壓縮處理,以此防止出現(xiàn)過(guò)擬合的情況,同時(shí)避免冗余信息對(duì)最終的分割精度的影響,其計(jì)算方式可以表示為
其中,best表示壓縮處理后的圖像像素特征,n表示壓縮倍數(shù),p表示逼近參數(shù),s表示圖像紋理信息,amin表示最小響度尺度信息。
經(jīng)過(guò)處理后的圖像進(jìn)入第二卷積層,建立目標(biāo)圖像特征與圖像整體之間的映射關(guān)系,最后利用SoftMax 層將擬合關(guān)系達(dá)到分割標(biāo)準(zhǔn)的像素作為最終的目標(biāo)像素發(fā)送到輸出層,完成對(duì)圖像的分割處理。由于不同圖像的模糊程度不同,映射關(guān)系下特征之間的擬合程度也存在明顯差異。為了適應(yīng)這種印象,需要對(duì)SoftMax 層的閾值參數(shù)進(jìn)行個(gè)性化設(shè)置,本文對(duì)其的設(shè)計(jì)方式可以表示為
其中,γ表示SoftMax 層的閾值參數(shù),從式(6)中可以看出,該參數(shù)值與圖像模糊系數(shù)直接相關(guān),因此可以對(duì)分割目標(biāo)的適應(yīng)性選擇。當(dāng)圖像像素與特征的擬合程度達(dá)到γ值時(shí),則將其輸出為目標(biāo)圖像,當(dāng)圖像像素與特征的擬合程度小于γ值時(shí),則將其輸出背景圖像。
通過(guò)這樣的方式,即可實(shí)現(xiàn)對(duì)高精度模糊圖像的分割處理,提高模糊圖像識(shí)別效率,降低圖像特征提取的識(shí)別時(shí)間和成本投入,極大程度提升了圖像編碼、文檔圖像處理、遙感和生物醫(yī)學(xué)圖像分析等方面的應(yīng)用效果。
為進(jìn)一步分析提出方法的圖像分割效果,本文進(jìn)行了試驗(yàn)測(cè)試。在Image Net(http://image-net.org/)圖像識(shí)別數(shù)據(jù)集中,選擇模糊圖像數(shù)據(jù)集1 000 個(gè),通過(guò)400次訓(xùn)練迭代測(cè)試,驗(yàn)證圖像幾何、灰度、紋理等特征提取有效性。為了能夠進(jìn)一步驗(yàn)證所提方法(基于深度神經(jīng)網(wǎng)絡(luò)的模糊圖像分割方法)的模糊圖像分割有效性,與曾艷陽(yáng)等[6]方法(基于截距直方圖和ots 融合的弱光圖像分割方法)和李巧蘭等[7]方法(基于最大熵閾值處理算法的視頻圖像人物分割方法)進(jìn)行對(duì)比分析,對(duì)比內(nèi)容為假陰性率、假陽(yáng)性率以及相似度測(cè)試。
為了實(shí)現(xiàn)對(duì)圖像分割方法的有效分析,本文在模糊圖像數(shù)據(jù)集中隨機(jī)選取3 組模糊程度不同的圖像作為測(cè)試數(shù)據(jù),具體見(jiàn)圖1。
以圖1 所示的圖像為基礎(chǔ),將中心部位的圓形圖像作為目標(biāo)分割對(duì)象,對(duì)其進(jìn)行分割處理及標(biāo)記。
在此基礎(chǔ)上,除了直觀地觀察判斷3 種方法的分割效果外,本文設(shè)置了假陰性率、假陽(yáng)性率以及相似度作為評(píng)價(jià)指標(biāo)。其中,假陽(yáng)性是指背景區(qū)域的像素點(diǎn)被分割到目標(biāo)區(qū),其計(jì)算方式為
其中,pr表示假陽(yáng)性率,xr表示位于背景區(qū)域但被分割到目標(biāo)區(qū)域的像素點(diǎn)數(shù)量,x表示目標(biāo)區(qū)域的像素點(diǎn)數(shù)量。
假陰性是指目標(biāo)區(qū)域的像素點(diǎn)被分割到背景區(qū)域,其計(jì)算方式可以表示為
其中,pf表示假陰性率,xf表示位于目標(biāo)區(qū)域但被分割到背景區(qū)域的像素點(diǎn)數(shù)量。
最后,相似度是指分割的目標(biāo)區(qū)域像素的一致性,其計(jì)算方式可以表示為
其中,λ表示相似度,xc表示重合部分像素?cái)?shù)量。
從上述3 個(gè)公式中可以看出,分割結(jié)果的假陰性率、假陽(yáng)性率越低,相似度越高,圖像的分割也就效果越好。
在上述基礎(chǔ)上,3 種方法分割得到的目標(biāo)圖像見(jiàn)圖2。
從圖2 中可以看出,對(duì)比3 種方法,曾艷陽(yáng)等[6]方法和李巧蘭等方法的分割結(jié)果中,邊緣存在明顯的模糊,相比之下,本文方法更加清晰。這是因?yàn)樗岱椒ㄔ趯?duì)模糊圖像進(jìn)行分割前,通過(guò)計(jì)算灰度值建立映射關(guān)系,實(shí)現(xiàn)模糊圖像的降噪處理,以此提高了圖像邊緣清晰度。
對(duì)具體的評(píng)價(jià)指標(biāo)進(jìn)行分析,其結(jié)果見(jiàn)表1。
表1 不同方法的分割結(jié)果對(duì)比表 單位:%
從表1 中可以看出,3 種方法的分割結(jié)果中,假陽(yáng)性率和假陰性率均隨著圖像模糊程度的增加而逐漸提高。對(duì)比3種方法,李巧蘭等[7]方法的假陽(yáng)性率和假陰性率最高,最大值分別達(dá)到了0.096 和0.080,相比之下,曾艷陽(yáng)等方法與之相比有所提升,但是評(píng)價(jià)指標(biāo)整體也處于相對(duì)較高的水平。觀察本文提出方法的分割結(jié)果,其中假陽(yáng)性率最大值僅為0.019,假陰性率最高值也僅為0.010,這也與圖2 中的測(cè)試結(jié)果體現(xiàn)出了相同的特征。由于在模糊圖像處理中將模糊圖像的灰度值作為訓(xùn)練迭代參數(shù),確保目標(biāo)分割圖像幾何、灰度、紋理等特征的有效提取,提升了模糊圖像分割的精準(zhǔn)度。
在此基礎(chǔ)上,對(duì)分割圖像的相似度進(jìn)行統(tǒng)計(jì),其結(jié)果見(jiàn)表2。
表2 不同方法的分割結(jié)果相似度
從表2 中可以看出,在3 種測(cè)試方法中,李巧蘭等方法分割圖像的相似度最低,其中,對(duì)于圖像(c)的分割結(jié)果中,相似度僅為0.507,對(duì)于模糊程度最低的圖像(a)分割后的相似度也僅為0.750,曾艷陽(yáng)等[6]方法與之相比有明顯提升,但是與本文方法相比仍存在一定不足。在本文的分割結(jié)果中,相似度始終在0.850 以上,且最大值達(dá)到了0.925。這是由于本文方法利用深度神經(jīng)網(wǎng)絡(luò)構(gòu)建多層級(jí)圖像處理任務(wù)層,對(duì)圖像像素與特征進(jìn)行擬合,通過(guò)擬合程度提高模糊圖像分割效果。
綜上所述,測(cè)試結(jié)果表明,本文提出的方法可以實(shí)現(xiàn)對(duì)模糊圖像的準(zhǔn)確分割,大大降低了像素模糊對(duì)分割帶來(lái)的干擾。
精確的圖像分割方法是實(shí)現(xiàn)對(duì)圖像信息深層分析、深度挖掘的重要基礎(chǔ),對(duì)其相關(guān)技術(shù)展開(kāi)研究具有重要的現(xiàn)實(shí)價(jià)值。模糊圖像分割有利于提高圖像編碼、文檔圖像處理、遙感和生物醫(yī)學(xué)圖像的識(shí)別和應(yīng)用效果,體現(xiàn)了圖像信息數(shù)據(jù)使用的核心內(nèi)容。為了解決模糊圖像的特征強(qiáng)度較弱、分割精確度較低的問(wèn)題,本文提出了基于深度神經(jīng)網(wǎng)絡(luò)的模糊圖像分割方法研究。通過(guò)空域?yàn)V波和頻域?yàn)V波完成模糊圖像的降噪預(yù)處理,利用深度神經(jīng)網(wǎng)絡(luò)提取模糊圖像特征,對(duì)壓縮處理后的模糊圖像進(jìn)行擬合分析,根據(jù)圖像特征和像素的擬合程度,實(shí)現(xiàn)模糊圖像分割。測(cè)試結(jié)果表明,本文方法實(shí)現(xiàn)了對(duì)模糊圖像的高精度分割,大大提高了分割結(jié)果的可靠性。通過(guò)此次研究,以期為模糊圖像處理工作的開(kāi)展提供有價(jià)值的參考。