石釗銘
(海裝武漢局駐武漢地區(qū)第四軍事代表室 武漢 430205)
深度學(xué)習(xí)(Deep Learning)作為新興智能技術(shù)方法,相對(duì)于傳統(tǒng)的結(jié)構(gòu)化艦船目標(biāo)識(shí)別方法一般要經(jīng)過(guò)特征提取,特征選擇(屬性約簡(jiǎn))和分類識(shí)別三大步驟而言,大大簡(jiǎn)化了識(shí)別步驟,它具有可自主學(xué)習(xí)特征、可直接輸入圖像等優(yōu)點(diǎn),避免了特征提取的主觀性,提高了識(shí)別精度,獲得了良好的識(shí)別效果。例如Lü等將DBN模型用于遙感圖像的分類處理中[1],Lü等設(shè)計(jì)了基于深度學(xué)習(xí)的層次分類模型[2],實(shí)驗(yàn)結(jié)果表明基于DBN模型的方法可以取得較好的分類效果。近幾年,DBN模型作為深度學(xué)習(xí)的一個(gè)典型模型,其在手寫(xiě)數(shù)字識(shí)別[3]、圖像處理[4]等領(lǐng)域得到了廣泛應(yīng)用。但DBN模型忽略了圖像的局部結(jié)構(gòu)[5],且其輸入像素的鄰域一般取實(shí)驗(yàn)值或經(jīng)驗(yàn)值,缺乏理論分析,也沒(méi)有考慮算法的時(shí)間復(fù)雜度。為此,本文提出了一種基于像素灰度級(jí)區(qū)域劃分的圖像局部空間灰度信息表征方法,豐富和完善了模型的輸入變量信息,在此基礎(chǔ)上,構(gòu)建了基于局部區(qū)域劃分的DBN目標(biāo)分類模型,并結(jié)合仿真實(shí)驗(yàn)驗(yàn)證算法的時(shí)效性。
本文算法流程如圖1所示。針對(duì)基于局部空間灰度的輸入像素,算法采用基于像素灰度級(jí)區(qū)域劃分的思想進(jìn)行處理;針對(duì)目標(biāo)分類方法,算法采用DBN模型進(jìn)行分類。算法在進(jìn)行艦船目標(biāo)分類識(shí)別時(shí),采用“局部-整體”的計(jì)算原則,即首先在分組劃分后的每塊區(qū)域內(nèi)進(jìn)行一次處理,然后在目標(biāo)整體空間內(nèi)進(jìn)行二次處理,理論分析表明,該算法降低了時(shí)間復(fù)雜度,提升了目標(biāo)的識(shí)別速度。
圖1 算法流程圖
借鑒文獻(xiàn)[6]的像素非局部空間灰度信息:利用與圖像像素具有相似鄰域結(jié)構(gòu)的像素來(lái)獲取該像素的空間信息,這種空間信息稱為像素的非局部空間灰度信息。顯然,對(duì)于某像素,利用與其具有相似鄰域結(jié)構(gòu)的像素來(lái)獲得它的空間信息要比僅僅利用其鄰域像素更為準(zhǔn)確。為此,本文提出了基于像素局部鄰域結(jié)構(gòu)信息,其與某像素的灰度信息一起構(gòu)成一個(gè)二元組,作為DBN模型的輸入項(xiàng)。為方便理解區(qū)域劃分的思想,下面給出局部區(qū)域的概念。
給定一個(gè)數(shù)據(jù)區(qū)間R,假設(shè)共有d維,將第i維空間劃分成ni個(gè)小區(qū)間段,且將這些小區(qū)間構(gòu)成的區(qū)間記做 Ri,則區(qū)間 Ri被笛卡爾集劃分成 n1×n2×…×nl個(gè)局部區(qū)域單元,則某個(gè)區(qū)間單元可以用其每小區(qū)間段在各維上的對(duì)應(yīng)位置所組成的d維向量來(lái)唯一標(biāo)識(shí),如區(qū)間M可標(biāo)識(shí)為,這里以二維空間為例進(jìn)行說(shuō)明,如圖2所示。
圖2 區(qū)域劃分示意圖
假設(shè)圖像I(x,y)的圖像灰度級(jí)為L(zhǎng),二維直方圖Ω被劃分成M組M×N個(gè)矩形區(qū)域,每組含有N(N=L/M)個(gè)像素灰度級(jí),每個(gè)矩形區(qū)域含有N×N個(gè)像素點(diǎn)。在每個(gè)矩形區(qū)域內(nèi),對(duì)于每一個(gè)像素i,灰度為 fi。定義以其為中心,大小為Size×Size的搜索窗口wi,在該搜索窗口中,計(jì)算像素i的局部空間灰度,公式表示如下:
其中,λi表示權(quán)值,為歸一化項(xiàng),gj表示該搜索窗口內(nèi)像素 j的灰度值。λi的計(jì)算公式如下:
基于上,某像素的局部空間灰度信息是搜索窗口內(nèi)所有像素灰度值進(jìn)行加權(quán)平均計(jì)算獲得的,而權(quán)值的大小表達(dá)了某像素與搜索窗口內(nèi)像素的鄰域結(jié)構(gòu)的相似程度,其值越大,表明其與鄰域結(jié)構(gòu)越相似。
針對(duì)二維直方圖圖像,其傳統(tǒng)分組方法的時(shí)間復(fù)雜度一般為O(L)(L表示圖像灰度級(jí)大?。榻档退惴ǖ臅r(shí)間復(fù)雜度,下面給出基于像素灰度級(jí)的區(qū)域劃分標(biāo)準(zhǔn)。假設(shè)參與計(jì)算的像素點(diǎn)個(gè)數(shù)為Num,則在區(qū)域劃分的基礎(chǔ)上,采用“局部-整體”的計(jì)算方式,Num的計(jì)算公式為
此外,對(duì)于搜索窗口大小Size的取值,一般設(shè)置為奇數(shù),且Size<N。
參考文獻(xiàn)[1],本文將三層RBM網(wǎng)絡(luò)和一層BP網(wǎng)絡(luò)組成的DBN模型作為分類識(shí)別部分的推理模型。其中,RBM網(wǎng)絡(luò)示意圖表示如下:
圖3 RBM示意圖
RBM模型所蘊(yùn)含的能量函數(shù)表示為
由于本文所采用的可見(jiàn)層之間的神經(jīng)元和隱含層之間的神經(jīng)元沒(méi)有連接,因此各個(gè)可見(jiàn)層和隱含層的節(jié)點(diǎn)的激活狀態(tài)是條件獨(dú)立的。因此,當(dāng)給定隱含層節(jié)點(diǎn)的狀態(tài)時(shí),第i個(gè)可見(jiàn)層節(jié)點(diǎn)的激活概率表示為
上式中,σ()x亦為邏輯斯蒂函數(shù)。
同理可得,第 j個(gè)可見(jiàn)層節(jié)點(diǎn)的激活概率可表示為
參考上述給定公式,對(duì)最大對(duì)數(shù)似然函數(shù)求導(dǎo),最后根據(jù)對(duì)比離散度[7]得到各個(gè)參數(shù)的更新規(guī)則:為訓(xùn)練數(shù)據(jù)集對(duì)應(yīng)分布的數(shù)學(xué)期望值,
針對(duì)BP分類網(wǎng)絡(luò)層,假設(shè)第i個(gè)節(jié)點(diǎn)的實(shí)際輸出值為oi,數(shù)學(xué)期望輸出值為di,則靈敏度δ的計(jì)算公式記做:
那么對(duì)于第k個(gè)隱含層,靈敏度δ的計(jì)算公式為
故對(duì)于模型第k個(gè)層的網(wǎng)絡(luò)權(quán)值,可得:
DBN模型首先將輸入像素二元組數(shù)據(jù)轉(zhuǎn)換為一維數(shù)據(jù),然后采用迭代的方式進(jìn)行批訓(xùn)練,訓(xùn)練完畢后,通過(guò)BP網(wǎng)絡(luò)向前傳播計(jì)算得到樣本所在的類別索引,最終得到輸入數(shù)據(jù)與類標(biāo)值的非線性映射關(guān)系,完成目標(biāo)分類識(shí)別。
實(shí)驗(yàn)對(duì)象為從谷歌地圖中隨機(jī)選取的航空遙感影像。實(shí)驗(yàn)數(shù)據(jù)同文獻(xiàn)[8],如圖所示。本次實(shí)驗(yàn)數(shù)據(jù)分為6個(gè)艦種,像素灰度級(jí)在0~255之間。在實(shí)驗(yàn)過(guò)程中,通過(guò)對(duì)艦船目標(biāo)的源圖像做灰度、尺寸縮放等處理得到大量的實(shí)驗(yàn)樣本,每個(gè)艦種1000幅,共計(jì)6000幅。開(kāi)發(fā)工具采用Matlab.2008,實(shí)驗(yàn)環(huán)境為Windows操作系統(tǒng),具體配置為Intel(R)Pentium(R)4 CPU 3.00 GHz。
圖4 目標(biāo)圖像切片數(shù)據(jù)
為驗(yàn)證該模型的識(shí)別性能,采用如下計(jì)算方式[9],公式如下:
其中,yic表示算法得出的計(jì)算結(jié)果,tic表示樣本的真實(shí)結(jié)果,且在該算法中,做如下規(guī)定處理:若某樣本Vi所屬類別為 Lc,則tic=1;否則,tic=0,同理,對(duì)yic的規(guī)定處理亦如此。
為驗(yàn)證本模型的性能,將本文DBN模型的實(shí)驗(yàn)結(jié)果分別與K近鄰算法(KNN)[10]、支持向量機(jī)算法(SVM)[11]、DBN模型[12]的實(shí)驗(yàn)結(jié)果進(jìn)行比較。其中,本次DBN模型和文獻(xiàn)[10]的DBN模型的實(shí)驗(yàn)參數(shù)設(shè)置為迭代次數(shù)為50,學(xué)習(xí)率ε=0.05,最小樣本數(shù)量min-batch=100。
本文選做8組實(shí)驗(yàn),8組實(shí)驗(yàn)分別記作組1、2、3、4、5、6、7和8,且每組實(shí)驗(yàn)的訓(xùn)練樣本為從6類艦種中隨機(jī)抽取的200、300、400、500、600、700、800、900數(shù)量的實(shí)驗(yàn)樣本,其余的作為測(cè)試樣本使用,本實(shí)驗(yàn)累計(jì)重復(fù)10次,并將每次實(shí)驗(yàn)的平均值作為每組實(shí)驗(yàn)的最終實(shí)驗(yàn)結(jié)果,實(shí)驗(yàn)數(shù)據(jù)如下表所示。
由上表不難看出:上述算法的平均識(shí)別率大致呈遞增的方式增長(zhǎng),基于DBN模型的分類性能優(yōu)于傳統(tǒng)的結(jié)構(gòu)化學(xué)習(xí)方法,而對(duì)于本文模型較DBN模型而言,其組6、7、8、9實(shí)驗(yàn)數(shù)據(jù)進(jìn)一步表明,隨著訓(xùn)練樣本數(shù)量的逐步增多,其分類性能逐步趨于完善,其識(shí)別能力愈來(lái)愈高。
表1 實(shí)驗(yàn)數(shù)據(jù)(I)
表2 實(shí)驗(yàn)數(shù)據(jù)(II)
針對(duì)艦船目標(biāo)分類識(shí)別問(wèn)題,研究提出了基于像素灰度級(jí)區(qū)域劃分的圖像局部空間灰度信息表征方法,該方法運(yùn)用區(qū)域劃分的分組思想計(jì)算像素灰度信息,降低了算法的時(shí)間復(fù)雜度,大大減少了算法的運(yùn)算量;提出了基于區(qū)域劃分的DBN分類模型,首先將元素的局部鄰域結(jié)構(gòu)信息與其灰度信息一起構(gòu)成一個(gè)二元組作為該模型的輸入項(xiàng),然后采用由三層RBM網(wǎng)絡(luò)和一層有監(jiān)督的反向傳播功能的BP網(wǎng)絡(luò)所組成的DNB模型進(jìn)行樣本分類訓(xùn)練。通過(guò)對(duì)模型輸入特征和樣本初始化處理,提升了模型的分類性能。仿真實(shí)驗(yàn)表明,本研究對(duì)今后基于光學(xué)遙感圖像的艦船目標(biāo)識(shí)別方法的研究具有一定的理論意義及應(yīng)用價(jià)值。