呂波
(雅安職業(yè)技術(shù)學(xué)院,四川 雅安 625000)
多媒體技術(shù)的快速發(fā)展,攝像設(shè)備不斷多樣化,每天不斷產(chǎn)生大量的圖像,從而出現(xiàn)了海量圖像,在圖像實(shí)際應(yīng)用中,如何從海量圖像中找到自己真正需要的圖像十分關(guān)鍵,而圖像分類是圖像搜索的基礎(chǔ),因此如何對(duì)海量圖像進(jìn)行分類顯得十分重要[1-3]。
針對(duì)海量圖像分類問(wèn)題,學(xué)者們進(jìn)行了大量的研究,出現(xiàn)許多有效的圖像分類方法[4-6]。如有學(xué)者提出了基于生成對(duì)抗網(wǎng)絡(luò)的圖像分類方法,在海量圖像分類過(guò)程中,由于該方法工作過(guò)程過(guò)于復(fù)雜,難以掌握,導(dǎo)致海量圖像分類效果不佳;有學(xué)者提出了BP神經(jīng)網(wǎng)絡(luò)的圖像分類方法,在海量圖像分類過(guò)程中,由于該方法計(jì)算繁瑣,導(dǎo)致海量圖像分類效率低[7-11],
大數(shù)據(jù)分析方法已廣泛應(yīng)用在自然圖像分類領(lǐng)域,檢測(cè)、配準(zhǔn)、生成等技術(shù)也逐漸應(yīng)用在圖像分類方面[12-14]。大數(shù)據(jù)分析方法對(duì)信息的多級(jí)處理,模擬人類大腦思維方式,不同的空間對(duì)應(yīng)不同層的特征,具有差異的語(yǔ)義信息,分類層次特征結(jié)構(gòu),分類能力高[15-17]。為了獲得理想的圖像分類結(jié)果,提出了基于大數(shù)據(jù)分析的海量圖像分類方法,并對(duì)其性能進(jìn)行分析。
卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)是一種大數(shù)據(jù)分析技術(shù),模擬人類大腦對(duì)信息處理過(guò)程,使用卷積神經(jīng)網(wǎng)絡(luò)算法分類圖像,將神經(jīng)網(wǎng)絡(luò)由數(shù)個(gè)神經(jīng)元組成,使高層抽象特征通過(guò)低層單一特征生成,被應(yīng)用于海量圖像分類方面[18-19]。
卷積神經(jīng)網(wǎng)絡(luò)是在人工神經(jīng)網(wǎng)絡(luò)基礎(chǔ)模型演變而來(lái),人工神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)圖,見(jiàn)圖1。
由圖1可知:人工神經(jīng)網(wǎng)絡(luò)模型連接各數(shù)據(jù)節(jié)點(diǎn),等數(shù)據(jù)流入網(wǎng)絡(luò)后計(jì)算出結(jié)果。
卷積神經(jīng)網(wǎng)絡(luò)將神經(jīng)元作為基本節(jié)點(diǎn),多種不同的神經(jīng)元相互聯(lián)系組成多層的神經(jīng)網(wǎng)絡(luò),每層都表示獨(dú)立特征,層次越高表示的語(yǔ)義越準(zhǔn)確。
(1) 卷積層。原始的輸入矩陣?yán)镁矸e核抽樣器生成卷積層。
(2) 下采樣層。以卷積層為基礎(chǔ)實(shí)施池化計(jì)算,生成下采樣層。
(3) 全連接層。通過(guò)迭代計(jì)算構(gòu)建多個(gè)交叉的采樣層,與多個(gè)卷積層生成全連接層,完成CNN 構(gòu)建。CNN結(jié)構(gòu)如圖2所示。
通過(guò)第1 層卷積樣本矩陣,由多層次變換得出y'。假定y表示該樣本的期望輸出,二者誤差用E描述,反向傳播時(shí)微調(diào)卷積核矩陣是依據(jù)誤差最小原則進(jìn)行操作。假設(shè)v層的第y個(gè)神經(jīng)元的輸出,則有:
其中:修正項(xiàng)、v-1 層的第k個(gè)神經(jīng)元的輸出、v層的第j與第k個(gè)神經(jīng)元間聯(lián)結(jié)的權(quán)重、分別用描述。v層的第y個(gè)神經(jīng)元的輸出用描述。v-1層的第k個(gè)神經(jīng)元的輸出計(jì)算公式,如公式(2)所示:
其中:激活函數(shù)用δ描述。
誤差函數(shù)是按照計(jì)算值與期望值的誤差計(jì)算,具體計(jì)算過(guò)程如公式(3)所示:
其中:誤差函數(shù)用θ描述,二次代數(shù)函數(shù)用f描述。
v層的第j神經(jīng)元的誤差計(jì)算公式如公式(4)所示:
CNN最后一層誤差計(jì)算公式如公式(5)所示:
其中:最后一層的梯度值、乘積運(yùn)算符、v層的輸出分別用θ、Θ、cV描述。
其他各層的誤差計(jì)算公式如(6)所示:
其中:v+1 層的權(quán)重用mv+1描述,v+1 層誤差用描述,函數(shù)用T描述。
權(quán)重梯度計(jì)算公式如(7)所示:
偏值梯度計(jì)算公式為:
卷積核的更新公式是使用梯度下降,卷積核的更新公式,具體如下:
其中:mv、dv分別表示第v層的權(quán)重、修正項(xiàng)。
基于大數(shù)據(jù)分析的海量圖像分類流程是通過(guò)構(gòu)建一個(gè)五層的卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)海量圖像分類。先將收集海量圖像實(shí)施圖像預(yù)處理后,輸入卷積神經(jīng)網(wǎng)絡(luò)中,通過(guò)改變卷積神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)以及調(diào)整相關(guān)參數(shù),訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò);采用訓(xùn)練好的卷積神經(jīng)網(wǎng)絡(luò)的輸出層輸出海量圖像分類結(jié)果。
基于大數(shù)據(jù)分析的海量圖像分類流程是:先收集海量圖像數(shù)據(jù),圖像數(shù)據(jù)分為測(cè)試數(shù)據(jù)與訓(xùn)練數(shù)據(jù);對(duì)海量圖像實(shí)施前期數(shù)據(jù)預(yù)處理,將海量圖像去偽彩,轉(zhuǎn)換成灰度圖像,提取海量圖像部分特征,實(shí)施歸一化處理成30×30;卷積核是5×5,一層全連接層、兩層下采樣層、兩層卷積層構(gòu)成CNN 模型,其中下采樣層使用尺度是2 的不重復(fù)池化,6 個(gè)特征圖構(gòu)成第一層卷積層,16 特征圖構(gòu)成第二層卷積層,輸出了類別是多類,sigmoid 函數(shù)是激活函數(shù);通過(guò)卷積神經(jīng)網(wǎng)絡(luò)改變模型結(jié)構(gòu),調(diào)整迭代次數(shù)和卷積核大小等參數(shù)后,判定訓(xùn)練時(shí)間和分類率是否滿足要求,當(dāng)滿足要求時(shí),可完成海量圖像的分類,如果不滿足,需重新進(jìn)行卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練直至滿足要求。
因此基于大數(shù)據(jù)分析的海量圖像分類流程,如圖3所示。
海量圖像數(shù)據(jù)預(yù)處理過(guò)程:因受外界環(huán)境的影響導(dǎo)致海量圖像質(zhì)量下降需對(duì)海量圖像實(shí)施預(yù)處理。海量圖像分成若干個(gè)子圖像,設(shè)定8 個(gè)子圖像,子圖像的離散余弦波變換計(jì)算過(guò)程,如公式(11)所示:
其中:子圖像用f(m,n)描述,0≤u≤7,0≤v≤7、C(u)=C(v)=。
利用離散余弦變換的逆變換,如公式(12)所示:
在樣品數(shù)較少情況下數(shù)據(jù)預(yù)處理過(guò)程:
(1) 利用鏡面上下左右對(duì)稱方法增強(qiáng)數(shù)據(jù)集。
(2) 對(duì)突出特征的刮痕數(shù)據(jù)集實(shí)施背景分割。
(3) 將變換的海量圖像實(shí)施主成分分析降維處理。
為了驗(yàn)證本文方法的海量圖像分類效果,在Windows7操作系統(tǒng),Matlab R2013c試驗(yàn)環(huán)境下。選取15000幅圖像作為仿真試驗(yàn)樣品。其中,訓(xùn)練數(shù)據(jù)是選取10000幅圖像,測(cè)試數(shù)據(jù)是選取剩下5000幅圖像,運(yùn)用本文方法與文獻(xiàn)[12]的圖像分類方法、文獻(xiàn)[13]的圖像分類方法分別實(shí)圖像分類精度、不同迭代次數(shù)、分類誤差曲線、圖像分類時(shí)間等方面對(duì)比仿真試驗(yàn)。
分別運(yùn)用文獻(xiàn)[12]方法、文獻(xiàn)[13]方法與本文方法分類500 幅圖像,三種方法分類精度用圖4描述。由圖4的實(shí)驗(yàn)結(jié)果可知:本文方法和圖像平均分類精度要高于文獻(xiàn)[12]和文獻(xiàn)[13],獲得更優(yōu)的圖像分類結(jié)果。
考慮到訓(xùn)練集樣本數(shù)量與訓(xùn)練誤差的關(guān)系對(duì)圖像分類效果的影響,將迭代次數(shù)分別為30次、60次,不同迭代次數(shù)分類誤差曲線,用圖5描述。由圖5可知,本文方法的訓(xùn)練誤差與迭代次數(shù)和訓(xùn)練集樣本數(shù)量成反比,當(dāng)?shù)螖?shù)和訓(xùn)練集樣數(shù)量增加時(shí),訓(xùn)練誤差也隨之減少。在圖5(b)中,本文方法最小訓(xùn)練誤差0.02,文獻(xiàn)[12]最小訓(xùn)練誤差0.08、文獻(xiàn)[13]最小訓(xùn)練誤差0.11,說(shuō)明本文訓(xùn)練誤差最小。
對(duì)比三種方法的海量圖像分類時(shí)間,具體結(jié)果見(jiàn)表1。由表1結(jié)果可知:本文方法海量圖像的平均分類時(shí)間3.5min分別比文獻(xiàn)[12]方法、文獻(xiàn)[13]方法節(jié)省14min、29min,說(shuō)明本文方法圖像分類時(shí)間最短,提升海量圖像的分類效率。
表1 三種方法的海量圖像分類時(shí)間
本文設(shè)計(jì)了基于大數(shù)據(jù)分析的海量圖像分類方法,并將其應(yīng)用仿真試驗(yàn)中進(jìn)行測(cè)試,實(shí)驗(yàn)結(jié)果表明:本文方法的圖像分類準(zhǔn)確率高、訓(xùn)練誤差小、圖像分類時(shí)間短、圖像分類效果好,可有效提高海量圖像分類效率,為后期圖像處理方面提供理論依據(jù)。由于本人時(shí)間與精力有限,本文研究中仍存在不足,以后希望將更多先進(jìn)的科學(xué)技術(shù)融入本方法中,可以更快速實(shí)現(xiàn)海量圖像分類。
自動(dòng)化技術(shù)與應(yīng)用2022年10期