文/鄭文超
近年來,計(jì)算機(jī)軟件技術(shù)有了較大提升,加之人工智能算法與信息技術(shù)的深度融合,使得信息技術(shù)已經(jīng)成為現(xiàn)如今炙手可熱的研究領(lǐng)域。人工智能技術(shù)已經(jīng)作為各行各業(yè)必須具備的一種常規(guī)技術(shù),現(xiàn)已滲透到社會各個領(lǐng)域中。圖像分割是圖像識別過程中的核心流程,分割算法的優(yōu)劣,嚴(yán)重影響圖像識別精度?,F(xiàn)如今各行各業(yè)都需要用到圖像識別技術(shù),例如交通抓拍、遙感目標(biāo)定位等。傳統(tǒng)圖像識別技術(shù)易受圖像本身質(zhì)量等其他干擾因素的限制,不適用于所有圖像的識別。國內(nèi)外學(xué)者,借鑒人眼圖像識別的原理,將人工智能技術(shù)融入圖像識別過程中,提出了各類基于人工智能算法的圖像分割算法,基于卷積神經(jīng)網(wǎng)絡(luò)的圖像分割算法便是其中一種。因此本文針對卷積神經(jīng)網(wǎng)絡(luò)的圖像分割算法進(jìn)行研究。對傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)圖像分割算法進(jìn)行分析,并針對不足研究了全卷積神經(jīng)網(wǎng)絡(luò)。本文所做研究,在眾多方面相較于原來的算法均具有明顯提高。
現(xiàn)如今,眾多圖像分割算法中存在分割標(biāo)準(zhǔn)不統(tǒng)一問題。國內(nèi)外學(xué)者研究往往針對與某一領(lǐng)域,此種算法雖然具有本領(lǐng)域的特色,但算法的普適性較差,無法以偏概全。近年來,隨著此種算法的不斷成熟應(yīng)用,已經(jīng)被多次應(yīng)用至交通違章識別、醫(yī)學(xué)成像、生產(chǎn)制造信息識別等領(lǐng)域,尤其以醫(yī)學(xué)領(lǐng)域應(yīng)用最為廣泛,通過卷積神經(jīng)網(wǎng)絡(luò)算法,將圖像根據(jù)已經(jīng)設(shè)定的標(biāo)準(zhǔn)進(jìn)行分割,將不同的分割部分分別標(biāo)記定位,為醫(yī)生最終診斷提供決策支撐。卷積神經(jīng)網(wǎng)絡(luò)通過在對大量圖像進(jìn)行檢測的過程中,可得到?jīng)Q策函數(shù),此函數(shù)首先針對圖像像素進(jìn)行識別和計(jì)算,然后完成圖像分割,這類分割算法既考慮了圖像的整體性,又發(fā)揮了神經(jīng)網(wǎng)絡(luò)的優(yōu)勢點(diǎn)。
表 1:基于全卷積神經(jīng)網(wǎng)絡(luò)和軟硬件配置表
傳統(tǒng)算法其基本原理如下:
整個卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)由兩層組成,分別為特征識別層和特征映射層。特征識別層主要負(fù)責(zé)以最小單元為單位的圖像局部特征識別,特征識別層根據(jù)具體算法的不同又細(xì)分為許多層級,每一層級作為下一層級的圖像輸入。特征識別層的最終輸出作為特征映射層的信號來源,而在具體算法執(zhí)行過程中,多個特征映射層構(gòu)成了算法的計(jì)算層。映射層是由多個神經(jīng)元組成,在計(jì)算時(shí)若每一神經(jīng)元的權(quán)重不一,計(jì)算效率會受影響。因此,應(yīng)保證特征映射層每一神經(jīng)元的權(quán)重相同,這樣有利于提升計(jì)算效率,減少參數(shù)。其算法基本架構(gòu)如圖1所示。
激活函數(shù)是卷積神經(jīng)網(wǎng)絡(luò)系統(tǒng)的核心,激活函數(shù)可保證卷積層結(jié)束至接入池化層之前,在一定限度內(nèi)降低圖像質(zhì)量,以減輕下一卷積層的壓力。卷積神經(jīng)網(wǎng)絡(luò)在眾多人工智能算法中可以脫穎而出,不僅取決于其優(yōu)良的算法結(jié)構(gòu),還取決于其優(yōu)秀的自主學(xué)習(xí)能力。系統(tǒng)每進(jìn)行一次卷積計(jì)算,都是一個自主進(jìn)化的過程。算法在對原始數(shù)據(jù)學(xué)習(xí)的過程中,可自主分析學(xué)習(xí)。此種模式與各種生物的神經(jīng)元學(xué)習(xí)理念較為相似,因此多被用于圖像和聲音處理中。
由于傳統(tǒng)算法對于存儲空間的容量要求較高,算法計(jì)算效率較低且像素特征的識別精度低等。為了解決以上問題,本文提出了一種全新的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),以滿足實(shí)際問題的需要。改進(jìn)后的卷積神經(jīng)網(wǎng)絡(luò)分割算法設(shè)計(jì)理念如下:
采用圖分割算法與卷積神經(jīng)網(wǎng)絡(luò)算法結(jié)合,解決卷積分割后圖像質(zhì)量差,模糊不清的問題。首先采用卷積神經(jīng)網(wǎng)絡(luò)對圖像進(jìn)行分割,并采用改進(jìn)的圖分割能量函數(shù)優(yōu)化分割后的圖像細(xì)節(jié);然后再進(jìn)行卷積神經(jīng)網(wǎng)絡(luò)是,強(qiáng)調(diào)空間上的一致性,采用K-means聚類算法對Gabor濾波器輸出的圖像紋理進(jìn)行整理和歸納,之后采用隨機(jī)森林分類器對其進(jìn)行分類,并對決策的數(shù)量和高度進(jìn)行調(diào)整。輸入圖像首先經(jīng)卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練,得到分割模型,然后利用全卷積網(wǎng)絡(luò)以獲取性能更高的圖像分割模型,獲得圖像像素概率圖。
本文實(shí)驗(yàn)所選擇當(dāng)今主流的算法測試和配置環(huán)境,其詳細(xì)情況如表1所示。
本實(shí)驗(yàn)中選擇的圖像批量大小為4,經(jīng)過400次計(jì)算之后,在結(jié)果集的基礎(chǔ)上計(jì)算一次準(zhǔn)確度,紙質(zhì)準(zhǔn)確度的誤差開始穩(wěn)定并趨于收斂。由于圖像分割的最終目標(biāo)是得到較為平滑的圖像預(yù)測結(jié)果,因此選擇了基于全局的精確率最好的迭代結(jié)果作為網(wǎng)絡(luò)訓(xùn)練最終結(jié)果。
本文經(jīng)過實(shí)驗(yàn)分析并對比了不同實(shí)驗(yàn)要素對最終圖像分割精度產(chǎn)生的影響。本文在深度網(wǎng)絡(luò)架構(gòu)方面本文選擇了SegNet-Basic和SegNet兩類原理和邏輯不相同的算法。為快速鑒別訓(xùn)練過程中圖像分割精確度程序的收斂速度,分析了使用fixed方式時(shí),SegNet網(wǎng)絡(luò)訓(xùn)練過程中精確度的變化趨勢。
經(jīng)驗(yàn)證發(fā)現(xiàn),不同架構(gòu)在均獲得了較高的分割精度值。當(dāng)使用的網(wǎng)絡(luò)結(jié)構(gòu)相同,但學(xué)習(xí)策略不同時(shí),使用fixed方式的全局精確度要高于step方式;天空和道路在圖像中所占有的整體比例越高,則圖像的分割精度將越高,草皮和行人數(shù)量少的圖像,其分割精度相對較低。
為了分析不同的圖像類型對算法最終分割精確度造成的影響,本文在fixed策略下,分析了RGB和RGB-D兩種圖像類型。經(jīng)比較可知,采用segNet算法得到的全局精確度分別為0.815和0.822,而segNet-Basci算法,其值分別為0.813和0.856。故使用RGB-D格式時(shí),最終圖像分割精確度高,同時(shí)精度提升幅度大。
隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展以及人類對于圖像識別要求的不斷提高,隨著人類對于識別技術(shù)要求的不斷提升以及各行各業(yè)對于計(jì)算機(jī)計(jì)算效率要求的不斷提高,人工智能算法已經(jīng)逐步與各行業(yè)融合,輔助進(jìn)行相關(guān)問題的解決。本文對基于劍姬神經(jīng)網(wǎng)絡(luò)的圖像分割算法進(jìn)行了研究。主要取得了以下研究成果:
圖1:卷積神經(jīng)網(wǎng)絡(luò)系統(tǒng)架構(gòu)
(1)梳理了卷積神經(jīng)網(wǎng)絡(luò)算法在圖像分割中的基本原理、模型、應(yīng)用過程中存在的問題;
(2)提出了基于圖分割原理和卷積神經(jīng)網(wǎng)絡(luò)融合技術(shù)的全卷積神經(jīng)網(wǎng)絡(luò)圖像分割算法,并進(jìn)行了實(shí)驗(yàn)驗(yàn)證。實(shí)驗(yàn)結(jié)果顯示,本文所提出的算法在分割精度、平均精確度、全局精確度三方面的表現(xiàn)均優(yōu)于其他算法。
本算法具備一定的推廣和應(yīng)用價(jià)值,可以在多種行業(yè)的圖像分割中使用,應(yīng)用前景比較廣闊。