趙唯辰 李玉杰 徐星雨
【摘 要】隨著當(dāng)前計(jì)算機(jī)專家們對(duì)人工智能算法的研究逐漸深入,在當(dāng)下關(guān)于人工智能的應(yīng)用已經(jīng)非常的廣泛,幾乎覆蓋不同領(lǐng)域的各行各業(yè),尤其是在圖像處理中,包括圖像邊緣檢測、圖像分割、圖像識(shí)別、圖像匹配、圖像分類等工作。人們希望通過對(duì)人工智能算法的研究與開發(fā),更好地完成包括圖像處理在內(nèi)的一系列繁雜的工作。本文研究人工智能算法中的多層神經(jīng)網(wǎng)絡(luò)算法在圖像處理過程中的應(yīng)用,并介紹深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò)在圖像識(shí)別、特征提取中的應(yīng)用。
【關(guān)鍵詞】人工智能;圖像處理;多層神經(jīng)網(wǎng)絡(luò);卷積神經(jīng)網(wǎng)絡(luò)
1人工智能的內(nèi)涵
人工智能的出現(xiàn)是隨著科學(xué)技術(shù)的發(fā)展而興起的,來自美國的尼爾遜教授認(rèn)為“人工智能是一門十分重要的學(xué)科,它是一門研究智能的學(xué)科,它可以將人類的意識(shí)無限的拓展”。溫斯頓教授所提出的定義能夠給我們在人工智能方面的研究提供依據(jù),以便在研究過程中開發(fā)出更加人性化、智能化的技術(shù)來不斷服務(wù)于人類,提高人類的工作效率和生活水平,不斷促進(jìn)社會(huì)經(jīng)濟(jì)的發(fā)展進(jìn)程。
人工神經(jīng)網(wǎng)絡(luò)是一種模擬動(dòng)物神經(jīng)網(wǎng)絡(luò)行為特征,進(jìn)行分布式并行信息處理的算法數(shù)學(xué)模型。在實(shí)際應(yīng)用中可以通過調(diào)整內(nèi)部大量節(jié)點(diǎn)之間相互連接的關(guān)系來達(dá)到處理信息的目的,信息在處理過程中能夠體現(xiàn)出較大的自組織性,因而人工神經(jīng)網(wǎng)絡(luò)具有自組織、自學(xué)習(xí)、自推理和自適應(yīng)等優(yōu)點(diǎn)。該項(xiàng)算法在圖像處理中的應(yīng)用中主要就是實(shí)現(xiàn)對(duì)圖像的壓縮操作,在實(shí)際應(yīng)用中可以在圖像輸出層和輸入層之間、中間傳輸層中分別設(shè)置較多和較少的節(jié)點(diǎn),然后神經(jīng)網(wǎng)絡(luò)計(jì)算法會(huì)神經(jīng)網(wǎng)絡(luò)計(jì)算法,能夠最大程度上節(jié)約儲(chǔ)存的空間,同時(shí)還能夠提高傳輸效率并實(shí)現(xiàn)圖像在輸出層的還原。
2人工神經(jīng)網(wǎng)絡(luò)算法在圖像處理中的應(yīng)用
2.1人工神經(jīng)網(wǎng)絡(luò)
神經(jīng)網(wǎng)絡(luò)算法是人類從動(dòng)物身上所學(xué)到的一種非常有用的算法模型,它所具備的最大的特點(diǎn)就是可以對(duì)信息內(nèi)部的一些具體的信息節(jié)點(diǎn)進(jìn)行分析與處理,然后得到有用的信息。然后通過得到的數(shù)據(jù)信息來達(dá)到對(duì)圖像的處理目的。而人工神經(jīng)網(wǎng)絡(luò)最大的優(yōu)點(diǎn)就是它是具有自身組織的、可以自主進(jìn)行學(xué)習(xí)、自主進(jìn)行推理演算、自身適應(yīng)環(huán)境等。
人工神經(jīng)網(wǎng)絡(luò)在圖像處理方面的應(yīng)用主要如下:
數(shù)據(jù)歸類劃分,使用多層神經(jīng)網(wǎng)絡(luò)可以完美的對(duì)數(shù)據(jù)進(jìn)行劃分,對(duì)標(biāo)有標(biāo)簽的指定類別數(shù)據(jù)點(diǎn)進(jìn)行曲線劃分。區(qū)別于回歸分析,邏輯回歸,K-means劃分,多層神經(jīng)網(wǎng)絡(luò)可用連續(xù)曲線對(duì)目標(biāo)數(shù)據(jù)進(jìn)行分區(qū)。
圖像處理中的圖像壓縮也要用到人工神經(jīng)網(wǎng)絡(luò),在設(shè)置節(jié)點(diǎn)時(shí),設(shè)置比較多的節(jié)點(diǎn)的是圖像的輸出層和圖像的輸入層,設(shè)置比較少的節(jié)點(diǎn)的是圖像的傳輸層。在圖像處理的過程中有些非常重要的作用,使用人工智能算法不僅可以完成存儲(chǔ)和傳輸功能,而且可以在很大程度上節(jié)省許多的存儲(chǔ)空間。
2.2卷積神經(jīng)網(wǎng)絡(luò)
圖像在計(jì)算機(jī)中的存儲(chǔ)形式可簡化為矩陣形式,圖像處理基礎(chǔ)即對(duì)圖像的操作,可以寫成矩陣形式。
在2維卷積中,首先引進(jìn)濾波器矩陣(或者被稱為“核”/“Kernel”),濾波器矩陣可修改或通過過濾增強(qiáng)圖像。過濾原圖像以強(qiáng)調(diào)某些功能或刪除其他功能,或過濾包括平滑,銳化和邊緣增強(qiáng),離散卷積可以視為矩陣的逐元素乘法。通過濾波矩陣的處理后,圖像僅保留了部分特征,而去掉了大部分其他特征。通過對(duì)濾波矩陣的選取可以有目的性的提取圖像內(nèi)圖形的指定特征。
同理,若把濾波器變?yōu)槟康膱D像或指定特征,對(duì)濾波器進(jìn)行人工智能訓(xùn)練,即可對(duì)圖像進(jìn)行特征識(shí)別或定位。對(duì)于定位而言,濾波器層被訓(xùn)練為在每個(gè)空間位置和尺度上預(yù)測邊界框的回歸網(wǎng)絡(luò)代替,然后將回歸預(yù)測與每個(gè)位置的分類結(jié)果相結(jié)合。多尺度訓(xùn)練可確保預(yù)測在尺度上正確匹配,并以指數(shù)方式增加合并預(yù)測的置信度。邊界框根據(jù)其中心之間的距離及其區(qū)域的交點(diǎn)進(jìn)行組合,最后通過采用具有最大類分?jǐn)?shù)的合并邊界框進(jìn)行最終預(yù)測。檢測訓(xùn)練類似于分類訓(xùn)練,但是當(dāng)沒有目標(biāo)存在時(shí),還需要預(yù)測后臺(tái)任務(wù)。傳統(tǒng)上,反例最初被隨機(jī)地用于訓(xùn)練,然后將最有爭議的負(fù)誤差添加到訓(xùn)練集中,通過選擇每個(gè)圖像的一些有趣的反例(例如隨機(jī)的或最有爭議的),對(duì)蒼蠅進(jìn)行消極訓(xùn)練,這種方法在計(jì)算上更昂貴,但使得程序更簡單。
在特征鑒別中,通過訓(xùn)練完成的濾波器矩陣,我們對(duì)整個(gè)原圖進(jìn)行一次卷積,得到的結(jié)果中,在那個(gè)特定曲線和周邊區(qū)域,值就很高,在其他區(qū)域,值相對(duì)低。這就是一張激活圖。對(duì)應(yīng)的高值區(qū)域就是我們所要檢測曲線的位置。在訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)(CNN)的某一個(gè)卷積層時(shí),我們實(shí)際上是在訓(xùn)練一系列的濾波器(或Kernel)。比如對(duì)于一個(gè)28*28的圖像,如果我們在CNN的第一個(gè)卷積層定義訓(xùn)練n個(gè)濾波器,那就這一層的輸出便是28*28*n.按照不同的任務(wù),我們可以對(duì)這個(gè)輸出做進(jìn)一步的處理,這包括激活函數(shù),池化,全連接等。
結(jié)語
綜上所述,隨著人們對(duì)人工智能的不斷研究,越來越多的智能算法不斷興起,而當(dāng)前多層神經(jīng)網(wǎng)絡(luò)算法在圖像處理中應(yīng)用主要為深度學(xué)習(xí)中的卷積神經(jīng)算法通過對(duì)中間層濾波器的訓(xùn)練使其達(dá)到使損失函數(shù)最小化的目的,進(jìn)而實(shí)現(xiàn)對(duì)圖像的識(shí)別、檢測、定位等功能。其能夠在圖像處理中發(fā)揮較大的作用,但是由于人們對(duì)以上算法的不了解,所以應(yīng)用水平較低,基于此,在以后的生產(chǎn)生活中應(yīng)大力推廣人工智能算法的應(yīng)用,不斷提高人們的工作效率,促進(jìn)社會(huì)生產(chǎn)的進(jìn)步。
參考文獻(xiàn):
[1]王玉娟,張海,王先國,潘志宏.人工智能算法在圖像處理中的應(yīng)用[J].電腦知識(shí)與技術(shù),2018,14(19):208-209+212.
[2]陳軻.基于人工智能算法的圖像識(shí)別與生成[J].電腦知識(shí)與技術(shù),2018,14(13):173-175.
[3]王弈,李傳富.人工智能方法在醫(yī)學(xué)圖像處理中的研究新進(jìn)展[J].中國醫(yī)學(xué)物理學(xué)雜志,2017,30(3):4138-4143.
[4]葛動(dòng)元.面向精密制造與檢測的機(jī)器視覺及智能算法研究[D].廣州:華南理工大學(xué),2017.
作者簡介:
趙唯辰 男,漢族,籍貫吉林省長春市,哈爾濱工業(yè)大學(xué)機(jī)械設(shè)計(jì)制造及其自動(dòng)化專業(yè)學(xué)士學(xué)位。大陸集團(tuán) 研發(fā)工程師,研究方向人工智能。
(作者單位:1大陸集團(tuán);2哈爾濱工業(yè)大學(xué);
3清華伯克利深圳學(xué)院)