• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    關(guān)于深度卷積神經(jīng)網(wǎng)絡(luò)在計(jì)算機(jī)視覺中的應(yīng)用研究

    2020-08-13 16:32:21茹鮮古麗·蘇來滿
    數(shù)碼世界 2020年6期
    關(guān)鍵詞:計(jì)算機(jī)視覺神經(jīng)網(wǎng)絡(luò)

    茹鮮古麗·蘇來滿

    摘要:隨著我國科學(xué)技術(shù)的不斷發(fā)展演變,深度卷積神經(jīng)網(wǎng)絡(luò)在流行全球的深度學(xué)習(xí)領(lǐng)域中顯得尤為活躍,它擁有傳統(tǒng)機(jī)器無法比擬的豐富網(wǎng)絡(luò)結(jié)構(gòu)。特別是在模型和算法上對(duì)計(jì)算機(jī)視覺識(shí)別能力的提高起到重要作用。基于此,本文將對(duì)深度卷積神經(jīng)網(wǎng)絡(luò)在計(jì)算機(jī)視覺中的應(yīng)用進(jìn)行研究。

    關(guān)鍵詞:神經(jīng)網(wǎng)絡(luò) 計(jì)算機(jī)視覺 深度卷積

    一、深度卷積神經(jīng)網(wǎng)絡(luò)

    卷積神經(jīng)網(wǎng)絡(luò)可理解成是一種前饋網(wǎng)絡(luò),屬于人工神經(jīng)網(wǎng)絡(luò)的一種。在網(wǎng)路中,每個(gè)神經(jīng)元相繼從輸入層開始逐級(jí)傳遞,最終達(dá)到輸出層,這種傳遞是不可逆的,即它只朝著一個(gè)方向傳遞,所以無法形成循環(huán),也就是沒有周期性。

    二、深度卷積神經(jīng)網(wǎng)絡(luò)在計(jì)算機(jī)視覺中的應(yīng)用

    (一)卷積神經(jīng)網(wǎng)絡(luò)的原理和結(jié)構(gòu)

    計(jì)算機(jī)圖像識(shí)別是通過卷積神經(jīng)網(wǎng)絡(luò)的三個(gè)層次結(jié)構(gòu)(卷積層、池化層、全連接層)的堆疊來實(shí)現(xiàn)的。

    1. 卷積層

    上圖所描述的是卷積層對(duì)原始圖像的處理結(jié)果,卷積的過程也是圖像特征提取的過程。

    圖中5×5的格子表示原始圖像,黃色小九宮格(3×3)代表一個(gè)濾波器覆蓋原始圖像的范圍(它的大小可以通過人工來設(shè)置)。并伴隨著處理的進(jìn)程,不斷沿著圖像的長和寬,以單位距離滑動(dòng),即如果設(shè)置滑動(dòng)距離為1,那么濾波器每次就會(huì)移動(dòng)1個(gè)小方格。右側(cè)的圖表示對(duì)圖像處理的卷積結(jié)果。隨著濾波器在原始圖像中不斷滑動(dòng),逐漸形成一個(gè)二維激活圖像。

    這里我們會(huì)發(fā)現(xiàn),得到的輸出圖像明顯小于原始圖像。也就是說,在每次卷積之后,輸出的尺寸會(huì)減少。為了讓輸出圖像尺寸與原始圖像尺寸相同,我們可以在輸出圖像的邊界添加數(shù)字0。結(jié)合上面的例子,我們把3×3圖片的每條邊上添加2排0,那么根據(jù)公式[(N-F +2P)/S]+1,就會(huì)得出與原始圖像一樣的尺寸。其中,N=原始圖像邊長;F=濾波器的邊長;P=添加0的長度;S=濾波器滑動(dòng)距離。但濾波器所提取的只是原始局部圖像,其中輸出深度與使用的濾波器的數(shù)量保持一致。

    2. 池化層

    與卷積層的濾波器作用相同,池化層同樣有個(gè)可滑動(dòng)的操作窗口,通過窗口的滑動(dòng)來獲得輸入結(jié)果,但這種輸出是在窗口大小的原始信息中提取最大值(最常見的池化有平均池化和最大池化,其中最大池化是最常使用的)為什么是2×2的窗口?因?yàn)樵诔鼗瘜又校@個(gè)比例的窗口是最常用的,而且人工設(shè)置的滑動(dòng)距離也是2。但這樣的池化效果會(huì)有效嗎,畢竟操作過程中,失去了更多的內(nèi)容。根據(jù)卷積神經(jīng)網(wǎng)絡(luò)的性質(zhì)來分析,被檢測(cè)的局部圖片特征,可以判斷圖片的類別。也可以理解成,由于圖像中局部領(lǐng)域具有一定的特征,并利用圖片特征的不變性,即通過向下采樣,來保證圖片的性質(zhì)基本不變。

    3. 全連接層

    經(jīng)過多輪的卷積層和池化層的處理之后,原始圖像中的信息被抽象成為信息含量更高的特征圖像,也就是輸出圖像。整個(gè)過程,就是卷積層和池化層對(duì)原始信息逐層提取圖像特征的過程。

    原始輸入圖是一張28×28大小的圖像,其中卷積層C1有6個(gè)5×5的濾波器,因?yàn)榫矸e層C1輸出6個(gè)大小的特征圖(公式為28-5+1=24,24×24,該數(shù)值代表每條邊的長度)。

    然后經(jīng)過池化層S1(我們假設(shè)池化層S1進(jìn)行平均值池化),中間的加偏置(每種特征圖有一個(gè)偏置)和Sigmoid函數(shù)激活操作省略,只是對(duì)卷積和池化過程做闡述。因此,池化層S1輸出的6個(gè)特征圖大小為(12×12)。

    接下來,在卷積層C2中,就會(huì)輸入6個(gè)特征圖,但與卷積層C1是不一樣的,因?yàn)榫矸e層C1只有一個(gè)特征圖,而卷積層C2有12個(gè)5×5濾波器,每個(gè)濾波器會(huì)與上一層(即S1層)的6個(gè)特征圖分別做卷積(根據(jù)實(shí)際情況也可以挑選幾種特征圖來做卷積),然后將得出的6個(gè)結(jié)果進(jìn)行求和計(jì)算,進(jìn)而形成一個(gè)新的特征圖。也就是說,卷積層C2有12個(gè)大小為(12-5+1=8,8×8)的特征圖,并進(jìn)入池化層S2。

    同樣道理,S2層有12個(gè)大小為(4×4)的特征圖。輸出層把S2層的特征圖變成一個(gè)向量,該向量的長度等于192(12×4×4),并把該向量當(dāng)成一個(gè)輸入點(diǎn),進(jìn)一步與下面的其它層進(jìn)行全連接和分類等操作。

    簡單總結(jié)一下就是,卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN),是把一個(gè)原始圖像,經(jīng)過多次卷積和池化后,逐漸轉(zhuǎn)變成一個(gè)向量,然后將該向量與其他網(wǎng)絡(luò)相連接。

    (二)圖像分類

    我們?cè)趯?duì)卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于圖像進(jìn)行分類時(shí),通常會(huì)在神經(jīng)網(wǎng)絡(luò)的最后一層,即全連接層的后面接一個(gè)Softmax分類器用于圖像標(biāo)簽的預(yù)測(cè)。所謂的圖像分類就是,通過將圖像集合對(duì)比分析,然后根據(jù)具體圖像特點(diǎn),進(jìn)行若干個(gè)不同種類的劃分操作,這個(gè)過程被稱作圖像分類。一般的圖像分類方式會(huì)涉及到較為復(fù)雜的函數(shù)計(jì)算,這里不做詳細(xì)說明。

    為了對(duì)圖像分類算法進(jìn)行合理性評(píng)估,從2012年起,每年都會(huì)舉辦圖像分類競(jìng)賽。以SIFT和LBP為例,通過對(duì)圖像特征進(jìn)行信息提取,然后將提取結(jié)果應(yīng)用到具體分類器中,在2010年和2011年的競(jìng)賽中,使用這種方法將錯(cuò)誤率控制在26.7%,這是一個(gè)十分了不起的成就。但更令人驚訝的事情還在后面,隨著Alex在2012年的競(jìng)賽中提出AlexNet,通過在圖像分類中應(yīng)用深度學(xué)習(xí),以創(chuàng)紀(jì)錄的成績?nèi)〉玫谝幻ㄥe(cuò)誤率在16.3%),這個(gè)成績比前一年下降近11個(gè)百分點(diǎn)。從2012年開始,深度學(xué)習(xí)模型在圖像識(shí)別中大展拳腳,逐漸得到更廣泛的認(rèn)可。

    (三)物體監(jiān)測(cè)

    由于計(jì)算機(jī)視覺領(lǐng)域的特殊性,使物體監(jiān)測(cè)過程變得十分復(fù)雜。因?yàn)閺挠?jì)算機(jī)的視角出發(fā),一張圖像,物體會(huì)以多種類型呈現(xiàn),這就需要對(duì)所有類型的圖像一一進(jìn)行識(shí)別,并單獨(dú)定位,在無形中增加了工作量,而且還不一定能夠保證效果質(zhì)量。目前看來,將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于物體模型檢測(cè)存在以下兩個(gè)問題:一個(gè)是在選擇區(qū)域進(jìn)行分類與總結(jié);另一個(gè)是如何進(jìn)行區(qū)域選擇,因此物體檢測(cè)工作與圖像分類工作相比,其難度可想而知。另外從操作內(nèi)容來看,在實(shí)際解決問題中遇到的步驟流程與圖像分類相比也是復(fù)雜繁瑣,對(duì)模型的要求更高,算法更加深?yuàn)W,標(biāo)準(zhǔn)自然更多。若想在實(shí)踐操作工程中更好的去應(yīng)用,除了要從網(wǎng)絡(luò)結(jié)構(gòu)方面進(jìn)行改進(jìn)外,還要優(yōu)化模型的流程方法。

    三、結(jié)束語

    綜上所述,通過對(duì)卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和原理的學(xué)習(xí),使我們很好的認(rèn)識(shí)了圖像識(shí)別、分類及特征提取。但到目前為止,人們對(duì)深度學(xué)習(xí)的應(yīng)用還停留在簡單的推理計(jì)算程度,雖然在圖像語音領(lǐng)域取得了一定的成果,但能否完整有效的應(yīng)用在其他領(lǐng)域,還需要我們不斷的研究與探索。

    參考文獻(xiàn)

    [1]楊風(fēng)光.深度卷積神經(jīng)網(wǎng)絡(luò)在計(jì)算機(jī)視覺領(lǐng)域的應(yīng)用[J].計(jì)算機(jī)與網(wǎng)絡(luò),2020,46(04):40-41.

    [2]張順,龔怡宏,王進(jìn)軍.深度卷積神經(jīng)網(wǎng)絡(luò)的發(fā)展及其在計(jì)算機(jī)視覺領(lǐng)域的應(yīng)用[J].計(jì)算機(jī)學(xué)報(bào),2019,42(03):453-482.

    猜你喜歡
    計(jì)算機(jī)視覺神經(jīng)網(wǎng)絡(luò)
    神經(jīng)網(wǎng)絡(luò)抑制無線通信干擾探究
    電子制作(2019年19期)2019-11-23 08:42:00
    基于深度卷積神經(jīng)網(wǎng)絡(luò)的物體識(shí)別算法
    雙目攝像頭在識(shí)別物體大小方面的應(yīng)用
    機(jī)器視覺技術(shù)發(fā)展及其工業(yè)應(yīng)用
    危險(xiǎn)氣體罐車液位計(jì)算機(jī)視覺監(jiān)控識(shí)別報(bào)警系統(tǒng)設(shè)計(jì)
    計(jì)算機(jī)視覺在交通領(lǐng)域的應(yīng)用
    基于計(jì)算機(jī)視覺的細(xì)小顆粒團(tuán)重量測(cè)量的研究
    基于神經(jīng)網(wǎng)絡(luò)的拉矯機(jī)控制模型建立
    復(fù)數(shù)神經(jīng)網(wǎng)絡(luò)在基于WiFi的室內(nèi)LBS應(yīng)用
    基于支持向量機(jī)回歸和RBF神經(jīng)網(wǎng)絡(luò)的PID整定
    冕宁县| 乳山市| 任丘市| 吉安县| 千阳县| 独山县| 凤阳县| 郁南县| 台湾省| 湘潭市| 洪湖市| 福贡县| 九江县| 疏附县| 安顺市| 禹州市| 阳泉市| 同仁县| 汾阳市| 海晏县| 乌拉特中旗| 克什克腾旗| 禹州市| 襄樊市| 滁州市| 盐池县| 玉环县| 青海省| 北票市| 荆州市| 丽江市| 宁蒗| 六盘水市| 泰州市| 芜湖市| 武清区| 宁陵县| 曲阜市| 南皮县| 攀枝花市| 九江市|