◆張國(guó)棟
?
基于深度學(xué)習(xí)的圖像特征學(xué)習(xí)和分類(lèi)方法的研究及應(yīng)用
◆張國(guó)棟
(北京科技大學(xué) 北京 100083)
當(dāng)前,在我國(guó)人工智能發(fā)展的過(guò)程當(dāng)中,深度學(xué)習(xí)是研究的一個(gè)主要方向。本文嘗試從深度學(xué)習(xí)的基本內(nèi)涵出發(fā),進(jìn)一步地探討圖像特征學(xué)習(xí)和分類(lèi)方法相關(guān)的研究以及具體的應(yīng)用。
深度學(xué)習(xí);圖像特征學(xué)習(xí);分類(lèi)方法
目前,在學(xué)術(shù)領(lǐng)域,評(píng)價(jià)人工智能的一個(gè)主要指標(biāo)是其所具有的學(xué)習(xí)力系統(tǒng)能否隨著經(jīng)驗(yàn)的積累而不斷進(jìn)行自身的學(xué)習(xí)能力的提升。尤其是,隨著科學(xué)技術(shù)的不斷發(fā)展,大數(shù)據(jù)時(shí)代已經(jīng)到來(lái),在為深度學(xué)習(xí)等相關(guān)人工智能技術(shù)提供巨大發(fā)展契機(jī)的同時(shí),也為深度學(xué)習(xí)環(huán)境下的圖像特征學(xué)習(xí)和分類(lèi)展開(kāi)深層次的應(yīng)用研究提供了新的思路。本文基于深度學(xué)習(xí)的基本內(nèi)涵,探討圖像特征學(xué)習(xí)和分類(lèi)方法的應(yīng)用,對(duì)于促進(jìn)該領(lǐng)域相關(guān)研究的深入和完善有著一定的現(xiàn)實(shí)借鑒意義。
深度學(xué)習(xí),從某種角度上,可以理解為一種經(jīng)驗(yàn)數(shù)據(jù)的自我提升的過(guò)程。從宏觀(guān)角度來(lái)看,深度學(xué)習(xí)可以借助較為復(fù)雜的模型來(lái)處理大規(guī)模的數(shù)據(jù)分析任務(wù)。同時(shí),通過(guò)對(duì)原始的數(shù)據(jù)產(chǎn)生影響,進(jìn)行著更加復(fù)雜的分析。
從機(jī)器學(xué)習(xí)的角度來(lái)看,深度學(xué)習(xí)主要是一種對(duì)相關(guān)數(shù)據(jù)的表征進(jìn)行學(xué)習(xí)的方法,通過(guò)對(duì)表征所體現(xiàn)出來(lái)的向量以及特定的形狀區(qū)域來(lái)進(jìn)行綜合分析來(lái)完成相應(yīng)的學(xué)習(xí)任務(wù)。深度學(xué)習(xí)可以借助監(jiān)督和非監(jiān)督式的方式來(lái)完成,在進(jìn)行深度學(xué)習(xí)的過(guò)程中,也可以借助特征提取的來(lái)對(duì)過(guò)往的手工特征的獲取的方式進(jìn)行替代。
從本質(zhì)上來(lái)看,進(jìn)行深度學(xué)習(xí)其主要目的是對(duì)人腦的神經(jīng)網(wǎng)絡(luò)進(jìn)行模擬,從而更好地提高人工智能水平。在進(jìn)行深度學(xué)習(xí)過(guò)程當(dāng)中,一般來(lái)說(shuō)會(huì)主要面臨以下幾個(gè)方面的問(wèn)題:例如,人腦本身就具有一定的深度,另外,在人腦進(jìn)行認(rèn)知的過(guò)程當(dāng)中會(huì)呈現(xiàn)出不斷出逐層遞進(jìn)的過(guò)程。同時(shí),如果深度不夠,相關(guān)的學(xué)習(xí)效果也會(huì)受到一定的影響。從目前來(lái)看,深度學(xué)習(xí)主要應(yīng)用在計(jì)算機(jī)視覺(jué)、語(yǔ)音識(shí)別、以及相關(guān)語(yǔ)言處理等諸多領(lǐng)域。
在深度學(xué)習(xí)領(lǐng)域,圖像特征學(xué)習(xí)是當(dāng)前該領(lǐng)域研究的主要方向。隨著整個(gè)互聯(lián)網(wǎng)信息的不斷發(fā)展,圖像的捕捉以及圖像的識(shí)別是深度學(xué)習(xí)當(dāng)前研究的主要方向。需要強(qiáng)調(diào)的是,圖像學(xué)習(xí)尤其是圖像特征學(xué)習(xí)作為深度學(xué)習(xí)應(yīng)用的一個(gè)主要方向,其所具有的方法主要體現(xiàn)在以下幾個(gè)方面:
基于深度學(xué)習(xí)背景下,圖像特征學(xué)習(xí)過(guò)程當(dāng)中,單層特征學(xué)習(xí)方法擁有較為廣闊的應(yīng)用前景。該方法主要依托神經(jīng)網(wǎng)絡(luò)模型,在此基礎(chǔ)上,進(jìn)行多層網(wǎng)絡(luò)的構(gòu)建。目前,在進(jìn)行人工神經(jīng)網(wǎng)絡(luò)等相關(guān)領(lǐng)域研究時(shí),科學(xué)家主要是以仿生和神經(jīng)網(wǎng)絡(luò)計(jì)算作為主要的研究主線(xiàn)。在仿生基礎(chǔ)上,主要是探討神經(jīng)元能否被視為隨機(jī)變量,通過(guò)概率圖模型的構(gòu)建來(lái)有效地進(jìn)行相關(guān)模型及參數(shù)的分析。需要強(qiáng)調(diào)的是,在原有的手工特征學(xué)習(xí)中,相關(guān)的學(xué)習(xí)方法,隨著神經(jīng)網(wǎng)絡(luò)技術(shù)發(fā)展已經(jīng)不斷完善。特別是針對(duì)原有神經(jīng)網(wǎng)絡(luò)一些不足,通過(guò)必要的訓(xùn)練,可以達(dá)到理想的效果和目的。這也是當(dāng)前神經(jīng)網(wǎng)絡(luò)相關(guān)技術(shù)不斷向前發(fā)展的過(guò)程中所面臨的一個(gè)主要挑戰(zhàn)。
在進(jìn)行深度學(xué)習(xí)的過(guò)程當(dāng)中,圖像特征學(xué)習(xí)還可以通過(guò)借助多層特征學(xué)習(xí)的方法來(lái)完成。其中主要是借助子空間學(xué)習(xí)的方式來(lái)進(jìn)行完成。這一方法主要是進(jìn)行降維空間中的相關(guān)數(shù)據(jù)本質(zhì)進(jìn)行分析,也可以理解為降維算法。傳統(tǒng)的降維算法,主要是進(jìn)行相關(guān)投影矩陣的分析來(lái)進(jìn)行相關(guān)轉(zhuǎn)換數(shù)據(jù)的獲得。通過(guò)借助“全局塊”模型的構(gòu)建來(lái)實(shí)現(xiàn)整個(gè)構(gòu)建過(guò)程當(dāng)中的優(yōu)化。需要強(qiáng)調(diào)的是,在進(jìn)行這種多層學(xué)習(xí)過(guò)程當(dāng)中,一方面,需要借助大量的訓(xùn)練樣本;另一方面對(duì)神經(jīng)網(wǎng)絡(luò)提出更高的要求。在進(jìn)行深度學(xué)習(xí)過(guò)程當(dāng)中,無(wú)論是單層特征的學(xué)習(xí),還是多層特征的學(xué)習(xí),其主要的目的是為實(shí)現(xiàn)人工智能的深化和發(fā)展。
為了更好地把握在深度學(xué)習(xí)背景下圖像特征的學(xué)習(xí)和分類(lèi)方法,在具體的應(yīng)用過(guò)程當(dāng)中,應(yīng)該充分借助反向傳播中的相關(guān)系統(tǒng)來(lái)進(jìn)行激活函數(shù)以及卷積層和聚合層的使用等等。通過(guò)這種方式來(lái)有效地對(duì)深度的神經(jīng)網(wǎng)絡(luò)進(jìn)行系統(tǒng)的訓(xùn)練。同時(shí),還需要借助必要的幾種損失函數(shù)以及最大間隔最小分類(lèi)誤差等來(lái)進(jìn)行深度學(xué)習(xí)的相關(guān)訓(xùn)練。通過(guò)引入多任務(wù)的深度卷積網(wǎng)絡(luò),進(jìn)一步地強(qiáng)化多任務(wù)背景下,深度學(xué)習(xí)在特征學(xué)習(xí)與分類(lèi)中的提高。
在進(jìn)行深度學(xué)習(xí)過(guò)程當(dāng)中,圖像分類(lèi)主要是對(duì)整個(gè)圖像的語(yǔ)義內(nèi)容進(jìn)行宏觀(guān)層面的判定。在當(dāng)前整個(gè)市場(chǎng)領(lǐng)域,圖像分類(lèi)無(wú)論是在信息檢索,還是在用戶(hù)需求分析領(lǐng)域都擁有著較大的應(yīng)用潛力。
在傳統(tǒng)的圖像分類(lèi)中,2009年主要是通過(guò)表征圖像以及大規(guī)模的數(shù)據(jù)訓(xùn)練來(lái)進(jìn)行圖像分類(lèi)。但是,這種圖像分類(lèi)的方法,由于是在不同目標(biāo)函數(shù)的指導(dǎo)下,通過(guò)分開(kāi)訓(xùn)練所得的,因此,無(wú)法進(jìn)行有效的聯(lián)合。到2002年,以卷積神經(jīng)網(wǎng)絡(luò)為代表的深度學(xué)習(xí)算法被廣泛的使用在圖像的識(shí)別中。斯坦福大學(xué)的相關(guān)研究人員,也進(jìn)一步發(fā)現(xiàn)了卷積神經(jīng)網(wǎng)絡(luò)所具有的優(yōu)勢(shì)。在今后的深度學(xué)習(xí)基礎(chǔ)上,圖像的分類(lèi)也將會(huì)呈現(xiàn)出更加專(zhuān)業(yè)化、多元化、科學(xué)化的發(fā)展方向。尤其是,當(dāng)前我國(guó)著名的搜索引擎開(kāi)發(fā)商百度,通過(guò)建立擁有更為豐富信息源的圖像數(shù)據(jù)庫(kù),結(jié)合深度學(xué)習(xí)相關(guān)算法來(lái)進(jìn)行圖像的分類(lèi)和過(guò)濾,其整體的分類(lèi)精確度已經(jīng)達(dá)到了百分之九十以上。
在今后的深度學(xué)習(xí)不斷提升的過(guò)程當(dāng)中,圖像特征學(xué)習(xí)和分類(lèi)也將呈現(xiàn)出更加廣闊的應(yīng)用空間。從當(dāng)前比較熱門(mén)的無(wú)人駕駛來(lái)看,通過(guò)借助深度學(xué)習(xí),幫助計(jì)算機(jī)相關(guān)系統(tǒng)來(lái)有效地了解道路交通情況,各種路標(biāo)以及意外緊急情況的妥善處理等等。通過(guò)這種方式不斷地完善自我的識(shí)別檢測(cè)能力,從而更好地滿(mǎn)足深度學(xué)習(xí)的要求。
在進(jìn)行圖像特征學(xué)習(xí)中,需要明確特征的內(nèi)涵。目前,在整個(gè)學(xué)術(shù)領(lǐng)域,圍繞圖像特征的研究,主要是相關(guān)的手工特征以及在計(jì)算機(jī)視覺(jué)領(lǐng)域中所呈現(xiàn)出來(lái)的表觀(guān)特征為研究對(duì)象。在深度學(xué)習(xí)背景下,無(wú)論是直方圖,還是物體檢測(cè)方面都可以有效地進(jìn)行特征的投影,從而取得相應(yīng)的效果。例如,在機(jī)器人應(yīng)用在尋路系統(tǒng)中,就有著重要的特征學(xué)習(xí)和分析能力的提升參數(shù)。從以上的數(shù)據(jù)任務(wù)和學(xué)習(xí)中,需要不斷地對(duì)原有的特征分析方法進(jìn)行有效的深化,從而進(jìn)一步地得到相關(guān)景深圖像的大小、邊緣等具體特征。
總之,當(dāng)前在整個(gè)深度學(xué)習(xí)領(lǐng)域,圍繞圖像特征學(xué)習(xí)以及分類(lèi)方法研究已經(jīng)取得了系統(tǒng)的成果,尤其是在單特征編碼以及深度卷積網(wǎng)絡(luò)方面都產(chǎn)生了不少的研究成果。本文從深度學(xué)習(xí)基本內(nèi)涵出發(fā),對(duì)圖像特征學(xué)習(xí)和分類(lèi)方法進(jìn)行系統(tǒng)的研究,對(duì)于促進(jìn)該領(lǐng)域相關(guān)研究的深入和完善有著一定的現(xiàn)實(shí)借鑒意義。
[1]馮子勇.基于深度學(xué)習(xí)的圖像特征學(xué)習(xí)和分類(lèi)方法的研究及應(yīng)用[D].廣東:華南理工大學(xué),2016.
[2]趙永威,李婷,藺博宇.基于深度學(xué)習(xí)編碼模型的圖像分類(lèi)方法[J].四川大學(xué)學(xué)報(bào)(工程科學(xué)版),2017.
[3]張洪群.一種基于深度學(xué)習(xí)的半監(jiān)督遙感圖像檢索方法[J].遙感學(xué)報(bào),2017.
[4]李琳,余勝生.基于深度學(xué)習(xí)模型的圖像質(zhì)量評(píng)價(jià)方法[J].華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版),2016.
[5]倪嘉成,許悅雷,田元榮.基于深度學(xué)習(xí)的MINST手寫(xiě)體字符分類(lèi)研究[C].全國(guó)圖象圖形聯(lián)合學(xué)術(shù)會(huì)議,2013.