郝思媛 周立儉 趙琨
【摘 要】目前,深度學習方法在圖像處理、計算機視覺以及機器學習都得到了廣泛的應用。然而,如何應用深度學習方法解決圖像處理過程中的實際問題成為了學生們關(guān)注的焦點問題。本文以深度學習技術(shù)為主要脈絡,研究如何有效提高圖像處理課堂質(zhì)量。希望可以為促進圖像處理行業(yè)的快速發(fā)展提供一些參考和意見。
【關(guān)鍵詞】深度學習;圖像處理
在圖像處理過程中,特征表達與融合技術(shù)是實現(xiàn)圖像智能解譯過程中一個非常重要的環(huán)節(jié),直接影響到圖像解譯精度。然而,當前的特征提取方法往往忽略了圖像的深層語義信息,解譯準確度受到了極大的影響。深度學習理論的出現(xiàn)可以有效地解決這一問題,為圖像特征學習提供可靠的技術(shù)保障,提取的特征更為抽象、魯棒性更強且不受周圍環(huán)境變化的影響。并且,完備的深度學習理論體系、豐富的網(wǎng)絡模型、有效的在線研發(fā)工具、開放的應用案例都為深度學習引入高光譜圖像處理中提供了必要的條件。
1 深度學習的技術(shù)概述
1.1 深度學習的發(fā)展
1965年,Ivakhnenko和Lapa提出多層非線性特征模型,可認為是最早的深度學習模型,但是該模型沒有使用后向傳播算法對網(wǎng)絡進行訓練,且層與層之間也沒有關(guān)聯(lián)性[1]。隨后,F(xiàn)ukushima提出了最早的卷積神經(jīng)網(wǎng)絡,包含多個卷積層和池層,但是該算法使用不斷加強的策略訓練網(wǎng)絡,需要人工分配大權(quán)重給圖像中的重要特征[2]。1989年,LeCun將卷積神經(jīng)網(wǎng)絡與后向傳播算法結(jié)合,利用“LeNet”網(wǎng)絡對數(shù)字圖像進行分類。隨后,梯度消失問題使深度學習的發(fā)展出現(xiàn)了空檔,直到2006年,Hinton和他的學生Salakhutdinov在頂尖學術(shù)刊物《科學》上發(fā)表了一篇文章,深度學習得到了全面的發(fā)展[3]。2015年,甚至有深度學習方面的專家預言“深度學習和機器智能”將會席卷全球,被應用于各個領(lǐng)域。Microsoft、IBM、Yahoo、百度等大公司爭相成立了深度學習研究團隊,將深度學習技術(shù)應用于語音識別、人臉識別、圖像分類以及在線工具的研發(fā)中。說明深度學習發(fā)展的迅猛勢頭以及其對未來科技發(fā)展的重要作用[4]。
1.2 典型深度學習算法
自編碼器和卷積神經(jīng)網(wǎng)絡是最為常用的深度學習方法,詳細介紹如下:
1)自編碼器:是基于單像元(向量)的深度學習網(wǎng)絡,先通過線性或非線性映射將輸入層的數(shù)據(jù)映射到隱層得到相應的隱層表示形式,然后輸出層通過最小化重構(gòu)誤差來對隱層表示進行重構(gòu)原數(shù)據(jù)。在此過程中,隱層表示可以理解為原像元的一種隱層特征,較傳統(tǒng)特征提取方法(如PCA),隱層表示具有抽象性、魯棒性、自適應性等特點。因此,自編碼器已被廣泛用于圖像特征提取領(lǐng)域。
2)卷積神經(jīng)網(wǎng)絡是基于圖像塊的深度學習網(wǎng)絡,輸入是包含豐富空間鄰域信息的圖像塊,因此通常利用卷積神經(jīng)網(wǎng)絡來提取圖像的空間特征。此外,不同于自編碼器的全連接網(wǎng)絡,卷積神經(jīng)網(wǎng)絡采用局部連接和權(quán)值共享極大地降低了計算復雜度,成為目前應用最為廣泛的深度學習網(wǎng)絡。在考慮圖像的空間紋理特征時,卷積神經(jīng)網(wǎng)絡是最為常用且有效的圖像特征提取方法。
2 在“圖像處理”中具體應用
在圖像處理課程的學習過程中,學生所掌握的方法不能直觀地體現(xiàn)在應用中,因此如何建立理論與應用的橋梁有助于學生更好地理解課程。筆者認為深度學習理論與方法對圖像處理課程的學習至關(guān)重要。
2.1 通過實踐激發(fā)學生學習興趣
以自然圖像為例,首先讓學生們了解什么是自然圖像。通過與灰色圖像、高光譜圖像進行對比,學習自然圖像的基本特點,了解構(gòu)成自然圖像數(shù)據(jù)的特點。做到可以利用有效的視圖工具將圖像的不同彩色波段進行顯示。這是圖像處理課程的基本要求。
在了解自然圖像特征之后,利用Matlab編程語言實現(xiàn)圖像處理課程涉及的特征提取方法以及分類方法。然后,利用自編碼器和卷積神經(jīng)網(wǎng)絡對該自然圖像進行處理,提取圖像的深層語義特征,且與傳統(tǒng)的圖像特征進行對比,有益于學生更加深刻地理解深層語義特征的概念。當然在此過程中,學生也對深度學習網(wǎng)絡的搭建、訓練以及測試形成一個較為詳細的了解。
學生在處理過程中,按照“發(fā)現(xiàn)問題解決問題”的模式真正理解圖像處理中的關(guān)鍵問題,同時對深度學習方法有了一個較為全面的認識。通過實踐的方法解決學生在學習圖像處理課程中的重點難點問題。
2.2 利用現(xiàn)代技術(shù)進行教學改革
隨著技術(shù)的不斷發(fā)展,學校對課堂基礎設施的不斷投入,老師們就需要利用各種先進的現(xiàn)代化技術(shù)提高學生的課堂質(zhì)量,調(diào)動學生的興趣。
目前,出現(xiàn)了許多新型手機APP平臺,其非常適用于高校教師,如對分易、校園集結(jié)號等。APP平臺的靈活運用可以有效地促進學生與老師之間的互動。在圖像處理的學習中,也可以引入各種APP管理軟件,將課堂的重點、難點展示給學生。
3 結(jié)論
通過將深度學習方法引入到圖像處理的課程中,可以提高學生的學習興趣。同時,為學生的后續(xù)深造提供了基礎鋪墊作用。
【參考文獻】
[1]A.G.Ivakhnenko, V. G. Lapa. Cybernetic Predicting Devices[J].Transdex,1965.
[2]K.Fukushima.Neocognitron:A self-organizing neural network model for a mechanism of pattern recognition unaffected by shift in position[J].Biol.Cybern. 1980,36:193-202.
[3]Hinton,G.E.and Salakhutdinov, R. R.. Reducing the dimensionality of data with neural networks[J].Science,2006,313(5786):504-507.
[4]陳濤,牛瑞卿,李平湘,張良培.基于人工神經(jīng)網(wǎng)絡的植被覆蓋遙感反演方法研究[J].遙感技術(shù)與應用,2010,25(1):24-30.
[責任編輯:朱麗娜]endprint