摘 要:《數(shù)字圖像處理》課程是高校電子信息類專業(yè)重要的專業(yè)選修課程,傳統(tǒng)的教學(xué)內(nèi)容注重理論知識,知識面全面,涉及數(shù)字圖像處理的各個領(lǐng)域,但各個章節(jié)之間的關(guān)聯(lián)性較少,不利于學(xué)生全局掌握數(shù)字圖像處理的基本思想。課程應(yīng)深度結(jié)合人工智能進行教學(xué)方法改革,以計算機視覺的經(jīng)典問題為切入點,結(jié)合當(dāng)前深度學(xué)習(xí)最新熱點技術(shù),設(shè)計合理的實驗,激發(fā)學(xué)生興趣,提高學(xué)生的實踐能力和綜合素質(zhì)。
關(guān)鍵詞:數(shù)字圖像處理;人工智能;教學(xué)方法
近十年來,隨著深度學(xué)習(xí)的快速發(fā)展,以深度學(xué)習(xí)為核心的人工智能技術(shù)取得了顯著進步。人工智能技術(shù)是計算機科學(xué)中一個分支,主要研究模仿人類神經(jīng)系統(tǒng)完成智能任務(wù),尤其是人類的視覺系統(tǒng),因此當(dāng)前人工智能大大推動了計算機視覺的發(fā)展,而計算機視覺的研究與數(shù)字圖像處理有著緊密的聯(lián)系,很多先進模型很大程度上都是基于數(shù)字圖像處理技術(shù),因此在數(shù)字圖像處理的教學(xué)過程中應(yīng)該考慮人工智能的背景,將理論和應(yīng)用相結(jié)合[1,2]。
1 目前的教學(xué)方法
國內(nèi)高校目前采用的教材普遍是岡薩雷斯教授編纂的經(jīng)典教材《數(shù)字圖像處理》[3],筆者也是選用這本教材,在教學(xué)過程中發(fā)現(xiàn)兩個問題:一方面是這本教材雖然內(nèi)容豐富,但是很多方法都是非常簡單,不能很好地應(yīng)用到實際生活的應(yīng)用中,這與當(dāng)前人工智能中計算機視覺的先進算法有很大的差距,雖然這本教材已經(jīng)多次增補再版,但更新速度遠遠跟不上計算機視覺的迅速發(fā)展,因此在教學(xué)過程中應(yīng)該及時將新技術(shù)引入到教授過程,激發(fā)學(xué)生的興趣;另一方面是該教材中講授的各個方面,比如空域操作、圖像分割、圖像增強、小波變換等,各個章節(jié)之間的相關(guān)性不大,每一章對應(yīng)著圖像處理領(lǐng)域一個大的課題,教師在教授過程中多采用針對性的講解,雖然可以將知識點講述的比較清晰,但學(xué)生在學(xué)習(xí)過程中很難形成系統(tǒng)性理解,而實際的圖像處理問題都是一個系統(tǒng)問題,涉及多個技術(shù)的綜合,因此將圖像處理的系統(tǒng)性思想引入課程講授是非常重要的。
當(dāng)前本科數(shù)字圖像課程大部分都有一部分的實驗學(xué)時,作為理論教學(xué)重要的輔助手段。實驗的目的主要體現(xiàn)在以下兩點:一是通過實驗內(nèi)容的設(shè)計和實現(xiàn),能夠很好地幫助學(xué)生理解課堂的理論知識,掌握基本圖像處理的技術(shù)技巧;二是合理的實驗內(nèi)容和可視化的圖像處理結(jié)果,能夠讓學(xué)生直觀觀察圖像處理的實際效果,進而提高對圖像處理的學(xué)習(xí)興趣。然而目前主流的數(shù)字圖像處理實驗采用Matlab語言,憑借其簡單易學(xué)的語言特點和強大的圖像處理工具箱,是數(shù)字圖像處理和模式識別的經(jīng)典教學(xué)語言。
2 人工智能背景下的數(shù)字圖像處理教學(xué)方法兩點思考
通過對目前數(shù)字圖像處理的教學(xué)方法分析,我們有以下兩點思考:
首先,在理論教學(xué)中,數(shù)字圖像處理與當(dāng)前計算機視覺、模式識別和機器學(xué)習(xí)等領(lǐng)域有著非常緊密的聯(lián)系,圖像處理的各個方面都是計算機視覺重要的研究領(lǐng)域,比如圖像增強、圖像語義分割、圖像識別等,而傳統(tǒng)的方法將每個領(lǐng)域單獨講授,不能使學(xué)生更加全面地掌握數(shù)字圖像處理的基本知識,更不能使學(xué)生了解當(dāng)前人工智能的發(fā)展,因此在數(shù)字圖像處理的講授中,在介紹完圖像的基本知識之后,接著介紹一些基本的機器學(xué)習(xí)和模式識別模型,這些模型基本上可以涵蓋后面圖像處理各個章節(jié)的核心算法,這樣就能夠使學(xué)生對數(shù)字圖像處理有一個較為全面地了解,尤其使學(xué)生能夠理解數(shù)字圖像和人工智能之間的關(guān)系。我們以圖像分割和圖像識別為例,傳統(tǒng)的圖像分割分為空域分割和頻域分割,且這兩種分割方法都是簡單的方法,沒有結(jié)合語義信息,而當(dāng)前常用的分割方法為結(jié)合語義信息的分割方法,同時圖像識別也常以支持向量機(SVM)為分類模型,因此在講授時發(fā)現(xiàn)兩者基本沒有聯(lián)系,而實際上,通過對其背后的模型分析,會發(fā)現(xiàn)兩者優(yōu)化學(xué)習(xí)的目標其實是一致的,同時圖像分割可以看作為特殊的圖像識別模型,即通過對待分割的區(qū)域里每一個像素做類別識別,可以達到圖像分割的目的。通過在數(shù)字圖像處理講授過程中,適度適時地傳遞一些機器學(xué)習(xí)和計算機視覺的相關(guān)知識,可以促進學(xué)生對圖像處理有全面系統(tǒng)的認識和理解。
其次,在實驗教學(xué)中,除了基本的理論驗證性實驗外,要以實際應(yīng)用為背景,設(shè)計一些圖像處理的綜合應(yīng)用實驗,同時建議學(xué)生使用Python語言進行程序設(shè)計。Python語言語法簡單、代碼可讀性較強,其圖像處理工具箱功能豐富,且深度學(xué)習(xí)、機器學(xué)習(xí)相關(guān)的Python工具箱較多且成熟,如Tensorflow、Keras、Theano等。在具體的應(yīng)用實驗中,學(xué)生可以融合課程各個章節(jié)的內(nèi)容,通過編程實現(xiàn),可以幫助學(xué)生理解圖像處理的核心算法,培養(yǎng)學(xué)生解決問題的能力。以車牌的圖像識別為例,本實驗設(shè)計涉及圖像的預(yù)處理、車牌區(qū)域的提取、車牌數(shù)字的提取和識別等問題,學(xué)生在實現(xiàn)過程中,可以使用當(dāng)前先進的深度學(xué)習(xí)模型,達到車牌的精確提取和識別。因此在實驗內(nèi)容的設(shè)計中,要設(shè)計一些開放性的實驗,引導(dǎo)學(xué)生使用當(dāng)前熱門的計算機視覺模型,結(jié)合指導(dǎo)老師的指導(dǎo),通過查閱文獻,激發(fā)學(xué)生的學(xué)習(xí)興趣,提高學(xué)生的科技創(chuàng)新能力。
3 結(jié)語
數(shù)字圖像處理作為電子信息類專業(yè)一門專業(yè)選修課程,是學(xué)生了解認識人工智能的重要途徑,本課程應(yīng)緊跟國家人工智能產(chǎn)業(yè)的發(fā)展方向,通過在傳統(tǒng)的理論講授和實驗過程中,融合人工智能的相關(guān)基礎(chǔ)知識,結(jié)合新思想、新方法、新模型,同時設(shè)計基于Python語言的綜合實驗設(shè)計,使學(xué)生能夠適應(yīng)人工智能快速發(fā)展的方向,提高學(xué)生的綜合實踐能力。
參考文獻:
[1]劉君.結(jié)合人工智能的數(shù)字圖像處理教學(xué)改革探討[J].科技創(chuàng)新導(dǎo)報,2018(16):229-232.
[2]梅夢麗.數(shù)字圖像處理技術(shù)及應(yīng)用實踐研究[J].科技風(fēng),2019(3):82.
[3]RC Gonzalez,RE Woods,SL Eddins.阮秋琦譯.國外電子與通信教材系列:數(shù)字圖像處理(MATLAB版)[M].北京:電子工業(yè)出版社,2014(2版).
作者簡介:酒明遠(1987-),男,漢族,河南濟源人,博士,講師,研究方向:圖像處理、模式識別、機器學(xué)習(xí)。