◆林 菡 邢婷婷 吳帆旭
基于BP神經(jīng)網(wǎng)絡(luò)的閩江口濕地鳥類物種識別的研究
◆林 菡 邢婷婷 吳帆旭
(福建農(nóng)林大學(xué)東方學(xué)院信息工程系 福建350715)
閩江口濕地作為亞太地區(qū)候鳥遷徙途中重要的一處落腳站,不乏有一些易危、瀕?;驑O度瀕危的鳥類,為了研究和保護這些候鳥,本課題以圖像識別技術(shù)的主要方法為背景,采用了一種基于小波變換和KL變換進行候鳥特征提取,并以BP神經(jīng)網(wǎng)絡(luò)作為分類器研究設(shè)計出一套適用于閩江口濕地復(fù)雜環(huán)境下的候鳥識別方案。
BP神經(jīng)網(wǎng)絡(luò);KL變換;小波變換;鳥類識別;分類器
隨著全球環(huán)境的日益惡化,動植物生存環(huán)境破壞嚴(yán)重,許多物種瀕臨滅絕的危險,其中,鳥類物種也因各種因素而遭受危害。為了提高人們對于鳥類的保護意識,人們嘗試?yán)梦锫?lián)網(wǎng)技術(shù)與圖像識別技術(shù)等對鳥類進行觀測與識別,以此達(dá)到保護的目的,但是,目前使用的鑒定研究在實踐中并不十分有效。因此,為了解決鳥類物種鑒定問題,提高識別準(zhǔn)確性,將BP神經(jīng)網(wǎng)絡(luò)引入鳥類物種鑒定分類中。將圖像識別技術(shù)與鳥類觀察與保護相結(jié)合,對鳥類物種鑒定和濕地網(wǎng)絡(luò)保護進行深入研究,具有重要的現(xiàn)實意義和應(yīng)用前景。
一般鳥類調(diào)查主要采用了人工調(diào)查方法,利用人工觀測記錄數(shù)據(jù),包括通過人工進行樣本比對獲取或者通過人工直接計數(shù)來統(tǒng)計信息。這種情況下,需要大量的人力,物力和財力,并且調(diào)查的結(jié)果很容易受到調(diào)查人員視力和聽力等主觀因素的影響。近年來,紅外熱像儀技術(shù)已廣泛應(yīng)用于國內(nèi)外野生動物調(diào)查和監(jiān)測。然而,由于紅外攝像機體積小,飛行速度快,距離地面移動距離長,許多鳥類難以被紅外攝像機捕獲,這增加了調(diào)查和監(jiān)測結(jié)果的不確定性。因此,紅外熱像儀技術(shù)更適用于大中型陸地鳥類的監(jiān)測,對非陸地鳥類的監(jiān)測效果不理想??傊?,傳統(tǒng)的鳥類調(diào)查和監(jiān)測方法存在不同的缺點,有必要研究新的方法來彌補上述缺點。
根據(jù)上述的情況,在這樣的背景下,提出采用一種通過小波變換和KL變換得到鳥類特征,在利用BP神經(jīng)網(wǎng)絡(luò)用于鳥類特征分類,進而識別出鳥類的方法。
由于閩江口濕地環(huán)境和其他不定因素的影響,在通過無線攝像機所采集到的圖像,在進行提取所需要的圖片時可能存在一些噪點,而這些噪點會對后續(xù)的紋理信息的提取造成一定的影響和干擾。因此,為了在提取之前對圖像執(zhí)行中值濾波以盡可能地消除噪聲干擾,對后期的操作的影響降到最低,對于采集到的圖像會進行一次預(yù)處理,使得所得到的圖像更為的明確。
對于閩江口濕地的鳥類進行區(qū)分,可以通過對鳥類的羽色進行判別,因為鳥類最具視覺意義的是其羽毛具有多樣化的圖像特征,因此在提取和選擇圖像特征時,選擇將鳥類羽毛的紋理特征進行特征提取操作,并希望模擬人類視覺識別過程以提取和選擇圖像。通過這樣的來達(dá)到較好的預(yù)期效果。
對于閩江口濕地的鳥類而言,我們在提取它的羽毛紋理特征時,都有一些共同之處,隨著K-L變換在圖像分析處理及圖像識別領(lǐng)域的發(fā)展與廣泛應(yīng)用,我們采用K-L變換對其進行圖像紋理的分析判別。通過使用K-L變換進行圖像紋理分析,也有利于鳥類羽毛紋理特征的提取。
K-L變換通常也被人們叫作主成分變換,由于K-L變換是以一種基于統(tǒng)計學(xué)基本特性的一種變換,旨在尋找任意的符合統(tǒng)計學(xué)分布的數(shù)集中的主要分量的子集,同時它也是一種降維變化,K-L在消除特定特征之間的相關(guān)性,突出不同樣本之間的差異性方面有著極其優(yōu)良的效果,故而選擇使用K-L變換進行鳥類羽毛紋理的差異性特征的提取處理。
其中,算法步驟如下:
( 1 ) 將每副鳥類圖片列化,形成矩陣;
( 2 ) 求出協(xié)方差矩陣的特征值與特征向量;
( 3 ) 選擇對應(yīng)少量最大特征值的特征向量組成特征空間;
( 4 ) 每張鳥類圖片映射為特征空間的某點,以其坐標(biāo)作為特征向量。
其中協(xié)方差矩陣為:
協(xié)方差矩陣與自相關(guān)矩陣之轉(zhuǎn)換關(guān)系為:
自相關(guān)矩陣為:
接下來求出R的特征向量與特征值:
降維至維,取前個特征向量,按照特征值大小從上到下排列形成變換矩陣。
神經(jīng)網(wǎng)絡(luò),又稱人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network)在機器學(xué)習(xí)((Machine Learning)領(lǐng)域,是一種仿生的神經(jīng)網(wǎng)絡(luò),即模仿動物的中樞神經(jīng)系統(tǒng),特別是大腦的結(jié)構(gòu)與功能及其工作方式,是一種人工構(gòu)建的近似于中樞神經(jīng)系統(tǒng)的數(shù)學(xué)/計算模型,可以用來對一些問題進行估計或近似。在絕大多數(shù)的情況下,神經(jīng)網(wǎng)絡(luò)能夠依據(jù)外部信息且在外部信息的基礎(chǔ)之上對其內(nèi)部構(gòu)造做出相應(yīng)的改進與變化,所以其是一種具備學(xué)習(xí)能力的自適應(yīng)的系統(tǒng)。
BP神經(jīng)網(wǎng)絡(luò)(Back Propagation Neural Network)被稱為基于誤差反向傳播算法的人工神經(jīng)網(wǎng)絡(luò)。它是最廣泛使用的人工神經(jīng)網(wǎng)絡(luò)之一。它由輸入層,輸出層和一個或多個隱藏層組成。最常用的BP神經(jīng)網(wǎng)絡(luò)模型是單隱藏層感知器模型,即神經(jīng)網(wǎng)絡(luò)只包括一個輸入層,一個隱藏層和一個輸出層,其拓?fù)浣Y(jié)構(gòu)如圖1所示:
圖1 單隱層 BP 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
同時,BP神經(jīng)網(wǎng)絡(luò)的自學(xué)習(xí)過程是一種類似于有導(dǎo)師進行指導(dǎo)的學(xué)習(xí),其基本構(gòu)造是在輸入層和輸出層之間添加若干層的神經(jīng)元。但是它們并沒有與外部信息直接進行交流,但隨著各項狀態(tài)的變化,它們就會跟著影響到輸入與輸出之間的關(guān)系。并且每一層都可以有若干個神經(jīng)節(jié)點。它的基本思想是輸入信號通過輸入層輸入,輸出層通過隱藏層的計算輸出,輸出值與設(shè)定好的標(biāo)簽值進行比較。誤差反轉(zhuǎn)從輸出層進入到輸入層。然而,神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)通常需要注重重復(fù)訓(xùn)練,同時由于重復(fù)訓(xùn)練的存在就會使誤差值隨著重復(fù)訓(xùn)練的次數(shù)的增加逐漸接近零并最終達(dá)到零。這時才會使輸出與期望一致。因此,BP神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)需要耗費一定量的時間,并且一些學(xué)習(xí)過程必須重復(fù)多次,甚至多達(dá)104(甚至更多)次。原因是神經(jīng)網(wǎng)絡(luò)的權(quán)重系數(shù)W具有許多分量W1,W2,...Wn;也即是一個多參數(shù)修改系統(tǒng)。調(diào)整系統(tǒng)參數(shù)必須耗費時間。目前,提高神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)速度和減少重復(fù)次數(shù)非常重要。這也是實時控制中的關(guān)鍵問題。
在進行鳥類的基本紋理特征的提取后,再根據(jù)提取出來的特征參數(shù)進行訓(xùn)練,采用基于BP神經(jīng)網(wǎng)絡(luò)分類器對鳥進行分類識別.BP神經(jīng)分類器訓(xùn)練步驟為:
( 1 ) 初始化:確定各層神經(jīng)元數(shù)目,隱層節(jié)點的連接強度權(quán)值矩陣W,V隨機賦值,節(jié)點的連接強度;誤差E置零,確定最大迭代次數(shù)、最小誤差。
( 2 ) 輸入訓(xùn)練樣本,得到網(wǎng)絡(luò)的輸出結(jié)果。
( 5 ) 檢查整個神經(jīng)網(wǎng)絡(luò)的中誤差是否達(dá)到需求,是則停止訓(xùn)練,沒有則進入第二步開始訓(xùn)練,達(dá)到一定要求的訓(xùn)練量后停止。如圖2所示:
圖2 部分訓(xùn)練樣本
實驗的硬件平臺為Intel i5-6300HQ CPU,4G內(nèi)存,GTX960 顯卡,軟件系統(tǒng)為Windows 10 操作系統(tǒng),利用MATLAB進行具體的實驗。
閩江河口濕地鳥類共有80余種,本次實驗隨機選取其中30類,自行采集樣本圖像。根據(jù)識別對象要求設(shè)計圖像采集原則如下:①鳥類處于停落狀態(tài);②圖像中的鳥類個體大小、清晰度可以進行鳥類物種辨別;③圖像為彩色圖像。每類采集10幅樣本圖像,合計300 幅圖像,圖像格式為png或jpg格式。經(jīng)圖像預(yù)處理后,每類取5幅作為訓(xùn)練樣本,其余作為測試樣本,共計150個訓(xùn)練樣本,150個測試樣本。
由數(shù)據(jù)我們可以得到,當(dāng)學(xué)習(xí)率在0.31和0.41時,神經(jīng)網(wǎng)絡(luò)的檢測效果較好,當(dāng)學(xué)習(xí)率為0.31,結(jié)點數(shù)為32時,神經(jīng)網(wǎng)絡(luò)的檢測效果為最佳狀。
濕地是一種十分特殊的生態(tài)系統(tǒng),由于濕地永久或季節(jié)性的被水掩蓋或者淹沒,導(dǎo)致濕地中會產(chǎn)生許多的無氧過程(oxygen-free processes)。濕地同時也是陸生生態(tài)系統(tǒng)和水生生態(tài)系統(tǒng)之間的過渡性生態(tài)系統(tǒng),因此濕地與森林、海洋并稱為地球上三大生態(tài)系統(tǒng),在保護物種多樣性等方面,發(fā)揮著極其重要且不可忽視的作用,因為其具有強大的沉積和凈化作用和豐富的鳥類物種,被譽為“地球之腎”、“鳥類的樂園”,是人類最為寶貴的環(huán)境資本之一,同時也是自然界中有生物多樣性和生命力較為強盛的生態(tài)系統(tǒng)之一。
在最近幾年以來,人類對濕地保護的意識進一步增強,濕地不但為鳥類提供了必要的生存環(huán)境,而且與人類的生存與發(fā)展有著十分密切的關(guān)聯(lián)。濕地的保護和研究已經(jīng)成為各個國家的基本認(rèn)識。眾多高校、研究所也為濕地研究成立了相關(guān)的部門
將圖像分析與處理算法和BP神經(jīng)網(wǎng)絡(luò)相結(jié)合運用到鳥類的分類中,在于研究出鳥類的種類分類與自動分類識別系統(tǒng),通過運用K-L變換,提取鳥類的羽毛的基本紋理特征,并通過BP神經(jīng)網(wǎng)絡(luò)進行分析和識別。成功率可以達(dá)到85%以上,本研究方法對鳥類的線上物種識別有著十分重要的實用意義。
[1]紀(jì)陽,張平.無線傳感器網(wǎng)絡(luò)的體系結(jié)構(gòu)[J].中興通訊技術(shù),2005,11(4):32-3576.
[2]J.M.KahnR.H.Katz,and K.S.J.Pister,Emerging Challe-nges:Mobile Networkingfor Smart Dust[J].J.of Commun.and Networks,September 2000,2(3):188-196.
[3]周正.無線傳感器網(wǎng)絡(luò)的節(jié)點自定位技術(shù)[J].中興通訊技術(shù),2005,11(4):51-56.
[4]高紅.BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)率的優(yōu)化方法[J].長春師范學(xué)院學(xué)報(自然科學(xué)版),2010(04).
[5]王華,程海青.自適應(yīng)動量項BP神經(jīng)網(wǎng)絡(luò)盲均衡算法[J].計算機工程與設(shè)計,2010(06).
[6]陳思.BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)率參數(shù)改進方法[J].長春師范學(xué)院學(xué)報(自然科學(xué)版),2010(02).
[7]劉江華,陳佳品,程君實.基于Gabor小波特征提取和支持向量機的人臉識別[J].計算機工程與應(yīng)用,2003(8).
[8]程思寧,武丹丹,張俊芬等.基于小波分析的人臉識別算法[J].長春工業(yè)大學(xué)學(xué)報:自然科學(xué)版,2006(1).
[9]周金萍.MATLAB 6.5圖形圖像處理與應(yīng)用實例[M].科學(xué)出版社,2003.
[10]莊晨輝.濕地與水鳥[M].中國林業(yè)出版社,2009.
[11]何東?。?dāng)?shù)字圖像處理,第2版[M].西安電子科技大學(xué)出版社,2008.
[12]黃志開.彩色圖像特征提取與植物分類研究[D].合肥:中國科學(xué)技術(shù)大學(xué),2006.
福建省教育廳中青年教師教育科研項目(項目編號:JAT170898)。