劉 超,林壽英,王彩霞,李新亮,張曉青,謝奕濤
(1.福建農(nóng)林大學(xué),福建 福州350002; 2.閩江學(xué)院,福建 福州350108)
中華蜜蜂(Chinese bee),簡稱中華蜂,屬于蜜蜂科藥用最廣的昆蟲之一,其自身的價值以及采集到的蜂蜜均被用于醫(yī)療和養(yǎng)生領(lǐng)域數(shù)年之久。在醫(yī)藥界中華蜂的價值更是被放大化,不僅能治療常見的燒傷燙傷,而且對于心臟病的治療還能起到舉足輕重的作用。位于福建省福州市的中華蜂養(yǎng)殖產(chǎn)業(yè)也是緊跟時代要求,一步一步發(fā)展壯大。
國內(nèi)關(guān)于中華蜂的檢測還處在人為檢測階段,耗費大量的人力和時間。國內(nèi)對于中華蜂的識別還處于依賴光電傳感器的檢測階段,由于傳感器自身的安裝不便捷、維護(hù)成本高,以及檢測結(jié)果準(zhǔn)確性不高等問題,致使傳統(tǒng)中華蜂的識別方式?jīng)]辦法得到推廣應(yīng)用。中華蜂的圖像分類對于中華蜂養(yǎng)殖產(chǎn)業(yè)來說始終處于不可或缺的地位,對于近些年全球智能化的發(fā)展趨勢,國內(nèi)許多養(yǎng)殖產(chǎn)業(yè)紛紛處于被動狀態(tài)。在這些養(yǎng)殖產(chǎn)業(yè)中蜜蜂養(yǎng)殖產(chǎn)業(yè)卻在不斷地更迭技術(shù),發(fā)展壯大。本研究將圖像識別與中華蜂養(yǎng)殖相結(jié)合,通過圖像識別方式高效識別出中華蜂物種,為后期智能蜂箱養(yǎng)殖系統(tǒng)做足準(zhǔn)備工作。
本文提出基于Gabor特征提取的SVM中華蜂識別方法,該方法首先將人工采集到的圖片進(jìn)行統(tǒng)一灰度化、歸一化處理,并對處理后的圖片經(jīng)過Gabor濾波器進(jìn)行特征向量提取,將提取后的高維特征向量進(jìn)行PCA降維,隨后采用支持向量機(jī)進(jìn)行訓(xùn)練和建模,對比不同核函數(shù)SVM的建模時長、識別準(zhǔn)確率及識別圖像的時長,選擇出最佳的核函數(shù)。
依據(jù)所采集到的中華蜂圖像,將圖片進(jìn)行預(yù)處理,降低外界因素對圖像造成的影響,對處理后的圖像進(jìn)行歸一化,使得圖像的大小保持一致,為后續(xù)Gabor濾波器提取特征值做鋪墊。經(jīng)過特征提取后的圖片再一次進(jìn)行以下采樣方式降維,最后將降維后的特征向量采用不同核函數(shù)的SVM機(jī)進(jìn)行分類和識別,試驗流程如圖1所示。
圖1 試驗流程Fig.1 Experimental flowchart
中華蜂圖片均是由試驗小組人員進(jìn)行采集,得到的圖片統(tǒng)一進(jìn)行灰度化及歸一化處理,使得數(shù)據(jù)庫中的所有圖片統(tǒng)一灰度減少外界環(huán)境對圖片的影響,并且圖片保持在32×32像素的大小,為后續(xù)的特征提取步驟做好鋪墊[1]。
2.1.1圖像灰度化
定義RGB空間的彩色圖片,每一個像素點均是由R、G、B的3個分量共同決定,每個分量在內(nèi)存所占的位數(shù)共同決定了圖像的顏色。對于將RGB圖像進(jìn)行灰度化處理,即對圖像RGB的3個分量進(jìn)行加權(quán)平均進(jìn)而得到最終的灰度值,本次研究采用OpenCV開放庫中所采用的灰度權(quán)值,如式(1)所示[2-3]。
Gray=0.072 169B+0.715 160G+0.212 671R
(1)
2.1.2圖像歸一化
人工采集到的中華蜂圖片容易受到拍攝角度或拍攝距離的影響,造成收集到的圖片大小尺寸不一,對后續(xù)的特征提取造成了不必要的麻煩,故采用OpenCV庫函數(shù)將所采集的圖片進(jìn)行大小統(tǒng)一調(diào)整,得到32×32像素的圖片庫。
Gabor濾波器可以抽取空間局部頻率特征,是一種有效的紋理檢測工具。在圖像處理中,Gabor函數(shù)屬于邊緣提取的線性濾波器,濾波器自身的頻率和方向表現(xiàn)內(nèi)容與人類視覺系統(tǒng)相近[4-5]。不同參數(shù)構(gòu)成的二維Gabor濾波器具有明顯的空間顯著性,以及在方向和頻率的抉擇方面具有顯著的優(yōu)勢,所以其在模擬視覺神經(jīng)方面可以獲得較好的效果。
二維Gabor濾波器的一般函數(shù)表達(dá)式:
(2)
式中kμ,v=kveiφμ
z=(x,y)——空間位置
v——Gabor濾波器尺度參數(shù)
μ——Gabor濾波器方向
kμ,v——平面波矢量
σ——高斯窗口尺度因子
exp(ikμ,v)——復(fù)數(shù)波,其中實數(shù)部分和虛數(shù)部分分別為cos(kμ,z)和sin(kμ,z)
(3)
式中kmax——最大頻率
f——頻域內(nèi)核函數(shù)的空間因子
φμ——Gabor濾波器的方向選擇
二維Gabor濾波器的函數(shù)一般具有自相似的特性,故又稱為Gabor小波。在Gabor濾波器中參數(shù)的選擇起著舉足輕重的作用,為了更加充分地描述圖像特征,采取在5個尺度和8個方向上組成濾波器組,即v={0,1,2,3,4},μ={0,1,2,3,4,5,6,7}。因為圖像的紋理分布是隨機(jī)的,φμ的取值范圍是0~2π,由于Gabor濾波器自身的對稱性,φμ的取值范圍可以等價于是0~π。
中華蜂圖像經(jīng)過Gabor濾波器提取后的特征向量具有較高的維數(shù),由于圖像歸一化后像素為32×32,經(jīng)過根據(jù)本研究所選取的尺度和方向參數(shù)得到圖像的Gabor特征位數(shù)是灰度圖像維數(shù)的40倍,即提取后的維數(shù)為40 960(32×32×40),致使檢索速度變慢,所以要對其產(chǎn)生的特征向量進(jìn)行線性降維操作,即主成分分析法(PCA)。
主成分分析法是通過某種線性投影,將高維數(shù)據(jù)映射到低維的空間中,并期望在所投影的維度上數(shù)據(jù)所保留的信息量最大,不失真程度最低,等價于方差最大[6]。以此降低數(shù)據(jù)高維不易處理的難度,且更大程度地保留了數(shù)據(jù)信息的完整性。
假設(shè)有數(shù)據(jù)中含有M個樣本{X1,X2,…,XM},每個樣本均是含有N維特征,即Xi=(x1,x2,…,xN)T,且每一個特征xj均含有自身的特征值。第一步對所有特征進(jìn)行中心化,去除自身的均值,即
(4)
第2步對去均值后的特征值進(jìn)行協(xié)方差矩陣C的求解,即
(5)
式(5)中cov(xi,xi+1)表示為
(6)
第3步求解協(xié)方差矩陣C的特征值和相應(yīng)的特征向量,求解協(xié)方差矩陣C的特征值λ和μ特征向量,即
Cu=λu
(7)
數(shù)據(jù)集中的特征值λ有N個,每一個λi對應(yīng)一個特征向量ui,將求得的特征值按照從大到小的順序排列,并選擇前k個特征值,將提取到的k個特征值組合成一組新的矩陣,即{(λ1,u1),(λ2,u2),…,(λk,uk)}[7]。
最后將原始的數(shù)據(jù)矩陣集合投影到選取的特征向量上,即可得到降維后的k維特征向量,即
(8)
支持向量機(jī)(SVM),又稱為支持向量網(wǎng)絡(luò),具有相關(guān)學(xué)習(xí)算法的監(jiān)督學(xué)習(xí)模型,該算法對數(shù)據(jù)進(jìn)行評估和識別,并應(yīng)用于分類和回歸分析,對于未經(jīng)訓(xùn)練的樣本具有較高的預(yù)測準(zhǔn)確率。SVM的實現(xiàn)原理:通過已選擇的核函數(shù)將輸入向量映射到一個高維數(shù)特征空間中,在這個高維特征空間中構(gòu)造一個最優(yōu)分類的超平面[8]。
由于決策邊界直接取決于訓(xùn)練數(shù)據(jù)自身,因此決策邊界的分離余量在訓(xùn)練SVM模型中稱為特征空間的高維空間中最大化。該學(xué)習(xí)策略基于統(tǒng)計學(xué)習(xí)理論,該理論將訓(xùn)練數(shù)據(jù)和未知數(shù)據(jù)分類中的錯誤最小化。
支持向量機(jī)可以看作為內(nèi)核機(jī),內(nèi)核常常被稱為相似性函數(shù),用于提供給機(jī)器學(xué)習(xí)算法功能[9-10]。
SVM常見的內(nèi)核如下。
(1)徑向基函數(shù)。在機(jī)器學(xué)習(xí)中,徑向基函數(shù)核(RBF)是一種局部性強(qiáng)的核函數(shù),其可以將樣本映射到更高維的空間中,應(yīng)用范圍廣,無論樣本大還是小都能表現(xiàn)出較強(qiáng)的性能[6]。
對于兩個樣本X和Y,RBF核函數(shù)表示為某些輸入空間中的特征向量,定義為
(9)
(2)多項式函數(shù)。多項式內(nèi)核用于識別輸入樣本的標(biāo)注特征以此確定之間的相似性和他們的組合關(guān)系。在回歸分析的框架中,該類型組合成為交互功能。多項式內(nèi)核的隱式特征空間與多項式回歸的隱式特征空間相似,但是二者之間的模型學(xué)習(xí)參數(shù)沒有關(guān)聯(lián)。多項式核函數(shù)可以實現(xiàn)將低維的輸入空間映射到高維的特征空間,但是多項式核函數(shù)的參數(shù)多,當(dāng)多項式的階數(shù)比較高的時候,核矩陣的元素值將趨于無窮大或者無窮小,計算復(fù)雜度會大到無法計算。對于q≥1時,多項式內(nèi)核函數(shù)定義為
(10)
(3)線性核。線性核主要用于線性可分的情況下,特征空間與輸入空間的維度是相同的,且其自身參數(shù)少,運算速度快,對于線性可分性數(shù)據(jù),其分類效果明顯[7]。其核函數(shù)定義為
K(x,y)=xTy+c
(11)
(4)二次內(nèi)核。二次內(nèi)核的計算強(qiáng)度較RBF較低,當(dāng)RBF的準(zhǔn)備過程變得繁雜時,二次內(nèi)核是一個適宜的替代方案。其定義為
(12)
(5)Sigmoid核。Sigmoid核函數(shù)被采取時,支持向量機(jī)實現(xiàn)了一個包含隱藏層的多層感知機(jī)網(wǎng)絡(luò)模型,其中的權(quán)值和隱藏層節(jié)點數(shù)均是由SVM算法內(nèi)部自動擬合而形成的,其定義為
K(x,y)=tanh[v(x·y)]+c
(13)
本研究的訓(xùn)練平臺為一臺臺式機(jī),硬件部分為Intel core i9-10850K(3.6GHz)十核CPU,以及GeForce GTX 1080ti 11GB GPU(3584 CUDA)和32 GB的內(nèi)存,在Windows 10 64位系統(tǒng)上運行,軟件部分采用Python3。
人工采集到的中華蜂圖片共有3類(蜂王、雄蜂、工蜂),共6 930張圖片,將得到的圖片灰度化并歸一化處理后,得到32×32像數(shù)大小的圖片,之后經(jīng)過Gabor濾波器提取特征向量并進(jìn)行采樣,得到的特征向量進(jìn)行PCA降維。降維后的特征向量經(jīng)過不同核函數(shù)的SVM進(jìn)行訓(xùn)練、建模并預(yù)測分析。
人工采集到的蜜蜂樣本如圖2所示。
圖2 人工采集的蜜蜂樣本圖像Fig.2 Bee sample images collected manually
將采集到的圖片進(jìn)行灰度化、歸一化并由Gabor濾波器進(jìn)行特征提取后,得到如圖3所示的圖片,將蜜蜂與蜂巢二者的紋理特征進(jìn)行有效的提取,更加突出了圖片的特征。
圖3 經(jīng)過預(yù)處理及Gabor處理后的圖像Fig.3 Sample image obtained after preprocessing and Gabor processing
進(jìn)一步將取得的圖像矩陣進(jìn)行PCA降維后并交由不同核函數(shù)的SVM進(jìn)行訓(xùn)練。訓(xùn)練結(jié)果如表1所示。
表1 訓(xùn)練結(jié)果
從結(jié)果中可以看出,在建模時間上徑向基核函數(shù)和Sigmoid核函數(shù)花費的時間很長,但是在預(yù)測準(zhǔn)確率方面優(yōu)勢十分明顯,而多項式、線性及二次核函數(shù)在訓(xùn)練建模耗費時長上占據(jù)優(yōu)勢,卻在預(yù)測準(zhǔn)確率上相較其余二者較低。綜合對比5種核函數(shù),Sigmoid核函數(shù)在對于經(jīng)過預(yù)處理及Gabor提取特征后得到中華蜂圖像的SVM識別預(yù)測中占據(jù)優(yōu)勢。
對采集到的中華蜂圖像進(jìn)行預(yù)處理及特征提取并降維后,經(jīng)過分析不同核函數(shù)的SVM所得出的建模時間,預(yù)測準(zhǔn)確率以及識別時長,可以得出在常見的SVM核函數(shù)中Sigmoid核函數(shù)對于中華蜂的識別分類效果最好,為隨后的中華蜂圖像識別研究奠定基礎(chǔ)。
在蜂箱養(yǎng)殖蜜蜂過程中抑制有害物種的入侵對蜂農(nóng)增加的工作負(fù)荷很大,同時在抑制過程中蜂農(nóng)開箱檢測的工作量也十分龐大。本研究將圖像識別應(yīng)用于蜂箱養(yǎng)殖,有效識別出中華蜂,為后期識別危害中華蜂的物種,即蟑螂和馬蜂,提供前期的準(zhǔn)備工作,為智能蜂箱的建立提供了堅實的算法基礎(chǔ)。