吳莉莉,邢玉清,鄭寶周,林愛英(河南農(nóng)業(yè)大學(xué)理學(xué)院,鄭州450002)
?
機(jī)器視覺在花椒品種鑒別中的初步研究*
吳莉莉*,邢玉清,鄭寶周,林愛英
(河南農(nóng)業(yè)大學(xué)理學(xué)院,鄭州450002)
摘要:花椒是一種重要的烹飪調(diào)料和中藥配料。本文將機(jī)器視覺技術(shù)引入到花椒品種的快速鑒別中,通過機(jī)器視覺硬件裝置獲取6類花椒樣品圖像共90幅,其中60幅作為訓(xùn)練樣本,30幅作為測試樣本。對所有樣本分別提取了顏色和紋理的共10個特征參數(shù),利用概率神經(jīng)網(wǎng)絡(luò)對特征數(shù)據(jù)進(jìn)行鑒別,正確識別率為93.33%。本文研究的基于機(jī)器視覺的花椒品種鑒別方法可以快速準(zhǔn)確地提取花椒樣品的特征數(shù)據(jù),為批量分選花椒奠定了技術(shù)基礎(chǔ)。
關(guān)鍵詞:機(jī)器視覺;顏色特征;紋理特征;概率神經(jīng)網(wǎng)絡(luò);花椒
作為日常調(diào)料食用的花椒主要是指蕓香科植物花椒(Zanthoxylum Bungeanum MaXim)的干燥成熟果皮[1-2],不僅被譽(yù)為“八大調(diào)味品”之一,還具有重要的藥用價值?;ń肥袌銎贩N繁多,不同地方、不同品種的花椒價格差異較大,常常出現(xiàn)品種混雜、真?zhèn)位煜痊F(xiàn)象。目前對花椒品種的鑒別主要依靠人工,檢驗(yàn)結(jié)果受主觀影響較大,重復(fù)性差、效率低;而化學(xué)分析或儀器分析等方法,其樣品前期處理的復(fù)雜性、實(shí)驗(yàn)本身的耗時性,無法滿足現(xiàn)場快速檢測的需求。利用機(jī)器視覺代替人的視覺,通過圖像的外觀特征進(jìn)行分類識別,是一種及時便捷、切實(shí)有效的方法。與人工檢測相比,機(jī)器視覺具有速度快、精度高、重復(fù)性好等優(yōu)點(diǎn),在農(nóng)產(chǎn)品品質(zhì)檢測領(lǐng)域有著廣闊的應(yīng)用前景。
機(jī)器視覺也稱計算機(jī)視覺,是一門涉及神經(jīng)生物學(xué)、心理物理學(xué)、計算機(jī)科學(xué)、圖像處理、模式識別和人工智能等諸多領(lǐng)域的交叉學(xué)科,主要研究用各種成像系統(tǒng)代替人的視覺器官作為輸入敏感手段,由計算機(jī)來代替大腦完成對信息的處理和解釋,實(shí)現(xiàn)對人類視覺行為的計算機(jī)模擬或再現(xiàn)。機(jī)器視覺在農(nóng)業(yè)中的應(yīng)用研究涉及作物種子品質(zhì)檢測、作物病害檢測、農(nóng)產(chǎn)品采摘、農(nóng)產(chǎn)品品質(zhì)檢測、農(nóng)產(chǎn)品分級等領(lǐng)域[3],為農(nóng)產(chǎn)品的快速無損檢測提供了重要的分析判定方法。
目前國內(nèi)機(jī)器視覺技術(shù)在花椒方面的研究主要集中在花椒顆粒的均勻度、閉眼率、椒籽率、果穗梗率[2-5]等外觀品質(zhì),對于花椒的顏色、紋理等其他宏觀特征的研究未見報道。
本文前期研究了利用機(jī)器嗅覺(即電子鼻)技術(shù)對花椒品種進(jìn)行鑒別(見參考文獻(xiàn)[4]),取得了較好的識別結(jié)果。該研究主要利用的是氣味作為識別特征,本文擬從外觀特征方面對其進(jìn)行鑒別,為后續(xù)的多傳感信息融合奠定基礎(chǔ),以期獲得更高的識別精度。
1.1實(shí)驗(yàn)材料
采用與文獻(xiàn)[4]中相同的花椒樣品,分別為:四川漢源大紅袍(1號樣品)、四川金陽青花椒(2號樣品)、陜西韓城大紅袍(3號樣品)、河北涉縣大紅袍(4號樣品)、云南魯?shù)榍嗷ń罚?號樣品)、甘肅隴南大紅袍(6號樣品)。所有樣品均為袋裝購買,生產(chǎn)日期在2015年3月至6月間,等級為特級。
1.2實(shí)驗(yàn)裝置
實(shí)驗(yàn)采用自行研制的機(jī)器視覺系統(tǒng),主要由硬件和軟件兩部分組成,其中硬件系統(tǒng)主要包括:光照室、光源、CCD攝像頭、樣品臺、圖像采集卡;軟件系統(tǒng)主要包括圖像處理軟件和模式識別算法。機(jī)器視覺硬件系統(tǒng)如圖1所示,花椒圖像的采集在光照室內(nèi)完成。
圖1 機(jī)器視覺硬件系統(tǒng)示意圖
CCD攝像頭是獲取花椒樣品圖像的關(guān)鍵部件之一,它將花椒圖像由光信號轉(zhuǎn)換成表示為R、G、B顏色值的模擬電信號,并輸入圖像處理設(shè)備。圖像采集卡將輸入的模擬電信號轉(zhuǎn)換成數(shù)字信號(對花椒圖像進(jìn)行A/D轉(zhuǎn)換),并將轉(zhuǎn)換后的數(shù)字信號輸入計算機(jī)進(jìn)行后續(xù)處理。光照室內(nèi)的光源采用漫反射環(huán)形LED來照明,樣品臺背景為白色底板,花椒在上面鋪上厚厚的一層,不露出底板,這樣可保證圖像不受背景的干擾。實(shí)驗(yàn)中每種花椒樣品圖像采集15幅,共90幅,為了適應(yīng)快速檢測的需要,減少程序運(yùn)行時間,將圖像裁剪為400 pixel×400 pixel。
1.3圖像的預(yù)處理
實(shí)際獲得的圖像在形成、傳輸、接收和處理的過程中,不可避免地存在著內(nèi)部干擾和外部干擾[6],因此需要對圖像進(jìn)行平滑處理。常用的平滑處理方法有鄰域平均法、中值濾波法、高斯平滑法、頻域低通濾波法等。由于中值濾波在去除噪聲的同時還能保護(hù)圖像細(xì)節(jié),因此本文采用中值濾波法對采集的圖像進(jìn)行平滑去噪。
中值濾波本質(zhì)上是一種統(tǒng)計排序?yàn)V波器,對于原圖像中某點(diǎn)(i,j),中值濾波對以該點(diǎn)為中心的鄰域內(nèi)的所有像素進(jìn)行統(tǒng)計排序,取其中值作為(i,j)點(diǎn)的響應(yīng)[7]。中值濾波的效果依賴于濾波窗口的大小,太大會使邊緣模糊,太小則去噪效果不好。圖2是采用不同大小的窗口對原始花椒圖像進(jìn)行中值濾波的效果,從圖中可看出,采用3×3模板不僅去除了噪聲,還很好地保留了細(xì)節(jié)。
圖2 不同窗口大小中值濾波比較
為了識別出圖像所屬的類別,需要將它與其他不同類別的圖像區(qū)分開來,這就要求選取的特征不僅能很好地描述圖像,還要能很好地區(qū)分不同類別的圖像。特征值的選擇直接影響著機(jī)器視覺的識別率,本文針對顏色和紋理兩方面的特征進(jìn)行參量提取。
2.1顏色特征提取
顏色特征是圖像中最直觀、最明顯的物理特征,它具有全局性,描述了圖像區(qū)域所有景物的表面性質(zhì)。相對于幾何特征而言,顏色具有一定的穩(wěn)定性,對大小、方向都不敏感,表現(xiàn)出相當(dāng)強(qiáng)的魯棒性。為了對顏色進(jìn)行定量描述,按照某種標(biāo)準(zhǔn)利用基色來表示顏色可以得到不同的色彩空間。常用的有RGB模型、HSI模型、HSV模型、CMY模型、Lab模型等等。
RGB模型是工業(yè)界的一種顏色標(biāo)準(zhǔn),是通過對紅(Red)、綠(Green)、藍(lán)(Blue)三種顏色亮度的變化以及它們相互之間的疊加來得到各種各樣的顏色,該標(biāo)準(zhǔn)幾乎包括視覺所能感知的所有顏色,是目前運(yùn)用最廣的顏色模型之一[7]。
HSI模型是從人的視覺系統(tǒng)出發(fā),直接使用色調(diào)(Hue)、飽和度(Saturation)和亮度(Intensity)來描述顏色。由于人的視覺對亮度的敏感程度遠(yuǎn)強(qiáng)于對顏色濃淡的敏感程度,因此在視覺系統(tǒng)中經(jīng)常采用HSI顏色模型進(jìn)行顏色提取與識別。
HSI顏色模型與RGB顏色模型存在一定的轉(zhuǎn)換關(guān)系,轉(zhuǎn)換公式如下:
其中
在花椒樣品的彩色圖像中,含有大量的顏色信息,通過這些信息可以反映出花椒的品種。由于攝像頭獲取的圖像是RGB模型,且HSI模型與人眼對事物的觀察模式一致,因此本文采用RGB和HSI兩種模型來對花椒圖像進(jìn)行特征參數(shù)提取。
實(shí)驗(yàn)中對經(jīng)過預(yù)處理之后的花椒樣品圖像分別提取R、G、B和H、S、I分量的均值,為了方便后續(xù)的模式識別,將其做了歸一化處理。表1列舉了花椒樣品1中作為訓(xùn)練樣本的10幅圖像的顏色特征值。
表1 花椒樣品1的顏色特征參數(shù)均值表
2.2紋理特征提取
習(xí)慣上,把圖像中局部不規(guī)則,而宏觀上有規(guī)律的特性稱之為紋理,作為物體表面的一種自然屬性,紋理是人類視覺系統(tǒng)區(qū)分自然界物體的重要依據(jù)。紋理特征的提取方法主要有結(jié)構(gòu)法、統(tǒng)計法、模型法和頻譜法。
灰度共生矩陣GLCM(Gray Level Co-occurrence Matrix)是由Haralick[8]提出的一種用來分析圖像紋理特征的重要方法,是最常用的紋理統(tǒng)計分析方法之一。GLCM是建立在圖像的二階聯(lián)合概率密度函數(shù)的基礎(chǔ)上,即通過計算圖像中特定方向和特定距離的兩像素間從某一灰度過渡到另一灰度的概率,反映圖像在方向、間隔、變化幅度及快慢的綜合信息[9]。簡單定義為:距離為d的兩個像素點(diǎn)灰度值分別為i和j的概率,數(shù)學(xué)表達(dá)式為:
其中(x,y)是圖像中的像素坐標(biāo),x、y的取值范圍為[0,N-1],i、j的取值范圍為[0,L-1],N為圖像像素,L為灰度級;d是用像素數(shù)量表示的相對距離,若d= 1,則表示相鄰像素;θ一般考慮四個方向,分別是0°、45°、90°、135°。
GLCM反映了圖像灰度分布關(guān)于方向、鄰域和變化幅度的綜合信息,但它并不能直接提供區(qū)別紋理的特性,于是在統(tǒng)計學(xué)的基礎(chǔ)上定義了一些度量來表示提取的紋理特征。綜合考慮分類效果和分類耗時這兩個方面,本文選取GLCM提取紋理特征中相關(guān)性小的四個參數(shù):對比度、相關(guān)性、能量和同質(zhì)性來表示紋理特征,這4個特征量的計算公式如下[9]:
①對比度
對比度可以理解為圖像的清晰度以及紋路的深淺,它反映了GLCM元素的值是如何分布的以及圖像局部的變化信息。
②相關(guān)性
其中μ1,μ2,σ1,σ2分別為:
相關(guān)性反映了在水平方向和垂直方向上鄰域像素間的相似性。
③能量
能量是圖像灰度分布均勻性的度量。
④同質(zhì)性
同質(zhì)性用來度量圖像紋理局部變化是否均勻?;贕LCM的花椒樣品紋理特征提取步驟如圖3所示。首先將花椒樣品的RGB圖像轉(zhuǎn)換為灰度圖像,為了節(jié)省計算時間對灰度級粗量化,將256級量化為16級;然后計算0°、45°、90°、135°四個方向的GLCM,距離d= 1,并將其歸一化,選取高斯函數(shù)作為歸一化函數(shù);再分別求出每個GLCM的對比度、相關(guān)性、能量和同質(zhì)性四個二階統(tǒng)計特征量,并計算每個特征量的均值,得到的這個4維向量就是最終所求的紋理特征向量。
圖3 GLCM的紋理特征提取框圖
對圖2(a)所示的圖像(即花椒樣品1的第一幅圖像)做灰度變換,得到如圖4所示的灰度圖像,然后計算GLCM,提取四個不同方向的二階統(tǒng)計量,如表2所示。對所有花椒樣品都做上述相同的特征提取,表3列舉了樣品1中作為訓(xùn)練樣本的10幅圖像的紋理特征均值。
圖4 花椒樣品1第一幅圖的灰度圖像
表2 4個方向GLCM二階統(tǒng)計量
表3 花椒樣品1的紋理特征參數(shù)均值表
概率神經(jīng)網(wǎng)絡(luò)PNN(Probabilistic Neural Net?work)是在徑向基函數(shù)RBF(Radial Basis Function)[10],其理論依據(jù)是貝葉斯最小風(fēng)險準(zhǔn)則(即貝葉斯決策理論)。PNN既具有統(tǒng)計分類的功能,又不受多元正態(tài)分布等條件的限制,并且在PNN運(yùn)算過程中可讀出被分類的新輸入樣本的后驗(yàn)概率,從而提供了對計算結(jié)果的解釋。理論上來說,PNN得到的分類結(jié)果能夠達(dá)到最大的正確率,當(dāng)訓(xùn)練的樣本數(shù)據(jù)足夠多時,PNN收斂于一個貝葉斯分類器,且推廣能力良好。
PNN的基本結(jié)構(gòu)如圖5所示,包括:輸入層、模式層、求和層和決策層。
圖5 PNN的基本結(jié)構(gòu)
輸入層接收來自訓(xùn)練樣本的值,其神經(jīng)元數(shù)目和樣本向量x的維數(shù)相等。模式層與輸入層之間通過連接權(quán)向量wi相連,進(jìn)行加權(quán)求和輸出zi=x·wi,通過一個非線性映射運(yùn)算后傳遞給求和層。模式層中的非線性映射采用指數(shù)函數(shù)exp[(zi-1)/σ2]實(shí)現(xiàn)。求和層將有對應(yīng)樣本中同一類的模式層傳來的輸入(屬于某類的概率)進(jìn)行累加以及得到輸入樣本屬于該類的最大可能性[11-14]。決策層接收來自求和層輸出的各類概率密度函數(shù),概率密度最大的那個神經(jīng)元輸出為1,即對應(yīng)的那一類是待識別的樣本模式類別,其他神經(jīng)元的輸出全為0。
利用PNN對花椒品種進(jìn)行鑒別時,顏色特征和紋理特征一同作為輸入向量,建立10維輸入和6維(待識別的種類)輸出。在設(shè)計PNN時,由于徑向基函數(shù)的分布密度Spread對網(wǎng)絡(luò)的分類性能影響較大,當(dāng)Spread接近于0時,對應(yīng)的PNN就是一個最近鄰分類器;當(dāng)Spread增大后,對應(yīng)的PNN就要考慮附近的設(shè)計向量。在訓(xùn)練網(wǎng)絡(luò)時,每種花椒樣品15幅圖像中取其中10幅作為訓(xùn)練樣本,共60幅,剩余5幅圖像作為測試樣本,共30幅。通過實(shí)驗(yàn)確定當(dāng)Spread取值在[0.05,0.8]時,訓(xùn)練樣本識別率為100%。將30幅測試樣本輸入訓(xùn)練好的PNN中,識別結(jié)果如表4所示。測試樣本的總體識別率為93.33%,3號樣品和4號樣品的外觀較為接近,因此在識別時會出錯,青花椒與紅花椒顏色有明顯的不同,可以完全識別。
表4 PNN對測試樣本的分類識別率(Spread=0.06)
本文用自行設(shè)計的機(jī)器視覺硬件系統(tǒng)對6類不同品種的花椒樣品圖像進(jìn)行了采集,通過中值濾波預(yù)處理之后,提取了R、G、B、H、S、I顏色分量的均值和GLCM的對比度、相關(guān)性、能量、同質(zhì)性紋理特征的均值一同作為分類特征,利用PNN進(jìn)行分類識別。PNN由于其權(quán)值就是模式樣本的概率分布,因此訓(xùn)練時間短,模式分類性能好。對6類花椒樣品的60幅圖像作為訓(xùn)練樣本,特征數(shù)據(jù)60×10維,PNN能完全正確分類,對于30幅圖像特征數(shù)據(jù)30× 10維的測試樣本,識別準(zhǔn)確率為93.33%,取得了較好的分類效果。如何優(yōu)化PNN,融合機(jī)器嗅覺信息來進(jìn)一步提高識別率是將要進(jìn)行的研究。
參考文獻(xiàn):
[1]余曉琴.花椒品質(zhì)評價方法及其應(yīng)用研究[D].重慶:西南大學(xué),2010:5.
[2]楊飛.基于機(jī)器視覺的花椒外觀品質(zhì)檢測技術(shù)研究[D].重慶:西南大學(xué),2008:5.
[3]鄭小東,王杰.機(jī)器視覺在玉米籽粒品質(zhì)檢測中的應(yīng)用研究[J].中國糧油學(xué)報,2013,28(4):124-128.
[4]吳莉莉,鄭丹,鄭寶周,等.基于電子鼻技術(shù)的花椒品種鑒別方法研究[J].傳感技術(shù)學(xué)報,2013,26(11):1473-1477.
[5]楊鎮(zhèn)宇.基于機(jī)器視覺和SVM的花椒外觀品質(zhì)檢測技術(shù)研究[D].重慶:西南大學(xué),2010:5.
[6]張弘.數(shù)字圖像處理與分析[M].北京:機(jī)械工業(yè)出版社,2013:1.
[7]張錚,徐超,任淑霞,等.數(shù)字圖像處理與機(jī)器視覺——Visual C++與Matlab實(shí)現(xiàn)[M].北京:人民郵電出版社,2014:5.
[8]Haralick R M,Shanmugam K,Dinstein I H. Textural Features for Image Classification. Systems[J]. Man and Cybernetics,IEEE Transactions,1973(6):610-621.
[9]王龍.圖像紋理特征提取及分類研究[D].青島:中國海洋大學(xué),2014:5.
[10]Specht D F. Probabilistic Neural Networks for Classification Map?ping or Associative Memory[C]// Neural Networks,IEEE Interna?tional Conference on Digital Object Identifier,1988,1:525-532.
[11]Specht D F. Probabilistic Neural Networks[J]. Int J Neural Net?works,1990,3:109-118.
[12]Roberto Miguez,Michael Georgiopoulos,Assem Kaylani. G-PNN:A Genetically Engineered Probabilistic Neural Network[J]. Non?linear Analysis:Theory,Methods & Applications,2010,73(6):1783-1791.
[13]Michael R Berthold,Jay Diamond. Constructive Training of Proba?bilistic Neural Networks[J]. Neurocomputing,1998,19(1-3):167-183.
[14]蘇亮,宋緒丁.基于Matlab的概率神經(jīng)網(wǎng)絡(luò)的實(shí)現(xiàn)及應(yīng)用[J].計算機(jī)與現(xiàn)代化,2011,195(11):47-50.
[15]段勇,李程,徐心和.基于顏色空間映射的自適應(yīng)足球機(jī)器人視覺系統(tǒng)[J].傳感技術(shù)學(xué)報,2012,25(1):82-86.
吳莉莉(1977-),湖北荊州人,2007年獲浙江大學(xué)生物醫(yī)學(xué)工程專業(yè)博士學(xué)位,師從陳裕泉教授。副教授,主要從事傳感器技術(shù)、信號處理、模式識別和農(nóng)產(chǎn)品無損檢測等方面的研究,已發(fā)表論文四十余篇,wllzju@126.com;
邢玉清(1981-),河南周口人,2008年獲中山大學(xué)生計算機(jī)應(yīng)用技術(shù)專業(yè)碩士學(xué)位,師從陳曉峰教授。講師,主要從事網(wǎng)絡(luò)安全、安全協(xié)議、密碼應(yīng)用等方面的研究,已發(fā)表論文十余篇,xyq@henau.edu.cn。
Simulation and Tests of Multiple Sprinklers Rainfall Generator*
LIU Bo,WANG Xiaolei*,SU Teng,KANG Zhaojing
(College of Meteorology and Oceanography,PLA University of Science and Technology,Nanjing 211101,China)
Abstract:In order to realize the full scope simulation of natural rainfall intensity,the observation pattern acquired from single sprinkler is regarded as a multi-dimensioned vector,on which the established model of multiple sprin?klers in square layout is based. Then,the data of coefficients of uniformity and rainfall isoline map for four over?lapped sprinklers are analyzed and the optimum spacing is ascertained. Further more,in the condition of the opti?mum spacing,an experiment is conducted to evaluate uniformity and stability of the rainfall environment. The test results indicate that tipping-bucket raingaugescan be located in four quarters of the compass so as to carry out large rainfall intensity test after the stability time in the current rainfall generator environment.
Key words:rainfall generator;large rainfall intensity;simulation;test
doi:EEACC:723010.3969/j.issn.1004-1699.2016.01.024
收稿日期:2015-08-06修改日期:2015-09-21
中圖分類號:TP391.4
文獻(xiàn)標(biāo)識碼:A
文章編號:1004-1699(2016)01-0136-05
項(xiàng)目來源:河南省科技攻關(guān)計劃項(xiàng)目(142102110054);河南省教育廳科學(xué)技術(shù)研究重點(diǎn)項(xiàng)目(12A510014)