汪天宇 曹成茂 謝承健 李 正
(安徽農業(yè)大學工學院,安徽 合肥 230036)
山核桃屬胡桃科植物,呈橢球狀,其果殼為淡褐色,果仁表皮為深褐或暗紅色,內有多個分隔,屬于含隔堅果類。山核桃仁富含營養(yǎng)且口感風味獨特,深受消費者的喜愛[1-3]。由于山核桃果殼硬且厚,食用不便,因此有進一步深加工的必要性。其深加工需要將破殼后的混合物料進行殼仁分選。破殼后的山核桃有各種不同形態(tài)的分離物,包括破碎的外殼、內隔、核桃仁等,且殼仁形狀差別不規(guī)律、質量不均勻,很難通過風選機等除雜篩選機械進行正確的篩分[2]。
國內外專家在物料的分選和色選方面進行了大量的研究[4-6],如Justus[7]曾使用機器視覺同時識別榛子和杏仁等堅果在紫外線范圍內發(fā)霉的顆粒,并識別果仁表面的顏色缺陷以獲取品質較高的果仁,此類研究中多是應用于研究對象的分級,而將研究色選與圖像處理技術應用于堅果殼仁的分選中則非常少見。采用圖像特征識別技術分選堅果的殼與仁的主要技術難點在于:果仁的表皮和外殼顏色特征差異性較小,尤其是山核桃等含隔堅果類,其內部分隔顏色與果仁表皮相近,難以通過僅選定某種色彩模型并設定色彩閾值的方式進行分類識別。
本試驗擬在研究山核桃殼仁分選的過程中同時利用顏色和紋理特征作為分選的物理指標,基于Labview虛擬儀器技術并結合應用模糊C-均值聚類算法,設計一種用于從山核桃殼仁混合物料中篩選出核桃仁的分選系統(tǒng)。該研究用于驗證計算機視覺技術應用于含隔堅果分選的可行性,對提高山核桃等堅果深加工生產的效率具有重要的意義。
在分析山核桃顏色特征后,發(fā)現(xiàn)山核桃外殼與內隔、核桃仁的顏色區(qū)別較大,分離物表面紋理排布具有一定的規(guī)律且差異性較大。各分離物形態(tài)如圖1所示,核桃仁種皮的顏色與內隔(包括殼的內壁部分)的顏色具有相似性,色域存在一定區(qū)域的重疊,很難通過傳統(tǒng)的閾值分割對目標進行正確的識別,因此有必要結合其紋理特征應用模糊聚類算法對其進行有效分類[8-10]。初步選用計算機視覺領域應用較廣的HSV顏色模式下的色調(H)、飽和度(S)、明度(V)和表面紋理的灰度共生矩陣的特征量能量(A)、熵(E)、慣性矩(M)、相關度(R)[11-12]共同描述目標的視覺特征,其中H/S/V特征值的論域范圍為[0,255],預選的7種特征能夠表達物體顏色和紋理的基本信息。
圖1 山核桃各分離物
考慮到山核桃破殼后各分離物的顏色特征具有復雜性,提取山核桃的顏色特征需要復雜的流程處理,具體工作流程見圖2[13]。由于各顏色分量中偶爾會有小波段的高頻噪聲出現(xiàn),預先對圖像的各像素通道進行均值濾波處理以有效消除噪聲影響。針對核桃仁的顏色特征,必須考慮到核桃仁形態(tài)的不完整性,即大概率出現(xiàn)局部裸仁的現(xiàn)象。裸仁的顏色接近乳白色,與目標分類對象特征具有很大的區(qū)別,在圖像處理中可以同化為背景處理,降低研究對象的復雜性[14],系統(tǒng)設計中采用閾值分割分離背景以消除其對目標特征的影響。預處理后的圖像包含了較為完整的對象特征信息,此時提取顏色特征信息輸出參數(shù)數(shù)值,完成基本處理步驟。
圖2 圖像的預處理流程
基于Labview虛擬儀器技術編寫山核桃顏色特征的提取和分類程序,設計符合交互的用戶界面,用戶界面與部分特征提取程序見圖3。創(chuàng)建IMAQ Getimage.vi,用于初始化攝像頭及將獲取的圖像存儲在圖像緩存區(qū)內[13]。在主程序中創(chuàng)建參數(shù)矩陣,局部變量交由MATLAB Script進行模糊聚類處理。
對獲取圖像進行預處理后,利用NI Vision Assistant分離出H/S/V的基色平面并數(shù)值化,創(chuàng)建獨立的子程序Image Getcolor.vi,提取相應基色平面下的灰度值,即HSV顏色模式下的各分量數(shù)值。紋理特征反映了提取圖像中相鄰像素點之間的關系,創(chuàng)建子程序Image Gettexture.vi,通過Vision工具包提取目標圖像灰度圖下的灰度值,由腳本程序生成灰度共生矩陣。計算表征灰度共生矩陣特征的標量,分別為[15]:
能量A:
(1)
圖3 上位機程序設計
熵E:
(2)
慣性矩M:
(3)
相關性R:
(4)
式中:
G(x,y)——灰度共生矩陣,其中(x,y)為像素空間坐標轉換成的灰度對;
將模糊聚類計算應用于山核桃殼仁分離物的顏色判斷,首先需要先建立一個包裹這2種顏色模型的7維特征數(shù)據(jù)[hj,sj,vj,aj,ej,mj,rj],相關特征參數(shù)見表1。多維特征數(shù)據(jù)的集合常存在若干問題,特征相互之間往往會存在強烈的相關度和冗余特征[16]。多維數(shù)據(jù)不僅存在一些無關的變量,復雜的計算還會對程序的運行造成負擔,擬選取的H、S、V、A、E、M、R7個特征之間數(shù)據(jù)維數(shù)相對較大,可能存在著冗余特征,為降低數(shù)據(jù)的維數(shù)有必要運用特征降維。主分量分析(PCA)是一種將高維數(shù)據(jù)簡化到低維空間以便于分析和顯示的方法。利用主分量分析法對擬選用的7維特征數(shù)據(jù)的集合進行降維處理,篩選出包含信息較多的特征,處理過程中除去其冗余或是貢獻較小的特征成分向量列,評估出最優(yōu)的特征子集。
表1 山核桃破殼分離物特征參數(shù)
通過對獲取特征數(shù)據(jù)集的因子分析,獲得數(shù)據(jù)集的總方差解釋。如表2所示,以某個成分的方差占全部方差的比重,即對應特征值占全部特征值總和的比重來衡量某列成分對整個數(shù)據(jù)集合的綜合貢獻程度。表2中,前3種主成分的累積對圖像顏色信息的累積貢獻率達到了96.433%,幾乎能夠完整地表達出山核桃各破殼物的顏色差異性信息,故選取前3種作為模糊聚類計算的最優(yōu)特征成分子集。前3種主要成分的特征向量為7×3的向量矩陣,在Matlab Script中編寫將原始的j×7維數(shù)據(jù)集與主要成分的特征向量矩陣相乘,數(shù)據(jù)維度則變換為成分特征向量的維度,實現(xiàn)降維目的,以此獲得變換后的數(shù)據(jù)集。
表2 數(shù)據(jù)集的總方差解釋
模糊聚類(FCM)算法由硬聚類(HCM)算法發(fā)展而來,是一種無監(jiān)督的聚類分析方法[17]。模糊聚類在聚類分析的基礎上進一步探究樣本對各類歸屬的可能性,表達了樣本是介于類之間的特性,算法中引入隸屬度這個概念來表征這種不確定程度[18]。山核桃的破殼分離物由于在顏色特征上存在一定的相似性,顏色分量的波動范圍存在重疊區(qū),無法直接通過閾值劃分實現(xiàn)分類,有必要運用模糊聚類算法進行聚類計算。
(5)
式中:
xj——樣本X中的第j個樣本;
ci——類i的聚類中心;
uij——樣品j屬于某一類i的隸屬度;
m——隸屬度因子[19]。
首先采用拉格朗日乘數(shù)法將約束條件代入目標函數(shù)中,并按所有j展開,得
(6)
求式(6)目標函數(shù)的極值,分別對其中的變量uij、ci求導數(shù),首先對uij求導。讓求導結果等于0的方程式見式(7)。
(7)
重新利用式(1)的約束條件,解出λj,并代入式(6)中,得到最終的迭代公式:
uij=
(8)
式(8)得到山核桃樣品屬于某一類的隸屬度函數(shù),按照同樣的計算方式,求目標函數(shù)J對ci的導數(shù)式見式(9),解出聚類中心ci的迭代式見式(10)。
(9)
(10)
上述推導式中采用的數(shù)據(jù)集X的樣本xj是7維特征數(shù)據(jù)經由特征降維處理后的3維數(shù)據(jù)樣本v1,v2,v3,提取大量樣本的顏色和紋理特征數(shù)據(jù),生成數(shù)據(jù)的向量空間并寫入測量文件,保存為dat文件格式。在Matlab中完成對模糊聚類程序的編寫[22],并導入Labview平臺下的Matlab腳本中,Matlab腳本對選擇的樣本空間進行特征降維和迭代計算,導出計算得出的樣本隸屬度矩陣和各聚類中心的位置。模糊聚類應用于數(shù)據(jù)的分類計算時具有無監(jiān)督性,需要具有相當數(shù)量的樣本才能進行聚類,為能使設計出的最終程序能夠對單個樣品進行正確的識別判斷,則需要保留樣本空間的數(shù)據(jù)。以最后一次采集到的樣本為目標樣本,經過圖像的采集和分析,對顏色和紋理的特征提取,目標樣本特征數(shù)據(jù)的值是確定的,樣本空間X經過模糊C-均值聚類計算后得出的3個聚類中心的位置也是一定的,依據(jù)聚類中心ci與隸屬度ui的關系式,可以分別輸出目標樣本對已知劃分的核桃仁、外殼、內隔這3個類的隸屬度值,其中迭代終止誤差限為10-5,模糊加權指數(shù)m為2。
按照上述步驟,通過圖像采集與特征分析程序獲取選擇試驗樣品的特征數(shù)據(jù),將所有特征數(shù)據(jù)寫入測量文件fcmdata.dat中,選取數(shù)量為300個的山核桃破殼分離物樣本作聚類計算,最大迭代計算次數(shù)為30次,經過23次左右的迭代計算獲得較為穩(wěn)定的目標函數(shù)值。
停止迭代后,結果得出各分類的聚類中心位置和相應數(shù)據(jù)樣本的隸屬度值,上述選取的分離物樣本的聚類中心分布位置見表3。
表3 聚類中心計算結果
由標準試驗樣品經程序計算得到的聚類中心及隸屬度矩陣分布見圖4,圖4(a)中可以看出經過降維處理后樣本數(shù)據(jù)及聚類中心在三維空間中的分布情況,圖4(b)中的橫坐標為試驗樣本,縱坐標為樣本對應類的隸屬度值,其中:第1類為山核桃內隔的隸屬度向量,第2類為山核桃外殼的隸屬度向量,第3類為山核桃仁的隸屬度向量。從圖4可以看出,程序對作為目標識別的樣本庫的分類具有合理性。
圖4 仿真效果圖
本試驗設計了針對山核桃殼仁分離物識別的靜態(tài)試驗方案,試驗樣品選自主產地安徽省皖南山區(qū)天目山脈寧國市萬家鄉(xiāng),采摘時間為2017年9月底。以沿山核桃縫合線直徑大小分為兩類樣本,個頭較小的樣本直徑為10~20 mm,個頭較大的樣本直徑為20~30 mm,個頭較小的山核桃內部紋路較密集,顏色較深,個頭較大的山核桃內部紋路較疏松,顏色較淺,將山核桃籽料直徑較大的試驗材料命名為1號樣本,直徑較小的命名為2號樣本。1號樣本和2號樣本中各遴選50個山核桃,分別通過本課題組已經研制出的仿生敲擊式山核桃破殼機[2]和基于低損傷離心力的二次破殼機進行破殼,獲得核桃仁和破碎殼體的混合物料,通過風選機吹除粉狀和粒狀小顆粒個體,篩選出破殼后體積相對較大的分離物。
搭建靜態(tài)圖像采集與測試試驗臺,如圖5所示,采用美國國家儀器公司的Basler ace型彩色面掃描相機(含ICX618 CCD傳感器),采集圖像格式為32位色彩色圖像,解析度為659×494。試驗中采用暖白色的環(huán)形聚光光源,光線柔和,聚光效果良好,能夠有效消除圖像陰影。為獲取較為準確的顏色特征,事先對攝像頭進行校色處理,圖像的傳輸格式為bmp,保證對色彩的還原度。
經CCD攝像頭對測試樣品進行圖像采集與特征分析程序提取特征數(shù)據(jù)后,Labview中的Matlab腳本工具對測試樣品的特征數(shù)據(jù)進行隸屬度計算,獲得測試的山核桃破殼分離物對各聚類中心的隸屬度值。依據(jù)設定的隸屬度值的范圍,由分選系統(tǒng)對各測試的樣本數(shù)據(jù)實現(xiàn)自動歸類并與期望結果進行比對,由此判斷識別的正確率。2組測試樣品的歸類識別與分選測試最終效果見表4。
1. 微型LED聚光光源 2. CCD攝像機 3. 光學支架 4. 工控機 5. 顯示器
圖5 靜態(tài)圖像采集測試裝置
Figure 5 The image acquisition and test device of static image
表4 分選試驗結果
試驗結果表明,采用顏色和紋理特征并應用模糊C-均值聚類算法對山核桃破殼混合物實現(xiàn)分類并篩選出核桃仁的方法是具有可行性和較高正確率的,且對核桃仁的識別正確率高于83%。誤選為外殼和內隔分別占7.0%和4.7%,是因為有些核桃仁表皮顏色的閾值具有多樣性,其中不乏有劣質的核桃仁??紤]到識別物體的不可分離性,預估擴大樣本容量后,識別的正確率仍有進一步提升的可能性。
(1) 本試驗的研究對象是屬含隔堅果類的山核桃,根據(jù)山核桃破殼分離物的顏色和紋理特征,預先對圖像進行處理和特征提取,并運用模糊聚類算法對破殼物料合理分類,通過分類結果把核桃仁從破殼混合物料中分選出來。設計了對應的靜態(tài)試驗方案,試驗結果驗證了整體系統(tǒng)設計的可行性。系統(tǒng)對核桃仁的識別率達到了83%以上。
(2) 受到試驗條件限制,研究中采用單面拍攝的方法,可能對研究對象無法進行立體的評估,仍需進一步思考優(yōu)化評估的方法和標準。研究中為盡可能地簡化研究對象,可能受到研究樣本不充分的影響,使實際研究對象的樣本劃分不足,導致選取類以外的對象無法在色選系統(tǒng)中被識別,如殼仁未完全分離體需要對圖像區(qū)域進行分割識別。
(3) 本試驗提出了將模糊聚類算法應用到山核桃殼仁的分選,從其顏色特征的選取到分析提供了較為完整的理論依據(jù),并設計了具體的試驗方案作論證,對堅果類及相似性質的物料分選及色選具有很好的參考價值。