□ 王秀兵 濟寧市儲備糧管理處 朱志選 臨沂市糧食質(zhì)量檢測中心
不完善粒是指有蟲蝕、病斑、生霉、生芽、霉變、破損、凍傷、熱損傷或未熟等缺陷但仍有使用價值的糧食、油料顆粒[1]。不完善粒是衡量糧食質(zhì)量的一項重要指標。目前,國家標準中對不完善粒采用的是傳統(tǒng)的感官檢測方法。該方法存在耗時、費力,重復(fù)性、再現(xiàn)性差等缺點,尤其是不同檢測人員主觀性差別大,易導(dǎo)致檢測結(jié)果不一致[2-5]。為滿足實際應(yīng)用中大規(guī)模糧食快速無損檢測的要求,機器化、智能化檢測糧食不完善粒的技術(shù)研究成為主要方向。
隨著信息技術(shù)和機器識別理論的不斷發(fā)展和完善,計算機數(shù)字圖像分析技術(shù)被應(yīng)用到糧食不完善粒檢測上來,依據(jù)其原理主要分為兩類。一種是傳統(tǒng)的機器識別。對糧食籽粒圖像進行采集,然后進行圖像優(yōu)化處理、提取顏色、形態(tài)、紋理等特征參數(shù),用數(shù)據(jù)分析模型進行識別評價[6]。另外一種是基于深度學(xué)習(xí)理論的人工神經(jīng)網(wǎng)絡(luò)。采集糧食籽粒圖像數(shù)據(jù),無需預(yù)處理和特征參數(shù)提取,直接對二維圖像進行特征識別和分類[7]。
獲得優(yōu)質(zhì)圖像是準確識別不完善粒的前提。采集之前,應(yīng)調(diào)整好焦距及樣品位置,以便獲得最佳采集效果。固定合適的參數(shù)方便后期的采集。張玉榮等選擇帶LED光源,黑色環(huán)氧樹脂背景的試驗箱內(nèi)進行玉米籽粒圖像采集,亮度為-30,對比度30,分辨率600 dpi。董晶晶等采用SOC710VP高光譜成像光譜儀進行小麥籽粒圖像采集,參數(shù)選擇10×10網(wǎng)格,圖像分辨率696×520 pixel,光譜掃描范圍493~1 106 nm,掃描速度30 lines,波段數(shù)116個。此法綜合了機器視覺和光譜分析的優(yōu)點,既能獲得糧食籽粒的外部圖像信息,又能獲得糧食籽粒內(nèi)部的品質(zhì)信息。
圖像采集過程中由于環(huán)境等因素的影響產(chǎn)生噪聲,使圖像質(zhì)量下降,需對圖像進行優(yōu)化處理。圖像預(yù)處理的方法主要有濾波、灰度轉(zhuǎn)換、圖像分割等。
圖像經(jīng)濾波處理后,有利于平滑、銳化及邊緣檢測,通過算法替換噪聲點的值以消除該異常值。最常用的是均值濾波和中值濾波。其原理是對圖像中某個待處理的像素,選擇一個模版,該模版由其鄰近的若干個像素組成,用模版中像素的灰度平均值來替代原像素的灰度值[8]。張玉榮等選擇均值濾波處理,認為其效果最好。
采集到的彩色圖像一般是256色的圖像,其色彩內(nèi)容相對比較復(fù)雜,不利于圖像的算法處理,因此需要將彩色圖像轉(zhuǎn)換為灰度圖像,簡化圖像內(nèi)容,提高處理效率[9]。主要是指RGB圖像的轉(zhuǎn)換,灰度圖像沒有RGB的差異,只是亮度上的不同。目前常用的有三種方式:最大值法、平均值法和加權(quán)平均值法。
圖像分割即依據(jù)形態(tài)、顏色、紋理等參數(shù)的差異性把圖像分割成若干區(qū)域,使得不同區(qū)域具有明顯的區(qū)分度。分割主要考慮閾值、邊緣、區(qū)域、圖論、能量泛函等的差異性。對獲得的糧食圖像進行區(qū)域分割處理,獲得糧食單粒圖像,既可以去除無用信息,又可大幅減少圖像數(shù)據(jù)。目前,將單粒圖像從背景中分割出來的方法主要有最大類間方差法(OSTO)和最大方差自動取閾法[10-12]。
特征是影響識別率的重要因素。不完善粒在外觀、顏色、光滑度等方面存在明顯差異。故一般提取形態(tài)、紋理和顏色特征參數(shù)來綜合分析識別不完善粒。目前開展的研究中選取的特征參數(shù)大同小異。顏色特征提取一般選擇最通用的RGB模型,此外HSI模型也被廣泛應(yīng)用。形態(tài)特征參數(shù)主要選取籽粒長軸長、短軸長、長寬比、周長、面積、伸展度、等效圓直徑、區(qū)域填充面積、離心率、緊湊度等參數(shù)。紋理是圖像中特征值強度的某種局部重復(fù)模式的宏觀表現(xiàn),具有較強的重復(fù)性和平穩(wěn)性,體現(xiàn)了宏觀意義上的圖像特征變化的某些規(guī)律[13]。參數(shù)選擇平滑度、對比度、一致性、三階矩、熵等。
特征參數(shù)提取后,即可進行圖像識別分析。它屬于模式識別的一種。糧食品質(zhì)檢測領(lǐng)域主要采用基于統(tǒng)計模式的識別和人工神經(jīng)網(wǎng)絡(luò)的識別。而且隨著人工智能的發(fā)展,CNN、BP、SVM可將獲得的各種特征信息進行綜合分析處理,提高識別精度。
CNN模型,即卷積神經(jīng)網(wǎng)絡(luò)模型,是一種特殊的深層神經(jīng)網(wǎng)絡(luò)模型。常用的有LeNet、AlexNet、VGG、ResNet等。與傳統(tǒng)識別方法相比,降低了數(shù)值的維數(shù)和過擬合的程度,而且容錯能力好,可以有效提取數(shù)據(jù)的局部特征進行分類。CNN模型中,將圖像分割后的局部區(qū)域作為層次結(jié)構(gòu)中的底層的輸入信息,數(shù)據(jù)依次傳播通過中間各層,每層的過濾器會集并數(shù)據(jù)中的顯著特征參數(shù)。鑒于局部區(qū)域圖像邊界等基礎(chǔ)特征的相似性,該法可以提供對位移、拉伸、旋轉(zhuǎn)的穩(wěn)定性。
SVM即支持向量機,在非線性映射確定的高維特征空間上構(gòu)造最優(yōu)分類超平面,將輸入量映射至該平面。將非線性分類問題轉(zhuǎn)化為線性分類問題。與傳統(tǒng)算法相比減小了誤差,提高了效率和精度。作為一種基于統(tǒng)計學(xué)習(xí)理論的模式識別方法,被廣泛應(yīng)用在小樣本、非線性及高維模式圖像識別中,具有較強的泛化能力。
BP 神經(jīng)網(wǎng)絡(luò)是神經(jīng)網(wǎng)絡(luò)的一種,屬于多層的前饋神經(jīng)網(wǎng)絡(luò)。包含信號的前傳播和誤差的逆向傳播兩個過程。在信號傳播過程中,不斷調(diào)試各層權(quán)值,直至輸出值的誤差降低到可以接受的水平,或者達到預(yù)先設(shè)定的調(diào)試次數(shù)。張玉榮等利用主成分分析確定了7個主成分因子,并建立了7-15-7的三層BP神經(jīng)網(wǎng)絡(luò)模型,各類型不完善粒正確識別率在90%以上。
目前的研究大多是建立在靜態(tài)圖像采集基礎(chǔ)上的,而實際檢測中需要從快速運動的糧食籽粒群體中提取有效圖像特征,這就對圖像特征表現(xiàn)能力提出了更高要求,也是下一步需要解決的問題。
實際應(yīng)用過程中會存在少許誤判的情形,各種方法的識別準確率并未達到100%。例如:一些芽或幼根未突破表皮,隆起不明顯的生芽粒,即萌動粒會被誤判為完善粒。這表明有些差異不能僅用顏色和紋理特征進行準確衡量,存在一定模糊性。下一步可以考慮糧食籽粒內(nèi)部信息與外部特征相結(jié)合的方式,獲得更高的分析檢測潛質(zhì)。
實際應(yīng)用場景中,由于外界環(huán)境的影響,無法保證絕對均勻的光照條件和杜絕噪聲的引入,因此有必要提高分析模型的泛化能力,使得模型對此兩種因素可以更好地匹配。