劉翠玲,王少敏,吳靜珠,孫曉榮
1. 北京工商大學(xué)計(jì)算機(jī)與信息工程學(xué)院,北京 100048 2. 北京工商大學(xué)食品安全大數(shù)據(jù)技術(shù)北京市重點(diǎn)實(shí)驗(yàn)室,北京 100048
葵花籽是僅次于棕櫚、大豆、菜籽的世界第四大油料作物,其品質(zhì)的好壞對(duì)后期產(chǎn)油及相關(guān)產(chǎn)品的加工至關(guān)重要[1]。由于種植或儲(chǔ)存不當(dāng),葵花籽殼內(nèi)籽仁常會(huì)出現(xiàn)破損、蟲(chóng)蝕、空殼等異常情況,若在榨油時(shí)選用的葵花籽存在以上異常顆粒,將影響后期出油率及生產(chǎn)油脂的品質(zhì)。因此,從源頭把控,對(duì)葵花籽內(nèi)部品質(zhì)進(jìn)行檢測(cè)是很有必要的。
葵花籽異常顆粒的出現(xiàn)將會(huì)影響出油率和油脂的品質(zhì),傳統(tǒng)的檢測(cè)方法主要有人工檢驗(yàn)和機(jī)器篩選,人工檢驗(yàn)耗費(fèi)人力,主觀性較大,可能存在漏檢等問(wèn)題;機(jī)器篩選會(huì)破壞葵花籽外殼,易造成原材料污染,不利于后期貯藏加工。Ma等[2]利用可見(jiàn)光和近紅外區(qū)域的多光譜成像技術(shù)對(duì)葵花籽昆蟲(chóng)侵染、發(fā)霉、異色、酸敗等異常情況進(jìn)行了非破壞性區(qū)分,利用Fisher’s線(xiàn)性判別函數(shù)進(jìn)行特征波長(zhǎng)提取,結(jié)合Wilks lambda逐步法,對(duì)完好無(wú)損的葵花籽進(jìn)行分類(lèi),準(zhǔn)確率最低可達(dá)到97%;同時(shí)利用多光譜成像技術(shù)結(jié)合主成分分析聚類(lèi)分析(PCA-CA),對(duì)不同酸敗程度的完整向日葵種子進(jìn)行精準(zhǔn)區(qū)分。李艷茹等[3]利用低場(chǎng)核磁共振技術(shù)結(jié)合主成分分析(PCA)方法對(duì)3種不同品種的葵花籽進(jìn)行區(qū)分,并建立偏最小二乘回歸(PLSR)模型對(duì)3種葵花籽的含油量進(jìn)行預(yù)測(cè),實(shí)現(xiàn)了葵花籽品質(zhì)的檢測(cè)。Jayabrindha等[4]通過(guò)機(jī)器視覺(jué)技術(shù)對(duì)10個(gè)不同品種的葵花籽進(jìn)行品種鑒定,利用SVM分類(lèi)算法結(jié)合最佳順序級(jí)聯(lián)方法,分類(lèi)準(zhǔn)確率達(dá)到98.82%。以上研究?jī)?nèi)容均實(shí)現(xiàn)對(duì)葵花籽品質(zhì)的檢測(cè),但由于實(shí)驗(yàn)儀器或方法的限制,均通過(guò)葵花籽的外部特征或剝除外殼后對(duì)品質(zhì)進(jìn)行檢測(cè)研究,無(wú)法實(shí)現(xiàn)對(duì)葵花籽殼內(nèi)籽仁品質(zhì)的帶殼無(wú)損檢測(cè)。
太赫茲波介于紅外和微波之間,具有較低能量和較高穿透性,不會(huì)引起有害的電離反應(yīng),且對(duì)絕大部分非極性物質(zhì)有較強(qiáng)穿透能力,近年來(lái)在食品[5]、農(nóng)業(yè)[6]、工業(yè)[7]、醫(yī)學(xué)[8]、安檢[9]及考古[10]等檢測(cè)領(lǐng)域得到了廣泛應(yīng)用。相比現(xiàn)有檢測(cè)手段,太赫茲時(shí)域光譜成像技術(shù)能在不破壞葵花籽外殼的情況下將內(nèi)部籽仁的形態(tài)以圖像的形式呈現(xiàn)出來(lái)。因此,本文利用太赫茲時(shí)域透射成像技術(shù)分別獲得帶殼葵花籽正常粒、破損粒、蟲(chóng)蝕粒和空殼粒的透射圖像,再通過(guò)形態(tài)學(xué)濾波和K-均值圖像分割算法,實(shí)現(xiàn)對(duì)葵花籽殼內(nèi)籽仁品質(zhì)的帶殼無(wú)損檢測(cè),為帶殼油料作物內(nèi)部品質(zhì)的無(wú)損檢測(cè)提供新思路。
本文選擇主要用于榨油的小油葵作為實(shí)驗(yàn)對(duì)象。為檢測(cè)葵花籽常見(jiàn)的異常情況,選用一顆正??ㄗ裑如圖1(a)]作為參照樣本,同時(shí)參照GB/T 5494—2008《糧油檢驗(yàn) 糧食、油料的雜質(zhì)、不完善粒檢驗(yàn)》制備破損粒[如圖1(b),去掉葵花籽仁一部分)、蟲(chóng)蝕粒(如圖1(c),籽仁邊緣挖洞]、空殼粒[如圖1(d),去掉籽仁]三類(lèi)異常樣本。制備完成后將葵花籽的外殼嚴(yán)絲合縫的合并固定,使其在外觀上與正??ㄗ淹耆嗤?。
圖1 葵花籽樣品圖(a):正常粒;(b):破損粒;(c):蟲(chóng)蝕粒;(d):空殼粒Fig.1 Sample of sunflower seeds(a):Normal seed;(b):Damaged kernel;(c):Worm-eaten kernel;(d):Empty seed
實(shí)驗(yàn)儀器采用劍橋Tera View公司生產(chǎn)的太赫茲時(shí)域脈沖光譜儀,型號(hào)為T(mén)eraPulse 4000,如圖2(a)所示,成像方式為脈沖成像,可發(fā)射頻率從60 GHz到4 THz(2~133 cm-1)的太赫茲波,信噪比最高可達(dá)到70 dB。圖像數(shù)據(jù)采集部分利用太赫茲透射成像附件進(jìn)行,如圖2(b)所示,其掃描范圍為20 mm×20 mm。
圖2 實(shí)驗(yàn)儀器(a):太赫茲脈沖光譜儀;(b)太赫茲透射成像附件Fig.2 Experimental apparatus(a):Terahertz pulse spectrometer;(b):Terahertz transmission imaging attachment
葵花籽光譜圖像采集具體過(guò)程如下:將透射附件安裝到太赫茲時(shí)域脈沖光譜儀上,采集無(wú)樣品時(shí)的太赫茲脈沖波作為參考信號(hào),確認(rèn)信號(hào)源無(wú)誤后開(kāi)始正式實(shí)驗(yàn)。將樣品固定在樣品架中心位置,設(shè)置相關(guān)參數(shù)后開(kāi)始采集,采集過(guò)程由TeraPulse軟件控制執(zhí)行。根據(jù)樣本大小設(shè)置合適的采樣范圍,以0.2 mm分辨率進(jìn)行光譜圖像采集,采集一個(gè)完整的樣本圖像所需時(shí)間約13~14 min。圖像重構(gòu)方式選擇峰峰值成像。
太赫茲圖像含有噪聲,分辨率較低,邊緣模糊不光滑,需要對(duì)原始圖像進(jìn)行相關(guān)優(yōu)化處理,保證葵花籽品質(zhì)檢測(cè)的準(zhǔn)確性。
1.4.1 圖像濾波處理
為保留葵花籽透射圖像中的邊緣信息,選用形態(tài)學(xué)濾波器(Morphological filter)中的外部梯度[11]進(jìn)行圖像濾波處理。外部梯度先對(duì)原始圖像進(jìn)行一定次數(shù)的膨脹操作,再將膨脹結(jié)果與原始圖像做差,實(shí)現(xiàn)對(duì)原始圖像的濾波。
1.4.2 圖像分割算法
圖像分割方法包括基于閾值、基于區(qū)域、基于聚類(lèi)及基于特定理論四大類(lèi),本研究選用基于聚類(lèi)的K-均值(K-means)圖像分割算法對(duì)濾波后的葵花籽圖像進(jìn)行分割。K-means算法可以實(shí)現(xiàn)類(lèi)間相似度最低和類(lèi)內(nèi)相似度最高[12],其基本原理[13]為:
將待分割圖像中所有像素點(diǎn)看作數(shù)據(jù)集合中的所有樣本點(diǎn),隨機(jī)選取K個(gè)樣本點(diǎn)作為初始聚類(lèi)中心,計(jì)算每個(gè)樣本點(diǎn)到各聚類(lèi)中心的歐氏距離,找出其中的最小值,將該樣本點(diǎn)劃入該聚類(lèi)中心所屬類(lèi),遍歷完所有樣本點(diǎn)以后,重新確定聚類(lèi)中心,一般以所在區(qū)域內(nèi)樣本點(diǎn)的均值作為新的聚類(lèi)中心;然后再次計(jì)算每個(gè)樣本點(diǎn)到新的聚類(lèi)中心的距離,對(duì)樣本重新進(jìn)行歸類(lèi),再次調(diào)整聚類(lèi)中心;重復(fù)以上步驟,直到聚類(lèi)中心不再改變,即當(dāng)前所屬類(lèi)區(qū)域內(nèi)的樣本點(diǎn)到該聚類(lèi)中心的歐式距離平方和最小,樣本點(diǎn)劃分完畢,圖像分割完成。
以上數(shù)據(jù)處理過(guò)程均通過(guò)Matlab2017軟件完成。
太赫茲圖像不僅包含樣品的空間信息,也包括樣品時(shí)間軸上的信息,圖像中的每個(gè)像素點(diǎn)代表一條光譜。通過(guò)太赫茲透射成像附件掃描所得樣本的太赫茲圖像如圖3所示,觀察葵花籽的太赫茲圖像可發(fā)現(xiàn),葵花籽內(nèi)部籽仁的形態(tài)可初步分辨,但仍存在分辨率較低,邊緣不明確的問(wèn)題。
圖3 四類(lèi)葵花籽的太赫茲透射圖像(a):正常粒;(b):破損粒;(c):蟲(chóng)蝕粒;(d):空殼粒Fig.3 Terahertz transmission images of four categories of sunflower seeds(a):Normal seed;(b):Damaged kernel;(c):Worm-eaten kernel;(d):Empty seed
此外,葵花籽的不同位置成像后顏色不同,以蟲(chóng)蝕粒為例,對(duì)比籽仁部分和外殼部分太赫茲光譜可以發(fā)現(xiàn)有明顯區(qū)別,如圖4所示。籽仁主要成分為脂肪和蛋白質(zhì),所得太赫茲光譜曲線(xiàn)圖有明顯的兩個(gè)峰,并且籽仁部分相比空殼部分較厚,對(duì)太赫茲波的吸收較強(qiáng),因此太赫茲信號(hào)的強(qiáng)度最大只達(dá)到2左右;空殼部分為干燥的木質(zhì)化外殼,對(duì)太赫茲信號(hào)吸收較少,太赫茲信號(hào)的強(qiáng)度最大可達(dá)到5左右。由于不同位置物質(zhì)不同,對(duì)太赫茲光的吸收強(qiáng)度不同,太赫茲光透射率不同,最終探測(cè)到返回的信號(hào)強(qiáng)度不同,使得重構(gòu)后圖像的不同位置有明顯的顏色差異。因此,通過(guò)對(duì)葵花籽的太赫茲圖像進(jìn)行分析處理,實(shí)現(xiàn)對(duì)葵花籽品質(zhì)的帶殼無(wú)損檢測(cè)是可行的。
圖4 葵花籽不同位置對(duì)應(yīng)的時(shí)域光譜Fig.4 Time-domain spectra corresponding to different positions of sunflower seed
為實(shí)現(xiàn)對(duì)葵花籽殼內(nèi)籽仁異常情況的檢測(cè),需要提高圖像的對(duì)比度,同時(shí)盡可能保證邊緣信息被保留,因此首先對(duì)葵花籽太赫茲圖像進(jìn)行濾波處理。圖5為采用中值濾波、均值濾波及非局部均值(non-local means,NLM)濾波對(duì)蟲(chóng)蝕粒的太赫茲圖像進(jìn)行濾波所得的結(jié)果,其中圖5(a)為利用5×5模板進(jìn)行均值濾波所得結(jié)果,圖5(b)為5×5模板進(jìn)行中值濾波的結(jié)果,圖5(c)為搜索窗口為5×5、鄰域窗口為2×2、濾波程度為10時(shí)NLM濾波結(jié)果。
圖5 蟲(chóng)蝕葵花籽太赫茲圖像濾波結(jié)果圖(a):5×5模板均值濾波;(b):5×5模板中值濾波;(c):NML濾波Fig.5 Terahertz image filtering results of insect-eroded sunflower seeds(a):5×5 template mean filtering;(b):5×5 template median filtering;(c):NML filtering
圖6為采用外部梯度對(duì)葵花籽蟲(chóng)蝕粒的太赫茲圖像進(jìn)行濾波的結(jié)果。在利用外部梯度進(jìn)行濾波時(shí),應(yīng)先考慮對(duì)原始圖像的膨脹。由膨脹的原理可知,與原始圖像進(jìn)行卷積的核的選擇會(huì)直接影響濾波后圖像的質(zhì)量。觀察采集的太赫茲圖像可發(fā)現(xiàn)由于儀器精度限制和噪聲影響,圖像邊緣為鋸齒狀。為保證樣本形狀不發(fā)生巨大變化,同時(shí)使邊緣光滑,本文選擇的核為平坦型菱形結(jié)構(gòu)元素,其尺寸大小為3。同時(shí),為確保圖像不被過(guò)度膨脹,本文只對(duì)各葵花籽的透射圖像進(jìn)行一次膨脹,之后將膨脹結(jié)果與原始圖像做差,求得外部梯度。對(duì)比蟲(chóng)蝕粒的外部梯度結(jié)果[如圖6(c)]和基礎(chǔ)形態(tài)學(xué)梯度結(jié)果[如圖6(d)]可發(fā)現(xiàn),外部梯度的濾波結(jié)果相比基本形態(tài)學(xué)梯度的濾波結(jié)果有明顯提升。
圖6 蟲(chóng)蝕葵花籽太赫茲圖像形態(tài)學(xué)濾波結(jié)果圖(a):原始圖像;(b);一次膨脹結(jié)果;(c):外部梯度;(d):形態(tài)學(xué)梯度Fig.6 Results of morphological filtering of insect-eroded sunflower seeds terahertz image(a):Original image;(b):One dilatation result;(c):External gradient;(d):Morphological gradient
對(duì)比圖5和圖6(c)的濾波結(jié)果可以發(fā)現(xiàn),中值濾波、均值濾波及NLM濾波能很好地去除噪聲,但圖像清晰度低,邊緣部分并沒(méi)有得到很好地保留,不利于葵花籽籽仁形態(tài)的檢測(cè)。而形態(tài)學(xué)濾波明顯提升了圖像質(zhì)量,在有效去除圖像噪聲的同時(shí),提高圖像對(duì)比度,還能準(zhǔn)確保留圖像邊緣信息,使葵花籽與背景之間有明顯界限,其濾波結(jié)果明顯優(yōu)于中值濾波、均值濾波及NLM濾波結(jié)果。四種不同狀態(tài)的葵花籽對(duì)應(yīng)的形態(tài)學(xué)濾波結(jié)果如圖7所示。
圖7 不同狀態(tài)葵花籽圖像形態(tài)學(xué)濾波結(jié)果(a):正常粒;(b):破損粒;(c):蟲(chóng)蝕粒;(d):空殼粒Fig.7 Morphological filtering results of sunflower seed images with different states(a):Normal seed;(b):Damaged kernel;(c):Worm-eaten kernel;(d):Empty seed
為進(jìn)一步準(zhǔn)確識(shí)別葵花籽殼內(nèi)籽仁狀態(tài),本文采用K-means聚類(lèi)算法對(duì)濾波后的太赫茲圖像進(jìn)行圖像分割。經(jīng)形態(tài)學(xué)濾波后的太赫茲圖像是RGB圖像,構(gòu)成的是一種非均勻顏色空間,用歐氏距離難以測(cè)量出顏色之間的特征差異,影響分割效果。而CIE(Commission Internationale de L’Eclairage,國(guó)際照明委員會(huì))-Lab顏色空間是一種均勻的顏色空間[14],在該顏色空間中,歐氏距離測(cè)量不同顏色之間差異性時(shí)具有不變性,即顏色相近的像素點(diǎn)其歐氏距離相應(yīng)較小,顏色差異較大的其對(duì)應(yīng)歐氏距離也較大[15]。因此,為使圖像分割結(jié)果準(zhǔn)確,先將濾波后的太赫茲圖像轉(zhuǎn)換到Lab顏色空間再進(jìn)行分割。
K-means聚類(lèi)算法是一種無(wú)導(dǎo)師監(jiān)督的學(xué)習(xí)算法,初始聚類(lèi)中心個(gè)數(shù)K的選擇直接影響圖像分割結(jié)果。本文針對(duì)籽仁的不同狀態(tài)確定各葵花籽圖像的初始聚類(lèi)中心個(gè)數(shù)K如下:破損粒K=4,蟲(chóng)蝕粒K=5,空殼粒K=3、正常粒K=4。確定初始聚類(lèi)中心的個(gè)數(shù)后,設(shè)置最大迭代次數(shù)為500次,即可對(duì)不同狀態(tài)的葵花籽圖像進(jìn)行分割,結(jié)果如圖8所示。
由圖8可看出,空殼粒圖像分割結(jié)果[圖8(d)]最好,能迅速準(zhǔn)確的判斷殼內(nèi)無(wú)籽仁;正常粒[圖8(a)]、破損粒[圖8(b)]及蟲(chóng)蝕粒[圖8(c)]的分割結(jié)果能將葵花籽籽仁部分劃分為一個(gè)類(lèi),但籽仁的最中間部分被分割到與背景同類(lèi),分析其原因是由于葵花籽籽仁的最中間位置沒(méi)有邊緣部分緊實(shí),透過(guò)的太赫茲光強(qiáng)度相對(duì)較大,成像后的顏色經(jīng)形態(tài)學(xué)濾波后與背景顏色接近,故而在圖像分割時(shí)與背景歸為一類(lèi),但最終的圖像分割結(jié)果并未影響對(duì)葵花籽籽仁形態(tài)的判定。因此,盡管存在一些小的噪聲類(lèi),但K-means分割算法仍能準(zhǔn)確呈現(xiàn)葵花籽殼內(nèi)籽仁的形態(tài),實(shí)現(xiàn)對(duì)葵花籽品質(zhì)的無(wú)損檢測(cè)。
圖8 不同狀態(tài)葵花籽圖像K-means圖像分割結(jié)果(a):正常粒;(b):破損粒;(c):蟲(chóng)蝕粒;(d):空殼粒Fig.8 K-means image segmentation results of sunflower seed images with different states(a):Normal seed;(b):Damaged kernel;(c):Worm-eaten kernel;(d):Empty seed
利用太赫茲時(shí)域透射成像技術(shù)分別獲得正常飽滿(mǎn)的葵花籽和籽仁破損、蟲(chóng)蝕、缺失三種異常情況下葵花籽的太赫茲圖像,利用形態(tài)學(xué)濾波中的外部梯度對(duì)葵花籽太赫茲圖像進(jìn)行濾波處理,在提高圖像清晰度的同時(shí),保證了樣品的形狀及邊緣信息不被改變或模糊。此外,結(jié)合K-means圖像分割算法對(duì)濾波后圖像進(jìn)行分割,提高了對(duì)葵花籽殼內(nèi)籽仁形態(tài)的檢測(cè)準(zhǔn)確性。實(shí)驗(yàn)結(jié)果表明,相比傳統(tǒng)檢測(cè)方法費(fèi)時(shí)費(fèi)力,易造成原材料污染等缺點(diǎn),太赫茲時(shí)域透射成像技術(shù)可以在不破壞葵花籽外殼的情況下將殼內(nèi)籽仁的形態(tài)以圖像的形式直觀呈現(xiàn),結(jié)合形態(tài)學(xué)濾波算法及K-means圖像分割算法,能夠?qū)ㄗ褮?nèi)籽仁的品質(zhì)實(shí)現(xiàn)快速無(wú)損綠色檢測(cè),為建立基于太赫茲時(shí)域光譜圖像的葵花籽品質(zhì)檢測(cè)模型奠定基礎(chǔ),為油料作物內(nèi)部品質(zhì)的帶殼無(wú)損檢測(cè)提供新的方法參考。