馬文強(qiáng) 張漫 李源 李民贊 楊莉玲 朱占江 崔寬波
摘 要 采用光譜與圖像相結(jié)合,實(shí)現(xiàn)了核桃仁蛋白質(zhì)和脂肪含量預(yù)測(cè)及基于完整度和色澤的核桃仁外觀品質(zhì)分級(jí)。選用新疆“溫185”核桃仁,采集了862.9~1704.02 nm和382.19~1026.66 nm范圍高光譜圖像。采用多元散射校正(MSE)和標(biāo)準(zhǔn)正態(tài)化(SNV)方法進(jìn)行預(yù)處理后,通過(guò)競(jìng)爭(zhēng)性自適應(yīng)重加權(quán)采樣算法與相關(guān)系數(shù)法,對(duì)核桃仁樣品的蛋白質(zhì)含量、脂肪含量、總色差3個(gè)參數(shù)進(jìn)行了特征波段篩選。通過(guò)偏最小二乘回歸(PLSR)算法建立了全光譜波段與特征光譜波段的蛋白質(zhì)和脂肪含量預(yù)測(cè)模型,與全光譜波段相比,蛋白質(zhì)含量特征波段預(yù)測(cè)模型的驗(yàn)證集決定系數(shù)(R2)由0.66增長(zhǎng)到0.91,均方根誤差(RMSEP)由1.37%下降到0.78%; 脂肪含量特征波段預(yù)測(cè)模型的驗(yàn)證集R2由0.83增長(zhǎng)到0.93, RMSEP由0.98%下降到0.47%。在外觀品質(zhì)方面,采用全光譜波段、RGB光譜波段、總色差特征光譜波段為輸入,采用決策樹(shù)、K近鄰和支持向量機(jī)算法建立了核桃仁外觀品質(zhì)分類模型。通過(guò)對(duì)比發(fā)現(xiàn),采用總色差特征波段建模,可大幅減低冗余信息的干擾,同時(shí)分類準(zhǔn)確率也高于RGB波段; 在光譜信息的基礎(chǔ)上加入圖像統(tǒng)計(jì)特征參數(shù)信息,能夠進(jìn)一步提升分類的準(zhǔn)確率,當(dāng)采用決策數(shù)算法建立的色澤分類模型時(shí),模型具有最高的分類準(zhǔn)確率(98.6%); 分類算法方面,當(dāng)輸入變量數(shù)目較少時(shí),決策樹(shù)算法在分類準(zhǔn)確率和速度方面都具有明顯的優(yōu)勢(shì)。利用高光譜技術(shù)可以實(shí)現(xiàn)核桃仁內(nèi)部品質(zhì)檢測(cè)與外觀分級(jí),為核桃仁品質(zhì)無(wú)損檢測(cè)的提供了新的理論依據(jù)。
關(guān)鍵詞 核桃仁; 高光譜圖像; 無(wú)損檢測(cè); 分類; 特征波段
1 引 言
核桃是一種老幼皆宜的堅(jiān)果食品和重要的木本油料作物,我國(guó)核桃種植面積及產(chǎn)量均居世界首位[1]。核桃仁品質(zhì)檢測(cè)與分級(jí)是核桃生產(chǎn)加工的重要環(huán)節(jié)。按照國(guó)家相關(guān)標(biāo)準(zhǔn)[2-3]的規(guī)定,核桃仁外觀品質(zhì)指標(biāo)包括完整度和表皮色澤,內(nèi)部品質(zhì)指標(biāo)包含脂肪含量和蛋白質(zhì)含量。實(shí)際生產(chǎn)中核桃仁分級(jí)主要依靠外形和色澤進(jìn)行人工挑選,生產(chǎn)成本高,分級(jí)隨意性大,難以對(duì)內(nèi)部品質(zhì)進(jìn)行分辨。傳統(tǒng)的化學(xué)檢測(cè)對(duì)樣品具有破環(huán)性,檢測(cè)時(shí)間也較長(zhǎng),難以適應(yīng)現(xiàn)代化生產(chǎn)要求。
機(jī)器視覺(jué)和近紅外光譜是農(nóng)產(chǎn)品品質(zhì)研究中采用較多的技術(shù)手段。在采用機(jī)器視覺(jué)進(jìn)行核桃仁分級(jí)方面,申愛(ài)敏等[4]以統(tǒng)計(jì)出的灰度圖像核桃仁的面積為依據(jù),采用閾值法自動(dòng)識(shí)別核桃仁等級(jí),分級(jí)正確率大于90%。蔡建等[5]提取了核桃仁圖像在HSV顏色空間的顏色直方圖、飽和度與明度的一、二階距、最小外接矩形長(zhǎng)寬比、輪廓面積與最小外接圓面積比等色澤與外觀參數(shù),采用決策樹(shù)(Decision tree, DT)算法進(jìn)行核桃仁分級(jí)預(yù)測(cè)建模,總體正確率達(dá)到92%。周軍等[6]在此基礎(chǔ)上進(jìn)一步加入了顏色距、圖像幾何不變距等顏色和外觀特征,并采用最大相關(guān)最小冗余算法對(duì)特征變量進(jìn)行篩選,通過(guò)樸素貝葉斯(Native Bayesian, NB)分類算法對(duì)核桃仁等級(jí)進(jìn)行建模預(yù)測(cè),分級(jí)正確率達(dá)到97.33%。在采用近紅外光譜進(jìn)行核桃仁內(nèi)部品質(zhì)檢測(cè)方面,郝中誠(chéng)等[7]采用了標(biāo)準(zhǔn)正態(tài)化預(yù)處理和偏最小二乘回歸(Partial least squares regression, PLSR)算法建立了核桃殼、仁近紅外光譜與含水率的預(yù)測(cè)模型,模型平均偏差達(dá)到了0.35%。本研究組前期采用近紅外光譜技術(shù)開(kāi)展了核桃仁品種分類及蛋白質(zhì)含量預(yù)測(cè)研究,采用主成分分析(Principal component analysis, PCA)與支持向量機(jī)(Support vector machine, SVM)相結(jié)合的方法對(duì)4個(gè)不同品種的核桃仁樣品近紅外光譜進(jìn)行分類,總體正確識(shí)別率達(dá)到 96%; 進(jìn)一步采用間隔偏最小二乘(Interval partial least squares, IPLS)算法對(duì)核桃仁蛋白質(zhì)含量特征波段進(jìn)行篩選,并建立了核桃仁蛋白質(zhì)含量偏PLS預(yù)測(cè)模型, 針對(duì)驗(yàn)證集的均方根誤差和相關(guān)系數(shù)分別為0.021和0.913[8,9]。核桃仁品質(zhì)檢測(cè)中需要對(duì)核桃仁內(nèi)外部品質(zhì)做出整體評(píng)價(jià),但兩種技術(shù)都無(wú)法同時(shí)反映被測(cè)樣品的外觀與內(nèi)部品質(zhì)信息。
高光譜成像同時(shí)包含了圖像和光譜兩種技術(shù)方法,其原理是采用高光譜成像設(shè)備對(duì)拍攝對(duì)象的反射光在光譜范圍內(nèi)進(jìn)行細(xì)分,然后采集每個(gè)對(duì)應(yīng)光譜波段的圖像信息,最終獲得具有三維數(shù)據(jù)的高光譜圖像信息。高光譜圖像不僅可以獲得圖像中每個(gè)點(diǎn)的光譜信息,而且可以獲得任意光譜波段的圖像,可以直觀地顯示出被拍攝對(duì)象的外觀特征、光譜特征、顏色特征、紋理特征等豐富的信息,因此,在農(nóng)產(chǎn)品品質(zhì)檢測(cè)方面的研究日益廣泛[10~14],目前已應(yīng)用于油料[15]、肉類[16]、水果[17]、種子[18]、飲料[19]等農(nóng)產(chǎn)品的無(wú)損檢測(cè)及分類方面。但是,由于成分、形狀的不同,以上成果無(wú)法直接用于核桃仁內(nèi)外部品質(zhì)檢測(cè)及分類。目前,采用高光譜技術(shù)進(jìn)行核桃品質(zhì)檢測(cè)的研究主要集中于核桃殼仁分類[20],針對(duì)核桃仁品質(zhì)的研究尚未見(jiàn)相關(guān)報(bào)道。
基于以上分析,為了探索同時(shí)實(shí)現(xiàn)核桃仁內(nèi)部品質(zhì)檢測(cè)和外觀等級(jí)分類的方法,本研究采用高光譜成像技術(shù)開(kāi)展了核桃仁脂肪含量、蛋白質(zhì)含量及色澤的特征光譜篩選,篩選出了品質(zhì)指標(biāo)的相關(guān)特征波段,進(jìn)一步建立了核桃仁脂肪含量和蛋白質(zhì)含量PLS預(yù)測(cè)模型,并采用DT算法建立了基于完整度和表皮色澤的核桃仁外觀等級(jí)分類模型,取得了較好的預(yù)測(cè)和分類效果,以期為核桃仁品質(zhì)無(wú)損檢測(cè)的應(yīng)用提供參考。
2 實(shí)驗(yàn)部分
2.1 實(shí)驗(yàn)樣本及其處理
實(shí)驗(yàn)樣品選用新疆“溫185”核桃,含水量為7%,實(shí)驗(yàn)前于4℃儲(chǔ)藏約5個(gè)月。手工破殼取仁,選取核桃仁樣品60枚,包含半仁、1/4仁和碎仁3個(gè)完整度等級(jí)和淺黃色、淺琥珀色、琥珀色3個(gè)色澤等級(jí),核桃仁樣本不同外觀等級(jí)示例如圖1所示,樣品外觀等級(jí)分布情況如表1所示。通過(guò)高光譜成像設(shè)備采集高光譜圖像后,使用色差儀采集每個(gè)核桃仁樣品5個(gè)不同位置的總色差,計(jì)算其平均值ΔE,并將核桃仁樣品的色澤類型按照測(cè)量計(jì)算出的總色差ΔE進(jìn)行劃分,其中: 淺黃色仁ΔE≥68,淺琥珀色仁60≤ΔE<68,琥珀色仁ΔE<60。按照食品安全國(guó)家標(biāo)準(zhǔn)GB5009.5-2016和GB 5009.6-2016要求,采用Foss全自動(dòng)凱氏定氮儀測(cè)量每個(gè)樣品的蛋白質(zhì)含量,采用索氏提取器測(cè)量脂肪含量。
2.2 高光譜圖像采集
高光譜圖像采集設(shè)備為北京卓立漢光公司生產(chǎn)的Gaia Sorter高光譜成像儀,儀器結(jié)構(gòu)如圖2所示,主要由成像光譜儀(V10E)、鏡頭(OL23)、CCD(LT365)、均勻光源(2套溴鎢燈)、電控移動(dòng)平臺(tái)、計(jì)算機(jī)及軟件控制系統(tǒng)組成。開(kāi)機(jī)后首先進(jìn)行預(yù)熱,以消除基線漂移造成的影響; 預(yù)熱后進(jìn)行鏡頭調(diào)焦并調(diào)試平臺(tái)移動(dòng)速度以避免圖像失真。采用圖像采集軟件Spectra View采集核桃仁成像信息,分別在863~1704 nm和382~1027 nm光譜范圍采集核桃仁樣品高光譜圖像,兩個(gè)光譜范圍內(nèi)的光譜分辨率分別為3.2和0.84 nm。
為了消除光照不均勻、周圍環(huán)境以及儀器暗電流造成的噪聲影響,需要在采集樣本高光譜圖像前,分別利用標(biāo)準(zhǔn)白板和鏡頭蓋采集白背景信息(Iw)和黑背景信息(Ib),然后按照公式(1)對(duì)采集的樣本原始高光譜圖像(I0)進(jìn)行黑白校正,得到校正后的圖像信息(I)。
其中,I為校正后的圖像信息; I0為原始高光譜圖像; Iw為白背景信息; Ib為黑背景信息。
2.3 光譜數(shù)據(jù)預(yù)處理與特征波段篩選
采用ENVI5.1軟件對(duì)核桃仁樣品高光譜圖像進(jìn)行感興趣區(qū)域(Region of interesting, ROI)提取,計(jì)算出感興趣區(qū)域光譜平均值作為樣品光譜信息,然后使用Matlab R2015a軟件進(jìn)行后續(xù)處理。原始光譜中含有較多的環(huán)境背景噪聲信息,因此進(jìn)一步采用多元散射校正(Multivariate scatter correction, MSE)和標(biāo)準(zhǔn)正態(tài)化(Standard normalized variate, SNV)的組合方法對(duì)原始光譜信息進(jìn)行預(yù)處理。
全光譜波段數(shù)據(jù)中包含較多與感興趣參數(shù)相關(guān)度較低的無(wú)關(guān)信息及冗余數(shù)據(jù),因此需要進(jìn)一步進(jìn)行特征波段篩選,以提高光譜數(shù)據(jù)信噪比,降低計(jì)算數(shù)據(jù)量。競(jìng)爭(zhēng)性自適應(yīng)重加權(quán)算法(Competitive adaptive reweighted sampling, CARS)是近年應(yīng)用較多的一種新型特征波段篩選算法,可以快速有效剔除全光譜波段內(nèi)的無(wú)關(guān)數(shù)據(jù),但CARS算法獲得的特征波段中仍存在冗余信息。本研究針對(duì)核桃仁蛋白質(zhì)含量、脂肪含量和總色差3個(gè)參數(shù),采用CARS算法與相關(guān)系數(shù)法(Correlation coefficient method, CCM)相結(jié)合的方法在對(duì)應(yīng)的全光譜波段范圍內(nèi)進(jìn)行了特征波段篩選,步驟如下: (1)去除了前段和后段受系統(tǒng)噪聲影響較大個(gè)波段點(diǎn)后,采用CARS算法針對(duì)感興趣的預(yù)測(cè)參數(shù)進(jìn)行特征波段篩選; (2)計(jì)算篩選出的特征波段中所有波段兩兩組合的相關(guān)系數(shù)絕對(duì)值; (3)設(shè)定相關(guān)系數(shù)絕對(duì)值閾值為0.9,統(tǒng)計(jì)任一波段與其它波段相關(guān)系數(shù)絕對(duì)值≥0.9的數(shù)目; (4)剔除與其它波段相關(guān)系數(shù)≥0.9數(shù)目最多的波段,并返回步驟(2)重新統(tǒng)計(jì); (5)當(dāng)所有波段兩兩組合的相關(guān)系數(shù)絕對(duì)值都小于0.9時(shí), 結(jié)束優(yōu)選。
2.4 核桃仁品質(zhì)檢測(cè)方法
2.4.1 核桃仁內(nèi)部品質(zhì)檢測(cè)方法 為了減小光譜獲取及品質(zhì)參數(shù)化學(xué)檢測(cè)中測(cè)量誤差的影響,采用馬氏距離((Mahalanobis distance, MD)法對(duì)測(cè)量值異常的樣品信息進(jìn)行剔除。具體方法是: 分別計(jì)算每個(gè)樣本光譜信息和化學(xué)測(cè)量值到樣本集中心的MD,然后統(tǒng)計(jì)樣本集MD的均值μ和均方差σ,以μ+3σ為閾值,將MD大于閾值的樣本作為異常樣本剔除。剔除異常樣品信息后,通過(guò)隨機(jī)抽樣法按2∶1的比例將樣本劃分為校正集和驗(yàn)證集。針對(duì)蛋白質(zhì)含量和脂肪含量,分別建立全光譜波段和特征光譜波段的PLSR模型,采用決定系數(shù)R2和均方誤差(Root mean square error, RMSE) 對(duì)模型進(jìn)行評(píng)估。
2.4.2 核桃仁外觀等級(jí)鑒別方法 核桃仁表皮色澤和完整度等級(jí)是進(jìn)行核桃仁外觀等級(jí)鑒別的關(guān)鍵因素。首先,在核桃仁表皮色澤等級(jí)識(shí)別方面,由于總色差是反映核桃仁表皮色澤的直接參數(shù),而總色差特征波段與總色差參數(shù)具有很高的相關(guān)性,因此提取了總色差特征波段的灰度圖像,用于進(jìn)一步圖像處理。同時(shí)為了比較與RGB(475、550和650 nm)圖像在核桃仁色澤鑒別中的差異,也提取了RGB圖像用于對(duì)比處理。不同色澤等級(jí)的樣品在圖像灰度分布統(tǒng)計(jì)量和灰度共生矩陣統(tǒng)計(jì)量存在差異,也可以用于不同色澤等級(jí)樣品的分類。本研究通過(guò)計(jì)算總色差特征波段平均灰度圖像和RGB灰度圖像的灰度分布統(tǒng)計(jì)量(均值、標(biāo)準(zhǔn)差、平滑度、一致性、熵、三階矩)和灰度共生矩陣統(tǒng)計(jì)量(對(duì)比度、相關(guān)性、能量、熵)共10個(gè)作為圖像統(tǒng)計(jì)特征參數(shù),用于核桃仁色澤等級(jí)分類。以全光譜波段信息、RGB光譜波段信息、總色差特征光譜波段信息以及光譜信息與圖像統(tǒng)計(jì)特征參數(shù)的組合為輸入變量,以樣品色澤等級(jí)標(biāo)簽為輸出變量,建立了DT算法、K近鄰(k-Nearest neighbor, KNN)算法和SVM3種色澤分類模型,其中,KNN算法中K=4,SVM采用線性核函數(shù)。建立模型時(shí),通過(guò)隨機(jī)抽樣法按2∶1的比例劃分訓(xùn)練集和驗(yàn)證集,以10次隨機(jī)抽樣劃分的驗(yàn)證集分類準(zhǔn)確率平均值作為模型分類平均準(zhǔn)確率由于對(duì)分類模型進(jìn)行評(píng)估。在核桃仁外觀完整度等級(jí)分類方面,本研究對(duì)總色差特征波段灰度圖像進(jìn)行otsu閾值分割和先膨脹后腐蝕處理后,根據(jù)核桃仁的外形特點(diǎn),選取高、寬、高寬比、面積、矩形度、圓形度6個(gè)外觀參數(shù)用于核桃仁完整度等級(jí)的分類。
以382~1027 nm范圍的全光譜信息、RGB波段光譜信息、特征波段光譜信息、圖像統(tǒng)計(jì)特征參數(shù)和圖像外形特征參數(shù)為輸入,以樣品完整度等級(jí)和色澤等級(jí)為輸出,采用DT、KNN和SVM進(jìn)行外觀品質(zhì)鑒別分類建模。采用10次抽樣的驗(yàn)證集平均分類準(zhǔn)確率對(duì)分類模型進(jìn)行評(píng)估。最終按照相關(guān)行業(yè)標(biāo)準(zhǔn)[2]的規(guī)定, 將樣本外觀依據(jù)完整度與色澤分為7個(gè)等級(jí)。
3 結(jié)果與討論
3.1 基于光譜信息的核桃仁內(nèi)部品質(zhì)指標(biāo)檢測(cè)
核桃仁樣品在近紅外區(qū)域(863~1704 nm)的平均光譜信息及預(yù)處理后的光譜信息如圖3所示.樣品原始光譜信息總體特征基本一致,除了水分的吸收峰外,其它成分的吸收峰并不明顯,需要對(duì)光譜進(jìn)行進(jìn)一步處理。通過(guò)MSE和SNV組合的預(yù)處理方法,去除了部分背景噪聲的影響,使樣品光譜信息更平滑。同時(shí),進(jìn)一步增強(qiáng)了光譜信息的一致性,突出了光譜峰谷,使光譜特征得到了強(qiáng)化。
采用CARS和CCM算法相結(jié)合對(duì)樣本蛋白質(zhì)含量測(cè)量值和脂肪含量測(cè)量值進(jìn)行特征波段篩選。圖3B中紅色虛線標(biāo)記為與樣本蛋白質(zhì)含量相關(guān)的特征波段,藍(lán)色虛線標(biāo)記為與樣本脂肪含量相關(guān)的特征波段。最終篩選出與樣本蛋白質(zhì)含量相關(guān)的6個(gè)特征波段,與樣本脂肪含量相關(guān)的7個(gè)特征波段,其中,1269 nm為與蛋白質(zhì)和脂肪含量共同相關(guān)的特征波段,篩選出的特征波段共計(jì)12個(gè),具體對(duì)應(yīng)的波長(zhǎng)見(jiàn)表2。
采用MD法進(jìn)行異常樣品信息剔除。樣本光譜信息、蛋白質(zhì)含量測(cè)量值和脂肪含量測(cè)量值的MD分布如圖4所示,紅色實(shí)線是閾值為μ+3σ的判別線,下方為正常樣本,紅線上方為測(cè)量信息異常的樣本。剔除了光譜信息測(cè)量異常樣品1例,蛋白質(zhì)含量測(cè)量異常樣品2例,脂肪含量測(cè)量異常樣品2例,共計(jì)剔除異常樣品5例。
剔除異常樣本后,將剩余的樣本按2∶1的比例隨機(jī)抽樣劃分為校正集和驗(yàn)證集。針對(duì)樣本蛋白質(zhì)含量和脂肪含量分別建立全光譜波段和特征光譜波段的PLSR預(yù)測(cè)模型,其中模型主成分?jǐn)?shù)為5,模型預(yù)測(cè)效果如表3所示,圖5為采用特征波段建立的蛋白質(zhì)和脂肪含量預(yù)測(cè)模型的預(yù)測(cè)結(jié)果分布圖。由圖5和表3可見(jiàn),與全光譜信息相比,采用特征波段建模,模型的決定系數(shù)(R2)和RMSE都有了明顯的改善,蛋白質(zhì)含量預(yù)測(cè)模型的驗(yàn)證集R2由0.66增長(zhǎng)到0.91,RMSEP由1.37下降到0.78; 脂肪含量預(yù)測(cè)模型的驗(yàn)證集R2由0.83增長(zhǎng)到0.93,RMSEP由0.98下降到0.47。說(shuō)明采用CARS算法與相關(guān)系數(shù)法結(jié)合,篩選出的特征波段有效的降低了全光譜信息的復(fù)雜度,提高了建模質(zhì)量。
3.2 基于光譜信息與圖像特征的核桃仁外觀等級(jí)分類
圖6為3種色澤核桃仁樣品在可見(jiàn)光和短波近紅外區(qū)域(382~1027 nm)的平均光譜曲線,由于光譜前后段噪聲影響較大,因此去除了前段和后段各20個(gè)波段點(diǎn)。由圖6可見(jiàn),在原始光譜中,3種色澤核桃仁樣品的光譜曲線在可見(jiàn)光范圍內(nèi)光譜反射率隨著色澤由淺到深呈現(xiàn)明顯的下降趨勢(shì),在近紅外范圍內(nèi)光譜較雜亂。經(jīng)過(guò)MSC和SNV組合方法預(yù)處理后的光譜信息,光譜反射率呈現(xiàn)出一定的規(guī)律性和一致性,有助于后續(xù)的光譜處理。
對(duì)樣本全光譜信息進(jìn)行了特征波段篩選,篩選出的總色差特征波段為402.5和689.2 nm,位置分布如圖6B中虛線位置所示。提取的總色差特征波段圖像與RGB圖像的圖像統(tǒng)計(jì)特征參數(shù)后,以光譜信息與圖像統(tǒng)計(jì)特征參數(shù)的組合為輸入變量,采用決策樹(shù)算法、K近鄰算法和支持向量機(jī)3種分類算法建立色澤分類模型,模型分類平均準(zhǔn)確率如表4所示。
由表4可知,當(dāng)采用圖像統(tǒng)計(jì)特征參數(shù)與總色差特征波段光譜信息的組合為輸入變量時(shí),采用DT算法建立的色澤分類模型具有最高的分類準(zhǔn)確率(98.6%)。在輸入變量方面,由于全光譜波段中包含大量無(wú)關(guān)的冗余信息,參與建模時(shí)降低了模型準(zhǔn)確率。采用總色差特征波段建模,大幅減低了冗余信息的干擾,提高了建模效率,同時(shí),采用總色差特征波段建模的分類準(zhǔn)確率也高于RGB波段。圖像統(tǒng)計(jì)特征參數(shù)反映了樣本圖像的色澤和紋理變化,屬于有效的分類信息,因此,在總色差特征波段光譜信息與RGB波段光譜信息的基礎(chǔ)上加入圖像統(tǒng)計(jì)特征參數(shù),能夠進(jìn)一步提升分類模型的準(zhǔn)確率。在輸入變量方面,當(dāng)采用全波段光譜信息為輸入時(shí),輸入變量數(shù)目較多,采用SVM算法的分類模型準(zhǔn)確率高于決策樹(shù)和KNN算法; 當(dāng)輸入變量數(shù)目為總色差特征波段及總色差特征波段與圖像信息的組合時(shí),輸入變量數(shù)目大幅減少,此時(shí)DT算法在模型分類準(zhǔn)確率和分類計(jì)算速度方面都具有明顯的優(yōu)勢(shì)。
對(duì)總色差特征波段平均灰度圖像進(jìn)行otsu閾值分割二值化、先膨脹后腐蝕處理,以淺黃色、淺琥珀色和琥珀色3種核桃整仁圖像為例,處理結(jié)果如圖7所示,處理后的圖像可以完整地將核桃仁與背景完全分割,有利于進(jìn)一步在此基礎(chǔ)上提取核桃仁圖像的外觀參數(shù)。提取核桃仁外觀參數(shù)后,以外觀參數(shù)為輸入,樣本完整度等級(jí)為輸出,采用DT算法建立核桃仁完整度分類模型。進(jìn)一步按照文獻(xiàn)[2]規(guī)定,結(jié)合核桃仁樣本表皮色澤分類結(jié)果,將樣本外觀按完整度與色澤分為7個(gè)等級(jí),分類結(jié)果見(jiàn)表5。由表5可知,建立的分類模型對(duì)核桃仁外觀等級(jí)分類效果較好,平均分類準(zhǔn)確率達(dá)到了98.4%。
4 結(jié) 論
采用高光譜成像技術(shù),開(kāi)展了核桃仁內(nèi)外部品質(zhì)檢測(cè)方法研究,通過(guò)光譜與圖像信息相結(jié)合的方法實(shí)現(xiàn)了核桃仁蛋白質(zhì)和脂肪含量預(yù)測(cè)以及基于完整度和色澤的核桃仁外觀品質(zhì)分級(jí)。結(jié)果表明,采用CARS算法與相關(guān)系數(shù)法相結(jié)合的方式,有效的去除了全光譜波段中的無(wú)關(guān)信息和冗余信息。與全光譜波段相比,特征波段預(yù)測(cè)模型蛋白質(zhì)含量的驗(yàn)證集R2由0.66增長(zhǎng)到0.91,RMSEP由1.37%下降到0.78%; 脂肪含量的驗(yàn)證集R2由0.83增長(zhǎng)到0.93,RMSEP由0.98%下降到0.47%,表明篩選出的特征波段有效降低了模型的復(fù)雜度,提高了模型預(yù)測(cè)能力。將色差特征光譜與圖像統(tǒng)計(jì)特征參數(shù)相結(jié)合,采用高光譜圖像提取了總色差特征波段光譜,能夠大幅降低冗余信息的干擾,提高建模效率。通過(guò)總色差特征波段光譜與圖像統(tǒng)計(jì)特征參數(shù)相結(jié)合的方法,與RGB波段相比進(jìn)一步提升分類的準(zhǔn)確率,當(dāng)采用DT算法建立的色澤分類模型時(shí),模型具有最高的分類準(zhǔn)確率(98.6%)。采用高光譜圖像同時(shí)實(shí)現(xiàn)了核桃仁內(nèi)部品質(zhì)參數(shù)(蛋白質(zhì)含量、脂肪含量)的檢測(cè)和外觀品質(zhì)(完整度、色澤)的分類,為核桃仁品質(zhì)無(wú)損檢測(cè)提供了新的解決方案。
References
1 CAO Ya-Long, JIE Bo, WANG Lei, MENG Hai-Jun, WU Guo-Liang. J. Fruit Sci.,? 2018, 35(9): 1128-1140
曹亞龍, 揭 波, 王 磊, 孟海軍, 吳國(guó)良. 果樹(shù)學(xué)報(bào), 2018,? 35(9): 1128-1140
2 LYT 1922-2010, Walnut Kernel. Forestry Industry Standards of the People's Republic of China
核桃仁. 中華人民共和國(guó)林業(yè)行業(yè)標(biāo)準(zhǔn). LYT 1922-2010
3 GB/T 20398-2006, Walnut Quality Grade. National Standards of the People's Republic of China
核桃堅(jiān)果質(zhì)量等級(jí). 中華人民共和國(guó)國(guó)家標(biāo)準(zhǔn). GB/T 20398-2006
4 SHEN Ai-Min, HUO Xiao-Jing, WANG Wen-Di, WANG Hong-Xia. Jiangsu Agric. Sci.,?? 2016,? 44(9): 383-385
申愛(ài)敏, 霍曉靜, 王文娣, 王紅霞. 江蘇農(nóng)業(yè)科學(xué), 2016,? 44(9): 383-385
5 CAI Jian, ZHOU Jun, SHI Jian-Xin, WANG Yong, GUO Zheng, LIU Hang. Jiangsu Agric. Sci.,?? 2018,? 46(5): 158-161
蔡 建, 周軍, 史建新, 王 勇, 郭 政, 劉 航. 江蘇農(nóng)業(yè)科學(xué), 2018,? 46(5): 158-161
6 ZHOU Jun, CAI Jian, GUO Jun-Xian, ZHANG Jing, SHI Jian-Xin, ALI Hasmu, JIANG Yan-Wu. Jiangsu Agric. Sci.,?? 2018,? 46(11): 175-179
周 軍, 蔡 建, 郭俊先, 張 靜, 史建新, 艾力·哈斯木, 姜彥武. 江蘇農(nóng)業(yè)科學(xué),? 2018,? 46(11): 175-179
7 HAO Zhong-Cheng, PENG Yun-Fa, ZHANG Hong, ZHANG Rui, ZHANG Rui-Li. J. Anhui Agric. Sci.,?? 2014,? 42(21): 7191-7193,7233
郝中誠(chéng), 彭云發(fā), 張 宏, 張 銳, 張銳利. 安徽農(nóng)業(yè)科學(xué),? 2014,? 42(21): 7191-7193,7233
8 MA Wen-Qiang, ZHANG Man, LI Zhong-Xin. Transact. Chin. Soc. Agric. Machin.,?? 2015,? 46(S1): 128-133
馬文強(qiáng), 張 漫, 李忠新. 農(nóng)業(yè)機(jī)械學(xué)報(bào),? 2015,? 46(S1): 128-133
9 MA Wen-Qiang, ZHANG Man, LI Zhong-Xin, YANG Li-Ling. Transacte. Chin. Soc. Agric. Machin.,?? 2017,? 48(S1): 407-411
馬文強(qiáng), 張 漫, 李忠新, 楊莉玲. 農(nóng)業(yè)機(jī)械學(xué)報(bào) , 2017,? 48(S1): 407-411
10 Kandpal L M, Park E, Tewari J, Cho B. J. Biosyst. Engineer.,?? 2015,? 40(2): 124-136
11 Kandpal L M, Cho B. J. Biosyst. Engineer.,?? 2014,? 39(3): 215-226
12 Mishra P, Nordon A, Asaari M S M, Lian G P, Redfern S. J. Food Engineer.,? 2019,? 249(5): 40-47
13 Su W H, Bakalis S, Sun D W. Biosyst. Engineer.,?? 2019,? 180(4): 70-86
14 LI Xiao-Yu, XU Sen-Miao, FENG Yao-Ze, HUANG Tao, DING Chong-Yi. Transact. Chin. Soc. Agric. Machin.,? 2016,? 47(1): 221-226
李小昱, 徐森淼, 馮耀澤, 黃 濤, 丁崇毅. 農(nóng)業(yè)機(jī)械學(xué)報(bào), 2016,? 47(1): 221-226
15 Cheng J H, Jin H L, Xu Z Y, Zheng F P. Anal. Methods,?? 2017,? 43(9): 6148-6154
16 Wei Y Z, Wu F Y, Xu J,Sha J J, Zhao Z F, He Y, Li X L. J. Food Engineer.,? 2019,? 248: 98-96
17 Zhao H T, Feng Y Z, Chen W, Jia G F. Meat Sci.,?? 2019,? 151: 75-81
18 Fan S X, Li C Y, Huang W Q, Chen L P. Sensors,? 2018,? 18(12): 1-19
19 ZHANG Hang, YAO Chuan-An, JIANG Meng-Meng, JI Yu-Hang, LI Hua-Jie. J. Triticeae Crops,?? 2019,? 39(1): 96-104
張 航, 姚傳安, 蔣夢(mèng)夢(mèng), 姬豫航, 李華杰. 麥類作物學(xué)報(bào),? 2019,? 39(1): 96-104
20 CHEN Cai-Hong, ZHANG Shu-Juan, SUN Hai-Xia, LI Cheng-Ji, XING Shu-Hai. J. Shanxi Univ. (Nat. Sci. Edit.),?? 2018,? 38(11): 27-32
陳彩虹, 張淑娟, 孫海霞, 李成吉, 邢書海. 山西農(nóng)業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版),? 2018,? 38(11): 27-32
Detection and Grading Method of Walnut Kernel Quality Based on
Hyperspectral Image
MA Wen-Qiang1,2, ZHANG Man*1, LI Yuan3, LI Min-Zan1,
YANG Li-Ling2, ZHU Zhan-Jiang2, CUI Kuan-Bo2
1(Key Laboratory of Modern Precision Agriculture System Integration Research, Ministry of Education,
College of Information and Electrical Engineering, China Agricultural University, Beijing 100083, China)
2(Agricultural Mechanization Institute, Xinjiang Academy of Agricultural Sciences, Urumqi 830091, China)
3(Soil Fertilizer and Agricultural Water Saving Research Institute,
Xinjiang Academy of Agricultural Sciences, Urumqi 830091, China)
Abstract Hyperspectral imaging technology enables rapid non-destructive inspection and grading of various agricultural products. In this work, the research on the quality detection method of walnut kernel based on hyperspectral image was carried out. The combination of spectrum and image information was used to realize the prediction of protein and fat content and the classification of the integrity and color of walnut kernel. The “Wen 185” walnuts, which were produced from Xinjiang, were shelled and prepared by different grades of integrity and color. Then the hyperspectral image of each sample was measured in the range of 862.9-1704.02 nm and 382.19-1026.66 nm by Gaia hyperspectral imager. After that, the color difference, fat content and protein content of samples were measured. Multivariate scatter correction and standard normalized variate were used to pre-processing the original spectral information. And the feature bands were screened by the method, which combined competitive adaptive re-weighting sampling (CARS) and correlation coefficient method (CCM ) algorithm, for the three parameters of protein content, fat content and total color difference of walnut kernel samples. Six feature bands related to protein content and 7 feature bands related to fat content were screened out. The internal quality parameter prediction model of the full spectrum band and the characteristic spectrum band were established by partial least squares regression (PLSR) algorithm. Compared with the full-spectrum band, the verification set coefficient (R2) of the feature band protein content prediction model increased from 0.66 to 0.91, and the mean square error (RMSEP) decreased from 1.37% to 0.78%. The verification set coefficient (R2) of the feature band fat content prediction model increased from 0.83 to 0.93, and the RMSEP decreased from 0.98% to 0.47%. It showed that the selected characteristic bands effectively reduced the complexity of the full spectrum information and improved the quality of modeling. In terms of appearance quality, the feature bands associating with the color difference were selected to be 402.5 and 689.2 nm. The full-spectral spectrum, RGB spectrum, characteristic spectrum and the combination of spectral and image information were used to establish the walnut appearance quality classification model by decision tree, K-nearest neighbor and support vector machine algorithm. It showed that the feature bands modeling greatly reduced the interference of redundant information, improved the modeling efficiency, and the classification accuracy were also significantly higher than the RGB bands by comparison. The adding image statistical feature parameter to the feature bands and RGB bands could further improve the accuracy of classification model which had the highest classification accuracy rate reached to 98.6% by decision tree algorithm. In terms of classification algorithm, the decision tree algorithm had obvious advantages in classification accuracy and calculation speed when the number of input variables was less. The used of hyperspectral technology could realize the internal quality detection and appearance classification of walnut kernels, which provided a new theoretical basis for the application of non-destructive testing of walnut kernel quality.
Keywords Walnut kernel; Hyperspectral image; Nondestructive testing; Classification; Feature band
(Received 16 August 2019; accepted 14 October 2020)
This work was supported by the Project of Renovation Capacity Building for the Young Sci-Tech Talents Sponsored by Xinjiang Academy of Agricultural Sciences (No. xjnkq-2019007), the National Natural Science Foundation of China (No.31701319) and the Science and Technology Innovation Key Cultivation Special Project of Xinjiang Academy of Agricultural Sciences (No.xjkcpy-004).
2019-08-16收稿; 2020-10-14接受
本文系新疆農(nóng)業(yè)科學(xué)院青年科技骨干創(chuàng)新能力培養(yǎng)項(xiàng)目(No. xjnkq-2019007)、國(guó)家自然科學(xué)基金項(xiàng)目(No.31701319)和新疆農(nóng)業(yè)科學(xué)院科技創(chuàng)新重點(diǎn)培育專項(xiàng)(No.xjkcpy-004)資助
* E-mail: cauzm@cau.edu.cn