張慧,張文偉,張永毅,李士靜,申佳瑜,朱均燕,謝小芳,溫永仙*
基于高光譜與紋理融合的烤煙分類方法研究
張慧1,2,張文偉3,張永毅3,李士靜1,2,申佳瑜1,2,朱均燕1,2,謝小芳4,溫永仙1,2*
1 福建農(nóng)林大學(xué)計(jì)算機(jī)與信息學(xué)院,福建 福州 350002;2 福建農(nóng)林大學(xué)統(tǒng)計(jì)及應(yīng)用研究所,福建 福州 350002;3 南平市煙草公司延平分公司,福建 南平 353000;4 福建農(nóng)林大學(xué)生命科學(xué)學(xué)院,福建 福州 350002
【】為提高烤煙的分類正確率?!尽坷酶吖庾V成像系統(tǒng)采集烤煙樣本,采用Savitzky-Golay卷積平滑法(SG)、多元散射校正(MSC)、一階導(dǎo)數(shù)法(FD)的組合方法對(duì)數(shù)據(jù)進(jìn)行預(yù)處理。通過(guò)連續(xù)投影算法(SPA)選擇特征波長(zhǎng),利用灰度共生矩陣(GLCM)選擇烤煙的紋理特征,將紋理特征與光譜特征歸一化處理后進(jìn)行融合,利用鄰近算法(KNN)、隨機(jī)森林(RF)、支持向量機(jī)(SVM)、樸素貝葉斯(NB)驗(yàn)證烤煙分類效果?!尽款A(yù)處理后的全波長(zhǎng)數(shù)據(jù)分類正確率較預(yù)處理前有所提升;利用SPA選擇特征波段進(jìn)行分類,正確率下降;高光譜融合紋理特征后進(jìn)行分類,分類效果顯著提升?!尽炕诟吖庾V與紋理融合可準(zhǔn)確、有效地對(duì)烤煙進(jìn)行無(wú)損分類,為量化烤煙分類提供了可行方法。
烤煙分類;高光譜成像;紋理特征;機(jī)器學(xué)習(xí);分類算法
煙草作為我國(guó)重要的經(jīng)濟(jì)作物之一,對(duì)其進(jìn)行客觀識(shí)別與分類十分重要[1]。目前烤煙的分類依據(jù)國(guó)標(biāo)GB2635—1992標(biāo)準(zhǔn)[2]。該標(biāo)準(zhǔn)通過(guò)人的視覺、嗅覺、觸覺進(jìn)行判別,容易受到溫度、濕度、人為感官的影響,導(dǎo)致烤煙分類不夠準(zhǔn)確、客觀[3]。
在煙草檢測(cè)研究方面,部分研究人員將高光譜數(shù)據(jù)與化學(xué)計(jì)量方法相結(jié)合,探究煙草中化學(xué)元素的含量情況。郭婷[4]利用高光譜遙感數(shù)據(jù)檢測(cè)煙草大田生長(zhǎng)狀況并監(jiān)測(cè)氮磷鉀含量。楊艷東等[5]通過(guò)對(duì)烤煙光譜數(shù)據(jù)提取,建立一元、多元回歸等模型對(duì)葉片中的氯密度進(jìn)行預(yù)測(cè)。
在煙草分級(jí)研究方面,近年來(lái)國(guó)內(nèi)外研究人員嘗試采用光譜相關(guān)無(wú)損檢測(cè)與機(jī)器學(xué)習(xí)相結(jié)合的方法對(duì)烤煙進(jìn)行分類。1968年McClure等[6]首次利用近紅外光譜技術(shù)(Near Infrared,NIR)對(duì)煙草的透射率特征進(jìn)行分析,賓俊等[7]利用NIR與極限學(xué)習(xí)機(jī)算法(Extreme Learning Machine,ELM)實(shí)現(xiàn)烤煙的自動(dòng)分類。相較于紅外光譜技術(shù),高光譜成像可同時(shí)反映光譜信息與圖像信息[8],更加準(zhǔn)確把握不同物質(zhì)、不同光譜之間的差別[9]。張龍等[10]通過(guò)對(duì)高光譜數(shù)據(jù)預(yù)處理,結(jié)合SVM對(duì)卷煙中的金屬、塑料等雜質(zhì)進(jìn)行識(shí)別分類,提高卷煙產(chǎn)品質(zhì)量。賈方方等[11]研究表明不同水分處理的煙草葉片之間光譜反射率差異明顯。部分研究人員利用圖像檢測(cè)技術(shù)對(duì)煙葉形態(tài)、紋理特征進(jìn)行研究。陳朋[12]通過(guò)提取煙葉形態(tài)特征,包括煙葉長(zhǎng)度、寬度、破損率等對(duì)煙葉進(jìn)行分級(jí)。李海杰 等[13]利用HSV空間圖像顏色特征與Gabor小波提取煙葉的紋理特征,通過(guò)SVM進(jìn)行分類。
在高光譜分類中,全波長(zhǎng)光譜眾多,存在大量冗余信息,需要先降維再進(jìn)行分類。但降維后,分類正確率會(huì)隨之降低。將降維后的高光譜數(shù)據(jù)與烤煙紋理信息融合,有利于改善分類效果[14]。許多研究人員對(duì)于高光譜與圖像信息融合分類進(jìn)行了探究。趙鵬等[15]為了提高木材樹種的分類正確度,提出一種基于I-BGLAM的融合紋理與高光譜特征的分類方法。路江明等[3]利用光譜特征、紋理特征以及融合特征的SVM進(jìn)行識(shí)別分類,改進(jìn)了龍井茶快速無(wú)損評(píng)估技術(shù)。
目前,基于高光譜與紋理特征融合對(duì)烤煙無(wú)損識(shí)別分類的研究相對(duì)較少。因此,本研究探究通過(guò)預(yù)處理、特征提取等方式,提高烤煙無(wú)損分類的正確率。
利用高光譜成像系統(tǒng)獲得烤煙光譜數(shù)據(jù),如圖1所示。高光譜成像系統(tǒng)由高感度EMCCD相機(jī)(Raptor EM285CL)、成像光譜儀(Imspector V10E)、穩(wěn)定輸出鹵素?zé)艄庠矗↖T 3900,21V,150W)以及計(jì)算軟件(Spectral-image)構(gòu)成。
本研究烤煙光譜數(shù)據(jù)均在室內(nèi)采集完成,高光譜成像系統(tǒng)同時(shí)配備暗箱、位移平臺(tái)及光譜圖像分析軟件。通過(guò)高光譜成像系統(tǒng)采集數(shù)據(jù)時(shí),各個(gè)參數(shù)設(shè)置情況如表1所示。
圖1 高光譜成像系統(tǒng)
表1 高光譜成像系統(tǒng)參數(shù)設(shè)置情況
Tab.1 Parameter setting of hyperspectral imaging system
供試烤煙品種為翠碧一號(hào)(CB-1)(福建省煙草專賣局煙草科學(xué)研究所提供),煙葉等級(jí)為C2F、C3F、C4F(福建省煙草專賣局煙草科學(xué)研究所專家鑒定)。收集各等級(jí)呈展開形態(tài)(圖2a)和自然卷曲狀態(tài)(圖2b)的烤煙葉片,共274片(表2)。
采集數(shù)據(jù)過(guò)程中,樣本光譜信息受到光源、電流等因素干擾,從而產(chǎn)生噪聲。為了減少實(shí)驗(yàn)誤差,通過(guò)黑白校正提高準(zhǔn)確度。在實(shí)驗(yàn)過(guò)程中,首先關(guān)閉光譜相機(jī)鏡頭,收集反射率為0的全黑標(biāo)定圖像。再打開鏡頭,掃描白板,采集反射率為99%的全白標(biāo)定圖像[16]。通過(guò)公式(1)處理,得到黑白校正高光譜數(shù)據(jù)。公式如下:
圖2 烤煙葉片展開與自然卷曲狀態(tài)
表2 烤煙樣本情況
Tab.2 Flue-cured tobacco sample
其中為未校正的高光譜圖像信息,為全黑標(biāo)定圖像,為全白標(biāo)定圖像,為校正后的高光譜圖像信息。
對(duì)高光譜進(jìn)行預(yù)處理,減少原始光譜偏差[17]。根據(jù)預(yù)處理的效果進(jìn)行分類,可以分為:平滑處理、散射校正、基線校正[18]。
SG卷積平滑法的基本假設(shè)是光譜數(shù)據(jù)含有白噪聲,多次計(jì)算求平均值可以降低噪聲。MSC假定在光譜的所有波長(zhǎng)中散射系數(shù)相同,將噪聲與光譜有效信息進(jìn)行分離。FD采用直接差分求導(dǎo)的方法,迅速確定光譜拐點(diǎn)、最大、最小反射率波長(zhǎng)位置。
SPA是一種特征選擇算法,通過(guò)共線性最小化的向前選擇,消除光譜數(shù)據(jù)中的冗余信息,降低數(shù)據(jù)維度,通過(guò)投影的方式尋找最具有代表性的波長(zhǎng)代替全波長(zhǎng)光譜數(shù)據(jù)[19]。
本研究在烤煙光譜信息分類中,加入圖像紋理信息。GLCM是一種描述圖像的常用方法,用于計(jì)算相鄰像素之間不同灰度值的組合數(shù)目,從而反映圖像在指定方向上的梯度信息[20]。將灰度圖轉(zhuǎn)為固定級(jí)數(shù)的圖像,對(duì)圖像分別從0°、45°、90°、135°4個(gè)方向計(jì)算灰度圖的能量、熵、慣性矩和相關(guān)性。將4個(gè)角度的平均值作為各參數(shù)的紋理信息[21]。
為彌補(bǔ)單一特征的缺陷,提高分類正確率,將SPA選擇后的光譜特征與紋理特征進(jìn)行融合。若直接進(jìn)行融合,數(shù)值大的數(shù)據(jù)會(huì)對(duì)數(shù)值小的數(shù)據(jù)產(chǎn)生影響,影響分類效果。因此,需要在數(shù)據(jù)融合之前,對(duì)兩組數(shù)據(jù)進(jìn)行歸一化處理[23]。
使用最大最小值歸一化方法,將樣本的光譜特征數(shù)據(jù)與紋理特征數(shù)據(jù)縮放至區(qū)間[0,1]。
式中,為樣本特征數(shù)據(jù),X、X分別表示樣本特征值中最大值和最小值,表示歸一化處理后的數(shù)據(jù)。
1.8.1 分類算法
利用分類算法對(duì)烤煙光譜數(shù)據(jù)進(jìn)行分類,分類算法對(duì)分類的正確率產(chǎn)生影響。目前基于高光譜領(lǐng)域分類算法常用的有KNN、SVM、RF、NB。
KNN是數(shù)據(jù)挖掘中最簡(jiǎn)單的分類方法之一,是通過(guò)測(cè)量不同特征值之間的距離進(jìn)行分類[17]。RF是由多棵樹集成的分類算法,最終會(huì)選擇輸出多棵樹分類結(jié)果的眾數(shù)作為隨機(jī)森林算法結(jié)果。SVM是監(jiān)督型學(xué)習(xí)模型,通過(guò)構(gòu)造分割面將數(shù)據(jù)進(jìn)行分類。NB是一種應(yīng)用基于獨(dú)立假設(shè)的貝葉斯定理的簡(jiǎn)單概率分類算法,假設(shè)每個(gè)特征都不相關(guān),依靠精確的自然概率模型,在有監(jiān)督學(xué)習(xí)的樣本集中能獲得好的分類效果[19]。
1.8.2 分類正確率
分類正確率(Accuracy)是最為常見的評(píng)價(jià)指標(biāo),表示分類過(guò)程中預(yù)測(cè)正確的個(gè)數(shù)與總數(shù)的比值[22]。
其中,表示被模型分類正確的正樣本,表示被模型分類錯(cuò)誤的正樣本,表示被模型分類錯(cuò)誤的負(fù)樣本,表示被模型分類正確的負(fù)樣本,表示樣本總數(shù)。
采用ENVI 5.0軟件提取感興趣區(qū)域(Region of Interest,ROI),在光譜圖像中提取各樣本光譜數(shù)據(jù)。采用MATLAB R2018a完成光譜數(shù)據(jù)的預(yù)處理與紋理特征提取,采用Spyder(Python 3.6)進(jìn)行烤煙分類。
通過(guò)ENVI 5.0軟件提取ROI,對(duì)每片實(shí)驗(yàn)樣本沿著烤煙煙葉中間葉脈兩側(cè)提取10個(gè)50×50像素的感興趣區(qū)域,將感興趣區(qū)域內(nèi)所有像素點(diǎn)的平均光譜值作為一個(gè)樣本的光譜數(shù)據(jù),對(duì)每個(gè)樣本提取高光譜數(shù)據(jù),最終共收集274個(gè)400~1000 nm波長(zhǎng)范圍內(nèi)的全波長(zhǎng)光譜數(shù)據(jù),由于光譜波長(zhǎng)兩端的噪聲大,故最終保留443.35~813.41nm共147段光譜。全波長(zhǎng)光譜數(shù)據(jù)如圖3所示。從圖中可以看出烤煙煙葉吸光度趨勢(shì)相似,在部分波長(zhǎng)存在重合,光譜曲線之間存在基線漂移、散射等問(wèn)題,故需要對(duì)光譜數(shù)據(jù)進(jìn)行預(yù)處理。
通過(guò)KNN、RF、SVM、NB結(jié)合交叉驗(yàn)證法,建立烤煙全分類模型[24]。其中SVM采用線性核函數(shù)(Linear Kernel),其懲罰因子c默認(rèn)為1。將帶標(biāo)簽的原始數(shù)據(jù)隨機(jī)打亂,25%作為測(cè)試集,75%作為訓(xùn)練集,結(jié)合分類算法對(duì)烤煙進(jìn)行分類,在不同預(yù)處理下,將100次測(cè)試集平均值作為分類正確率。分類正確率及標(biāo)準(zhǔn)差如表3所示。
圖3 烤煙全波長(zhǎng)高光譜
表3 不同預(yù)處理方法和分類算法下分類正確率
Tab.3 Accuracy under different preprocessing methods and classification algorithms %
由表3可知,SVM方法在不同預(yù)處理的方法中,平均正確率達(dá)到84.82%,而KNN、RF、NB的分類正確率在63%~69%之間,說(shuō)明SVM的分類效果明顯優(yōu)于其他分類算法。在分別使用SG、MSC、FD預(yù)處理方式的分類中,使用SG的平均正確率最高,達(dá)到75.9%,可見SG平滑處理有效降低曲線噪聲,提高分類正確率。對(duì)比發(fā)現(xiàn),SG、MSC、FD結(jié)合的預(yù)處理方式達(dá)到最高的平均正確率83.08%,且在SVM分類算法下達(dá)到最小偏差1.98%。
采用SG+MSC+FD方式對(duì)烤煙光譜數(shù)據(jù)進(jìn)行預(yù)處理。光譜數(shù)據(jù)預(yù)處理后結(jié)果如圖4所示。首先采用SG卷積平滑法(圖4a),設(shè)定平滑點(diǎn)數(shù)為7,平滑項(xiàng)數(shù)為3[25],降低光譜噪聲。用MSC方法(圖4b),消除光譜散射影響[26]。采用FD消除基線漂移和其它背景的干擾(圖4c),差分寬度為1,F(xiàn)D預(yù)處理后曲線較原始數(shù)據(jù)產(chǎn)生明顯波動(dòng),局部反射率大幅提高,出現(xiàn)多個(gè)明顯的波峰波谷,F(xiàn)D預(yù)處理能突出不同類別烤煙的細(xì)微差異,提升分類正確率。
圖4 預(yù)處理后的光譜曲線
采用SPA對(duì)全波長(zhǎng)預(yù)處理后146段光譜數(shù)據(jù)進(jìn)行光譜特征選擇,如圖5所示。當(dāng)選擇25個(gè)特征波段時(shí),均方根誤差為0.4008,且均方根誤差下降幅度逐漸緩慢(圖5a),選擇波段情況(圖5b)。通過(guò)SPA自動(dòng)選擇25個(gè)波段,對(duì)應(yīng)波長(zhǎng)如表4所示。
圖5 SPA結(jié)果
表4 基于SPA特征波段選擇結(jié)果
Tab.4 The features selection results based on SPA
SPA共提取了25個(gè)特征波段,讀取該25個(gè)波段下的灰度圖。選擇其中一個(gè)最為清晰,亮度均勻的617.64 nm下灰度圖,進(jìn)行GLCM紋理提取。為減少計(jì)算量,對(duì)每個(gè)樣本圖像的灰度圖進(jìn)行壓縮,轉(zhuǎn)換為64級(jí)灰度圖,處理窗口為8×8,提取GLCM中能量、熵、對(duì)比度、相關(guān)性4個(gè)參數(shù),分別對(duì)0°、45°、90°、135°4個(gè)方向進(jìn)行提取,最終提取4×4個(gè)紋理特征,共16維。以一片烤煙樣本為例,45°方向下能量(圖6a),熵(圖6b),對(duì)比度(圖6c),相關(guān)性(圖6d)圖像情況如圖6所示。紋理特征各方向各類別樣本的能量、熵、對(duì)比度、相關(guān)性的均值及標(biāo)準(zhǔn)差如表5所示。
圖6 GLCM提取參數(shù)圖像
表5 紋理特征
Tab.5 Texture features
在對(duì)烤煙數(shù)據(jù)不同處理方法下,KNN、RF、SVM、NB結(jié)合交叉驗(yàn)證法,對(duì)烤煙進(jìn)行分類,正確率及標(biāo)準(zhǔn)差如表6所示。
表6 不同分類算法的分類正確率
Tab.6 Accuracy of different classification algorithms %
將全波長(zhǎng)未預(yù)處理的數(shù)據(jù)與預(yù)處理后數(shù)據(jù)的正確率進(jìn)行比較,預(yù)處理后的分類正確率更高。未預(yù)處理數(shù)據(jù)的光譜維度是147段,KNN、RF、SVM、NB測(cè)試集的正確率在51%~65%之間。進(jìn)行SG+MSC+FD預(yù)處理后,光譜維度是146段。測(cè)試集正確率在73%~96%之間。表明預(yù)處理后的正確率較預(yù)處理前有明顯的提升。
通過(guò)SPA降低光譜數(shù)據(jù)維度,分類正確率隨之下降。此時(shí)光譜維度是25段,降維后,減少數(shù)據(jù)計(jì)算復(fù)雜度,提高效率。降維后測(cè)試集正確率在74%~91%之間。
對(duì)GLCM提取的烤煙紋理特征數(shù)據(jù)進(jìn)行分類,分類效果不如光譜特征。紋理特征維度為16段,測(cè)試集正確率在66%~72%之間。
紋理特征與光譜特征融合的分類達(dá)到最好分類效果。此時(shí)數(shù)據(jù)維度為41段,包含光譜特征25段和紋理特征16段。各分類算法正確率均高于90%,測(cè)試集標(biāo)準(zhǔn)差在1.7%~2.8%之間,較其他處理方法偏差更小,更穩(wěn)定。其中SVM的分類效果最佳,訓(xùn)練集正確率達(dá)到99.12%,測(cè)試集正確率達(dá)到97.53%??緹熂y理特征與光譜特征融合的數(shù)據(jù),既降低了數(shù)據(jù)維度,又提高了正確率。
將數(shù)據(jù)集中烤煙葉片自然狀態(tài)、葉片展開下收集的數(shù)據(jù)分離,分別計(jì)算他們?cè)诟魈幚矸椒ㄏ耂VM分類正確率,如表7所示。在兩種不同狀態(tài)下烤煙的紋理特征與光譜特征融合下的分類正確率均高于95%,達(dá)到較好水平。比較兩種狀態(tài)下的烤煙分類正確率,自然卷曲狀態(tài)的正確率在不同操作水平下均高于葉片展開下的分類正確率。
表7 烤煙葉片自然卷曲狀態(tài)與展開狀態(tài)下SVM的分類正確率對(duì)比
Tab.7 Comparison of classification accuracy of SVM in natural state and unfolded state of flue-cured tobacco %
數(shù)據(jù)預(yù)處理可以提高烤煙分類正確率,本研究發(fā)現(xiàn)利用SG、MSC和FD的組合預(yù)處理方式能達(dá)到較好分類正確率。選擇特征光譜可降低數(shù)據(jù)維度,避免數(shù)據(jù)冗余,本研究利用SPA選擇烤煙特征光譜提高分類算法工作效率。圖像紋理特征可彌補(bǔ)光譜特征缺陷,基于GLCM提取的烤煙紋理特征,融合光譜特征,可提高烤煙的分類正確率。
本研究發(fā)現(xiàn)分類過(guò)程中自然卷曲狀態(tài)下烤煙分類正確率高于葉片展開狀態(tài)。推測(cè)可能是由于展開葉片取點(diǎn)范圍較大,特征值有更大區(qū)間,而自然卷曲下提取ROI更集中,導(dǎo)致自然卷曲的烤煙正確率更高。且烤煙在烤制過(guò)程中烤煙逐漸卷曲,卷曲層內(nèi)部和外部的濕度等因素可能不同,將葉片展開,會(huì)造成一定誤差。
因此,本研究采用SG、MSC、FD組合方法對(duì)光譜數(shù)據(jù)進(jìn)行預(yù)處理。采用SPA選取特征光譜波長(zhǎng),采用GLCM提取紋理特征,融合高光譜信息和紋理特征后,利用KNN、RF、SVM、NB對(duì)烤煙數(shù)據(jù)進(jìn)行分類,可準(zhǔn)確、有效地對(duì)烤煙進(jìn)行無(wú)損分類,為量化烤煙分類提供了可行方法
[1] 方世誠(chéng). 基于光譜與色度的烤煙分類方法研究[D]. 貴陽(yáng):貴州大學(xué),2016.
FANG Shicheng. Study on classification method of flue cured tobacco based on spectrum and chroma[D]. Guiyang: Guizhou University,2016.
[2] 中華人民共和國(guó)國(guó)家質(zhì)量監(jiān)督檢驗(yàn)檢疫總局. 烤煙:GB2635- 1992[S]. 北京:中國(guó)標(biāo)準(zhǔn)出版社,1992.
General administration of quality supervision, inspection and quarantine of the People’s Republic of China. Flue-Cured Tobacco: GB 2635-1992[S]. Beijing: China Standards Press,1992.
[3] 陸江明,范婷婷,穆青爽,等. 融合光譜與紋理特征的龍井茶等級(jí)無(wú)損識(shí)別[J]. 現(xiàn)代食品科技,2021, 37(3):301-307, 249.
LU Jiangming, FAN Tingting, MU Qingshuang, et al. Nondestructive identification of longjing Tea Grade by fusing spectral and textural feature[J]. Modern Food Science and Technology, 2021, 37(3):301-307, 249.
[4] 郭婷. 不同鉀水平和成熟度煙草高光譜特征及其品質(zhì)估測(cè)模型研究[D]. 長(zhǎng)沙:湖南農(nóng)業(yè)大學(xué),2019.
GUO Ting, Hyperspectral characteristics and estimating model of leaf quality content in tobacco based on potassium and maturity treatments[D]. Changsha: Hunan University,2019.
[5] 楊艷東,賈方方,劉新源,等. 烤煙葉片氯密度高光譜預(yù)測(cè)模型的建立[J]. 河南農(nóng)業(yè)科學(xué),2019,48(5):155-160.
YANG Yandong, JIA Fangfang, LIU Xinyuan, et al. Construction of hyperspectral prediction model for chlorine density of flue-cured tobacco leaves[J]. Journal of Henan Agricultural Sciences, 2019, 48(5):155-160.
[6] McClure W F. Spectral characteristucs of tobacco in the near infrared region from 0.6-2.6 microns [J]. Tobacco Sci, 1968(12): 232-235.
[7] 賓俊,周冀衡,范偉,等. 基于NIR技術(shù)和ELM的烤煙煙葉自動(dòng)分類[J]. 中國(guó)煙草學(xué)報(bào),2017,23(2):60-68.
BIN Jun, ZHOU Jiheng, FAN Wei, et al. Automatic grading of flue-cured tobacco leaves based on NIR technology and extreme learning machine algorithm[J]. Acta Tabacaria Sinica, 2017, 23(2): 60-68.
[8] 趙凡,閆昭如,薛建新,等. 高光譜無(wú)損識(shí)別野生和種植黑枸杞[J]. 光譜學(xué)與光譜分析,2021,41(1):201-205.
ZHAO Fan, YAN Zhaoru, XUE Jianxin, et al. Identification of wild black and cultivated goji berries by hyperspectral image[J]. Spectroscopy and Spectral Analysis, 2021, 41(1):201-205.
[9] 劉立新,李夢(mèng)珠,趙志剛,等. 高光譜成像技術(shù)在生物醫(yī)學(xué)中的應(yīng)用進(jìn)展[J]. 中國(guó)激光,2018,45(2):214-223.
LIU Lixin, LI Mengzhu, ZHAO Zhigang, et al. Recent advances of hyperspectral imaging application in biomedicine[J]. Chinese Journal of Lasers, 2018,45(2):214-223.
[10] 張龍,馬嘯宇,王銳亮,等. 高光譜成像技術(shù)在煙葉和雜物分類中的應(yīng)用[J]. 煙草科技,2020,53(8):72-78.
ZHANG Long, MA Xiaoyu, WANG Ruiliang, et al. Application of hyperspectral imaging technology to tobacco leaf and foreign matter sorting[J]. Tobacco Science & Technology, 2020, 53(8): 72-78.
[11] 賈方方,馬新明,李春明,等. 不同水分處理對(duì)煙草葉片高光譜及紅邊特征的影響[J]. 中國(guó)生態(tài)農(nóng)業(yè)學(xué)報(bào), 2011, 19(6): 1330- 1335.
JIA Fangfang, MA Xinming, LI Chunming, et al. Effect of water condition on hyperspectral and red-edge characteristics of tobacco leaf[J]. Chinese Journal of Eco-Agriculture,2011,19(6):1330-1335.
[12] 陳朋. 煙葉紋理表面的視覺檢測(cè)技術(shù)研究與應(yīng)用[D]. 貴陽(yáng):貴州大學(xué),2017.
CHEN Peng. Research and application of visual inspection technology for texture of tabacco surface[D]. Guiyang: Guizhou University, 2017.
[13] 鄭守國(guó),翁士狀,劉瑜凡,等. 融合高光譜成像多類特征的名優(yōu)牛肉種類鑒別[J]. 激光雜志,2021,42(8):57-61.
ZHENG Shouguo, WENG Shizhuang, LIU Yufan, et al. Identification of famous beef species using multiple futures of hyperspectral imaging[J]. Laser Journal, 2021,42(8):57-61.
[14] 李海杰. 基于機(jī)器視覺的煙草異物檢測(cè)和煙葉分類分級(jí)方法研究[D]. 南京:南京航空航天大學(xué),2016.
LI Haijie. Research on methods of tobacco foreign material detection and tobacco leaves grading based on machine vision[D]. Nanjing: Nanjing University of Aeronautics and Astronautics,2016.
[15] 趙鵬,韓金城,王承琨. 基于I-BGLAM紋理和光譜融合的高光譜顯微成像木材樹種分類[J]. 光譜學(xué)與光譜分析, 2021, 41(2): 599-605.
ZHAO Peng, HAN Jincheng, WANG Chengkun. Wood species classification with microscopic hyper-spectral imaging based on I-BGLAM texture and spectral fusion[J]. Spectroscopy and Spectral Analysis,2021,41(2):599-605.
[16] 黃蒂云,李景彬,尤佳,等. 基于高光譜技術(shù)融合圖像信息的脫絨棉種品種分類檢測(cè)研究[J]. 光譜學(xué)與光譜分析,2018, 38(7): 2227-2232.
HUANG Diyun, LI Jingbin, YOU Jia, et al. The classification of delinted cottonseeds varieties by fusing image information based on hyperspectral image technology[J]. Spectroscpy and Spectral Analysis, 2018, 38(7):2227-2232.
[17] 何嘉琳,喬春燕,李冬冬,等. 可見近紅外高光譜成像技術(shù)對(duì)靈武長(zhǎng)棗VC含量的無(wú)損檢測(cè)方法[J]. 食品科學(xué),2018,39(6): 194-199.
HE Jialin, QIAO Chunyan, LI Dongdong, et al. Non-destructive detection of vitamin c content in “l(fā)ingwu changzao” jujubes using visible near infrared hyperspectral imaging[J]. Food Science, 2018, 39(6): 194-199.
[18] 張晟翀,李宇海. 紅外高光譜數(shù)據(jù)鑒別技術(shù)研究[J]. 光電技術(shù)應(yīng)用,2019, 34(2): 27-33.
ZHANG Shengchong, LI Yuhai. Research on infrared hyperspectral data identification technology[J]. Electro-Optic Technology Application, 2019, 34(2): 27-33.
[19] 孟慶龍,張艷,尚靜. 光纖光譜結(jié)合模式識(shí)別無(wú)損檢測(cè)蘋果表面疤痕[J]. 激光技術(shù),2019, 43(5): 86-90.
MENG Qinglong, ZHANG Yan, SHANG Jing. Nondestructive detection of apple defect combining optical fiber spectra with pattern recognition[J]. Laser Technology, 2019, 43(5): 86-90.
[20] 蘆兵,孫俊,楊寧,等. 基于熒光透射譜和高光譜圖像紋理的茶葉病害預(yù)測(cè)研究[J]. 光譜學(xué)與光譜分析, 2019, 39(8): 2515- 2521.
LU Bing, SUN Jun, YANG Ning, et al. Prediction of tea diseases based on fluorescence transmission spectrum and texture of hyperspectral image[J]. Spectroscopy and Spectral Analysis, 2019, 39(8): 2515-2521.
[21] 孫婷,田建平,胡新軍,等. 基于高光譜成像技術(shù)的釀酒高粱品種分類[J]. 食品與發(fā)酵工業(yè),2021,47(05):186-192.
SUN Ting, TIAN Jianping, HU Xinjun, et al. Classification of liquor sorghum varieties based on hyperspectral imaging technology[J].Food and Fermentation Industries, 2021, 47(5):186- 192.
[22] 高蕊. 隨機(jī)森林算法改進(jìn)及其在醫(yī)療診斷系統(tǒng)中的應(yīng)用[D]. 南京:南京郵電大學(xué),2020.
GAO Rui. Improvement of random forest algorithm and its application in medical diagnosis system[D]. Nanjing: Nanjing University of Posts and Telecommunications, 2020.
[23] 王靖會(huì),程嬌嬌,劉洋,等. 基于高光譜成像技術(shù)鑒別大米品種[J]. 中國(guó)農(nóng)業(yè)科技導(dǎo)報(bào),2021, 23(9): 121-128.
WANG Jinghui, CHENG Jiaojiao, LIU Yang, et al. Identification of rice variety based on hyperspectral imaging technology[J]. Journal of Agricultural Science and Technology, 2121, 23(9): 121- 128.
[24] 王智宏,劉杰,王婧茹,等. 數(shù)據(jù)預(yù)處理方法對(duì)油頁(yè)巖含油率近紅外光譜分析的影響[J]. 吉林大學(xué)學(xué)報(bào)(工學(xué)版),2013, 43(04): 1017-1022.
WANG Zhihong, LIU Jie, WANG Jingru, et al. Influence of data preprocessing on NIRS analysis for oil yield of oil shale[J]. Journal of Jilin Univesity (Engineering and Technology Edition), 2013, 43(04): 1017-1022.
[25] 王陽(yáng). 基于樸素貝葉斯的高光譜礦物識(shí)別[D]. 長(zhǎng)春:吉林大學(xué),2014.
WANG Yang, Mineral identification by hyperspectral based on data mining[D]. Changchun: Jilin University, 2014.
[26] 劉爽. 小麥赤霉病高光譜信息多循環(huán)提取及組合式識(shí)別研究[D].長(zhǎng)春:中國(guó)科學(xué)院大學(xué)(中國(guó)科學(xué)院長(zhǎng)春光學(xué)精密機(jī)械與物理研究所),2019.
LIU Shuang. Research on multi-cycle extraction and combination identification of hyperspectral information of fusarium head blight in wheat[D]. Changchun:University of Chinese Academy of Sciences (Changchun Institute of Optics,Fine Mechanics and Physics), 2019.
Research on classification method of flue-cured tobacco based on fusion of hyperspectral and texture features
ZHANG Hui1,2, ZHANG Wenwei3, ZHANG Yongyi3, LI Shijing1,2, SHEN Jiayu1,2,ZHU Junyan1,2, XIE Xiaofang4, WEN Yongxian1,2*
1 College of Computer and Information Science, Fujian Agriculture and Forestry University, Fuzhou 350002, Fujian, China;2 Institute of Statistics and Applications, Fujian Agriculture and Forestry University, Fuzhou 350002, Fujian, China;3 Yanping Branch of Nanping Tobacco Company, Nanping 353000, Fujian, China;4 College of Life Sciences, Fujian Agriculture and Forestry University, Fuzhou 350002, Fujian, China
The purpose of this paper is to improve the classification accuracy of flue-cured tobacco.A hyperspectral imaging system was used to collect flue-cured tobacco sample. The combination method of Savitzky-Golay(SG) smoothing filter, multiplicative scatter correction (MSC) and the first derivative (FD) was used to preprocess the data of flue-cured tobacco. Feature wavelength was selected through successive projections algorithm (SPA). The texture features of flue-cured tobacco selected by gray-level co-occurrence matrix (GLCM), and then the texture features and spectral features were normalized and fused. The classification effect of flue-cured tobacco was verified by using k-nearest neighbor(KNN), random forests (RF), support vector machine(SVM) and naive bayes(NB).The results showed that the classification accuracy of full-band hyperspectral data after preprocessing was improved compared with that before processing. 25 features bands were selected by SPA, and the classification accuracy using features bands was decreased. After the fusion of hyperspectral and texture features, the classification effect was improved significantly.The proposed method can accurately and effectively classify flue-cured tobacco without damage through fusion of hyperspectral and texture, which provides a feasible method for quantifying the classification of flue-cured tobacco.
flue-cured tobacco classification; hyperspectral imaging; texture feature; machine learning; classification algorithm
Corresponding author. Email:wen9681@sina.com
中國(guó)煙草總公司福建省公司科技項(xiàng)目“煙草收購(gòu)全程質(zhì)量追溯管理模式構(gòu)建與應(yīng)用”(閩煙司[2022]5號(hào));中國(guó)煙草總公司福建省公司科技計(jì)劃項(xiàng)目“鮮煙成熟度智能化檢測(cè)技術(shù)研究(2019350000240137);福建省煙草公司南平市公司科技計(jì)劃項(xiàng)目“翠碧一號(hào)煙葉掛灰機(jī)理研究及其防控技術(shù)研究”(NYK2021-10-03)
張慧(1997—),主要研究方向:統(tǒng)計(jì)信息技術(shù)與數(shù)據(jù)挖掘,Tel:0591-13358216295,Email:392019334@qq.com
溫永仙(1966—),教授,主要研究方向:統(tǒng)計(jì)信息技術(shù)與數(shù)據(jù)挖掘,Email:wen9681@sina.com
2021-08-16;
2022-04-20
張慧,張文偉,張永毅,等. 基于高光譜與紋理融合的烤煙分類方法研究[J]. 中國(guó)煙草學(xué)報(bào),2022,28(3). ZHANG Hui, ZHANG Wenwei, ZHANG Yongyi, et al. Research on classification method of flue-cured tobacco based on fusion of hyperspectral and texture features[J]. Acta Tabacaria Sinica, 2022, 28(3). doi:10.16472/j.chinatobacco.2021.T0139