中圖分類號:TP391.41 文獻(xiàn)標(biāo)志碼:A
水稻為多型性植物,種類繁多,據(jù)文獻(xiàn)記載世界上稻屬作物的品種數(shù)量大約是14萬種,我國水稻品種約有535種左右。如何快速有效地對如此巨大的水稻種類進(jìn)行分類鑒定,是一項(xiàng)復(fù)雜的工程。傳統(tǒng)的水稻品種鑒別通常采用田間鑒定與室內(nèi)鑒別相結(jié)合。田間鑒定的主要內(nèi)容為純度、熟期和主要特征特性,室內(nèi)鑒定包括電子鼻和電子舌指紋分析技術(shù)[1]、礦物質(zhì)元素分析方法[2]及DNA指紋圖譜技術(shù)。但傳統(tǒng)鑒定的方法存在時(shí)間長、費(fèi)用高、抽樣檢測等缺點(diǎn)。光譜分析技術(shù)[3-5]在快速鑒定方面具有速度快、成本低、無污染及不破壞樣品等優(yōu)點(diǎn)。
光譜匹配算法基本分為特征峰的光譜匹配算法和全光譜的光譜匹配算法。特征峰的光譜匹配算法通過峰個(gè)數(shù)、峰位、峰寬、峰面積和峰形指數(shù)等特征峰來衡量光譜之間的相似度,特征峰匹配算法有著運(yùn)算量小的先天優(yōu)勢,但匹配精度不高。全光譜的光譜匹配算法比較整個(gè)光譜的數(shù)據(jù)點(diǎn),運(yùn)算量大,但具有較高的精度。光譜檢測和識別[7-12]在水源地污染源監(jiān)測、農(nóng)作物葉片氮素含量反演、森林冠層識別、土壤水分監(jiān)測、植被、農(nóng)田等多個(gè)領(lǐng)域廣泛應(yīng)用[13-16]。趙冬娥等[17]利用光譜角匹配算法成功實(shí)現(xiàn)了生活垃圾的識別分類,準(zhǔn)確度達(dá)90.0% 以上;明群杰等[18]采用交叉相關(guān)光譜匹配、光譜角匹配和小波變換等多種匹配算法對研究區(qū)內(nèi)的小蒿草(Kobresiapygmaea)植被和針茅(Stipa)植被分類識別,得到了較好的分類結(jié)果。目前,高光譜成像分類識別應(yīng)用較多,應(yīng)用高光譜分類研究需要大范圍的研究對象,對于個(gè)體樣本,特別是對同一大類下不同品種相似度高的分類研究報(bào)道較少。
本研究通過絕對差異法(absolute distangce,AD)、總體平方差法(sum of square difference,SSD)歐式距離法(Euclideanditance,ED)光譜角法(spectralangle,SA)等全譜匹配算法對不同品種的水稻葉片進(jìn)行識別,通過判定標(biāo)準(zhǔn)光譜(光譜平均值)和待判定光譜之間的相似性,驗(yàn)證可見-近紅外光譜在識別水稻品種級成差異時(shí)的科學(xué)性與實(shí)用性,以期達(dá)到快速鑒定18水稻種類的目的。
1 材料與方法
1.1 材料與設(shè)備
試驗(yàn)用樣品圣稻13(Shengdao13)、陽光200(Yangguang200)、和臨稻11(Lindao11)三種水稻。產(chǎn)地青島城陽區(qū),地處青島市區(qū)北部方向,中心地理坐標(biāo)位于東經(jīng) 120°12′ ,北緯 36°20′ 。2008年6-9月試驗(yàn)按照 4.0m×6.0m 的小區(qū)設(shè)計(jì),每種水稻種植6個(gè)小區(qū),共設(shè)計(jì)18個(gè)小區(qū),所有試驗(yàn)小區(qū)統(tǒng)一集中管理,保持施肥和澆水量相同。
光譜儀選用荷蘭Aventes公司生產(chǎn)的AvaSpec-2048FT-SPU光譜儀,鹵鎢燈光源AvaLightHAL作為補(bǔ)償光源。光譜儀具體技術(shù)參數(shù)見表1。
1.2 光譜數(shù)據(jù)采集
取長勢一致的植株,每種水稻葉片樣品采集54株,測主莖上完全展開3個(gè)葉以上的倒數(shù)第2個(gè)葉片的光譜吸收率,每個(gè)樣本測10次,取平均值。按照1:2的比例,即18個(gè)和36個(gè)分別作為建立分類中心集和驗(yàn)證集。
1.3 光譜處理
AvaSpec-2048FT-SPU光譜儀光譜自動扣除基線,光譜平滑處理常用的方法有移動平均法(movingaveragefilter,MAF)、多項(xiàng)式卷積法(Savizky-Go-layfilter,SGF)、箱車平均法(boxcarfilter,BF)及高斯平滑法(Gaussianfilter,GF)等。
本研究采用多項(xiàng)式卷積法進(jìn)行平滑處理。多項(xiàng)式卷積平滑算法是由Savizky和Golay最早提出,采用最小二乘擬合系數(shù)作為響應(yīng)函數(shù),對原始光譜曲線進(jìn)行平滑處理。該方法擬合信號中的低頻成分,而將高頻成分?jǐn)M合了出去,最大的特點(diǎn)是在濾除噪聲的同時(shí)可以確保信號的形狀和寬度不變。具體數(shù)據(jù)處理如式(1):
式中: Pi 為經(jīng)過多項(xiàng)式卷積平滑處理后的第 i 個(gè)光譜數(shù)據(jù)點(diǎn)的吸光度; Wj 為第 j 個(gè)數(shù)據(jù)點(diǎn)的多項(xiàng)式擬合系數(shù); 2k+1 為窗口寬度。
1.4 全光譜匹配算法
全光譜匹配算法適用于波段范圍、數(shù)據(jù)點(diǎn)間隔和數(shù)據(jù)點(diǎn)數(shù)相同的不同光譜數(shù)據(jù)。由于數(shù)據(jù)量大,故運(yùn)算量要明顯增大,精度較高。主要有絕對差異法、總體平方差法、歐式距離法和光譜角法等。
1.4.1 絕對差異法
絕對差異法的定義為比較值與參考值的差異,兩條光譜曲線間的絕對差異法可表示為
式中: M 為樣品光譜與參照光譜的差值; Ai 為第 i 個(gè)樣品光譜數(shù)據(jù)點(diǎn)的吸光度; Si 為第 i 個(gè)參考光譜數(shù)據(jù)點(diǎn)的吸光度。絕對差異法區(qū)分兩條光譜時(shí), M 越大,相似度越低;反之,相似度越高。
1.4. 2 總體平方差法
總體平方差是總體各單位標(biāo)準(zhǔn)值與算術(shù)平均數(shù)之間的平均差異,兩條光譜曲線間的總體標(biāo)準(zhǔn)差可表示為
式中: N 為樣品光譜與參照光譜的總體標(biāo)準(zhǔn) 差。
1.4.3 歐式距離法
歐氏距離(Euclideandistance)是一個(gè)通常采用的距離定義,它是在 ?m 維空間中兩個(gè)點(diǎn)之間的真實(shí)距離。兩條光譜曲線之間的歐式距離可以表示為
式中: L 為樣品光譜與參照光譜的歐式距離 oL 值越小表示樣品光譜與參照光譜越相似;反之,則越大。
1. 4. 4 光譜角法
光譜角法是一種光譜匹配技術(shù),實(shí)質(zhì)上是通過測試參考光譜和測試光譜的相似程度來達(dá)到識別兩條光譜的相似程度。表示為
式中:0表示兩條光譜之間的夾角,夾角越小,說明越相似。
2 結(jié)果與分析
2.1 分類中心的構(gòu)建
將圣稻13、陽光200和臨稻11三種水稻的原始光譜信息使用多項(xiàng)式卷積法進(jìn)行平滑處理,窗口寬度選取7個(gè)數(shù)據(jù)點(diǎn),試驗(yàn)樣本光譜數(shù)量為18個(gè),平滑后3種水稻葉片吸收光譜的曲線圖如圖1。
對3個(gè)水稻品種內(nèi)的所有光譜取平均值,將該平均值光譜數(shù)據(jù)作為類型中心,類型中心如圖2所示。
2.2 樣品的分類識別
從圖2中可以看出,3種水稻光譜類型中心曲線波形非常相似,存在較為嚴(yán)重的重疊和覆蓋現(xiàn)象,特征峰位、峰高、峰寬、峰面積和峰形等特征峰匹配算法(spectral matching algorithm with peak in-formation,SMA-P)顯然已經(jīng)不適合本研究的分類識別。因此,本研究選擇全光譜匹配算法(spectralmatching algorithm with full spectral information,SMA-FS)計(jì)算光譜數(shù)據(jù)之間的相似性或差異性。分別使用絕對差異法、總體平方差法、歐式距離法、光譜角法共4種方法對3種水稻36個(gè)樣本的光譜進(jìn)行匹配。圖3中(a)圖表示的是36個(gè)圣稻13樣品使用4種全光譜匹配算法進(jìn)行分類識別的結(jié)果,4種方法均能夠較為準(zhǔn)確地將待測樣品劃分到對應(yīng)的類別中去,識別出圣稻13的正確個(gè)數(shù)明顯高于其他兩種水稻種類的個(gè)數(shù)。圖3中(b)(c)圖也得出相同的結(jié)論。表明4種全光譜匹配算法在水稻種類識別方面具有一定的可行性。
進(jìn)一步定量分析4種全光譜匹配算法對3種水稻樣品的分類情況,對分類結(jié)果的精度進(jìn)行定量評價(jià)。建立的正確識別率如表2所示。結(jié)果顯示:絕對差異法最高正確識別率 69.44% ,最低為55.56% ,平均值 60.19% ;總體平方差法最高正確識別率 63.89% ,最低為 44.44% ,平均值 55.55% ;歐式距離法最高正確識別率 61.11% ,最低為47.22% ,平均值 56.48% ;光譜角法最高正確識別率 72.22% ,最低為 63.89% ,平均值 67.59% 。絕對差異法和光譜角法的平均值正確識別率均超過60% ,光譜角法對3種水稻樣本的正確識別率均超過 60% ,較絕對差異法的表現(xiàn)穩(wěn)定。
表24種全光譜匹配算法對3種水稻樣品的分類識別率
3結(jié)論
本研究采集了圣稻13、陽光200和臨稻11三種水稻可見-近紅外吸收光譜,使用了絕對差異法、總體平方差法、歐式距離法和光譜角法4種全光譜匹配算法對驗(yàn)證集樣品進(jìn)行識別。結(jié)果表明4種全光譜匹配算法均能夠較為準(zhǔn)確地將待測樣品劃分到對應(yīng)的類別中去,其中,光譜角法較其他3種方法平均正確識別率最高,為 72.22% ,穩(wěn)定性方面也最優(yōu),均超過 60% 。可見-近紅外光譜可以反應(yīng)不同水稻種類的組成差異,全光譜匹配算法適用于水稻種類組成差異整體識別與評價(jià)。但是,識別的精準(zhǔn)程度還有待進(jìn)一步提高,今后還需進(jìn)一步試驗(yàn)驗(yàn)證。在樣品選取和光譜采集過程中人為的影響因素存在,環(huán)境參數(shù)、儀器設(shè)置、樣品擺放、噪聲信息均會影響試驗(yàn)結(jié)果。固體樣品的物質(zhì)含量和內(nèi)部結(jié)構(gòu)的差異,也會導(dǎo)致采集的光譜數(shù)據(jù)有差異。因此,若要探究普適性更強(qiáng)的研究結(jié)果,需要今后對試驗(yàn)各個(gè)環(huán)節(jié)進(jìn)行更深人的思考和規(guī)范。
參考文獻(xiàn):
[1]LOUDMILKJB,HIMMELSBACHDS,BARTONFE,etal.Novel searchalgorithms fora mid-infrared spectrallibrary of cotton contaminants[J]. Applied Spectroscopy,2008,62(6) : 661-670.
[2]李興.高光譜數(shù)據(jù)庫及數(shù)據(jù)挖掘研究[D].北京:中國科學(xué)院遙感應(yīng)用研究所,2006.
[3]李桂峰,趙國建,王向東,等.蘋果質(zhì)地品質(zhì)近紅外無損檢測和指紋分析[J].農(nóng)業(yè)工程學(xué)報(bào),2008,24(6):169-173.
[4]王曉旭,黃安民,楊忠,等.近紅外光譜用于杉木木材強(qiáng)度分等的研究[J].光譜學(xué)與光譜分析,2011,31(4) : 975-978.
[5]趙榮軍,霍小梅,上官蔚蔚,等.近紅外光譜法預(yù)測粗皮桉木材氣干密度的影響因素分析[J].光譜學(xué)與光譜分析,2011,31(11):2948-2951.
[6]周萬懷.蘋果近紅外光譜數(shù)據(jù)庫系統(tǒng)關(guān)鍵算法研究及原型系統(tǒng)開發(fā)[D].杭州:浙江大學(xué),2014.
[7]李穎,張立福,嚴(yán)薇,等.地面成像光譜數(shù)據(jù)的田間雜草識別[J].遙感學(xué)報(bào),2013,17(4):855-871.
[8]YANG C,HE ZY,YUWC.Comparison of public peakdetection algorithms forMALDI mass spectrometrydata-analysis[J].BMCBioinformatics,20O9,10(4):1-13.
[9]鄭龍海,袁祖強(qiáng),殷晨波,等.基于機(jī)器視覺的建筑垃圾自動分類系統(tǒng)研究[J].機(jī)械工程與自動化,2019(6) :16-18.
[10]LAPORT-FAURETQ,LUBACB,CASTELLE B,et al.Classification of Atlantic coastal sand dune vegetation usinginSitu,UAV,andairborne hyperspectral data[J/OL].Remote Sensing,2020,12(14)(2020-07-11)[2024-08-11].https://doi.org/10.3390/rs1214222.
[11]肖武,任河,呂雪嬌,等.基于無人機(jī)遙感的高潛水位采煤沉陷濕地植被分類[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2019,50(2):177-186.
[12]耿仁方,付波霖,蔡江濤,等.基于無人機(jī)影像和面向?qū)ο箅S機(jī)森林算法的巖溶濕地植被識別方法研究[J].地球信息科學(xué)學(xué)報(bào),2019,21(8):1295-1306.
[13]周學(xué)秋,朱雨杰,劉旭,等.現(xiàn)代傅立葉變換近紅外光譜儀器技術(shù)及其應(yīng)用[J].現(xiàn)代儀器,2002,8(4):29-33.
[14]褚小立,袁洪福,陸婉珍.近年來我國近紅外光譜分析技術(shù)的研究與應(yīng)用進(jìn)展[J].分析儀器,2006(2):1-10.
[15]虞華強(qiáng),趙榮軍,傅峰,等.利用近紅外光譜技術(shù)預(yù)測杉木力學(xué)性質(zhì)[J].西北林學(xué)院學(xué)報(bào),2007,22(5):149-154.
[16]傅霞萍,應(yīng)義斌,陸輝山,等.應(yīng)用多種近紅外建模方法分析梨的堅(jiān)實(shí)度[J].光譜學(xué)與光譜分析,2007,27(5) : 911-915.
[17]趙冬娥,吳瑞,趙寶國,等.高光譜成像的垃圾分類識別研究[J].光譜學(xué)與光譜分析,2019,39(3):921-926.
[18]明群杰.基于光譜匹配技術(shù)的青藏高原典型植被識別與提取[D].北京:中國地質(zhì)大學(xué)(北京),2017.
(責(zé)任編輯:曾 晶)
Application of Full Spectral Matching Algorithm in Rice Classification
LIU Ziheng*1,LIU Hancheng2,ZONG Jin’,WU Xianzhong3 (1.Energy and Power Engineering School,Gansu Minzu Normal University,Hezuo,747Ooo,China; 2.Chemistry and Life Science College,Gansu Minzu Normal University,Hezuo 747ooo,China; 3.College ofGeographyandEnvironmental Enginering,Lanzhou CityUniversity,Lanzhou 73Oo7o,China)
Abstract: In this paper,using three types of rice (i.e.Shengdao 13, Yangguang 2OO and Lindao 11)as the experimental subjects,the spectral diferences ofthree kinds of rice were analyzed byspectral matching algorithm withfullspectra (SMA-FS),realizing the identificationand evaluation of rice varieties.The Savizky-Golay filter was used to smooth the original spectra.Normal SMA-FS,including absolute distance (AD),square derivative (SD),euclidean distance(ED),and spectral angle(SA)were used to distinguish diffrent samples.AD has the highest correct recognition rate of 69.44% ,the lowest is 55.56% ,and the average value is 60.19% . SSD has the highest correct recognition rate of 63.89% ,the lowest is 44.44% ,and the average value is 55.55% : ED has the maximum correct recognition rate of 61. 11% ,the minimum of 47. 22% ,and the average of 56.48% . SA has the maximum correct recognition rate of 72.22% ,the minimum of 63.89% ,and the average value of 67.59% . The spectral angle method outperforms the other three methods in recognition rate and stability.Four SMA-FS allcan accurately classify the tested samples into corresponding categories,and the composition diferences of diffrent ricevarieties can be reflected in the visible near-infrared spectra.SMA-FS is suitable for the overall recognition and evaluation of rice variety composition differences,providing a new method of rice variety identification.
Keywords:SMA-FS;Savizky-Golay filter;classification;spectral absorption;differentiate