黃良平 杜澤麗 范留軍
摘要:玉米是生態(tài)農(nóng)業(yè)的關(guān)鍵農(nóng)作物之一,富含蛋白質(zhì)、纖維素、脂肪等物質(zhì),為實(shí)現(xiàn)優(yōu)質(zhì)玉米的培養(yǎng),需要對(duì)玉米營(yíng)養(yǎng)品質(zhì)進(jìn)行快速鑒定。同時(shí),針對(duì)同一品種的玉米對(duì)不同頻率的光會(huì)產(chǎn)生不同光譜響應(yīng)數(shù)據(jù)的特點(diǎn),為實(shí)現(xiàn)利用光譜建模快速鑒定玉米營(yíng)養(yǎng)品質(zhì)的目的,提出了基于BP神經(jīng)網(wǎng)絡(luò)的平均影響值(BP_MIV)光譜因子篩選方法。利用 BP_MIV法篩選出對(duì)玉米營(yíng)養(yǎng)品質(zhì)貢獻(xiàn)率大的波長(zhǎng)對(duì)應(yīng)的光譜響應(yīng)數(shù)據(jù)列,同時(shí)由于光譜測(cè)量過程中受到試驗(yàn)環(huán)境、儀器參數(shù)配置、光散射效應(yīng)等因素的影響,光譜響應(yīng)數(shù)據(jù)中除包含玉米樣品營(yíng)養(yǎng)品質(zhì)含量的信息外,同時(shí)還存在各種噪音干擾,因此,對(duì)該響應(yīng)數(shù)據(jù)進(jìn)行小波去噪處理,最后建立優(yōu)選波長(zhǎng)因子下的小波神經(jīng)網(wǎng)絡(luò)玉米營(yíng)養(yǎng)品質(zhì)鑒定預(yù)報(bào)模型。結(jié)果表明,篩選出的波長(zhǎng)因子能較好地代表眾多光譜因子,對(duì)玉米蛋白質(zhì)的預(yù)報(bào)精度較傳統(tǒng)的統(tǒng)計(jì)方法要高。
關(guān)鍵詞:營(yíng)養(yǎng)品質(zhì);BP_MIV;貢獻(xiàn)率;小波去噪;預(yù)報(bào)精度
中圖分類號(hào): TP183;S127 ?文獻(xiàn)標(biāo)志碼: A ?文章編號(hào):1002-1302(2020)17-0225-04
河南省地處中原地區(qū),是人口大省,也是我國(guó)重要的糧食產(chǎn)區(qū)。其中玉米又占其全部糧食產(chǎn)量的近1/5。玉米的營(yíng)養(yǎng)品質(zhì)是指玉米中所含的蛋白質(zhì)、纖維素、脂肪等各種營(yíng)養(yǎng)成分。為實(shí)現(xiàn)優(yōu)質(zhì)玉米的培養(yǎng),首先要對(duì)玉米的營(yíng)養(yǎng)品質(zhì)進(jìn)行快速鑒定。而光譜檢測(cè)法[1]是一種能快速檢測(cè)物質(zhì)成分含量的分析方法,它根據(jù)物質(zhì)的光譜響應(yīng)特征來鑒別物質(zhì)并確定化學(xué)組成和相對(duì)含量,而光譜測(cè)量受到試驗(yàn)環(huán)境、儀器參數(shù)配置、光散射效應(yīng)等因素的影響,光譜響應(yīng)數(shù)據(jù)中除了包含樣品成分的信息,同時(shí)還存在各種噪音干擾,鑒于此,引入了小波分析理論[2-3]對(duì)這些響應(yīng)值進(jìn)行去噪處理。同時(shí)由于不同波長(zhǎng)的光譜響應(yīng)值之間必然存在包含或相關(guān)關(guān)系,若把這些因子全部引入到預(yù)報(bào)模型中,不但提高不了模型的預(yù)報(bào)精度,反而會(huì)因超大的數(shù)據(jù)運(yùn)算而對(duì)模型本身和計(jì)算機(jī)有很高的要求,因此,本研究提出了基于神經(jīng)網(wǎng)絡(luò)的平均影響值(mean impact value based on BP,BP_MIV)光譜因子篩選方法[4]。最終利用該方法篩選出貢獻(xiàn)率大的波長(zhǎng)因子,經(jīng)小波去噪處理后建立基于小波神經(jīng)網(wǎng)絡(luò)的玉米營(yíng)養(yǎng)品質(zhì)鑒定模型,并與傳統(tǒng)的統(tǒng)計(jì)模型進(jìn)行比較。
1 不同波長(zhǎng)下響應(yīng)值的小波去噪
不同波長(zhǎng)下測(cè)量得到的光譜響應(yīng)數(shù)據(jù)主要反映的是玉米營(yíng)養(yǎng)品質(zhì)含量的信息,同時(shí)也不可避免地包含有噪聲信息,其基本模型[5]表示為
通過對(duì)式(1)中含噪聲信號(hào)yj進(jìn)行去噪,進(jìn)而恢復(fù)原始信號(hào)Lj′,利用小波對(duì)不同波長(zhǎng)下的不同玉米樣品的響應(yīng)值進(jìn)行去噪,主要分為3個(gè)步驟:
(1)對(duì)各個(gè)波長(zhǎng)下的不同玉米樣品響應(yīng)值進(jìn)行分解。確定一個(gè)正交小波基函數(shù)后對(duì)含噪聲信號(hào)yj進(jìn)行N尺度的小波分解。
(2)高頻系數(shù)的閾值選擇。對(duì)各尺度下的高頻信號(hào)設(shè)定一個(gè)合適的門限閾值,通過含噪聲信號(hào)的絕對(duì)值與所選定的閾值進(jìn)行比較確定信號(hào)的取舍。本研究采用幾乎硬閾值法對(duì)高頻系數(shù)進(jìn)行處理。
(3)小波重構(gòu)。利用幾乎硬閾值法對(duì)高頻信號(hào)d1、d2、…、dN處理后得到的d1′、d2′、…、dN′和第N層的低頻系數(shù)cdN進(jìn)行一維信號(hào)的小波重構(gòu)。
2 基于BP_MIV法的波長(zhǎng)因子篩選
2.1 BP神經(jīng)網(wǎng)絡(luò)基本理論
BP神經(jīng)網(wǎng)絡(luò)(back propagation neural network)是一種非線性系統(tǒng)辨識(shí)工具,通過梯度下降的誤差后向傳播實(shí)現(xiàn),具有結(jié)構(gòu)簡(jiǎn)單、操作性強(qiáng)、快速實(shí)現(xiàn)模式識(shí)別和函數(shù)模擬等優(yōu)點(diǎn)。通常網(wǎng)絡(luò)有輸入層、隱含層和輸出層,網(wǎng)絡(luò)模型結(jié)構(gòu)見圖1。
BP神經(jīng)網(wǎng)絡(luò)主要分2個(gè)階段進(jìn)行學(xué)習(xí)[5-6]:
第1階段(正向傳播):輸入層信息經(jīng)過處理輸給隱含層,并由隱含層輸出:
輸出層計(jì)算各單元的輸出值并輸出:
式中:wkm、wnk分別為隱含層-輸入層權(quán)值、輸出層-隱含層權(quán)值,b1k、b2k為隱含層和輸出層閾值。
第2階段(反向傳播):計(jì)算誤差更新權(quán)重和閾值。誤差計(jì)算:
更新權(quán)值和閾值計(jì)算:
2.2 BP_MIV法對(duì)波長(zhǎng)因子篩選
籠統(tǒng)地將所有波長(zhǎng)因子下的玉米響應(yīng)值納入網(wǎng)絡(luò)模型中,會(huì)使得模型運(yùn)算耗時(shí)過長(zhǎng),甚至不能收斂,不利于提高模型的預(yù)報(bào)精度和可靠性[7],因此要依據(jù)貢獻(xiàn)率對(duì)這些波長(zhǎng)因子進(jìn)行剔除,而本研究采取基于BP神經(jīng)網(wǎng)絡(luò)的MIV法對(duì)因子進(jìn)行篩選?;贐P神經(jīng)網(wǎng)絡(luò)的MIV法的基本思想:采用214種光波長(zhǎng)在4 000~10 000 cm-1 范圍內(nèi)對(duì)100種玉米樣品對(duì)應(yīng)的光譜響應(yīng)數(shù)據(jù)進(jìn)行分析,同時(shí)采用生化方法精確檢測(cè)出該100種玉米樣品的蛋白質(zhì)、纖維素、脂肪的含量。對(duì)光波t對(duì)應(yīng)的100種玉米樣品的響應(yīng)數(shù)據(jù)分別加10%和減小10%,其他光譜響應(yīng)數(shù)據(jù)保持不變,得到2個(gè)數(shù)據(jù)樣本P_in(t)和P_de(t),分別進(jìn)行BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練得result_in(t)和result_de(t),計(jì)算2次訓(xùn)練結(jié)果的差值并求平均值mean[result_in(t)-result_de(t)],直至t從波長(zhǎng)1到波長(zhǎng)214,即MIV-t。這214種光波長(zhǎng)對(duì)玉米蛋白質(zhì)含量的MIV-t如圖2所示。
MIV-t值有正有負(fù),其符號(hào)代表相關(guān)的方向,絕對(duì)值大小代表影響程度,圖2是由BP_MIV算法運(yùn)行10次,求得各次結(jié)果絕對(duì)值的平均值后作出的。可以看出,有142種波長(zhǎng)對(duì)蛋白質(zhì)含量的影響在1.5%以下,43種波長(zhǎng)貢獻(xiàn)率在1.5%~2.0%之間,29種波長(zhǎng)的貢獻(xiàn)率在2.0%以上,且累計(jì)達(dá)74%,較好地反映了波長(zhǎng)與蛋白質(zhì)含量貢獻(xiàn)率的關(guān)系,因此選擇這29種波長(zhǎng)對(duì)應(yīng)的光譜響應(yīng)值進(jìn)行建模。這29種波長(zhǎng)的MIV-t如表1所示。
3 建立玉米營(yíng)養(yǎng)品質(zhì)的BP神經(jīng)網(wǎng)絡(luò)預(yù)報(bào)模型
3.1 利用小波對(duì)光譜響應(yīng)值進(jìn)行去噪處理
采用db6小波函數(shù)對(duì)篩選出的29種波長(zhǎng)下的光譜響應(yīng)值進(jìn)行尺度為j=3的分解,各層的高頻系數(shù)利用公式(2)去噪,最后應(yīng)用Mallat快速重構(gòu)算法獲得光譜響應(yīng)數(shù)據(jù)的濾波值。這29種波長(zhǎng)對(duì)應(yīng)的光譜響應(yīng)數(shù)據(jù)濾波前后的信噪比(SNR)如表2所示。
由表2可知,經(jīng)過db6小波濾波后29種光譜響應(yīng)數(shù)據(jù)的信噪比均有所提高,濾波后的數(shù)據(jù)能更好地反映波長(zhǎng)與玉米營(yíng)養(yǎng)品質(zhì)含量之間的關(guān)系。
3.2 建立BP神經(jīng)網(wǎng)絡(luò)預(yù)報(bào)模型
篩選出29種波長(zhǎng)對(duì)應(yīng)的前80種樣品的光譜響應(yīng)數(shù)據(jù)訓(xùn)練樣本,可見輸入層神經(jīng)元數(shù)為29,根據(jù)高大啟仿真經(jīng)驗(yàn)公式[8]得出隱含層神經(jīng)元數(shù)為10,輸出層為蛋白質(zhì)含量,從而構(gòu)建29×10×1的小波BP_MIV模型。利用構(gòu)建的小波BP_MIV模型對(duì)后20種玉米樣品的蛋白質(zhì)含量進(jìn)行預(yù)報(bào),并與多元線性回歸模型[9]預(yù)報(bào)的結(jié)果進(jìn)行比較,結(jié)果如表3所示。為更直觀地反映3種模型的預(yù)報(bào)演結(jié)果,作殘差圖(圖3)。
由表3和圖3可以看出,3種模型對(duì)玉米蛋白質(zhì)預(yù)報(bào)結(jié)果總體上均與生化方法實(shí)測(cè)值相符,3種模型的均方根誤差(RMSE)分別為1.31、1.11、0.86 g;平均相對(duì)偏差(RAD)分別為10%、8%、7%,表明基于BP網(wǎng)絡(luò)的玉米蛋白質(zhì)非線性擬合模型較多元線性回歸模型預(yù)報(bào)的結(jié)果更穩(wěn)定,且精度更高;同時(shí),經(jīng)過BP_MIV預(yù)先篩選并利用小波去噪處理后所建立的小波BP網(wǎng)絡(luò)模型的預(yù)報(bào)精度最高,大部分樣品的蛋白質(zhì)含量與實(shí)測(cè)值吻合。
4 結(jié)束語(yǔ)
本試驗(yàn)主要研究基于BP神經(jīng)網(wǎng)絡(luò)的MIV光譜篩選方法,針對(duì)光譜響應(yīng)值測(cè)量過程中存在的誤差,利用小波進(jìn)行去噪,最終建立具有較高貢獻(xiàn)率波長(zhǎng)因子的小波BP網(wǎng)絡(luò)模型,并應(yīng)用于玉米蛋白質(zhì)含量的預(yù)報(bào)中,結(jié)果表明,小波BP網(wǎng)絡(luò)模型在預(yù)報(bào)精度和算法收斂時(shí)間上均優(yōu)于不做預(yù)先處理和因子篩選的BP網(wǎng)絡(luò)模型,鑒于該模型在蛋白質(zhì)含量預(yù)報(bào)中的高精確性,還可利用該模型預(yù)報(bào)玉米其他營(yíng)養(yǎng)物質(zhì)的含量,如脂肪、纖維素,進(jìn)而為農(nóng)作物的營(yíng)養(yǎng)物質(zhì)快速鑒定和預(yù)報(bào)提供一種思路。
參考文獻(xiàn):
[1]周 竹,李小昱,高海龍,等. 馬鈴薯干物質(zhì)含量高光譜檢測(cè)中變量選擇方法比較[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào),2012,43(2):128-133.
[2]梁 亮,楊敏華,臧 卓. 基于小波去噪與SVR的小麥冠層含氮率高光譜測(cè)定[J]. 農(nóng)業(yè)工程學(xué)報(bào),2010,26(12):248-253.
[3]胡昌華,李國(guó)華,周 濤. 基于MATLAB 7.X的系統(tǒng)分析與設(shè) 計(jì)—— 小波分析[M]. 西安:西安電子科技大學(xué),2008.
[4]胡紀(jì)元,文鴻雁,周 呂,等. 基于IPSO-BP模型的大壩多源監(jiān)測(cè)數(shù)據(jù)預(yù)報(bào)與反演[J]. 大地測(cè)量與地球動(dòng)力學(xué),2014,34(4):67-70.
[5]程正興,楊守志,馮曉霞. 小波分析的理論、算法、進(jìn)展與應(yīng)用[M]. 北京:國(guó)防工業(yè)出版社,2007.
[6]謝國(guó)權(quán),戚 藍(lán),曾新華. 基于小波和神經(jīng)網(wǎng)絡(luò)拱壩變形預(yù)測(cè)的組合模型研究[J]. 武漢大學(xué)學(xué)報(bào)(工學(xué)版),2006,39(2):16-19,27.
[7]蘇 博,劉 魯,楊方廷. GM(1,N)灰色系統(tǒng)與BP神經(jīng)網(wǎng)絡(luò)方法的糧食產(chǎn)量預(yù)測(cè)比較研究[J]. 中國(guó)農(nóng)業(yè)大學(xué)學(xué)報(bào),2006,11(4):99-104.
[8]高大啟. 有教師的線性基本函數(shù)前向三層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)研究[J]. 計(jì)算機(jī)學(xué)報(bào),1998,21(1):80-85.
[9]李 想,徐偉平,郭永田,等. 信息技術(shù)應(yīng)用對(duì)農(nóng)戶農(nóng)業(yè)經(jīng)營(yíng)收入的影響研究[J]. 中國(guó)農(nóng)業(yè)科技導(dǎo)報(bào),2014,16(1):172-181.