喬正明 詹 成
(1. 常州紡織服裝職業(yè)技術(shù)學(xué)院,江蘇 常州 213164;2. 蘇州科技大學(xué),江蘇 蘇州 215000)
隨著近紅外光譜技術(shù)與化學(xué)計(jì)量方法的快速發(fā)展,近紅外光譜技術(shù)被廣泛地應(yīng)用于農(nóng)產(chǎn)品品質(zhì)分析領(lǐng)域[1]。蘋果糖度是蘋果質(zhì)量的重要評價(jià)指標(biāo),運(yùn)用預(yù)測相關(guān)系數(shù)(correlation of prediction,CP)Rp預(yù)測均方根誤差(root mean square error of prediction,RMSEP)σp作為蘋果糖度預(yù)測結(jié)果的性能評價(jià)指標(biāo),很多學(xué)者利用近紅外光譜技術(shù)進(jìn)行了蘋果糖度預(yù)測研究。趙杰文等[2]提出運(yùn)用傅里葉變換近紅外光譜儀采集蘋果光譜,建立了基于偏最小二乘(partial least squares,PLS)的蘋果糖度預(yù)測模型,其中Rp和σp分別為0.938 7和0.505 4。Zhang等[3]運(yùn)用Nexus FT-IR光譜儀為蘋果光譜采集儀器,建立了基于PLS的蘋果糖度預(yù)測模型,Rp和σp分別為0.906和0.272,該方法主要用于測試套袋評估的精度,且要求蘋果顏色均勻,因此整體預(yù)測精度不高。劉燕德等[4]運(yùn)用Antaris FT-IR光譜儀采集蘋果光譜,建立了基于遺傳—偏最小二乘的蘋果糖度預(yù)測模型,Rp和σp分別為0.954和0.797,該方法可以有效解決蘋果顏色對于預(yù)測精度的影響,但是光譜冗余信息造成的誤差過大。夏阿林等[5]建立了基于遺傳—區(qū)間偏最小二乘的蘋果糖度預(yù)測模型,運(yùn)用Nexus 670 FT-IR光譜儀采集蘋果光譜,Rp和σp分別為0.932和0.384,該方法雖然對比以往研究整體的預(yù)測精度有大幅提升,且算法的執(zhí)行效率較高,但對于光譜冗余信息的處理仍然是個難題,整體收斂性差,復(fù)雜度較高。
為了進(jìn)一步改善蘋果糖度預(yù)測模型的精度,研究擬提出一種基于小波包變換的特征波長篩選和樽海鞘算法(salp swarm algorithm,SSA)改進(jìn)極限學(xué)習(xí)機(jī)(extreme learning machine,ELM)的蘋果糖度預(yù)測模型,以期為蘋果糖度預(yù)測提供新的方法。
試驗(yàn)儀器采用美國Thermo Fisher公司的型號為Antaris II的近紅外檢測儀。該儀器集成了透射、反射、漫透射以及漫反射等不同檢測模塊,采用了Nicolet專利的高光通量、高速動態(tài)準(zhǔn)直電磁式干涉儀,可以實(shí)現(xiàn)不同狀態(tài)下的樣品高效的、精準(zhǔn)的檢測與分析。
基于近紅外光譜的SSA-ELM的蘋果糖度預(yù)測模型的建模思路如圖1所示。
圖1 蘋果糖度預(yù)測建模流程Figure 1 Apple sugar content predictive modelingprocess
2.2.1 種群初始化 在標(biāo)準(zhǔn)SSA算法中,樽海鞘算法的種群規(guī)模為N,搜索空間維數(shù)為D,樽海鞘的位置為X=[Xn1,Xn2,…,XnD]T,n=1,2,…,N,食物位置為F=[F1,F2,…,FD]T,搜索空間上限為ub=[ub1,ub2,…,ubD]T、搜索空間下限為lb=[lb1,lb2,…,lbD]T,樽海鞘算法的種群隨機(jī)初始化公式為[6]:
XN×D=R(N,D)×(ub-lb)+lb,
(1)
式中:
XN×D——樽海鞘位置向量(向量維數(shù)為N×D);
R(N,D)——N×D維的隨機(jī)向量。
2.2.2 更新領(lǐng)導(dǎo)者位置 在標(biāo)準(zhǔn)SSA算法中,領(lǐng)導(dǎo)者引領(lǐng)整個樽海鞘群體的移動,用來搜索食物,這一操作的主要目的是使得領(lǐng)導(dǎo)者位置更新方式具有很強(qiáng)的隨機(jī)性,領(lǐng)導(dǎo)者更新策略按式(2)計(jì)算:
(2)
式中:
ubd,lbd——引領(lǐng)者個體在d維上的搜索上限和搜索下限;
c1、c2——隨機(jī)數(shù),處于[0,1];
c3——搜索平衡因子(主要用于平衡全局搜索和局部搜索能力,增強(qiáng)引領(lǐng)者的隨機(jī)性和多樣性)。
收斂因子按式(3)計(jì)算:
c1=2e(-4t/T)2,
(3)
式中:
c1——收斂因子;
t——樽海鞘算法的當(dāng)前迭代次數(shù);
T——樽海鞘算法的最大迭代次數(shù)。
2.2.3 更新追隨者位置 根據(jù)文獻(xiàn)[7]可知,初始位置、速度和加速度直接關(guān)系到追隨者的位置,跟隨者根據(jù)牛頓運(yùn)動方程更新位置:
(4)
(5)
(6)
式中:
a——加速度;
v0——初始速度;
ta——迭代步長;
R——運(yùn)動距離;
2.3.1 極限學(xué)習(xí)機(jī) 與傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)相比,ELM模型結(jié)構(gòu)如圖2所示[8]。
圖2 ELM模型結(jié)構(gòu)示意圖Figure 2 ELM model structure diagram
對于N個訓(xùn)練樣本(Xi,Ti),ELM模型的輸入向量Xi=[xi1,xi2,…,xin]T∈Rn,ELM模型的目標(biāo)向量Ti=[ti1,ti2,…,tin]T∈Rm,X為n×Q的矩陣,T為m×Q的
矩陣,Q為訓(xùn)練樣本數(shù)量。因此,L個隱含層神經(jīng)元的ELM模型輸出為[9]:
(7)
式中:
Wi——ELM模型的輸入權(quán)重,Wi=[wi1,wi2,…,win]T;
Wi·Xj——Wi和Xj的內(nèi)積;
βi——ELM模型的輸出權(quán)重;
g(x)——激勵函數(shù);
bi——ELM模型的第i個隱含層神經(jīng)元的偏置。
ELM模型訓(xùn)練目的就是使式(8)的誤差最小[10]。
(8)
由式(7)和式(8)可知,存在一組參數(shù)βi、Wi和bi使得式(9)成立。
(9)
式(9)的矩陣形式為[11]:
Hβ=T,
(10)
式中:
H——ELM模型的隱含層神經(jīng)元的輸出;
β——ELM模型的輸出權(quán)重矩陣。
例2Alice在社交應(yīng)用上發(fā)布了一條消息,消息中有“教師”這個詞匯,她的朋友Bob(在Alice的社交應(yīng)用中屬于“朋友”這一訪問者類型)要訪問這條消息。首先,社交應(yīng)用中的訪問控制模塊會對Bob的請求進(jìn)行攔截,然后檢查分配給“朋友”這一訪問者類型的隱私規(guī)則,以確定Bob的訪問水平(教育工作者),然后調(diào)出含有“教育工作者”的這一支(圖3),“教師”節(jié)點(diǎn)在“教育工作者”節(jié)點(diǎn)下面,最終,訪問控制模塊將消息中的“教師”替換成“教育工作者”(Bob的訪問水平)發(fā)送給Bob。
(11)
(12)
2.3.2 適應(yīng)度函數(shù) ELM模型的性能直接取決于初始輸入權(quán)值Wi和隱含層偏置bi的選擇。為提高ELM模型的性能,運(yùn)用SSA算法優(yōu)化選擇ELM模型的初始輸入權(quán)值Wi和隱含層偏置bi,將均方差作為適應(yīng)度函數(shù),即當(dāng)均方差誤差最小時,所對應(yīng)的初始輸入權(quán)值Wi和隱含層偏置bi作為ELM模型的最優(yōu)參數(shù):
(13)
式中:
n——訓(xùn)練樣本數(shù)量;
x(i)和xp(i)——第i個樣本的實(shí)際值和預(yù)測值;
[Wimin,Wimax]與[bimin,bimax]——ELM模型第i個初始輸出權(quán)值W和第i個隱含層偏置b的上下限值,且W∈[-1,1]和b∈[-1,1]。
2.3.3 算法步驟
Step1:讀取蘋果光譜數(shù)據(jù)和含量數(shù)據(jù),預(yù)處理并進(jìn)行特征波長篩選,將數(shù)據(jù)劃分為訓(xùn)練集和測試集,并進(jìn)行歸一化處理;
Step3:計(jì)算適應(yīng)度。針對訓(xùn)練集,將訓(xùn)練集代入ELM模型,按適應(yīng)度函數(shù)式(12)計(jì)算每個樽海鞘個體的適應(yīng)度;
Step4:選定領(lǐng)導(dǎo)者、追隨者和食物。計(jì)算適應(yīng)度大小,將適應(yīng)度最優(yōu)的樽海鞘位置設(shè)定為當(dāng)前食物位置;剩下的N-1個樽海鞘,將排在前一半的樽海鞘作為領(lǐng)導(dǎo)者,剩下的作為追隨者;
Step5:更新領(lǐng)導(dǎo)者位置和追隨者位置;
Step6:計(jì)算更新之后的樽海鞘個體適應(yīng)度fs。比較fs與當(dāng)前食物的適應(yīng)度ffood,如果fs>ffood,則將fs所對應(yīng)的樽海鞘位置作為新的食物位置;
Step7:重復(fù)Step3~Step6,如果t>T,輸出最優(yōu)食物位置,最優(yōu)食物位置所對應(yīng)的結(jié)果即為ELM模型的最優(yōu)初始輸入權(quán)值和隱含層偏置。將最優(yōu)初始權(quán)值和隱含層偏置代入ELM模型進(jìn)行蘋果糖度預(yù)測?;诩t外光譜的SSA-ELM的蘋果糖度預(yù)測流程如圖3所示。
圖3 基于紅外光譜的SSA-ELM的蘋果糖度預(yù)測流程Figure 3 SSA-ELM apple sugar content predictionprocess based on infrared spectroscopy
光譜的預(yù)處理方法有:一階導(dǎo)數(shù)算法(FD)預(yù)處理、二階導(dǎo)數(shù)算法(SD)預(yù)處理、標(biāo)準(zhǔn)正態(tài)變量變換算法預(yù)處理(SNV)和多元散射校正(MSC)預(yù)處理[12-13],不同預(yù)處理結(jié)果如表1所示。蘋果原始光譜圖像如圖4所示。由表1可知,多元散射校正(MSC)處理結(jié)果最好。其預(yù)處理結(jié)果如圖5所示。
圖4 蘋果原始光譜Figure 4 Apple’s original spectrum
圖5 MSC預(yù)處理結(jié)果Figure 5 MSC preprocessing result graph
表1 不同預(yù)處理建模效果對比Table 1 Comparison of different preprocessing modeling effects
選擇均方根誤差(ERMSE)和相關(guān)系數(shù)C2評價(jià)蘋果糖度預(yù)測模型的性能[14-15]:
(14)
(15)
式中:
xk——第k個樣本的蘋果糖度實(shí)際值;
pk——第k個樣本的蘋果糖度預(yù)測值;
n——樣本數(shù)量;
ERMSE——均方根誤差;
C2——相關(guān)系數(shù)。
由于蘋果光譜數(shù)據(jù)具有維度高而復(fù)雜的特點(diǎn),蘋果糖度預(yù)測模型建立之前先對光譜數(shù)據(jù)進(jìn)行降維處理,文中分別對比全波段和偏最小二乘法、連續(xù)投影法和小波包變換等篩選特征波長的結(jié)果,最終確定蘋果光譜特征波長篩選方法。特征波長篩選后建模效果對比如表2和圖6所示。
表2 特征波長篩選后建模效果對比
由表2和圖6可知,基于小波包變換特征波長篩選之后的建模效果最好,相關(guān)系數(shù)和均方根誤差分別為0.924 2和0.672 6,優(yōu)于全波段和偏最小二乘法、連續(xù)投影法的建模效果。因此選擇小波包變換特征波長篩選法進(jìn)行蘋果光譜特征波長篩選。
圖6 特征波長篩選后建模效果Figure 6 Modeling effect diagram after characteristic wavelength selecting
為驗(yàn)證SSA-ELM進(jìn)行蘋果糖度預(yù)測的有效性和可靠性,將SSA-ELM與GA-ELM、PSO-ELM和ELM進(jìn)行比較,參數(shù)設(shè)定:① SSA算法:樽海鞘種群規(guī)模N=10,最大迭代次數(shù)T=100;② 遺傳算法[16](genetic algorithm,GA)算法:最大迭代次數(shù)T=100,種群規(guī)模N=10,變異概率pm=0.1,交叉概率pc=0.7;③ 粒子群算法[17](particle swarm optimization algorithm,PSO):學(xué)習(xí)因子c1=c2=2,最大迭代次數(shù)T=100,種群規(guī)模N=10,慣性權(quán)重w=0.8;④ ELM模型[18-19]:輸入層神經(jīng)元數(shù)量N1=2 740、隱含層神經(jīng)元數(shù)量N2=10以及輸出層神經(jīng)元數(shù)量為N3=1,一共采集到光譜數(shù)據(jù)34組,將前25組作為訓(xùn)練集,剩下9組作為測試集,蘋果糖度預(yù)測結(jié)果如圖7和表3所示。
圖7 蘋果糖度預(yù)測對比Figure 7 Apple sugar content predictioncomparison chart
表3 蘋果糖度預(yù)測結(jié)果對比Table 3 Comparison of apple sugar content prediction results
對比圖7與表3可知:① 在訓(xùn)練集和測試集上,SSA-ELM模型的蘋果糖度預(yù)測結(jié)果優(yōu)于GA-ELM、PSO-ELM和ELM模型的蘋果糖度預(yù)測結(jié)果,SSA-ELM模型的蘋果糖度預(yù)測評價(jià)指標(biāo)RMSE最小且相關(guān)系數(shù)R2最大,由此證明SSA-ELM模型的蘋果糖度預(yù)測值和蘋果糖度實(shí)際值關(guān)聯(lián)程度最高,蘋果糖度預(yù)測效果最好;② 通過SSA、GA和PSO等算法對ELM模型的初始輸入權(quán)值和隱含層偏置的優(yōu)化選擇,SSA-ELM、GA-ELM和PSO-ELM模型的蘋果糖度預(yù)測精度優(yōu)于ELM模型,說明通過智能算法優(yōu)化ELM模型的參數(shù)可以有效提高ELM模型的蘋果糖度預(yù)測精度。
為提高蘋果糖度預(yù)測的精度,提出了一種基于紅外光譜的樽海鞘算法改進(jìn)極限學(xué)習(xí)機(jī)的蘋果糖度預(yù)測算法。針對極限學(xué)習(xí)機(jī)模型預(yù)測性能受其初始權(quán)值和閾值的影響,運(yùn)用樽海鞘算法對極限學(xué)習(xí)機(jī)模型的初始權(quán)值和閾值進(jìn)行優(yōu)化選擇。將蘋果的紅外光譜吸光度作為極限學(xué)習(xí)機(jī)的輸入,蘋果糖度作為極限學(xué)習(xí)機(jī)的輸出,建立紅外光譜的蘋果糖度預(yù)測模型,其對蘋果糖度預(yù)測的精度高于遺傳算法改進(jìn)極限學(xué)習(xí)機(jī)、粒子群算法改進(jìn)極限學(xué)習(xí)機(jī)和極限學(xué)習(xí)機(jī)。通過智能算法優(yōu)化極限學(xué)習(xí)機(jī)模型的參數(shù)可以有效提高極限學(xué)習(xí)機(jī)模型的蘋果糖度預(yù)測精度。