段宏偉,郭 梅,朱榮光,牛其建
1. 江蘇大學農(nóng)業(yè)工程學院,江蘇 鎮(zhèn)江 212013 2. 江蘇大學現(xiàn)代農(nóng)業(yè)裝備與技術教育部重點實驗室,江蘇 鎮(zhèn)江 212013 3. 石河子大學機械電氣工程學院,新疆 石河子 832003
隨著化石能源價格不斷攀升,生物質(zhì)能利用價值愈發(fā)受到各國能源部門關注。生物質(zhì)炭化成型燃料因清潔衛(wèi)生、 灰渣可回收利用等優(yōu)點已成為我國主推清潔能源之一。熱值(CV)是熱效率、 燃燒設備熱平衡、 燃料品質(zhì)計算的重要指標,主要通過氧彈量熱儀測量反應物與生成物的焓差計算得到,然而該方法難以滿足工業(yè)生產(chǎn)實時監(jiān)測要求。
激光誘導擊穿光譜(LIBS)是一種利用激光在焦平面直接燒蝕樣品表面產(chǎn)生等離子體時發(fā)射的原子或離子光譜進行檢測的新興技術[1]。該技術在農(nóng)業(yè)原料等生物質(zhì)復雜基體特性精確定量分析方面仍面臨挑戰(zhàn)。Song等[2]研究結果表明X自變量特征提取法可以去除復雜基體LIBS譜線中大量無信息變量和多重共線性變量,從而提升定量模型預測性能。
目前常規(guī)特征變量提取方法為X(光譜)自變量特征提取類型法,如競爭性自適應重加權算采樣法、 遺傳算法和回歸系數(shù)法等[2-4],上述方法主要依據(jù)不同采樣光譜波段組合構建模型的交互驗證均方根誤差(RMSECV)進行特征光譜提取。由于該類方法所對應回歸模型主要為線性偏最小二乘回歸(PLSR),而秸稈炭中主要包含金屬元素原子/離子譜線和非金屬元素原子/分子譜線,因此X自變量特征提取法僅能篩選出符合朗伯比爾線性定律的大部分金屬元素LIBS特征光譜。
為提取與秸稈炭CV緊密相關的非金屬元素LIBS特征譜線,本研究提出一種Y(濃度∶熱值)因變量特征提取法,主要對秸稈炭CV與元素濃度進行相關性分析,通過相關性顯著分析獲取大部分非金屬元素最佳組合譜線。研究基于XY雙變量特征提取策略精確獲取秸稈炭CV敏感特征元素變量,采用遺傳算法優(yōu)化及自適應增強的人工神經(jīng)網(wǎng)絡算法(GA-BP-Adaboost)構建秸稈炭CV非線性LIBS定量分析模型,為秸稈炭燃料品質(zhì)評價以及工業(yè)現(xiàn)場過程分析提供一種可靠的分析策略。
LIBS系統(tǒng)燒蝕源為一臺調(diào)Q的Nd∶YAG固體激光器,激發(fā)波長為1 064 nm,最大頻率為2 Hz,脈沖延遲為10 ns,最大激發(fā)能量為100 mJ。激光聚焦后法線入射到樣品表面并引發(fā)等離子體,相對于水平方向呈45°的準直鏡接收等離子體信號至光纖傳輸通道。光纖出口連接7通道電荷耦合光譜儀,光譜儀分辨率為0.05 nm,檢測波長范圍為187~980 nm。
在本研究中,針對激光脈沖能量波動對譜線強度影響問題,將激光能量設為30 mJ,單點激光重復燒蝕次數(shù)設為3,單點光斑大小設為200 μm。為了避免軔致輻射,探測器相對于激光脈沖的延遲時間設為0.7 μs。
79個秸稈炭樣品采購于南京智融聯(lián)科技有限公司,包含水稻秸稈炭和玉米秸稈炭。樣品經(jīng)過45 ℃烘箱干燥后,利用刀片式粉碎機粉碎過75 μm篩后放入自封袋備用。樣品中N,C,S,H和O采用元素分析儀測定[5],K,Na,Ca,Mg,Pb,Cr,Cu,Zn和P元素含量采用ICP-MS測定[6],CV采用氧彈量熱儀測定[7],實驗結果如表1所示。
表1 CV和主要元素含量統(tǒng)計結果Table 1 Statistical results of CV and main element content
定量分析模型一般形式為Y=KX+B,其中X和Y分別為自變量和因變量,所對應特征變量提取方法可以分類為X自變量特征提取法和Y因變量特征提取法。本研究所采用的XY雙變量特征提取法流程如圖1所示。
首先采用Y因變量特征提取法獲取與秸稈炭CV相關的C和O等非金屬元素譜峰波段組合,通過CV與秸稈炭元素濃度之間相關性分析,選取相關性極顯著(p<0.01)元素分析線展寬波段作為特征變量。采用回歸系數(shù)法(RC)作為X自變量特征提取法,通過設定不同回歸系數(shù)閾值篩選特征變量,并構建不同特征變量組合的線性偏最小二乘回歸(PLSR)模型,依據(jù)模型RMSECV(交互驗證均方根誤差)值選取最優(yōu)金屬元素譜線組合作為提取結果。由于所提取特征包含線性和非線性變量,最終構建秸稈炭CV的非線性精確定量分析模型。
圖1 XY雙變量特征提取策略Fig.1 XY bivariate feature extraction strategy
遺傳算法優(yōu)化及自適應增強的人工神經(jīng)網(wǎng)絡算法(GA-BP-Adaboost)[8]是一種非線性人工神經(jīng)網(wǎng)絡改進模型,一方面采用遺傳算法(GA)優(yōu)化邊界函數(shù)參數(shù)w和b值,另一方面采用多個弱預測器對數(shù)據(jù)集中每個樣本進行訓練并不斷調(diào)整樣本權重D,同時為每個弱預測器分配權重alpha以計算最終強預測器結果。相關計算公式分別為式(1)—式(3)
(1)
(2)
Errori=Errori+(0,Di, j)
(3)
式中,i和j分別為弱預測器和樣本序號,Error為每個弱預測器所有樣本權重總和。若某個樣本被準確預測(小于相對誤差率閾值),則該樣本權重降低,式(2)中alpha符號取負,所對應Error值不變(+0);若某個樣本未能準確預測(大于相對誤差率閾值),則該樣本權重升高,式(2)中alpha符號取正,所對應Error值變大(+Di, j)。
模型效果主要由均方根誤差(RMSE)、 平均相對誤差(ARE)和相對標準誤差(RSD)來評價[9-10],計算公式如式(4)—式(6)所示。RMSECV越小,則建模效果越好;RSDP和AREP越小,則模型預測精度越高。
(4)
(5)
(6)
圖2 LIBS譜線Fig.2 LIBS spectral analysis
與非金屬元素和重金屬元素相比較,營養(yǎng)型金屬元素K,Ca,Na和Mg發(fā)射線強度較大。原因可能是營養(yǎng)型金屬元素的電離能較小,更容易發(fā)生能級躍遷至激發(fā)態(tài),單位體積內(nèi)處于激發(fā)態(tài)的原子數(shù)更多,譜線強度更大。又由于K,Na,Ca,Mg和Cr參與農(nóng)作物生理生長作用過程,其LIBS分析線可能會對秸稈炭CV表現(xiàn)出更高敏感性。
首先采用Y因變量特征提取法獲取與CV具有顯著相關性的特征元素譜峰波段,結果如表2所示。CV與C,O,H和Na元素濃度相關性較大且相關系數(shù)呈現(xiàn)極顯著性(p<0.01);與Ca,K和Cr元素濃度相關性相對較低且相關系數(shù)呈現(xiàn)顯著性(p<0.05);而與S,Mg,Zn,Pb,N,Cu和P元素濃度無相關性。由于秸稈炭中C,O和H主要以碳單質(zhì)、 芳香環(huán)、 羧基、 醚鍵和硅氧鍵等形式存在[13],能夠顯著提升秸稈炭CV。因此,選取C,O,H和Na元素的LIBS譜峰波段作為Y因變量特征提取結果。
采用X自變量特征提取法獲取全波段PLSR模型回歸系數(shù)較大值作為CV特征變量,結果如圖3(a)所示。當回歸系數(shù)閾值分別設為15×10-5,10×10-5,5×10-5,4×10-5,3×10-5,2×10-5和1×10-5時,其所構建PLSR模型的RMSECV結果如圖3(b)所示。結果表明:隨著閾值逐漸減小,RMSECV值先減小后增大。原因可能是:當RMSECV降低時,CV模型中線性相關性元素Ca,Cr,Mg和K的分析線光譜逐漸被選中;當RMSECV升高時,CV模型中非線性相關性元素光譜和噪聲信息逐漸被選中。當閾值為4×10-5時RMSECV降至最小值0.61,所選取49個特征變量數(shù)為X自變量特征提取結果。
表2 CV與元素相關性分析Table 2 Correlation analysis between CV and elements
圖3 回歸系數(shù)法閾值選取 (a): 全波段PLSR模型回歸系數(shù);(b): 不同回歸系數(shù)閾值模型結果Fig.3 Threshold selection of regression coefficient method (a): Full band PLSR model regression coefficient; (b): Model results with different regression coefficient thresholds
綜上所述,XY雙變量特征提取法獲取的CV特征變量結果如圖4(a)所示。Y因變量特征提取法主要包括C,O,H和Na元素分析線展寬波段,X自變量特征提取法主要包括Ca,Cr,Mg和K元素分析線光譜,并且二者無交集。分別構建X單變量、Y單變量和XY雙變量特征PLSR模型,由圖4(b)得出雙變量特征模型的RMSECV值最小,表明XY雙變量特征提取法能夠成功獲取CV特征變量。然而由于該方法獲取了大量非線性特征變量,有必要構建非線性多元回歸模型以提升模型預測性能。
圖4 XY雙變量特征提取結果 (a): XY雙變量特征提取結果;(b): 三種特征變量模型效果比較Fig.4 XY bivariate feature extraction results (a): XY bivariate feature extraction results; (b): Comparison of three feature variable model
在構建GA-BP-Adaboost特征模型前,需要提前采用GA和Adaboost對BP-ANN模型參數(shù)進行尋優(yōu)以構建較為穩(wěn)健的非線性特征模型。相關參數(shù)設置:GA參數(shù)中迭代次數(shù)為20,種群規(guī)模為20;Adaboost參數(shù)中弱預測器個數(shù)設為20,雙隱含層數(shù)均為1,輸入層、 隱含層和輸出層傳遞函數(shù)分別為tansig,tansig和purelin; 訓練函數(shù)為trainbr,學習速率和學習目標均設為0.01。
對于GA-BP部分,當交叉概率設為0.8~0.95,步長為0.05,變異概率設為0.05~0.5,步長為0.05時,所對應平均適應度值如圖5(a)所示。當變異概率逐漸減小,交叉概率逐漸增大時,平均適應度值呈現(xiàn)降低趨勢。當變異概率和交叉概率分別為0.1和0.95時,平均適應度降至最小值80.98。又由于適應度函數(shù)為預測絕對誤差和,適應度越小表明模型預測越準確。對于BP-Adaboost部分,由于20個弱預測器模型對每個訓練樣本的相對誤差率(RE)范圍為0~7.15%,將RE閾值設為0.05~0.30,步長為0.05,結果如圖5(b)所示。觀察得出,隨著RE值增大,AREP和RSDP值總體呈現(xiàn)先減小后增大趨勢。因此,將變異概率、 交叉概率和RE值分別設為0.1,0.95和0.01用于進一步的GA-BP-Adaboost模型構建。
圖5 GA和Adaboost參數(shù)優(yōu)化 (a): GA參數(shù)優(yōu)化;(b): Adaboost參數(shù)優(yōu)化Fig.5 Optimization of GA and Adaboost parameters (a): GA parameter optimization; (b): Adaboost parameter optimization
將所提取特征變量數(shù)據(jù)經(jīng)主成分分析(閾值參數(shù)設為99.93%),并基于優(yōu)化后的參數(shù)構建GA-BP-Adaboost模型,將模型結果與線性PLSR模型效果相比較,結果如圖6所示。與PLSR特征模型相比較,GA-BP-Adaboost特征模型中大部分樣本(1~3,5,7~17,19,20)的預測值與測定值更為接近,AREP和RSDP分別降低了0.82%和0.91%。結果表明:非線性GA-BP-Adaboost模型效果較優(yōu),原因可能是XY雙變量特征提取法獲取了大量非線性特征變量,而神經(jīng)網(wǎng)絡模型通過多個神經(jīng)元的深度訓練能夠較好地實現(xiàn)非線性特征變量的擬合。與Song等[2]所構建CV特征模型結果相比較,本研究所構建PLSR和GA-BP-Adaboost模型的RSDP值分別下降了0.34%和1.25%。原因可能是:Song等采用了一種集成變量選擇法,即將回歸系數(shù)法、 套索法、 競爭性自適應重加權算采樣法、 遞歸加權偏最小二乘法、 顯著性多元相關法、 最小冗余最大相關性選取的6個變量子集分別構建PLSR模型,根據(jù)RMSECV值選取前3個變量子集合并作為最終集成變量特征提取結果。然而該方法所選用的特征提取方法均屬于X自變量特征提取法,僅能提取符合朗伯比爾線性定律的金屬元素譜線,無法提取與CV相關的C和O等非金屬元素特征譜線。因此,將XY雙變量特征提取法與GA-BP-Adaboost非線性多元回歸模型相結合能夠顯著提升傳統(tǒng)X自變量特征模型效果,可以用于秸稈炭CV精準預測。
圖6 模型預測結果Fig.6 Model prediction results
針對傳統(tǒng)X自變量特征提取方法在LIBS定量分析秸稈炭CV過程中缺陷問題,提出了一種XY雙變量特征提取法。首先分析了秸稈炭CV與各元素含量之間相關性,基于相關性顯著性分析結果選取與CV相關的Y型特征變量,主要包含C,O,H和Na元素分析線展寬波段;同時通過篩選多變量線性模型回歸系數(shù)閾值獲取與CV相關的X型特征變量,主要包含Ca,Cr,Mg和K元素分析線光譜。進一步采用所提取特征變量構建秸稈炭CV非線性神經(jīng)網(wǎng)絡模型,其AREP和RSDP值明顯低于相關文獻報道的特征模型結果。結果表明:XY雙變量特征提取法結合GA-BP-Adaboost模型可以用于秸稈炭CV精確定量預測分析。