段宏偉 韓魯佳 黃光群
(中國農業(yè)大學工學院, 北京 100083)
作為一種清潔可再生能源,秸稈已成為我國生物質資源燃燒發(fā)電利用的重要組成部分。與煙煤燃料相比,生物質秸稈中硫、氮和碳含量較低,鉀(K)和鈉(Na)含量較高。秸稈直燃發(fā)電雖然能夠減少環(huán)境中二氧化硫、氮氧化物和二氧化碳的排放,但高濃度的堿金屬容易引發(fā)結渣問題,從而對秸稈燃燒效率產生巨大影響。由于不同產地、不同種類秸稈中堿金屬含量不同,能夠表征秸稈燃料結渣程度的堿性氧化物指數(shù)也會有所差別[1]。因此,生物質秸稈中堿金屬K和Na的元素定量分析具有重要意義。
與傳統(tǒng)原子光譜分析技術相比,激光誘導擊穿光譜(Laser induced breakdown spectroscopy, LIBS)技術具有不需要對樣品進行繁瑣預處理以及能夠同時進行多元素快速分析的優(yōu)點,已在土壤、植物和農產品等多個方向的農業(yè)領域中廣泛應用[2-11]。然而,目前LIBS在生物質秸稈基礎組成和特性方面的研究報道較少。原因可能是:對于農業(yè)物料樣本,樣品中各元素分析線光譜極易受到復雜的基體效應和自吸收/自蝕影響,從而較大程度地降低模型預測精度。合適的光譜預處理能夠有效減弱因基體效應引發(fā)的光譜擾動[12-14],回歸方法(線性/非線性)的合理選取也有利于建立更穩(wěn)健的光譜定標模型。因此,LIBS光譜數(shù)據(jù)預處理和建模方法的選取對快速準確定量分析生物質秸稈中K和Na元素含量具有重要意義。
常用的原子光譜預處理方法主要包括基線校正(Baseline correction, BC)、歸一化(Normalization, Norm)、中心化(Mean-centering, MC)、導數(shù)法和多元散射校正等方法。由于LIBS光譜儀采集通道數(shù)較多,不同通道之間基線差別較大,且光譜儀中暗電流噪聲可能使所獲取光譜發(fā)生基線偏移,同時考慮到光譜儀工作時微弱光程差異可能引起光譜變化,因此,本文主要選取基線校正、歸一化和中心化相互組合算法作為小麥秸稈中K和Na的LIBS光譜預處理方法。在常用的多元建模方法中,線性建模方法偏最小二乘回歸(Partial least squares regression, PLSR)能夠同時對光譜和化學分析值進行主成分降維,所構建的定標模型穩(wěn)健性較好;非線性建模方法增強型反向傳播人工神經網(wǎng)絡(Adaboost backpropagation artificial neural network, BP-ADaboost)通過將多個BP神經網(wǎng)絡作為弱分類器構建成強學習器,從而克服BP神經網(wǎng)絡容易陷入局部最優(yōu)和過擬合的缺陷,因而具有較好的非線性擬合性能。因此,可將PLSR和BP-ADaboost作為小麥秸稈中K和Na含量的線性和非線性建模方法。
本文選用我國華北地區(qū)小麥秸稈作為研究對象,通過查詢NIST數(shù)據(jù)庫確認K和Na分析線位置及對應波段,分別采用基線校正、歸一化與中心化相互組合算法對LIBS光譜進行預處理,對比不同預處理算法對小麥秸稈中K和Na的LIBS光譜降噪效果的影響,同時分析比較線性建模方法PLSR和非線性建模方法BP-ADaboost對預處理后光譜數(shù)據(jù)的適用性。
29個代表性小麥秸稈樣本采自我國山東省、山西省、天津市和河北省。小麥秸稈切碎后置于45℃ 干燥箱中干燥至質量恒定,經WKF-130型粉碎機粉碎后過20目篩,放入自封袋中備用。
取每個制備樣品約0.50 g,與7.00 mL濃硝酸消解液混合置于密閉的微波消解系統(tǒng)(意大利Milestone touch公司)進行消解處理,再于160℃加熱板上趕酸后,將消解液轉移到100.00 mL容量瓶中定容。配置對應濃度的K和Na的標準曲線,使用PE NexION 300型電感耦合等離子體發(fā)射光譜儀對消解液中K和Na含量進行測定。每個樣品重復測定2次,最終以平均值作為K和Na含量標準值。
LIBS光譜采集使用ChemReveal 3764型臺式LIBS激光光譜儀,其主要包括Nd:YAG釔鋁石榴石晶體激光器(激發(fā)波長1 064 nm)、中階梯光柵光譜儀(Echelle)、7通道電荷耦合(CCD)光譜探測器(波長190~950 nm,分辨率0.05 nm)、數(shù)字延遲發(fā)生器、精密旋轉儀、計算機、反射鏡、透鏡和光纖等。
光譜采集前,首先將環(huán)境氣體設置為氬氣,激光器脈沖聚焦點調節(jié)在樣品表面下2 mm,以防止氬氣被擊穿。針對激光脈沖能量波動對譜線強度的影響,將激光能量設為最大能量的15%,單點激光重復燒蝕次數(shù)設為20。為獲取最佳的光譜強度和信背比,探測器相對于激光脈沖的延遲時間為1 μs。同時將單個樣品的光譜采集點數(shù)設為80,單個點的光斑直徑設為400 μm,以減少樣品不均勻性帶來的誤差。
光譜采集時,掃描器按照設定路徑逐點掃描,并依次獲取每個點在187.781~982.287 nm波段內的光譜信息,掃描完成后將最終獲取的80個點的平均光譜作為該樣品光譜。制備樣品從自封袋中取出后,均勻填滿直徑和深度為30 mm和7 mm的鋁蓋,以20 t壓力將樣品壓制成緊實、平整的片狀,以防止光譜采集過程中的樣品飛濺。
交互驗證決定系數(shù)越大,交互驗證均方根誤差越小,則建模效果越好;預測決定系數(shù)越大,預測均方根誤差越小,則模型預測效果越好。若相對分析誤差大于3,表明模型的預測效果較好,可以用于實際檢測;若相對分析誤差在2.25~3范圍內,說明利用模型能夠進行定量分析,基本滿足實際檢測需求;若相對分析誤差在1.75~2.25范圍內,說明模型預測效果一般,基本可以定量分析;若相對分析誤差小于1.75,則模型難以進行定量分析[16]。
圖1 小麥秸稈樣品平均光譜Fig.1 Averaged spectrum of wheat stalk samples
原子發(fā)射光譜的數(shù)據(jù)統(tǒng)計、降噪和建模分析分別基于ChemLytics和Matlab 2014a軟件平臺完成。利用軟件Office 2013、Origin 9.1和Matlab 2014a分別制作圖表。
將采集到的29個代表性小麥秸稈樣本按照元素含量遞增方式排序后,以3∶1的比例選取22個樣本作為建模校正集,剩余7個樣本作為預測集,小麥秸稈中K和Na的含量(質量比)統(tǒng)計結果如表1所示。
表1 小麥秸稈鉀和鈉含量統(tǒng)計結果Tab.1 Content statistical result of K and Na in wheat straw g/kg
小麥秸稈主要由纖維素、半纖維素、木質素以及少量無機物組成,其主要包含C、H、O、K、Na、Ca和Mg等元素。LIBS儀器獲取的29個小麥秸稈樣品中各元素的平均光譜如圖1所示。由圖1結合NIST數(shù)據(jù)庫得出C、H、O、K、Na、Ca和Mg 7種元素的19條分析譜線參數(shù)如表2所示,主要包括信號強度、能級結構、統(tǒng)計權重、躍遷概率、上下能級能量。觀察發(fā)現(xiàn),對于同種元素:當上下能級能量相同時,原子躍遷概率一般近似相同;當上能級相同時,下能級越高,躍遷概率一般越低;而當下能級相同時,上能級越低,躍遷概率一般越高。并且,對于同種元素同一類型的原子(如CⅠ、KⅠ、CaⅡ等):上下能級差越大,上下能級統(tǒng)計權重比值越小,原子越難被激發(fā),信號強度越低。
表2 小麥秸稈中主要元素分析線光譜參數(shù)Tab.2 Spectroscopic parameters of analytical lines of main elements in wheat stalk
對于Na,原子發(fā)射光譜分析線位于588.99 nm和589.59 nm處,對應的2個吸收峰主要分布在587.026~591.022 nm附近。并且,588.99 nm處的信號強度高于589.59 nm,原因可能是二者上下能級能量相同的條件下,588.99 nm處的上下能級統(tǒng)計權重比值更大。對于K,其原子發(fā)射光譜分析線位于404.4、404.7、766.49、769.90 nm處,對應的4個吸收峰主要分布在403.711~405.283 nm和760.052~774.026 nm附近。對比發(fā)現(xiàn),前后兩個波段區(qū)間的基線水平相差較大,原因主要是LIBS全波段(190~950 nm)光譜儀包含7個光學通道,而不同通道之間存在拼接誤差。同時,觀察發(fā)現(xiàn)K的原始光譜在766.49 nm和769.90 nm處吸收峰存在嚴重的自吸收現(xiàn)象,原因可能是隨著激光能量的增加,激光與樣品作用形成的燒蝕坑直徑和深度均增大,樣品燒蝕量增大,激發(fā)的K原子、離子量增加,光源中心溫度較高,原子所發(fā)射的光譜容易被周圍大量分散的基態(tài)同類原子所吸收,又由于吸收線寬度小于發(fā)射線的寬度,因此可以發(fā)現(xiàn)譜線中心處的吸收比邊緣更強烈,即發(fā)生了自吸收[17-18]。
與分子光譜分析技術相比,LIBS技術依據(jù)羅馬金-賽伯[19-20]公式原理進行樣品元素檢測,主要利用已知元素的分析線和吸收峰光譜信息。因此,當采用多元線性或非線性方法進行小麥秸稈中K和Na含量的定標模型構建時,選取K(403.711~405.283 nm、760.052~774.026 nm)和Na(587.026~591.022 nm)的光譜數(shù)據(jù)作為建模原始數(shù)據(jù)[12]。為了消除因樣品的基體效應引發(fā)的光譜噪聲,分別選用中心化(MC)、歸一化(Norm)、基線校正(BC)對所獲取小麥秸稈中K和Na的LIBS光譜數(shù)據(jù)分別進行預處理。分別采用PLSR和BP-ADaboost構建不同預處理后光譜數(shù)據(jù)的定標模型,并采用留一法對定標模型進行交互驗證,結果如表3所示。為了提高BP-ADaboost算法計算效率和建模精度,采用主成分分析法(PCA)首先對原始數(shù)據(jù)進行特征信息提取,提取參數(shù)累積方差貢獻率設為95%。交互驗證均方根誤差越小,則定標模型建模效果越好,表明所對應的光譜預處理效果越好。
對于K,在5種預處理方法中,PLSR模型中最小的交互驗證均方根誤差為3.203 g/kg,此時采用的潛變量因子數(shù)為2,對應的預處理方法為MC;而PCA-BP-ADaboost模型中最小的交互驗證均方根誤差為1.255 g/kg,對應的預處理方法為BC+MC。
對于Na,當采用BC+MC進行光譜預處理時,其PLSR模型的交互驗證均方根誤差為0.167 g/kg,小于其他光譜預處理后模型結果;而當采用BC+Norm+MC進行光譜預處理時,PCA-BP-ADaboost模型的交互驗證均方根誤差為0.001 g/kg,小于其他光譜預處理后模型結果。
綜上可知,當分別采用MC和BC+MC對小麥秸稈中K和Na的LIBS光譜進行預處理時,其PLSR模型建模效果分別達到最優(yōu);而當分別采用BC+MC和BC+Norm+MC對小麥秸稈中K和Na的LIBS光譜進行預處理時,其PCA-BP-ADaboost模型建模效果分別達到最優(yōu)。進一步比較可知,最優(yōu)預處理方法后的光譜模型效果均好于未預處理后光譜建模效果。原因可能是BC方法能夠消除儀器中不同光譜通道之間的基線差異及暗電流噪聲引起的輕微基線偏移,Norm能夠消除光程差的影響,而MC能夠增強不同樣本之間的光譜數(shù)據(jù)差異性從而有利于提高模型精度。
為驗證所構建小麥秸稈中K和Na最優(yōu)PLSR和PCA-BP-ADaboost定標模型性能,選用具有代表性的7個小麥秸稈樣本進行預測分析,模型預測結果如表4所示。
對于K,當潛變量因子數(shù)為2時,其PLSR模型預測均方根誤差和相對分析誤差分別為2.569 g/kg和2.192,相對分析誤差小于PCA-BP-ADaboost模型結果。表明PCA-BP-ADaboost模型預測性能較好。分析原因,可能是K在766.49 nm和769.90 nm處存在自吸收,致使分析線光譜強度與K濃度含量之間不再遵從朗伯比爾線性定律,從而更適用于非線性神經網(wǎng)絡模型。并且, PCA-BP-ADaboost模型相對分析誤差大于2.35,表明該模型能夠用于定量分析小麥秸稈中K含量,基本能夠滿足實際檢測需求。
對于Na,當潛變量因子數(shù)為5時,其PLSR模型的預測均方根誤差和相對分析誤差分別為0.222 g/kg和2.613,相對分析誤差小于PCA-BP-ADaboost模型結果。表明PCA-BP-ADaboost模型預測性能較好。分析原因,由于小麥秸稈組成成分較為復雜,不同樣本的基體效應相差較大,預處理后光譜中仍存在一定的基體效應噪聲,容易對PLSR線性模型產生干擾。又由于PCA-BP-ADaboost模型相對分析誤差大于4,表明該模型能夠用于小麥秸稈中Na含量的實際在線檢測。
圖2 小麥秸稈中K和Na的最優(yōu)模型結果Fig.2 Results of K and Na in wheat straw by using the best models