劉鎮(zhèn)波 孫鳳亮 李耀翔 劉一星(生物質材料科學與技術教育部重點實驗室(東北林業(yè)大學),哈爾濱,150040)Xiang-Ming Wang(加拿大林產品創(chuàng)新研究院,魁北克,G1P 4R4)
按美國材料與試驗協(xié)會(ASTM)定義,近紅外(NIR)光譜區(qū)域是指波長在780~2 526 nm范圍內的電磁波,是人們最早發(fā)現(xiàn)的非可見光區(qū)域。近幾十年來,隨著計算機技術、分析儀器數(shù)字化和化學計量學的快速發(fā)展,使近紅外光譜技術在各領域的應用越來越廣泛[1]。木材科學工作者們也將這項技術引入到木材科學研究中。
通過前人研究成果可以看出,近紅外光譜技術不但可以用來預測木材的生長特性,如管胞長度、微纖絲傾角、細胞壁直徑、細胞壁厚度、纖維長度、纖維素結晶度等[2-6],也可用于預測木材的物理、力學性質,如含水率、密度、壓縮強度、彎曲強度、彈性模量及強度等[7-13],而且,應用近紅外光譜技術還可以對木材的化學性質進行分析,如預測木材的纖維素、綜纖維素、Klason木質素、半纖維素、木質素、抽提物、樹脂等的質量分數(shù)[14-18],分析木材的腐朽過程及木材改性處理后的化學性質變化[19-22]。為了提高近紅外光譜分析精度,以獲得更好的預測效果,學者們采用一階導數(shù)、二階導數(shù)、小波變換、二階微分處理、平滑預處理等方法對光譜數(shù)據(jù)進行預處理[23-25],并分析預處理對預測效果的影響。從前人的研究可以看出,應用NIR技術可以預測木材的多種化學性質,但針對我國人工林楊木化學性質預測的研究,尤其是針對不同光譜數(shù)據(jù)區(qū)域、不同數(shù)據(jù)預處理方法及不同建模方法對人工林楊木苯醇抽提物質量分數(shù)預測影響的研究尚少開展。
楊木是我國種植量最大、種植面最廣、最重要的人工林樹種之一,開展高效利用楊木資源的相關研究具有重要的意義。筆者在按照國家標準方法測定人工林楊木木材苯醇抽提物質量分數(shù)的基礎上,通過不同光譜區(qū)域、不同光譜預處理方法及不同的建模方法建立基于近紅外光譜技術的楊木苯醇抽提物質量分數(shù)的預測方法,這對實現(xiàn)人工林楊木木材化學性質的快速、準確測定具有重要意義。
木材試樣采自安徽太和縣楊木人工林,共采集7棵樹,每棵樹采6個樣本,共42個樣本。在進行苯醇抽提物質量分數(shù)的傳統(tǒng)方法測定及NIR光譜采集前,將試樣磨成40~60目的木粉。
苯醇抽提物質量分數(shù)按照國家標準GBT 2677.6-94進行測定。每個樣品同時做兩份平行測定,取其算術平均值作為測定值。
采用美國ASD公司生產的LabSpec Pro FR/A114260便攜式快速掃描光譜儀采集樣品近紅外光譜,采集波長范圍為350~2 500 nm。實驗室室內溫度(20±1)℃,平均相對濕度50%。全光譜數(shù)據(jù)采集速度為0.1 s。在1.5 s內對每個樣品連續(xù)掃描10次,在350~1 000 nm范圍內采樣間隔為1.4 nm,在1 000~2 500 nm范圍內采樣間隔為2 nm。將所得光譜做平均處理后,顯示的平均光譜作為該樣品的光譜。
采集了42個樣本,其中30個樣本作為校正集用于預測模型的建立和模型的完全交互驗證,剩余12個樣本作為預測集,不參與建模。采用傳統(tǒng)實驗方法測得樣本的苯醇抽提物質量分數(shù),具體結果如表1所示。
表1 苯醇抽提物質量分數(shù)數(shù)據(jù)分布
本研究對樣品采集的光譜區(qū)域為3 5 0~2 500 nm,基于不同區(qū)域光譜數(shù)據(jù),應用CAMO公司的多變量統(tǒng)計分析軟件Unscramb中的偏最小二乘法(PLS1、PLS2)及主成分回歸(PCR)方法建立校正模型,并采用完全交互驗證方式得到驗證模型各項參數(shù)。通過比較不同主成分數(shù)(PCs)對應的校正模型與驗證模型的結果,得出較佳的校正模型與驗證模型,具體結果如表2所示??梢钥闯?,在不同的光譜區(qū)域,采用不同的光譜數(shù)據(jù)預處理及不同的建模方法,為了獲得較佳的校正模型與驗證模型,需要采用不同的主成分數(shù)。比較不同建模方法的結果可以看出,無論在哪個光譜區(qū)域、采用哪種光譜數(shù)據(jù)預處理方法,基于PLS1方法建立的校正模型與驗證模型要優(yōu)于PLS2、PCR方法;而PLS2與PCR兩種方法的結果相對比較接近。
在全光譜區(qū)域(350~2 500 nm)內,無論采用哪種建模方法,當光譜數(shù)據(jù)未進行預處理或進行Baseline預處理時,建立的校正模型、驗證模型優(yōu)于對光譜數(shù)據(jù)進行一階導數(shù)或二階導數(shù)預處理的結果,而光譜數(shù)據(jù)未進行預處理時建立的模型與Baseline預處理后的結果差異較小。在1 300~2 050 nm光譜區(qū)域,當采用PLS1、PLS2建模方法時,對光譜數(shù)據(jù)未進行預處理或者Baseline預處理后建立的模型效果優(yōu)于一階導數(shù)或二階導數(shù)預處理后的結果;而采用PCR建模方法時,基于未處理的光譜數(shù)據(jù)建立的模型效果優(yōu)于進行數(shù)據(jù)預處理的結果。在2 050~2 500 nm光譜區(qū)域,當采用PLS1建模方法時,光譜數(shù)據(jù)進行一階導數(shù)預處理后建立的模型效果優(yōu)于其他的預處理方法,但采用PLS2、PCR建模方法時,光譜數(shù)據(jù)的預處理方法對最終的模型效果影響較小。
比較不同光譜區(qū)域模型的各項參數(shù)可以看出,當光譜數(shù)據(jù)未進行預處理時,基于1300~2050 nm光譜區(qū)域建立的模型效果優(yōu)于350~2 500 nm、2 050~2 500 nm區(qū)域,當光譜數(shù)據(jù)進行Baseline預處理后,基于350~2 500 nm光譜區(qū)域建立的模型效果優(yōu)于其他兩個光譜區(qū)域;而采用一階導數(shù)或二階導數(shù)預處理方法時,未體現(xiàn)出某個光譜區(qū)域的模型效果均優(yōu)于其他區(qū)域的一致規(guī)律。
從上述分析可以看出,光譜區(qū)域、預處理方法及建模方法對校正模型、驗證模型的結果均有較大的影響,在特定的光譜區(qū)域,要獲得較佳的模型效果,需要采用不同的光譜數(shù)據(jù)預處理方法,或者不同的建模方法。綜合比較不同光譜區(qū)域、不同預處理方法及不同建模方法的結果可以得出,當光譜區(qū)域為2050~2 500 nm、光譜數(shù)據(jù)進行一階導數(shù)預處理,且采用PLS1建模方法,主成分數(shù)為7時,建立的模型效果最佳,校正模型的相關系數(shù)r=0.997 8、均方根誤差為0.000 3、標準誤差為0.000 3,驗證模型r=0.736 0,均方根誤差為0.006 1、標準誤差為0.006 1。
根據(jù)建立的較佳校正模型、驗證模型,對未參與建模的未知樣本進行預測,并分析預測結果與實際測量結果的相關性,結果如表3所示。
表2 苯醇抽提物質量分數(shù)的近紅外光譜預測的校正模型與驗證模型各項參數(shù)
表3 對未知樣本的預測結果
可以看出,光譜區(qū)域、預處理方法及建模方法對最終的預測效果均有較顯著的影響,在350~2 500 nm、1 300~2 050 nm兩個光譜區(qū)域,當光譜數(shù)據(jù)未進行預處理或進行Baseline預處理時,預測效果優(yōu)于一階導數(shù)、二階導數(shù)預處理方法,而Baseline預處理方法的預測效果又稍優(yōu)于未處理方法;在2 050~2 500 nm光譜區(qū)域,當光譜數(shù)據(jù)未進行預處理或進行Baseline預處理時,預測效果劣于一階導數(shù)、二階導數(shù)預處理方法,這與另兩個光譜區(qū)域的規(guī)律相反。比較PLS1、PLS2及PCR建模方法之間的差異可以看出,無論在哪個光譜區(qū)域,采用哪種光譜數(shù)據(jù)預處理方法,基于PLS1建模方法建立的模型預測效果均最佳,PLS2方法次之,PCR方法的預測效果最劣。比較不同光譜區(qū)域之間的差異可以得出,針對PLS1方法,2 050~2 500 nm光譜區(qū)域的預測效果最佳;而對于PSL2、PCR兩種方法,預測效果的優(yōu)劣受光譜數(shù)據(jù)預處理方法影響,當采用未處理或Baseline的預處理方法時,1 300~2 050 nm光譜區(qū)域的預測效果優(yōu)于另兩個光譜區(qū)域,當采用一階導數(shù)或二階導數(shù)的預處理方法時,2 050~2 500 nm光譜區(qū)域的預測效果更優(yōu)。
綜合比較不同光譜區(qū)域、不同預處理方法及不同建模方法的預測結果可以得出,當光譜區(qū)域為2 050~2 500 nm、光譜數(shù)據(jù)進行一階導數(shù)預處理、采用PLS1的建模方法、主成分數(shù)為7時,建立的模型預測效果最佳,其預測結果與實測結果之間的相關系數(shù)為0.918 6。
應用近紅外光譜法對人工林楊木的苯醇抽提物質量分數(shù)進行了快速測定。用國家標準方法測定了42個楊木木材樣品的苯醇抽提物質量分數(shù),并用近紅外光譜儀(LabSpec Pro FR/A114260)測定相應的光譜。通過不同的光譜區(qū)域(350~2 500 nm、1 300~2 050 nm、2 050~2 500 nm)、不同的光譜預處理方法(未處理、Baseline、一階導數(shù)、二階導數(shù)預處理)及不同的建模方法(PLS1、PLS2、PCR),建立了相應的校正模型與驗證模型,并對未參與建模的未知樣本進行預測。結果得出:當光譜區(qū)域為2 050~2 500 nm、光譜數(shù)據(jù)進行一階導數(shù)預處理、采用PLS1建模方法、主成分數(shù)為7時,建立的校正模型預測效果最佳,校正模型的相關系數(shù)r=0.997 8、均方根誤差為0.000 3、標準誤差為0.000 3,驗證模型r=0.736 0,均方根誤差為0.006 1、標準誤差為0.006 1;未知樣本的預測結果與實測結果之間的相關系數(shù)為0.918 6。
[1]陸婉珍,袁洪福.現(xiàn)代近紅外光譜分析技術[M].北京:中國石化出版社,2000:4.
[2]Schimleck L R,Jones P D,Peter GF,et al.Nondestructive estimation of tracheid length from sections of radial wood strips by near infrared spectroscopy[J].Holzforschung,2004,58(4):375-381.
[3]Lestander T A,Lindeberg J,Eriksson D,et al.Prediction of Pinus sylvestris clear-wood properties using NIR spectroscopy and biorthogonal partial least squares regression[J].Canadian Journal of Forest Research,2008,38(7):2052-2062.
[4]Inagaki T,Schwanninger M,Kato R,et al.Eucalyptus camaldulensis density and fiber length estimated by near-infrared spectroscopy[J].Wood Science and Technology,2012,46(1/3):143-155.
[5]江澤慧,費本華,楊忠.光譜預處理對近紅外光譜預測木材纖維素結晶度的影響[J].光譜學與光譜分析,2007,27(3):435-438.
[6]王玉榮,費本華,傅峰,等.基于近紅外光譜技術預測木材纖維長度[J].中國造紙,2008,27(6):6-9.
[7]江澤慧,黃安民.木材中的水分及其近紅外光譜分析[J].光譜學與光譜分析,2006,26(8):1464-1468.
[8]張慧娟,李耀翔,張鴻富,等.基于近紅外光譜不同波段的紅松木材含水率預測分析[J].東北林業(yè)大學學報,2011,39(4):83-85.
[9]Alves A,Santos A,Rozenberg P,et al.A common near infraredbased partial least squares regression model for the prediction of wood density of Pinus pinaster and Larix×eurolepis[J].Wood Science and Technology,2012,46(1/3):157-175.
[10]李耀翔,張鴻富,張亞朝,等.基于近紅外技術的落葉松木材密度預測模型[J].東北林業(yè)大學學報,2010,38(9):27-30.
[11]黃安民,費本華,江澤慧,等.表面粗糙度對近紅外光譜分析木材密度的影響[J].光譜學與光譜分析,2007,27(9):1700-1702.
[12]Xu Q H,Qin M H,Ni Y H,et al.Predictions of wood density and module of elasticity of balsam fir(Abiesbalsamea)and black spruce(Picea mariana)from near infrared spectral analyses[J].Canadian Journal of Forest Research,2011,41(2):352-358.
[13]黃安民,王曉旭,楊忠,等.近紅外光譜應用于杉木木材強度分等的研究[J].光譜學與光譜分析,2011,31(4):975-978.
[14]Jones P D,Schimleck L R,Peter GF,et al.Nondestructive estimation of wood chemical composition of sections of radial wood strips by diffuse reflectance near infrared spectroscopy[J].Wood Science and Technology,2006,40(8):709-720.
[15]Poke F S,Wright JK,Raymond CA.Predicting extractives and lignin contents in Eucalyptus globulus using near infrared reflectance analysis[J].Journal of Wood Chemistry and Technology,2004,24(1):55-67.
[16]Gierlinger N,Schwanninger M,Hinterstoisser B,et al.Rapid determination of heartwood extractives in Larix sp.by means of Fourier transform near infrared spectroscopy[J].Journal of Near Infrared Spectroscopy,2002,10(4):203-214.
[17]馬曉龍.近紅外反射法在分析桉木中纖維素含量的應用研究[J].現(xiàn)代科學儀器,2006,23(5):81-83.
[18]黃安民,江澤慧,李改云.杉木綜纖維素和木質素的近紅外光譜法測定[J].光譜學與光譜分析,2007,27(7):1328-1331.
[19]Schwanninger M,Hinterstoisser B,Gierlinger N,et al.Application of Fourier Transform Near Infrared Spectroscopy(FT-NIR)to thermally modified wood[J].European Journal of Wood and Wood Products,2004,62(6):483-485.
[20]Green B,Jones P D,Nicholas D D,et al.Non-destructive assessment of Pinus sp.wafers subjected to Gloeophyllum trabeum in soil block decay tests by diffuse reflectance near infrared spectroscopy[J].Wood Science and Technology,2011,45(3):583-595.
[21]Kelley S S,Jellison J,Goodell B.Use of NIR and pyrolysis-MBMScoupled with multivariate analysis for detecting the chemical changes associated with brown-rot biodegradation of spruce wood[J].FEMSMicrobiology Letters,2002,209(1):107-111.
[22]楊忠.近紅外光譜預測人工林濕地松木材性質與腐朽特性的研究[D].北京:中國林業(yè)科學研究院,2005:79-114.
[23]王學順,戚大偉,黃安民.基于小波模極大值的木材近紅外光譜去噪[J].林業(yè)科學,2008,44(10):109-112.
[24]王學順,戚大偉,黃安民.木材近紅外光譜小波閾值去噪方法[J].東北林業(yè)大學學報,2009,37(2):32-34.
[25]王學順,戚大偉,黃安民.基于小波變換的木材近紅外光譜去噪研究[J].光譜學與光譜分析,2009,29(8):2059-2062.