潘屾 王克奇 梁玉亮 張怡卓
(東北林業(yè)大學,哈爾濱,150040)
木材基本密度獲取方法有傳統(tǒng)稱質量法、機械力密度檢測法、射線密度檢測法等[1]。傳統(tǒng)稱質量法測量結果準確,但是操作過程復雜,耗時長,且測量結果是板材的平均密度;機械力密度檢測法快速有效,但屬于破壞性實驗;射線密度檢測方法包括X射線和β射線等,能夠快速無損檢測木材密度,但是實驗環(huán)境要求嚴格,射線會對操作人員產生危害[2]。
近紅外光譜(NIR)承載著C—H、N—H、O—H、S—H等含氫基團振動的倍頻與合頻化學鍵信息,包含了絕大多數類型有機物組成和分子結構的豐富信息[3]。而木材密度與木材的化學組成、細胞構造密切相關[4],因此,可以利用近紅外技術建立光譜信息與木材基本密度的聯(lián)系。國內外學者已利用近紅外光譜分析技術開展了木材性質的研究[5-10],反映了木材近紅外光譜信息與木材的實際密度值之間不是單純的線性關系,非線性關系可以更好地表征二者之間的關系。
小波神經網絡(WNN),是將小波理論與人工神經網絡的思想相結合而形成的一種新的神經網絡[11];是在傳統(tǒng)BP的結構基礎上,將小波基作為隱含層節(jié)點的傳遞函數,信號前向傳播的同時誤差反向傳播的神經網絡。考慮木材基本密度與近紅外光譜的非線性關系,本研究將小波神經網絡方法運用到木材基本密度建模中,實現(xiàn)木材基本密度的準確識別。
試材采自黑龍江省五常市林業(yè)局沖河林場,地理坐標北緯44°37′55″~44°47′52″、東經127°35′55″~127°55′51″,平均海拔350 m。該地區(qū)屬溫帶大陸性季風氣候,最高氣溫35 ℃,最低氣溫-34 ℃,年平均氣溫2.3 ℃;年降水量750 mm;土壤以暗棕壤為主,谷地草甸土和沼澤土僅少量分布。在柞木人工林內,取6株樣木,樹齡20 a,伐倒并標記樹木生長方向,在每株標準木的胸高(1.3 m)附近連續(xù)截取5 cm圓盤。帶回實驗室將每個圓盤去皮后,按照國家標準GB 1929—2009制取20 mm×20 mm×20 mm的密度試樣,并挑選出無缺陷、無明顯顏色差異試樣120個。
實驗中選用INSION公司超緊湊型近紅外光纖光譜儀及其開發(fā)的SPEC view 7.1軟件,對木材樣本進行光譜掃描,光譜波長范圍900~1 700 nm,分辨率9 nm,使用兩分叉光纖探頭采集樣品表面的近紅外光譜。實驗室溫度、濕度基本恒定,室內溫度控制在20 ℃,平均相對濕度為50%。光纖探頭固定在支架上,探頭對試樣垂直、非接觸測量,距離1 mm,光斑直徑5 mm,每個切面均勻采集5個樣點,每點掃描30次自動平均為1個光譜。
柞木基本密度按照國家標準GB 1933—2009《木材密度測定方法》進行測定(見表1)。在120個試樣中,以2∶1分為校正集和預測集,其中密度最大和最小樣品歸為校正集,以80個校正集樣品建立校正模型,剩余40個作為預測集對模型進行驗證。密度值范圍0.699 3~0.836 4 g/cm3,預測集樣品密度信息被校正集樣品密度信息所覆蓋。
表1 樣本基本密度匯總
由于小波神經網絡獨特的數學理論,因此,小波神經網絡具有較多組合的學習方法和表現(xiàn)形式。小波神經網絡的基本結構如圖1所示。
圖1 小波神經網絡結構
小波神經網絡的結構由輸入層、隱含層、輸出層構成,小波神經網絡采用某一小波函數為激勵函數,本文選取Morlet小波作為傳遞函數[13],小波神經網絡的具體描述如下。
式中:xks為第s個輸入樣本的第i維取值;yis為第s個神經網絡輸出的第i維取值;wij為中間隱含層到輸出層的權值;rjk為輸入層到隱含層的權值;aj、bj為隱含層的伸縮和平移因子;dis為第s個實際輸出樣本的第i維取值;E為誤差函數;ui為網絡的偏置。
具體訓練步驟:
①網絡初始化,隨機化伸縮因子、平移因子及網絡連接權重,設置網絡學習速率,迭代次數n=0。載入輸入/輸出樣本P、T,得到歸一化輸入和輸出X、Y。
②輸入下一個樣本,計算神經網絡的輸出。
對G(n)初始化,神經網絡的隱含層、輸出矩陣為:
對W(n)進行初始化,神經網絡的輸出層:
③采用BP算法進行修正W(n)和G(n):
則神經網絡總的誤差輸出:
神經網絡W(n)的修正方法:
W(n+1)=W(n)-η(?E(n)/?W(n))。
輸出層系數G(n)的修正方法:
G(n+1)=G(n)-η(?E(n)/?G(n))。
式中:W(n)取1~n列。
④判斷算法結束與否,若迭代結束,則輸出結果,否則返回②。
在光譜波長900~1 700 nm范圍內,采用蒙特卡洛采樣法剔除奇異樣本,校正集共有80個樣本。利用蒙特卡洛采樣法(MCS),循環(huán)2000次得到每個樣本預測殘差的均值-方差分布圖(見圖2),樣本8、23、37、52、64、72偏離大多數樣本計算結果,這6個樣本是奇異樣本。對3種奇異點剔除算法選出的樣本、不進行奇異點剔除的樣本,分別建立偏最小二乘回歸模型(見表2)。
圖2 MCS法樣本預測殘差的均值-方差分布
異點剔除算法建模樣本校正集相關系數均方根誤差預測集相關系數均方根誤差無80個樣本0.8620.02960.8460.0317杠桿值剔除樣本8、17、23、37、520.9060.02710.8730.0290半數重采樣法剔除樣本8、23、37、44、59、720.9160.02580.8920.0281蒙特卡洛采樣法剔除樣本8、23、37、52、64、720.9250.02340.9040.0275
選用Savitzky-Golay卷積平滑算法(簡稱S-G平滑),分別與導數法、標準正態(tài)變換、多元散射校正結合,對柞木樣本光譜進行預處理(見圖3)。由圖3可見:導數光譜可以更清晰直觀的看出光譜變化趨勢及光譜波峰,矢量歸一化(SNV)和MSC可以去除光譜漂移。但是,由于本實驗中全光譜波長數為117 nm,而導數計算對于波長數較少的情況存在較大的誤差;柞木基本密度變化范圍較窄;因此,對比上述4種方法,采用MSC和S-G平滑的預處理更適合本文的研究對象。
圖3 不同預處理方法的柞木光譜圖
根據文獻[14],將BiPLS-SPA算法優(yōu)選出的6個光譜波長吸光度作為模型的輸入向量,分別建立偏最小二乘法(PLS)、BP神經網絡和WNN模型。
小波神經網絡隱層節(jié)點數的設置會對網絡性能產生影響,節(jié)點數過多訓練時間過長,節(jié)點數過少又達不到預期效果。通過經驗值和訓練實驗分析,將隱層節(jié)點設置為6,小波基函數為Morlet函數,學習速率為0.01,期望誤差為0.001,學習次數為1 000,建立小波神經網絡模型對預測集樣本進行驗證(見圖4)。
圖4 小波網絡模型預測散點分布
對預測集的40個樣本進行實驗(見表3),PLS模型校正集與預測集的結果較穩(wěn)定,表明柞木基本密度和近紅外光譜之間存在較強的線性關系;BP網絡的建模效果最好,但是預測結果卻較差,說明BP神經網絡對訓練樣本極為依賴,對局部的優(yōu)化使其推廣性受到制約;WNN的結果最好,預測集相關系數達到0.968,預測均方根誤差為0.014 4。說明WNN很好的表達了基本密度與近紅外光譜間的關系;同時,WNN在學習的過程中可克服過擬合,具有泛化能力。
表3 不同建模方法的結果與比較
由于木材基本密度與近紅外光譜存在著一定的非線性關系,本文應用WNN構建了柞木基本密度預測模型。建模過程中,通過光譜預處理奇異值剔除,保證了樣本可靠性。通過WNN與BP、PLS建模比較,驗證了WNN可以克服BP的過擬合,提高基本密度預測泛化能力,預測結果具有較高的準確性。與線性的偏最小二乘和應用較多的BP神經網絡模型相比,實驗結果表明:PLS模型校正集與預測集的結果穩(wěn)定,是由于柞木基本密度和近紅外光譜之間有線性關系存在;BP神經網絡對校正集預測結果較好,但對預測集樣本預測能力較差,是由于BP神經網絡對訓練樣本極為依賴。而小波神經網絡的預測結果最好,為近紅外光譜預測木材基本密度提供了新的思路。在建模過程中,運用MSC可有效的剔除異常點,運用S-G平滑方法進行預處理可以消除散射效應與噪聲的影響。
[1] 孫燕良,張厚江,朱磊,等.木材密度檢測方法研究現(xiàn)狀與發(fā)展[J].森林工程,2011,27(1):23-26.
[2] 李麗,撒潮,龐友會,等.基于β射線的單板密度檢測實驗[J].林業(yè)機械與木工設備,2008,36(5):10-12.
[3] 陸婉珍.現(xiàn)代近紅外光譜分析技術[M].北京:中國石化出版社,2007.
[4] 劉一星,趙廣杰.木材學[M].北京:中國林業(yè)出版社,2012.
[5] SCHIMLECK L R, DOWNES G M, EVANS R. Estimation of eucalyptus nitens wood properties by near infrared spectroscopy[J]. Appita Journal,2006,59(2):136-141.
[6] SANTOS A J A, ALVES A M M, SIMES R M S,et al. Estimation of wood basic density ofAcaciaMelanoxylon(R. Br.) by near infrared spectroscopy[J]. Journal of Near Infrared Spectroscopy,2012,20(2):267-274.
[7] JONES P D, SCHIMLECK L R, PETER G F, et al. Nondestructive estimation ofPinustaedaL. wood properties for samples from a wide range of sites in Georgia[J]. Canadian Journal of Forest Research,2005,35(1):85-92.
[8] ALVES A, SANTOS A, ROZENBERG P, et al. A common near infrared-based partial least squares regression model for the prediction of wood density ofPinuspinasterandLarix×eurolepis[J]. Wood Science and Technology,2012,46(1/2/3):157-175.
[9] 江澤慧,黃安民,王斌.木材不同切面的近紅外光譜信息與密度快速預測[J].光譜學與光譜分析,2006,26(6):1034-1037.
[10] 李耀翔,張鴻富.非線性算法在近紅外預測木材密度中的應用研究[J].森林工程,2012,28(5):38-41.
[12] BARNES R J, DHANOA M S, LISTER S J. Standard normal variate transformation and de-trending of near-infrared diffuse reflectance spectra[J]. Applied Spectroscopy,1989,43(5):772-777.
[13] TABARAKI R, KHAYAMIAN T, ENSAFI A A. Solubility prediction of 21 azo dyes in supercritical carbon dioxide using wavelet neural network[J]. Dyes and Pigments,2007,73(2):230-238.
[14] 張怡卓,涂文俊,李超.基于BiPLS-SPA優(yōu)選近紅外光譜的木材基本密度預測:以柞木為例[J].東北林業(yè)大學學報,2016,44(10):79-83.