王志遠(yuǎn),李耀翔,張哲宇
(東北林業(yè)大學(xué) 工程技術(shù)學(xué)院,黑龍江 哈爾濱 150040)
近紅外分析技術(shù)憑借著快速方便、綠色無(wú)損的優(yōu)勢(shì)在農(nóng)業(yè)、食品藥品以及石油化工等產(chǎn)業(yè)快速發(fā)展,獲得了科研人員的青睞[1-3]。在林業(yè)方面,近紅外被應(yīng)用于木材的物理、化學(xué)、力學(xué)性能的測(cè)定[4],Chen 等[5]提出了一種利用Vis-NIR 高光譜成像和改進(jìn)隨機(jī)青蛙算法(MRF)預(yù)測(cè)木材含水率的新方法;曾韋珊等[6]利用近紅外光譜技術(shù)建立了濕加松針葉兒茶素和表兒茶素總量的模型;Chen 等[7]采用正交偏最小二乘法(OPLS)和連續(xù)投影算法(SPA)提取有效光譜,并采用混合偏最小二乘法(MIX-PLS)建立預(yù)測(cè)木材彈性模量的模型;蔡紹祥等[8]通過(guò)傅里葉變換紅外光譜分析木材細(xì)胞壁化學(xué)成分變化情況,研究不同木材化學(xué)成分對(duì)細(xì)胞壁靜態(tài)黏彈性的影響。為保證近紅外技術(shù)預(yù)測(cè)結(jié)果的準(zhǔn)確性,需要盡可能地減少各種因素對(duì)近紅外光譜的影響,其中主要因素包括實(shí)驗(yàn)樣品因素、儀器因素、實(shí)驗(yàn)操作人員因素。
近紅外儀器是近紅外分析的基礎(chǔ)硬件,按分光類(lèi)型可分為濾光片型、光柵色散型、傅里葉變換型等,按應(yīng)用類(lèi)型分為實(shí)驗(yàn)室型、便攜型和工業(yè)在線(xiàn)型。不同類(lèi)型的儀器會(huì)產(chǎn)生較大差異,即使在測(cè)量相同材料時(shí)也會(huì)產(chǎn)生略有不同的光譜。Yap 等[9]提出的自適應(yīng)人工神經(jīng)網(wǎng)絡(luò)算法可以在沒(méi)有標(biāo)準(zhǔn)樣品參與的情況下將主儀器的模型轉(zhuǎn)移到其他儀器上,降低了校準(zhǔn)模型的成本;Mcvey等[10]比較了臺(tái)式近紅外儀器、便攜式近紅外儀器和手持SCIO 儀器3 種儀器預(yù)測(cè)芫荽種子真實(shí)性的能力,與臺(tái)式近紅外儀器相比,另外2 種儀器存在一些局限性;Wolfrum 等[11]比較了常規(guī)實(shí)驗(yàn)室近紅外(NIR)光譜儀和兩個(gè)低成本NIR 光譜儀的性能,表明與傳統(tǒng)的實(shí)驗(yàn)室光譜儀相比,使用光譜范圍有限的低成本光譜儀具有很大的前景。
實(shí)驗(yàn)操作人員裝樣方式的選取、制樣方法的不同、采集樣品的方式、操作熟練度等都會(huì)在一定程度上影響模型精度。Costa 等[12]發(fā)現(xiàn)不同的光譜采集技術(shù)對(duì)近紅外模型預(yù)測(cè)木材密度具有影響,由積分球采集的光譜生成的NIR 模型比光纖具有更好的統(tǒng)計(jì)數(shù)據(jù);Dos Santos 等[13]同樣分析了積分球采集和光纖采集對(duì)建立近紅外光譜模型預(yù)測(cè)木材含水量的影響,結(jié)果顯示用積分球在木材表面上采集的近紅外光譜最適合生成用于估計(jì)桉樹(shù)木材含水量的近紅外模型;Li 等[14]研究了在不同的角度采集光譜對(duì)預(yù)測(cè)結(jié)果的影響,證明90°角(橫向)模型或混合角度模型可以為基本密度預(yù)測(cè)提供一個(gè)可靠的結(jié)果。實(shí)驗(yàn)結(jié)果在很大程度上取決于操作員的經(jīng)驗(yàn)和知識(shí),根據(jù)標(biāo)準(zhǔn)和使用指南進(jìn)行操作,可以減少不同批次實(shí)驗(yàn)的誤差[15]。
實(shí)驗(yàn)樣品因素是比較主要的影響因素,樣品的含水率、溫度以及化學(xué)成分組成都會(huì)不同程度影響光譜的準(zhǔn)確性。Ayanleye 等[16]發(fā)現(xiàn)木材表面狀況會(huì)極大地影響預(yù)測(cè)模型的性能,當(dāng)木材表面粗糙時(shí),可以獲得更好的性能;黃安民等[17]證明建立不同粗糙度的混合預(yù)測(cè)模型可以減少粗糙度對(duì)模型的影響,提高模型的穩(wěn)健性;Kunze 等[18]證明外部參數(shù)正交化(EPO)可以校正不同水分條件下巴西本土樹(shù)種木材光譜中水分的影響,并通過(guò)PLS-DA 判別模型進(jìn)行分析,在PLS-DA 識(shí)別樣本時(shí)采用更靈活的標(biāo)準(zhǔn)也有利于減少誤差。樣品的粒徑已被證明對(duì)濕化學(xué)分析、化學(xué)降解和光譜信息的結(jié)果有很大影響[19]。Wu 等[20]研究了不同粒徑對(duì)土壤有機(jī)質(zhì)光譜預(yù)測(cè)的影響,發(fā)現(xiàn)混合樣品可以提高土壤樣品的表面反射率,增加與土壤有機(jī)質(zhì)的相關(guān)性。
為了去除一些無(wú)關(guān)信息或噪聲的影響,提高模型的預(yù)測(cè)精度,選擇合適的儀器、光譜范圍、建模方法、光譜預(yù)處理和代表性樣品至關(guān)重要。Li等[21]在提升小波變換的基礎(chǔ)上,利用雙正交小波對(duì)最優(yōu)變換的光譜進(jìn)行分解;Pasquini 等[22]評(píng)估了一種可提高緊湊型近紅外分光光度計(jì)性能的旋轉(zhuǎn)線(xiàn)性樣品探測(cè)裝置,該裝置使測(cè)量過(guò)程中評(píng)估的樣本量最大化,提供了更具代表性的平均光譜,顯著改善了多元回歸結(jié)果;Wu 等[23]提出了一種改進(jìn)加權(quán)乘法散射校正算法進(jìn)行變量選擇,與其他校正方法相比,其可以提供更好的預(yù)測(cè)性能。
木材的基本密度是一項(xiàng)重要的物理性質(zhì),與其力學(xué)性能息息相關(guān),在木材加工利用和干燥防腐中具有實(shí)際意義[14]。本研究以東北地區(qū)的落葉松為研究對(duì)象,分析不同表面粗糙度對(duì)近紅外光譜技術(shù)預(yù)測(cè)落葉松木材基本密度的影響,采用波段選擇的方法優(yōu)選出特征波段,根據(jù)優(yōu)選波段建立基本密度預(yù)測(cè)模型,達(dá)到優(yōu)化近紅外模型的目的,減小表面粗糙度對(duì)預(yù)測(cè)精度的影響。
試驗(yàn)樣本采自黑龍江省方正縣高楞鎮(zhèn)星火林場(chǎng)(N45°43′5.73″,E129°13′34.37″)。星火林場(chǎng)的土壤類(lèi)型為暗棕壤森林土,在落葉松天然次生林區(qū),分別設(shè)立4 塊大小為20 m×20 m 的樣地,在每塊樣地的向陽(yáng)面和背陰面隨機(jī)選取一棵標(biāo)準(zhǔn)木;伐倒后,用電鋸自標(biāo)準(zhǔn)木胸徑(胸高1.3 m 處)開(kāi)始,向上連續(xù)鋸截5 cm 左右圓盤(pán),在實(shí)驗(yàn)室對(duì)木圓盤(pán)進(jìn)行手工剝皮后,過(guò)樹(shù)芯由北向南鋸截2 cm×2 cm×3 cm 的木塊,共計(jì)120 個(gè)落葉松木塊樣品,記錄每個(gè)樣本標(biāo)號(hào)。
根據(jù)《木材密度測(cè)定方法》(GB/T 1933—2009)的標(biāo)準(zhǔn),采用排水法對(duì)落葉松樣品進(jìn)行基本密度的測(cè)定。采用SPXY(sample set partitioning based on joint x-y distances)方法對(duì)120 個(gè)樣品進(jìn)行劃分,將自變量與因變量相結(jié)合以選擇具有代表性的樣本,由K-S (Kennard-Stone)方法進(jìn)一步發(fā)展而來(lái)[24]。樣本集中2/3 為校正集,1/3 為驗(yàn)證集。測(cè)得的120 個(gè)落葉松樣品基本密度在0.347 3 ~0.513 8 g?cm-3之間,平均值為0.421 3 g?cm-3,標(biāo)準(zhǔn)差為0.045 17 g?cm-3(表1)。
開(kāi)發(fā)綠色能源,實(shí)現(xiàn)綠色建設(shè),是現(xiàn)階段國(guó)家發(fā)展的重要戰(zhàn)略目標(biāo)。光伏發(fā)電,是一種可再生的綠色清潔能源,能有效緩解我國(guó)在經(jīng)濟(jì)建設(shè)中的能源匱乏問(wèn)題[1]。簡(jiǎn)單來(lái)說(shuō),光伏發(fā)電就是將太陽(yáng)能轉(zhuǎn)化成電力,方便人們的生產(chǎn)生活。光伏發(fā)電與煤炭發(fā)電不同,光伏發(fā)電不會(huì)產(chǎn)生垃圾、有毒物,不會(huì)出現(xiàn)資源浪費(fèi),且是取之不盡,用之不竭的。而電氣自動(dòng)化能夠有效提高太陽(yáng)能利用效率,通過(guò)對(duì)電氣自動(dòng)化在太陽(yáng)能光伏發(fā)電中的應(yīng)用研究,解決我國(guó)在資源配置方面遇到的各種問(wèn)題。
MS是一種罕見(jiàn)的發(fā)生于骨髓外的由未成熟髓細(xì)胞構(gòu)成的局限性實(shí)體腫瘤,可發(fā)生于人體的任何部位,尤其是皮膚、淋巴結(jié)、軟組織和骨骼等。MS可作為一種獨(dú)立的腫瘤存在,但更常見(jiàn)于AML患者中,尤其是M4、M5和M2亞型。APL是一種以出血為主的特殊類(lèi)型急性髓系白血病,髓外浸潤(rùn)也比較少見(jiàn),且常累及中樞神經(jīng)系統(tǒng),其次是皮膚、耳道、鼻咽、睪丸和淋巴結(jié)等。至今以MS合并APL尤其是MS作為APL首發(fā)癥狀的病例報(bào)告較少,國(guó)內(nèi)外也僅為個(gè)別病例報(bào)告(表 1)[3-13]。
表1 樣品基本密度統(tǒng)計(jì)Table 1 Basic density statistics of the wood samples
不同表面粗糙度的近紅外光譜圖吸光度產(chǎn)生了差異,大體上呈現(xiàn)表面越粗糙其吸光度越高的趨勢(shì)。砂紙目數(shù)越高,其表面打磨也越光滑。如圖1 所示,在波長(zhǎng)1 350 ~2 500 nm 之間,M2 的樣品吸光度最低,M0 的樣品吸光度最高,即樣品Ra值越高,樣品吸光度越高。在波長(zhǎng)350~1 350 nm之間,M1 的吸光度仍高于M2 樣品,而M0 的樣品吸光度處于兩者之間。落葉松樣品近紅外光譜采集方式是漫反射方式,樣品表面越光滑,光的反射率越大;隨著樣品表面粗糙度的增加,光經(jīng)過(guò)多次的反射、折射、衍射攜帶的相關(guān)信息會(huì)增加。因此,樣品表面粗糙度對(duì)近紅外光譜產(chǎn)生較大影響,進(jìn)而影響近紅外光譜分析技術(shù)的預(yù)測(cè)能力。
福建亞通新材料科技股份有限公司創(chuàng)建于1994年,是一家專(zhuān)業(yè)從事塑料管道產(chǎn)品研究和制造的國(guó)家級(jí)重點(diǎn)高新技術(shù)企業(yè)。亞通產(chǎn)品主要用于市政建設(shè)(道路、通信、電力、燃?xì)?、供水、排水、排污等基礎(chǔ)設(shè)施建設(shè))、水務(wù)投資運(yùn)營(yíng)(城市供水、排污、輸水管網(wǎng)建設(shè)改造)、建筑工程、農(nóng)業(yè)節(jié)水排灌系統(tǒng)、現(xiàn)代園藝等各種領(lǐng)域,產(chǎn)品種類(lèi)及配套之全,位居全國(guó)同行業(yè)領(lǐng)先地位。
此時(shí)期是小麥病蟲(chóng)害防治的關(guān)鍵期,主要病害以小麥銹病和小麥紋枯病為主,蟲(chóng)害有螻蛄、金針蟲(chóng)等。該時(shí)期病蟲(chóng)害較多,需加強(qiáng)對(duì)麥田的監(jiān)測(cè),防治措施以物理和化學(xué)防治相結(jié)合,如及時(shí)拔除雜草、針對(duì)性的噴灑農(nóng)藥等。
同一落葉松樣品在M0、M1 以及M2 的條件下,表面粗糙度不同,其近紅外光譜的線(xiàn)形圖(圖1)并無(wú)較大差異,且均在波長(zhǎng)為1 415、1 892、2 056 nm 處出現(xiàn)了明顯的吸收峰,與李耀翔等[25]的研究結(jié)果基本一致。
圖1 不同表面粗糙度下的木材近紅外光譜Fig. 1 NIR spectra of wood with different surface roughness
試驗(yàn)采用美國(guó)ASD 公司的LabSpec? Pro FR /A114260 便攜式物質(zhì)成分分析光譜儀測(cè)量近紅外光譜。該儀器可選擇的光譜范圍為350 ~2 500 nm,光譜分辨率為3 nm @700 nm、10 nm@1 400 nm 和2 100 nm。光譜采樣間隔為1.4 nm@350 ~1 050 nm、2 nm @1 000 ~2 500 nm。
盡管?chē)?guó)際經(jīng)濟(jì)出現(xiàn)復(fù)蘇,但全球性貿(mào)易仍然繼續(xù)震蕩,歐元區(qū)經(jīng)濟(jì)增速放緩,新興市場(chǎng)經(jīng)濟(jì)動(dòng)蕩加劇,加上西方一些國(guó)家所設(shè)的各種經(jīng)濟(jì)壁壘,國(guó)際林產(chǎn)品市場(chǎng)競(jìng)爭(zhēng)激烈,我國(guó)木材制品出口仍較困難。隨著“一帶一路”倡議的推進(jìn),深圳、成都、鄭州等多個(gè)城市相繼開(kāi)通中歐班列,由于班列運(yùn)輸時(shí)間比海運(yùn)縮短三分之二,價(jià)格是空運(yùn)的四分之一,因而加速我國(guó)木材加工產(chǎn)品對(duì)“一帶一路”沿線(xiàn)國(guó)家的出口速度,前3季度我國(guó)的刨花板和膠合板出口數(shù)量都實(shí)現(xiàn)了增長(zhǎng)。纖維板的出口數(shù)量下降不少,但出口金額降幅收窄,木家具出口數(shù)量有增長(zhǎng),但出口金額基本與去年同期持平。
近紅外光譜在采集過(guò)程中容易攜帶無(wú)關(guān)噪聲,對(duì)近紅外光譜分析產(chǎn)生影響,因此需要對(duì)近紅外光譜原始數(shù)據(jù)進(jìn)行預(yù)處理,以此來(lái)獲得具有高信噪比和低背景干擾的近紅外信號(hào)。常見(jiàn)的預(yù)處理方法包括移動(dòng)平均平滑、SG 平滑、導(dǎo)數(shù)處理、基線(xiàn)校正(baseline)、MSC、SNV 等方法。
通過(guò)對(duì)比實(shí)驗(yàn)得到的沖擊端應(yīng)力曲線(xiàn)和D-R-PH模型的結(jié)果,表明了利用該方法對(duì)于確定泡沫材料的動(dòng)態(tài)參數(shù)具有較高的可行性和準(zhǔn)確性。通過(guò)對(duì)比準(zhǔn)靜態(tài)實(shí)驗(yàn)的應(yīng)力-應(yīng)變曲線(xiàn),可以從實(shí)驗(yàn)的角度得到不管泡沫鋁是何種相對(duì)密度,它都是一種沖擊速率相關(guān)的材料的結(jié)論。
為模擬木材在加工過(guò)程中其表面未加工、粗加工、精加工的情況,對(duì)含水率12%的落葉松樣品設(shè)置3 種不同的表面粗糙度條件,分別為未打磨(M0)、150 目砂紙打磨(M1)、320 目砂紙打磨(M2)。以M0 樣品作為對(duì)照組,在室溫20 ℃、空氣濕度50%條件下使用二分光纖探頭對(duì)樣品橫截面兩個(gè)不同位置進(jìn)行光譜采集;之后以150 目砂紙對(duì)樣品連續(xù)打磨30 次,打磨完后在相同條件下采集近紅外光譜;完成150 目打磨后以320 目砂紙對(duì)樣品連續(xù)打磨30 次,仍以相同方式采集光譜。在采集光譜過(guò)程中,設(shè)置采集次數(shù)為30 次,采集間隔為1 nm,每采集3 ~5 個(gè)樣品,需要對(duì)準(zhǔn)聚四氟乙烯標(biāo)準(zhǔn)白板進(jìn)行校準(zhǔn)。將得到的光譜數(shù)據(jù)導(dǎo)入到ViewSpec Pro 軟件和The Unscrambler X 10.4 (64-bit) 軟件中進(jìn)行處理,涉及到的算法均在MATLAB R2017a 軟件上操作。
從圖1 可以看到,在350 nm 附近和2 500 nm附近包含大量噪聲等無(wú)用信息,為提高建模精度和速度,選擇波段600 ~2 200 nm 這部分光譜進(jìn)行后續(xù)的處理和建模。本研究主要討論11 點(diǎn)移動(dòng)平均平滑、SG 平滑和基線(xiàn)校正這3 種預(yù)處理方法對(duì)預(yù)測(cè)模型的影響。不同表面粗糙度的樣品使用不同光譜預(yù)處理的效果如表2 所示。M0 的樣品使用原始光譜建立的回歸模型的校正集相關(guān)系數(shù)(Rc)為0.882 3,校正集均方根誤差(RMSEC)為0.020 7,驗(yàn)證集相關(guān)系數(shù)(Rp)為0.854 8,RMSEP為0.023 6。采用11 點(diǎn)平滑、基線(xiàn)校正及SG 平滑進(jìn)行預(yù)處理的光譜建立的回歸模型,其Rc均低于原始光譜,11 點(diǎn)平滑和SG 平滑預(yù)處理的Rp均高于原始光譜,11 點(diǎn)平滑的RMSEP為0.023 4,SG 平滑的RMSEP為0.023 5。
表2 基于不同預(yù)處理的不同表面粗糙度落葉松基本密度預(yù)測(cè)模型Table 2 Prediction models for basic density of larch based on different pretreatments of different surface roughness samples
M1 的樣品采用原始光譜建立的回歸模型的Rc為0.837 9,RMSEC為0.025 1,Rp為0.675 4,RMSEP為0.024 6。在3 種預(yù)處理方法中,11 點(diǎn)平滑處理的效果較差,校正集與驗(yàn)證集的結(jié)果都不理想,基線(xiàn)校正與SG 平滑的Rc和Rp都好于原始光譜,RMSEP分別為0.023 7 和0.024 0。
BiPLS 是在iPLS 基礎(chǔ)之上提出的特征波段選擇方法,其將整個(gè)光譜區(qū)劃分為若干個(gè)等寬的區(qū)間,之后基于全光譜建立回歸模型。以交叉驗(yàn)證均方根誤差RMSECV為評(píng)價(jià)指標(biāo),每次剔除一個(gè)區(qū)間,以剔除后剩下的區(qū)間為基礎(chǔ)建立PLS 模型,以此反復(fù)直至剩下最后一個(gè)區(qū)間,然后以RMSECV最小的區(qū)間組合作為特征波段建立PLS 回歸模型。
M2 的樣品采用原始光譜方法建立的模型效果最好,優(yōu)于其他預(yù)處理方法,Rc為0.806 5,RMSEC為0.027 0,Rp為0.698 1,RMSEP為0.028 5。采用11 點(diǎn)平滑和SG 平滑處理的光譜建立的驗(yàn)證模型相關(guān)系數(shù)為0.696 1 和0.696 3,均略低于原始光譜的Rp,RMSEP均為0.028 5。
“柳哥人才可惜了啊。”寢室二床說(shuō)道,“柳哥這成績(jī),出國(guó)拿全獎(jiǎng),畢業(yè)美利堅(jiān)?。 碑?dāng)然,這都是大學(xué)寢室里沒(méi)有任何惡意、近乎習(xí)慣的互捧。
在表面粗糙度不同的條件下,各個(gè)預(yù)處理方法對(duì)回歸模型的預(yù)測(cè)能力產(chǎn)生的效果各不一樣。針對(duì)M0 樣品SG 平滑的預(yù)處理效果與11 點(diǎn)平滑法差別不大;M1 樣品中SG 平滑的預(yù)處理效果略遜于基線(xiàn)校正,優(yōu)于其他方法;M2 樣品中3 種預(yù)處理方法對(duì)預(yù)測(cè)模型均無(wú)較大改善,預(yù)處理的效果與原始光譜相差不大,其中 SG 平滑預(yù)處理表現(xiàn)較好。綜合考慮,采用SG 平滑建模的效果略好于原始光譜、11 點(diǎn)平滑、基線(xiàn)校正這3 種預(yù)處理方法,因此,采用SG 平滑預(yù)處理后的光譜進(jìn)行接下來(lái)的波段選擇和建模。
近紅外光譜數(shù)據(jù)通常包含成百上千個(gè)數(shù)據(jù)點(diǎn),在建立近紅外光譜模型時(shí)全光譜數(shù)據(jù)一般攜帶大量冗余信息,從而影響建模的速度和準(zhǔn)確性。為了減少大量重疊的無(wú)用信息對(duì)多元校正模型的干擾,對(duì)原始全波段光譜數(shù)據(jù)進(jìn)行選擇,篩選出共線(xiàn)性少、冗余信息少且包含主要有效信息的波段。目前應(yīng)用較為廣泛的特征波段選擇方法包括間隔偏最小二乘法(iPLS)、反向區(qū)間偏最小二乘法(BiPLS)、聯(lián)合區(qū)間偏最小二乘法(SiPLS)和移動(dòng)窗口偏最小二乘法(MWPLS)等。
實(shí)驗(yàn)組患者中有1例患者唾液增多,有1例患者失眠,不良反應(yīng)發(fā)生率為12.5%;對(duì)照組患者中有1例患者唾液增多,有2例患者心動(dòng)過(guò)速,有1例患者嗜睡,不良反應(yīng)發(fā)生率為25.0%。實(shí)驗(yàn)組明顯低于對(duì)照組,兩組差異對(duì)比具有統(tǒng)計(jì)學(xué)意義,P<0.05。
SiPLS 方法在均勻劃分的m個(gè)等寬區(qū)間中隨機(jī)選取n個(gè)區(qū)間組成聯(lián)合區(qū)間并建立PLS 模型,這種方法彌補(bǔ)了iPLS 單一區(qū)間容易造成光譜信息遺漏的缺點(diǎn),比較不同模型的效果,選擇其中RMSECV最小的聯(lián)合區(qū)間作為特征波段。由于SiPLS的計(jì)算量比較大,通常區(qū)間n的數(shù)量不超過(guò)5 個(gè)。
采用BiPLS 方法進(jìn)行波段選擇,為了減少區(qū)間數(shù)量對(duì)預(yù)測(cè)結(jié)果的影響,將全光譜數(shù)據(jù)劃分為20 ~40 個(gè)區(qū)間,優(yōu)選出RMSECV值最小的區(qū)間數(shù)。當(dāng)區(qū)間數(shù)為36 時(shí),M0 樣品的RMSECV值最小為0.026 7,選取了220 個(gè)特征波長(zhǎng)點(diǎn),對(duì)應(yīng)的波段為1 629 ~1 716、1 849 ~1 892、2 025 ~2 068、2 113 ~2 156 nm(圖2a);當(dāng)區(qū)間數(shù)為38 時(shí),M1 樣品的RMSECV值最小為0.023 4,選取了464 個(gè)特征波長(zhǎng)點(diǎn),對(duì)應(yīng)的波段為600 ~642、772 ~856、983 ~1 108、1 277 ~1 318、1 613 ~1 654、1 865 ~1 906、2 117 ~2 200 nm(圖3a);當(dāng)區(qū)間數(shù)為29 時(shí),M2 樣品的RMSECV值最小為0.025 9,選取了663 個(gè)特征波長(zhǎng)點(diǎn),對(duì)應(yīng)的波段為600 ~655、768 ~823、880 ~990、1 101 ~1 210、1 321 ~1 430、1 541 ~1 595、1 926 ~2 090 nm(圖4a)。
圖2 M0 樣品波段區(qū)間優(yōu)選Fig. 2 Band interval optimization of the M0 sample
圖3 M1 樣品波段區(qū)間優(yōu)選Fig. 3 Band interval optimization of the M1 sample
圖4 M2 樣品波段區(qū)間優(yōu)選Fig. 4 Band interval optimization of the M2 sample
采用SiPLS 方法進(jìn)行波段選擇,將全光譜數(shù)據(jù)分別劃分為15、20、25、30 和35 共5 個(gè)區(qū)間數(shù),并且在區(qū)間內(nèi)分別選擇2、3、4 個(gè)區(qū)間進(jìn)行組合,同樣優(yōu)選出RMSECV值最小的區(qū)間組合。當(dāng)區(qū)間數(shù)為20、組合區(qū)間數(shù)為3 時(shí),M0 樣品的RMSECV值最小為0.022 7,選取波段為1 135 ~1 348、1 670 ~1 776 nm(圖2b);當(dāng)區(qū)間數(shù)為15、組合區(qū)間數(shù)為4 時(shí),M1 樣品的RMSECV值最小為0.021 4,選取波段為707 ~920、1 242 ~1 348、1 456 ~1 562 nm(圖3b);當(dāng)區(qū)間數(shù)為15、組合區(qū)間數(shù)為3 時(shí),M2 樣品的RMSECV值最小為0.027 2,選取波段為1 028 ~1 134、1 883 ~2 094 nm(圖4b)。
2.4.1 基于不同粗糙度的近紅外模型
在不同表面粗糙度下,以人工選擇的波段、BiPLS 和SiPLS 選擇的波段分別建立預(yù)測(cè)模型。如表3 所示,與人工選擇波段和BiPLS 相比,M0 和M1 采用SiPLS 選取的特征波段建立的PLS 回歸模型效果最好,M0的Rp為0.865 9,RMSEP為0.022 7,主因子數(shù)為7;M1 的Rp為0.766 0,RMSEP為0.021 4,主因子數(shù)為9;BiPLS 波段選擇方法對(duì)M0 的建模效果不如人工選取的波段。M2 樣品是采用BiPLS選取的特征波段建立的PLS 回歸模型效果最好,主因子數(shù)為7,Rp為0.756 5,RMSEP為0.026 0;采用SiPLS 選取的特征波段建立的模型效果次之,主因子數(shù)為5,Rp為0.725 6,RMSEP為0.027 4。由表3 可知,采用SiPLS 方法選擇的特征波段數(shù)小于BiPLS 和人工選擇,表明SiPLS 方法在選擇特征波段時(shí)去掉了大量的無(wú)用噪聲,盡可能地保留有用的光譜信息。綜合在不同表面粗糙度條件下的建模表現(xiàn)效果,SiPLS 建模方法是這3 種方法中穩(wěn)定性和準(zhǔn)確性最好的方法,并且隨著從M0、M1、M2 樣品粗糙度的降低,預(yù)測(cè)模型的精度也變低,M0、M1、M2 的Rp分別為0.865 9、0.766 0、0.725 6。
表3 不同波段選擇方法對(duì)不同粗糙度樣品的建模結(jié)果Table 3 Modeling results of different waveband selection methods for samples with different roughness
2.4.2 基于3 種粗糙度混合樣本的近紅外模型
為了減少樣品表面粗糙度對(duì)落葉松樣品基本密度預(yù)測(cè)的影響,利用包含M0、M1 以及M2 的樣品建立混合校正模型,并且依舊采取上文的SPXY 樣本集劃分方法(校正集為240 個(gè)樣本)。采用SiPLS 波段選擇方法選擇合適的波段,建立PLS 回歸模型。
從樣品前期處理過(guò)程(1.3.1)的步驟來(lái)看,可能引入的干擾元素來(lái)自?xún)煞矫?。一方面,在?chē)床上對(duì)高純錫樣品的表面刨光處理時(shí),由于接觸樣品分析面的車(chē)刀是鋼材質(zhì)的,因此在該過(guò)程可能會(huì)對(duì)樣品分析面引入Fe元素的污染;另一方面,后續(xù)樣品的清洗過(guò)程中所使用的硝酸和超純水,可能會(huì)殘留一些離子污染樣品分析面,對(duì)分析有直接影響的就是Ca、Mg離子。只要通過(guò)預(yù)濺射使這3種可能存在的干擾元素含量趨于平穩(wěn),即可正常檢測(cè)采集數(shù)據(jù)組。
當(dāng)區(qū)間數(shù)為20、聯(lián)合區(qū)間數(shù)為4 時(shí),選取的結(jié)果最優(yōu),入選區(qū)間為8、10、12、13 這4 個(gè)區(qū)間,對(duì)應(yīng)的波段為1 106 ~1 213、1 322 ~1 429 和1 538 ~1 751 nm(表4)。從每種粗糙度中選取40 個(gè)樣品,分別驗(yàn)證每種粗糙度的預(yù)測(cè)能力。如表5 所示,M0 樣品的RMSEP從0.022 7 降低到了0.020 1,M1樣品的RMSEP從0.021 4降低到了0.016 0,M2 樣品的RMSEP從0.027 4 降低到了0.026 1,表明SiPLS 選擇的波段范圍包含了M0、M1 和M2 這3 種粗糙度的重要信息,基于此建立混合模型的預(yù)測(cè)能力要好于單一模型,在波段范圍1 106 ~1 213、1 322 ~1 429 和1 538 ~1 751 nm建立的模型可以有效降低樣品表面粗糙度的影響,提高了模型的穩(wěn)健性。
表4 不同區(qū)間數(shù)下SiPLS 混合模型波段優(yōu)選Table 4 Band selection of the SiPLS mixed model under different interval numbers
表5 混合模型預(yù)測(cè)不同粗糙度結(jié)果Table 5 The prediction results of the mixed model for samples with different roughness
本文研究了表面粗糙度為未打磨(M0)、150目(M1)和320 目(M2)打磨的樣品對(duì)基于近紅外技術(shù)預(yù)測(cè)落葉松基本密度的影響。討論不同粗糙度樣品光譜產(chǎn)生的差異,對(duì)比分析在人工選擇波段、BiPLS 和SiPLS 波段優(yōu)選方法下,構(gòu)建預(yù)測(cè)落葉松樣品基本密度模型的效果,在此基礎(chǔ)上建立混合模型減小粗糙度的影響,提高預(yù)測(cè)精度。
研究表明,在不同表面粗糙度條件下,樣品表面越粗糙,樣品光譜的吸光度越高(M0 >M1 >M2),表面粗糙的樣品攜帶的光譜有效信息要多于表面光滑的樣品。在不同波段優(yōu)選方法中,針對(duì)不同表面粗糙度的樣品,SiPLS 優(yōu)選出的特征波長(zhǎng)點(diǎn)包含更多的有效信息,與其他波段選擇方法相比其具有更大的優(yōu)勢(shì)。基于SiPLS 和PLS 建立的回歸模型準(zhǔn)確性更高,表明經(jīng)過(guò)SiPLS波段優(yōu)選可以有效降低不同表面粗糙度對(duì)NIR 預(yù)測(cè)模型的影響。所建模型對(duì)不同粗糙度的預(yù)測(cè)結(jié)果為M0>M1>M2,呈現(xiàn)出與粗糙度相同的趨勢(shì),表明粗糙度的程度與預(yù)測(cè)結(jié)果精度存在一定聯(lián)系?;旌夏P徒?jīng)SiPLS 優(yōu)選的波段范圍為1 106 ~1 213、1 322 ~1 429 和1 538 ~1 751 nm,表明在此區(qū)間內(nèi)包含了不同粗糙度樣品的光譜信息。采用不同粗糙度樣品建立的SiPLS-混合模型效果要好于不同粗糙度的單一模型,RMSEP均得到了不同程度的提高,表明建立混合模型可以有效提高近紅外模型的穩(wěn)健性與普適性。
木材種類(lèi)繁多,通常將其分為針葉材和闊葉材兩大類(lèi),根據(jù)各自的特性不同,在木材工業(yè)上的用途也不一樣。在木材工業(yè)中,利用近紅外技術(shù)對(duì)木材的物理力學(xué)性質(zhì)等進(jìn)行預(yù)測(cè)時(shí),由于加工方式不同,表面粗糙度的影響是不可避免。
本研究主要針對(duì)的是東北地區(qū)的落葉松木材,分析其不同表面粗糙度對(duì)NIR 預(yù)測(cè)模型的影響,研究結(jié)果是否適用于其他種類(lèi)的針葉材或闊葉材有待進(jìn)一步驗(yàn)證。在實(shí)際的應(yīng)用中NIR 會(huì)受到多種因素的影響,不僅是表面粗糙度,還包括溫度、含水率和操作者因素等,優(yōu)化影響因素的方法也各不相同。在后續(xù)的研究中對(duì)其他針葉材和闊葉材進(jìn)行不同表面粗糙度的處理,驗(yàn)證表面粗糙度對(duì)NIR 預(yù)測(cè)木材密度的影響,提出適用于大部分木材的優(yōu)化方法,建立適用范圍更廣的NIR 預(yù)測(cè)模型。為了進(jìn)一步提高模型的普適性,近紅外檢測(cè)技術(shù)及模型傳遞方法的結(jié)合可能會(huì)成為木材生產(chǎn)加工領(lǐng)域新的應(yīng)用方向,這也將是下一步研究的重點(diǎn)。