吳 珽, 房桂干*, 梁 龍, 張新民, 趙振義
(1. 中國(guó)林業(yè)科學(xué)研究院林產(chǎn)化學(xué)工業(yè)研究所 江蘇省生物質(zhì)能源與材料重點(diǎn)實(shí)驗(yàn)室國(guó)家林業(yè)局林產(chǎn)化學(xué)工程重點(diǎn)開放性實(shí)驗(yàn)室 生物質(zhì)化學(xué)利用國(guó)家工程實(shí)驗(yàn)室,江蘇 南京 210042;2. 華夏科創(chuàng)儀器有限公司,北京 100085)
制漿材綜纖維素和聚戊糖含量的近紅外預(yù)測(cè)
吳 珽1, 房桂干1*, 梁 龍1, 張新民2, 趙振義2
(1. 中國(guó)林業(yè)科學(xué)研究院林產(chǎn)化學(xué)工業(yè)研究所 江蘇省生物質(zhì)能源與材料重點(diǎn)實(shí)驗(yàn)室國(guó)家林業(yè)局林產(chǎn)化學(xué)工程重點(diǎn)開放性實(shí)驗(yàn)室 生物質(zhì)化學(xué)利用國(guó)家工程實(shí)驗(yàn)室,江蘇 南京 210042;2. 華夏科創(chuàng)儀器有限公司,北京 100085)
用傳統(tǒng)方法測(cè)定了156個(gè)制漿材樣品的綜纖維素和聚戊糖含量并采集了樣品的近紅外光譜。對(duì)原始光譜進(jìn)行多元散射校正后,運(yùn)用偏最小二乘法和交互驗(yàn)證的方法,確定最佳主成分?jǐn)?shù)分別為9和10并建立樣品綜纖維素和聚戊糖含量的校正模型。獨(dú)立驗(yàn)證中兩個(gè)模型的決定系數(shù)Rval2分別為0.903 4、0.940 1,預(yù)測(cè)均方根誤差(RMSEP)分別為0.69%、0.78%,相對(duì)分析誤差(RPD)值分別為3.22、4.09,絕對(duì)偏差(AD)分別為-1.00%~1.20%、-1.39%~1.31%,兩個(gè)校正模型較好地預(yù)測(cè)了驗(yàn)證集樣品的綜纖維素和聚戊糖含量,基本滿足制漿造紙工業(yè)中快速測(cè)定的需求。
近紅外光譜;偏最小二乘法;制漿材;綜纖維素;聚戊糖
制漿造紙工業(yè)中,常采用測(cè)定綜纖維素和聚戊糖的方法來確定原料中纖維素和半纖維素的含量情況,并以此表征原料的使用價(jià)值[1]。但傳統(tǒng)測(cè)定方法用藥多、耗時(shí)長(zhǎng),無(wú)法滿足實(shí)時(shí)檢測(cè)的需求[2]。近紅外光譜技術(shù)是近年發(fā)展較快的一種快速無(wú)損的檢測(cè)方法,該方法通過樣品的近紅外光譜和已確定的物化性質(zhì)建立數(shù)學(xué)模型以預(yù)測(cè)未知樣品的相應(yīng)性質(zhì)[3],在林業(yè)[4]、農(nóng)副產(chǎn)業(yè)[5-6]、石油化工[7-8]等領(lǐng)域發(fā)揮著重要作用。目前國(guó)內(nèi)外學(xué)者已利用近紅外光譜技術(shù)結(jié)合化學(xué)計(jì)量學(xué)方法,對(duì)制漿原料在線分類、化學(xué)成分及制漿得率預(yù)測(cè)等作了大量研究[9-12],但鮮有針對(duì)我國(guó)常用制漿材的綜纖維素和聚戊糖含量進(jìn)行較全面的分析預(yù)測(cè)。本研究采集了我國(guó)制漿造紙工業(yè)中常用的三大樹種(桉木、相思、楊木)共156個(gè)樣品的近紅外光譜,通過傳統(tǒng)化學(xué)方法測(cè)定其綜纖維素和聚戊糖含量,在Matlab 7.0下調(diào)用偏最小二乘法(Partial Least Squares, PLS)建立校正模型,為制漿造紙行業(yè)實(shí)現(xiàn)原料材性的預(yù)測(cè)及原料使用價(jià)值的快速評(píng)估提供了可能。
1.1原料
實(shí)驗(yàn)所用原材料為制漿造紙工業(yè)中廣泛使用的桉木、相思和楊木。選取具有代表性的適齡植株,去皮后切削成規(guī)格統(tǒng)一的木片(約20 mm×10 mm×2 mm),共采集156個(gè)樣品。每個(gè)樹種隨機(jī)選出12個(gè)樣品組成驗(yàn)證集用于獨(dú)立驗(yàn)證,其余樣品用于校正模型的建立。
表1 樣品的選取及使用情況
1.2儀器設(shè)備與光譜采集
采用華夏科創(chuàng)儀器有限公司研發(fā)的阿達(dá)瑪近紅外光譜儀獲取所有校正集與驗(yàn)證集的近紅外光譜,儀器參數(shù)設(shè)定如下:掃描波長(zhǎng)范圍為1 600~2 500 nm,分辨率為8 cm-1,采樣點(diǎn)為100,光譜重復(fù)掃描50次平均為一個(gè)光譜數(shù)據(jù)。為了充分獲取木片信息,將樣品木片平鋪在采樣杯底部,層層疊起,盡量不留透光縫隙。每個(gè)樣品重復(fù)裝樣3次,取其平均光譜作為樣品原始光譜。
1.3含量測(cè)定
樣品采集完近紅外光譜后,置于植物粉碎機(jī)中磨成木粉并過篩,選取40~60目的木粉細(xì)末,涼至室溫后放入聚乙烯袋中密封備用。
按GB/T 2677.10-1995測(cè)定綜纖維素含量:在pH為4~5時(shí),用亞氯酸鈉處理經(jīng)苯醇抽提后的樣品,以除去所含木素;定量地測(cè)定殘留物量,以百分比表示,即為綜纖維素含量。
按GB/T 2677.9-1994測(cè)定聚戊糖含量:將樣品與12%的鹽酸共沸,使樣品中的聚戊糖水解生成戊糖,戊糖進(jìn)一步脫水轉(zhuǎn)化為糠醛;將蒸餾出的糠醛經(jīng)冷凝后收集,用溴化法定量地測(cè)定蒸餾出的糠醛含量,換算為聚戊糖含量。
1.4分析過程與評(píng)價(jià)標(biāo)準(zhǔn)
數(shù)據(jù)分析過程主要在Matlab 7.0下進(jìn)行:采集樣品木片的近紅外光譜;用傳統(tǒng)化學(xué)法測(cè)定綜纖維素和聚戊糖含量;對(duì)近紅外光譜進(jìn)行預(yù)處理;以校正集數(shù)據(jù)通過偏最小二乘法(PLS)和交互驗(yàn)證在提取不同主成分?jǐn)?shù)的情況下建立模型,當(dāng)預(yù)測(cè)殘差平方和(Prediction Residiual Error Sum of Squares, PRESS)最小時(shí),對(duì)應(yīng)的主成分?jǐn)?shù)為最佳主成分?jǐn)?shù),校正模型最優(yōu);用驗(yàn)證集樣品對(duì)校正模型進(jìn)行獨(dú)立驗(yàn)證,進(jìn)一步確定模型預(yù)測(cè)性能[13]。
以交互驗(yàn)證決定系數(shù)(Rcv2)、交互驗(yàn)證均方根誤差(RMSECV)、獨(dú)立驗(yàn)證決定系數(shù)(Rval2)、預(yù)測(cè)均方根誤差(RMSEP)、相對(duì)分析誤差(RPD)、絕對(duì)偏差(AD)綜合評(píng)價(jià)模型性能。其中Rcv2和Rval2的大小與待測(cè)性質(zhì)的分布范圍有關(guān),對(duì)于分布范圍很寬的性質(zhì),其值可能接近于1,因此Rcv2、Rval2只作為判斷模型質(zhì)量的參考數(shù)據(jù)。交互驗(yàn)證均方根誤差(RMSECV)及預(yù)測(cè)均方根誤差(RMSEP)的值越小,模型的預(yù)測(cè)的誤差越小。其中RMSEP是評(píng)價(jià)近紅外分析的準(zhǔn)確度與精準(zhǔn)度、可靠性與穩(wěn)定性的基礎(chǔ)指標(biāo)。RPD值定義為驗(yàn)證集的標(biāo)準(zhǔn)差與RMSEP的比值,目的是將模型對(duì)驗(yàn)證集樣品的預(yù)測(cè)結(jié)果標(biāo)準(zhǔn)化。如果RPD值大于5,模型質(zhì)量好,可用于質(zhì)量控制;當(dāng)RPD值在2.5~5之間時(shí),模型較好,能適應(yīng)非精確性的預(yù)測(cè)。RPD值小于2.5時(shí),模型預(yù)測(cè)性能較差。而絕對(duì)偏差直觀反映了預(yù)測(cè)值和真實(shí)值之差,應(yīng)在模型實(shí)際應(yīng)用時(shí)許可的誤差范圍以內(nèi)[14]。
2.1測(cè)定值分布
測(cè)定全部校正集和驗(yàn)證集共156個(gè)樣品的綜纖維素和聚戊糖含量,其分布情況見表2。相思樣品的綜纖維素含量較低,在73.10%~78.69%區(qū)間上分布,桉木和楊木的綜纖維素含量則基本分布于78.45%~81.75%的區(qū)間上;相思和楊木的聚戊糖含量低于桉木,約17.08%~26.21%;桉木的聚戊糖含量約25.04%~30.60%。樣品綜纖維素和聚戊糖含量總體分布較寬,有利于建立適應(yīng)性較強(qiáng)的模型。
表2 樣品綜纖維素和聚戊糖含量的分布
2.2樣品的近紅外光譜
圖1為不同樣品的近紅外光譜圖,其中橫坐標(biāo)為光譜波長(zhǎng),縱坐標(biāo)表征樣品對(duì)光譜的吸收強(qiáng)弱??梢姌悠吩趻呙璨ㄩL(zhǎng)范圍上存在較強(qiáng)吸收,但光譜吸收帶較寬且重疊嚴(yán)重,難以精確區(qū)分譜帶歸屬。
2.3光譜預(yù)處理及模型的建立
通過Matlab7.0軟件采用多元散射校正(MSC)的方式對(duì)原始光譜進(jìn)行預(yù)處理,以期提高信噪比,消除干擾信息,從而提高所建模型的準(zhǔn)確性與穩(wěn)定性。為精確建立模型,防止損失較多信息量,本研究用全光譜區(qū)間參與建模。在Matlab7.0下,采用偏最小二乘法(PLS)和交互驗(yàn)證中的留一法確定最佳主成分?jǐn)?shù):對(duì)某一主成分?jǐn)?shù)h,從校正集中每次選取一個(gè)樣品,對(duì)校正集中其余樣品信息使用偏最小二乘法(PLS)建立模型來預(yù)測(cè)此樣品;再?gòu)男U辛硗膺x取一個(gè)樣品,重復(fù)上述過程;經(jīng)反復(fù)建模及預(yù)測(cè),直到校正集中每個(gè)樣品均被且僅被預(yù)測(cè)一次,得到對(duì)應(yīng)這一主成分?jǐn)?shù)的PRESS值;設(shè)置主成分?jǐn)?shù)最大為12,以免發(fā)生模型過擬合現(xiàn)象,當(dāng)PRESS值最小時(shí),對(duì)應(yīng)的主成分?jǐn)?shù)為最佳主成分?jǐn)?shù),此時(shí)校正模型質(zhì)量最優(yōu)。圖2顯示綜纖維素校正模型PRESS值隨主成分?jǐn)?shù)的變化,當(dāng)主成分?jǐn)?shù)為9時(shí),PRESS值最小,此后有小幅回升。綜纖維素最優(yōu)校正模型的Rcv2值為0.921 8,RMSECV值為0.51%。圖3則反映了聚戊糖模型最佳主成分?jǐn)?shù)為10;其最優(yōu)校正模型的Rcv2值為0.9532,RMSECV值為0.67%,如表3所示。模型的相關(guān)性和準(zhǔn)確性較好。
圖1 樣品的近紅外光譜
圖2 綜纖維素模型的主成分?jǐn)?shù)-PRESS值圖
圖3 聚戊糖模型的主成分?jǐn)?shù)-PRESS值圖
表3 校正模型的參數(shù)及評(píng)價(jià)
2.4獨(dú)立驗(yàn)證
進(jìn)一步確定校正模型的預(yù)測(cè)性能需經(jīng)過獨(dú)立驗(yàn)證。其基本過程是采用模型對(duì)已知實(shí)測(cè)值的驗(yàn)證集樣品進(jìn)行預(yù)測(cè),首先在Matlab7.0軟件中調(diào)入驗(yàn)證集樣品的光譜數(shù)據(jù)和模型文件,經(jīng)過模型計(jì)算分析得到預(yù)測(cè)值結(jié)果,詳細(xì)數(shù)據(jù)如表4所示。
表4 驗(yàn)證集樣品的預(yù)測(cè)值與實(shí)測(cè)值
(續(xù)表4)
將預(yù)測(cè)值與實(shí)測(cè)值進(jìn)行統(tǒng)計(jì)比較,得出校正模型的獨(dú)立驗(yàn)證參數(shù),見表3。其中Rval2值均小于Rcv2值,RMSEP值均略大于RMSECV值,可見驗(yàn)證集樣品具有代表性,建模和預(yù)測(cè)過程中不存在較大的誤差。綜纖維素校正模型的RMSEP值為0.69%,絕對(duì)偏差范圍為-1.00 %~1.20%,RPD值為3.22。聚戊糖校正模型的RMSEP值為0.78%,絕對(duì)偏差范圍為-1.39%~1.31%,RPD值為4.09。兩個(gè)模型的RMSEP值均小于1%,絕對(duì)偏差范圍略大于1%,基本能夠滿足制漿造紙工業(yè)中快速測(cè)定的誤差要求。兩個(gè)模型的RPD值在2.5到5之間時(shí),模型較好,能適應(yīng)非精確性的預(yù)測(cè)。用預(yù)測(cè)值和實(shí)測(cè)值作散點(diǎn)圖(圖4~5),預(yù)測(cè)值和實(shí)測(cè)值分布在45o線兩側(cè)且偏差不大,模型穩(wěn)健性較好。
圖4 綜纖維素模型的獨(dú)立驗(yàn)證
圖5 聚戊糖模型的獨(dú)立驗(yàn)證
1)采集了156個(gè)常見制漿材樣品的近紅外光譜并用傳統(tǒng)化學(xué)方法測(cè)定了樣品的綜纖維素和聚戊糖含量,對(duì)原始光譜進(jìn)行多元散射校正后,在Matlab 7.0軟件中使用偏最小二乘法和交互驗(yàn)證的方法確定了最佳主成分?jǐn)?shù)分別9和10。據(jù)此確定的綜纖維素和聚戊糖校正模型相關(guān)性較好;RMSEP值分別為0.69%和0.78%,絕對(duì)偏差范圍分別為-1.00 %~1.20%和-1.39%~1.31%,基本能夠滿足制漿造紙工業(yè)中快速測(cè)定的誤差要求;RPD值分別為3.22和4.09,模型能適應(yīng)非精確性的預(yù)測(cè)。這也進(jìn)一步證實(shí)了近紅外光譜用于制漿材材性預(yù)測(cè)的可行性。
2)樣品樹種基本覆蓋了我國(guó)制漿造紙工業(yè)中所用的速生闊葉材種,且綜纖維素和聚戊糖含量分布較廣,模型有著良好適應(yīng)性。為制漿造紙工業(yè)原料材性實(shí)時(shí)檢測(cè)及原料使用價(jià)值快速評(píng)估的實(shí)現(xiàn)提供了可能。
3)本研究采用國(guó)產(chǎn)阿達(dá)瑪近紅外光譜儀所建立的模型較成功,說明我國(guó)近紅外設(shè)備已具備較高的品質(zhì),其推廣與普及將節(jié)省制漿造紙行業(yè)的檢測(cè)成本。
[1] Schwanninger M, Rodrigues J C, Fackler K. A review of band assignments in near infrared spectra of wood and woodcomponents[J]. Journal of Near Infrared Spectroscopy, 2011, 19(5): 287-308.
[2] Tsuchikawa S, Schwanninger M. A review of recent near-infrared research for wood and paper (part 2)[J]. Applied Spectroscopy Reviews, 2013, 48(7): 560-587.
[3] 嚴(yán)衍祿, 陳斌, 朱大洲, 等. 近紅外光譜分析的原理、技術(shù)與應(yīng)用[M]. 北京: 中國(guó)輕工業(yè)出版社, 2013: 92-95.
[4] Stirling R. Near-infrared spectroscopy as a potential quality assurance tool for the wood preservation industry[J]. The Forestry Chronicle, 2013, 89(5): 654-658.
[5] 徐文杰, 劉茹, 洪響聲, 等. 基于近紅外光譜技術(shù)的淡水魚品種快速鑒別[J]. 農(nóng)業(yè)工程學(xué)報(bào), 2014, 30(1): 253-261.
[6] Talens P, Mora L, Morsy N, et al. Prediction of water and protein contents and quality classification of Spanish cooked ham using NIR hyperspectral imaging[J]. Journal of Food Engineering, 2013, 117(3): 272-280.
[7] 王艷斌, 胡于中, 李文樂, 等. 近紅外原油快速評(píng)價(jià)技術(shù)預(yù)測(cè)常減壓蒸餾裝置側(cè)線收率[J]. 光譜學(xué)與光譜分析, 2014, 34(10): 2612-2616.
[8] Balabin R M, Safieva R Z, Lomakina E I. Near-infrared (NIR) spectroscopy for motor oil classification: From discriminant analysis to support vector machines[J]. Microchemical Journal, 2011, 98(1): 121-128.
[9] 崔宏輝, 房桂干, 梁龍. 基于近紅外光譜快速鑒別木材種類的研究[J]. 現(xiàn)代化工, 2015, 35(2): 169-171.
[10] 姚勝, 武國(guó)峰, 姜亦飛, 等. 相思樹聚戊糖含量近紅外光譜分析模型的建立與修正[J]. 光譜學(xué)與光譜分析, 2010, 30(5): 1206-1209.
[11] He W, Hu H. Prediction of hot-water-soluble extractive pentosan and cellulose content of various wood species using FT-NIR spectroscopy[J]. Bioresource technology, 2013, 140(7): 299-305.
[12] 劉勝, 張文杰. 近紅外光譜數(shù)據(jù)建立相思樹制漿得率預(yù)測(cè)模型[J]. 林業(yè)科技, 2011, 36(2): 48-50.
[13] 陸婉珍. 現(xiàn)代近紅外光譜分析技術(shù)[M]. 北京: 中國(guó)石化出版社, 2007: 44-45.
[14] Fiona S Poke, Carolyn A Raymond. Predicting extractives, lignin and cellulose contents using near infrared spectroscopy on solid wood in Eucalyptus globulus[J]. Wood Chemistry and Technology, 2006, 26(2): 187-199.
The Prediction of Holocellulose and Pentosan Content in Pulpwood by Near Infrared Spectroscopy
WU Ting1, FANG Gui-gan1*, LIANG Long1, ZHANG Xin-min2, ZHAO Zhen-yi2
(1. Key Lab. of Biomass Energy and Material, Jiangsu Province, National Engineering Lab. for Biomass Chemical Utilization, Key and Open Lab. on Forest Chemical Engineering, SFA, Institute of Chemical Industry of Forestry Products, CAF Nanjing 210042, China; 2. China invent Instrument Tech. Co. Ltd, Beijing 100085, China)
A study was conducted to use the traditional method to analyze the content of holocellulose and pentosan of 156 pulpwood samples and the near-infrared (NIR) spectra were also collected. After the original spectra were pretreated by multipliplicative scatter correction (MSC), partial least squares (PLS) method and cross-validation was used to confirm the best factors would be 9 and 10. Based on those factors, calibration models for holocellulose and pentosan content was built. The independent verification of the calibration models showed the coefficient of determination (Rval2) was 0.9034 and 0.9401. The root mean square error of prediction (RMSEP) was 0.69% and 0.78%. The relative percent deviation (RPD) was 3.22 and 4.09. And the absolute deviation (AD) was -1.00%~1.20% and -1.39%~1.31%. Both calibration models basically met the requirements of rapid determination in pulping and paper making industry for their good predictive performance.
near-infrared spectroscopy; partial least squares(PLS); pulpwood; holocellulose; pentosan
O657.3;TS721
A
1004-8405(2015)04-0049-06
10.16561/j.cnki.xws.2015.04.03
2015-07-13
國(guó)家林業(yè)局948項(xiàng)目“農(nóng)林剩余物制機(jī)械漿節(jié)能和減量技術(shù)引進(jìn)”(2014-4-31)。
吳 珽(1988~),男,江蘇興化人,在讀研究生;研究方向:制漿造紙工藝參數(shù)在線檢測(cè)。
* 通訊作者:房桂干(1966~),國(guó)際木材科學(xué)院院士,博士生導(dǎo)師;研究方向:制漿造紙清潔生產(chǎn)、環(huán)保和生物質(zhì)利用研究。fangguigan@icifp.cn