馬公喆,楊曉麗,汪文超,陳云秀
(曲靖師范學(xué)院化學(xué)化工學(xué)院,云南曲靖655011)
水分含量是煤品質(zhì)非常重要的檢測(cè)參數(shù)之一,水分含量對(duì)煤加工、運(yùn)輸、銷(xiāo)售均起到至關(guān)重要的作用。水分傳統(tǒng)檢測(cè)方法是熱重分析,缺點(diǎn)是耗時(shí)較長(zhǎng)。近紅外光譜采集1 100~2 500 nm范圍內(nèi)的光,主要反映物質(zhì)分子中C-H、N-H、O-H、C-O和S-H等基團(tuán)振動(dòng)的合頻與倍頻吸收[1]。因此,近紅外光譜可以通過(guò)O-H基團(tuán)吸收獲得水分含量信息。目前已有一些科研工作者對(duì)近紅外光譜技術(shù)用于煤中水分含量的檢測(cè)進(jìn)行了研究。武中巨等采用近紅外光譜技術(shù)和偏最小二乘對(duì)褐煤品質(zhì)進(jìn)行了快速檢測(cè),結(jié)果表明水分檢測(cè)誤差較大[2]。Dong W K等從近紅外光譜中提取了5個(gè)波長(zhǎng)點(diǎn)用于實(shí)現(xiàn)煤品質(zhì)的快速檢測(cè),檢測(cè)誤差在10%左右[3]。Wang Y等將小波變換方法用于提高近紅外光譜在煤品質(zhì)檢測(cè)中的應(yīng)用并低降建模難度[4-6]。
本文針對(duì)煙煤中水分含量的近紅外快速檢測(cè),采用常用的主成分分析和偏最小二乘回歸建立檢測(cè)模型。
采集曲靖富源地區(qū)煙煤樣品100個(gè),將煤樣粉碎研磨到0.180 mm(80目)。采用熱重分析檢測(cè)煤樣中水分含量[7]。精確稱(chēng)量空氣干燥煤樣1.0±0.1 g(精確至0.000 2g),將煤樣平鋪于干燥恒重的Φ40 mm稱(chēng)量瓶。打開(kāi)稱(chēng)量瓶蓋,放入預(yù)先鼓風(fēng)并已加熱至105~110℃的干燥箱中,在一直鼓風(fēng)的條件下干燥40 min。從干燥箱中取出稱(chēng)量瓶,立即蓋上蓋,放入干燥器中冷卻至室溫(約20 min)后,稱(chēng)量。再進(jìn)行檢查性干燥,每次30 min,直到連續(xù)兩次干燥煤樣的質(zhì)量減少不超過(guò)0.001 g或質(zhì)量增加時(shí)為止。
采用Thermo AntarisⅡ光譜儀采集煙煤的近紅外光譜數(shù)據(jù),光譜范圍4 000~12 000 cm-1,分辨率8 cm-1,掃描次數(shù)8。
偏最小二乘(partial least squares,PLS)[8]是一種基于因子分析的多變量校正方法,利用自變量矩陣中提取出的隱變量來(lái)建立模型,可以充分利用因變量矩陣和自變量矩陣的信息。PLS比多元線性回歸、主成分回歸等線性模型更穩(wěn)定。
偏最小二乘法的基本數(shù)學(xué)模型為:
式中n為樣本數(shù),r為自變量數(shù),m為因變量數(shù),s為隱變量數(shù)。E和F分別為關(guān)于X和Y的線性模型的殘差矩陣。
當(dāng)E的元素服從正態(tài)分布時(shí),根據(jù)最大熵原理,最大熵Hmax的大小取決于方差σ2:
此處eij為殘差,(r-s)為自由度。當(dāng)σ2最小時(shí),建立的數(shù)學(xué)模型具有最佳的預(yù)測(cè)效果。
PLS中的隱變量個(gè)數(shù)是十分重要的,只有確定出恰當(dāng)?shù)碾[變量數(shù),才能消除噪聲、避免過(guò)度擬合、獲得良好預(yù)測(cè)效果。PLS一般采用交互驗(yàn)證(Cross-validation)的預(yù)測(cè)誤差平方和(predicted error sum of squares,PRESS)確定隱變量數(shù),當(dāng)PRESS最小時(shí),該隱變量數(shù)最佳。
主成分分析(principal component analysis,PCA)是一種統(tǒng)計(jì)分析方法,可以進(jìn)行數(shù)據(jù)降維、變量提取、數(shù)據(jù)壓縮、分類(lèi)、聚類(lèi)等處理[9]。主成分分析將數(shù)據(jù)進(jìn)行特征分解,構(gòu)造新變量(稱(chēng)為主成分)并保證各變量之間正交。方差越大的主成分含原變量信息量越大。提取較少幾個(gè)主成分就可以包含原數(shù)據(jù)的信息,將高維數(shù)據(jù)降到低維。
首先采用PCA將含有1557個(gè)變量的高維近紅外光譜數(shù)據(jù)映射到低維空間,再根據(jù)低維特征變量建立PLS模型。為了檢驗(yàn)建模效率,將100個(gè)樣本分為校正集和預(yù)測(cè)集,其中校正集包含85個(gè)樣本,預(yù)測(cè)集包含15個(gè)樣本。
PLS先提取數(shù)據(jù)的特征信息(隱變量)再建立預(yù)測(cè)模型,因此提取出的特征數(shù)目(隱變量數(shù))會(huì)直接影響模型的性能。考察了1~15個(gè)隱變量數(shù)下模型的預(yù)測(cè)性能,結(jié)果見(jiàn)表1。從表1中可見(jiàn),隨著PLS隱變量數(shù)的增加,預(yù)測(cè)誤差先減小后增大。當(dāng)隱變量數(shù)為3時(shí),預(yù)測(cè)最準(zhǔn)確,平均預(yù)測(cè)絕對(duì)百分誤差為0.0828。
表1 PLS隱變量數(shù)對(duì)模型檢測(cè)精度的影響Tab.1 Effect of the number of hidden variables PLS on model detection accuracy
PLS 主分量個(gè)數(shù) 平均預(yù)測(cè)絕對(duì)誤差 平均預(yù)測(cè)絕對(duì)百分誤差0.0023 0.0927 5 0.0021 0.0856 6 0.0025 0.0977 7 0.0024 0.0971 9 0.0029 0.1156 10 0.0031 0.1247 11 0.003 0.1202 12 0.0032 0.126 13 0.0034 0.1342 14 0.0033 0.1328 4 15 0.0033 0.1323
PCA提取出的主成分包含樣本有用信息并能剔除一部分無(wú)用信息,主成分個(gè)數(shù)直接決定數(shù)據(jù)壓縮及濾噪效果。本文將PLS主分量數(shù)固定為3,考察了PCA主成分?jǐn)?shù)3~30對(duì)建模的影響,見(jiàn)圖1。
圖1 PCA主成分?jǐn)?shù)對(duì)預(yù)測(cè)效果的影響Fig.1 Effect of PCA main components on predict result
圖1表明,隨著主成分?jǐn)?shù)的增加,平均預(yù)測(cè)絕對(duì)誤差和平均預(yù)測(cè)絕對(duì)百分誤差呈現(xiàn)相同的變化趨勢(shì),隨著波動(dòng)先下降后上升。當(dāng)主成分?jǐn)?shù)為16時(shí)獲得最低平均預(yù)測(cè)絕對(duì)百分誤差,0.0728。
為了進(jìn)一步考察模型的預(yù)測(cè)性能,表2列出了真實(shí)結(jié)果、預(yù)測(cè)結(jié)果和預(yù)測(cè)百分誤差。結(jié)果表明有5個(gè)樣本預(yù)測(cè)偏差較大,超過(guò)了0.1,其余10個(gè)樣本預(yù)測(cè)效果較好??偠灾梢酝ㄟ^(guò)PCA-PLS方法結(jié)合近紅外技術(shù)實(shí)現(xiàn)煙煤中水分檢測(cè)。
表2 PCA-PLS結(jié)果Tab.2 PCA-PLS results
本文收集了100個(gè)煙煤樣品,針對(duì)煙煤水分檢測(cè)探討了近紅外光譜法快速檢測(cè)的可行性。采用主成分分析和偏最小二乘分析近紅外光譜,主成分分析用來(lái)對(duì)近紅外光譜壓縮、濾噪,偏最小二乘用來(lái)建立檢測(cè)模型。通過(guò)對(duì)模型參數(shù)的考察和優(yōu)化,最佳平均預(yù)測(cè)絕對(duì)百分誤差為0.0728。結(jié)果表明近紅外光譜技術(shù)可以用于煙煤水分快速檢測(cè)。
[1]McDonald R S.Infrared spectrometry[J].Analytical Chemistry,1984,56:349R-372R.
[2]武中臣,熊智新,王海東,等.褐煤品質(zhì)的傅里葉變換近紅外光譜定量分析[J].光譜實(shí)驗(yàn)室,2008,25(5):819-823.
[3]Dong W K,Jong M L,Jae S K.Application of near diffuse reflectance spectroscopy for on-line measurement of coal properties[J].Korean Journal Chemical Engineering,2009,26:489-495.
[4]Wang Y,Shi G,Zhong X,et al.PLS regression on coal infrared spectrum with wavelet pre-processing[J].Applied Mechanics and Materials,2011,80-81:279-283.
[5]Wang S,F(xiàn)eng X,Zhou J,et al.Fourier transform near infrared spectroscopy analysis of power plant coal quality[J].Advanced Materials Research,2011,236-238:799-803.
[6]WangY,Wang D,Xin H,et al.PLS regression on wavelet transformed infrared spectra for prediction of coal contents[J].R.Chen(Ed.):ICICIS 2011,PartⅠ,CCIS 134:348-353.
[7]常宏,李?lèi)?ài)啟,王洪偉,等.煤中水分的快速測(cè)定[J].煤質(zhì)技術(shù),2004(2):50-52.
[8]Haaland D M ,Thomas E V.Partial Least-Squares Methods for Spectral Analyses.1.Relation to Other Quantitative Calibration Methods and the Extraction of Qualitative Information[J].Analytical Chemistry,1988,60:1193-1202.
[9]Jolliffe I T.Principal Component Analysis[J].New York,USA:Springer-Verlog,1986.