摘 要 分段直接校正(PDS)算法是目前最常用的近紅外光譜模型傳遞方法,但它在對整個(gè)譜區(qū)進(jìn)行校正時(shí),始終依賴大小不變的傳遞窗口。為了提高傳遞效果,本研究在PDS基礎(chǔ)上提出了一種新的算法——小波多尺度分段直接校正法(WMPDS),用于混胺的近紅外光譜模型傳遞,并詳細(xì)討論了模型的傳遞參數(shù)和傳遞結(jié)果。本算法首先對混胺的近紅外光譜進(jìn)行小波分解,然后用PDS算法對每一層小波系數(shù)進(jìn)行傳遞,PDS窗口隨小波系數(shù)頻率的提高進(jìn)行動態(tài)調(diào)整,最后進(jìn)行小波重構(gòu)。本算法能有效消除不同儀器之間的大部分差異,大幅度地改善分析精度,與傳統(tǒng)的PDS相比,傳遞效果明顯提高。
關(guān)鍵詞 近紅外光譜; 模型傳遞; 小波多尺度分段直接校正
2010-05-21收稿;2010-12-11接受
本文系國防預(yù)研基金項(xiàng)目(No.9140A19050106JB1409)資助
* E-mail:juxiangw@163.com
1 引 言
模型傳遞也稱儀器標(biāo)準(zhǔn)化,是指經(jīng)過數(shù)學(xué)處理后,使一臺儀器上的模型能夠用于另一臺儀器,從而減少重新建模所帶來的巨大工作量,實(shí)現(xiàn)樣品和數(shù)據(jù)資源的共享[1]。目前,模型傳遞大多使用的是有標(biāo)模型傳遞算法,主要有S/B算法[2]、Shenk′s算法[3]、普魯克算法[4]、直接校正(DS)算法[5]、分段直接校正(PDS)算法[6,7]和目標(biāo)因子法[8]等,其中應(yīng)用最為普遍和最為成功的方法是PDS算法。近年來,小波分析作為一種新的時(shí)頻分析方法,廣泛應(yīng)用于多個(gè)領(lǐng)域。小波變換(WT)結(jié)合PDS用于模型傳遞的算法已有報(bào)道,田高友等[9]用小波變換對原始光譜進(jìn)行壓縮,然后對壓縮后的光譜進(jìn)行傳遞;譚超等[10]在PDS傳遞時(shí),用小波對原始光譜進(jìn)行分解,光譜去噪后對剩余小波系數(shù)進(jìn)行逐個(gè)傳遞,最后進(jìn)行重構(gòu)與預(yù)測。他們強(qiáng)調(diào)的是小波在預(yù)處理中的壓縮和去噪能力,小波主要起預(yù)處理的作用。本研究充分利用小波變換多分辨率分析的特點(diǎn),建立了一種新的模型傳遞算法: 將WT和PDS充分融合,利用小波在空間域具有的表征信號局部特性的能力,將儀器間差異分解到各層小波系數(shù)中,調(diào)整各層的PDS窗口寬度實(shí)現(xiàn)最佳傳遞效果。
2 原理與算法
小波分析是由法國工程師J. Morlet在1974年提出的[11],它克服了短時(shí)傅里葉變換單分辨率上的缺陷,具有多分辨率分析的特點(diǎn)。PDS算法是一種多元全譜區(qū)模型傳遞算法,它的基本假設(shè)是實(shí)際光譜數(shù)據(jù)的變化只局限于一個(gè)小的區(qū)域,選擇合適的窗口能對各個(gè)波長點(diǎn)的光譜進(jìn)行校正。
小波多尺度分段直接校正法的基本思想:對于已知樣品,在不同近紅外光譜儀測得的近紅外光譜存在較大差異。由于產(chǎn)生差異原因的多樣性,這些差異強(qiáng)度及體現(xiàn)在譜區(qū)的范圍有很大不同,有的尖銳,有的平緩,有些是局部性,有些是全譜區(qū)。由于小波變換的多分辨率分析的特點(diǎn),因此可以利用小波變換將這些不同類型的差異分解到各層的小波系數(shù)中。在低頻部分,小波系數(shù)比較相似,差異一般局限在一小塊譜區(qū)內(nèi),可選擇較小的PDS窗口寬度進(jìn)行校正;在高頻部分,小波系數(shù)差異較大,差異體現(xiàn)在較寬的譜區(qū)內(nèi),需選擇較大的PDS窗口寬度進(jìn)行校正。WMPDS算法就是根據(jù)需要,選擇不同的小波函數(shù)和分解層數(shù),將儀器間差異分解到各層小波系數(shù)中,然后動態(tài)調(diào)整PDS窗口寬度在各層小波系數(shù)進(jìn)行校正。
小波多尺度分段直接校正法的具體步驟:(1)在校正集中選擇有代表性的樣品作為轉(zhuǎn)換集樣品,在光譜檢測和建模的主儀器獲得其光譜AM,在其它光譜儀(從儀器)上獲得其光譜AS; (2)選定母小波和小波分解的層數(shù)n,則光譜信號x可分解為
x≈v0+w0+w1+……+wn(1)
根據(jù)(1)式,可以對AM和AS進(jìn)行分解:
AM≈AM,v0+AM,w0+AM,w1+……+AM,wn(2)
AS≈AS,v0+AS,w0+AS,w1+……+AS,wn(3)
(3)用PDS算法計(jì)算AM,v0和AM,v0(v0項(xiàng)對應(yīng)的矩陣)間的轉(zhuǎn)換矩陣,PDS算法的窗口寬度選為f0。wi對應(yīng)的矩陣也用PDS算法計(jì)算轉(zhuǎn)換矩陣,窗口寬度由公式fi=2if0計(jì)算得到; (4)在從儀器上測定預(yù)測集的近紅外光譜,按步驟(2)選擇的參數(shù)進(jìn)行分解,用步驟(3)中的轉(zhuǎn)換矩陣對各層小波系數(shù)進(jìn)行校正,然后對校正后的小波系數(shù)進(jìn)行重構(gòu)。
3 實(shí)驗(yàn)部分
3.1 樣品性質(zhì)的測定及光譜的采集
混胺是一種液體燃料,由三乙胺和二甲苯胺各約50%組成,易揮發(fā)、易吸濕,在貯存過程中各成分會發(fā)生變化。本研究從各化驗(yàn)室采集不同存貯周期的混胺樣品68份,用0.5 mol/L HCl和0.5 mol/L NaOH標(biāo)準(zhǔn)溶液,采用返滴定電位分析測定二甲苯胺含量。
分別用兩臺TH2000型近紅外光譜儀(分別記作TH2000a和TH2000b,北京英賢公司)測定采集到的混胺樣品的光譜。近紅外光譜配備2048 象元線形陣列CCD 檢測器,分辨率優(yōu)于1.5 nm,光譜采集范圍700~1100 nm,數(shù)據(jù)間隔0.2 nm。測量時(shí)將混胺樣品倒入5 cm玻璃樣品池,穩(wěn)定8 min,以空氣為參比進(jìn)行光譜掃描,掃描10次取平均值。
第6期王菊香等: 小波多尺度分段直接校正法用于近紅外光譜模型傳遞的研究
3.2 評價(jià)參數(shù)
采用校正標(biāo)準(zhǔn)偏差(SEC)、預(yù)測標(biāo)準(zhǔn)偏差(SEP)和決定系數(shù)(R2)評價(jià)PLS模型的質(zhì)量,當(dāng)SEC和SEP較小且比較接近時(shí),PLS模型精度較高,穩(wěn)健性較好。采用光譜平均差異(ARMS)評價(jià)傳遞性能[9]。ARMS能反映不同儀器間的光譜差異,ARMS越大,儀器差異越明顯。
4 結(jié)果與討論
4.1 主儀器上PLS模型的建立
將68個(gè)混胺樣品,按二甲苯胺的含量進(jìn)行排序,然后每間隔4個(gè)選1個(gè)作為預(yù)測集樣品,選出14個(gè)作為預(yù)測集,剩下54個(gè)作為校正集,兩臺儀器的校正集和驗(yàn)證集的樣品相應(yīng)一致。在兩臺儀器上分別建立PLS模型,對預(yù)測集的組分含量進(jìn)行預(yù)測。建模過程中采用“留一”交叉驗(yàn)證法確定最佳主成分?jǐn)?shù),模型參數(shù)和預(yù)測結(jié)果如表1所示。由表1可知,兩臺儀器對混胺的各組分預(yù)測的R2都大于0.98,SEC和SEP比較小且比較接近,說明兩臺儀器的性能能達(dá)到分析要求。本實(shí)驗(yàn)選擇TH2000b作為主儀器,TH2000a作為光譜模型傳遞從儀器。 4.2 轉(zhuǎn)換集樣品的選擇
在有標(biāo)樣的模型傳遞中,需要選擇轉(zhuǎn)換集樣品,根據(jù)所選樣品計(jì)算轉(zhuǎn)換矩陣。轉(zhuǎn)換集樣品數(shù)對模型傳遞效果有影響。轉(zhuǎn)換集中樣品數(shù)太少,轉(zhuǎn)換矩陣包含的轉(zhuǎn)換信息不充分;標(biāo)樣數(shù)太多,使實(shí)際應(yīng)用變得復(fù)雜。本研究采用K/S算法,從主儀器的校正集中選取標(biāo)準(zhǔn)樣品。通過ARMS對標(biāo)樣數(shù)作圖確定合適的標(biāo)樣數(shù)。
圖1為從儀器的光譜傳遞后的ARMS隨標(biāo)樣數(shù)的變化趨勢圖。隨著標(biāo)樣數(shù)的增多,ARMS逐漸下降;當(dāng)標(biāo)樣數(shù)增至5時(shí),ARMS變化幅度趨于平穩(wěn)。因此,標(biāo)樣數(shù)選取5。
圖1 預(yù)測集的ARMS隨轉(zhuǎn)換集樣品數(shù)的變化
Fig.1 Changs of average of root mean square(ARMS) with standard sample numbers
4.3 模型傳遞參數(shù)的選擇
采用“db4”作為母小波對混胺的近紅外光譜進(jìn)行小波分解,選擇WMPDS算法的傳遞參數(shù)。對于WMPDS算法,參數(shù)的選擇主要有小波的分解層數(shù)w 和PDS窗口寬度f(即WMPDS算法步驟(3)中的f0)。在PDS算法進(jìn)行傳遞時(shí),如果f過小,選定的光譜數(shù)據(jù)會遺漏儀器間的差異,傳遞性能較差;如果f過大,選定的光譜數(shù)據(jù)將含有與儀器無關(guān)的信息,不僅計(jì)算量大,而且存在“過校正”現(xiàn)象,傳遞性能變差。小波分解的層數(shù)與分析的精度要求及光譜的信噪比有關(guān)。本研究考察小波分解層數(shù)的變化范圍為1~6,PDS窗口寬度的范圍為3~17,間隔為2點(diǎn)。用WMPDS算法校正預(yù)測集在從儀器上測定的光譜,ARMS隨兩者的變化如表2所示。當(dāng)固定w時(shí),ARMS隨f增加而減小,在某個(gè)寬度達(dá)到最小。然后, ARMS隨f增加而增大;當(dāng)固定f時(shí),ARMS隨w的變化也是先減小后增大,存在極小值。WMPDS的最佳參數(shù)為w=4,f=13。
4.4 模型傳遞結(jié)果分析 圖2 WMPDS傳遞前后的近紅外光譜圖
Fig. 2 NIR spectra of mixed amine before and after calibration transfer by WMPDS
圖2為混胺樣品在主儀器和從儀器上測定的光譜及用WMPDS算法校正后的光譜,其中WMPDS的參數(shù)為w=4,f=13。觀察在主、從儀器上測量得到的樣品的光譜圖,可以看出兩臺儀器測量的光譜之間的差異是非常明顯的;經(jīng)過WMPDS校正后,光譜差異不明顯。
為了進(jìn)一步說明WMPDS的傳遞效果,分別用主儀器模型對預(yù)測集在從儀器上測得的光譜和經(jīng)過WMPDS算法校正過后的光譜進(jìn)行預(yù)測,預(yù)測結(jié)果如表3所示。經(jīng)WMPDS校正后,水分含量的SEP由0.110降到0.044,R2由0.365提高到0.894;三乙胺含量的SEP由0.881降到0.368,R2由0.605提高到0.933;二甲苯胺含量的SEP由0.769降到0.425,R2由0.799提高到0.938。結(jié)果表明: WMPDS能明顯改善模型的分析精度。圖3為經(jīng)WMPDS傳遞前后三乙胺含量預(yù)測值與標(biāo)準(zhǔn)方法測定值的相關(guān)圖。經(jīng)WMPDS校正后,對預(yù)測集的預(yù)測效果明顯提高。
Fig.3 Correlation of triethylamine between test and NIR predicted before and after calibration transfer by WMPDS
4.5 與PDS傳遞結(jié)果的比較
PDS算法的校正步驟:采用K/S算法在校正集中選擇轉(zhuǎn)換樣品集,通過PDS算法計(jì)算轉(zhuǎn)換矩陣,然后在對預(yù)測集的光譜進(jìn)行校正,轉(zhuǎn)換集大小和PDS寬度通過ARMS最小的原則選出。在PDS校正的過程中,選擇的轉(zhuǎn)換集大小為5,窗口寬度為13,與WMPDS的最優(yōu)參數(shù)w=4,f=13比較可知,WMPDS的傳遞過程相對于PDS并未簡化。分別用PDS算法和WMPDS算法對預(yù)測集在從儀器測得的光譜進(jìn)行模型轉(zhuǎn)移,然后在主儀器的模型上對混胺的各組分進(jìn)行預(yù)測,預(yù)測結(jié)果如表4所示。
由表4可知,無論是對水分含量,還是對三乙胺含量或二甲苯胺含量的預(yù)測,WMPDS的傳遞精度均好于PDS。說明在WMPDS算法中,通過小波變換把不同差異(可以理解為頻率)分解,用動態(tài)的窗口寬度進(jìn)行轉(zhuǎn)移后,傳遞結(jié)果優(yōu)于固定窗口寬度PDS算法。
綜上可知:(1)WMPDS算法用于混胺的近紅外光譜模型傳遞,能有效扣除不同近紅外光譜儀之間的差異,提高模型分析精度,實(shí)現(xiàn)不同儀器間模型的共享。(2)與傳統(tǒng)的PDS算法相比,WMPDS的傳遞過程未得到優(yōu)化,但傳遞精度顯著提高。
References
1 ZHANG Xue-Bo, FENG Yan-Chuan, HU Chang-Qin(張學(xué)博,馮艷春,胡昌勤). Chin. J. Plarm. Anal.(藥物分析雜志), 2009, 29(8): 1390~1399
2 CHU Xiao-Li, YUAN Hong-Fu, LU Wan-Zhen(褚小立,袁洪福,陸婉珍). Spectroscopy and Spectral Analysis(光譜學(xué)與光譜分析), 2001, 21(6): 881~885
3 LU Wan-Zhen(陸婉珍). Medern Analysis Technique of NIR(現(xiàn)代近紅外光譜分析技術(shù)). Beijing(北京): Sinica Petro Chemistry Press(中國石化出版社), 2007: 89
4 CHU Xiao-Li, YUAN Hong-Fu, LU Wan-Zhen(褚小立,袁洪福,陸婉珍). Chinese J. Anal. Chem.(分析化學(xué)), 2002, 30(1): 114~119
5 LI Qing-Bo, ZHANG Guang-Jun, XU Ke-Xin, WANG Yan(李慶波,張廣軍,徐可欣,汪 彥). Spectroscopy and Spectral Analysis(光譜學(xué)與光譜分析), 2007, (5): 873~876
6 Griffiths M L, Svozil D, Worsfold P, Evans E H. Journal of Analytical Atomic Spectrometry, 2006, 21(10): 1045~1052
7 Tortajada-Genaro L A, Campins-Falco P. Talanta, 2007, 72(3): 1004~1012
8 WANG Yan-Bin, YUAN Hong-Fu, LU Wan-Zhen(王艷斌,袁洪福,陸婉珍). Spectroscopy and Spectral Analysis(光譜學(xué)與光譜分析), 2005, 25(3): 398~401
9 TIAN Gao-You, CHU Xiao-Li, YUAN Hong-Fu, LU Wan-Zhen(田高友,褚小立,袁洪福,陸婉珍). Chinese J. Anal. Chem.(分析化學(xué)), 2006, 34(7): 927~932
10 TAN Chao, QIN Xin, WU Tong(譚 超,覃 鑫,吳 同). Computers and Applied Chemistry(計(jì)算機(jī)與應(yīng)用化學(xué)), 2009, 26(5): 645~648
11 ZHANG Rui-Feng(張瑞豐). Wavelet Analysis and Project Application with Matlab(Matlab小波分析與工程應(yīng)用). Beijing(北京): National Defense Industry Press(國防工業(yè)出版社), 2008: 5~10
Application of Wavelet Multi-Scale Piecewise Direct Standardization on
Near Infrared Analysis Calibration
WANG Ju-Xiang1, LI Hua2, XING Zhi-Na1, GUO Heng-Guang1
1(Department of Airborne Vehicle Engineering, Naval Aeronautical and Astronautical, Yantai 264001)
2(The 91388th Unit PLA, Zhanjiang 524000)
Abstract Piecewise direct standardization (PDS) is the most popular method on near infrared analysis calibration transfer. One of the disadvantages of PDS is that the window widths are the same in the whole near infrared (NIR) spectral wavelengths as the window width is too large in some spectra region and too small in the others. A new calibration transfer method based on PDS was proposed to improve the calibrated results, the new method is wavelet multi-scale piecewise direct standardization (WMPDS). It was used for calibration transfer in NIR analysis of mixed amine. Wavelet transfer (WT) was conducted to discompose NIR data and then PDS was applied to correct the wavelet coefficients. The window widths of PDS were changed as the wavelet coefficients changed and the reconstruction of the coefficient was next to the correction of PDS. WMPDS can well correct the differences between instruments and improve analytical accuracy greatly. The performance of WMPDS is better than that of PDS in NIR calibration transfer.
Keywords Near infrared; Calibration transfer; Wavelet multi-scale piecewise direct standardization
(Received 21 May 2010; accepted 11 December 2010)