劉 龍,范賢光, 2*,康哲銘,吳 怡,王 昕, 2*
1. 廈門大學(xué)航空航天學(xué)院儀器與電氣系,福建 廈門 361005 2. 傳感技術(shù)福建省高等學(xué)校重點(diǎn)實(shí)驗(yàn)室,福建 廈門 361005
拉曼散射又稱拉曼效應(yīng),是一種基于激光的光譜技術(shù),由印度物理學(xué)家拉曼(Raman)[1]于1928年首先發(fā)現(xiàn)。作為一種鑒定分子結(jié)構(gòu)的重要手段,拉曼光譜可提供有關(guān)分子振動的定量信息,可用于研究組織和細(xì)胞內(nèi)分子的化學(xué)組成和結(jié)構(gòu)。同時,拉曼光譜又具備無損傷、無需標(biāo)記等優(yōu)點(diǎn),在生物醫(yī)藥、食品監(jiān)測以及各種疾病診斷等多個領(lǐng)域得到廣泛應(yīng)用[2-3]。
然而,由于自發(fā)拉曼信號很弱,僅為原始激發(fā)光信號強(qiáng)度的10-8左右,在利用拉曼光譜儀測試中,不可避免的受到熒光背景干擾,出現(xiàn)基線漂移現(xiàn)象,嚴(yán)重影響拉曼光譜的分析應(yīng)用能力。因此,減少基線漂移,提高拉曼光譜信號的信噪比,變得至關(guān)重要。目前,解決該問題的主要策略分為兩大類: 改進(jìn)實(shí)驗(yàn)方法和數(shù)值處理。改進(jìn)實(shí)驗(yàn)方法中,有偏振調(diào)制法,高頻調(diào)制法和門控法等[4-6]。雖然可以在一定程度上減少基線漂移,但是其結(jié)構(gòu)復(fù)雜、造價昂貴,一般由實(shí)驗(yàn)室自行搭建,用于前沿科學(xué)研究,推廣難度相對較大。數(shù)值處理中,有頻域?yàn)V波、小波變換和曲線擬合等[7-10]。頻域?yàn)V波是對拉曼信號進(jìn)行傅里葉變換,然后設(shè)計合適濾波器進(jìn)行濾波處理的方法。盡管頻域?yàn)V波有一定的效果,但是這種方法可能造成拉曼光譜的人為扭曲,且參數(shù)設(shè)計復(fù)雜。小波變換是對拉曼信號作分解處理,得到一系列不同頻率正弦波,實(shí)現(xiàn)基線去除的目標(biāo)。然而,不同拉曼光譜的噪聲和基線頻率不盡相同,尋找一個通用的分解方法比較困難,且計算量和計算復(fù)雜度也相對較高。曲線擬合是將拉曼信號中的基線通過多項式擬合出來,然后從拉曼光譜中去除。但是,擬合階數(shù)不易確定,且容易導(dǎo)致欠擬合或過擬合現(xiàn)象的發(fā)生。階數(shù)選擇過少,會導(dǎo)致欠擬合; 階數(shù)選擇過多,會導(dǎo)致過擬合。為實(shí)現(xiàn)拉曼信號基線的完美去除,需要對信號進(jìn)行大量的嘗試,計算量相對較大且耗時。本文在不增加實(shí)驗(yàn)設(shè)備成本的前提下,針對傳統(tǒng)基線校正的方法進(jìn)行了改進(jìn),提出一種基于自適應(yīng)加窗spline曲線擬合的拉曼光譜去基線方法,該方法不僅可以夠克服擬合階數(shù)不易確定和計算復(fù)雜的難題,而且還具備樣條曲線平滑去噪的優(yōu)點(diǎn)。有效地消除拉曼光譜信號的基線漂移,較好的保留一些較弱的拉曼特征峰,為進(jìn)一步分析光譜數(shù)據(jù)和實(shí)現(xiàn)拉曼成像提供準(zhǔn)確可靠的信息。
spline曲線擬合是將一些指定點(diǎn)連接成一條光順曲線,具有樣條曲線平滑和計算相對簡單的優(yōu)點(diǎn),廣泛應(yīng)用于船體和機(jī)翼外形設(shè)計等對光滑性要求較高的造型中[11-12]。其中,3次樣條函數(shù),不僅有著較高的精度,而且方便操作。在本文中,將其用于拉曼光譜基線的擬合。
待擬合區(qū)間[a,b]分為n段:a=x0 S(x)=S(xj)=aj+bjx+cjx2+djx3, x∈[xj,xj+1] (j=0, 1, …,n-1) (1) 其中,共有4n個待定系數(shù),且滿足如下的條件。 (2) 考慮到本文是實(shí)現(xiàn)拉曼光譜的基線擬合,首尾兩端處需要具備有連續(xù)性和光滑性,所以在首尾兩端滿足第一種邊界條件: 給定y=f(x)在端點(diǎn)的一階導(dǎo)數(shù)。 (3) 聯(lián)立式(1),式(2)和(3),即可求得三次樣條函數(shù)S(x)。 3次樣條函數(shù)S(x)具備樣條曲線平滑的特點(diǎn),使用其擬合拉曼光譜基線的同時,又可實(shí)現(xiàn)對基線的平滑作用,達(dá)到一定的去噪功能。故此,本文基于3次樣條函數(shù)S(x),提出了基于自適應(yīng)加窗spline曲線擬合算法校正基線,其原理如圖1所示。利用3次spline函數(shù)擬合算法,通過自適應(yīng)加窗去基線峰值循環(huán)迭代,不斷逼近光譜信號基線,原始信號扣線基線后,即可實(shí)現(xiàn)基線校正后的光譜。信號處理方法的基本步驟如下: (1) 輸入原始拉曼信號R(n維向量)和拉曼峰值搜索的初始步長step1; (2) 利用譜峰識別算法,對R以step1進(jìn)行初始搜索,得到R峰值坐標(biāo)集合。并以概率統(tǒng)計的方法,估算峰值出現(xiàn)頻率最多的頻段位置,得到優(yōu)化的峰值搜索步長step2。再以step2重復(fù)上述操作,得到拉曼光譜谷值搜索的優(yōu)化步長step3; (3) 借助譜谷識別算法,對R以step3進(jìn)行搜索,得到R谷值坐標(biāo)集合,利用spline函數(shù)擬合基線r。再以概率統(tǒng)計的方法,估算谷值出現(xiàn)頻率最多的頻段位置,得到初始加窗函數(shù)的寬度Win_step; (4) 再次利用譜峰識別算法,對r以step3進(jìn)行搜索,得到r峰值坐標(biāo)集合,并在峰值位置,對稱加窗去峰值。為防止出現(xiàn)邊緣效應(yīng),對r兩端附近出現(xiàn)的峰值加半窗處理。然后利用spline函數(shù)擬合基線,得到r1。逐點(diǎn)比較r1和R,取較小的點(diǎn)賦值給r1; (5) 返回步驟(4)繼續(xù)執(zhí)行,并重新賦值step3=step3/i,Win_step=Win_step/i,其中i是循環(huán)次數(shù)。直至自適應(yīng)窗函數(shù)寬度Win_step低于閾值Win_min; (6) 校正后的光譜信號Rcorrect=R-r1。 圖1 自適應(yīng)加窗spline曲線擬合去基線流程圖Fig.1 Process of baseline fitting by adaptive windowed spline fitting 選用乙酸丁酯、PMMA作為實(shí)驗(yàn)樣品。實(shí)驗(yàn)儀器選用由QE65Pro,拉曼光纖探頭,激光器組成的模塊化拉曼系統(tǒng)。其中,叉光纖一端接785nm激光器,另一端接光譜儀。 將實(shí)驗(yàn)樣品乙酸丁酯,PMMA分別置于比色皿和自封袋中,設(shè)定激光功率為500 mW, 積分時間為10 s,利用實(shí)驗(yàn)室搭建的模塊化拉曼系統(tǒng),完成樣品測試,獲得原始拉曼光譜數(shù)據(jù)R。其中光譜拉曼位移范圍為200~3 300 cm-1,光譜分辨率為1 cm-1。在拉曼光譜擬合基線前,首先設(shè)定合適的拉曼峰值搜索的初始步長step1。基于譜峰識別算法,經(jīng)優(yōu)化搜索得: step1設(shè)定在40~80cm-1范圍最優(yōu)。本文中選用step1為70 cm-1,完成初始基線r的擬合,如圖2所示。 然后,利用本文算法完成對初始基線的進(jìn)一步擬合,如圖3所示。由圖3可知,擬合基線能夠很好的通過原始拉曼信號各谷值點(diǎn),同時擬合基線在拉曼光譜信號特征峰集中的位置區(qū)間能夠很好地捕捉到各個特征峰基點(diǎn); 在特征峰分散的位置區(qū)間,又能夠很好地與原始光譜信號逼近,且基線整體變化平緩。 圖2 原始拉曼光譜和初始基線r (a): 乙酸丁酯; (b): PMMAFig.2 Original spectra and its original baseline r (a): n-Butyl acetate; (b): PMMA 圖3 原始拉曼光譜和自適應(yīng)加窗spline曲線擬合基線 (a): 乙酸丁酯; (b): PMMAFig.3 Original spectra and its baseline by adaptive window spline fitting (a): n-Butyl acetate; (b): PMMA 最后,基于求得的擬合基線,完成拉曼光譜信號基線的校正,如圖4所示。由圖4可知,本文算法校正基線后的拉曼光譜,很好地保留了光譜信號的特征峰段信息。同時,沒有出現(xiàn)多余的波峰,且較好的保留一些較弱的拉曼特征峰,可以用于進(jìn)一步的消噪平滑以及特征峰的識別和匹配。這為本文算法的可行性和良好性能提供了有力的證明。 圖4 自適應(yīng)加窗spline曲線擬合去除基線 (a): 乙酸丁酯; (b): PMMAFig.4 Raman spectra after the baseline correction by adaptive window spline fitting (a): n-Butyl acetate; (b): PMMA 為進(jìn)一步驗(yàn)證本文算法的良好性能,選取傳統(tǒng)多項式擬合方法,零相位高通濾波器[13]和BEADS[14]算法(Baseline estimation and denoising with sparsity)進(jìn)行比較,圖5給出了三種算法校正乙酸丁酯基線的結(jié)果。其中,圖5(a)給出了多項式擬合基線的結(jié)果。由于多項式階數(shù)對基線擬合結(jié)果有較大的影響,本文采用三階和六階作為擬合對照組。由圖5(a)可看出,對于樣品乙酸丁酯的光譜信號,在使用三階多項式擬合基線時,在拉曼位移為2 200 cm-1左右兩側(cè)出現(xiàn)了明顯的過擬合和欠擬合現(xiàn)象,擬合基線基本上沒有通過光譜信號的谷值點(diǎn); 六階多項式擬合基線時,在一定程度上改善了過擬合現(xiàn)象,但是在拉曼位移為2 200~3 000 cm-1范圍,欠擬合現(xiàn)象反而嚴(yán)重。因此,傳統(tǒng)多項式擬合基線需要在階數(shù)上進(jìn)行優(yōu)化,然而擬合的階數(shù)又因樣品不同會有所差異,造成多項式擬合基線算法的通用性能不佳。 圖5(b)給出了零相位高通濾波擬合基線的結(jié)果,其中濾波器設(shè)計采用chebyschev1型。由于濾波器的階數(shù)和通帶波紋δ影響擬合結(jié)果,本文采用階數(shù)1,2,通帶波紋δ為0.1,0.5擬合四組基線。由圖5(b)可看出,在拉曼位移1 600 cm-1左右,基線發(fā)生了不同程度的過擬合和欠擬合現(xiàn)象。比較圖5(b)中的擬合基線1和3,2和4可知: 階數(shù)相同,δ越大,在拉曼位移1 600 cm-1右側(cè)的欠擬合現(xiàn)象有所改善; 比較圖5(b)中的擬合基線1和2,3和4可知: 階數(shù)越小,δ相同,在拉曼位移1 600 cm-1左側(cè)的過擬合現(xiàn)象有所改善。因此,濾波器擬合基線需要在多個參數(shù)之間進(jìn)行耦合優(yōu)化,計算較為復(fù)雜。 圖5 乙酸丁酯拉曼光譜及其基線 (a): 多項式擬合基線; (b): 零相位高通濾波擬合基線; (c): BEADS擬合基線Fig.5 Raman spectra of n-Butyl acetate and its baseline (a): Baseline by polynomial fitting; (b): Baseline by zero-phase high-pass filtering; (c): Baseline by BEADS fitting 圖5(c)給出了BEADS擬合基線的結(jié)果。BEADS算法常用于處理色譜信號,但是也可用于處理其他含有基線干擾的信號。這里用以對照,驗(yàn)證本文算法的性能。由圖5(c)可知: BEADS算法整體擬合良好,僅在拉曼位移1 170~1 210 cm-1范圍,出現(xiàn)了過擬合現(xiàn)象; 在拉曼位移600 cm-1左側(cè),出現(xiàn)了一定的欠擬合現(xiàn)象。因此,BEADS算法應(yīng)用到拉曼光譜信號基線去除時,整體性能良好,但是局部擬合結(jié)果有待提高。 綜上所述,采用基于自適應(yīng)加窗spline曲線擬合的拉曼光譜去基線方法,充分利用了spline函數(shù)的光滑特性,克服了傳統(tǒng)多項式擬合基線階數(shù)不易確定的缺陷,濾波器擬合基線參數(shù)設(shè)計復(fù)雜的弊端,和BEADS算法擬合基線局部性能不佳的瑕疵。同時,在原始光譜信號出現(xiàn)嚴(yán)重基線漂移現(xiàn)象時,本文算法仍能夠擬合出光滑的基線,且不易出現(xiàn)欠擬合和過擬合的現(xiàn)象,較好的保留一些較弱的拉曼特征峰,實(shí)現(xiàn)了較好的基線校正效果,為進(jìn)一步分析光譜數(shù)據(jù)提供準(zhǔn)確可靠的信息。 提出了一種基于自適應(yīng)加窗spline曲線擬合的拉曼光譜去基線方法,首先利用譜峰、譜谷識別算法,借助優(yōu)化搜索步長得到谷值擬合曲線,然后針對擬合曲線峰值自適應(yīng)加窗去除并利用spline樣條函數(shù)重新擬合基線,最后利用循環(huán)迭代的形式,直至窗寬小于閾值,從而實(shí)現(xiàn)對拉曼光譜信號基線校正。與傳統(tǒng)多項式擬合基線和濾波器擬合基線等相比,本文算法克服了階數(shù)難確定,參數(shù)復(fù)雜的缺陷,并且整體和局部擬合基線結(jié)果較好,通用性能強(qiáng)。同時,對于基線漂移較大的光譜信號,也能夠獲得較好的校正效果,能夠很好地避免欠擬合和過擬合現(xiàn)象。因此,本文提出的算法可以作為一種有效的基線校正方法應(yīng)用到實(shí)際中。1.2 基于自適應(yīng)加窗spline曲線擬合算法
2 實(shí)驗(yàn)部分
2.1 材料和儀器
2.2 方法
3 結(jié)果與討論
4 結(jié) 論