王書濤, 李明珊, 王玉田, 吳 興, 程 琪, 車先閣, 朱文浩
燕山大學(xué)河北省測(cè)試計(jì)量技術(shù)與儀器重點(diǎn)實(shí)驗(yàn)室, 河北 秦皇島 066004
多環(huán)芳烴(polycyclic aromatic hydrocarbons, PAHs)是指分子中存在兩個(gè)以上苯環(huán)以稠環(huán)形式相連的碳?xì)浠衔颷1], 目前已經(jīng)有200多種多環(huán)芳烴被發(fā)現(xiàn), 第一種被人們發(fā)現(xiàn)的多環(huán)芳烴是具有強(qiáng)致癌性的苯并[α]芘, 常常作為多環(huán)芳烴的代表。 多環(huán)芳烴一般都具有毒性, 致癌性, 難降解性, 長(zhǎng)時(shí)間的危害著動(dòng)物、 植物、 以及人類的健康[2]。 此類化合物常常含有兩個(gè)或兩個(gè)以上的苯環(huán), 相對(duì)分子質(zhì)量較大, 能夠通過(guò)各種方式進(jìn)入到我們?nèi)祟惖纳眢w, 導(dǎo)致體內(nèi)細(xì)胞增值速度加快, 嚴(yán)重失控, 甚至在一定程度上產(chǎn)生基因突變, 從而轉(zhuǎn)變成癌細(xì)胞[3]。 多環(huán)芳烴的主要來(lái)源是由煤、 石油、 木材以及有機(jī)高分子化合物的不充分燃燒, 大多數(shù)來(lái)自于化學(xué)工業(yè)、 交通運(yùn)輸、 日常生活等方面, 普遍存在于我們的生活環(huán)境, 甚至作物和食品中[4]。
目前, 多環(huán)芳烴的檢測(cè)方法有很多, 國(guó)內(nèi)外標(biāo)準(zhǔn)的測(cè)量方法——液相色譜法和氣相色譜法等。 王金虎等采用氣相色譜法測(cè)定2,6-二氯苯酚中單氯苯酚的含量, 各已知峰與相鄰峰間均能很好分離, 可用于2,6-二氯苯酚中雜質(zhì)的測(cè)定[5]。 張祎瑋等對(duì)比采用高效液相色譜示差折光檢測(cè)器(HPLC)和氣相色譜-質(zhì)譜聯(lián)用(GC-MS)測(cè)定柴油中芳烴含量, 結(jié)果表明, 兩種方法均有較好的摻兌準(zhǔn)確性[6]。 近年來(lái), 很多研究學(xué)者也都嘗試著對(duì)這些方法的進(jìn)行改進(jìn), 提出了更有效, 更靈敏的方法。 同時(shí)人們也在發(fā)展更多新的檢測(cè)方法, 例如, 毛細(xì)管電泳分析法, 表面增強(qiáng)拉曼散射光譜檢測(cè)(SERS), 此方法在很大程度上增強(qiáng)了拉曼強(qiáng)度[7]。
本文采用三維熒光光譜法, 該方法具有靈敏度高、 分析速度快、 所需的試樣量少, 并且適用于現(xiàn)場(chǎng)操作的特點(diǎn)。 由于不同種類的多環(huán)芳烴具有不同數(shù)量的苯環(huán)數(shù)目, 因此具有不同的光譜特性, 根據(jù)這一特點(diǎn)可以成功檢測(cè)多環(huán)芳烴[8]。 實(shí)驗(yàn)將三維熒光光譜法與平行因子算法(PARAFAC)相結(jié)合, 首先在預(yù)處理中采用集合經(jīng)驗(yàn)?zāi)B(tài)分解算法(EEMD)對(duì)苊和萘的三維熒光光譜數(shù)據(jù)進(jìn)行去噪處理, 利用平行因子算法在有干擾物的情況下對(duì)混合溶液進(jìn)行成分識(shí)別和濃度預(yù)測(cè)。
本實(shí)驗(yàn)采用全功能熒光光譜儀(英國(guó)Edinburgh公司, FS920)對(duì)樣品進(jìn)行檢測(cè), 檢測(cè)物質(zhì)的過(guò)程為: 氙燈光源發(fā)出的連續(xù)光, 通過(guò)入射單色器色散分離出特定波長(zhǎng)的激發(fā)單色光, 照射被檢測(cè)的樣品, 樣品池中的樣品被激發(fā)出熒光, 經(jīng)由發(fā)射單色器得到所需的單色熒光, 通過(guò)光電檢測(cè)器將熒光信號(hào)放大轉(zhuǎn)換為電信號(hào), 之后進(jìn)行A/D轉(zhuǎn)換, 將數(shù)字信號(hào)傳輸給計(jì)算機(jī)進(jìn)行數(shù)據(jù)處理, 得到我們所需要的光譜數(shù)據(jù)。
實(shí)驗(yàn)前需要對(duì)FS920光譜儀進(jìn)行實(shí)驗(yàn)參數(shù)的設(shè)計(jì): 激發(fā)波長(zhǎng)掃描范圍200~370 nm, 步長(zhǎng)為10 nm, 發(fā)射波長(zhǎng)掃描范圍240~390 nm, 步長(zhǎng)為2 nm, 儀器的激發(fā)和發(fā)射狹縫寬度均為2.78 mm。 為避免儀器本身的瑞利散射的影響, 設(shè)置起始的發(fā)射波長(zhǎng)滯后激發(fā)波長(zhǎng)40 nm。
本實(shí)驗(yàn)以多環(huán)芳烴中的苊(ANA)和萘(NAP)為例, 進(jìn)行熒光光譜數(shù)據(jù)的測(cè)量, 樣品均在阿拉丁官網(wǎng)購(gòu)買。 用精密電子秤稱取ANA和NAP各0.01 g, 由于ANA和NAP具有低溶解性, 故選取結(jié)構(gòu)簡(jiǎn)單的甲醇作為溶劑, 稀釋定容, 得到10 mg·L-1的一級(jí)儲(chǔ)備液。 將一級(jí)儲(chǔ)備液, 進(jìn)行不同比例的稀釋并混合, 得到ANA和NAP的混合溶液。 混合后的濃度配比如表1。
表1 混合溶液的濃度配比
采用經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)降噪時(shí)容易產(chǎn)生模態(tài)混疊現(xiàn)象, 避免此類問(wèn)題產(chǎn)生, 提出了一種新的去噪方法——集合經(jīng)驗(yàn)?zāi)B(tài)分解(EEMD)[9]。
EEMD的分解過(guò)程為:
(1)將原始信號(hào)中x(t)中加入呈正態(tài)分布的白噪聲vi(t), 即
xi(t)=x(t)+vi(t)
(1)
式中,xi(t)為第i次加入白噪聲的信號(hào),vi(t)為第i次加入的白噪聲。
(2)將信號(hào)xi(t)采用EMD方法進(jìn)行分解, 得到若干IMF分量, 記為Iij(t), 和一個(gè)余項(xiàng), 記為o(t)。 其中Iij(t)表示第i次加入白噪聲后分解得到的第j個(gè)IMF分量;
(3)重復(fù)上述兩個(gè)步驟, 每次加入新的正態(tài)分布的白噪聲序列;
(4)將得到的IMF分量做總體平均處理后, 得到EEMD分解后的最終的IMF分量, 即
(2)
式中,N為加入高斯白噪聲的次數(shù);Ij(t)為信號(hào)經(jīng)EEMD分解后得到的第j個(gè)IMF分量。
EEMD的最終分解結(jié)果為
(3)
平行因子算法(PARAFAC)是一種經(jīng)典的迭代求解算法, 因其具有方便和高效的特點(diǎn), 在很多的實(shí)驗(yàn)研究中應(yīng)用廣泛[10]。 PARAFAC基于三線性模型, 采用的是最小二乘原理實(shí)現(xiàn)三線性分解的方法, 將本文中經(jīng)實(shí)驗(yàn)得到的三維熒光數(shù)據(jù)中的多個(gè)樣本的EEM構(gòu)成一個(gè)I×J×K維的矩陣X, 根據(jù)平行因子分析原理可以將X矩陣分成A(得分矩陣)、B和C(載荷矩陣), 通過(guò)這三個(gè)矩陣對(duì)三維熒光光譜進(jìn)行解析。 分解公式如式(4)
i=1, 2, …,I;j=1, 2, …,K
(4)
其中,xijk為第i個(gè)樣品在發(fā)射波長(zhǎng)j、 激發(fā)波長(zhǎng)k處的熒光強(qiáng)度, 是矩陣X中的元素;F為表示組分?jǐn)?shù);aif為激發(fā)光譜矩陣A中的元素, 代表第k個(gè)成分在第i個(gè)激發(fā)波長(zhǎng)處的熒光強(qiáng)度;bjf為發(fā)射光譜矩陣B中的元素, 代表第f個(gè)成分在第j個(gè)發(fā)射波長(zhǎng)處的熒光強(qiáng)度;ckf為相對(duì)濃度矩陣C中的元素, 代表第k個(gè)樣本中第f個(gè)成分的相對(duì)濃度;eijk為三維殘差陣E中的元素。
當(dāng)估計(jì)組分?jǐn)?shù)與真實(shí)組分?jǐn)?shù)差別過(guò)大時(shí), 會(huì)導(dǎo)致誤差的產(chǎn)生, 因此在采用PARAFAC對(duì)混合物質(zhì)進(jìn)行分析時(shí), 需要預(yù)估組分?jǐn)?shù)。 核一致診斷法, 是通過(guò)計(jì)算平行因子分析模型中的超對(duì)角陣T和最小二乘擬合陣G之間的相似程度, 即核一致值(core-consistency)來(lái)估計(jì)組分?jǐn)?shù)[11]
core-consistency=100%×
(5)
式中F為成分?jǐn)?shù), 當(dāng)成分?jǐn)?shù)F大于正確的成分?jǐn)?shù)時(shí), 核一致值接近于0或?yàn)樨?fù)數(shù); 當(dāng)成分?jǐn)?shù)F小于或等于正確的成分?jǐn)?shù)時(shí), 核一致函數(shù)的值等于1或接近1。 規(guī)定60%作為閾值來(lái)確定成分?jǐn)?shù)。
使用FS920光譜儀對(duì)甲醇中的樣本進(jìn)行三維數(shù)據(jù)掃描, 將得到的光譜數(shù)據(jù)通過(guò)MATLAB軟件進(jìn)行處理, 生成苊和萘的激發(fā)/發(fā)射光譜圖, 三維光譜圖和等高線圖, 圖1為甲醇溶劑中苊(a)和萘(b)的等高線圖, (a)中可以看出苊有兩個(gè)熒光峰, 分別位于激發(fā)波長(zhǎng)為298 nm, 發(fā)射波長(zhǎng)為324/338 nm處, (b)中可以看出萘的熒光峰位于激發(fā)波長(zhǎng)為280 nm和發(fā)射波長(zhǎng)為322 nm處。 圖1可以看出在苊和萘的溶液中存在著溶劑甲醇的干擾, 而且光譜儀本身也存在著干擾, 因此需要對(duì)光譜數(shù)據(jù)進(jìn)行預(yù)處理。
本實(shí)驗(yàn)采用空白扣除法扣除甲醇拉曼散射的影響, 并對(duì)系統(tǒng)激發(fā)和發(fā)射光譜進(jìn)行校正。 并結(jié)合集合經(jīng)驗(yàn)?zāi)B(tài)分解(EEMD)對(duì)光譜數(shù)據(jù)進(jìn)行去噪處理。
圖2為經(jīng)過(guò)消除拉曼散射, 激發(fā)發(fā)射校正和EEMD去除噪聲后的光譜圖。
圖1 甲醇中苊(a)和萘(b)的等高線圖
圖2 預(yù)處理后苊(a)和萘(b)的等高線圖
經(jīng)過(guò)預(yù)處理后, 光譜形狀基本沒(méi)有發(fā)生改變, 熒光峰位置和熒光強(qiáng)度也基本保持不變, 并且去掉了冗余信息, 使毛刺減少, 光譜更光滑。
在實(shí)驗(yàn)中測(cè)得了9組熒光光譜數(shù)據(jù), 根據(jù)實(shí)驗(yàn)中對(duì)激發(fā)波長(zhǎng)和發(fā)射波長(zhǎng)范圍的設(shè)置, 得到了76×18的二維矩陣, 同時(shí)構(gòu)造成三線性模型X1, 其維數(shù)為9×76×18。 由于PARAFAC算法在預(yù)估計(jì)因子數(shù)時(shí)比較敏感, 在對(duì)X1進(jìn)PARAFAC解析之前, 需要正確估計(jì)樣本的成分?jǐn)?shù), 這對(duì)后續(xù)的光譜分辨有很大的影響。 采用核一致診斷法估計(jì)X1的因子數(shù), 如圖3所示為核一致診斷法估計(jì)的因子數(shù), 從圖中可知在因子數(shù)為2之后, 核一致值開(kāi)始下降到87%, 因此選擇因子數(shù)2和3都可以對(duì)X1進(jìn)行分解。
PARAFAC算法分解后會(huì)產(chǎn)生三組數(shù)據(jù), 包括各組分濃度, 分解出的單組分樣本的最佳激發(fā)和發(fā)射波長(zhǎng)數(shù)據(jù), 將三組光譜數(shù)據(jù)進(jìn)行歸一化處理, 并與歸一化后的真實(shí)的組分濃度, 苊和萘的最佳激發(fā)和發(fā)射波長(zhǎng)進(jìn)行比對(duì)。 真實(shí)的單組分苊和萘的激發(fā)發(fā)射特征光譜圖如圖4所示。
圖5為選擇因子數(shù)2時(shí)對(duì)X1分解, 并進(jìn)行歸一化處理得到的光譜圖。 與圖5所示的真實(shí)的苊和萘光譜圖進(jìn)行對(duì)比, 真實(shí)光譜中苊的最佳激發(fā)波長(zhǎng)在298 nm, 最佳發(fā)射波長(zhǎng)在324/338 nm; 萘的最佳激發(fā)波長(zhǎng)在280 nm, 最佳發(fā)射波長(zhǎng)在322 nm, 而平行因子分解得到的苊的最佳激發(fā)波長(zhǎng)在300 nm, 最佳發(fā)射波長(zhǎng)在324/338 nm; 萘的最佳激發(fā)波長(zhǎng)在270 nm, 最佳發(fā)射波長(zhǎng)在322 nm。 根據(jù)數(shù)據(jù)對(duì)比可以得出, 采用的選擇因子數(shù)2時(shí)PARAFAC算法能夠成功的將混合的多環(huán)芳烴分解出來(lái)。
圖3 核一致診斷法估計(jì)因子數(shù)
圖4 真實(shí)歸一化激發(fā)(a)和發(fā)射(b)特征光譜
圖5 2因子PARAFAC分解后的激發(fā)(a)和發(fā)射(b)特征光譜
將PARAFAC算法分解出來(lái)的樣本濃度進(jìn)行歸一化處理并且與歸一化以后的真實(shí)濃度進(jìn)行擬合, 如圖6所示苊的擬合度為95.7%, 萘的擬合度為96.7%, 擬合程度較高, 可以驗(yàn)證PARAFAC算法分解得到的分辨光譜與真實(shí)光譜有很高的擬合度, 可將苊和萘兩種物質(zhì)成功的分辨出來(lái)。
核一致診斷法判斷當(dāng)選擇因子3時(shí)仍能采用PARAFAC算法分解混合樣本, 圖7為選擇因子數(shù)3時(shí)對(duì)X1分解, 并進(jìn)行歸一化處理得到的光譜圖。
將PARAFAC算法分解出來(lái)的樣本濃度進(jìn)行歸一化處理并且與歸一化以后的真實(shí)濃度進(jìn)行擬合, 如圖8所示苊的擬合度為95.3%, 萘的擬合度為95.8%, 能夠分辨出混合樣本, 但是擬合程度低于選擇2因子。
圖6 2因子苊(a)和萘(b)的擬合圖
圖7 3因子PARAFAC分解后的激發(fā)(a)和發(fā)射(b)特征光譜
圖8 3因子苊(a)和萘(b)的擬合圖
由分解的激發(fā)發(fā)射光譜圖和樣本濃度擬合圖可知, 選擇3因子對(duì)X1進(jìn)行分解時(shí), 分解效果欠佳。
在與實(shí)驗(yàn)測(cè)得的真實(shí)濃度線性回歸的同時(shí)可以得到苊和萘的預(yù)測(cè)濃度, 通過(guò)計(jì)算得到回收率(R)和均方根誤差(RMSEP)。 回收率表示預(yù)測(cè)濃度相對(duì)真實(shí)濃度的準(zhǔn)確度, 均方根誤差對(duì)預(yù)測(cè)濃度中的特大誤差或者特小誤差比較敏感, 能夠很好地反映出預(yù)測(cè)的精密度, 其中回收率和均方根誤差公式為
(6)
(7)
式中,n為樣本數(shù);xact和xpred分別為樣本的真實(shí)濃度和預(yù)測(cè)濃度。
表2 2因子濃度預(yù)測(cè)表
選擇2因子進(jìn)行PARAFAC定量分析時(shí)結(jié)果如表2, 苊和萘的平均回收率分別是101.8%和98.9%, 均方根誤差為0.0187和0.0316, 樣本的預(yù)測(cè)濃度有較好的回收率和較低的均方根誤差, 能夠準(zhǔn)確判斷出混合樣本的各部分濃度。 選擇3因子時(shí)結(jié)果如表3, 苊和萘的回收率較低, 均方根誤差分別為0.033和0.1163, 兩個(gè)指標(biāo)均低于選擇2因子時(shí)的結(jié)果。
表3 3因子濃度預(yù)測(cè)表
由于多環(huán)芳烴長(zhǎng)期危害人類健康, 為有效地對(duì)多環(huán)芳烴進(jìn)行檢測(cè), 本研究以苊和萘為例采用三維熒光光譜法對(duì)這兩種物質(zhì)進(jìn)行分析。 首先采用EEMD對(duì)光譜數(shù)據(jù)進(jìn)行預(yù)處理, 去掉光譜噪聲的干擾, 然后基于PARAFAC算法對(duì)苊和萘多組分體系進(jìn)行有效的定性定量分析, 得到較好的擬合度, 高回收率和低均方根誤差。 結(jié)果表明三維熒光光譜法結(jié)合PARAFAC算法能夠有效地檢測(cè)環(huán)境中的多環(huán)芳烴, 為環(huán)境檢測(cè)提供了依據(jù)。