蔡靖
摘 要: 為了更好地保護(hù)環(huán)境,將激光光譜技術(shù)應(yīng)用于環(huán)境污染的檢測中。采用激光光譜技術(shù)對環(huán)境中的污染物濃度進(jìn)行檢測,得到相應(yīng)的光譜數(shù)據(jù),并對光譜數(shù)據(jù)進(jìn)行預(yù)處理,然后采用主成分分析降低數(shù)據(jù)規(guī)模,并采用支持向量機對光譜數(shù)據(jù)進(jìn)行回歸分析,建立污染物濃度檢測模型,通過貓群算法對支持向量機參數(shù)進(jìn)行優(yōu)化,最后應(yīng)用于對水體污染物的總有機碳濃度檢測。仿真結(jié)果表明,該模型可以對環(huán)境污染物的濃度進(jìn)行高精度檢測,能夠快速實現(xiàn)環(huán)境中的污染物濃度檢測,實際應(yīng)用價值高。
關(guān)鍵詞: 激光技術(shù); 光譜分析; 支持向量機; 主成分分析; 污染物濃度檢測
中圖分類號: TN2?34; X832 文獻(xiàn)標(biāo)識碼: A 文章編號: 1004?373X(2017)11?0179?04
Application of laser spectroscopy technology in environmental monitoring
CAI Jing
(School of Chemical and Materials Engineering, Yanching Institute of Technology, Langfang 065201, China)
Abstract: In order to better protect the environment, the laser spectrum technology is applied to the detection of environmental pollution. The laser spectroscopy technology is used to detect the pollutant concentration in environment to get the corresponding spectral data, and preprocess the spectral data. The principal component analysis is adopted to reduce the data size. The support vector machine is employed to perform the regression analysis for spectral data. The pollutant concentration detection model was established. The cat swarm algorithm is used to optimize the parameters of support vector machine. The model is applied to the total organic carbon concentration detection of water pollutant. The simulation results show that the model can perform the high?precision detection for concentration of environmental pollutant, detect the pollutant concentration in the environment quickly, and has high practical application value.
Keywords: laser technology; spectral analysis; support vector machine; principal component analysis; pollutant concentration detection
0 引 言
隨著我國經(jīng)濟(jì)的飛速發(fā)展,企業(yè)越來越多,環(huán)境污染越來越嚴(yán)重,如何對環(huán)境中的污染物進(jìn)行有效檢測,引起了人們的高度關(guān)注,而有機污染濃度檢測是環(huán)境監(jiān)測的一個重要研究方向[1?2]。
為了準(zhǔn)確對有機污染濃度檢測,國內(nèi)外學(xué)者們進(jìn)行了廣泛的研究,提出了一些有機污染濃度檢測模型[3]。激光光譜技術(shù)通過光譜強度描述有機污染濃度,因此成為當(dāng)前一個研究熱點[4]。有學(xué)者提出采用激光光譜和多元線性回歸相融合的有機污染濃度檢測模型,通過多元線性回歸對有機污染濃度和激光光譜強度之間的關(guān)系進(jìn)行建模,得到了較高的檢測精度[5]。然而多元線性回歸計算復(fù)雜度高,不能滿足有機污染濃度的線檢測需求[6]。有學(xué)者提出采用激光光譜和偏最小二乘法建立有機污染濃度檢測模型,得到了較高的檢測精度[7]。由于偏最小二乘法是一種線性分析方法,當(dāng)有機污染濃度和激光光譜強度呈現(xiàn)非線性關(guān)系時,檢測精度低,檢測結(jié)果極不可靠[8]。隨后有學(xué)者提出神經(jīng)網(wǎng)絡(luò)、支持向量機的有機污染濃度檢測模型,相對其他有機污染濃度檢測模型[9?10],它們獲得了更優(yōu)的有機污染濃度檢測結(jié)果,檢測結(jié)果更加有說服力,然而在實際應(yīng)用中,神經(jīng)網(wǎng)絡(luò)要求收集大量的有機污染濃度檢測樣本,增加了實驗次數(shù),導(dǎo)致有機污染濃度檢測成本急劇增加,難以應(yīng)用于實踐。支持向量機沒有神經(jīng)網(wǎng)絡(luò)的大樣本要求,可以進(jìn)一步降低有機污染濃度檢測效果[11]。激光光譜信息中存在大量的重疊信息,這些重疊信息相當(dāng)于噪聲信息,會對有機污染濃度檢測結(jié)果產(chǎn)生干擾,因此需要消除這些重疊信息。
為了提高環(huán)境的有機污染濃度檢測精度,利用激光光譜技術(shù)、主成分分析以及支持向量機的優(yōu)點,提出一種新型的有機污染濃度檢測模型,首先采用主成分分析對光譜信息進(jìn)行降維,提取主要成分,然后采用貓群算法優(yōu)化支持向量機建立污染物濃度檢測模型,實驗結(jié)果表明,該模型提高了有機污染濃度檢測精度,而且獲得了比其他模型更優(yōu)的檢測效果。
1 相關(guān)理論
1.1 主成分分析
主成分分析算法可以將原始數(shù)據(jù)從高維空間映射到低維空間,簡化原始數(shù)據(jù),保持原始數(shù)據(jù)的基本信息[9]。通過主成分分析對原始數(shù)據(jù)處理后,數(shù)據(jù)規(guī)模變小,而且數(shù)據(jù)之間相互獨立,不存在重復(fù)信息,有利于后續(xù)處理,工作步驟如下:
Step1:設(shè)原始數(shù)據(jù)共有個樣本,每一個樣本均有維,那么相應(yīng)的矩陣為對所有數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,避免數(shù)量級不同帶來的干擾,無量綱后的數(shù)據(jù)矩陣為;
Step2:計算的協(xié)方差矩陣具體如下:
(1)
Step3:計算矩陣的特征值和特征向量
Step4:主成分的貢獻(xiàn)率和累計貢獻(xiàn)率為:
(2)
(3)
Step5:根據(jù)累計方差貢獻(xiàn)率確定主成分?jǐn)?shù)量,通常累計方差貢獻(xiàn)率要超過85%;
Step6:根據(jù)主成分因子載荷矩陣得到原始數(shù)據(jù)的組合形式為:
(4)
式中為主成分的值。
1.2 支持向量機
設(shè)訓(xùn)練樣本為那么可以得到如下方程:
(5)
式中:和分別代表權(quán)向量和偏置向量。
采用松弛因子和懲罰因子優(yōu)化式(5)的目標(biāo)值,則可得到:
(6)
根據(jù)拉格朗日乘子和得到凸二次優(yōu)化問題,具體形式為:
(7)
式(5)的對偶形式為:
(8)
相應(yīng)的約束條件如下:
(9)
通過上述過程,得到支持向量機的回歸形式為:
(10)
通過引入核函數(shù)可以有效防止出現(xiàn)“維數(shù)災(zāi)”問題,式(10)變?yōu)椋?/p>
(11)
1.3 貓群算法
貓群算法(CSO)是一種類似于遺傳算法的啟發(fā)式算法,受到貓日常行為啟示提出來的,包括搜尋模式和跟蹤模式,工作步驟如下:
Step1:初始化貓群;
Step2:將貓群進(jìn)行分組,一部分貓為搜尋模式,其他為跟蹤模式;
Step3:不同模式的貓執(zhí)行不同操作模式;
Step4:對貓速度和位置進(jìn)行更新操作;
Step5:估計每一個貓的適應(yīng)度值,找出適應(yīng)度值最高的貓;
Step6:如果滿足終止條件,輸出最優(yōu)解;否則返回Step2繼續(xù)執(zhí)行。
2 有機污染濃度檢測模型的工作步驟
Step1:采用激光光譜儀對有機污染濃度值進(jìn)行采樣和測量,得到相應(yīng)的實驗數(shù)據(jù)。
Step2:受到樣本背景、雜散光等的干擾,數(shù)據(jù)中存在一些無用信息和噪聲,采用標(biāo)準(zhǔn)正態(tài)變量變換法提取有效數(shù)據(jù),具體為:
(12)
Step3:采用主成分分析對處理后的數(shù)據(jù)進(jìn)行分析,選擇一些主要成分去除數(shù)據(jù)之間的重復(fù)信息。
Step4:根據(jù)提取主要成分對原始數(shù)據(jù)進(jìn)行簡化處理,減少數(shù)據(jù)的規(guī)模,并將它們分為測試樣本和訓(xùn)練樣本。
Step5:采用訓(xùn)練樣本對支持向量機進(jìn)行學(xué)習(xí),并采用貓群算法對支持向量機相關(guān)參數(shù)進(jìn)行在線優(yōu)化,建立有機污染濃度的檢測模型。
Step6:對測試樣本進(jìn)行檢測,得到有機污染濃度檢測精度。
具體工作流程如圖1所示。
圖1 有機污染濃度檢測模型的工作流程
3 仿真測試
3.1 數(shù)據(jù)源
選擇某污水處理廠作為研究對象,激光光譜的波長范圍為180~187 nm,收集水體總有機碳(COD)進(jìn)行仿真實驗,收集到80個樣本,如圖2所示。30個樣本作為測試樣本統(tǒng)計有機污染濃度檢測精度。
3.2 采用主成分處理數(shù)據(jù)
采用主成分分析對原始數(shù)據(jù)進(jìn)行處理,得到的結(jié)果如圖3所示,從圖3可知,當(dāng)主成分?jǐn)?shù)量為8時,累計貢獻(xiàn)率超過85%,因此,采用8個主成分作為支持向量機的輸入,建立有機污染濃度檢測模型。
3.3 支持向量機核函數(shù)及參數(shù)確定選擇
在支持向量機的有機污染濃度檢測建模過程中,核函數(shù)及參數(shù)選擇至關(guān)重要,當(dāng)前有許多類型不同的核函數(shù),常用核函數(shù)有多項式、徑向基函數(shù)等,它們具體為:
(13)
(14)
圖2 COD的濃度
圖3 主成分分析的結(jié)果
對多項式函數(shù)、徑向基函數(shù)的性能進(jìn)行分析,得到的曲線如圖4,圖5所示,從圖4和圖5可以發(fā)現(xiàn),相對于多項式函數(shù),徑向基函數(shù)的學(xué)習(xí)能力強,因此選擇徑向基函數(shù)建立有機污染濃度檢測模型。
圖4 徑向基函數(shù)的曲線圖
采用貓群算法對徑向基函數(shù)的參數(shù)和支持向量機參數(shù)進(jìn)行優(yōu)化,得到最優(yōu)值為采用和建立有機污染濃度檢測模型。
3.4 實驗結(jié)果與分析
選擇文獻(xiàn)[11?12]的模型進(jìn)行對比實驗,采用均方根誤差(RMSE)和相關(guān)系數(shù)對有機污染濃度檢測精度進(jìn)行分析,它們的定義如下:
(15)
(16)
圖5 多項式函數(shù)的曲線
不同模型的RMSE和的結(jié)果如表1所示,對表1進(jìn)行對比和分析可以發(fā)現(xiàn),相對于文獻(xiàn)[11?12]的有機污染濃度檢測模型,本文模型的RMSE的值更高,這表明有機污染濃度檢測精度更高,而值更大,表明本文模型的有機污染濃度檢測結(jié)果與實際值更加接近,可以更準(zhǔn)確地描繪有機污染濃度和激光光譜強度之間的關(guān)系,具有明顯的優(yōu)勢。
表1 不同模型網(wǎng)絡(luò)流量預(yù)測誤差比較
[模型名稱 RMSE 文獻(xiàn)[11]模型 16.60 0.947 文獻(xiàn)[12]模型 15.39 0.952 本文模型 13.46 0.969 ]
4 結(jié) 語
為了提高環(huán)境污染物檢測的準(zhǔn)確性,采用激光光譜技術(shù)提取污染物濃度的光譜數(shù)據(jù),并采用主成分分析提取重要數(shù)據(jù),然后采用支持向量機對光譜數(shù)據(jù)進(jìn)行回歸分析,最后進(jìn)行了具體水體污染濃度檢測實驗,結(jié)果表明,本文模型提高了環(huán)境污染物濃度的檢測精度,具有一定的實際應(yīng)用價值。
參考文獻(xiàn)
[1] KESHAVNA N, MUSTARD J F. Spectral unmixing [J]. IEEE signal processing magazine, 2002, 19(1): 44?57.
[2] PLAZA A, DU Q, BIOUCAS?DIAS J M, et al. Foreword to the special issue on spectral unmixing of remotely sensed data [J]. IEEE transactions on geoscience and remote sensing, 2011, 49(11): 4104?4111.
[3] BIOUCAS?DIAS J M, PLAZ A, DOBIGEON N, et al. Hyperspectral unmixing overview: geometrical, statistical, and sparse regression?based approaches [J]. IEEE journal of selected topics in applied earth observations and remote sensing, 2012, 5(2): 354?379.
[4] 徐霞,成芳,應(yīng)義斌.近紅外光譜技術(shù)在肉品檢測中的應(yīng)用和研究進(jìn)展[J].光譜學(xué)與光譜分析,2009,29(7):1876?1880.
[5] 任曉東,雷武虎.基于光譜區(qū)分法的高光譜核異常檢測算法[J].光子學(xué)報,2016,45(3):3?7.
[6] 褚小力,袁洪福,陸婉珍.用于石化工業(yè)的光譜和波譜類過程分析技術(shù)[J].現(xiàn)代科學(xué)儀器,2006(3):8?13.
[7] 于意仲,周小玉,張帆,等.紫外差分光學(xué)吸收法測量污染氣體的實驗研究[J].環(huán)境科學(xué)學(xué)報,2003,23(5):630?634.
[8] 劉文清,崔志成,劉建國,等.大氣痕量氣體測量的光譜學(xué)和化學(xué)技術(shù)[J].量子電子學(xué)報,2004,21(2):202?210.
[9] 杜樹新,蔣丹紅,李林軍.基于支持張量機回歸的三維熒光光譜法水體有機污染物濃度檢測[J].高技術(shù)通訊,2014,24(1):80?85.
[10] 杜樹新,杜陽鋒,武曉莉.基于三維熒光導(dǎo)數(shù)光譜的水體有機污染物濃度檢測[J].光譜學(xué)與光譜分析,2010,30(12):3268?3271.
[11] 聶勁松,張為俊,楊勇,等.激光光譜技術(shù)在環(huán)境監(jiān)測中的應(yīng)用專題系列(Ⅳ)激光光譜學(xué)方法測量大氣中OH自由基[J].物理,2002,31(1):31?35.
[12] 吳元清,杜樹新,嚴(yán)赟.水體有機污染物濃度檢測中的紫外光譜分析方法[J].光譜學(xué)與光譜分析,2011,31(1):233?237.