梁子躍,楊 昊,黃燦燦,周 建,江正偉,方志明
(1.中國(guó)計(jì)量大學(xué) 信息工程學(xué)院,浙江 杭州310018;2.浙江清華長(zhǎng)三角研究院,浙江 嘉興314006;3.衢州市環(huán)境監(jiān)測(cè)中心站,浙江 衢州324000)
電子鼻的混合氣體分類研究
梁子躍1,楊 昊1,黃燦燦2,周 建3,江正偉3,方志明3
(1.中國(guó)計(jì)量大學(xué) 信息工程學(xué)院,浙江 杭州310018;2.浙江清華長(zhǎng)三角研究院,浙江 嘉興314006;3.衢州市環(huán)境監(jiān)測(cè)中心站,浙江 衢州324000)
針對(duì)空氣污染物氨氣、乙醇、氨氣乙醇混合氣體,搭建在線檢測(cè)電子鼻系統(tǒng).采用不同的特征提取方法得出特征,并利用主成分分析(PCA)和線性判別式分析(LDA)做類別區(qū)分. 結(jié)果顯示,利用傳感器響應(yīng)最大值特征和LDA能更好地區(qū)分三類氣體.利用最大響應(yīng)值特征,采用多層感知器(MLP)神經(jīng)網(wǎng)絡(luò)和粒子群(POS)優(yōu)化的支持向量機(jī)(SVM)對(duì)110個(gè)測(cè)試樣本分類.結(jié)果顯示,MLP神經(jīng)網(wǎng)絡(luò)的正確率為70%,POS優(yōu)化的SVM正確率為96.364 0%.最后,根據(jù)Loadings分析,剔除了TGS2602,MQ138,MQ3傳感器,優(yōu)化了傳感器陣列.結(jié)果表明,該在線電子鼻系統(tǒng)能夠應(yīng)用到這三類空氣污染物分類.
電子鼻;特征提取;模式識(shí)別;傳感器陣列優(yōu)化;大氣污染物
Studyonmixedgasdetectionbasedonelectronicnoses
Abstract: Targeting air pollutants of ammonia, ethanol and the ammonia ethanol mixed gas, an online electronic nose system was established. Different feature extraction methods were used to obtain their features. Principal component analysis (PCA) and linear discriminant analysis (LDA) were used to classify them. The results showed that the three kinds of gases could be distinguished by using the maximum response characteristics of the sensor and LDA. Based on the maximum response value, a multilayer perceptron (MLP) neural network and an SVM optimized by particle swarm optimization (POS) were used to test 110 samples classification. The results showed that the correct rate of the MLP neural network was 70% and the SVM optimized by POS was 96.364 0%. Finally, according to the loadings analysis, the TGS2602, MQ138 and MQ3 sensors were removed and the sensor array was optimized. The online electronic nose system can be applied to the classification of these three types of air pollutants.
Keywords: electronic nose;feature extraction ;pattern recognition;sensor array optimization;air pollutant
隨著科技進(jìn)步,電子鼻在環(huán)境監(jiān)測(cè)[1]、食品安全和藥物辨別等方面的應(yīng)用得到快速發(fā)展.如:楊莉等人的交通環(huán)境有毒氣體的檢測(cè)技術(shù)研究[2],朱向東等人的基于DSP的便攜式氣體檢測(cè)儀系統(tǒng)[3],梁喜鳳等人的傳感器陣列的CO與H2S混合氣體檢測(cè)系統(tǒng)設(shè)計(jì)與試驗(yàn)[4],以上研究在氣體檢測(cè)傳感器優(yōu)選上沒有做出合理嚴(yán)謹(jǐn)?shù)睦碚摲治?;田秀英等人的基于PCA方法的帶魚和肉類新鮮度的電子鼻系統(tǒng),采用半導(dǎo)體傳感器陣列檢測(cè)在5,10,15 ℃條件下,TVBN(揮發(fā)性鹽基總氮)的含量,采用PCA算法對(duì)不同天數(shù)的魚和肉進(jìn)行了分類[5],該研究?jī)H停留在區(qū)分不同天數(shù)的魚和肉,并未做準(zhǔn)確率預(yù)測(cè)的研究;韋彩虹的基于電子鼻系統(tǒng)的混合氣體的定性分析和定量估計(jì)[6],該研究在傳感器響應(yīng)特征的選取上僅選取了最大值,未做其他提取特征的比較效果分析.
基于以上問題,設(shè)計(jì)了該電子鼻系統(tǒng). 本文設(shè)計(jì)的電子鼻,嘗試采用多種分類模型,包括典型的非監(jiān)督模型PCA和幾類監(jiān)督模型算法.經(jīng)過對(duì)比和分析實(shí)驗(yàn),達(dá)到精確分類三類氣體的目的.
1.1 材料
氣體配置選用的是茂圖氣體設(shè)備(上海)有限公司的標(biāo)準(zhǔn)鋼瓶,氨氣氣體濃度為295 ppm,乙醇?xì)怏w濃度為295 ppm流量計(jì)和顯示器選用的是北京崛場(chǎng)匯博隆精密儀器有限公司的MT-52;研制的電子鼻系統(tǒng)主要包括3類氣體傳感器:半導(dǎo)體氣體傳感器、電化學(xué)氣體傳感器和光離子氣體傳感器.這里做氣體分類實(shí)驗(yàn)只需用到傳感器氣室1中的半導(dǎo)體氣體傳感器.
1.2 系統(tǒng)結(jié)構(gòu)
電子鼻系統(tǒng)圖如圖1.通過與氮?dú)饣旌虾蟮臉?biāo)定氣體分別經(jīng)氣室1或氣室2(選擇哪個(gè)氣室通過開關(guān)閥門控制),根據(jù)傳感器感應(yīng)的信號(hào),傳給電子鼻系統(tǒng)內(nèi)的在線數(shù)據(jù)采集板(STM32FZET6),經(jīng)過數(shù)據(jù)采集板簡(jiǎn)單數(shù)據(jù)處理,將數(shù)據(jù)傳給上位機(jī)(PC),經(jīng)MATLAB2008a,進(jìn)行模式分類.
表 1 氣室1的傳感器陣列和響應(yīng)氣體
圖 1 電子鼻系統(tǒng)示意圖Figure 1 Schematic graph of electronic noses system schemes
有三個(gè)過程:1)基線過程 先接入純空氣鋼瓶沖洗氣室;2)采樣過程 待基線穩(wěn)定后,切換三通閥,調(diào)節(jié)氣體流量計(jì),獲得所需濃度的測(cè)試氣體;3)脫附過程 切換三通閥,再次通入純空氣鋼瓶進(jìn)行脫附[5-6].這里選用氨氣濃度100 ppm,乙醇濃度100 ppm.二者混合氣體.得到傳感器響應(yīng)曲線.由于受限氣體存量,選擇氨氣、乙醇響應(yīng)時(shí)間325 s,二者混合響應(yīng)時(shí)間180 s. 并經(jīng)過減基線和平滑濾波處理,得到下面曲線.見圖2~4.
圖2 氯氣濃度100 ppm氨氣濃度金屬半導(dǎo)體傳感器 響應(yīng)Figure 2 Response of metal semiconductor sensors with 100 ppm ammonia concentration
圖3 乙醇濃度100 ppm,金屬半導(dǎo)體傳感器響應(yīng)Figure 3 Response of metal semiconductor sensors with 100ppm ethanol concentration
圖4 某濃度下混合氣體金屬半導(dǎo)體傳感器響應(yīng)Figure 4 Response of metal semiconductor sensor with mixed gases in a certain concentration
根據(jù)得到傳感器的響應(yīng)曲線對(duì)比發(fā)現(xiàn),不同的氣體在同一段響應(yīng)時(shí)間,各自曲線下的積分面積、初始響應(yīng)時(shí)間段平均微分值和最大響應(yīng)值有較明顯不同.所以選用了這三種特征提取方法.
3.1 選取曲線下面積
這里選用了Maltab里面的Trapz函數(shù),來提取1到180 s時(shí)間,曲線下積分面積.
3.2 選取平均微分值
平均微分法公式如下:
(1)
其中N是取得測(cè)試點(diǎn)數(shù);xi為曲線中第i個(gè)測(cè)量點(diǎn)的值 ;xi+1是第i+1個(gè)測(cè)試點(diǎn)的值;Δt是時(shí)間間隔,這里選用的是1 s;平均微分值K的意義是某段時(shí)間內(nèi)傳感器對(duì)被測(cè)氣體的平響應(yīng)速度[7].這個(gè)根據(jù)傳感器TGS2602在第10 s對(duì)氨氣的響應(yīng)趨勢(shì)出現(xiàn)較大波動(dòng),其他傳感器在該時(shí)間段相對(duì)平滑,所以選用時(shí)間1~10 s.即N取10.
3.3 選取最大值
這里截取的響應(yīng)時(shí)間內(nèi)的最大值.從傳感器的響應(yīng)結(jié)果來看,不同的氣體在同一段時(shí)間內(nèi),各個(gè)對(duì)應(yīng)傳感器的響應(yīng)值有明顯差別.
3.4 傳感器陣列優(yōu)化
使用輸出電壓的變化,載荷分析用于模式文件識(shí)別時(shí)判斷傳感器的重要性.如果某一傳感器對(duì)識(shí)別分析的作用足夠小,那么就選擇去掉.對(duì)于一個(gè)特定的線性判別,傳感器的載荷參數(shù)接近零,說明對(duì)整個(gè)傳感器陣列有很低的貢獻(xiàn).
圖5 針對(duì)三類氣體與PCA1,PCA2,PCA3相關(guān)的 載荷分析Figure 5 Loadings analysis related to PCA1, PCA2, PCA3 for three type gas
從圖5可以看出,傳感器TGS2620,MQ138,MQ3對(duì)當(dāng)前氣體分類有更低的貢獻(xiàn),可以去掉;而TGS2602,TGS826,MQ137,TGS832有更高的貢獻(xiàn),所以保留.
主成分分析是一種從多維數(shù)據(jù)中提取信息的統(tǒng)計(jì)學(xué)習(xí)方法.它將原始的測(cè)得的變量(例如p維)降維為一種新的不相關(guān)的變量(假設(shè)為m維,m<=p),且盡可能大的保持原有信息.新的變量叫做原變量的主成分.PCA得分用于研究數(shù)據(jù)點(diǎn)在多維空間質(zhì)量特性的聚類情況,前三個(gè)主成分累計(jì)貢獻(xiàn)率均超過85%,滿足了前t個(gè)主成分包含了原始變量的基本信息.圖6~8是不同特征的PCA的分圖.
圖6 選取面積特征的三類氣體樣本PCA的得分圖Figure 6 PCA score of three kinds of gas samples with area characteristics
圖7 選取平均微分特征的三類氣體樣本PCA的得分圖Figure 7 P CA score of three kinds of gas samples with average differential characteristics
圖8 選取最大值特征的三類氣體樣本PCA的得分圖Figure 8 The PCA score of three kinds of gassamples with maximum value
線性判別式分析與主成分分析類似,將帶上標(biāo)簽的數(shù)據(jù)點(diǎn),通過投影的方法,投影到維度更低的空間中,使得投影后的點(diǎn)形成按類別區(qū)分一簇一簇情況.相同類別的點(diǎn),將會(huì)在投影后的空間更接近其要求投影后的模式樣本在新的子空間有最小的累內(nèi)距離和最大的類間距離[8-10].以下是針對(duì)三類氣體的LDA分析.見圖9~11.
圖9 選取面積特征的三類不同氣體樣本的LDA分析Figure 9 LDA analysis of three kinds of gas samples with different area characteristics
圖10 選取平均微分特征的三類不同氣體樣本 的LDA分析Figure 10 LDA analysis of three kinds of gas samples with average differential characteristics
圖11 選取最大值特征的三類不同氣體樣本 的LDA分析Figure 11 LDA analysis of three kinds of gas samples with maximum values
綜合以上分析表明,選取傳感器響應(yīng)的最大值特征,在PCA分析中,相同類得到更好的聚集;在LDA分析中,三類氣體得到更好的區(qū)分.
該系統(tǒng)選用標(biāo)準(zhǔn)BP神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)模型對(duì)三類氣體進(jìn)行模式分類[11].BP神經(jīng)網(wǎng)絡(luò)一共設(shè)置3層,輸入層、隱含層和輸出層.因這里7個(gè)傳感器提取特征信號(hào),所以輸入層確定為7個(gè)神經(jīng)元.隱含層和輸出層都確定為1個(gè)神經(jīng)元,輸出層輸出不同種類氣體標(biāo)號(hào).采用試錯(cuò)法選擇隱含層節(jié)點(diǎn)數(shù),根據(jù)測(cè)試的正確率結(jié)果反復(fù)調(diào)整參數(shù).實(shí)現(xiàn)最優(yōu)分類正確率為70%.其中參數(shù)調(diào)節(jié)如表2和表3所示.S1為輸出層到隱含層神經(jīng)元,S2隱含層到輸出層神經(jīng)元,TF1,TF2為節(jié)點(diǎn)傳遞函數(shù),BTF為訓(xùn)練函數(shù),MSE為均方誤差.
表 2 BP主要參數(shù)的選擇
表 3 BP次要參數(shù)的選擇
但是,標(biāo)準(zhǔn)BP神經(jīng)網(wǎng)絡(luò)算法有很多缺陷.比如采用梯度下降法,訓(xùn)練速度慢;易形成局部極小而得不到全局最優(yōu),很容易出現(xiàn)欠學(xué)習(xí)和過學(xué)習(xí).而支持向量機(jī)在分類中并不存在以上問題.針對(duì)以上BP可能出現(xiàn)局部最優(yōu)導(dǎo)致的達(dá)不到理想的分類效果,增加了SVM分類模型.
支持向量機(jī)是基于統(tǒng)計(jì)學(xué)習(xí)方法,尋找一個(gè)最優(yōu)的超平面作為高維空間中的決策函數(shù)[12].該模型參數(shù)是根據(jù)訓(xùn)練的數(shù)據(jù)而變化,不需要提前預(yù)置.最佳參數(shù)的尋優(yōu)是訓(xùn)練程序的過程中,根據(jù)數(shù)據(jù)與模型的不斷匹配.這跟神經(jīng)網(wǎng)絡(luò)比如:多層感知器神經(jīng)網(wǎng)絡(luò)和徑向基神經(jīng)網(wǎng)絡(luò)具有共性.在本實(shí)驗(yàn)中,支持向量機(jī)做三類氣體分類最重要的選擇參數(shù)是懲罰參數(shù)c和核函數(shù)參數(shù)g(針對(duì)多項(xiàng)式/rbf/Sigmoid核函數(shù)).
這里選用了POS和Hold-Out-Method二種方法選擇最優(yōu)參數(shù)c和g.優(yōu)化結(jié)果和正確率如表4所示.
表 4 參數(shù)c和g尋優(yōu)
1)采用不同的特征提取方法進(jìn)行分析,得出最大值特征樣本易于被PCA和LDA區(qū)分.
2)通過PCA載荷分析,發(fā)現(xiàn)傳感器TGS2602,MQ138,MQ3對(duì)當(dāng)前氣體分類有較低的貢獻(xiàn),可以去除.實(shí)現(xiàn)了傳感器陣列的優(yōu)化.
3)通過MLP,POS - SVM進(jìn)行樣本分類,比較發(fā)現(xiàn)POS - SVM正確率達(dá)到96.364 0%,相比BP神經(jīng)網(wǎng)絡(luò)更優(yōu).
選取傳感器響應(yīng)最大值特征,小樣本分類預(yù)測(cè),POS - SVM分類正確率達(dá)到96.364 0%.為了達(dá)到更好的預(yù)測(cè)效果,后續(xù)將更換不同的傳感器型號(hào),選取更多種特征獲取大量樣本做進(jìn)一步分類和定量分析研究.
[1] 田秀英,蔡強(qiáng),劉銳,等. 基于電子鼻土壤與地下水污染修復(fù)現(xiàn)場(chǎng)TVOC和惡臭的評(píng)估[J]. 環(huán)境科學(xué),2013,34(2):463-467. TIAN X Y, CAI Q, LIU R, et al. Assessment of TVOC and odor in the remediation site of contaminated soil and ground water using electronic nose [J].EnvironmentScience, 2013,34(2):463-467.
[2] 楊莉,王磊.交通環(huán)境有毒氣體的檢測(cè)技術(shù)研究[J].計(jì)算機(jī)工程與應(yīng)用,2010,46(8):202-204. YANG L, WANG L. Study on detection of toxic gases in traffic environment [J].ComputerEngineeringandApplications, 2010, 46(8):202-467.
[3] 朱向東.基于DSP的便攜式氣體檢測(cè)儀系統(tǒng)[J].儀表技術(shù)與傳感器,2011,48(2):33-37. ZHU X D. Portable gas detector based on DSP [J].InstrumentTechniqueandSensor, 2011,48(2):33-37.
[4] 梁喜鳳,劉立豪.傳感器陣列的CO與H2S混合氣體檢測(cè)系統(tǒng)設(shè)計(jì)與試驗(yàn)[J].中國(guó)計(jì)量學(xué)院學(xué)報(bào),2015,26(1):40-45. LIANG X F, LIU L H. Design and experiments on detection system for CO and H2S gas mixtures based on sensor array [J].JournalofChinaUniversityofMetrology, 2015, 26(1):40-45.
[5] 田秀英.電子鼻在TVOC和惡臭檢測(cè)方面的應(yīng)用研究[D].上海:上海師范大學(xué),2012. TIAN X Y.ApplicationofElectronicNoseinTVOCandOdorDetection[D].Shanghai: Shanghai Normal University,2012.
[6] 韋彩虹.基于電子鼻系統(tǒng)的混合氣體的定性分析和定量估
計(jì) [D].杭州:浙江大學(xué),2012. WEI C H.QualitativeAnalysisandQuantitativeEstimationofMixedGasesBasedonElectronicNoseSystem[D]. Hangzhou: Zhejiang University, 2012.
[7] 趙赟,郭振華,孟凡利,等.基于分段平均微分法的動(dòng)態(tài)檢測(cè)識(shí)別系統(tǒng)[J].傳感技術(shù)學(xué)報(bào),2007,20(8):1707-1711. ZHAO Y, GUO Z H, MENG F L, et al. Dynamic detection and recognition system based on the segmental average differentiation[J].ChineseJournalofSensorsandActuators, 2007, 20(8): 1707-1711.
[8] AMARI A, EL BARI N, BOUCHIKHI B. Electronic nose for anchovy freshness monitoring based on sensor array and pattern recognition methods: Principal components analysis, linear discriminant analysis and support vector machine [J].InternationalScientificJournalofComputing, 2007,6(3) : 61-67.
[9] TIAN F G, CHENG L L. High accuracy handwritten Chinese character recognition using LDA-based compound distances [J].PatternRecognition, 2008, 41(11): 3442-3451.
[10] TANGA E, SUGANTHANA P, YAO X. Linear dimensionality reduction using relevance weighted LDA [J].PatternRecognition, 2005,38(4): 485-493.
[11] 章德賓, 徐家鵬, 許建軍,等. 基于監(jiān)測(cè)數(shù)據(jù)和BP神經(jīng)網(wǎng)絡(luò)的食品安全預(yù)警模型[J]. 農(nóng)業(yè)工程學(xué)報(bào), 2010,26(1):221-226. ZHANG D B, XU J P, XU J J, et al. Model for food safety warning based on inspection data and BP neural network[J].TransactionsoftheChineseSocietyofAgriculturalEngineering,2010,26(1):221-226.
[12] PAL M, FOODY G. Feature selection for classification of hyperspectral data by SVM [J].IEEETransactionsonGeoscienceandRemoteSensing,2010,48 (5): 2297-2307.
LIANG Ziyue1,YANG Hao1,HUANG Cancan2,ZHOU Jian3, JIANG Zhengwei3,F(xiàn)ANG Zhiming3
(1. College of Information Engineering, China Jiliang University, Hangzhou 310018, China;
2.Yangtze Delta Region Institute of Tsinghua University, Zhejiang Jiaxing 314006, China; 3. Quzhou Environmental Monitoring Center, Zhejiang Quzhou 324000, China )
2017-04-24 《中國(guó)計(jì)量大學(xué)學(xué)報(bào)》網(wǎng)址zgjl.cbpt.cnki.net
國(guó)家重大科學(xué)儀器設(shè)備開發(fā)專項(xiàng)(No.2012YQ15008705),浙江省科技計(jì)劃項(xiàng)目(No.2015C33009).
X831
A