馬宏莉, 王 濤, 李泊龍, 曾 敏, 楊建華, 楊 志
(薄膜與微細(xì)技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室 上海交通大學(xué) 電子信息與電氣工程學(xué)院 微納電子學(xué)系,上海 200240)
隨著城市化進(jìn)程的加快,室內(nèi)環(huán)境常存在氨氣(NH3)、甲醛(CH2O)、苯(C6H6)、甲苯(C7H8)等多種氣體污染物。長(zhǎng)期生活和工作在受氣體污染的室內(nèi)環(huán)境中,人體健康將受到嚴(yán)重威脅[1,2]。此外,在生產(chǎn)生活中,天然氣與煤氣等有害氣體泄露的危險(xiǎn)情況也時(shí)有發(fā)生。所以,研究室內(nèi)環(huán)境中的有毒有害氣體檢測(cè),對(duì)于人體的安全健康保障具有重要的意義。
傳統(tǒng)的基于單一氣體傳感器的有毒有害氣體檢測(cè)方法,在應(yīng)用過(guò)程中易受背景環(huán)境氣體的影響而出現(xiàn)誤報(bào),這是因?yàn)楝F(xiàn)有氣體傳感器材料均具有交叉敏感特性,即無(wú)法達(dá)到只對(duì)某一種氣體敏感。為提高復(fù)雜環(huán)境下特定氣體組分的定量識(shí)別效果,結(jié)合了傳感器陣列和機(jī)器學(xué)習(xí)算法的電子鼻系統(tǒng)被廣泛應(yīng)用。如Jia P等人[3]設(shè)計(jì)了基于金屬氧化物半導(dǎo)體氣體傳感器的電子鼻系統(tǒng),實(shí)現(xiàn)了室內(nèi)C6H6、C7H8、CH2O和一氧化碳(CO)等四種常見(jiàn)的室內(nèi)污染氣體的檢測(cè)。類似地,Zhang D等人[4]將氣體傳感器陣列與反向傳播神經(jīng)網(wǎng)絡(luò)(back propagation neural network,BPNN)相結(jié)合,實(shí)現(xiàn)了CH2O和NH3混合時(shí)的組分識(shí)別。盡管電子鼻系統(tǒng)對(duì)于室內(nèi)氣體的檢測(cè)技術(shù)取得了一定進(jìn)展[5],但其針對(duì)多種單一氣體及混合氣體同時(shí)進(jìn)行定量識(shí)別的研究還相對(duì)較少,文獻(xiàn)[6]只實(shí)現(xiàn)了丙酮(C3H6O)和2—丙醇(C3H8O)兩種氣體的單一及混合情況下的定量識(shí)別。
本文設(shè)計(jì)了一種高效且低成本的電子鼻系統(tǒng),可同時(shí)實(shí)現(xiàn)6種常見(jiàn)室內(nèi)有毒有害氣體,包括硫化氫(H2S)、NH3、CO、C7H8、CH2O和C3H6O,在單一及二元?dú)怏w混合情況下的組分識(shí)別及體積分?jǐn)?shù)估計(jì)。設(shè)計(jì)的傳感器陣列采用4種商用金屬氧化物型氣體傳感器,降低了設(shè)備成本;采用先識(shí)別再估計(jì)的方法,保證了少量訓(xùn)練樣本情況下電子鼻系統(tǒng)較好的體積分?jǐn)?shù)估計(jì)性能;提出的層次分類器(hierarchical classifier,HC)很好地避免了分類器訓(xùn)練過(guò)程中的樣本不平衡問(wèn)題,進(jìn)而提高了對(duì)未參與訓(xùn)練濃度樣本的識(shí)別率。
為實(shí)現(xiàn)H2S,CO,NH3,C7H8,CH2O,C3H6O等6種氣體在單一及混合情況下的組分識(shí)別,本文選取日本Figaro公司生產(chǎn)的TGS2620、TGS2603、TGS2600以及TGS2602等四種成熟的商用金屬氧化物型氣體傳感器以構(gòu)成傳感器陣列,將其集成于自制的PCB。此外,為實(shí)現(xiàn)傳感器陣列信號(hào)的采集,該P(yáng)CB還包括:基于AD620的多路模數(shù)轉(zhuǎn)換采樣模塊、基于RS—232串口的上位機(jī)通信模塊、基于STM32單片機(jī)的程序控制模塊、以及電源開關(guān)等其他相關(guān)外圍電路。
假設(shè)單一氣體和混合氣體H2S,CO,NH3,C7H8,CH2O,C3H6O,H2S+CO,NH3+C7H8,CH2O+C3H6O的類標(biāo)簽分別為1~9,則訓(xùn)練集和測(cè)試集中樣本的數(shù)量及樣本體積分?jǐn)?shù)分布如表1所示。
表1 訓(xùn)練集與測(cè)試集樣本數(shù)量及體積分?jǐn)?shù)分布
單一氣體的體積分?jǐn)?shù)以5×10-6的間隔在(5~30)×10-6之間變化,每個(gè)體積分?jǐn)?shù)實(shí)驗(yàn)重復(fù)3次。混合氣體中的每種氣體組分的體積分?jǐn)?shù)變化與單一氣體相同。
傳感器陣列響應(yīng)的時(shí)域特征具有獲取快速簡(jiǎn)單的特點(diǎn),無(wú)需復(fù)雜的信號(hào)處理算法,適用于微小便攜式氣體傳感器陣列系統(tǒng)。因此,本文采用式(1)所示差分時(shí)域特征[7],用于實(shí)現(xiàn)多組分氣體的定量識(shí)別
f=Rgas-Rair
(1)
式中f為提取的時(shí)域特征,Rair和Rgas分別為傳感器在潔凈空氣中的基線值和在待測(cè)氣體氛圍中的穩(wěn)態(tài)響應(yīng)值。
HC通常由類別層次和基分類器兩部分組成[8],本文設(shè)計(jì)的HC的類別層次示意圖如圖1所示。
圖1 類別層次示意
為實(shí)現(xiàn)每個(gè)層次的類識(shí)別,本文采用BPNN模型作為基分類器。BPNN模型主要由輸入層、隱含層和輸出層組成,隱含層激活函數(shù)常采用Sigmoid模型函數(shù),典型單隱含層BPNN結(jié)構(gòu)如圖2所示[9]。
圖2 典型單隱含層BPNN模型結(jié)構(gòu)
單隱含層BPNN的輸入層與輸出層節(jié)點(diǎn)數(shù)主要由特征輸入x=[x1,x2,…,xm]和目標(biāo)輸出y=[y1,y2,…,yn]的維數(shù)決定,隱含層節(jié)點(diǎn)數(shù)可通過(guò)經(jīng)驗(yàn)公式(2)進(jìn)行選取
(2)
式中m,n變量為輸入層與輸出層節(jié)點(diǎn)數(shù);N為隱含層節(jié)點(diǎn)數(shù);a為1~10之間的常數(shù)。
此外,wij為第i個(gè)輸入層節(jié)點(diǎn)xi到第j個(gè)隱含層節(jié)點(diǎn)netj的權(quán)系數(shù),w′jk為第j個(gè)隱含層節(jié)點(diǎn)netj到第k個(gè)輸出節(jié)點(diǎn)的權(quán)系數(shù)。θj為第k個(gè)隱含層節(jié)點(diǎn)netj的閾值。
假設(shè)有p個(gè)自變量X={x1,x2,…,xp}和q個(gè)因變量Y={y1,y2,…,yq},用于研究因變量Y和自變量X之間統(tǒng)計(jì)關(guān)系的多元線性回歸模型可表述如下
Y=XB+Eγ
(3)
式中B和Eγ分別為常系數(shù)矩陣和殘差矩陣。
將多元線性回歸模型用于體積分?jǐn)?shù)估計(jì)的優(yōu)點(diǎn)在于利用少量樣本即可得到傳感器陣列響應(yīng)與氣體體積分?jǐn)?shù)的關(guān)系函數(shù)。同時(shí),建立的多元回歸單輸出和多輸出模型,可分別用于實(shí)現(xiàn)單一氣體和二元混合物中對(duì)應(yīng)組分的體積分?jǐn)?shù)估計(jì)。
偏最小二乘(partial least-squares,PLSR)回歸在多元線性回歸的基礎(chǔ)上,利用主成分分析(PCA)算法對(duì)輸入和輸出向量同時(shí)進(jìn)行分析,充分利用自變量與因變量間的相關(guān)關(guān)系,提高多元回歸模型的預(yù)測(cè)性能。
為減少傳感器陣列中的冗余信息對(duì)分類效果的影響,本文采用PCA降維后的差分時(shí)域特征作為分類器的輸入,其對(duì)應(yīng)的主成分得分圖如圖3所示。
圖3 差分時(shí)域特征的主成分得分
為驗(yàn)證本文提出的基于類別層次的氣體識(shí)別方法的優(yōu)越性,分別將BPNN和基于反向傳播神經(jīng)網(wǎng)絡(luò)的層次分類器(back propagation neural network-based hierarchical classi-fier,BPNN-HC)用于多組分氣體的識(shí)別。對(duì)表1中的訓(xùn)練和測(cè)試樣本進(jìn)行多次重復(fù)試驗(yàn)后,BPNN及BPNN-HC的分類性能對(duì)比結(jié)果如表2所示。其中,準(zhǔn)確率、精確率以及召回率的微平均和宏平均是多分類中常用的性能評(píng)價(jià)指標(biāo)。其中,宏平均主要用于評(píng)價(jià)分類器對(duì)訓(xùn)練樣本數(shù)量少的類別的識(shí)別效果,微平均則相反。
表2 BPNN與BPNN-HC多分類性能對(duì)比 %
從表2中可以看出,本文設(shè)計(jì)的電子鼻系統(tǒng)對(duì)未參與訓(xùn)練的體積分?jǐn)?shù)樣本的識(shí)別準(zhǔn)確率達(dá)到96.81 %。此外,對(duì)比宏平均精確率結(jié)果可以發(fā)現(xiàn),BPNN-HC相比于BPNN能更有效地識(shí)別具有少量樣本的單一氣體。
在實(shí)現(xiàn)6種單一氣體和3種混合氣體的模式識(shí)別后,針對(duì)每個(gè)模式分別建立回歸模型以實(shí)現(xiàn)體積分?jǐn)?shù)估計(jì)。以H2S和CO為例,其在單一和混合情況下體積分?jǐn)?shù)估計(jì)結(jié)果分別如圖4和圖5所示。
本文6種有毒有害氣體在單一和混合情況下,測(cè)試樣本的體積分?jǐn)?shù)預(yù)測(cè)結(jié)果如表3所示。其中,平均絕對(duì)誤差(mean absolute error,MAE)、均方根誤差(root mean square error,RMSE)以及決定系數(shù)(R-square,R2)等是常見(jiàn)的回歸模型評(píng)價(jià)指標(biāo)。
圖4 單一氣體H2S和CO的體積分?jǐn)?shù)預(yù)測(cè)結(jié)果對(duì)比
圖5 混合氣體H2S+CO中H2S和CO體積分?jǐn)?shù)預(yù)測(cè)結(jié)果對(duì)比
表3 測(cè)試樣本的體積分?jǐn)?shù)預(yù)測(cè)結(jié)果
從圖5和表3可以看出,針對(duì)不同模式建立的PLSR模型能夠較好地預(yù)測(cè)單一氣體和混合氣體對(duì)應(yīng)組分的體積分?jǐn)?shù),其未訓(xùn)練樣本體積分?jǐn)?shù)預(yù)測(cè)的平均絕對(duì)誤差均小于2.5×10-6。
本文設(shè)計(jì)的電子鼻系統(tǒng),有效地實(shí)現(xiàn)了多種室內(nèi)有毒有害氣體的識(shí)別與體積分?jǐn)?shù)估計(jì)。提出的基于BPNN-HC具有良好的泛化性能,并對(duì)6種單一氣體及3種混合氣體的識(shí)別準(zhǔn)確率達(dá)到了96.81 %。針對(duì)每個(gè)模式分別建立的回歸模型,其決定系數(shù)R2均大于0.91,有效地實(shí)現(xiàn)了單一及混合情況下的氣體組分體積分?jǐn)?shù)估計(jì)。因此,本文所設(shè)計(jì)的高效且低成本的電子鼻系統(tǒng),將使得室內(nèi)環(huán)境氣體檢測(cè)的大規(guī)模推廣成為可能。