郭娟,駱德漢,何啟莉,詹燦堅
(廣東工業(yè)大學信息工程學院,廣州510006)
電子鼻是一種模仿生物嗅覺的氣味分析裝置,電子鼻系統(tǒng)基本上由傳感器陣列和數(shù)據(jù)采集系統(tǒng)、計算機和數(shù)據(jù)存儲系統(tǒng)以及模式識別算法[1]組成。電子鼻傳感器陣列克服了人工感官評定會受周圍環(huán)境和個人因素的干擾,這意味著機器嗅覺技術適用于許多領域。首先,它是一種無損檢測從物體[2]表面釋放的揮發(fā)物的技術。其次,電子鼻通常攜帶方便,可以隨時隨地檢測氣味。第三,電子鼻具有擴展嗅覺范圍的能力,因為氣體傳感器能夠探測并感知到那些人類聞不到的化學物質(zhì)[3]。電子鼻在世界上得到了越來越廣泛的應用。電子鼻的發(fā)展對人類有很多好處,電子鼻可以在氣味、周圍空氣和呼吸氣體的檢測或分類中發(fā)揮重要作用,如食品安全檢測[4]、醫(yī)學診斷[5]和環(huán)境監(jiān)測等[6]。對于電子鼻來說,數(shù)據(jù)預處理算法和分類器體系結(jié)構(gòu)都是影響分類精度的重要因素。
隨著信息技術的飛速發(fā)展,智能識別方法已引起人們的廣泛關注。大量的算法被引入嗅覺領域作為氣味識別的方法,如模糊邏輯[7]、遺傳算法、機器學習、人工神經(jīng)網(wǎng)絡[8]。然而,這些方法大多是在大量訓練數(shù)據(jù)的基礎上成功運行的。在實際采樣的過程中,由于樣本數(shù)量有限,往往只能收集到有限的電子鼻采樣數(shù)據(jù)。此外,當識別的物質(zhì)產(chǎn)地不同或者保存方式不同都會有氣味有較大的影響,這會降低訓練后網(wǎng)絡模型的泛化能力,在某些情況下,網(wǎng)絡模型甚至不再適用。因此,針對樣本量有限的小樣本氣味數(shù)據(jù),設計的一種有效的識別方法是極為重要的。
本文基于電子鼻采集的不同傳感器響應,通過生成對抗網(wǎng)絡(Generative Adversarial Network,GAN)對小樣本數(shù)據(jù)進行拓展,結(jié)合卷積神經(jīng)網(wǎng)絡(Convolu?tional Neural Network,CNN)學習擴展樣本數(shù)據(jù)的特征,最終對物質(zhì)氣味分類。
生成式對抗網(wǎng)絡(Generative Adversarial Net?work,GAN)主要由兩個子模塊組成:生成器模型(Generative Model,G)和 判 別 模 型(Discriminative Model,D)。發(fā)生器G接收從正態(tài)分布或均勻分布采樣的潛在隨機矢量,并輸出合成樣本。鑒別器D以訓練樣本或合成樣本作為輸入,輸出一個標量,表示訓練樣本或合成樣本遵循原始數(shù)據(jù)分布的概率。GAN的理念基于競爭,G的目的是混淆D,D的目的是區(qū)分G生成的數(shù)據(jù)和原始數(shù)據(jù)集的數(shù)據(jù),其流程如圖1所示。
圖1 GAN框架
對于生成器G:Z→X,其中Z為任意維數(shù)的噪聲空間;它對應于超參數(shù)空間。X為數(shù)據(jù)空間;目的是得到數(shù)據(jù)分布。發(fā)生器通過在數(shù)據(jù)空間中擬合數(shù)據(jù)特征并隨機添加噪聲來生成新的數(shù)據(jù)。優(yōu)化的目標函數(shù)如下:
其中D(x)表示判別器D對一個原始樣本的評分,D(G(z))表示判別器D一個生成樣本的評分;Pdata表示生成樣本的概率分布,Pdata表示原始數(shù)據(jù)的概率分布。
卷積神經(jīng)網(wǎng)絡(Convolutional Neural Networks,CNN)是一種典型的深度學習架構(gòu)。經(jīng)過大量圖像數(shù)據(jù)訓練后,由于CNN具有多層卷積濾波器,因此可以學習捕獲不同級別的特征。每個過濾器都可以充當特定的特征模式提取器,并將它們組合在一起就可以形成功能強大的特征模型。
CNN是一種多層的監(jiān)督學習神經(jīng)網(wǎng)絡,隱含層的卷積層和池化層是實現(xiàn)卷積神經(jīng)網(wǎng)絡特征提取功能的核心模塊。經(jīng)典CNN神經(jīng)網(wǎng)絡的基本結(jié)構(gòu)由輸入層(Input Layer)、卷積層(Convolutional Layer)、池化層(Pooling Layer)、全連接層(Full-Connected Layer)以及輸出層(Output Layer)構(gòu)成,其網(wǎng)絡結(jié)構(gòu)如圖2所示。每一層有多個特征圖,每個特征圖通過一種卷積濾波器提取輸入的一種特征,每個特征圖有多個神經(jīng)元。
圖2 CNN網(wǎng)絡結(jié)構(gòu)
其中卷積層由多個卷積神經(jīng)元組成,每個神經(jīng)元的權(quán)值和參數(shù)可以通過反向傳播算法得到。卷積層中的卷積濾波器提供輸入數(shù)據(jù)的壓縮表示,卷積濾波器可以從輸入數(shù)據(jù)中提取特征,每個過濾器由在網(wǎng)絡訓練階段調(diào)整的權(quán)值組成。通過卷積層,網(wǎng)絡可以提取輸入數(shù)據(jù)向量的低層邊緣特征。卷積層的計算公式如下:
其中n為輸入矩陣個數(shù),Xk表示第k個輸入矩陣,Wk表示卷積核的第k個子卷積核矩陣,s(i,j)即卷積核W對應的輸出矩陣的對應位置元素的值。
為了解決訓練數(shù)據(jù)有限的問題,本文提出了一種結(jié)GAN和CNN的分類器方法。首先,將原始樣本分為訓練集樣本和測試集樣本,利用生成的訓練網(wǎng)絡對樣本的數(shù)據(jù)進行增強,生成大量的模擬樣本。之后,使用生成的樣本和原始樣本混合的樣本訓練基于CNN的深度學習分類器。最后,利用測試樣本對訓練好的分類器進行測試,驗證了該方法對有限數(shù)據(jù)問題的有效性。
數(shù)據(jù)集從AirSense公司的PEN3電子鼻收集,PEN3電子鼻是一種通用氣體響應信號采樣儀表,它有10個金屬氧化物氣體傳感器,每個傳感器對不同氣體的靈敏度不同,如表1所示。電子鼻通過把十個傳感器之間的距離控制得非常小,使得因樣本氣味組成成分不均勻的問題得以解決,從而采集而來的氣味數(shù)據(jù)準確反映出氣味的真實信息。
表1 PEN3電子鼻傳感器陣列詳細信息
使用PEN3收集了7種中藥材的氣敏響應作為數(shù)據(jù)集,包括:檳榔、高良姜、砂仁、枳殼、莪術、姜黃、牡丹皮等。電子鼻實驗環(huán)境溫度為25±0.5℃,233濕度為75±2%。為了保證氣體傳感器響應的一致性,實驗材料的準備和實驗過程嚴格按照下列程序設置:
(1)初始條件下,將需要采集的中藥材放置于一個干凈的燒杯中,并保持不動超過20分鐘,以保證氣味充分揮發(fā);
(2)數(shù)據(jù)采集之前,對傳感器室進行清洗和校準;
(3)在采集的過程中,每個樣本采集時間為120秒;
(4)重復步驟(1)-(3),每種中藥各取100個樣品。最終的數(shù)據(jù)集由7類700個數(shù)據(jù)樣本組成,每類100個樣本,可視化其響應曲線如圖3所示。
圖3 電子鼻數(shù)據(jù)響應曲線
為了解決小樣本數(shù)據(jù)下的氣味識別問題,本文建立了基于GAN的數(shù)據(jù)增強模型。首先,我們采集到的電子鼻信號轉(zhuǎn)換為灰度圖,將氣味識別問題轉(zhuǎn)換為圖片分類問題。在數(shù)據(jù)預處理階段,主要目的是樣本數(shù)據(jù)生成拓展,建立了數(shù)據(jù)生成網(wǎng)絡模型GAN模型,具體流程如圖4所示。當原始樣本輸入GAN模型時,GAN生成器會對樣本數(shù)據(jù)進行擴展,得到大量與原始樣本相似的偽樣本。原始樣本與生成的偽樣本相結(jié)合,形成新的混合樣本。
圖4 數(shù)據(jù)預處理過程
在模型訓練過程中,首先對生成器和判別器的模型參數(shù)進行初始化。其次,在生成樣本后,固定生成模型,并訓練判別器模型,使生成的樣本與真實樣本盡可能準確地進行區(qū)分。然后,經(jīng)過多次更新后,對鑒別器模型進行固定,對生成模型進行訓練,使生成的數(shù)據(jù)與真實數(shù)據(jù)的差異最小化。最后,重復上述步驟,直到模型參數(shù)穩(wěn)定。
本文中根據(jù)數(shù)據(jù)預處理部分生成的增強數(shù)據(jù)集,將訓練集數(shù)據(jù)輸入CNN中進行訓練,卷積層通過計算輸入變量的乘積和來提取特征,ReLU用于引入卷積網(wǎng)絡的非線性,引入最大池化層來減小卷積數(shù)據(jù)的空間大小。然后,引入一個全連通層來學習高級特征的非線性組合,通過輸出層實現(xiàn)Softmax作為分類器識別氣味標簽。其中卷積神經(jīng)網(wǎng)絡的參數(shù)設置如下表2所示。
表2 CNN參數(shù)設置
本文將GAN-CNN模型應用于氣味識別,首先,將電子鼻采集到的氣味信息轉(zhuǎn)化為灰度圖,將灰度圖輸入GAN進行預處理,得到一個拓展數(shù)據(jù)集,對于數(shù)據(jù)集按照7:3比例劃分訓練集和測試集。之后將劃分好的數(shù)據(jù)集數(shù)據(jù)輸入CNN模型進行訓練識別。為了更好地展現(xiàn)該方法的識別效果,我們使用同樣的數(shù)據(jù)集,將該方法與PCA-SVM、PCA-RF、CNN、CNNSVM等多種方法進行對比實驗,實驗結(jié)果如表3所示。
表3
從表2中,可以清晰看到,PCA-SVM和PCA-RF在氣味識別上有一定的效果,CNN和CNN-SVM的預測效果更好,均可以達到90%以上。同時,考慮其中本文中提到的GAN-CNN模型準確度可以可達到94.43%,可以認為GAN-CNN適合用作為基于電子鼻的氣味識別算法。
本文提出了一種用于小樣本氣味識別的神經(jīng)網(wǎng)絡方法,該方法基于生成對抗網(wǎng)絡(GAN)和卷積神經(jīng)網(wǎng)絡(CNN)相結(jié)合的GAN-CNN模型。該方法可用于有限樣本的深度學習,能有效提高分類性能。為此,我們分別與PCA-SVM、PCA-RF、CNN、CNN-SVM等多種方法進行對比實驗,其中GAN-CNN識別準確率最高可達94.43%,效果優(yōu)于其他算法。