閆 錚,井 濤,孟慶浩*
(1.天津大學(xué)機(jī)器人與自主系統(tǒng)研究所,天津 300072;2.天津市過程檢測與控制重點(diǎn)實(shí)驗(yàn)室,天津 300072;3.天津大學(xué)電氣自動化與信息工程學(xué)院,天津 300072)
氣味源距離估計(jì)(Odor Source Proximity Estimation,OSPE)是指利用氣體傳感器的響應(yīng)數(shù)據(jù)估計(jì)氣味釋放源到當(dāng)前測量位置的距離。 快速、準(zhǔn)確地估計(jì)氣味源距離在氣體泄漏源定位任務(wù)中具有重要意義。 近年來興起的機(jī)器人主動嗅覺研究[1]使用移動機(jī)器人搭載氣體傳感器執(zhí)行氣味源定位(Odor Source Localization,OSL)任務(wù);利用氣體傳感器信號實(shí)時(shí)估計(jì)機(jī)器人與氣味源間的距離,同樣有助于提高主動嗅覺的執(zhí)行效率。
用于氣體檢測的傳感器類型多種多樣,其中金屬氧化物半導(dǎo)體(Metal Oxide Semiconductor,MOS)傳感器具有成本低、敏感度高且易于集成的優(yōu)點(diǎn),是最常用于OSL 任務(wù)的氣體傳感器。 MOS 傳感器通過吸附被測氣體改變電導(dǎo)率從而實(shí)現(xiàn)對氣體濃度的檢測,因此只能獲取傳感器所在位置較小范圍內(nèi)的氣體濃度,且具有較長的恢復(fù)時(shí)間[2],因此一些學(xué)者[3-10]對MOS 傳感器的響應(yīng)特性進(jìn)行分析,綜合利用MOS 傳感器信號的靜態(tài)/動態(tài)特征、時(shí)域/頻域特征以獲得實(shí)時(shí)性更高的信號處理方法,同時(shí)從中提取更豐富的信息。
基于MOS 傳感器估計(jì)氣味源距離的關(guān)鍵問題是選擇合適的OSPE 指標(biāo),簡稱距離指標(biāo)(Distance Indicator,DI)。 最直觀的DI 是氣味濃度:在擴(kuò)散主控或者平流主控環(huán)境中,氣味濃度隨著氣味源距離的增加而減小,這種濃度分布特點(diǎn)可用高斯擴(kuò)散模型描述[3]。 而在湍流環(huán)境中,氣味瞬時(shí)濃度分布波動強(qiáng)烈,明顯偏離高斯分布。 為了從具有波動性、間歇性特點(diǎn)的信號中提取距離相關(guān)信息,研究者通常采用時(shí)間平均法,提取一段時(shí)間內(nèi)信號的時(shí)均特征,以獲得更穩(wěn)定的DI(即時(shí)均DI)。 Ferri 等[4]通過實(shí)驗(yàn)證明,相對于平均濃度,MOS 傳感器的響應(yīng)幅值具有更穩(wěn)定的距離估計(jì)效果。 Lilienthal 等[5]通過實(shí)驗(yàn)對比了MOS 傳感器響應(yīng)平均值、方差以及歸一化標(biāo)準(zhǔn)差三種DI,結(jié)果表明歸一化標(biāo)準(zhǔn)差用于OSPE 的精度最高。 上述時(shí)均DI 都需要對較長時(shí)間的傳感器響應(yīng)進(jìn)行統(tǒng)計(jì)分析,影響了距離估計(jì)的實(shí)時(shí)性,且上述特征較為簡單,OSPE 精度有限。
從頻域角度看,氣味煙羽信號是寬頻帶的隨機(jī)信號,功率譜密度高達(dá)幾十kHz[6]。 生物領(lǐng)域相關(guān)研究表明,昆蟲等生物可以從復(fù)雜的氣味煙羽信號中提取瞬時(shí)特征用于氣味導(dǎo)航,以完成搜索食物或?qū)ふ遗渑嫉然顒覽7]。 為獲得更準(zhǔn)確的DI,學(xué)者們開展了一系列提取MOS 傳感器信號瞬時(shí)特征的研究,其中較典型的是Schmuker 等[8]通過級聯(lián)濾波方法增強(qiáng)信號中被緩慢衰減掩蓋的快速響應(yīng),即“Bout”特征,并證明Bout 個數(shù)是一種較準(zhǔn)確的DI,即在1.45 m 范圍內(nèi),該算法的平均距離估計(jì)誤差為0.18 m(相對誤差12.4%)。 Burgués 等[9]在Bout 特征的基礎(chǔ)上進(jìn)行改進(jìn),使用具有線性相位和有限脈沖響應(yīng)的低通微分濾波器,將平均估計(jì)誤差降低到0.08 m(相對誤差5.5%)。 并將該算法用于無人機(jī)OSL 和氣味建圖研究中[10],通過實(shí)驗(yàn)驗(yàn)證了基于Bout 特征數(shù)構(gòu)建的氣味分布圖可以更加準(zhǔn)確地描述氣味濃度分布。
盡管傳統(tǒng)方法已有可觀成就,但設(shè)計(jì)人工特征較復(fù)雜,涉及到較多需手動調(diào)整的超參數(shù),且一般需要持續(xù)時(shí)間較長的響應(yīng)信號,影響距離估計(jì)的實(shí)時(shí)性。
MOS 傳感器信號是一種典型的時(shí)間序列。 隨著深度學(xué)習(xí)研究的發(fā)展,基于循環(huán)神經(jīng)網(wǎng)絡(luò)的方法在時(shí)間序列處理上取得了較好效果[11]。 相比于人工特征設(shè)計(jì)方法,深度學(xué)習(xí)方法從數(shù)據(jù)出發(fā)自動學(xué)習(xí)特征,避免了對手動參數(shù)設(shè)置的依賴,有望實(shí)現(xiàn)更復(fù)雜的特征表達(dá)。 長短時(shí)記憶(Long Short-Term Memory,LSTM)網(wǎng)絡(luò)作為一種典型的循環(huán)神經(jīng)網(wǎng)絡(luò)[12],其性能在多個時(shí)間序列處理相關(guān)領(lǐng)域得到了驗(yàn)證[13]。
本文將LSTM 網(wǎng)絡(luò)引入OSPE 研究中,借助LSTM 網(wǎng)絡(luò)對長序列特征的學(xué)習(xí)能力,對MOS 傳感器信號進(jìn)行處理,實(shí)現(xiàn)氣味源距離的端到端估計(jì)。
深度學(xué)習(xí)研究一般需要大量數(shù)據(jù)訓(xùn)練網(wǎng)絡(luò)以避免過擬合問題。 真實(shí)環(huán)境的氣味擴(kuò)散實(shí)驗(yàn)受限于復(fù)現(xiàn)困難、條件不可控等問題,難以大量開展重復(fù)性研究;基于計(jì)算機(jī)仿真技術(shù)實(shí)現(xiàn)的氣味擴(kuò)散仿真平臺可以提供可重復(fù)的虛擬氣味擴(kuò)散環(huán)境,利用氣味擴(kuò)散仿真平臺進(jìn)行算法驗(yàn)證,已成為OSL 等研究的重要方法[14]。 本文選取廣泛應(yīng)用的氣味擴(kuò)散仿真平臺GADEN[15]生成氣味擴(kuò)散仿真數(shù)據(jù),對其進(jìn)行LSTM 網(wǎng)絡(luò)訓(xùn)練和驗(yàn)證。 由于環(huán)境條件(環(huán)境風(fēng)場、氣味源釋放速率等)對氣味擴(kuò)散分布影響較大,為了驗(yàn)證模型在未知環(huán)境條件下的適應(yīng)能力,本文基于不同環(huán)境條件生成仿真數(shù)據(jù),測試網(wǎng)絡(luò)在未知環(huán)境條件下的距離估計(jì)性能,稱之為OSPE 的“環(huán)境條件泛化測試”。
本文主要貢獻(xiàn)包括:①首次將LSTM 網(wǎng)絡(luò)引入OSPE 研究中,利用網(wǎng)絡(luò)自動學(xué)習(xí)DI,避免了傳統(tǒng)估計(jì)方法對人為參數(shù)設(shè)置的依賴。 ②構(gòu)建了OSPE 仿真數(shù)據(jù)集用于網(wǎng)絡(luò)訓(xùn)練和參數(shù)調(diào)優(yōu)。 ③通過實(shí)驗(yàn)對不同LSTM 網(wǎng)絡(luò)超參數(shù)對距離估計(jì)準(zhǔn)確性的影響進(jìn)行了分析,得到了最優(yōu)網(wǎng)絡(luò)設(shè)計(jì)。 ④提出距離估計(jì)泛化測試,驗(yàn)證了網(wǎng)絡(luò)對未知環(huán)境條件的泛化適應(yīng)能力。
氣味擴(kuò)散仿真為主動嗅覺研究提供了可重復(fù)的虛擬氣味分布條件,已成為初期算法設(shè)計(jì)與驗(yàn)證的關(guān)鍵環(huán)節(jié)。 本文使用GADEN[15]仿真平臺生成OSPE 數(shù)據(jù)集,模擬50 種環(huán)境條件(不同的氣味源釋放速率、氣味源位置和環(huán)境風(fēng)速)下的氣味擴(kuò)散分布,同時(shí)在仿真中設(shè)置了多個MOS 傳感器用于氣味濃度采樣,得到了相應(yīng)的氣味濃度采樣序列。
GADEN 仿真平臺基于機(jī)器人操作系統(tǒng)(Robot Operation System,ROS)開發(fā),通過計(jì)算流體動力學(xué)(Computational Fluid Dynamics,CFD)軟件獲得環(huán)境風(fēng)場數(shù)據(jù),基于煙絲擴(kuò)散模型[16]實(shí)現(xiàn)對氣味擴(kuò)散過程的仿真,從而獲得氣味濃度空間分布。 GADEN 根據(jù)常用MOS 傳感器產(chǎn)品的響應(yīng)特性曲線,內(nèi)置了多種MOS 傳感器仿真模型,本文選取TGS2620[17](Figaro公司產(chǎn)品)作為氣體濃度采集傳感器。
構(gòu)建了如圖1 所示的室內(nèi)仿真環(huán)境,環(huán)境的長、寬、高尺寸為10.4 m×6.4 m×3 m,房間設(shè)有1 個氣流入口和1 個氣流出口,出口設(shè)為自然壓力出口。
圖1 室內(nèi)仿真模擬環(huán)境(平面圖)
入口處風(fēng)向如圖1 中矢量箭頭所示,通過控制入口風(fēng)速獲得不同的環(huán)境風(fēng)場。 氣味源設(shè)置在空間中線(Y=300 cm,Z=150 cm)不同位置處,釋放氣味分子一段時(shí)間后環(huán)境內(nèi)氣味分布趨近穩(wěn)定狀態(tài),如圖2 所示。
圖2 氣味擴(kuò)散示意圖(平面圖)
本文在50 種不同的環(huán)境條件下進(jìn)行氣味擴(kuò)散仿真,即5 種不同風(fēng)速、2 種不同氣味源位置和5 種不同氣味源釋放速率,在共5×2×5=50 種組合下采集了氣味擴(kuò)散仿真數(shù)據(jù)。 各環(huán)境條件的取值如表1 所示。
表1 仿真環(huán)境條件
表1 中給出的氣味源位置表示氣味源的X 軸坐標(biāo),入口風(fēng)速表示入口處的風(fēng)速大小,其方向與X軸平行,氣味源釋放速率表示氣味源每秒釋放的氣味分子數(shù),即氣味源濃度;本文設(shè)置的環(huán)境條件組合涵蓋了常見的室內(nèi)氣味擴(kuò)散環(huán)境條件。 針對50 種仿真環(huán)境條件組合,每種組合仿真兩輪,共得到100組仿真數(shù)據(jù)。
如圖1 所示,仿真氣味源設(shè)置在空間中線上靠近房間入口處,104 個MOS 傳感器(TGS2620,傳感器ID=0 ~103,圖1 中只標(biāo)記出了10 個傳感器)單排均勻部署在空間中線上(傳感器間隔10 cm,即ID=i的傳感器的X軸坐標(biāo)為10×icm)進(jìn)行密集的氣味濃度采集。 仿真過程中采集各MOS 傳感器所在位置的傳感器響應(yīng)和氣味濃度真值(即單位空間內(nèi)氣味分子數(shù),此真值由仿真平臺給出)。 每次仿真獲得的數(shù)據(jù)維度為(Ns×Nt),Ns表示傳感器個數(shù)(Ns=104),Nt表示采樣次數(shù)。 每次仿真從所有傳感器建立穩(wěn)定響應(yīng)(稱為有效起始時(shí)間)起采樣1 000 s,采樣頻率為10 Hz,即每0.1 s 對傳感器信號進(jìn)行一次采樣,即每輪仿真獲得的數(shù)據(jù)集尺寸為104×10 000。
1.3.1 有效起始時(shí)間
氣味分子從氣味源擴(kuò)散到下風(fēng)向處的傳感器并建立穩(wěn)定響應(yīng)需要一定時(shí)間。 本文在仿真中設(shè)置一個有效起始時(shí)間,即距離氣味源最遠(yuǎn)的傳感器建立穩(wěn)定響應(yīng)所需的時(shí)間,有效起始時(shí)間后,才開始記錄各傳感器的響應(yīng)數(shù)據(jù)。 本文分析了最小風(fēng)速條件(1 m/s)和最小氣味源釋放速率(30 s-1)下,距氣味源最遠(yuǎn)的MOS 傳感器位置的濃度真值變化曲線和傳感器響應(yīng)曲線,據(jù)此選取有效起始時(shí)間為20 s,即仿真中氣味源釋放20 s 后再開始采集傳感器的響應(yīng)數(shù)據(jù)。
1.3.2 數(shù)據(jù)歸一化
本文選取的TGS2620 氣體傳感器響應(yīng)輸出量程為[0,65 535],仿真環(huán)境中由16 位AD 轉(zhuǎn)換器采集傳感器響應(yīng)信號,65 535(即216-1)對應(yīng)無氣味響應(yīng)狀態(tài),取值范圍較大且分布不均勻,直接使用原始響應(yīng)采樣值進(jìn)行訓(xùn)練不利于模型收斂。 因此本文采用式(1)所示的方法對數(shù)據(jù)進(jìn)行歸一化處理。
式中:~R表示歸一化后的響應(yīng)值,R表示傳感器原始輸出響應(yīng)。 傳感器響應(yīng)歸一化有助于加快模型訓(xùn)練的收斂速度和穩(wěn)定性。
1.3.3 訓(xùn)練與測試數(shù)據(jù)集生成
一輪仿真得到的數(shù)據(jù)集記錄了氣味源下風(fēng)向間隔為0.1 m 的密集傳感器陣列的響應(yīng)數(shù)據(jù)。 實(shí)際應(yīng)用中難以如此密集地部署傳感器;直接使用1 000 s的序列作為模型輸入數(shù)據(jù)會影響應(yīng)用的實(shí)時(shí)性。 因此,本文在原始仿真數(shù)據(jù)的基礎(chǔ)上進(jìn)行時(shí)間截取和空間采樣(即時(shí)間和空間上的降采樣),以獲得更符合實(shí)際應(yīng)用場景的樣本進(jìn)行模型訓(xùn)練。
對于某一傳感器的歸一化響應(yīng)序列(1 ×10 000),利用滑動窗口截取不同長度的序列片段,得到時(shí)間截取后的樣本(樣本長度等于滑動窗口長度)。 以較大傳感器間隔(間隔為0.9 cm,共選取10個傳感器,)從陣列中均勻選取若干傳感器(即空間采樣),得到用于模型訓(xùn)練的數(shù)據(jù)集。
記滑動窗口的滑動步長為S(兩次截取數(shù)據(jù)時(shí)滑動窗口的移動距離),滑動窗口長度為L,降采樣后數(shù)據(jù)集樣本數(shù)為100×10×{[(10 000-L)/S]+1},其中100 為仿真次數(shù),每個樣本響應(yīng)序列尺寸為1×L。
圖3 為本節(jié)數(shù)據(jù)集中不同環(huán)境條件組合對應(yīng)的樣本數(shù)分布,不同環(huán)境條件組合的樣本數(shù)分布是相對均勻的。 其中訓(xùn)練集和驗(yàn)證集樣本數(shù)比例為4 ∶1。
圖3 各環(huán)境條件組合的樣本數(shù)量分布
最早用于OSPE 的指標(biāo)以傳感器響應(yīng)序列的統(tǒng)計(jì)特征為基礎(chǔ)。 Lilienthal 等[5]提出并分析了三種常用的DI 用于源距離估計(jì)的性能。 本文基于生成的OSPE 數(shù)據(jù)集對比了上述三種DI 的準(zhǔn)確性,在訓(xùn)練集上對三種DI 與氣味源距離的關(guān)系進(jìn)行最小二乘擬合(擬合目標(biāo)為多項(xiàng)式函數(shù),自變量為DI,因變量為氣味源距離),基于驗(yàn)證集對擬合函數(shù)進(jìn)行精度驗(yàn)證。
序列響應(yīng)平均值計(jì)算公式如下:
相應(yīng)的平均化標(biāo)準(zhǔn)差計(jì)算公式如下:
式(2)、(3)、(4)中di表示第i個氣源距離標(biāo)簽的某一序列,S(di)表示該序列數(shù)值個數(shù),μ(k)表示該序列中第k個數(shù)值。 按公式即可求出第i個氣源距離標(biāo)簽下所有序列的DI用于最小二乘擬合。 擬合多項(xiàng)式在驗(yàn)證集上測試平均誤差的計(jì)算公式如下:
式中:Nv表示驗(yàn)證集序列總數(shù),ln表示驗(yàn)證集中第n個序列的距離標(biāo)簽,F(xiàn)q表示距離指標(biāo)q的擬合多項(xiàng)式,qn表示驗(yàn)證集中第n個序列的DI。
基于統(tǒng)計(jì)特征的DI 在驗(yàn)證集上的平均估計(jì)誤差如表2 所示,其中平均值的距離估計(jì)效果相對較好,但是三種DI 在10m 范圍內(nèi)的相對估計(jì)誤差都在20%以上,精度較低,難以用于實(shí)際的OSPE應(yīng)用。
表2 基于統(tǒng)計(jì)特征的DI 驗(yàn)證集平均誤差
基于統(tǒng)計(jì)特征的DI 計(jì)算方法簡單,但距離估計(jì)精度較低。 文獻(xiàn)[8]提出了“Bout”特征,通過設(shè)計(jì)級聯(lián)濾波器,提取濾波信號中連續(xù)上升的部分作為Bout 特征;通過擬合氣味源距離和Bout 特征的關(guān)系(線性函數(shù)),獲得了較好的估計(jì)效果(文獻(xiàn)[8]給出的相對估計(jì)誤差為12.4%,文獻(xiàn)[9]改進(jìn)的Bout 特征相對估計(jì)誤差為5.5%)。 但人工特征涉及較多需要手動調(diào)整的參數(shù),參數(shù)取值對估計(jì)精度影響較大,且難以考慮不同環(huán)境條件對模型參數(shù)的影響。
隨著深度學(xué)習(xí)方法的發(fā)展與成熟,以循環(huán)神經(jīng)網(wǎng)絡(luò)為代表的深度網(wǎng)絡(luò)模型在語音識別[18]、語言建模[19]和翻譯[20]等時(shí)間序列處理領(lǐng)域中獲得了比傳統(tǒng)人工特征方法更好的效果。 針對現(xiàn)有基于人工特征進(jìn)行OSPE 方法存在的問題,本文將深度網(wǎng)絡(luò)模型引入OSPE 應(yīng)用中,基于LSTM 網(wǎng)絡(luò)構(gòu)建距離估計(jì)模型,在大量仿真數(shù)據(jù)上進(jìn)行模型訓(xùn)練與驗(yàn)證,并分析網(wǎng)絡(luò)超參數(shù)對距離估計(jì)效果的影響。 為驗(yàn)證模型在未知環(huán)境條件下的距離估計(jì)效果,本文還進(jìn)行了OSPE 泛化測試,通過在未知環(huán)境條件(訓(xùn)練時(shí)未出現(xiàn)過的環(huán)境條件)數(shù)據(jù)集上進(jìn)行距離估計(jì)測試,驗(yàn)證模型的泛化能力。
LSTM 網(wǎng)絡(luò)針對循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)處理長時(shí)間序列能力不足的問題,通過設(shè)計(jì)信息選擇性通過的門結(jié)構(gòu),實(shí)現(xiàn)對長依賴關(guān)系的學(xué)習(xí)[21]。 本文利用LSTM 網(wǎng)絡(luò)進(jìn)行MOS 傳感器響應(yīng)序列處理。
3.1.1 LSTM 層結(jié)構(gòu)
LSTM 層結(jié)構(gòu)如圖4 所示。 LSTM 層包括1 個LSTM 單元,遞歸地處理前一層輸出的序列數(shù)據(jù)。x代表輸入信息,隱藏狀態(tài)h和記憶狀態(tài)C分別代表隱藏信息和記憶信息。
圖4 LSTM 層結(jié)構(gòu)
3.1.2 網(wǎng)絡(luò)結(jié)構(gòu)
LSTM 單元輸入數(shù)據(jù)維度為(B,I,L),其中B代表批尺寸(Batch size,指一次訓(xùn)練時(shí)并行計(jì)算的樣本數(shù)),I表示特征維度(本文特征維度固定為1),L表示時(shí)間序列長度;單元輸出數(shù)據(jù)維度為(B,H),H表示隱藏狀態(tài)h的維度。 本文選取LSTM 網(wǎng)絡(luò)層數(shù)為W,最后一層最后一個隱藏狀態(tài)作為整個LSTM結(jié)構(gòu)的輸出單元,輸出單元接全連接網(wǎng)絡(luò)(輸入維度為H,輸出維度為1),得到最終的距離估計(jì)值,網(wǎng)絡(luò)結(jié)構(gòu)如圖5 所示。
圖5 LSTM 網(wǎng)絡(luò)結(jié)構(gòu)
3.2.1 網(wǎng)絡(luò)訓(xùn)練與驗(yàn)證過程
分別利用PyTorch 和Paddle 實(shí)現(xiàn)網(wǎng)絡(luò)構(gòu)建,基于NVIDIA V100 顯卡進(jìn)行網(wǎng)絡(luò)訓(xùn)練與測試。 實(shí)驗(yàn)采用1.2 節(jié)生成的仿真數(shù)據(jù)集進(jìn)行網(wǎng)絡(luò)訓(xùn)練和驗(yàn)證。 基于3.1.2 中的網(wǎng)絡(luò)結(jié)構(gòu),以均方誤差(meansquare error,MSE)作為損失函數(shù),采用Adam 優(yōu)化器進(jìn)行網(wǎng)絡(luò)優(yōu)化。 為加快訓(xùn)練收斂速度,在訓(xùn)練過程中設(shè)置動態(tài)學(xué)習(xí)率,若連續(xù)10 個迭代周期內(nèi),模型在驗(yàn)證集上的距離估計(jì)精度提升小于0.01 m 時(shí),則降低學(xué)習(xí)率(乘以0.5)繼續(xù)訓(xùn)練;調(diào)整兩次學(xué)習(xí)率后性能仍不提升時(shí),結(jié)束模型訓(xùn)練并保存最優(yōu)模型參數(shù),訓(xùn)練周期設(shè)置為200。(20%)有顯著降低。
圖6 最優(yōu)模型性能曲線
3.2.2 超參數(shù)影響分析
LSTM 網(wǎng)絡(luò)涉及的超參數(shù)包括LSTM 單元隱藏狀態(tài)維度、LSTM 層數(shù),以及輸入步長。 上述三個超參數(shù)可能對模型性能有較明顯影響,本文通過控制變量法分析不同參數(shù)對模型精度的影響。
①輸入步長
分別選定如圖7 中所示的8 種輸入步長(采樣數(shù)據(jù)長度50~2 500,對應(yīng)采樣時(shí)間5 s~250 s)進(jìn)行驗(yàn)證,設(shè)置LSTM 單元隱藏狀態(tài)維度為64、LSTM 層數(shù)為2,驗(yàn)證集距離估計(jì)誤差曲線如圖7 所示。
圖7 不同輸入步長與驗(yàn)證集估計(jì)誤差關(guān)系
由圖7 可知,當(dāng)輸入步長小于1 200 時(shí),輸入步長變化顯著地影響模型精度,輸入步長越大,有效的輸入信息量越多,估計(jì)誤差越??;當(dāng)輸入步長大于1 200 后,輸入信息變得復(fù)雜和冗余,故該參數(shù)增加對模型精度幾乎無提升。 充分考慮模型復(fù)雜度和精度的平衡,本文最終選定輸入步長為1 200。
②LSTM 層數(shù)對模型性能的影響
增加LSTM 層數(shù)可以提高網(wǎng)絡(luò)的特征表達(dá)能力,但會增加模型的復(fù)雜度和計(jì)算開銷。 本文在驗(yàn)證集上對1 ~4 層LSTM 網(wǎng)絡(luò)的模型精度進(jìn)行對比(LSTM 單元隱藏狀態(tài)維度為64,輸入步長1 200),驗(yàn)證集估計(jì)誤差曲線如圖8 所示。
由圖8 可知,LSTM 層數(shù)設(shè)置為4 時(shí),LSTM 網(wǎng)絡(luò)復(fù)雜度過高,模型收斂速度較慢,開始訓(xùn)練90 輪后估計(jì)誤差才出現(xiàn)明顯下降。 對比其他層數(shù),2 層的模型性能最佳,故本文選取LSTM 層數(shù)為2。
圖8 不同LSTM 層數(shù)與驗(yàn)證集估計(jì)誤差關(guān)系
③LSTM 單元隱藏狀態(tài)維度
本文選取如圖9 所示的5 種LSTM 單元隱藏狀態(tài)維度(16 ~128)進(jìn)行對比驗(yàn)證,設(shè)置輸入步長為1 200、LSTM 層數(shù)為2,不同隱藏狀態(tài)維度對應(yīng)的模型驗(yàn)證集估計(jì)誤差曲線如圖9 所示。
圖9 不同隱藏狀態(tài)維度與驗(yàn)證集估計(jì)誤差關(guān)系
圖10 驗(yàn)證集估計(jì)誤差及模型總參數(shù)量之間關(guān)系
綜上,本文選取LSTM 網(wǎng)絡(luò)層數(shù)為2,隱藏狀態(tài)維度為64,輸入步長為1 200,模型訓(xùn)練130 輪左右趨于收斂,對應(yīng)最優(yōu)估計(jì)精度約為0.16 m。 網(wǎng)絡(luò)超參數(shù)與PyTorch/Paddle 框架中的LSTM 單元參數(shù)的對應(yīng)關(guān)系如表3 所示。
表3 網(wǎng)絡(luò)參數(shù)在PyTorch/Paddle 框架中對應(yīng)關(guān)系
3.3.1 未知環(huán)境泛化測試
模型泛化能力指模型處理新數(shù)據(jù)的能力。 由于環(huán)境條件對氣味擴(kuò)散分布影響較大,本文提出針對未知環(huán)境條件的泛化測試,即在基于未知環(huán)境條件生成的泛化測試數(shù)據(jù)集上測試模型的泛化能力。 首先設(shè)置與1.2 節(jié)仿真數(shù)據(jù)集生成條件完全不同的環(huán)境條件,生成新的仿真數(shù)據(jù):設(shè)置環(huán)境風(fēng)速為1.8 m/s、2.2 m/s,氣味釋放速率為45、55,氣味源位置為X=0.75 m,基于上述條件的4 種組合生成4 組仿真數(shù)據(jù),得到5 760 個泛化測試樣本。 泛化測試集的仿真環(huán)境條件對于模型來說均是未知的(與訓(xùn)練集完全不同的環(huán)境條件)。
在泛化測試集上采用本文模型得到的不同氣源距離區(qū)間對應(yīng)的平均估計(jì)誤差如圖11 所示。 泛化測試集在各距離區(qū)間的樣本數(shù)量分布大致均勻,整體平均泛化誤差約為0.25 m,平均相對誤差約為2.5%(10 m 范圍);泛化誤差與距離區(qū)間有較強(qiáng)相關(guān)性,在距離氣味源較近區(qū)域和較遠(yuǎn)區(qū)域有較高的估計(jì)精度,而在中間區(qū)域估計(jì)精度相對較低,將在后續(xù)工作中分析該情況。
圖11 不同氣味源距離區(qū)間對應(yīng)的泛化測試結(jié)果
3.3.2 泛化對比分析
為了驗(yàn)證本文基于LSTM 的OSPE 模型的有效性,將LSTM 距離估計(jì)模型與第2 章中基于三個統(tǒng)計(jì)DI 的擬合函數(shù)進(jìn)行對比。 在相同訓(xùn)練集上訓(xùn)練模型或利用最小二乘法擬合統(tǒng)計(jì)指標(biāo)到氣味源距離的函數(shù)關(guān)系,分別在驗(yàn)證集和泛化測試集上測試距離估計(jì)精度。
從表4 可知LSTM 距離估計(jì)模型的驗(yàn)證集估計(jì)誤差、泛化誤差最小,較另外三種基于統(tǒng)計(jì)DI 的方法降低了一個數(shù)量級,泛化能力最強(qiáng)。
表4 不同DI 估計(jì)誤差對比 單位:m
本文將深度學(xué)習(xí)方法引入氣味源距離估計(jì)的應(yīng)用中,基于氣味擴(kuò)散仿真平臺GADEN 生成仿真數(shù)據(jù)集,提出了一種基于LSTM 的氣味源距離估計(jì)模型,在仿真數(shù)據(jù)集上訓(xùn)練、驗(yàn)證模型,得到了較好的距離估計(jì)效果。 利用對比實(shí)驗(yàn)分析了LSTM 超參數(shù)對模型精度的影響,通過驗(yàn)證實(shí)驗(yàn)得到最優(yōu)模型,獲得了1.6%的距離估計(jì)相對誤差(10 m 空間內(nèi)),顯著優(yōu)于基于統(tǒng)計(jì)指標(biāo)的方法。 同時(shí)給出了模型泛化測試方法,通過生成未知環(huán)境條件下的仿真數(shù)據(jù)集對模型的泛化能力進(jìn)行了驗(yàn)證。 本文方法利用深度學(xué)習(xí)網(wǎng)絡(luò)特征自學(xué)習(xí)的特點(diǎn),克服了傳統(tǒng)方法對氣味擴(kuò)散模型和人工參數(shù)設(shè)定的依賴。
本文研究結(jié)果驗(yàn)證了基于深度學(xué)習(xí)進(jìn)行氣味源定位的可行性。 不過顯然氣體擴(kuò)散取決于復(fù)雜眾多的環(huán)境因素,例如風(fēng)速、地形結(jié)構(gòu)和氣流障礙物等。為了進(jìn)一步探討這些因素的影響,首先還需要在更復(fù)雜自由的模擬環(huán)境中進(jìn)行測試(比如在空間中添加多個氣流出口或氣流障礙物),進(jìn)一步完善模型和數(shù)據(jù)集(如在更多位置采集傳感器響應(yīng)信號),然后思考將該方法應(yīng)用于移動機(jī)器人或無線傳感器網(wǎng)絡(luò),進(jìn)一步研究主動嗅覺導(dǎo)航策略。