• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于隨機森林的公路隧道CO氣體濃度預測模型

      2022-11-01 06:34:52張志剛徐瑩張錦秋韓秀杰閆尉深
      科學技術與工程 2022年26期
      關鍵詞:交通量車速污染物

      張志剛, 徐瑩, 張錦秋, 韓秀杰, 閆尉深

      (1.河北省高速公路延崇籌建處, 張家口 075400; 2.河北工業(yè)大學土木與交通學院, 天津 300401)

      隧道是公路交通網(wǎng)絡的重要組成部分。公路隧道的建設有效地減少了道路病害、保護自然環(huán)境,提高了公路交通的運輸效率。由于狹長的隧道空間不利于污染物的及時擴散,車輛排放的污染物不僅限制了隧道的建設規(guī)模,還影響隧道的運營成本、駕駛安全性和司乘人員的健康[1-2]。

      一氧化碳(CO)是車輛排放污染物的主要成分,對人體健康影響最大。輕則會造成人體反應、記憶力等機能障礙;重則危害人體血液循環(huán)系統(tǒng)。現(xiàn)行公路隧道的通風控制多依據(jù)污染物監(jiān)測結(jié)果實施,數(shù)據(jù)反饋的時滯性和通風控制的滯后性導致隧道內(nèi)污染物濃度無法得到及時、有效的控制,極易造成隧道內(nèi)污染物的積聚,從而影響人員健康和行車安全。因此,提前預知隧道內(nèi)CO濃度值及其變化趨勢,對隧道內(nèi)CO濃度控制及隧道通風控制方案的制定十分必要。

      隧道內(nèi)車輛排放CO濃度受諸多因素影響,如交通量、車速、風速。已有眾多學者對這些影響因素進行了研究[3-5]。陳雷[6]通過實驗研究得出:無豎井縱向通風隧道越長,隧道末端CO濃度越大。雨天情況下隧道內(nèi)CO氣體濃度較高[7]。付偉等[8]通過物理與數(shù)學模型得出交通量與隧道長度、交通量與高程、隧道入口風速與高程對CO氣體濃度的關系。《公路隧道通風設計細則》JTG/T D70/2-02—2014[9]中給出的CO排放量經(jīng)驗計算公式考慮了多種因素的影響。但計算公式將車速、風速等作為定值參數(shù)計算,難以作為隧道內(nèi)CO氣體濃度控制的依據(jù)。此外,部分學者對各因素作用下的隧道內(nèi)污染氣體濃度的分布特征進行了廣泛研究,總結(jié)了污染氣體濃度沿隧道長度的分布規(guī)律[10-11]。然而,污染氣體濃度的粗略計算和定性的污染氣體濃度分布規(guī)律難以作為隧道前饋式通風系統(tǒng)精確控制的依據(jù),不利于實現(xiàn)隧道的節(jié)能環(huán)保運行。

      隨著機器學習的發(fā)展和推廣,越來越多的學者將其應用于空氣污染物濃度的預測研究[12-13]。機器學習在非線性數(shù)據(jù)處理與預測方面優(yōu)勢突出,Grivas 等[14]建立了基于時間和氣象數(shù)據(jù)的PM10人工神經(jīng)網(wǎng)絡預測模型,模型預測結(jié)果的決定系數(shù)(R2)介于0.50~0.67。孫寶磊[15]基于污染物濃度監(jiān)測數(shù)據(jù),建立了SO2、NO2、O3、CO、PM10、PM2.56種污染物的BP (back propagation) 神經(jīng)網(wǎng)絡預測模型。王黎明等[16]提出了基于距離相關系數(shù)和支持向量機回歸的PM2.5濃度預測模型。董紅召等[17]利用空氣污染物監(jiān)測數(shù)據(jù)和車輛抓拍識別數(shù)據(jù),構(gòu)建了基于CART (classification and regression tree) 回歸樹的氮氧化物(NOx)濃度預測模型。構(gòu)建準確、高效的隧道內(nèi)污染氣體濃度預測機器學習模型,實現(xiàn)污染氣體濃度的實時預測,可為隧道通風系統(tǒng)的精準控制提供依據(jù),有利于實現(xiàn)隧道前饋式通風系統(tǒng)的節(jié)能環(huán)保。

      隨機森林是一種靈活性高的機器學習算法,能夠處理高維度數(shù)據(jù)、模型泛化能力強、訓練速度快,廣泛應用于交通運輸[18]、水質(zhì)監(jiān)測[19]、電力系統(tǒng)預警[20]等領域,且性能突出。為準確、快速地預測隧道內(nèi)CO氣體濃度,降低CO氣體對人員健康的危害、保證隧道營運的安全和環(huán)保,現(xiàn)將隨機森林應用于隧道CO濃度預測研究中,并驗證預測模型的準確性,以實現(xiàn)多因素共同作用下的隧道內(nèi)CO濃度的準確預測。首先,搜集隧道內(nèi)CO濃度現(xiàn)場實測數(shù)據(jù)建立數(shù)據(jù)庫;其次,基于隨機森林算法構(gòu)建隧道內(nèi)CO濃度預測模型;最后,將構(gòu)建的預測模型應用于3 300 m長隧道的CO氣體濃度預測,以驗證模型的預測性能。

      1 數(shù)據(jù)收集與處理

      1.1 數(shù)據(jù)收集

      為充分考慮各因素對隧道內(nèi)CO濃度預測的影響,本文研究結(jié)合文獻[4]的現(xiàn)場實測數(shù)據(jù),將車流量、車速、風速作為主要輸入特征。為充分考慮隧道內(nèi)污染物濃度分布的不均勻性,提高模型泛化性能,將污染物監(jiān)測點位置作為輸入特征之一。文獻[4]中實測隧道長度為2 087 m;沿隧道設置5個監(jiān)測點,監(jiān)測點間的隧道長度分別為360、600、540、580 m,高度均為1.2 m;測試時間共120 min;數(shù)據(jù)集共120組數(shù)據(jù),測試日期為2019年12月20日16:30—18:30,整體分析如表 1所示。測點位置被定義為距隧道出口距離與隧道長度的比值。交通量以小客車為標準車型折算為當量標準小客車,小型車折算系數(shù)為1,中型車折算系數(shù)為1.5,大型車折算系數(shù)為2.5,汽車列車折算系數(shù)為4.0[21]。

      表1 樣本數(shù)據(jù)集分析Table 1 Statistics of the collecting database

      1.2 數(shù)據(jù)處理

      皮爾遜相關系數(shù)常用于度量兩個變量間的相關性,值介于-1~1。其中,-1表示完全負相關,0表示無關,1表示完全正相關。為了更好地了解各輸入特征間的相關關系,避免非必要特征導致的過擬合,并減小計算強度,本文對輸入特征進行皮爾遜相關性分析,計算結(jié)果如圖 1所示。由圖 1可以看出,各輸入特征間的皮爾遜相關系數(shù)絕對值均小于0.6,各特征間為弱相關關系,因此認為各輸入特征相互獨立且有意義。

      圖1 各特征間的皮爾遜相關系數(shù)Fig.1 Pearson correlation coefficient of each pair input variables

      處理數(shù)據(jù)缺失問題的常用方法為刪減法和填補法。由于樣本數(shù)據(jù)集數(shù)量的限制,本文采用填補法處理車速缺失數(shù)據(jù),以減小數(shù)據(jù)缺失導致的預測誤差。車速缺失數(shù)據(jù)對應的隧道限制車速為40~80 km/h,故使用[40,60]區(qū)間內(nèi)的隨機數(shù)填補缺失數(shù)據(jù)。

      為避免數(shù)據(jù)透視差導致的模型精度虛高現(xiàn)象,在將樣本數(shù)據(jù)集輸入隨機森林模型前,首先進行訓練集和測試集數(shù)據(jù)的劃分,并設置數(shù)據(jù)集劃分隨機生成器種子。數(shù)據(jù)透視差是指在模型訓練過程中,由于每次劃分的數(shù)據(jù)集不同,多次運行后使機器學習算法學習到整個樣本數(shù)據(jù),進而導致模型計算結(jié)果過于樂觀。隨機挑選數(shù)據(jù)集的70%作為訓練集數(shù)據(jù),30%作為測試集數(shù)據(jù);隨機生成器種子為42。

      由表 1可知,數(shù)據(jù)集各特征值量級存在較大差異,為統(tǒng)一樣本數(shù)據(jù)的統(tǒng)計分布,提高預測模型的計算效率,采用如下公式對樣本數(shù)據(jù)集進行歸一化處理:

      (1)

      式(1)中:x*為歸一化后的樣本數(shù)據(jù);xmean為樣本數(shù)據(jù)均值;xmax為樣本數(shù)據(jù)最大值;xmin為樣本數(shù)據(jù)最小值。

      2 預測模型建立

      2.1 隨機森林模型

      圖2 隨機森林原理Fig.2 Simplified conceptual diagram of the RF method

      (2)

      式(2)中:x為輸入模型的自變量與因變量。

      2.2 模型評價指標

      (1)決定系數(shù)(R2),也稱擬合優(yōu)度,反應自變數(shù)x對變數(shù)y變異的可解釋的百分比,進而判斷模型的解釋能力。決定系數(shù)越大,自變量引起的變動占總變動的百分比越高,自變量對因變量的解釋程度越高。

      (2)均方根誤差(root mean square error, RMSE),也稱標準誤差,是觀測值和真實值的差的平方與觀測次數(shù)n的比值的平方根。均方根誤差能夠很好地反映測量的精密度。

      決定系數(shù)和均方根誤差的計算公式為

      (3)

      (4)

      2.3 模型參數(shù)確定

      隨機森林是基于bagging框架的決策樹模型,故隨機森林的參數(shù)調(diào)節(jié)包括框架的參數(shù)擇優(yōu)和決策樹的參數(shù)擇優(yōu)。采用十折交叉驗證微調(diào)模型,設置30種參數(shù)組合,每種組合計算10次,組合的最優(yōu)RMSE結(jié)果如圖 3所示,最小值RMSE為0.491 0。據(jù)此確定最優(yōu)超參數(shù)n_estimators為100;bootstrap為False;max_features為4;其余參數(shù)為默認值。

      圖3 每種試驗組合的最優(yōu)RMSE Fig.3 The best RMSE versus each parameter combination test

      3 預測結(jié)果與分析

      3.1 模型預測結(jié)果分析

      應用預處理完成的訓練集和測試集數(shù)據(jù)對模型其進行評估。模型的學習曲線如圖 4所示。由圖 4可知,隨著訓練集數(shù)量的增加,訓練曲線的R2平穩(wěn)至接近1。測試曲線的R2變化較大,在初始的20次循環(huán)中,R2急劇上升至0.8;逐漸趨向于訓練集結(jié)果,并最終穩(wěn)定于0.9左右。由此可知,CO濃度預測模型表現(xiàn)力好,無數(shù)據(jù)過擬合和欠擬合現(xiàn)象。

      圖4 學習曲線Fig.4 Learning curve

      訓練集和測試集數(shù)據(jù)應用于該預測模型的計算結(jié)果如圖 5所示,其中圖 5(a)為訓練集預測結(jié)果,圖 5(b)為測試集預測結(jié)果。由圖 5可以看出,基于該模型的CO濃度預測值與CO濃度實測值十分接近。預測模型在訓練集的平均絕對誤差和決定系數(shù)分別為0.187 1和0.990 7;測試集的平均絕對誤差和決定系數(shù)分別為0.497 4和0.943 7。由此可知,基于隧道內(nèi)CO濃度影響因素構(gòu)建隨機森林預測模型的整體擬合性能較高,能夠準確預測隧道內(nèi)的CO濃度值。

      圖5 預測模型計算結(jié)果Fig.5 Scatter plot of the predicted and actual pressures for full database

      為進一步評估基于隨機森林的隧道內(nèi)CO濃度預測模型性能,本文建立了隧道內(nèi)CO濃度預測線性模型和支持向量機模型,并比較3種模型的預測性能,如表 2所示。線性回歸模型中訓練集和測試集的RMSE分別為0.817 4和1.044 6,R2分別為0.809 7和0.778 1;支持向量機模型中訓練集和測試集的RMSE分別為0.282 0和0.629 4,R2分別為0.977 3和0.919 4。RMSE值低說明預測值與真實值偏差??;R2高說明預測值與真實值接近,模型擬合效果好。由此可知,隨機森林模型的測試結(jié)果優(yōu)于線性回歸模型和支持向量機模型。

      表2 隨機森林和線性回歸模型性能比較Table 2 The performance comparison of random forest and linear regression

      3.2 預測模型驗證

      將構(gòu)建的隧道內(nèi)CO氣體濃度預測模型應用于3 300 m長公路隧道內(nèi)CO氣體濃度預測,并將預測結(jié)果與實際CO氣體濃度值比較,進一步驗證預測模型的適用性。驗證集數(shù)據(jù)來源于整理文獻[4]中關于3 300 m長隧道的實測數(shù)據(jù)(共110組)。數(shù)據(jù)采集監(jiān)測點為5個,間距為900、770、610、510 m,監(jiān)測點高度為1.2 m?,F(xiàn)場實測時間為2020年1月9日17:10—19:00。數(shù)據(jù)的統(tǒng)計方式與表 1相同,兩次隧道實測儀器相同。數(shù)據(jù)集分析如表 3所示。

      將驗證集數(shù)據(jù)輸入特征按照式(1)進行歸一化處理后導入訓練好的CO預測模型,并將模型輸出結(jié)果與驗證集CO濃度真實值進行對比,結(jié)果如圖 6所示。驗證集的RMSE和R2分別為0.909 5和0.729 5, 劣于測試集數(shù)據(jù)計算結(jié)果。這是由兩組實測數(shù)據(jù)集的數(shù)據(jù)差異導致。兩組實測數(shù)據(jù)來自不同的隧道,表 1中數(shù)據(jù)源于隧道A,長2 087 m,單洞建筑限界寬度為13.25 m,限高為5 m,設計速度為80 km/h;表 3中數(shù)據(jù)源于隧道B,長3 300 m,單洞建筑限界寬度為8.5 m,限高為4 m,設計速度為50 km/h。表 1數(shù)據(jù)集中交通量和車速數(shù)據(jù)的標準差分別為52.97和4.94,而表 3驗證集數(shù)據(jù)中交通量和車速數(shù)據(jù)的標準差分別為32.78和14.71。兩組數(shù)據(jù)中交通量和車速數(shù)據(jù)的標準差相差約37.78%和197.78%,這使得預測模型在驗證集預測性能的表現(xiàn)稍差。此外,隧道A與隧道B所處地理位置存在差異,會導致環(huán)境中的CO氣體濃度略有不同,而實測數(shù)據(jù)為考慮隧道環(huán)境的CO氣體濃度,而CO氣體濃度預測模型是基于隧道A的測試數(shù)據(jù)建立,因此導致預測模型對隧道B內(nèi)CO氣體濃度的計算誤差。

      圖6 模型驗證結(jié)果Fig.6 Scatter plot of the predicted and actual pressures for validation database

      表3 樣本數(shù)據(jù)集分析Table 3 Statistics of the collecting database

      總體而言,基于2 087 m隧道現(xiàn)場實測數(shù)據(jù)建立的CO濃度預測模型能夠較為準確地預測CO濃度,模型泛化能力較強。

      3.3 特征重要性分析

      為進一步分析各輸入特征對隧道內(nèi)CO濃度預測的影響,應用隨機森林對輸入特征的重要性進行分析,并采用基尼指數(shù)作為特征重要性評價指標。依據(jù)特征重要性評分結(jié)果將各特征依次排序,如圖 7所示。由圖 7可以看出,測點位置的重要性評分最高(0.593 34);其次是風速(0.330 14);車速和交通量的重要性評分分別為0.045 26和0.031 26。

      圖7 特征重要性Fig.7 Feature importance

      特長隧道內(nèi)CO濃度監(jiān)測點位置間距較大,不同監(jiān)測點CO氣體濃度存在差異,致使隧道內(nèi)CO氣體濃度分布不均勻。因此,測點位置對特長隧道CO氣體濃度預測有較大影響。圖 8為各輸入特征與CO濃度的散點圖,圖8中紅色線段為對應特征與CO濃度的關系曲線。由圖 8可以看出,測點位置與CO濃度的關系最為顯著[圖 8(a)];風速與CO濃度的關系擬合曲線[圖 8(b)]次之。隨著測點位置值的增大,隧道內(nèi)CO濃度逐漸減小,即靠近隧道出口處,CO濃度值較大。此外,隧道內(nèi)CO濃度值隨風速的增大逐漸減小。車速、交通量與CO濃度的關系難以通過數(shù)據(jù)散點圖總結(jié)[圖 8(c)和圖8(d)],因此,車速與交通量對隧道CO濃度的影響規(guī)律的總結(jié)應結(jié)合其他因素綜合考慮。

      圖8 輸入特征與風速的關系Fig.8 Scatter plot of CO versus input variables

      4 結(jié)論

      (1)以公路隧道實測數(shù)據(jù)為基礎,建立了以交通量、車速、風速為主要輸入特征的特長隧道內(nèi)CO氣體濃度預測模型。該模型在訓練集的RMSE和R2分別為0.187 1和0.990 7;測試集的RMSE和R2分別為0.497 4和0.943 7;預測結(jié)果優(yōu)于線性模型和支持向量機模型。

      (2)本文建立CO氣體濃度預測模型具有準確的預測性能和良好的泛化能力。預測模型應用于3 300 m長隧道內(nèi)CO氣體濃度預測,預測結(jié)果與實際CO氣體濃度值比較顯示RMSE和R2分別為0.909 5和0.729 5。

      (3)特征的重要性分析確定測點位置對隧道內(nèi)CO濃度的影響最大,風速次之。隨著測點位置值的增大,隧道內(nèi)CO濃度逐漸減??;靠近隧道出口處,CO濃度值較大。隧道內(nèi)CO氣體濃度值隨風速的增大逐漸減小。

      猜你喜歡
      交通量車速污染物
      基于ETC門架數(shù)據(jù)的高速公路交通量轉(zhuǎn)換探究
      菌株出馬讓畜禽污染物變廢為寶
      環(huán)境科學研究(2021年6期)2021-06-23 02:39:54
      環(huán)境科學研究(2021年4期)2021-04-25 02:42:02
      你能找出污染物嗎?
      基于動態(tài)差法的交通量監(jiān)測技術應用
      2012款奔馳R300車修改最高車速限制
      高速公路補償交通量模型研究
      基于四階段法的公路交通量預測研究
      北方交通(2016年12期)2017-01-15 13:52:51
      北京現(xiàn)代途勝車車速表不工作
      化隆| 克东县| 阿坝县| 蒙自县| 平远县| 武宣县| 隆化县| 龙游县| 洛南县| 巩义市| 鄂温| 浦东新区| 金阳县| 山西省| 翁源县| 马公市| 红原县| 奉新县| 花垣县| 教育| 张家口市| 蓬溪县| 民丰县| 乌海市| 扎鲁特旗| 蚌埠市| 嵊州市| 横峰县| 郑州市| 库车县| 措美县| 鹤庆县| 甘德县| 宜宾县| 珠海市| 札达县| 库伦旗| 上饶县| 内江市| 大邑县| 嵊州市|