摘要 文章將基于高速公路沿線自建觀測站樁和氣象站收集的長序列能見度觀測數(shù)據(jù)作為輸入,利用長短時記憶模型(LSTM)構(gòu)建了能見度的監(jiān)測和外推模型,分別開展逐5 min間隔、30 min時效的外推試驗,同時定量評估了不同模型結(jié)構(gòu)、訓(xùn)練時間及有無遺忘層對結(jié)果的影響。外推結(jié)果表明,LSTM模型的最大RMSE可達3.75 km,調(diào)整訓(xùn)練輸入尺度參數(shù)后,RMSE減小幅度達33.3%;調(diào)整訓(xùn)練時間步長后,RMSE進一步減少了3.5%;加入遺忘層后RMSE又進一步減少了10.9%,為0.73 km,但也存在10 min外推時效內(nèi)RMSE增大的情況。由于能見度在10 km以下的事件對交通安全的影響較大,提取了10 km以下的能見度事件進行了獨立評估,發(fā)現(xiàn)增加遺忘層對10 km以下的RMSE有增大的趨勢。該研究能夠提前預(yù)判低能見度的演變過程,相關(guān)結(jié)果已應(yīng)用在交管部門并協(xié)助其提前決策,一定程度上減少了惡劣天氣對交通造成的不利影響。
關(guān)鍵詞 短臨監(jiān)測;LSTM;能見度
中圖分類號 U495 文獻標(biāo)識碼 A 文章編號 2096-8949(2024)22-0007-03
0 引言
高速公路提供高速、便捷的運輸手段,是社會經(jīng)濟發(fā)展的重要條件。隨著交通事業(yè)不斷發(fā)展,截至2022年底[1],我國當(dāng)前公路里程已達到535.48萬公里,其中高速公路里程11.99萬公里。然而,相關(guān)研究也指出,我國高速公路交通事故頻次居高不下,在造成大量生命和財產(chǎn)損失的同時,也嚴(yán)重影響路網(wǎng)運行效率[2],因此其事故危害性遠高于普通公路[3]。能見度是用來衡量大氣透明度的距離指標(biāo),代表水平方向的可見距離。研究指出,當(dāng)能見度小于100 m時,交通事故發(fā)生的概率密度會比其他情況高出30%[4]。面對頻繁出現(xiàn)的低能見度惡劣天氣,高速公路沿線氣象產(chǎn)品與服務(wù)的準(zhǔn)確性和精細化,對于提高交通運輸?shù)陌踩燥@得尤為重要[5]。
許多學(xué)者已在利用氣象數(shù)據(jù)輔助道路決策中開展了大量工作,唐亞平等[6]利用沈山高速公路沿線10個交通氣象站的氣象觀測資料建立了數(shù)學(xué)模型,對公路路面溫度、能見度及冰雪路面等交通氣象環(huán)境進行了判識。同時,也有學(xué)者采用天氣學(xué)與統(tǒng)計學(xué)相結(jié)合的方法,以及直接使用環(huán)境氣象數(shù)值預(yù)報模式,針對高速公路能見度開展了相應(yīng)研究,賀皓等[7]依據(jù)陜西省的三條高速公路的大霧天氣,制作了大霧氣象成因的概念模型;林云等[8]根據(jù)空氣質(zhì)量觀測和相對濕度建立了與能見度時空特征的統(tǒng)計關(guān)系,構(gòu)建了適合深圳市區(qū)的能見度統(tǒng)計模型;美國大氣研究中心、美國環(huán)境預(yù)報中心等科研機構(gòu)[9-10]基于WRF建立了氣象化學(xué)耦合模式(WRF-Chem)等。
交管部門對于形成突然、范圍較小的局地性事件[11]進行實際決策時,需要提前15~30 min預(yù)判惡劣天氣可能對交通安全造成的不利影響,進而采取限流或封路等措施。目前針對能見度的相關(guān)研究,一方面統(tǒng)計方法雖然時效上滿足,但準(zhǔn)確性上仍有待于提高[12];另一方面數(shù)值預(yù)報模式物理機理清楚且誤差容易追溯,但其spin-up時間久,時效性上無法滿足,同時初始場精度也影響模型最終的預(yù)報效果[13]。近年來,隨著機器學(xué)習(xí)技術(shù)蓬勃發(fā)展,使用機器學(xué)習(xí)方法解決氣象問題也越來越受到關(guān)注,殷美祥等[14]使用GRU神經(jīng)網(wǎng)絡(luò)對雷州半島近海岸進行能見度1 h的短臨監(jiān)測與外推研究,為能見度的精細化應(yīng)用提供了新思路。
該文將基于高速公路沿線布置的自動觀測站樁數(shù)據(jù),使用長短時記憶模型(LSTM)機器學(xué)習(xí)方法進行建模,開展基于公路沿線逐站樁尺度的能見度監(jiān)測和外推試驗,分析機器學(xué)習(xí)模型結(jié)構(gòu)、訓(xùn)練時間及遺忘層對結(jié)果的影響,并探討了低能見度事件下的參數(shù)敏感性。
1 研究區(qū)域、數(shù)據(jù)和方法
1.1 研究區(qū)域
北京—秦皇島高速公路,簡稱“京秦高速”,是我國境內(nèi)連接北京市和河北省秦皇島市的高速公路,為我國國家高速公路網(wǎng)北京—哈爾濱高速公路(國家高速G1)的并行線之一。京秦高速始建于2015年12月,并于2023年2月4日實現(xiàn)全線貫通,全長264 km。為更好地獲取公路沿線小尺度天氣事件的發(fā)生情況,京秦高速擬以3 km等間距安裝自動觀測站樁進行能見度實時觀測。
1.2 數(shù)據(jù)獲取
為提前獲取高速公路沿線小尺度低能見度天氣事件的發(fā)生情況,延長道路調(diào)度決策時間,該試驗擬通過構(gòu)建LSTM模型,開展5 min步長30 min外推時效的高速公路沿線站樁級能見度要素的監(jiān)測和外推數(shù)據(jù)集的制作。由于京秦高速站點多為新建站樁,數(shù)據(jù)的時間長度不足,為此,收集河北區(qū)域的國家站2021—2022年長序列數(shù)據(jù)插補到京秦高速的站樁位置,從而構(gòu)建數(shù)據(jù)集,用于模型的建設(shè)和檢驗。
1.3 模型構(gòu)建
使用序貫(sequential)構(gòu)建方式線性堆疊輸入層、LSTM連接層和全連接層,輸入變量經(jīng)LSTM連接層轉(zhuǎn)換后,將輸入層維數(shù)轉(zhuǎn)換為LSTM細胞數(shù)(設(shè)置為50)。在非線性計算之后,經(jīng)全連接層處理后(設(shè)置為6)進行輸出。對比輸出的預(yù)測和觀測目標(biāo),然后進行迭代優(yōu)化(初始設(shè)置為最大500代),從而構(gòu)建歷史輸入數(shù)據(jù)和輸出目標(biāo)數(shù)據(jù)之間的關(guān)系。
1.4 模型評估
該試驗使用驗證期預(yù)測序列值和觀測值之間的絕對誤差(AE)表示預(yù)測序列和觀測值之間的偏差情況;使用平均絕對誤差(MAE)和均方根誤差(RMSE)表示預(yù)測序列相對于觀測序列的誤差大小;使用相關(guān)系數(shù)(CC)表示預(yù)測序列相對于觀測序列在變化趨勢上的相關(guān)性,以全方位評估模型的外推結(jié)果。
1.5 模型調(diào)整
以改善能見度30 min外推時效RMSE(即最大預(yù)見期時效)為目的,設(shè)計多種類型的試驗,并和上一步修改的基準(zhǔn)進行對比,其試驗設(shè)計主要如下(見表1所示):
(1)訓(xùn)練輸入尺度。該試驗組以5站1年(合計5年)長度數(shù)據(jù),最大迭代數(shù)為500的訓(xùn)練作為基準(zhǔn)試驗,控制輸入訓(xùn)練站的點數(shù)進行測試,采取最合適的試驗作為下一步調(diào)整的基準(zhǔn)。
(2)時間步長參數(shù)。該試驗組以60步長(1 h)為基準(zhǔn)試驗,控制時間的步長變量進行測試,采取最合適的試驗作為下一步調(diào)整的基準(zhǔn)。
(3)模型遺忘層設(shè)定。該試驗組以無遺忘層為基準(zhǔn)試驗,控制遺忘層的遺忘參數(shù)進行測試,采取最適宜參數(shù)作為最終的調(diào)整依據(jù)。
2 結(jié)果與分析
2.1 外推結(jié)果評估
從空間尺度上看,短臨監(jiān)測與外推和觀測能見度相比:在大多數(shù)站點情況下略低于觀測能見度;誤差方面,平均絕對誤差最小值為0.72 km,最大值為3.75 km;RMSE最小值為1.11 km,最大值為8.36 km,最低相關(guān)系數(shù)為0.82。從時間尺度上看,平均絕對誤差在最大預(yù)報時效上為0.3 km,RMSE則為1.27 km,相關(guān)系數(shù)為0.97。
篩選低于10 km的能見度事件進行評估,從空間尺度上看:短臨監(jiān)測與外推能見度和觀測能見度相比,在大多數(shù)站點略低于觀測能見度;誤差方面,平均絕對誤差最小值為0.64 km,最大值為3.91 km;RMSE最小值為0.94 km,最大值為7.15 km,最低相關(guān)系數(shù)為0.22。從時間尺度上看,平均絕對誤差在最大預(yù)報時效上為1.0 km,RMSE則為2.31 km,相關(guān)系數(shù)為0.72。
2.2 參數(shù)調(diào)整的影響分析
修改訓(xùn)練輸入數(shù)據(jù)量的大小。結(jié)果顯示,增加訓(xùn)練數(shù)據(jù)如7站,引入較多的數(shù)據(jù)能夠讀取到更多的非線性變化趨勢。經(jīng)過訓(xùn)練后,30 min監(jiān)測和外推時效的RMSE達到了0.85 km,相較于初始的1.27 km提升了33%。
測試訓(xùn)練時間步長對模型預(yù)測的影響。結(jié)果顯示,經(jīng)過訓(xùn)練后,時間步長為30 min的試驗表現(xiàn)出較好的RMSE提升,其RMSE為0.82 km,相對于參考試驗,RMSE進一步改良了3.5%。
修改遺忘參數(shù)。試驗結(jié)果表明:在遺忘系數(shù)為0.3情況下,30 min監(jiān)測和外推時效的RMSE達到了0.73 km,進一步提升了10.9%;遺忘系數(shù)過大時,RMSE反而會增大。同時,在5 min監(jiān)測和外推時效時,遺忘系數(shù)為0.3的RMSE為0.15 km,相比于對照試驗的0.08 km,惡化了87%,如圖1所示:
2.3 低能見度下的結(jié)果分析
在低能見度情形下,7站試驗在30 min監(jiān)測和外推時效的RMSE達到了1.54 km,相較于初始的2.31 km提升了33%。
訓(xùn)練的時間步長參數(shù)調(diào)整結(jié)果顯示,時間步長為30 min的試驗表現(xiàn)出較好的RMSE提升,其RMSE為1.502 km,相對于參考試驗的1.54 km,RMSE進一步改良了2.4%。
增加遺忘層的試驗結(jié)果顯示,對于低能見度情形,遺忘層的增加使得RMSE和平均絕對誤差均出現(xiàn)了不同程度的惡化,如圖2所示:
3 結(jié)論
該試驗使用序貫式堆疊建立了LSTM模型的方法,使用2021—2022年長序列氣象觀測,插補到京秦高速河北段自動觀測站樁的預(yù)設(shè)位置,分別組成訓(xùn)練和測試數(shù)據(jù)集進行模型的訓(xùn)練調(diào)整,制作了短臨監(jiān)測外推數(shù)據(jù)集。以觀測數(shù)據(jù)集為基準(zhǔn),對外推數(shù)據(jù)序列使用的絕對誤差、平均絕對誤差、RMSE和相關(guān)系數(shù)進行了評估,得出結(jié)論如下:
短臨監(jiān)測與外推能見度在大多數(shù)站點略低于觀測值,平均絕對誤差在最大預(yù)報時效為0.3 km,RMSE則為1.27 km,相關(guān)系數(shù)為0.97;10 km以下的低能見度情形下,平均絕對誤差在最大預(yù)報時效上為1.0 km,RMSE則為2.31 km,相關(guān)系數(shù)為0.72。
調(diào)整能見度模型的模型結(jié)構(gòu)和訓(xùn)練參數(shù),以獲得較好的擬合效果,可首先考慮對輸入數(shù)據(jù)尺度進行調(diào)整,其RMSE提升幅度可達33.6%;對于訓(xùn)練時間步長的調(diào)整,RMSE進一步改良了3.5%;遺忘層的加入能夠減小較長監(jiān)測時效情形的RMSE;但在10 min內(nèi)監(jiān)測時效情形下,遺忘層的加入會增加RMSE,提升達10.9%。在低能見度情形下,遺忘層的加入會對能見度短臨監(jiān)測與外推造成負(fù)面的影響。
該試驗為進一步發(fā)掘基于高速公路沿線觀測站樁的數(shù)據(jù)價值,延長小尺度突發(fā)事件的預(yù)警外推時效長度,使用較為簡易的數(shù)據(jù)輸入和預(yù)處理方法開展了監(jiān)測和外推試驗,雖然在部分驗證試驗中取得了較好效果,然而在低能見度情形下仍需對模型進一步改進,或加入更豐富的監(jiān)測數(shù)據(jù),以改善外推質(zhì)量。
參考文獻
[1]交通運輸部.2022年交通運輸行業(yè)發(fā)展統(tǒng)計公報[Z].北京:交通運輸部,2022.
[2]張馳,周郁茗,張敏,等.交通事故導(dǎo)致的高速公路擁堵狀態(tài)判別方法[J].交通信息與安全,2023(1):23-33.
[3]沈靜.高速公路事故風(fēng)險實時預(yù)測及事后時空影響分析[D].南京:東南大學(xué),2018.
[4]馮蕾,鄧毅萍,李藹恂,等.霧天高速公路交通事故的特征及與能見度的關(guān)系[J].科技導(dǎo)報,2020(11):160-168.
[5]劉東,馬社強,牛學(xué)軍.我國高速公路交通事故特點分析[J].中國人民公安大學(xué)學(xué)報(自然科學(xué)版),2008(4):65-68.
[6]唐亞平,張晉廣,張凱,等.北方公路交通氣象環(huán)境識別及安全管理策略研究[J].氣象科學(xué),2012(4):466-471.
[7]賀皓,劉子臣,徐虹,等.陜西省高等級公路大霧的預(yù)報方法研究[J].陜西氣象,2003(1):7-10.
[8]林云,孫向明,張小麗,等.深圳市大氣能見度與細粒子濃度統(tǒng)計模型[J].應(yīng)用氣象學(xué)報,2009(2):252-256.
[9]周廣強,謝英,吳劍斌,等.基于WRF-Chem模式的華東區(qū)域PM2.5預(yù)報及偏差原因[J].中國環(huán)境科學(xué) ,2016(8):2251-2259.
[10]王曉君,馬浩.新一代中尺度預(yù)報模式(WRF)國內(nèi)應(yīng)用進展[J].地球科學(xué)進展,2011(11):1191-1199.
[11]胡思濤,王雪梅,朱艷茹.團霧天氣下高速公路交通事故特征分析[J].交通信息與安全,2014(4):69-73+101.
[12]張小玲,楊波,盛杰,等.中國強對流天氣預(yù)報業(yè)務(wù)發(fā)展[J].氣象科技進展,2018(3):8-18.
[13]Wood, E. F., Roundy, J. K., Troy, T. J., et al. Hyperresolution global land surface modeling: Meeting a grand challenge for monitoring Earth's terrestrial water[J]. Water Resource Research, 2011(47): W05301.
[14]殷美祥,羅瑞婷,陳榮泉,等.基于GRU神經(jīng)網(wǎng)絡(luò)的雷州半島近海岸能見度短臨預(yù)報研究[J].熱帶氣象學(xué)報,2023(2):267-275.
收稿日期:2024-06-06
作者簡介:劉俊江(1997—),男,碩士,助理工程師,研究方向:交通專題應(yīng)用產(chǎn)品研發(fā)。
基金項目:國家氣象信息中心專題應(yīng)用產(chǎn)品研發(fā)重點創(chuàng)新團隊“交通安全氣象監(jiān)測產(chǎn)品研發(fā)及應(yīng)用項目”(NMIC-2024-ZD07),國家自然科學(xué)基金委員會“中國民用航空局民航聯(lián)合研究基金項目”(U2033207)。