摘 要:隨著人工智能技術(shù)的發(fā)展,基于強(qiáng)化學(xué)習(xí)的列車(chē)自動(dòng)運(yùn)行技術(shù)成為軌道交通領(lǐng)域研究熱點(diǎn)。該技術(shù)通過(guò)模擬人類(lèi)駕駛員的決策過(guò)程,融合強(qiáng)化學(xué)習(xí)方式,能實(shí)現(xiàn)列車(chē)的自主行駛、路徑選擇、速度調(diào)節(jié)等關(guān)鍵功能。文章探究了強(qiáng)化學(xué)習(xí)在列車(chē)自動(dòng)駕駛中的應(yīng)用,分析了當(dāng)前技術(shù)的難點(diǎn)與發(fā)展方向。依靠?jī)?yōu)化算法模型、增強(qiáng)數(shù)據(jù)處理能力和提升系統(tǒng)自適應(yīng)性,列車(chē)自動(dòng)駕駛技術(shù)有望在提高運(yùn)輸效能、減少事故發(fā)生概率、降低能源消耗等方面發(fā)揮關(guān)鍵功效。本文還提出了實(shí)際應(yīng)用中需解決的問(wèn)題及相應(yīng)的技術(shù)改進(jìn)策略,以促進(jìn)該技術(shù)的持續(xù)應(yīng)用與發(fā)展。
關(guān)鍵詞:強(qiáng)化學(xué)習(xí) 列車(chē)自動(dòng)駕駛 軌道交通 路徑選擇 速度控制
隨著智能交通系統(tǒng)的快速發(fā)展,列車(chē)自動(dòng)駕駛技術(shù)在提升軌道運(yùn)輸效率、保障安全性以及減少人為差錯(cuò)方面具有重要應(yīng)用價(jià)值。強(qiáng)化學(xué)習(xí)作為一種依靠獎(jiǎng)勵(lì)機(jī)制的自主學(xué)習(xí)方式,為列車(chē)自動(dòng)駕駛領(lǐng)域提供了新的解決方案。強(qiáng)化學(xué)習(xí)依靠不斷試錯(cuò)與完善決策流程,能夠幫助列車(chē)實(shí)現(xiàn)自主控制與高效運(yùn)行。然而,在實(shí)際應(yīng)用推行階段,列車(chē)自動(dòng)運(yùn)行仍面臨諸多難題,如環(huán)境的不穩(wěn)定性、數(shù)據(jù)處理的繁雜性問(wèn)題,本研究旨在探索基于強(qiáng)化學(xué)習(xí)的列車(chē)自動(dòng)駕駛技術(shù)的優(yōu)勢(shì)、難題與應(yīng)對(duì)措施。為該領(lǐng)域的技術(shù)進(jìn)步和實(shí)際運(yùn)用提供理論支撐和技術(shù)指引。
1 列車(chē)自動(dòng)駕駛技術(shù)的概述
列車(chē)自動(dòng)駕駛技術(shù)作為智能交通系統(tǒng)的核心組成部分,近年來(lái)在城市軌道交通領(lǐng)域得到了廣泛關(guān)注與應(yīng)用。它通過(guò)引入人工智能、傳感器技術(shù)、數(shù)據(jù)處理算法以及通信技術(shù),達(dá)成列車(chē)自主行駛效果。這項(xiàng)技術(shù)的核心優(yōu)勢(shì)是能顯著提高列車(chē)運(yùn)行的安全性、準(zhǔn)時(shí)性和效率,減少人工操作失誤,從而改善整個(gè)交通系統(tǒng)的運(yùn)轉(zhuǎn)。
列車(chē)自動(dòng)駕駛技術(shù)的基礎(chǔ)依賴(lài)多種先進(jìn)技術(shù)的融合。列車(chē)自動(dòng)駕駛系統(tǒng)通過(guò)部署激光雷達(dá)、攝像頭、GPS、紅外傳感器等設(shè)備,即時(shí)采集列車(chē)周邊環(huán)境的數(shù)據(jù)。這些數(shù)據(jù)有助于系統(tǒng)實(shí)現(xiàn)環(huán)境感知,還可精確測(cè)定列車(chē)的實(shí)際位置,從而為決策過(guò)程提供支持[1]。列車(chē)自動(dòng)駕駛系統(tǒng)大量應(yīng)用強(qiáng)化學(xué)習(xí)、深度學(xué)習(xí)等人工智能算法,尤其在決策和路徑規(guī)劃方面,系統(tǒng)可通過(guò)持續(xù)學(xué)習(xí)與優(yōu)化,逐步提升自主運(yùn)行能力。
自動(dòng)駕駛列車(chē)的工作流程通常包含三個(gè)主要部分:感知階段、決策步驟和執(zhí)行操作,感知架構(gòu)依靠傳感器收集實(shí)時(shí)數(shù)據(jù),識(shí)別列車(chē)周邊的狀況;決策模塊根據(jù)所搜集的數(shù)據(jù)和預(yù)設(shè)準(zhǔn)則,通過(guò)算法確定最優(yōu)決策,包含速度調(diào)整、車(chē)道變更、停車(chē)等操作;執(zhí)行部分是將決策轉(zhuǎn)化為具體行動(dòng),調(diào)控列車(chē)達(dá)成既定目標(biāo)。該流程的各個(gè)環(huán)節(jié)均要求系統(tǒng)具備極高的精準(zhǔn)度與可靠性。
列車(chē)自動(dòng)運(yùn)行技術(shù)已在多國(guó)城市軌道交通中實(shí)現(xiàn)初步應(yīng)用,尤其在地鐵和輕軌等場(chǎng)景中得到了較為廣泛地應(yīng)用。通過(guò)運(yùn)用無(wú)人駕駛技術(shù),軌道交通運(yùn)行效率得到極大提升,而且在安全性能層面顯著降低了事故發(fā)生概率,還在資源利用和能源消耗方面達(dá)成了優(yōu)化。
2 基于強(qiáng)化學(xué)習(xí)的列車(chē)自動(dòng)駕駛技術(shù)面臨的問(wèn)題
2.1 環(huán)境復(fù)雜性與不確定性
列車(chē)自動(dòng)運(yùn)行技術(shù)面臨復(fù)雜環(huán)境條件,時(shí)常要應(yīng)對(duì)源自多領(lǐng)域的復(fù)雜輸入與不確定性,特別是在實(shí)際運(yùn)營(yíng)操作開(kāi)展時(shí),列車(chē)運(yùn)行的環(huán)境往往存在多種不可預(yù)見(jiàn)的因素。環(huán)境復(fù)雜程度呈現(xiàn)于多個(gè)維度,如天氣條件變化、軌道上的障礙物、與其他交通工具的互動(dòng),甚至突發(fā)情形(如設(shè)備故障、人員進(jìn)入軌道等)。這些因素不僅會(huì)對(duì)列車(chē)的正常運(yùn)行產(chǎn)生影響,還會(huì)增加系統(tǒng)決策的難度和風(fēng)險(xiǎn)。尤其是在暴雨、霧霾、狂風(fēng)這類(lèi)極端天氣情形下,自動(dòng)駕駛系統(tǒng)應(yīng)具備極高的環(huán)境感知能力。
不確定性呈現(xiàn)于多個(gè)維度,盡管當(dāng)前傳感器技術(shù)逐漸成熟,然而當(dāng)前存在感知盲區(qū),尤其是在傳感器無(wú)法全面覆蓋的角落或遮擋物下方,列車(chē)無(wú)法立即識(shí)別潛在的隱患,不同環(huán)境的動(dòng)態(tài)轉(zhuǎn)變也對(duì)列車(chē)自動(dòng)駕駛形成了挑戰(zhàn)[2]。例如,在城市軌道交通的運(yùn)營(yíng)體系里,列車(chē)要識(shí)別其他列車(chē)、乘客、行人等,還需靈活應(yīng)對(duì)可能出現(xiàn)的突發(fā)情況。
2.2 數(shù)據(jù)處理與訓(xùn)練模型的挑戰(zhàn)
列車(chē)自動(dòng)駕駛系統(tǒng)核心依賴(lài)數(shù)據(jù)處理和訓(xùn)練模型的能力。巨量的傳感器數(shù)據(jù)、軌道數(shù)據(jù)和環(huán)境信息要實(shí)時(shí)處理,這給計(jì)算系統(tǒng)設(shè)定了極高標(biāo)準(zhǔn)。尤其是在高速行駛與復(fù)雜情形下,數(shù)據(jù)的實(shí)時(shí)性和準(zhǔn)確性極其重要,倘若數(shù)據(jù)處理出現(xiàn)滯后或偏差,會(huì)導(dǎo)致列車(chē)對(duì)環(huán)境判斷失誤,從而產(chǎn)生安全隱患。因此,如何高效精準(zhǔn)地處理繁雜龐大的實(shí)時(shí)數(shù)據(jù)是當(dāng)前技術(shù)發(fā)展的關(guān)鍵問(wèn)題之一。
傳感器所產(chǎn)生的數(shù)據(jù)規(guī)模巨大且種類(lèi)繁多,包含圖像、音頻、距離類(lèi)數(shù)據(jù),如何快速且精確地從這些數(shù)據(jù)中提取有效信息并進(jìn)行融合處理,變?yōu)榧蛛y題。尤其是如何對(duì)來(lái)自不同傳感器的信息進(jìn)行有效整合,以達(dá)成更全面的環(huán)境認(rèn)知,是當(dāng)前學(xué)術(shù)領(lǐng)域研究熱點(diǎn)。當(dāng)下的處理算法如卷積神經(jīng)網(wǎng)絡(luò)(CNN)和深度強(qiáng)化學(xué)習(xí)(DRL)雖在圖像與傳感器數(shù)據(jù)處理上有一定成效,但在實(shí)際應(yīng)用推廣進(jìn)程中,仍然面臨著高效能和低延遲處理的雙重挑戰(zhàn)。
列車(chē)自動(dòng)駕駛系統(tǒng)需依靠海量歷史數(shù)據(jù)與模擬環(huán)境來(lái)訓(xùn)練模型,且達(dá)成高效實(shí)時(shí)優(yōu)化,獲取數(shù)據(jù)并非易如反掌之事。尤其是在多種復(fù)雜操作場(chǎng)景下,如何獲取高質(zhì)量訓(xùn)練數(shù)據(jù)并進(jìn)行有效標(biāo)注,是當(dāng)前技術(shù)應(yīng)用遭遇的一大難題。訓(xùn)練過(guò)程中會(huì)遇到的數(shù)據(jù)偏差和標(biāo)簽錯(cuò)誤,都會(huì)對(duì)模型的精確性與穩(wěn)定性產(chǎn)生影響,模型需在多樣化操作場(chǎng)景下進(jìn)行全面檢測(cè),確保其在實(shí)際運(yùn)行中的適應(yīng)性。
2.3 安全防護(hù)與應(yīng)急處置問(wèn)題
列車(chē)自動(dòng)駕駛技術(shù)的發(fā)展并非僅為技術(shù)革新,更要解決安全性與應(yīng)急響應(yīng)等核心難題。列車(chē)自動(dòng)駕駛系統(tǒng)屬于一個(gè)高度復(fù)雜智能系統(tǒng),它的安全性能至關(guān)重要。在自動(dòng)駕駛開(kāi)展階段內(nèi),系統(tǒng)需保證在任何情形下都能快速作出精準(zhǔn)決策,消除一切潛在的事故與災(zāi)禍,自動(dòng)駕駛系統(tǒng)安全性面臨一系列挑戰(zhàn)。
盡管當(dāng)前的傳感器技術(shù)不斷發(fā)展,但仍然存在局限情況,傳感器會(huì)受到天氣、光線、物理障礙等因素的干擾,導(dǎo)致系統(tǒng)難以精確地感知環(huán)境。尤其是處于惡劣天氣條件時(shí),傳感器出現(xiàn)失效或誤判會(huì)導(dǎo)致災(zāi)難性后果。因此,如何保障傳感器的可靠性和冗余性,是確保列車(chē)自動(dòng)駕駛安全的基礎(chǔ)。在列車(chē)運(yùn)行過(guò)程中,存在遭遇多種突發(fā)狀況的概率,例如設(shè)備故障、人員非法進(jìn)入軌道、信號(hào)故障等。若自動(dòng)駕駛系統(tǒng)未能及時(shí)識(shí)別此類(lèi)狀況并采取對(duì)應(yīng)措施,會(huì)造成嚴(yán)重的后果。因此,如何設(shè)計(jì)高效的應(yīng)急響應(yīng)機(jī)制,確保在突發(fā)狀況發(fā)生時(shí),系統(tǒng)能夠迅速且精確地采取相應(yīng)的應(yīng)對(duì)措施,是列車(chē)自動(dòng)駕駛技術(shù)亟須攻克的難題。
3 基于強(qiáng)化學(xué)習(xí)的列車(chē)自動(dòng)駕駛技術(shù)問(wèn)題的解決策略
3.1 提升數(shù)據(jù)處理與環(huán)境建模能力
在列車(chē)自動(dòng)運(yùn)行系統(tǒng)研發(fā)與應(yīng)用階段,數(shù)據(jù)處理和環(huán)境建模是確保系統(tǒng)高效安全運(yùn)行的基礎(chǔ)。列車(chē)自動(dòng)駕駛系統(tǒng)依賴(lài)大量像雷達(dá)、攝像頭、激光雷達(dá)這類(lèi)的傳感器數(shù)據(jù),這些數(shù)據(jù)能夠?qū)崟r(shí)對(duì)列車(chē)所處環(huán)境開(kāi)展感知與建模。然而,由于環(huán)境復(fù)雜且易變,數(shù)據(jù)處理和模型構(gòu)建面臨巨大挑戰(zhàn)。為有效提升自動(dòng)駕駛系統(tǒng)的性能,需更進(jìn)一步提升數(shù)據(jù)處理能力,并且完善環(huán)境建模。數(shù)據(jù)處理能力的提升需從多維度展開(kāi),自動(dòng)駕駛系統(tǒng)面對(duì)的數(shù)據(jù)種類(lèi)繁多,涵蓋圖像數(shù)據(jù)、深度數(shù)據(jù)、時(shí)間序列數(shù)據(jù)等,各類(lèi)數(shù)據(jù)在分析和處理過(guò)程中展現(xiàn)不同特性。因此需采用多模態(tài)融合技術(shù)整合各異傳感器的數(shù)據(jù),利用經(jīng)過(guò)優(yōu)化的數(shù)據(jù)融合算法,提升數(shù)據(jù)的精準(zhǔn)度與處理速度。尤其在對(duì)實(shí)時(shí)性要求嚴(yán)苛的列車(chē)自動(dòng)駕駛系統(tǒng)中,如何降低數(shù)據(jù)處理的延遲,確保系統(tǒng)能夠?qū)崟r(shí)做出決策,是提升系統(tǒng)性能的關(guān)鍵。
此外,環(huán)境建模是確保自動(dòng)駕駛系統(tǒng)感知并認(rèn)知周邊環(huán)境的關(guān)鍵環(huán)節(jié)。慣用環(huán)境建模技術(shù)憑借靜態(tài)地圖與規(guī)則機(jī)制完成,然而在動(dòng)態(tài)環(huán)境之中,列車(chē)周?chē)沫h(huán)境隨時(shí)會(huì)發(fā)生改變。因此,環(huán)境建模須具備更高的動(dòng)態(tài)適應(yīng)性,借助機(jī)器學(xué)習(xí)算法和深度學(xué)習(xí)算法,可以從海量實(shí)時(shí)數(shù)據(jù)中自動(dòng)學(xué)習(xí)環(huán)境特征,打造精確且動(dòng)態(tài)的環(huán)境模型[3]。該模型能夠根據(jù)列車(chē)運(yùn)行軌跡、速度以及所處外部環(huán)境實(shí)時(shí)更新,從而為自動(dòng)駕駛系統(tǒng)提供更精準(zhǔn)的信息支持。若提高數(shù)據(jù)處理及環(huán)境建模能力,需提升系統(tǒng)的運(yùn)算能力,并引入更加高效的算法。伴隨著計(jì)算機(jī)硬件的發(fā)展,尤其是GPU和云計(jì)算的應(yīng)用,數(shù)據(jù)處理能力將獲得顯著提升。借助深度神經(jīng)網(wǎng)絡(luò)、圖卷積網(wǎng)絡(luò)等先進(jìn)算法,可提升自動(dòng)駕駛系統(tǒng)在復(fù)雜環(huán)境中的感知與決策能力,確保列車(chē)安全且高效地運(yùn)行。
3.2 改進(jìn)強(qiáng)化學(xué)習(xí)算法,提升系統(tǒng)自適應(yīng)性
強(qiáng)化學(xué)習(xí)(RL)作為一種自主學(xué)習(xí)的技術(shù),在列車(chē)自動(dòng)運(yùn)行駕駛系統(tǒng)中具備廣泛應(yīng)用前景。強(qiáng)化學(xué)習(xí)依靠與環(huán)境的交互,自動(dòng)調(diào)整系統(tǒng)的行為策略,在不斷嘗試糾錯(cuò)過(guò)程中優(yōu)化決策策略。然而,在列車(chē)自動(dòng)運(yùn)行實(shí)際應(yīng)用情形下,現(xiàn)有的強(qiáng)化學(xué)習(xí)算法仍存在自適應(yīng)能力差、訓(xùn)練效率低等問(wèn)題。為增強(qiáng)自動(dòng)駕駛系統(tǒng)的自適應(yīng)水平,要對(duì)現(xiàn)有的強(qiáng)化學(xué)習(xí)算法予以改進(jìn),提升其于復(fù)雜環(huán)境中的性能,適應(yīng)性為列車(chē)自動(dòng)駕駛系統(tǒng)成功應(yīng)用的關(guān)鍵。在實(shí)際運(yùn)營(yíng)階段,列車(chē)會(huì)面臨多種復(fù)雜的交通情形,如天氣變化、道路狀況改變、突發(fā)事件等,目前的強(qiáng)化學(xué)習(xí)算法一般難以在這些變幻莫測(cè)的環(huán)境中做出快速且精準(zhǔn)的決策,導(dǎo)致系統(tǒng)適應(yīng)能力不佳。為提升強(qiáng)化學(xué)習(xí)算法的自適應(yīng)水平,能夠采用元學(xué)習(xí)技術(shù),利用多任務(wù)學(xué)習(xí)方式,讓系統(tǒng)處于未知場(chǎng)景時(shí),能快速適應(yīng)并調(diào)整策略。此外,還能夠運(yùn)用多智能體強(qiáng)化學(xué)習(xí)技術(shù),模擬多個(gè)智能體在復(fù)雜環(huán)境中的交互,從而提升系統(tǒng)的整體協(xié)同與處理能力。
列車(chē)自動(dòng)駕駛系統(tǒng)的學(xué)習(xí)效率是當(dāng)前強(qiáng)化學(xué)習(xí)算法所面臨的重大挑戰(zhàn)。傳統(tǒng)強(qiáng)化學(xué)習(xí)模型一般需要大量訓(xùn)練數(shù)據(jù)和長(zhǎng)時(shí)間訓(xùn)練周期,在列車(chē)自動(dòng)駕駛系統(tǒng)應(yīng)用場(chǎng)景里這是不可接受的。為提升訓(xùn)練效果,可采用模仿學(xué)習(xí)與深度Q網(wǎng)絡(luò)等技術(shù),通過(guò)參考人類(lèi)專(zhuān)家或經(jīng)驗(yàn)?zāi)P偷牟呗?,減少對(duì)真實(shí)環(huán)境的依賴(lài)水平,加快系統(tǒng)的學(xué)習(xí)進(jìn)度。另外,融合強(qiáng)化學(xué)習(xí)與仿真技術(shù),依托虛擬環(huán)境開(kāi)展大規(guī)模訓(xùn)練,可進(jìn)一步提高算法的訓(xùn)練效能,還可降低實(shí)際環(huán)境中的試錯(cuò)成本[4]。為促進(jìn)強(qiáng)化學(xué)習(xí)效果,有必要對(duì)獎(jiǎng)勵(lì)函數(shù)的設(shè)計(jì)進(jìn)一步完善,獎(jiǎng)勵(lì)函數(shù)是強(qiáng)化學(xué)習(xí)算法中決定系統(tǒng)行為的關(guān)鍵因素。恰當(dāng)?shù)莫?jiǎng)勵(lì)設(shè)置能夠確保系統(tǒng)選擇正確的行動(dòng)方案,根據(jù)列車(chē)自動(dòng)駕駛的特點(diǎn),獎(jiǎng)勵(lì)函數(shù)可根據(jù)行車(chē)安全、時(shí)間效率、能源消耗等多方面要素進(jìn)行綜合設(shè)計(jì),確保系統(tǒng)目標(biāo)高度吻合。
3.3 強(qiáng)化安全性與應(yīng)急處理機(jī)制
列車(chē)自動(dòng)駕駛技術(shù)的一項(xiàng)核心目標(biāo)為保障列車(chē)運(yùn)行的安全性。在開(kāi)展自動(dòng)駕駛推進(jìn)進(jìn)程時(shí),任何微小失誤或決策差錯(cuò)都將導(dǎo)致嚴(yán)重安全事故。因此,強(qiáng)化安全性能與應(yīng)急處理機(jī)制,確保系統(tǒng)在各種突發(fā)狀況下的應(yīng)對(duì)能力,是自動(dòng)駕駛系統(tǒng)需著重關(guān)注的核心要點(diǎn)。
自動(dòng)駕駛系統(tǒng)安全性需依靠多重冗余機(jī)制提高,在實(shí)際應(yīng)用過(guò)程中,列車(chē)自動(dòng)駕駛系統(tǒng)所依靠的傳感器和控制系統(tǒng)均會(huì)出現(xiàn)故障。因此要設(shè)計(jì)具有冗余特性的硬件與軟件系統(tǒng)。例如,可設(shè)置多個(gè)傳感器確保環(huán)境感知的精確性,并依靠不同類(lèi)型的傳感器相互校驗(yàn),增強(qiáng)系統(tǒng)的可靠性[5]。冗余控制系統(tǒng)能在故障發(fā)生時(shí)快速切換到備用系統(tǒng),確保列車(chē)穩(wěn)定運(yùn)行,自動(dòng)駕駛系統(tǒng)的應(yīng)急處理能力是確保列車(chē)安全的關(guān)鍵因素,無(wú)論是設(shè)備故障、突發(fā)意外,或是難以預(yù)見(jiàn)的外部狀況,系統(tǒng)都要能夠迅速作出反應(yīng)。應(yīng)急處理機(jī)制設(shè)計(jì)應(yīng)涵蓋兩方面要點(diǎn):一是故障監(jiān)控與判別能力,二是應(yīng)急處置與決策能力。在故障首次出現(xiàn)瞬間,系統(tǒng)應(yīng)能夠迅速診斷問(wèn)題并采取有效的應(yīng)對(duì)措施,如轉(zhuǎn)換到人工操控模式或啟動(dòng)應(yīng)急制動(dòng)設(shè)備,應(yīng)急響應(yīng)能力還需通過(guò)模擬測(cè)試與實(shí)際測(cè)試來(lái)驗(yàn)證,確保系統(tǒng)能在實(shí)際環(huán)境中做出準(zhǔn)確決策。
為增強(qiáng)安全性與應(yīng)急處理能力,還能夠通過(guò)多維度數(shù)據(jù)分析與預(yù)測(cè)模型提升系統(tǒng)預(yù)警能力。憑借對(duì)實(shí)時(shí)運(yùn)行數(shù)據(jù)的分析,系統(tǒng)可預(yù)估潛在故障與危險(xiǎn),提前采取防范措施。同時(shí),借助強(qiáng)化學(xué)習(xí)和深度學(xué)習(xí)方法,系統(tǒng)可在持續(xù)學(xué)習(xí)與優(yōu)化過(guò)程中,提升應(yīng)急處理能力,并且在復(fù)雜環(huán)境中做出合理的判斷與決策。列車(chē)自動(dòng)駕駛系統(tǒng)的安全性與應(yīng)急處理機(jī)制是保障系統(tǒng)穩(wěn)定運(yùn)行的關(guān)鍵。只有通過(guò)多重冗余、應(yīng)急響應(yīng)機(jī)制和數(shù)據(jù)分析與預(yù)測(cè)技術(shù)相融合,才能確保自動(dòng)駕駛技術(shù)在復(fù)雜環(huán)境中持續(xù)保持高效安全運(yùn)行。
4 結(jié)論
基于強(qiáng)化學(xué)習(xí)的列車(chē)自動(dòng)駕駛技術(shù)為軌道交通智能化發(fā)展提供全新解決方案。盡管目前面臨多種挑戰(zhàn),但隨著強(qiáng)化學(xué)習(xí)算法的不斷優(yōu)化和數(shù)據(jù)處理技術(shù)的提升,列車(chē)自動(dòng)駕駛技術(shù)擁有廣泛的應(yīng)用前景。未來(lái),整合先進(jìn)的環(huán)境建模技術(shù)、改進(jìn)的算法以及安全增強(qiáng)措施,可以進(jìn)一步提升列車(chē)自動(dòng)駕駛系統(tǒng)的可靠性和效率,推動(dòng)智能交通系統(tǒng)的發(fā)展步伐。
參考文獻(xiàn):
[1]金彥亮,范寶榮,高塬.基于元強(qiáng)化學(xué)習(xí)的自動(dòng)駕駛算法研究[J].工業(yè)控制計(jì)算機(jī),2024,37(3):24-26.
[2]許宏鑫,吳志周,梁韻逸.基于強(qiáng)化學(xué)習(xí)的自動(dòng)駕駛汽車(chē)路徑規(guī)劃方法研究綜述[J].計(jì)算機(jī)應(yīng)用研究,2023,40(11):3211-3217.
[3]杜牽.基于風(fēng)險(xiǎn)評(píng)估和深度強(qiáng)化學(xué)習(xí)的自動(dòng)駕駛決策方法研究[D].濟(jì)南:齊魯工業(yè)大學(xué),2024.
[4]馮挽強(qiáng),羅茶根,張周平,等.基于強(qiáng)化學(xué)習(xí)的自動(dòng)駕駛車(chē)輛自適應(yīng)規(guī)劃與控制方法[J].大眾汽車(chē),2023(11):0001-0004.
[5]蘇曉樂(lè).基于深度強(qiáng)化學(xué)習(xí)的自動(dòng)駕駛超車(chē)決策研究[D].西安:長(zhǎng)安大學(xué),2023.