印徐偉屹
摘 要:無人駕駛技術(shù)對于發(fā)展新興技術(shù)、改善交通狀況、建設智能城市等有著深遠的意義。在技術(shù)上無人駕駛可以分為感知、決策、執(zhí)行三大模塊。本文重點介紹無人駕駛中的決策技術(shù),包括兩種典型技術(shù)路線的基本原理、典型應用和優(yōu)缺點分析,并在最后對無人駕駛決策技術(shù)的發(fā)展提出建議。
關(guān)鍵詞:無人駕駛;決策系統(tǒng);自動狀態(tài)機;深度學習
中圖分類號:TP391.41 文獻標識碼:A 文章編號:1671-2064(2020)10-0092-02
0引言
隨著科技的發(fā)展和社會的進步,汽車已經(jīng)成為了人們?nèi)粘I畹谋匦杵?。我國作為汽車消費大國,對于無人駕駛汽車的需求也是十分明顯的:首先,無人駕駛汽車應用能夠降低交通事故發(fā)生的概率,保證了人們的安全;其次,無人駕駛汽車對于殘疾人來說,也能夠大大降低出行的難度,在一定程度上能夠進一步刺激汽車市場,推動汽車行業(yè)向未來大步前進;再次,無人駕駛汽車往往與新能源、清潔能源等概念緊密聯(lián)系,發(fā)展無人駕駛汽車也能夠為我國的環(huán)境保護和能源保護作出貢獻;最后,無人駕駛汽車的發(fā)展與通信技術(shù)的發(fā)展是密不可分的,發(fā)展無人駕駛汽車在客觀上也能夠不斷推動通信技術(shù)的發(fā)展。
無人駕駛技術(shù)是一項多個學科高度融合、高度交叉的新興技術(shù),其發(fā)展需要多種技術(shù)的共同支持,因此當我們在做相關(guān)研究時,應當采用模塊化的思想進行學習和探究,適當?shù)貙o人駕駛技術(shù)進行解構(gòu)和分類。
1無人駕駛技術(shù)分析
無人駕駛目前尚處于高速發(fā)展的階段,因此不同研究團體的實現(xiàn)方式、技術(shù)構(gòu)成各有不同,但總體上看,可以將無人駕駛的技術(shù)實現(xiàn)分為三個部分:感知、決策和控制[1]。
1.1感知模塊
感知模塊指的是無人駕駛汽車需要對周圍的環(huán)境進行信息采集并匯總給決策模塊。就像人類需要對周圍的事物進行識別和判斷一樣,無人駕駛汽車也需要對自己所處的位置和周圍的事物進行識別和判斷。因此,無人駕駛的感知模塊可以總結(jié)為兩個任務:識別與定位[2]。識別任務指的是無人駕駛汽車需要對周圍的障礙物(除去汽車以外的所有物體)進行識別,定位任務指的是無人駕駛汽車需要確定自身相對于周邊環(huán)境的位置[3]。隨后,感知系統(tǒng)將獲取的信息輸入到?jīng)Q策模塊中。
1.2執(zhí)行模塊
執(zhí)行模塊指的是在決策模塊給出決策信息后,根據(jù)決策信息對無人駕駛汽車的各個部件實施物理控制,包括剎車、加速、轉(zhuǎn)向等。隨著自動控制技術(shù)的發(fā)展,無人駕駛的執(zhí)行模塊已經(jīng)非常成熟。因此,無人駕駛汽車技術(shù)的關(guān)鍵在于如何根據(jù)已有信息作出合理、快速、安全的決策。
1.3決策模塊
決策模塊的任務是根據(jù)無人駕駛汽車感知模塊獲得的信息進行指令的下達。在實際的運行過程中,一方面無人駕駛汽車需要主動地作出任務規(guī)劃和動作指令,另一方面也要時刻對突發(fā)情況保持關(guān)注和給出反饋。同時我們還要考慮到指令本身是有層次的,既有路徑規(guī)劃這樣的宏觀任務,也有緊急制動這樣的具體任務。因此,如何用數(shù)學語言去系統(tǒng)性地描述一個有著多輸入、多輸出的決策系統(tǒng)就成為了當前制約無人駕駛系統(tǒng)的重大技術(shù)難關(guān)。
總的來看,目前決策系統(tǒng)的主要發(fā)展方向有兩個:(1)以自動狀態(tài)機為首的基于規(guī)則的決策系統(tǒng);(2)以深度學習為首的基于學習的決策系統(tǒng)[4],下文中將進行重點介紹。
2無人駕駛中的決策技術(shù)分析
2.1基于規(guī)則的決策技術(shù)
在實際的運行中,無人駕駛汽車經(jīng)常需要作出運動狀態(tài)的改變,而狀態(tài)改變的依據(jù)是對周圍環(huán)境的綜合判斷。為了讓無人駕駛汽車的運行在我們的掌控之中,開發(fā)人員需要提前對無人駕駛汽車的運動狀態(tài)進行預設(例如加速、減速、轉(zhuǎn)彎、緊急制動等)并在狀態(tài)的切換之間設置判斷條件。因此有限狀態(tài)機被廣泛應用于無人駕駛決策系統(tǒng)。
2.1.1有限狀態(tài)機
有限狀態(tài)機(Finite-state machine,F(xiàn)SM),又稱有限狀態(tài)自動機,簡稱狀態(tài)機,是表示有限個狀態(tài)以及在這些狀態(tài)之間的轉(zhuǎn)移和動作等行為的數(shù)學模型。在數(shù)學上有限狀態(tài)機是一個離散系統(tǒng),描述了一個對象在其生命周期內(nèi)的可能行為/狀態(tài)序列,有限狀態(tài)機有四個基本要素:現(xiàn)態(tài)、次態(tài)、條件與動作。在沒有任何的輸入或輸入不滿足條件時,狀態(tài)機保持現(xiàn)態(tài)并執(zhí)行現(xiàn)態(tài)的動作;當外部輸入滿足一定的條件時,狀態(tài)機跳到下一個狀態(tài)(即次態(tài))并執(zhí)行次態(tài)的動作。這種數(shù)學模型的邏輯清晰、實用性強,例如汽車在路口時,我們可以將輸入設置為紅綠燈,當輸入為紅時汽車保持不動,當輸入為綠時汽車進入行駛狀態(tài)。
2.1.2有限狀態(tài)機分類
從結(jié)構(gòu)上可以將有限狀態(tài)機分為串聯(lián)式、并聯(lián)式和混連式三種體系架構(gòu)[5]。
串聯(lián)式結(jié)構(gòu)是最為簡單的結(jié)構(gòu)。不同的狀態(tài)之間像電路一樣單線鏈接,依次執(zhí)行,一般不構(gòu)成環(huán)路,比較典型的應用是麻省理工大學的“塔羅斯”無人駕駛汽車。串聯(lián)式結(jié)構(gòu)簡單,因此解決復雜問題時有天然的劣勢。
并聯(lián)式結(jié)構(gòu)類似于電路的并聯(lián)結(jié)構(gòu),各個子狀態(tài)的輸入和輸出呈現(xiàn)的是多節(jié)點的鏈接結(jié)構(gòu),即根據(jù)輸入的信息可以同時進入不同的子狀態(tài)。這種結(jié)構(gòu)對于復雜問題的處理有著比較強的能力,但缺點在于當面對過于復雜的任務時,如果子狀態(tài)過多就會導致算法機構(gòu)龐大,并且可能會導致邏輯沖突。比較典型的代表是國防科學技術(shù)大學研發(fā)的紅旗CA7460、梅賽德斯奔馳公司研發(fā)的Bertha無人車。
為了優(yōu)化自動狀態(tài)機,人們提出了混聯(lián)式的結(jié)構(gòu),即子狀態(tài)中既有串聯(lián)連接,又存在并聯(lián)連接,這種結(jié)構(gòu)雖然在設計的時候難度更大,但在實際執(zhí)行時能夠結(jié)合串聯(lián)式與并聯(lián)式的優(yōu)點,因此在大型決策任務中被廣泛采用。例如卡耐基梅隆大學與福特公司研發(fā)的BOSS無人車、弗吉尼亞理工大學研發(fā)的Odin無人車、中國科學技術(shù)大學研發(fā)的智能駕駛Ⅱ號等。
2.2基于學習的決策技術(shù)
2.2.1深度學習與神經(jīng)網(wǎng)絡
近些年來,隨著機器學習理論和計算機硬件技術(shù)的發(fā)展,基于大數(shù)據(jù)的深度學習方法在計算機視覺、人工智能、自然語言處理等多個領(lǐng)域大放異彩,其中又以神經(jīng)網(wǎng)絡表現(xiàn)最為突出,其基本思想是通過分析大量的樣本來學習人的行為。而在無人駕駛領(lǐng)域,許多研究人員也在試圖使用神經(jīng)網(wǎng)絡來賦予汽車學習的能力。
神經(jīng)網(wǎng)絡的出色之處在于能夠通過大量的計算來擬合“輸入”與“輸出”之間的映射關(guān)系,模擬了人腦對畫面信息的加工處理,即便這種映射是存在誤差的,但在工業(yè)上是能夠滿足要求的,自然也可以應用于決策系統(tǒng)。在圖像識別任務中,研究人員構(gòu)建的是從圖像到目標類的映射,而在決策任務中,研究人員構(gòu)建的是輸入信息到車輛操作的映射。顯然,這種從輸入端(實時圖像)到輸出端(實時決策)的映射本質(zhì)上是通過高明的算法讓計算機去完成復雜的、計算量巨大的函數(shù)擬合任務,也能夠大大降低決策系統(tǒng)的工程實現(xiàn)難度。
2.2.2典型應用
NVIDIA公司研發(fā)的無人車輛駕駛系統(tǒng)就是典型的卷積神經(jīng)網(wǎng)絡的應用,其輸入為每秒30幀的圖像,輸出則是轉(zhuǎn)向盤轉(zhuǎn)角,在訓練階段,NVIDIA要求駕駛者駕駛車輛并記錄在駕駛過程中攝像頭拍到的數(shù)據(jù)和駕駛者對轉(zhuǎn)向盤的操作(轉(zhuǎn)角),以此來構(gòu)造訓練集,隨后將該訓練集交給一個9層的卷積網(wǎng)絡進行訓練、調(diào)整超參數(shù)。
百度一直將無人駕駛作為自己的重要研究項目,為了實現(xiàn)車輛的橫向(左右)與縱向(前后)控制,他們使用了LSTM網(wǎng)絡和卷積神經(jīng)網(wǎng)絡進行實時控制判斷。橫向控制任務的處理思路與NVIDIA類似,使用了單幅圖像作為輸入,曲率作為卷積神經(jīng)網(wǎng)絡的輸出;在縱向控制任務中,百度將該問題處理為時空序列預測問題,輸入數(shù)據(jù)為最近的5幀圖像,輸出為縱向的控制信號(油門、剎車)。
Mobileye在無人駕駛中引入了增強學習,更加強調(diào)了人工智能系統(tǒng)與外界的交互、學習和進化。增強學習的基本思路是對整個系統(tǒng)的行為給出及時更新的評價,對有利于任務的完成和目標實現(xiàn)的行為給出高評價,對不利于任務完成、違反規(guī)定、造成負面影響的行為給出低評價,這樣就在數(shù)學上實現(xiàn)了對決策系統(tǒng)的反饋,或者說就讓計算機有了“摸著石頭過河”的依據(jù)。有了科學的評價,計算機就可以通過大量計算和模擬來實現(xiàn)對整個決策系統(tǒng)的優(yōu)化[6]。
3針對無人駕駛決策系統(tǒng)的發(fā)展建議
不難總結(jié),基于狀態(tài)機的方法是符合人類邏輯的、規(guī)則的方法,解釋性強,適合進行決策行為的描述;基于學習的方法更加依賴于大數(shù)據(jù)和計算機強大的計算能力,在“端對端”問題上表現(xiàn)非常出色,適合進行具體動作的指令[7]。綜上,對于無人駕駛的決策系統(tǒng)筆者提出如下建議:
(1)決策系統(tǒng)由上至下分為“任務”“行為”“動作”三個層次,在任務層次決策系統(tǒng)需要確定無人駕駛汽車的路徑規(guī)劃等抽象任務;行為層次負責無人駕駛系統(tǒng)的宏觀行為,例如跟車、右轉(zhuǎn)、停泊等;動作層次負責無人駕駛汽車的具體行為。
(2)基于規(guī)則的算法將更多地應用于構(gòu)建決策系統(tǒng)的上層架構(gòu),充分發(fā)揮以狀態(tài)機為首的規(guī)則算法的模塊化處理與邏輯性強的優(yōu)勢,避免狀態(tài)機進行過于細化的、具體的決策。
(3)端到端的學習方法在具體行為決策上有著天然的優(yōu)勢,因此更有利于在動作層次中發(fā)揮優(yōu)勢,充分發(fā)揮場景便利的優(yōu)勢,能夠?qū)⒏鞣N情況納入考慮范圍內(nèi)。更為重要的是底層行為層次相比于較高的層次而言,擁有更多的數(shù)據(jù)量以供學習。
(4)跳出無人駕駛汽車這個概念本身,5G時代是萬物互聯(lián)的時代,因此在將來無人駕駛汽車不再是一個單獨的個體,而是納入整個交通信息網(wǎng)的一個組成單元。也就是說決策系統(tǒng)除去任務層次,可能還會有更高的城市系統(tǒng)的層次。
4結(jié)語
無人駕駛是信息時代多種高精尖技術(shù)綜合作用下的產(chǎn)物,與人工智能技術(shù)、信息技術(shù)、機電一體化技術(shù)、通信技術(shù)等聯(lián)系密切,深度耦合,而決策系統(tǒng)則是無人駕駛?cè)竽K中最為復雜和迷人的系統(tǒng),吸引著無數(shù)科學家、工程師。筆者相信隨著5G時代的到來,無人駕駛汽車必然能夠迎來重大的技術(shù)突破,搭載有效可靠的決策系統(tǒng),實現(xiàn)真正的智能交通。
參考文獻
[1] 周丁濤.淺析無人駕駛中的感知技術(shù)[J].科技傳播,2018,10(23):157-159.
[2] 馬飛躍,王曉年.無人駕駛汽車環(huán)境感知與導航定位技術(shù)應用綜述[J].汽車電器,2015(2):1-5.
[3] 王俊.無人駕駛車輛環(huán)境感知系統(tǒng)關(guān)鍵技術(shù)研究[D].北京:中國科學技術(shù)大學,2016.
[4] 熊璐,康宇宸,張培志,等.無人駕駛車輛行為決策系統(tǒng)研究[J].汽車技術(shù),2018(8):1-9.
[5] 王奕康.無人駕駛汽車技術(shù)及其發(fā)展探究[J].中國新通信,2018,20(6):176-177.
[6] 肖已達.面向城區(qū)綜合環(huán)境的無人駕駛車輛平臺及關(guān)鍵技術(shù)研究[D].上海:上海交通大學,2013.
[7] 王欽普,趙佳,趙浩.無人駕駛汽車發(fā)展面臨的挑戰(zhàn)與建議[J].客車技術(shù)與研究,2016(6):2-6.