吉靜
(上海電科智能系統(tǒng)股份有限公司,上海200063)
城市快速路作為大型城市交通網(wǎng)絡(luò)的重要組成部分,在城市交通“提速”上起著重要作用。但是近年來,隨著私家車的增多,人們出行需求的快速增加,現(xiàn)有的快速路交通擁堵現(xiàn)象頻頻發(fā)生,嚴(yán)重影響了快速路出行效率。
快速路上的交通擁堵通常是由于瓶頸區(qū)所導(dǎo)致的,快速路瓶頸區(qū)可以分為常發(fā)性瓶頸區(qū)和非常發(fā)性瓶頸區(qū)。非常發(fā)性瓶頸區(qū)具有較強(qiáng)的突發(fā)性,傳統(tǒng)的方法難以識(shí)別預(yù)測(cè)。交通瓶頸識(shí)別方法除了傳統(tǒng)的基于三相交通流理論的方法、基于非局部氣體動(dòng)理論模型的方法和基于元胞自動(dòng)機(jī)模型的方法外,自動(dòng)識(shí)別(Automatic Traffic congestion identification,ACI)算法也隨著網(wǎng)絡(luò)的發(fā)展以及計(jì)算機(jī)算力的提高而被提出,如:楊小寶等人以生理- 心理模型中的MITSIM模型為基礎(chǔ),在跟車子模型加入了隨機(jī)擾動(dòng)項(xiàng),換道子模型的可行性檢測(cè)中加入了前后間距不足時(shí)司機(jī)的減速行為[1]。
Richard Arnott 等人提出了一種集交通擁堵和路邊停車飽和于一體的市區(qū)停車模型,該模型會(huì)d 額外對(duì)市區(qū)出行的金錢和時(shí)間成本敏感[2]。Syuichi Masukura 等人提出了一個(gè)簡(jiǎn)單的單車道模型,對(duì)由慢速車輛引起的干擾過渡進(jìn)行了研究[3]。
Katsunori Tanaka 等人將傳統(tǒng)的最佳速度模型拓展到考慮了波動(dòng)加速度的模型,并對(duì)如何將擴(kuò)展的交通模型應(yīng)用于颶風(fēng)疏散中的高速公路上的交通流進(jìn)行了研究[4]。林瑜、楊曉光等人提出了間斷交通流阻塞度的概念,反映了城市道路間斷交通流實(shí)際運(yùn)行狀態(tài)[5]。
雖然自動(dòng)識(shí)別模型能夠在一定程度上提高模型識(shí)別準(zhǔn)確率,但是由于我國(guó)智能交通發(fā)展年限較短,在大多數(shù)城市中,有關(guān)快速路瓶頸區(qū)的有記錄樣本并不會(huì)很多,尤其是非突發(fā)性瓶頸區(qū)樣本更是很少,少樣本會(huì)嚴(yán)重影響機(jī)器學(xué)習(xí)模型的精度。雖然快速路瓶頸區(qū)樣本較少,但軌道交通瓶頸站點(diǎn)、高速公路瓶頸區(qū)等存在著一定的樣本,由于業(yè)務(wù)的不同,這些數(shù)據(jù)樣本根據(jù)傳統(tǒng)的人工智能方法,不能用于智能模型的訓(xùn)練。為了解決上述問題,本文將元學(xué)習(xí)方法用于快速路瓶頸區(qū)自動(dòng)識(shí)別建模中,并且該方法可以進(jìn)一步擴(kuò)展到軌道交通瓶頸區(qū)和高速路瓶頸區(qū)識(shí)別中。
元學(xué)習(xí)方法是一種先進(jìn)的深度學(xué)習(xí)方法。元學(xué)習(xí)通過使用數(shù)據(jù)量大的相關(guān)數(shù)據(jù)集對(duì)模型進(jìn)行預(yù)訓(xùn)練,再使用這個(gè)數(shù)據(jù)量小的訓(xùn)練數(shù)據(jù)集來對(duì)此預(yù)訓(xùn)練模型進(jìn)行訓(xùn)練以得到精度足夠高的最終模型[6]。
元學(xué)習(xí)方法從多個(gè)給定的數(shù)據(jù)量豐富的數(shù)據(jù)集:D1,D2,D3….DN,捕捉跨數(shù)據(jù)集的總體信息(例如形狀和物體種類的關(guān)系,車流量和交通擁堵情況的關(guān)系),從而當(dāng)我們有一個(gè)新的數(shù)據(jù)量較小的數(shù)據(jù)集DN+1時(shí),可以利用學(xué)習(xí)到的跨數(shù)據(jù)集總體信息來對(duì)數(shù)據(jù)集DN+1內(nèi)的特征進(jìn)行更精確的判斷[7,8]。
模型將快速路的瓶頸區(qū)的特征定義為五個(gè)維度:發(fā)生時(shí)段、交通事件情況、天氣情況、當(dāng)前區(qū)域車速、道路維修情況。將軌道交通的瓶頸站點(diǎn)特征定義為發(fā)生時(shí)段、發(fā)車頻率、車站站臺(tái)擁擠度、是否為換乘車站、是否有重大活動(dòng)。將高速公路瓶頸區(qū)特征定義為五個(gè)維度:發(fā)生時(shí)段、交通事件情況、通行能力、天氣情況、道路維修情況。
通過較少樣本量的快速路瓶頸區(qū)數(shù)據(jù)、高速公路瓶頸區(qū)數(shù)據(jù)、軌道交通瓶頸站點(diǎn)數(shù)據(jù),根據(jù)空間元學(xué)習(xí)方法,結(jié)合神經(jīng)網(wǎng)絡(luò)模型,訓(xùn)練得到一個(gè)通用的、精度較高的快速路瓶頸區(qū)識(shí)別模型,該模型可以實(shí)時(shí)、不間斷地主動(dòng)對(duì)快速路段可能會(huì)形成瓶頸區(qū)的區(qū)域和時(shí)間進(jìn)行推理,一旦模型檢測(cè)到可能會(huì)形成瓶頸區(qū),會(huì)及時(shí)進(jìn)行預(yù)警。
模型結(jié)構(gòu)見圖1。
圖1 模型的整體結(jié)構(gòu)
本文提出基于空間元學(xué)習(xí)結(jié)合神經(jīng)網(wǎng)絡(luò)的城市快速路瓶頸區(qū)識(shí)別方法,進(jìn)行模型訓(xùn)練與參數(shù)調(diào)優(yōu),具體包括以下步驟:
步驟1:將快速路瓶頸區(qū)識(shí)別模型M 訓(xùn)練設(shè)置為2-way 100-shot,即2 個(gè)類別,每個(gè)類別包含50 個(gè)樣本的分類任務(wù)??焖俾菲款i區(qū)識(shí)別模型M的輸入為5 個(gè)維度。
對(duì)于快速路瓶頸區(qū)識(shí)別,模型的輸入為:發(fā)生時(shí)段x1、交通事件情況x2、天氣情況x3、當(dāng)前區(qū)域車速x4、道路維修情況x5。對(duì)于軌道交通的瓶頸站點(diǎn)識(shí)別,模型的輸入為發(fā)生時(shí)段x1、車輛發(fā)車頻率x2、車站站臺(tái)擁擠度x3、是否為換乘車站x4、是否有重大活動(dòng)x5。對(duì)于高速公路瓶頸區(qū)識(shí)別,模型的輸入為:發(fā)生時(shí)段x1、交通事件情況x2、行駛速度x3、天氣情況x4、當(dāng)前區(qū)域流量x5。將上述輸入的特征進(jìn)行one-hot 編碼后,得到每個(gè)樣本的輸入X={x1,x2,x3,x4,x5},輸出Y={y1,y2},其中y1代表形成了瓶頸區(qū),y2代表沒有形成瓶頸區(qū)。
步驟2:確定包含空間屬性的任務(wù)集合T={T1,T2,T3,T4,T5,T6,T7,T8}。T1代表了A 城市的快速路樣本,T2代表了B 城市的快速路樣本,T3代表了A 城市的高速公路瓶頸區(qū)相關(guān)樣本,T4代表了B 城市的高速公路瓶頸區(qū)相關(guān)樣本,T5代表目標(biāo)城市的高速公路瓶頸區(qū)相關(guān)樣本,T6代表了A 城市的軌道交通瓶頸區(qū)相關(guān)樣本,T7代表了B 城市軌道交通瓶頸區(qū)相關(guān)樣本,T8代表了目標(biāo)城市軌道交通瓶頸區(qū)相關(guān)樣本。
任務(wù)集合T 為相似任務(wù)的集合,“相似任務(wù)”不僅包括高速公路瓶頸區(qū)識(shí)別模型和軌道交通瓶頸站點(diǎn)識(shí)別模型,還包括空間屬性。不同的城市之間瓶頸區(qū)形成因素變化較大,因此空間屬性有效地?cái)U(kuò)展了“任務(wù)集合”,從而進(jìn)一步提高了元學(xué)習(xí)的算法精度。
步驟3:確定空間元學(xué)習(xí)模型MMETA 的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),多層感知機(jī)神經(jīng)網(wǎng)絡(luò)模型輸入層有5 個(gè)神經(jīng)元,有2 個(gè)隱藏層,第一個(gè)隱藏層有4 個(gè)神經(jīng)元,第二個(gè)隱藏層有3 個(gè)神經(jīng)元,輸出層有2 個(gè)神經(jīng)元,激活函數(shù)為Sigmoid 函數(shù),最后輸出層的激活函數(shù)為Softmax。隨機(jī)初始化空間元學(xué)習(xí)模型MMETA 的權(quán)重參數(shù)θ。
步驟4:設(shè)定每個(gè)任務(wù)Ti在任務(wù)集合T 中滿足均勻分布p(T),從任務(wù)集合T 中按照均勻分布概率從8 個(gè)任務(wù)中采樣6 個(gè)任務(wù),組成了用于空間元學(xué)習(xí)模型Mmeta的訓(xùn)練樣本集S={T1,T2,T3,T4,T5,T6}。
步驟5:開始進(jìn)行內(nèi)循環(huán),求得每個(gè)任務(wù)上的最優(yōu)模型權(quán)重參數(shù)θi',i=1,2,3,4,5,6,包括以下步驟:
步驟5.1:對(duì)訓(xùn)練樣本集S={T1,T2,T3,T4,T5,T6}中的每個(gè)任務(wù)Ti,i=1,2,3,4,5,6,制作好訓(xùn)練數(shù)據(jù)集Dttrain={(x1,y1),(x2,y2),…,(x30,y30)}和測(cè)試數(shù)據(jù)集Dttest={(x31,y31),(x32,y32),…,(x50,y50)}。
步驟5.2:對(duì)于每個(gè)任務(wù)Ti,確定分類模型為多層感知機(jī)神經(jīng)網(wǎng)絡(luò)模型MTi,多層感知機(jī)神經(jīng)網(wǎng)絡(luò)模型MTi模型結(jié)構(gòu)與空間元學(xué)習(xí)模型結(jié)構(gòu)相同。損失函數(shù)為交叉熵LTi(fθ)。
式中,xj表示訓(xùn)練數(shù)據(jù)集Ditrain中的樣本輸入值,yj表示Ditrain中的標(biāo)簽值,fθ(xj)表示多層感知機(jī)神經(jīng)網(wǎng)絡(luò)模型MTi預(yù)測(cè)出來的結(jié)果。
步驟5.3:對(duì)于每個(gè)任務(wù)Ti,在訓(xùn)練數(shù)據(jù)集Ditrain上,用梯度下降的方法對(duì)模型權(quán)重參數(shù)θi'進(jìn)行更新,即最小化損失函數(shù)。模型權(quán)重參數(shù)θi'的更新計(jì)算公式為:
式中,θ 表示更新前的模型權(quán)重參數(shù),α 表示學(xué)習(xí)率,取值0.001。
表1 快速路示例數(shù)據(jù)
表2 上海軌道交通某區(qū)域部分站點(diǎn)數(shù)據(jù)
表3 某高速段交通數(shù)據(jù)
最后得到采樣出來的6 個(gè)任務(wù)的模型最優(yōu)參數(shù)集合θ'={θ1',θ2',θ3',θ4',θ5',θ6'}。
步驟6:開始進(jìn)行外循環(huán):在測(cè)試數(shù)據(jù)集Ditest上,對(duì)空間元學(xué)習(xí)模型Mmeta 的權(quán)重參數(shù)θ 進(jìn)行優(yōu)化更新,更新公式為:
式中,∑Ti~p(T)LTi(fθ)為損失函數(shù),是子任務(wù)模型(根據(jù)每個(gè)任務(wù)Ti建立的模型)最優(yōu)參數(shù)下的預(yù)測(cè)誤差之和;β 為空間元學(xué)習(xí)模型學(xué)習(xí)率,取值為0.002;
步驟7:重復(fù)上述步驟4 到步驟6,進(jìn)行10 次迭代,直到收斂。
步驟8:最后學(xué)習(xí)得到的空間元學(xué)習(xí)模型Mmeta的權(quán)重參數(shù)θ 為目標(biāo)任務(wù)的最優(yōu)模型初始參數(shù)。對(duì)于目標(biāo)任務(wù),只要在少量樣本上進(jìn)行2 次迭代,即可得到快速路瓶頸區(qū)識(shí)別模型M。當(dāng)路況發(fā)生了變化,模型判別出將會(huì)形成瓶頸區(qū)后,會(huì)及時(shí)主動(dòng)發(fā)出預(yù)警。
本次實(shí)驗(yàn)所用的快速路數(shù)據(jù)主要是上海市某高架發(fā)布段數(shù)據(jù)。數(shù)據(jù)示例見表1。
本次實(shí)驗(yàn)所用的軌道交通站點(diǎn)數(shù)據(jù)為上海地鐵在浦東新區(qū)區(qū)域的各站點(diǎn)。數(shù)據(jù)示例見表2。
本次實(shí)驗(yàn)所用的高速公路數(shù)據(jù)采用了某高速段的數(shù)據(jù)。數(shù)據(jù)示例見表3。
本文采用召回率(Recall score)、精確率(Precision)、F1 分?jǐn)?shù)、ROC 曲線來衡量模型的好壞。
(1)召回率
召回率(Recall score)說明了被正確預(yù)測(cè)為陽性的樣本占所有陽性樣本的比例,計(jì)算公式為:
式中,Recall 表示召回率,TP 表示正確陽性,F(xiàn)N 表示錯(cuò)誤陰性。當(dāng)召回率越接近于1,這個(gè)模型的準(zhǔn)確率就越高,召回率的取值范圍是0-1。
(2)精確率
精確率(Precision)說明了被正確預(yù)測(cè)的陽性樣本占所有被預(yù)測(cè)為陽性的樣本的比例,計(jì)算公式為:
圖2 是基于元學(xué)習(xí)模型的ROC 曲線。橫坐標(biāo)表示假陽率,
式中,P 表示精確率,TP 表示正確陽性,F(xiàn)P 表示錯(cuò)誤陽性。當(dāng)精確率越接近于1,這個(gè)模型的準(zhǔn)確率就越高,精確率的取值范圍是0-1。
(3)F1 分?jǐn)?shù)
精度和召回指數(shù)在某些時(shí)候是不可兼得的,需要一個(gè)更加全面的評(píng)價(jià)指標(biāo)來綜合考慮精度和召回指數(shù)這兩個(gè)指標(biāo)。F1 分?jǐn)?shù)可以看做是模型精確率和召回率的一種調(diào)和平均,計(jì)算公式為:
式中,F(xiàn)1 表示分?jǐn)?shù),P 表示精確率,Recall 表示召回率。當(dāng)F1 分?jǐn)?shù)越接近于1,這個(gè)模型的準(zhǔn)確率就越高,F(xiàn)1 分?jǐn)?shù)的取值范圍是0-1。
(4)ROC 特征曲線(ROC 曲線)
ROC 曲線代表了在不同的操作條件(閾值)下,其敏感性(FPR)和精確性(TPR)的趨勢(shì)走向。ROC 曲線上每一個(gè)點(diǎn)表明了不同閾值下的敏感性和精確性。ROC 曲線的橫軸為敏感性,豎軸為精確性。敏感性和精確性可以表述為以下公式:
式中,F(xiàn)PR 表示敏感性,TPR 表示精確性,TP 表示正確陽性,F(xiàn)N 表示錯(cuò)誤陰性,F(xiàn)P 表示錯(cuò)誤陽性,TN 表示正確陰性。
對(duì)該模型的精確度本文使用了召回率、精確率、F1 分?jǐn)?shù)進(jìn)行了評(píng)價(jià)。具體評(píng)價(jià)結(jié)果見表4。
表4 模型的精確度評(píng)價(jià)指標(biāo)
召回率和精確率均達(dá)到了85%以上,F(xiàn)1 分?jǐn)?shù)達(dá)到了0.862。該模型的精確度已經(jīng)足夠高,達(dá)到了建模的目的。
圖2 模型ROC 曲線
本文還使用了接受者操作特征曲線(ROC 曲線)進(jìn)行了評(píng)價(jià)。具體結(jié)論見圖2。縱軸表示真陽率。圖中實(shí)線是元學(xué)習(xí)模型的ROC 曲線。圖中虛線是對(duì)角線,對(duì)應(yīng)的是一個(gè)“隨機(jī)猜測(cè)模型”(50%的概率猜測(cè)正確)。ROC 曲線越靠近左上角,模型的預(yù)測(cè)準(zhǔn)確率就越高。對(duì)于圖中的左上角,即坐標(biāo)為(0,1)這個(gè)點(diǎn),對(duì)應(yīng)的是“理想模型”(ideal model),其中FPR=0,同時(shí)TPR=1,這意味著模型把所有的樣本都分類正確。從上圖中可以看到,元學(xué)習(xí)模型(轉(zhuǎn)下頁)靠近左上角,說明元學(xué)習(xí)模型的準(zhǔn)確率較高。
本文使用元學(xué)習(xí)方法來構(gòu)建預(yù)測(cè)模型,能夠在城市快速路瓶頸區(qū)數(shù)據(jù)集的數(shù)據(jù)量非常小的情況下,利用有足夠大的數(shù)據(jù)量的軌道交通站點(diǎn)及高速公路的數(shù)據(jù)集對(duì)模型進(jìn)行預(yù)訓(xùn)練,有效提高城市快速路瓶頸區(qū)小樣本模型的識(shí)別精度。并且以上海某高架段為例,結(jié)果顯示得到的元學(xué)習(xí)模型準(zhǔn)確率為85.3%,召回率為87.1%,F(xiàn)1 得分為86.2%。本模型一定程度上解決了小數(shù)據(jù)量情況下如何進(jìn)行交通預(yù)測(cè)的現(xiàn)實(shí)問題,對(duì)城市快速路瓶頸區(qū)能夠進(jìn)行智能精確自動(dòng)識(shí)別,從而及時(shí)提前進(jìn)行預(yù)警,為后續(xù)的交通誘導(dǎo)措施和決策提供精準(zhǔn)及時(shí)的信息依據(jù),有效緩解城市擁堵。