李 青
(武漢市公安局洪山區(qū)交通大隊(duì),湖北 武漢 430071)
智慧城市的建設(shè)以物聯(lián)網(wǎng)、大數(shù)據(jù)、云計(jì)算等科學(xué)技術(shù)為核心,對(duì)城市中產(chǎn)生的海量數(shù)據(jù)進(jìn)行采集、處理、分析和利用,實(shí)現(xiàn)對(duì)城市各方面信息的全面感知和資源調(diào)度[1]。智慧城市的建設(shè)離不開交通網(wǎng)絡(luò)。城市交通的發(fā)展情況與智慧城市的建設(shè)緊密相關(guān),能夠改變產(chǎn)業(yè)不均的問(wèn)題,促進(jìn)經(jīng)濟(jì)發(fā)展。近年來(lái),私家車數(shù)量逐漸增多,給城市交通道路帶來(lái)負(fù)擔(dān),增大了城市交通壓力[2]。
針對(duì)智慧城市交通流量預(yù)測(cè)方法,相關(guān)文獻(xiàn)進(jìn)行了大量技術(shù)研究。文獻(xiàn)[3]提出了動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)預(yù)測(cè)方法,建立視頻信息高速公路,并將其應(yīng)用在交通信息網(wǎng)絡(luò)平臺(tái),對(duì)車輛進(jìn)行定位和對(duì)城市交通進(jìn)行控制,以實(shí)現(xiàn)數(shù)字交通執(zhí)法。由于系統(tǒng)模型的輸入維度過(guò)多,進(jìn)行預(yù)測(cè)需要花費(fèi)較長(zhǎng)時(shí)間。文獻(xiàn)[4]建立了1種基于神經(jīng)網(wǎng)絡(luò)和統(tǒng)計(jì)算法的混合模型,對(duì)城市中某區(qū)域內(nèi)的交通流量進(jìn)行模擬。但該方法沒(méi)有結(jié)合道路交通的速動(dòng)性,導(dǎo)致交通流時(shí)間序列中的預(yù)測(cè)精度較差。
針對(duì)上述技術(shù)的不足,本文提出利用人工智能(artificial intelligence,AI)視頻技術(shù)進(jìn)行車輛識(shí)別的方法。該方法通過(guò)統(tǒng)計(jì)局部的梯度方向直方圖(histogram of oriented gradients,HOG)特征,并將HOG特征作為車輛識(shí)別的特征,以建立XGBoost融合模型對(duì)交通流量進(jìn)行預(yù)測(cè)。由于該方法加入了多個(gè)分類器,故能提升模型的預(yù)測(cè)效果,提高模型的預(yù)測(cè)能力。
基于AI視頻監(jiān)控的智慧城市交通系統(tǒng)以視頻采集為基礎(chǔ),應(yīng)用AI和大數(shù)據(jù)技術(shù)進(jìn)行車輛檢測(cè)、人臉識(shí)別、圖像識(shí)別等,進(jìn)而獲取城市道路交通車輛信息,并對(duì)采集的海量信息作大數(shù)據(jù)分析處理[5-6]。
基于AI視頻監(jiān)控的智慧城市交通系統(tǒng)框架如圖1所示。
AI車輛識(shí)別過(guò)程如圖2所示。
基于AI視頻監(jiān)控的智慧城市交通系統(tǒng)主要分為基礎(chǔ)層、數(shù)據(jù)層、應(yīng)用層和業(yè)務(wù)層?;A(chǔ)層包括計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)資源池和視頻圖像庫(kù),完成存儲(chǔ)資源的云化,通過(guò)對(duì)原始數(shù)據(jù)、視頻解析部分的視頻資源進(jìn)行整合,實(shí)現(xiàn)各業(yè)務(wù)數(shù)據(jù)和運(yùn)行數(shù)據(jù)的整合處理,形成多種數(shù)據(jù)庫(kù)[7]。數(shù)據(jù)層共享和交互各智慧城市的交通視頻,為系統(tǒng)的應(yīng)用層提供視頻資源。數(shù)據(jù)層應(yīng)用AI技術(shù),對(duì)視頻共享平臺(tái)中的圖像、視頻資源進(jìn)行分析,提取車輛、人物、行為、特征等結(jié)構(gòu)化數(shù)據(jù)[8]。物聯(lián)網(wǎng)平臺(tái)搭載智能調(diào)度算法,為視頻共享平臺(tái)和硬件設(shè)備提供算法支持。同時(shí),根據(jù)不同的數(shù)據(jù)模型對(duì)多維度的結(jié)構(gòu)化數(shù)據(jù)進(jìn)行關(guān)聯(lián)、分析、挖掘,輸出多維度有價(jià)值的融合數(shù)據(jù),支撐系統(tǒng)業(yè)務(wù)層中業(yè)務(wù)的進(jìn)行。系統(tǒng)的應(yīng)用層基于數(shù)據(jù)層提供的視頻資源,為用戶提供基礎(chǔ)視頻應(yīng)用和智能應(yīng)用[9]。業(yè)務(wù)層主要展示城市交通的運(yùn)行狀態(tài)、監(jiān)測(cè)預(yù)警指標(biāo)、交通控制等。AI視頻技術(shù)以車輛為識(shí)別目標(biāo),對(duì)車輛的類型、品牌、顏色等特征信息進(jìn)行識(shí)別,并且能夠識(shí)別駕駛?cè)藛T信息和駕駛狀態(tài)[10]。AI視頻監(jiān)控可實(shí)現(xiàn)AI車輛信息特征提取。在對(duì)AI車輛數(shù)據(jù)信息特征進(jìn)行提取時(shí),構(gòu)建了支持向量機(jī)(support verctor machine,SVM)分類器[11]。SVM分類器如圖3所示。
圖3中,不同類型的點(diǎn)為需要進(jìn)行分類的城市交通圖像數(shù)據(jù)信息的正負(fù)類別,H1、H2、H3代表3種不同的分類器。其中,H3不能較好的分類出正負(fù)類別的數(shù)據(jù);H1和H2能夠分離正負(fù)類別的數(shù)據(jù),但分類器H2抗噪能力和泛化能力較差。分類器H1具有較好的抗噪能力,同時(shí)能夠取得較好的分類效果。SVM分類器通過(guò)(p-1)維的超平面將p維數(shù)據(jù)分為正負(fù)類別。H1是滿足要求的超平面[12]。SVM分類器是在所有超平面中選擇1個(gè)最大間隔將兩類不同數(shù)據(jù)進(jìn)行分離。SVM的超平面如圖4所示。
SVM分類器中,線性可分SVM要求數(shù)據(jù)集是線性可分的。對(duì)此,本文設(shè)定需要進(jìn)行分類的車輛數(shù)據(jù)集為(X1,y1),(X2,y2),…,(Xn,yn)。Xi為p維的車輛數(shù)據(jù)。當(dāng)yi=+1時(shí),Xi數(shù)據(jù)為正類別數(shù)據(jù);當(dāng)yi=-1時(shí),Xi數(shù)據(jù)為反類別數(shù)據(jù)[13]。yi為SVM的超平面輸出數(shù)據(jù)信息。SVM的超平面可表示為:
XTW+b=0
(1)
式中:X為城市交通圖像數(shù)據(jù)信息;W為法向量;b為截距;T為轉(zhuǎn)置。
為了找到最大間隔的超平面,可以先找到平行且兩者之間間隔最大的2個(gè)超平面。最大間隔超平面位于兩者中間,可為:
(2)
式中:d為2個(gè)超平面的間隔[14]。
為了解決出現(xiàn)少量樣本不可分的現(xiàn)象,本文引入了軟間隔,加入懲罰參數(shù)和松弛因子得到軟間隔SVM。
(3)
式中:C為懲罰因子;ξ為松弛因子;ξi為像素i數(shù)據(jù)信息的松弛因子。
將圖像灰度化后,計(jì)算灰度圖像每個(gè)像素點(diǎn)的梯度值,得到梯度圖。
(4)
式中:G為最終的梯度值;Gx為水平方向的梯度值;Gy為垂直方向的梯度值;(i,j)為數(shù)據(jù)像素。
對(duì)block數(shù)組進(jìn)行歸一化,得到最終的HOG特征向量。對(duì)于64×128的圖像,共有105個(gè)block。因此,將所有blcok得到的數(shù)組進(jìn)行組合,可以得到1個(gè)長(zhǎng)度為3 780的HOG特征[15]。
系統(tǒng)中,視頻監(jiān)控到的數(shù)據(jù)受到各種因素的影響,使數(shù)據(jù)集出現(xiàn)數(shù)據(jù)缺失、噪聲數(shù)據(jù)和數(shù)據(jù)冗余等情況。因此,需要對(duì)數(shù)據(jù)集進(jìn)行預(yù)處理,以提高數(shù)據(jù)質(zhì)量和可利用率。本文使用系統(tǒng)中AI視頻監(jiān)控的開源交通數(shù)據(jù)集。數(shù)據(jù)集包含的字段如表1所示。
表1 數(shù)據(jù)集包含的字段
道路ID能夠作為交通特征,屬于類別型特征,使用Label Encoding進(jìn)行編碼。時(shí)間片靜態(tài)特征為時(shí)間維度的屬性,包括星期、節(jié)假日、小時(shí)、分鐘等,能夠在時(shí)間維度上描述道路特征。星期和小時(shí)的映射方式為one-hot Encoding。預(yù)測(cè)函數(shù)可以為:
(5)
式中:K為決策樹數(shù)量。
決策樹函數(shù)可以為:
F={f(x)=wq(x)}(q:Rm→T,w∈RT)
(6)
式(6)為評(píng)價(jià)城市交通函數(shù)時(shí)交通數(shù)據(jù)信息所占的決策樹空間。q(x)為將交通數(shù)據(jù)信息樣本x映射到構(gòu)建的決策樹函數(shù)上的葉子節(jié)點(diǎn)。決策樹的葉子節(jié)點(diǎn)記作wq(x)。評(píng)價(jià)城市交通數(shù)據(jù)信息的正則化目標(biāo)函數(shù)可以為:
(7)
(8)
式中:N為決策樹模型中的葉子節(jié)點(diǎn)個(gè)數(shù);w為所構(gòu)建的決策樹模型中的葉子節(jié)點(diǎn)的權(quán)重;γ和λ均為可以調(diào)節(jié)的參數(shù)。
在計(jì)算過(guò)程中,要注意設(shè)置迭代次數(shù),前(t-1)步迭代次數(shù)后,輸出的模型為ft-1(x)。在第t步的優(yōu)化過(guò)程中,輸出目標(biāo)函數(shù)為:
(9)
將式(9)進(jìn)行二階泰勒展開,可以得到:
Ω(ft)]
(10)
式(10)可以記作:
(11)
(12)
則葉子節(jié)點(diǎn)迭代次數(shù)輸出數(shù)據(jù)信息可以為:
(13)
XGBoost模型在計(jì)算智慧城市交通時(shí),需要對(duì)模型進(jìn)行優(yōu)化。在完成 XGBoost模型初始化參數(shù)訓(xùn)練時(shí),優(yōu)化參數(shù)主要包括樹的最大深度max_depth、學(xué)習(xí)率learning_rate、列采樣比率colasmaple_bytree和樣本采樣比率subsample。模型參數(shù)的調(diào)節(jié)范圍和調(diào)節(jié)步長(zhǎng)如表2所示[16-17]。
表2 模型參數(shù)的調(diào)節(jié)范圍和調(diào)節(jié)步長(zhǎng)
XGBoost模型在不同的max_depth下預(yù)測(cè)評(píng)價(jià)指標(biāo)變化如圖5所示。
隨著max_depth值的增加,模型開始出現(xiàn)過(guò)擬合的情況。當(dāng)max_depth的值為4時(shí),預(yù)測(cè)評(píng)價(jià)指標(biāo)最小。預(yù)測(cè)評(píng)價(jià)指標(biāo)隨max_depth的增加而增加,說(shuō)明模型出現(xiàn)過(guò)擬合。由此可以確定參數(shù)max_depth的值為4。對(duì)上述數(shù)據(jù)模型進(jìn)行預(yù)測(cè),通過(guò)提取的交通特征和優(yōu)化后的參數(shù)對(duì)建立的XGBoost融合模型進(jìn)行訓(xùn)練。使用訓(xùn)練好的模型對(duì)城市交通未來(lái)一段時(shí)間內(nèi)的流量進(jìn)行預(yù)測(cè)。通過(guò)對(duì)道路靜態(tài)特征的提取可知,道路長(zhǎng)度對(duì)車輛的旅行時(shí)間影響較大,而道路寬度對(duì)車輛的旅行時(shí)間影響較小。因此,道路長(zhǎng)度的區(qū)分度比其他道路靜態(tài)特征更高[18]。
根據(jù)預(yù)測(cè)結(jié)果可知,交通流量一般為逐漸變化,不會(huì)出現(xiàn)突然增大或突然減小的情況。時(shí)間連續(xù)性決定了前一時(shí)刻的平均旅行時(shí)間對(duì)后一時(shí)刻的影響較大。根據(jù)XGBoost融合模型輸入的交通流量預(yù)測(cè)結(jié)果對(duì)城市交通情況進(jìn)行控制,并及時(shí)作出相應(yīng)的調(diào)整,以避免交通擁堵。
為驗(yàn)證基于AI視頻監(jiān)控的智慧城市交通系統(tǒng)的性能,分別使用文獻(xiàn)[3]系統(tǒng)、文獻(xiàn)[4]系統(tǒng)和本研究系統(tǒng)進(jìn)行試驗(yàn),對(duì)比3種系統(tǒng)的車輛識(shí)別效果和流量預(yù)測(cè)能力。試驗(yàn)環(huán)境需要搭建在配置好的服務(wù)器上,并進(jìn)行Tomcat和Java的Jdk配置和安裝。中心管理服務(wù)器采用64位E5系列處理器,內(nèi)存為32 GB DDR4,硬盤為600 GB SAS。視頻接入服務(wù)器為64位E5系列處理器,內(nèi)存為32 GB DDR4,硬盤為600 GB SAS。數(shù)據(jù)轉(zhuǎn)發(fā)服務(wù)器為64位E5系列處理器,內(nèi)存為32 GB DDR4,硬盤為600 GB SAS,平臺(tái)網(wǎng)關(guān)為4個(gè)千兆網(wǎng)口。數(shù)據(jù)庫(kù)服務(wù)器采用64位E7系列處理器,內(nèi)存為512 GB DDR4,硬盤為1.2 TB SAS,服務(wù)端操作系統(tǒng)為Windows Server 2008 R2(64 bit),服務(wù)端JDK為jdk1.8.0_66,接入交換機(jī)的參數(shù)為交換容量598 Gbit/s。本研究試驗(yàn)選用的訓(xùn)練樣本為64×64×3的RGB 圖像。
訓(xùn)練樣本為10 000張車輛圖像和10 000張非車輛圖像。其中,車輛圖像基本包含了所有常見車型,而非車輛圖像主要以道路環(huán)境中非車輛圖像為主。數(shù)據(jù)樣本中:車輛類型數(shù)據(jù)信息為12 684 MB;車輛標(biāo)志數(shù)據(jù)類型為8 542 MB;車輛顏色數(shù)據(jù)類型為1 635 MB;車牌數(shù)據(jù)類型為782 MB;道路圖像數(shù)據(jù)類型為22 450 MB。試驗(yàn)架構(gòu)如圖6所示。
通過(guò)試驗(yàn),將數(shù)據(jù)樣本分為6組,設(shè)定每組中有500個(gè)車輛圖像,使用3種系統(tǒng)對(duì)每組樣本進(jìn)行識(shí)別。車輛識(shí)別結(jié)果如圖7所示。
由圖7可知,本研究系統(tǒng)對(duì)數(shù)據(jù)樣本識(shí)別到的車輛數(shù)量最多,AI車輛識(shí)別效果最好。本研究系統(tǒng)先對(duì)樣本圖像進(jìn)行HOG特征提取,通過(guò)滑動(dòng)窗口滑動(dòng)到不同的位置獲取特征信息,再輸入到SVM分類器中進(jìn)行判斷。其中,第4組和第5組識(shí)別到的車輛數(shù)量均為500個(gè),識(shí)別率高達(dá)100%。
文獻(xiàn)[3]系統(tǒng)的最少識(shí)別個(gè)數(shù)低至483個(gè),在第4組識(shí)別到的車輛數(shù)量最高可達(dá)到494個(gè),車輛識(shí)別過(guò)程中可能受到圖像質(zhì)量的限制,如光照不均勻、畫面不清晰、存在噪聲干擾的影響等,導(dǎo)致識(shí)別效果不好。文獻(xiàn)[4]系統(tǒng)識(shí)別第2組樣本數(shù)據(jù)得到的識(shí)別數(shù)量最低為471個(gè),第3組上升到490個(gè),系統(tǒng)識(shí)別效果不穩(wěn)定,也可能存在誤識(shí)別的情況。
為驗(yàn)證3種系統(tǒng)對(duì)城市交通流量的預(yù)測(cè)效果,輸入城市中某區(qū)域內(nèi)的歷史交通流量,使用3種系統(tǒng)對(duì)未來(lái)一段時(shí)間內(nèi)的交通流量進(jìn)行預(yù)測(cè),并與真實(shí)流量值進(jìn)行比較,計(jì)算誤差百分比。
(14)
式中:yi為預(yù)測(cè)值;xi為實(shí)際值。
3種系統(tǒng)的預(yù)測(cè)誤差如圖8所示。
由數(shù)據(jù)點(diǎn)預(yù)測(cè)值的誤差百分比可知,本研究系統(tǒng)得到預(yù)測(cè)數(shù)據(jù)的誤差百分比在[-0.1,0.1]之間,誤差百分比相對(duì)穩(wěn)定,說(shuō)明本研究系統(tǒng)對(duì)交通流量的預(yù)測(cè)效果較好。文獻(xiàn)[3]系統(tǒng)的誤差百分比最大可達(dá)到0.48,而文獻(xiàn)[4]系統(tǒng)的誤差百分比超過(guò)0.5,且變化幅度較大,預(yù)測(cè)精度不穩(wěn)定。
針對(duì)城市交通信息管理能力、城市交通數(shù)據(jù)信息交互能力滯后的問(wèn)題,本文提出1種基于XGBoost融合模型的交通流量預(yù)測(cè)技術(shù)。該技術(shù)通過(guò)AI視頻監(jiān)控,以HOG特征信息模型實(shí)現(xiàn)流量數(shù)據(jù)信息的分析,由SVM分類器實(shí)現(xiàn)城市交通信息的分類與識(shí)別,提升了道路信息識(shí)別能力。同時(shí),本文構(gòu)建了XGBoost融合方法,能夠提高交通流量預(yù)測(cè)能力,并通過(guò)分類回歸樹(classification and regression tree,CART)作為基分類器,實(shí)現(xiàn)原始數(shù)據(jù)集的編碼,最終集成多個(gè)決策樹模型。在試驗(yàn)過(guò)程中,車輛圖像的識(shí)別率比較高,對(duì)交通流量的預(yù)測(cè)數(shù)據(jù)的誤差百分比始終低于0.1。該研究能夠加強(qiáng)城市交通系統(tǒng)監(jiān)控,提高交通數(shù)據(jù)信息分析和應(yīng)用能力。