尹 露
(上海電科智能系統(tǒng)股份有限公司,上海 200063)
交通擁堵是目前城市快速路面臨的最為嚴(yán)重的問題之一[1].如何確定實時的、精準(zhǔn)的交通信息,并及時采取相應(yīng)的措施改善交通擁堵,已經(jīng)成為城市交通治理的一個迫切的任務(wù).
實施有效的智能交通管理系統(tǒng)是解決交通擁堵的一個重要手段.智能交通系統(tǒng)需要前端設(shè)備進行感知,然而傳統(tǒng)的交通數(shù)據(jù)采集手段包括線圈檢測器、微波、攝像頭等,其缺點十分明顯:需要間隔固定的距離進行前期布設(shè),檢測范圍依賴設(shè)備的覆蓋率;檢測設(shè)備的好壞嚴(yán)重影響數(shù)據(jù)質(zhì)量,一旦發(fā)生設(shè)備故障,數(shù)據(jù)缺失嚴(yán)重,并且需要人工長期維護.此外,受布設(shè)方式的影響,傳統(tǒng)的采集設(shè)備在數(shù)據(jù)精準(zhǔn)性、及時性方面也十分欠缺.
針對這些問題提出了一種新的交通信息采集手段——Φ-OTDR分布式光纖傳感設(shè)備.該設(shè)備采集方便,不需要提前布設(shè),只需要利用道路上已有的通信光纜,將其中空余的光纖接入系統(tǒng),就可實現(xiàn)連續(xù)的、長距離的動態(tài)實時數(shù)據(jù)采集.根據(jù)采集的實時動態(tài)數(shù)據(jù),尋找光纖振動數(shù)據(jù)與交通狀態(tài)之間的關(guān)系,是本文重點要討論的問題.
國外對交通狀態(tài)的擁堵識別一直是智能交通系統(tǒng)中十分常見的功能之一,包括常發(fā)性的擁堵和偶發(fā)性的擁堵計算.常發(fā)性擁堵一般是由于道路交通量過大產(chǎn)生的,如交通的早晚高峰,并具有一定的可預(yù)測性.研究指標(biāo)如高速公路擁堵指數(shù)(freeway congestion index FCI)[2-3]和常發(fā)性擁堵發(fā)生概率指標(biāo)[4].偶發(fā)性擁堵發(fā)生時間沒有預(yù)測性,如交通事故、惡劣天氣等,目前并沒有成熟的研究體系[5].
國內(nèi)對城市交通狀態(tài)的研究始于20世紀(jì)90年代.隨著城市智能交通技術(shù)的發(fā)展,針對我國城市道路特殊情況,在交通狀態(tài)識別方面取得了顯著的成果.主要研究方法有3大類:第1類為文獻[6-7]研究基于交通傳感器的交通參數(shù)采集,通過分析路段交通流量與速度的關(guān)系,判斷交通狀態(tài)的變化;第2類為文獻[8-10]利用集對分析法、模糊聚類法等實現(xiàn)對交通狀態(tài)的識別;近幾年,由于大數(shù)據(jù)技術(shù)的發(fā)展,產(chǎn)生了第3類基于數(shù)據(jù)挖掘技術(shù)的城市交通狀態(tài)研究,如支持向量機(SVM)、機器學(xué)習(xí)、圖像識別等深度學(xué)習(xí)算法[11-12],但是在交通數(shù)據(jù)采集設(shè)備這一塊,仍然是以線圈和視頻為主.本文提出的借助光纖傳感設(shè)備,實現(xiàn)對路段連續(xù)、實時數(shù)據(jù)的采集,在交通應(yīng)用領(lǐng)域具有較高的創(chuàng)新性,對真實項目的落地應(yīng)用有一定的參考價值.
工程上應(yīng)用較多的交通數(shù)據(jù)采集技術(shù)主要分為2類:固定型采集技術(shù)和移動型采集技術(shù)[13].固定型采集技術(shù)是指采集設(shè)備安裝地點固定,是不可移動的,一般用于提供地點交通數(shù)據(jù);移動型采集技術(shù)的采集設(shè)備則安裝在車輛上,一般用于提供路段交通數(shù)據(jù),如全球定位系統(tǒng)(GPS)、汽車牌照識別、電子標(biāo)簽識別等[14].固定型采集設(shè)備包含波頻設(shè)備(微波、超聲、紅外),磁頻設(shè)備(線圈、地磁),視頻設(shè)備(攝像頭)3類[15].
這2類交通數(shù)據(jù)采集技術(shù)工程缺陷十分明顯:固定型采集技術(shù)的檢查范圍受限于設(shè)備的布設(shè)位置,且設(shè)備需要定期維護,受外界環(huán)境影響較大;移動型采集技術(shù)一定要在車輛上安裝相應(yīng)的設(shè)備,否則無法獲取數(shù)據(jù),工程成本較高[15].
光纖傳感技術(shù)的優(yōu)勢在于連續(xù)、靈敏度高.不僅可實現(xiàn)規(guī)模較大、距離較長的工程數(shù)據(jù)采集,同時對光纖沿線的擾動信號具有高強度的靈敏性,因此十分適用于交通安全狀態(tài)監(jiān)測.該技術(shù)在交通運輸方面的應(yīng)用還在起步階段,主要用于周界安防和長距離的油氣管道監(jiān)測、大型倉庫及油罐的火災(zāi)防護、大型設(shè)備(如航空航天飛行器)的老化程度檢測等[15-18]方面.
分布式光纖傳感系統(tǒng)采用通信鏈路的既有光纜作為傳感光纖.在既有的通信光纜中,一般存在沒有使用的光纖鏈路,分布式光纖傳感系統(tǒng)抽取其中一根光纖連接到系統(tǒng)內(nèi),利用該光纖提供的背向散射光進行分布式信息感知,實現(xiàn)傳感和數(shù)據(jù)傳輸.根據(jù)應(yīng)用需求,一般選擇城市快速路中鋪設(shè)有通信光纜的路段作為信息采集路段.由于鋪設(shè)光纜的方式、鋪設(shè)深度、鋪設(shè)位置不同,信息采集路段上一定會存在對振動信號不敏感的地區(qū),進行信號分析和現(xiàn)場實驗時,應(yīng)該避開這些不敏感區(qū)域.另外,受鋪設(shè)因素的影響,信息采集路段對振動信號敏感區(qū)域的敏感程度也不一樣.
本研究選取滬寧高速大渡河路至江橋收費站7 km的路段作為測試路段,利用道路中已經(jīng)鋪設(shè)的通信光纜作為實驗對象,既有通信光纜的終端設(shè)置在快速路設(shè)備控制的機房內(nèi),Φ-OTDR分布式光纖傳感系統(tǒng)數(shù)據(jù)采集設(shè)備如圖1所示.該設(shè)備在測試環(huán)境下,每1 m,0.6s采集1次振動數(shù)據(jù),采集頻率為100 Hz,全天24 h不間斷采集.
圖1 Φ-OTDR分布式光纖傳感系統(tǒng)數(shù)據(jù)采集設(shè)備
本模型基于Φ-OTDR光纖傳感設(shè)備,通過采集上海市滬寧高速的交通狀態(tài)實時光纖振動數(shù)據(jù),解調(diào)光纖波形在時間和位置上的變化規(guī)律,建立基于支持向量機(SVM)的交通狀態(tài)判別算法,實現(xiàn)對真實交通狀態(tài)的智能識別.
3.2.1 SVM算法簡介
SVM實現(xiàn)監(jiān)督學(xué)習(xí)的機理在于,對樣本進行分類的過程,對于小樣本、非線性、及高維模式識別問題具有較好的分類效果.SVM算法的實現(xiàn)過程是將訓(xùn)練集子集定義為決策邊界,通過尋找2類決策邊界中間的一個超平面,當(dāng)超平面與被集中訓(xùn)練的2類邊緣樣本的“距離”最大時,得到最大邊緣超平面.因為“距離”最大,超平面可有效區(qū)分2類樣本,并具有很好的泛化誤差,如圖2所示.
圖2 SVM算法中的最大邊緣超平面
由于任何凸集都適用支持向量機算法,為了尋找最大邊緣超平面,需運用拉格朗日乘子,拉格朗日函數(shù)見式(1):
(1)
式中:λi為拉格朗日乘子;xi、yi表示已知的訓(xùn)練樣本;C為懲罰因子;ξi為松弛變量;w、b表示分割超平面的系數(shù)向量;得到式(2):
s.t. 0≤λi≤C,i=1,…,n
(2)
由于交通狀態(tài)分類的分割平面是曲面而不是平面,而SVM 模型屬于線性二分類器,無法適用于交通狀態(tài)的分類,因此引入核函數(shù).
核函數(shù)可將特征從原坐標(biāo)空間X映射到坐標(biāo)空間φ(X)中,得到新的目標(biāo)函數(shù)式(3):
(3)
核函數(shù)一方面可解決SVM模型線性不可分的情況,同時又能避免計算時出現(xiàn)的多維災(zāi)難問題,節(jié)省計算時間,節(jié)約計算資源.
3.2.2 定義交通狀態(tài)
根據(jù)國家道路交通信息發(fā)布規(guī)范GA/T 994—2017,在限制速度為80 km/h的城市快速路下,3級通行狀態(tài)的發(fā)布要求如表1所示.
表1 快速路3級通行狀態(tài)發(fā)布規(guī)定
3.2.3 5 min數(shù)據(jù)波形圖統(tǒng)計
步驟1將原始數(shù)據(jù)按照研究路段和時間區(qū)間,分成若干M×N的矩陣.
其中M代表研究路段的距離,單位為米,例如M取[500,800],表示測試道路500~800 m位置區(qū)間;N代表采集數(shù)據(jù)的時間范圍,由于每0.6 s采集1次數(shù)據(jù),在N取[1,1 000]時,實際代表的是第0.6~600 s的數(shù)據(jù),也就是前10 min的數(shù)據(jù),參見表2.
表2 原始數(shù)據(jù)的矩陣劃分
步驟2確定單位標(biāo)準(zhǔn)矩陣,矩陣格式為500×500.
依次將測試路段每500 m劃分成一個單獨的研究對象,并分別對每個研究對象每5 min統(tǒng)計1次數(shù)據(jù).因此,每1個500 m的研究路段,根據(jù)不同時間的采集數(shù)據(jù),可得到若干個500×500的標(biāo)準(zhǔn)矩陣,表3為一個單位標(biāo)準(zhǔn)矩陣.
表3 單位標(biāo)準(zhǔn)矩陣(萬鎮(zhèn)路—祁連山路段)
步驟3獲得每個單位標(biāo)準(zhǔn)矩陣的數(shù)據(jù)波形曲線.
以距離為橫坐標(biāo),光纖采集數(shù)據(jù)為縱坐標(biāo),依次將每個點位的采集值在坐標(biāo)上畫出來,可得到每個標(biāo)準(zhǔn)曲線的波形曲線,如圖3所示.
圖3 單位標(biāo)準(zhǔn)矩陣的數(shù)據(jù)波形曲線
3.2.4 建立基于SVM的交通狀態(tài)判別模型
步驟1對每標(biāo)準(zhǔn)研究路段建立起每隔5 min交通狀態(tài)數(shù)據(jù)檔案.
在數(shù)據(jù)處理中心調(diào)取每段標(biāo)準(zhǔn)研究路段的交通狀態(tài)信息,以萬鎮(zhèn)路—祁連山南路為例,具體統(tǒng)計格式如表4所示.
表4 萬鎮(zhèn)路—祁連山南路交通數(shù)據(jù)檔案
步驟2建立路段光纖采集數(shù)據(jù)波形曲線圖片庫.
分別獲取每1段路段在標(biāo)準(zhǔn)矩陣下的數(shù)據(jù)波形曲線,并根據(jù)真實的交通狀態(tài)數(shù)據(jù)檔案,分別為每1張圖片貼上對應(yīng)交通狀態(tài)的學(xué)習(xí)標(biāo)簽.例如:萬鎮(zhèn)路—祁連山南路;2018-01-10;07:00—07:05;暢通,其數(shù)據(jù)波形曲線如圖4所示.
圖4 萬鎮(zhèn)路—祁連山南路5 min數(shù)據(jù)波形曲線
步驟3建立SVM交通狀態(tài)學(xué)習(xí)數(shù)據(jù)庫.
按照需要實現(xiàn)判別的交通狀態(tài),依次建立暢通、緩慢、擁堵3類交通狀態(tài)學(xué)習(xí)數(shù)據(jù)庫,將貼上學(xué)習(xí)標(biāo)簽的曲線圖片按照對應(yīng)的交通狀態(tài),分別放入學(xué)習(xí)數(shù)據(jù)庫,最終可得到暢通、緩慢、擁堵3大學(xué)習(xí)數(shù)據(jù)庫,如圖5~圖7所示.
圖5 SVM交通狀態(tài)學(xué)習(xí)數(shù)據(jù)庫-暢通狀態(tài)
圖6 SVM交通狀態(tài)學(xué)習(xí)數(shù)據(jù)庫-緩慢狀態(tài)
圖7 SVM交通狀態(tài)學(xué)習(xí)數(shù)據(jù)庫-擁堵狀態(tài)
步驟4通過Matlab軟件實現(xiàn)基于SVM的交通狀態(tài)判別.
軟件代碼技術(shù)思路如圖8所示,主要包括數(shù)據(jù)訓(xùn)練學(xué)習(xí)和實現(xiàn)狀態(tài)預(yù)測2部分.通過安裝SVM工具箱,可直接在Matlab中調(diào)用,SVM訓(xùn)練函數(shù)為:
圖8 基于SVM的交通狀態(tài)判別模型實現(xiàn)思路
model=svmtrain(label,scaledpic,′-t -c -v′)
(4)
第1個參數(shù)為標(biāo)簽,第2個為訓(xùn)練數(shù)據(jù),第3個是個命令集合,-t表示核函數(shù),-c為懲罰系數(shù),-v為交叉驗證數(shù).
SVM分類預(yù)測函數(shù)為:
[predict_label,accuracy,prob_estimates]=
svmpredict(label,scaledpic,model)
(5)
模型中各步驟均基于Matlab編程實現(xiàn),各步驟的編程核心思想如下.
讀取訓(xùn)練數(shù)據(jù)的函數(shù)定義為:
function[imageContainer,label]=
ReadPic(n_pic,flag)
(6)
具體處理步驟為:
1)將曲線圖片轉(zhuǎn)為pgm格式,并統(tǒng)一將圖片大小處理為112像素×92像素;
2)每1種交通狀態(tài)里面都有N張圖片,前N/2張當(dāng)作訓(xùn)練集,后N/2張當(dāng)作測試集;
3)當(dāng)flag為0時,表示輸入為訓(xùn)練集,flag為1時,表示輸入為測試集;
4)n_pic為不同的曲線圖像類別,在本模型中n_pic=3,即表示暢通、緩慢、擁堵3種狀態(tài);
5)label即是數(shù)據(jù)的標(biāo)簽;
6)imageContainer是一個向量化圖片容器,即將每1張圖片轉(zhuǎn)成一行向量放入其每行中,有點的地方像素為1,其他地方為0.
數(shù)據(jù)PCA降維,是為了讓SVM 在高維情況下線性不可分的問題,在低維情況下變得線性可分,函數(shù)定義為:
function[pcaA,V]=fastPCA(A,k)
(7)
式中:A為樣本矩陣,將其降至k維后的矩陣為pcaA,V為主成分分量.
數(shù)據(jù)歸一化是為了讓所有數(shù)據(jù)處于同一個可比較的量級.舉一個簡單的例子,例如A體重70 kg,身高1.75 m,B體重69 kg,身高1.50 m,C體重65 kg,身高1.74 m,SVM是基于距離算的,所以會把A和B看成相似的,而實際上A和C比較相似,函數(shù)定義為式(8):
function[scaledpic]=
scaling(picMat,lTarget,uTarget)
(8)
式中:picMat為需要進行規(guī)范化的曲線圖像數(shù)據(jù),所有數(shù)據(jù)在歸一化之后,取值都將在[-1,1]之間.
3.2.5 基于SVM的交通狀態(tài)判別模型運行結(jié)果
在本模型中,由于需要分類的狀態(tài)一共有3類,因此每一次需要測試識別的圖像共有3×N/2張.表5展示了在不同的樣本數(shù)據(jù)N下的SVM分類識別結(jié)果.毫無疑問,模型測試結(jié)果也說明了隨著數(shù)據(jù)樣本量的增大,模型訓(xùn)練的準(zhǔn)確度會提高,最終的分類識別正確率也會越高.
表5 不同的樣本數(shù)據(jù)N下的SVM分類識別結(jié)果
基于光纖傳感技術(shù),借助光纖傳感設(shè)備,可實現(xiàn)對連續(xù)路段實時數(shù)據(jù)的采集.本研究通過數(shù)據(jù)挖掘技術(shù),實現(xiàn)了基于支持向量機(SVM)的交通狀態(tài)判別智能識別算法,該算法對暢通、緩慢和擁堵3種交通狀態(tài)可有效識別,并發(fā)布實時交通狀態(tài).在連續(xù)交通數(shù)據(jù)采集方面,光纖傳感技術(shù)具有很大的優(yōu)勢,因此對于未來城市快速路的智慧建設(shè),本技術(shù)具有一定的參考和應(yīng)用價值.