(國研網(wǎng)成都分公司,四川 成都 610056)
2018年1月,中共中央、國務(wù)院發(fā)出《關(guān)于開展掃黑除惡專項(xiàng)斗爭的通知》。近來年,高速公路運(yùn)輸在國民經(jīng)濟(jì)的地位越來越明顯。但同時(shí),高速公路運(yùn)營管理中暴露的新情況、新問題也逐年增多,特別是偷逃通行費(fèi)問題,不但給國家?guī)斫?jīng)濟(jì)損失,而且給正常的運(yùn)營秩序帶來較大的沖擊。高速公路打逃工作是交通領(lǐng)域掃黑除惡一項(xiàng)重要工作,也是高速公路企業(yè)提升管理精細(xì)化水平、挽回經(jīng)濟(jì)損失的內(nèi)在要求。
現(xiàn)階段,高速抓逃的主要手段是依靠人工的經(jīng)驗(yàn)來進(jìn)行高速抓逃,而這種方式效率低下,準(zhǔn)確率較低。并且抓逃范圍僅限于稽核人員當(dāng)前所處的收費(fèi)站,很難以達(dá)到全路網(wǎng)范圍內(nèi)的精準(zhǔn)打逃。
隨著大數(shù)據(jù)時(shí)代的到來,數(shù)據(jù)挖掘技術(shù)得到了飛速的發(fā)展,越來越多的數(shù)據(jù)挖掘技術(shù)被用于實(shí)際工作和生活中。筆者基于BP神經(jīng)網(wǎng)絡(luò)框架基礎(chǔ)上,對海量通行數(shù)據(jù)進(jìn)行人工智能的數(shù)據(jù)挖掘,并結(jié)合高速公路實(shí)際的管理方法,以達(dá)到精準(zhǔn)預(yù)測、精準(zhǔn)定位的最終目標(biāo)。
基于現(xiàn)階段的收費(fèi)策略,影響高速車輛收費(fèi)金額的關(guān)鍵因素有:
1)行駛里程數(shù):即入口收費(fèi)站與出口收費(fèi)站之間的里程。
2)車輛載重:主要是針對于貨車而言,主要是依據(jù)車輛的軸數(shù)與載重來進(jìn)行高速費(fèi)用。
3)車型:主要是針對于客車而言,計(jì)算的通行費(fèi)用不同,此時(shí)關(guān)鍵數(shù)據(jù)為客車車型。
4)是否屬于免費(fèi)車。
很多逃費(fèi)行為都是從以上幾個(gè)方面來偽造和非法更改關(guān)鍵數(shù)據(jù)等而達(dá)到逃費(fèi)的目的。
1)倒卡(換卡)逃費(fèi):通過倒卡(換卡)等逃費(fèi)手段,來減少實(shí)際里程數(shù),從而達(dá)到逃費(fèi)目的,具體逃費(fèi)行為有。
(1)單車循環(huán)留置倒卡。指車輛出站時(shí)謊稱卡丟失,收費(fèi)員按無卡程序操作后,駕駛員手中留置通行卡一張,第二次通行時(shí)入口正常領(lǐng)卡,用第一張卡就入口站近下,如此循環(huán)。
(2)套牌(或無牌)車換卡。車主一般擁有兩輛以上同顏色、同型號的車輛,從不法分子手中購買假牌照和假行駛證,使每輛車都用兩套甚至多套相同手續(xù)的車牌照。在行駛高速公路時(shí),其中兩輛車分頭對發(fā),在中途互換通行卡,并換上與通行卡讀取信息中對應(yīng)的車牌號,然后分別從對方入口時(shí)較近的收費(fèi)站下高速,以達(dá)到逃交通行費(fèi)的目的。
(3)變相倒卡。有兩種情況:一種是甩掛,即當(dāng)貨車進(jìn)入服務(wù)區(qū)后,司機(jī)將車廂放在服務(wù)區(qū),然后駕駛車頭在就近的收費(fèi)站下高速后再領(lǐng)卡上來。到服務(wù)區(qū)拉上車廂到相鄰的收費(fèi)站下,縮短繳費(fèi)距離;一種是在臨近收費(fèi)站的服務(wù)區(qū)卸貨或倒貨,減少遠(yuǎn)途載重車輛超限重量。
(4)專車送卡。限超車接近目的地時(shí)聯(lián)系一輛空車上路送卡、交換,持交換卡來出站以此逃費(fèi)。
2)UJ型線路逃費(fèi):通過該方式來改變車輛的實(shí)際里程數(shù)和載重?cái)?shù),從而達(dá)到逃費(fèi)目的。
3)假軸逃費(fèi):按照高速貨車相關(guān)收費(fèi)標(biāo)準(zhǔn),貨車的收費(fèi)與其核定載重有一定的關(guān)系。當(dāng)載重超過限載時(shí),通行費(fèi)的單價(jià)將成倍增加,而貨車軸數(shù)越大,其限載也就越大;貨車為了避免支付超載帶來的高額費(fèi)用,以增加假軸的方式,從而達(dá)到逃費(fèi)目的。
4)換貨逃費(fèi):貨車在出站前,將貨物提前轉(zhuǎn)移到從出站口附近上來接應(yīng)的車,然后輕車出站以達(dá)到逃費(fèi)的目的。
對于高速公路逃費(fèi)行為,現(xiàn)場稽查人員常采用人工稽查方式,根據(jù)一線人員的經(jīng)驗(yàn)來識別、打擊車輛的逃費(fèi)行為[1-4],而該方式效率低,并且在準(zhǔn)確性上也比較低,不能做到逐條檢測。
神經(jīng)網(wǎng)絡(luò)是由大量處理單元互聯(lián)組成的非線性、自適應(yīng)信息處理系統(tǒng),具有自學(xué)習(xí)的優(yōu)點(diǎn),而自學(xué)習(xí)能力對于預(yù)測有著特別重要的意義。因此,通過構(gòu)建神經(jīng)網(wǎng)絡(luò),使機(jī)器具有學(xué)習(xí)能力,智能識別逃費(fèi)車輛,打擊高速逃費(fèi)行為。
高速打逃可以歸結(jié)為尋找車輛通行記錄與車輛逃費(fèi)之間的映射關(guān)系,根據(jù)該車輛的通行記錄來判斷車輛是否存在逃費(fèi)行為。
神經(jīng)網(wǎng)絡(luò)利用現(xiàn)有的數(shù)據(jù)找出輸入與輸出之間得映射關(guān)系(近似),利用這種映射關(guān)系(近似),輸出結(jié)果。BP神經(jīng)網(wǎng)絡(luò)作為目前應(yīng)用最廣泛的神經(jīng)網(wǎng)絡(luò),BP神經(jīng)網(wǎng)絡(luò)無論在網(wǎng)絡(luò)理論還是在性能方面已比較成熟。其突出優(yōu)點(diǎn)就是具有很強(qiáng)的非線性映射能力和柔性的網(wǎng)絡(luò)結(jié)構(gòu)。網(wǎng)絡(luò)的中間層數(shù)、各層的神經(jīng)元個(gè)數(shù)可根據(jù)具體情況任意設(shè)定,并且隨著結(jié)構(gòu)的差異其性能也有所不同。
BP神經(jīng)網(wǎng)絡(luò)是一種按誤差反向傳播(簡稱誤差反傳)訓(xùn)練的多層前饋網(wǎng)絡(luò),其算法稱為BP算法,它的基本思想是梯度下降法,利用梯度搜索技術(shù),以期使網(wǎng)絡(luò)的實(shí)際輸出值和期望輸出值的誤差均方差為最小。BP神經(jīng)網(wǎng)絡(luò)的算法框架如圖1所示,算法框架包括:輸入層、隱藏層以及輸出層;
圖1 BP神經(jīng)網(wǎng)絡(luò)
BP算法包括信號的前向傳播和誤差的反向傳播兩個(gè)過程。即①計(jì)算誤差輸出時(shí)按從輸入層到輸出層的方向進(jìn)行。②而調(diào)整權(quán)值和閾值則從輸出層到輸入層的方向進(jìn)行。
(1)
(2)
Lt=f(y,Ot)
(3)
(4)
此時(shí)經(jīng)過訓(xùn)練的神經(jīng)網(wǎng)絡(luò)即能對類似樣本的輸入信息,自行處理輸出誤差最小的經(jīng)過非線形轉(zhuǎn)換的信息。
BP神經(jīng)網(wǎng)絡(luò)算法模型的訓(xùn)練建立在一個(gè)巨大的數(shù)據(jù)集上進(jìn)行的,數(shù)據(jù)集包含大約500萬條高速通行記錄,通行數(shù)據(jù)包括:入口時(shí)間、入口站、入口車牌、入口車型、入口車情、出口時(shí)間、出口站、出口車牌、出口車型、出口車情、總重、軸數(shù)、里程以及卡號。
經(jīng)過對高速車輛逃費(fèi)行為的分析,結(jié)合原數(shù)據(jù)中數(shù)據(jù),進(jìn)行特征融合與特征選擇,最終選取以下特征作為算法模型的輸入:①進(jìn)出車牌一致性(same_car_number)。②低速(low_speed)。③短途重載(short_dis_overweight)。④長途重載(long_dis_lightweight)。⑤同站進(jìn)出(min_out_in)。⑥通行時(shí)間重疊(same_time_range_again)。⑦車軸不一致(different_zhou)。⑧車型不一致。⑨標(biāo)識缺失。⑩標(biāo)識不一致;車情不一致。
因?yàn)閿?shù)據(jù)集為車輛出站數(shù)據(jù),故以車輛的出站車牌為依據(jù),分析2018年某路公司全部的通行記錄,統(tǒng)計(jì)各特征出現(xiàn)的次數(shù)以及車輛的總通行次數(shù)。
具體的統(tǒng)計(jì)規(guī)則如表1所示。在統(tǒng)計(jì)車牌不一致情況時(shí),考慮收費(fèi)站攝像頭對圖片識別的準(zhǔn)確性,采取編輯距離技術(shù)方式來判別進(jìn)出車牌是否一致。
表1 特征統(tǒng)計(jì)規(guī)則
數(shù)據(jù)統(tǒng)計(jì)后,如表2所示,將數(shù)據(jù)分為訓(xùn)練集、測試集以及預(yù)測集。
表2 數(shù)據(jù)集
下面詳細(xì)介紹算法框架。BP神經(jīng)網(wǎng)絡(luò)由輸入層、隱藏層以及輸出層組成,如圖2所示。在這種情況下,每一層節(jié)點(diǎn)的輸入都是上一層輸出的線性函數(shù),而且不管神經(jīng)網(wǎng)絡(luò)有多少層,最終的輸出的都是輸入的線性組合,那么網(wǎng)絡(luò)的逼近能力就相當(dāng)有限。因此,在每一層之間都引入非線性函數(shù)作為激活函數(shù),將線性組合轉(zhuǎn)化為非線性組合,而這種幾乎可以逼近任意函數(shù)。為了保證模型的收斂速度,選擇ReLU函數(shù)[8]作為激活函數(shù),函數(shù)表達(dá)式如下。
ReLU=max(0,x)
(5)
圖2 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
由于在實(shí)際訓(xùn)練樣本中,高速逃費(fèi)車輛與正常行駛車輛的比例相差巨大,數(shù)據(jù)存在巨大的不平衡性,導(dǎo)致算法模型因?yàn)閿?shù)據(jù)的不平衡性導(dǎo)致無法滿足實(shí)際分類要求,模型對于逃費(fèi)車輛識別的準(zhǔn)確率不太理想。對采取上采樣或下采樣方式,模型的效果都沒有太大改觀。
為了提升模型的分類準(zhǔn)確率,借用了殘差神經(jīng)網(wǎng)絡(luò)中的short_cut結(jié)構(gòu),增加到BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中,具體模型結(jié)構(gòu)如圖3所示。為了避免模型的過擬合,在模型訓(xùn)練中借用了機(jī)器學(xué)習(xí)中的L2正則。
圖3 BP+short_cut神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
經(jīng)過模型優(yōu)化處理后,模型的分類結(jié)果準(zhǔn)確率得到了巨大提升,模型的分類準(zhǔn)確率由86%左右提升到98%左右,具體模型的準(zhǔn)確率如表3所示。
表3 模型分類準(zhǔn)確率
高速逃費(fèi)監(jiān)測系統(tǒng)平臺應(yīng)用于某高速路公司,從平臺生成的風(fēng)險(xiǎn)名單中共選取了20輛車進(jìn)行實(shí)地系統(tǒng)驗(yàn)證,結(jié)合進(jìn)出站視頻圖像,實(shí)地取證了若干車輛。
從平臺提供的車輛名單中發(fā)現(xiàn)有大量改軸車、換貨、倒卡車輛……,其中,19輛車存在逃費(fèi)行為:改軸車輛:8輛;換卡逃費(fèi):6輛;換貨逃費(fèi):5輛;還有一輛車存在逃費(fèi)嫌疑,由于數(shù)據(jù)問題,并不能對其進(jìn)行逃費(fèi)定性。
如圖4所示,經(jīng)過實(shí)地驗(yàn)證,平臺提供的逃費(fèi)車輛名單準(zhǔn)確率非常高。
圖4 某高速路公司視頻
本文對BP神經(jīng)網(wǎng)絡(luò)以及BP神經(jīng)網(wǎng)絡(luò)的優(yōu)勢進(jìn)行簡要概述,并提出了如何運(yùn)用BP神經(jīng)網(wǎng)絡(luò)來識別高速逃費(fèi)車輛,有效地制止高速逃費(fèi)行為,維護(hù)高速交通的正常的運(yùn)營秩序,努力形成安全、便捷、高效、綠色、經(jīng)濟(jì)的綜合交通運(yùn)輸體系。