孫馬馳
摘 要:21世紀(jì)以來,人們在時代進(jìn)步和發(fā)展過程中不知不覺地進(jìn)入了信息時代。在信息時代,大量數(shù)據(jù)進(jìn)入新時代。在數(shù)據(jù)時代,人們?nèi)匀黄惹幸筇岣呱a(chǎn)和生活質(zhì)量。智能交通的發(fā)展要滿足人們的生活和現(xiàn)實(shí)社會的需求,大量的信息和數(shù)據(jù)在智能交通的建設(shè)中也發(fā)生了變化和增加了難度。高效便捷的智能交通系統(tǒng)已成為當(dāng)今大數(shù)據(jù)時代研究的主題。本文從智能交通方式在大數(shù)據(jù)時代下發(fā)生的變化、大數(shù)據(jù)的融合給智能交通帶來的優(yōu)劣勢以及帶來的問題與挑戰(zhàn)出發(fā)探究大數(shù)據(jù)背景下智能交通系統(tǒng)的發(fā)展。
關(guān)鍵詞:智能交通;大數(shù)據(jù);應(yīng)用;發(fā)展
一、緒論
大數(shù)據(jù)時代已經(jīng)到來。這無疑對城市交通來說,既是機(jī)遇又是挑戰(zhàn)。作為主要支柱的城市交通在傳統(tǒng)的交通方式中具有根本性作用。大數(shù)據(jù)時代的特點(diǎn)人們用四個V字符開頭的英文單詞Velocity,Variety,Volume和Value等詞匯表達(dá)??焖傩院涂深A(yù)測性的大數(shù)據(jù)能使得交通預(yù)測的水平提升。未來的交通運(yùn)行狀態(tài)、驗證可行性的技術(shù)方案依靠各個部門提供的有效數(shù)據(jù)進(jìn)行精準(zhǔn)提煉和建構(gòu)合適的交通預(yù)測模型進(jìn)行有效模擬。而在實(shí)時交通預(yù)測領(lǐng)域,車輛碰撞、車輛換道、檢測車輛駕駛員行為狀態(tài)可以依靠大數(shù)據(jù)的快速信息處理能力進(jìn)行實(shí)時預(yù)測。在大數(shù)據(jù)時代,城市交通和大數(shù)據(jù)將不可避免地冗合在各個環(huán)節(jié)。大數(shù)據(jù)帶來的技術(shù)突破將城市交通推向一個全面的信息時代。
二、智能交通在大數(shù)據(jù)時代下發(fā)生的變化和帶來的優(yōu)劣勢
(一)傳統(tǒng)公共交通管理在大數(shù)據(jù)時代變化的途徑
大數(shù)據(jù)可能會超出管理區(qū)域的限制。行政區(qū)劃的劃分是國家劃分為不同的行政區(qū)域進(jìn)行有效的規(guī)則和管理,同時也帶動地方政府追求各自轄區(qū)利益最大化,將各類用戶可能使用的交通數(shù)據(jù)整合到系統(tǒng)中,利用整體交通功能建立公交信息綜合利用模式。為解決實(shí)時交通障礙,需要將大數(shù)據(jù)集成起來檢索、利用和分析來提取相關(guān)信息滿足交通需求。
名古屋市中心京都地區(qū)從1970年到2004年汽車分流比呈現(xiàn)上升趨勢,而公共汽車和鐵路呈現(xiàn)下降趨勢,城市交通模式與公共交通發(fā)展方向不一致。
(二)數(shù)據(jù)遷移問題
近年來,互聯(lián)網(wǎng),云計算等技術(shù)的快速發(fā)展,越來越多的個人和企業(yè)選擇將大量信息數(shù)據(jù)業(yè)務(wù)轉(zhuǎn)移到服務(wù)優(yōu)勢和技術(shù)優(yōu)勢明顯的云計算平臺。規(guī)?;臄?shù)據(jù)中心將減少本地硬件的投資和維護(hù)成本,還能確保安全性。但是,我們知道Chao Daoo的數(shù)據(jù)遷移并不那么容易。它必須得到可行、可靠和安全的技術(shù)解決方案的支持。一旦出現(xiàn)錯誤將出現(xiàn)安全危險,進(jìn)而影響現(xiàn)實(shí)社會和實(shí)體經(jīng)濟(jì)。此外,為了實(shí)現(xiàn)大規(guī)模數(shù)據(jù)遷移任務(wù),必須保證傳輸技術(shù)支持大帶寬的有效空間。帶寬技術(shù)的發(fā)展目前雖然發(fā)展迅速,但隨著大數(shù)據(jù)時代的到來,其發(fā)展速度已經(jīng)與大量海域信息傳輸?shù)囊蟛秸{(diào)落后,以至于其可能成為數(shù)據(jù)遷移的障礙。
(三)大數(shù)據(jù)下智能交通的劣勢
大數(shù)據(jù)的擴(kuò)張加速了信息傳遞和共享的速度。大數(shù)據(jù)管理系統(tǒng)使可以使用擁有交通數(shù)據(jù)的交通部門、交警部門的相關(guān)數(shù)據(jù)。然而系統(tǒng)的計數(shù)功能無法被除人以外的任何其他功能檢索到以靜態(tài)格式存儲的計算交通數(shù)據(jù)。用智能手機(jī)、傳感器和機(jī)載車輛不斷收集、交流和處理移動數(shù)據(jù),例如交通狀況和天氣狀況,這是交通數(shù)據(jù)的目標(biāo)。
三、智能交通在大數(shù)據(jù)時代下產(chǎn)生的問題與挑戰(zhàn)
(一)數(shù)據(jù)綜合體
目前,像浮動車數(shù)據(jù)、智能交通卡之類的信息數(shù)據(jù)也已經(jīng)廣泛分布在信息處理與記錄領(lǐng)域。例如城市中有20000輛車輛,由20000車輛軌跡產(chǎn)生的實(shí)時傳輸記錄能夠生成的平均數(shù)據(jù)長度為50B。這樣每天就能生成4.75 GB的數(shù)據(jù)。如果加入視頻、圖像、音頻,那么整個數(shù)據(jù)系統(tǒng)將具有更復(fù)雜、經(jīng)歷動態(tài)和不確定的變化的相互關(guān)聯(lián)關(guān)系,從而產(chǎn)生錯綜復(fù)雜并且難以處理的數(shù)據(jù)關(guān)聯(lián)模型。
(二)實(shí)時數(shù)據(jù)接收
交通領(lǐng)域在現(xiàn)代智能交通的發(fā)展過程中呈現(xiàn)出動態(tài)多方向發(fā)展。在網(wǎng)上大量的數(shù)據(jù)被接受、記錄和處理,這是現(xiàn)代智能交通的發(fā)展需要。例如在交通領(lǐng)域,出租車在行駛以及停放位置的軌跡數(shù)據(jù)記錄、長途客車駕駛員在駕駛時的軌跡數(shù)據(jù)記錄、公務(wù)車輛外出辦理業(yè)務(wù)或者出差時的駕駛軌跡記錄以及出租車在與乘客進(jìn)行交易時的交易信息數(shù)據(jù)記錄也需要大量的實(shí)時接收、記錄和處理。
(三)海量數(shù)據(jù)的計算
大數(shù)據(jù)的計算和處理要求繁瑣且對數(shù)據(jù)要求嚴(yán)格,傳統(tǒng)的計算和處理方法已經(jīng)不能滿足。密集計算和新的計算模型能打破傳統(tǒng)的思維模式保證大數(shù)據(jù)的計算和處理。大數(shù)據(jù)時代的數(shù)據(jù)計算需要自下而上的以數(shù)據(jù)為中心的計算模型代替自頂向下的集中式模型。該模型在技術(shù)上的支持離不開數(shù)據(jù)計算效率的評估方法和數(shù)據(jù)計算復(fù)雜度的基礎(chǔ)研究理論。
(四)大數(shù)據(jù)帶給城市交通環(huán)境的挑戰(zhàn)
大數(shù)據(jù)環(huán)境給城市交通帶來信息密度較低,存在一定的不確定性的變化;單一的數(shù)據(jù)源不能完整的描述圖像,只能從某一角度對圖像的某一個特征進(jìn)行描述;來源不一樣的數(shù)據(jù)源因參考系統(tǒng)的選取不同而得到不一樣的錯誤分布結(jié)論;關(guān)注更多地數(shù)據(jù)之間的聯(lián)系分析以發(fā)現(xiàn)新的知識和法律。因此,以上海為例,城市擴(kuò)張給交通帶來了新的挑戰(zhàn):“上海社會經(jīng)濟(jì)發(fā)展與城市交通之間的關(guān)系進(jìn)行研究”。2030年國內(nèi)生產(chǎn)總值總量達(dá)6720億元,比2010年多3倍;2020年職位總數(shù)規(guī)模達(dá)到1430-1550萬人,比目前高出26%;常住人口:2020年為2800萬,2030年為3000萬;流動人口2020年將達(dá)到250萬,比目前多26萬。中心城市規(guī)模仍在擴(kuò)大:“十一五”期間,中心城區(qū)建設(shè)量將增加2000萬平方米每年,建筑物開發(fā)量將接近4.5億平方米。常住人口表現(xiàn)出向中心地區(qū)蔓延的趨勢。從2009年開始,計劃發(fā)展可容納300萬人的面積達(dá)70平方公里的2批38個大型住宅社區(qū)。
四、智能交通海量數(shù)據(jù)平臺
(一)數(shù)據(jù)密集型戰(zhàn)略控制分析的技術(shù)路徑
從本質(zhì)上講,大數(shù)據(jù)背景下的流量分析技術(shù)是一種信息處理過程,它將數(shù)據(jù)組織成信息,從信息中提取特征,從特征變化中找出模式,并跟蹤對策措施。系統(tǒng)狀態(tài)分析和交通行為分析是模型處理問題的兩個基本的部分。(圖1:戰(zhàn)略監(jiān)管的技術(shù)應(yīng)用框架)
(二)系統(tǒng)架構(gòu)
現(xiàn)代智能交通離不開大數(shù)據(jù),結(jié)合典型的云計算平臺架構(gòu)的基本結(jié)構(gòu),智能交通平臺海量數(shù)據(jù)架構(gòu)可以分為三個主要部分:數(shù)據(jù)采集層、數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)服務(wù)層。數(shù)據(jù)采集層是收集所有需要處理的數(shù)據(jù)信息,智能交通系統(tǒng)通過數(shù)據(jù)傳輸?shù)浇煌ㄔ破脚_來獲得數(shù)據(jù),根據(jù)應(yīng)用需求不同在云平臺將其分門別類并存儲在相對應(yīng)的內(nèi)存數(shù)據(jù)庫內(nèi)存當(dāng)中,根據(jù)處理后的因地制宜的需求選擇不同的數(shù)據(jù)體系結(jié)構(gòu)層進(jìn)行相應(yīng)的處理,最后為數(shù)據(jù)服務(wù)層提供實(shí)時、快捷、高效的服務(wù)。
(三)遷移數(shù)據(jù)計劃
為了讓數(shù)據(jù)的統(tǒng)計分析更加準(zhǔn)確,我們必須允許存儲在現(xiàn)有智能交通數(shù)據(jù)的關(guān)聯(lián)數(shù)據(jù)庫中的歷史數(shù)據(jù)遷移到大數(shù)據(jù)平臺。經(jīng)過反復(fù)實(shí)驗,由于oracle可以直接使用開源工具Sqoop數(shù)據(jù)傳輸數(shù)據(jù)到HDFS中,因而最好的解決方案是打開數(shù)據(jù)庫數(shù)據(jù)瀏覽端口,只是它的傳輸速度是在網(wǎng)絡(luò)帶寬的限制下運(yùn)行處理的。該方案在實(shí)際實(shí)驗過程中安全性能有保障,在測試中一直在維護(hù)其安全性。Sqoop是在Hadoop和關(guān)系數(shù)據(jù)庫之間傳輸數(shù)據(jù)的工具。它可以將數(shù)據(jù)從關(guān)系數(shù)據(jù)庫和Hadoop的HDFS和關(guān)系數(shù)據(jù)庫之間來回傳輸導(dǎo)入轉(zhuǎn)移到數(shù)據(jù)庫中。
(四)存儲數(shù)據(jù)計劃
包括海量數(shù)據(jù)存儲功能和大量的數(shù)據(jù)計算功能的系統(tǒng)架構(gòu)必須保證數(shù)據(jù)存儲和數(shù)據(jù)計算是不可分割的,這是任何信息數(shù)據(jù)計算系統(tǒng)的共性。為了確保該函數(shù)的實(shí)現(xiàn),這要求通信客戶端可以確保數(shù)據(jù)源層中收集的數(shù)據(jù)不會丟失,并且可以不丟失地發(fā)送到云平臺。在傳輸過程中,系統(tǒng)的存儲功能需要保持所有數(shù)據(jù)一致性并在保存中長久不失真。在正常情況下,上傳文件的請求信號被系統(tǒng)平臺接收。這樣,為了讓數(shù)據(jù)持久性存儲,云平臺上的Hadoop集群分配檢驗開始的工作任務(wù),然后將需要被處理的數(shù)據(jù)文件塊上傳到HDFS中的HBase分布式數(shù)據(jù)庫。多個任務(wù)被上傳的時候,JobTracker就會分配任務(wù)并在架構(gòu)層配置各種工具來保證存儲的完整性。存儲模塊在此時開啟數(shù)據(jù)處理,并相應(yīng)地分析任務(wù)的來源及可靠性。
(五)數(shù)據(jù)倉庫系統(tǒng)
數(shù)據(jù)倉庫系統(tǒng)是在構(gòu)建智能交通大數(shù)據(jù)系統(tǒng)平臺的過程中的重要組成部分。在現(xiàn)有數(shù)據(jù)倉庫系統(tǒng)的基礎(chǔ)上對數(shù)據(jù)倉庫系統(tǒng)審查智能交通數(shù)據(jù),以下功能是必備的:(1)高度的可擴(kuò)展性:面對現(xiàn)代交通發(fā)展數(shù)據(jù)的大爆炸趨勢,數(shù)據(jù)庫不再依靠一臺或多臺服務(wù)器進(jìn)行擴(kuò)展,以滿足數(shù)據(jù)量的指數(shù)增長。我們必須能夠輕松實(shí)現(xiàn)高擴(kuò)展性的線路目標(biāo)。(2)高度容錯性:現(xiàn)代智能交通大數(shù)據(jù)系統(tǒng)的數(shù)據(jù)來源多且雜,應(yīng)該高度允許出現(xiàn)差錯。容錯要求在系統(tǒng)查詢執(zhí)行中在某一節(jié)點(diǎn)運(yùn)行中出現(xiàn)故障時,不需要重新運(yùn)行查詢這一步驟,只有這樣才能滿足現(xiàn)代智能交通數(shù)據(jù)的實(shí)時交通信息查詢快捷性的要求。因此,考慮使用軟件在大型集群環(huán)境中實(shí)現(xiàn)容錯,而不是依賴于系統(tǒng)硬件,這一點(diǎn)很重要。
(六)處理數(shù)據(jù)計劃
數(shù)據(jù)處理以滿足不同的需求,這是現(xiàn)代智能交通領(lǐng)域大數(shù)據(jù)系統(tǒng)平臺的心臟。一般系統(tǒng)的數(shù)據(jù)處理應(yīng)用不同應(yīng)用程序的需求是基于統(tǒng)計應(yīng)用程序?qū)崟r分離的基礎(chǔ)之上的。該模塊采用同步計算和增量計算方法,保證系統(tǒng)數(shù)據(jù)的完整、精確和實(shí)時處理。這個過程中使用的關(guān)鍵技術(shù)包括:
(1)軌跡數(shù)據(jù)快速檢索技術(shù):該技術(shù)的核心是原始數(shù)據(jù)被SeqIlence Fries二進(jìn)制文件替換,并將鍵值存儲設(shè)計為一個記錄。此外,以前的關(guān)系數(shù)據(jù)庫查找來實(shí)現(xiàn)快速的統(tǒng)計功能被HDF分布式文件系統(tǒng)和MapReduce分布式計算編程所代替。該技術(shù)的數(shù)據(jù)壓縮率可達(dá)40%,運(yùn)行速度可提高50倍以上。因此,可以實(shí)現(xiàn)固化數(shù)據(jù)的快速檢索和統(tǒng)計分析。
(2)分布式軌跡聚類技術(shù):技術(shù)采用MapReduce分布式計算架構(gòu)來處理分布式軌跡,實(shí)現(xiàn)K.Means聚類算法。通常,它將指定起點(diǎn)位置,然后可以使用正常運(yùn)行路徑的聚類分析來快速檢測異常值以實(shí)現(xiàn)分布式軌跡的正則化。這種技術(shù)通??梢钥焖俚乇容^常規(guī)路線或指定路線,以及異常分析的比較。
(3)地圖匹配技術(shù):該技術(shù)通過對來源于傳感器的觀測數(shù)據(jù)進(jìn)行分析來確定傳感器的載體位置。在智能交通領(lǐng)域,通用傳感器其實(shí)就是我們常說的GPS接收機(jī)。這是因為GPS接收機(jī)能夠向我們提供諸如經(jīng)緯度、坐標(biāo)等地理位置信息,并且在許多領(lǐng)域已經(jīng)得到應(yīng)用。大多數(shù)車載GPS接收機(jī)的實(shí)際意義在于保證車輛在正確道路行駛。因此,它在車輛實(shí)時導(dǎo)航系統(tǒng)中發(fā)揮著至關(guān)重要的作用。
五、結(jié)論
無論是今天還是在未來,大數(shù)據(jù)在智能交通中的應(yīng)用離不開現(xiàn)在已經(jīng)構(gòu)建了海量數(shù)據(jù)平臺的云計算等大數(shù)據(jù)處理技術(shù)和平臺進(jìn)行數(shù)據(jù)的收集、接受和處理等。只有充分利用大數(shù)據(jù)平臺才能防止海量數(shù)據(jù)的突現(xiàn)。在大數(shù)據(jù)時代下開發(fā)利用現(xiàn)代交通,會讓智能交通更加快速地發(fā)展,也將為公眾在創(chuàng)造更加美好的生活的途中提供更加便捷、高效、綠色、安全的出行環(huán)境。因此,從系統(tǒng)架構(gòu)的確定、遷移數(shù)據(jù)計劃的確定、數(shù)據(jù)計劃的存儲以及確定數(shù)據(jù)處理計劃入手來做好海量數(shù)據(jù)平臺建設(shè),并保證其能夠在今天在未來的可持續(xù)發(fā)展,來建立一個智能、高效、便捷的智能交通系統(tǒng)。
參考文獻(xiàn):
[1]邱衛(wèi)云.智能交通大數(shù)據(jù)分析云平臺技術(shù)[J].中國交通信息化,2013.
[2]姬倩倩,溫浩宇.公共交通大數(shù)據(jù)平臺架構(gòu)研究[J].電子科技,2015.
[3]韓歡.基于大數(shù)據(jù)的智能交通運(yùn)輸平臺的研究[D].成都理工大學(xué),2014.