劉中飛,張 軍,邱荷婷
(首都經(jīng)濟貿(mào)易大學管理工程學院,北京100070)
隨著社會的發(fā)展以及國家政策的傾斜,人口的急速增長,越來越多的人都聚集在城市中,導致了城市交通的擁堵,特別是在大規(guī)模人群的城鄉(xiāng)結(jié)合部的區(qū)域。為了更好地控制城鄉(xiāng)結(jié)合部的交通,減少不必要的擁堵,用傳統(tǒng)的交通控制與疏散的方式在一定程度上是行不通的。所以,智慧交通應用而生。智慧交通的出現(xiàn),帶來了許多現(xiàn)代化的管理方式,并減少了大量人力物力的浪費,使得城市的交通變得更加的流暢,減少了城鄉(xiāng)結(jié)合部區(qū)域大量的擁堵問題。在智能交通中,數(shù)據(jù)挖掘有著無比關(guān)鍵的地位,是智能交通中最重要的一面??梢哉f,沒有數(shù)據(jù)挖掘技術(shù)的應用,就沒有智慧交通光明的未來。如果要想在城鄉(xiāng)結(jié)合部大幅度減少交通擁堵問題,就必須更加深入地理解數(shù)據(jù)挖掘技術(shù)。
數(shù)據(jù)挖掘是一個過程,主要是對大量的有噪聲的信息進行有效的提取,從中可以得到一個自己想要的數(shù)據(jù)[2]。在社會快速發(fā)展的今天,大量的數(shù)據(jù)在各行各業(yè)都急速的增長,廣泛可用的數(shù)據(jù)使得當今社會進入了數(shù)據(jù)時代,但是有許多的數(shù)據(jù)是無效的,要想從“數(shù)據(jù)海洋“中得到想要的數(shù)據(jù)是極其困難的一件事情,數(shù)據(jù)挖掘的重要性就凸顯出來了,數(shù)據(jù)挖掘的實際應用解決了這個問題,數(shù)據(jù)庫技術(shù)用于存儲和管理數(shù)據(jù),機器學習方法用于分析存儲的數(shù)據(jù),從而揭示了隱藏在海量數(shù)據(jù)中的大量“知識”。數(shù)據(jù)挖掘的技術(shù)可以挖掘以下幾種類型的模式:相關(guān)分析、聚類分析、離散點分析、關(guān)聯(lián)分析等。
相關(guān)分析:需要在分類和回歸之前繼續(xù)進行,可以分析、識別、分類、回歸相關(guān)的屬性,并忽略其他無關(guān)的屬性。
聚類分析:相似度很高的對象可以聚集在一起。這些對象中可以根據(jù)類內(nèi)相似度最大化和類內(nèi)相似度最小化的原理進行聚類或者進行分組。
離散點分析:在數(shù)據(jù)集中包含了許多對象,這些對象與數(shù)據(jù)集中其他對象的一般行為有不一致的地方,這些點就是離散點。因為一般的數(shù)據(jù)挖掘技術(shù)把離散點給剔除了,但是有些稀有事物比正常事物更有趣,更能吸引人們的注意力。因此,離散點數(shù)據(jù)分析被稱為離散點分析。
關(guān)聯(lián)分析:又稱為關(guān)聯(lián)規(guī)則。如果兩個或者多個事物之間存在某種關(guān)系,可以通過一個事物聯(lián)系到其他的事物,并可以對其他的事物進行預測。主要是挖掘兩者之間存在的隱藏的關(guān)系。其中,關(guān)聯(lián)分析又可以被進一步分為單維關(guān)聯(lián)規(guī)則和多維關(guān)聯(lián)規(guī)則這兩種類型。
這就是為什么數(shù)據(jù)挖掘技術(shù)在城鄉(xiāng)結(jié)合部區(qū)域的發(fā)展中起著關(guān)鍵性作用的原因,接下來需要對數(shù)據(jù)挖掘的技術(shù)進行深一步的分析,并將其應用于城鄉(xiāng)結(jié)合部的交通問題中。
近幾年以來,中國交通發(fā)展越來越好,交通環(huán)境得到了很好的改善,但是,交通安全方面的措施卻沒有得到很大的改變,中國道路環(huán)境沒有得到改變的根本原因是道路設計不規(guī)范、混合交通環(huán)境比較差以及一些安全措施不足等,這些問題在城鄉(xiāng)結(jié)合部尤為明顯。
隨著國家政策的傾斜,政府對城鄉(xiāng)結(jié)合部的關(guān)注越來越多。城鄉(xiāng)結(jié)合部是中國快速發(fā)展過程中的一個特色區(qū)域,是最活躍的區(qū)域。城鄉(xiāng)結(jié)合部具有距離市區(qū)較近、生活方便、信息流動速度快等多種優(yōu)勢,同時具有城市和農(nóng)村的優(yōu)勢,成為城市向外延展的重要窗口。但是,由于城鄉(xiāng)結(jié)合部人口眾多,人們的交通意識比較淡薄,人流量巨大,導致了大量交通事故的發(fā)生。
其中,在城鄉(xiāng)結(jié)合部地區(qū)道路設計不規(guī)范,人員眾多,且社會關(guān)系構(gòu)成較為復雜。在城鄉(xiāng)結(jié)合部,主要的交通工具有電動車、摩托車,不良習慣有無證駕駛、超速行駛、違章停車以及不系安全帶等具有安全隱患的問題[3],并且在城鄉(xiāng)結(jié)合部,社會管理較為滯后,經(jīng)濟管理混亂以及規(guī)劃管理無序。
針對城鄉(xiāng)結(jié)合部的種種難題,基于目前智能交通的大背景,將以大數(shù)據(jù)Hadoop技術(shù)的MapReduce計算中心和分布式數(shù)據(jù)庫HBase存儲融入到交通數(shù)據(jù)處理仿真平臺。
4.1.1 區(qū)域交通系統(tǒng)數(shù)據(jù)挖掘
將選取具有強大并行能力的Hadoop平臺,通過進行海量交通數(shù)據(jù)的分析,部署Hadoop集群,可以基于道路導航,使資源進行合理的分配,以此來改善有關(guān)道路的平衡問題。傳統(tǒng)的單機方法無法解決這樣的問題,未來解決這一類問題,可以借助Hadoop平臺,因為這個平臺具有強大的并行計算的能力,用此平臺可以對道路的情況進行各種判斷,此平臺也可以提供高效的存儲能力。
4.1.2 區(qū)域交通管理仿真平臺
將通過虛擬化技術(shù)構(gòu)建的服務器集群,為平臺的搭建提供基本的硬件資源。在此基礎上構(gòu)建以Cloud Foundry為基礎的PaaS平臺,可以通過使用Cloud Foundry的框架和通信機制來完成集成的任務,這其中包括了有關(guān)交通的海量數(shù)據(jù),可以將Hadoop的功能通過與Cloud Foundry平臺相結(jié)合,建立一個集中大數(shù)據(jù)存儲和處理的一個平臺,這個平臺可以滿足當前的數(shù)據(jù)訪問量以及業(yè)務計算的需求,這樣就為大數(shù)據(jù)構(gòu)建一個全新的交通仿真的平臺。
區(qū)域交通系統(tǒng)數(shù)據(jù)挖掘技術(shù)和區(qū)域交通管理仿真平臺擬解決城鄉(xiāng)結(jié)合部交通網(wǎng)絡的復雜性和動態(tài)性的問題、制約因素的輸入輸出機制問題以及數(shù)據(jù)計算瓶頸問題。
4.2.1 城鄉(xiāng)結(jié)合部交通網(wǎng)絡的復雜性和動態(tài)性問題
城鄉(xiāng)結(jié)合部的外部像“城”,內(nèi)部像“村”的復合型決定了區(qū)域交通網(wǎng)絡的復雜性,通過探索城鄉(xiāng)運輸網(wǎng)絡中各種瓶頸的產(chǎn)生及其傳播過程,并且找到交通擁堵的根本原因就是一個中心問題。
4.2.2 制約因素的輸入輸出機制問題
交通承載力包括了多種的力量:交通環(huán)境污染承載力、交通自然資源承載力以及交通心理承載力等,如何確定模型輸入輸出的變量是一個關(guān)鍵性問題,其中,合理的資源分配是重中之重,必須在交通擁堵和資源閑置之間找到一個平衡點。
4.2.3 數(shù)據(jù)計算瓶頸問題
隨著計算機網(wǎng)絡的快速發(fā)展以及在交通運輸領(lǐng)域的應用,日常需要處理的交通數(shù)據(jù)已經(jīng)呈現(xiàn)出大數(shù)據(jù)的許多特征。采用傳統(tǒng)的數(shù)據(jù)信息處理方式已經(jīng)遇到了計算分析的性能瓶頸。一方面,集中化的數(shù)據(jù)庫成為整個系統(tǒng)的突破口,數(shù)據(jù)的遞增,無疑給數(shù)據(jù)庫帶來了嚴峻的考驗;另一方面,隨著數(shù)據(jù)的遞增,數(shù)據(jù)計算的時長在急速地增加,越來越不適應海量數(shù)據(jù)對時間的要求。
隨著社會的發(fā)展,城鄉(xiāng)結(jié)合部是國家關(guān)注的重點,城鄉(xiāng)道路交通是城市管理最重要方面之一。加強城鄉(xiāng)交通狀況管理,維護城鄉(xiāng)交通秩序,是極其重要的一個點[4],且有利于推動城鄉(xiāng)結(jié)合部的發(fā)展,而城鄉(xiāng)結(jié)合部的發(fā)展符合國家政策的制定。但是發(fā)展不能急于求成,應結(jié)合中國的實際情況,并借鑒國外結(jié)合部發(fā)展的模式,以此來構(gòu)建中國城鄉(xiāng)結(jié)合部交通的發(fā)展[5]。