黃柏然
廣西博聯(lián)信息通信技術有限責任公司
基于數(shù)據(jù)挖掘技術的交通流量分析
黃柏然
廣西博聯(lián)信息通信技術有限責任公司
交通流量預測是研究智能交通系統(tǒng)的重要課題,通過交通流量預測方法對相關數(shù)據(jù)進行建模,預測未來交通流量,進一步更好地制定忙時交通分流預案,配備合適的運營資源。本文闡述了數(shù)據(jù)挖掘技術的主要方法以及交通流量預測與BP神經(jīng)網(wǎng)絡模型預測的主要步驟,對基于數(shù)據(jù)挖掘技術的交通流量進行了探討分析。
數(shù)據(jù)挖掘技術;交通流量預測;BP神經(jīng)網(wǎng)絡模型;Matlab軟件
隨著城市建設的不斷推進,促進了交通運輸?shù)陌l(fā)展,同時交通擁堵和事故、環(huán)境污染以及能源消耗問題越來越嚴重。為了保障交通運輸?shù)慕】蛋l(fā)展,必須加強交通流量預測的分析。
數(shù)據(jù)挖掘技術的主要方法:(1)聚類分析法。聚類分析是通過將數(shù)據(jù)對象進行聚類分組,然后形成板塊,將毫無邏輯的數(shù)據(jù)變成了有聯(lián)系性的分組數(shù)據(jù),然后從其中獲取具有一定價值的數(shù)據(jù)內容進行進一步的利用。由于這種分析方法不能夠較好的就數(shù)據(jù)類別、屬性進行分類,所以聚類分析法一般都運用在心理學、統(tǒng)計學、數(shù)據(jù)識別等方面。(2)人工神經(jīng)網(wǎng)絡。人工神經(jīng)網(wǎng)絡是通過大批量的數(shù)據(jù)進行分析,而這種數(shù)據(jù)分析方式本身是建立在一定的數(shù)據(jù)模型基礎上的,因此通常都可以隨時根據(jù)數(shù)據(jù)需求進行分類,所以人工神經(jīng)網(wǎng)絡也是當下數(shù)據(jù)挖掘技術中最常用的一種數(shù)據(jù)分析方式之一。(3)關聯(lián)性分析法。有時數(shù)據(jù)本身存在一定的隱蔽性使得很難通過普通的數(shù)據(jù)分析法進行數(shù)據(jù)挖掘和利用,這就需要通過關聯(lián)性分析法完成對于數(shù)據(jù)信息的關聯(lián)性識別,來幫助人力完成對于數(shù)據(jù)分辨的任務,這種數(shù)據(jù)分析方法通常是帶著某種目的性進行的,因此比較適用于對數(shù)據(jù)精準度相對較高的信息管理工作。(4)特征性數(shù)據(jù)分析法。網(wǎng)絡數(shù)據(jù)隨著信息時代的到來變成了數(shù)據(jù)爆炸式,其數(shù)據(jù)資源十分廣泛并且得到了一定的普及,如何就網(wǎng)絡爆炸式數(shù)據(jù)進行關于特性的分類就成為了當下數(shù)據(jù)整理分類的主要內容。在上文中提到的人工神經(jīng)網(wǎng)絡數(shù)據(jù)分析也屬于這其中的一種,此外還有很多方法都是通過計算機來進行虛擬數(shù)據(jù)的分類,尋找數(shù)據(jù)之間存在的普遍規(guī)律性完成數(shù)據(jù)的特性分析從而進行進一步分類。
1、交通流量預測的分析?,F(xiàn)有短時交通流量預測方法大致可以分為:第一、以數(shù)理統(tǒng)計和微積分等傳統(tǒng)數(shù)學和物理方法為基礎的,其主要包括早期的歷史平均模型,自回歸滑動平均模型(ARMA),以及后來研究的更復雜、更精度的多元回歸模型,Kalman濾波模型,ARIMA模型等;第二、無數(shù)學模型的預測方法,其需要自己建立新的算法來實現(xiàn),主要方法有非參數(shù)回歸,譜分析法,基于小波理論的方法,神經(jīng)網(wǎng)絡等。
2、BP神經(jīng)網(wǎng)絡模型預測的主要步驟。BP神經(jīng)網(wǎng)絡模型把一組樣本的I/O的輸入輸出問題轉化一個非線性優(yōu)化的問題,其實際是優(yōu)化中梯度下降法。假如把這種神經(jīng)網(wǎng)絡的看作是從輸入層到輸出層的映射,則這個映射是一個高度非線性得關系。
首先是要對訓練樣本進行選取和預處理,結合研究狀況以及目標,選取合適的訓練樣本和檢驗樣本,由于BP神經(jīng)網(wǎng)絡各層轉換函數(shù)以及學習規(guī)則是不同的,所以在輸入樣本之前要對輸入的樣本作預處理;然后再去確定建造BP網(wǎng)絡的結構,這包括變量的選取,隱層和隱層節(jié)點數(shù)的選取等問題;把輸入樣本輸入到BP神經(jīng)網(wǎng)絡模型中,再進行仿真訓練;而后預測出該網(wǎng)絡的輸出值,再拿該期望值與實際輸出進行比較,根據(jù)誤差去反復的修改誤差,從而改變權值以及閾值,直到誤差一個可接受的范圍,完了再用檢驗樣本進行對比,判斷結果;然后對結果進行比較分析,最后認可該網(wǎng)絡模型的算法,就可以對未來交通流量進行精確地預測。
BP神經(jīng)網(wǎng)絡的設計:首先是對模型的建立、數(shù)據(jù)采集并且預處理,然后對輸入到模型特征向量的數(shù)據(jù)進行預測、通過預測的數(shù)值去判斷是否符合實際數(shù)值等。該模型網(wǎng)絡的建立是整個系統(tǒng)是否成功的關鍵,并且只要選擇的數(shù)據(jù)完備、可靠、準確,才有可能得到符合預測的網(wǎng)絡模型。數(shù)據(jù)的采取需要有實時的數(shù)據(jù)采集系統(tǒng)。事實上預處理的過程要求根據(jù)數(shù)據(jù)的實際情況進行預處理,本文研究的交通流量數(shù)據(jù)都是來自交通監(jiān)控部門,故具有完備的、一致的,因此要首先要對其進行數(shù)據(jù)變換。對于系統(tǒng)的輸出數(shù)值是否滿足實際數(shù)值,只要將其所得到的預測值和數(shù)學期望值進行比較,所得的數(shù)值滿足在數(shù)學期望值的附近且其誤差值小于預先設定的誤差值時,就可以認為該系統(tǒng)可以成功預測交通流量,可以先把它記下來;反之,認為將得不到合適的數(shù)值,需要不斷的改變權值。
對輸入到網(wǎng)絡模型特征向量數(shù)據(jù)進行預測:首先建立合適的網(wǎng)絡模型,將對應的交通流量的特征向量數(shù)據(jù)預處理后,輸入到網(wǎng)絡進行訓練,仿真訓練結束后,用檢驗樣本的特征向量進行檢驗,然后用最后一組數(shù)據(jù)對該模型測試,分析其模型的實際是否有效,判斷其是否是符合實際交通流量預測的模型。只要特征向量的數(shù)值的選擇較為合適,就有可能建立起較為合適的模型,可以用此來對交通流量進行預測。所以BP神經(jīng)網(wǎng)絡應用于交通流量的預測中是可行的。
應用BP神經(jīng)網(wǎng)絡的交通流量預測模型建立可以知道,在應用BP神經(jīng)網(wǎng)絡解決現(xiàn)實存在的問題中,網(wǎng)絡結構參數(shù)的確定,訓練算法和參數(shù)的選取,只能通過大量的科學實驗,最后通過計算獲得,這占用了大量編程人員的大量時間和精力,然而Matlab軟件提供了這些便捷,其提供了現(xiàn)成的神經(jīng)網(wǎng)絡工具箱,即是它擁有這方面大量地函數(shù)庫。Matlab軟件的神經(jīng)網(wǎng)絡工具箱應該是囊括了現(xiàn)在所有的網(wǎng)絡模型,例如:徑向基函數(shù)網(wǎng)絡,BP網(wǎng)絡,線性網(wǎng)絡,感知器等等網(wǎng)絡模型。對于這些模型,Matlab軟件中的庫函數(shù)提供了大量地算法模型。
城市化建設進程的加快,使得交通運輸問題日趨增多;而交通流量的預測可以對現(xiàn)有的交通設施進行合理利用,有效緩解交通擁堵現(xiàn)象,降低交通事故發(fā)生率,從而保障交通運輸?shù)氖孢m安全。
[1]陳建偉,李麗坤.數(shù)據(jù)挖掘技術研究[J].數(shù)字技術與應用,2016(01)
[2]段冰.基于DE-BP神經(jīng)網(wǎng)絡模型的旅游客源預測[J].價值工程,2010(34)
[3]高海峰.智能交通系統(tǒng)中數(shù)據(jù)挖掘技術的應用研究[J].數(shù)字技術與應用,2016(05)