譚曉艷
摘要:交通大數(shù)據(jù)是智能交通系統(tǒng)發(fā)展的必然結(jié)果,可視分析技術(shù)為我們提供了一種直觀有效的方法,它將復(fù)雜的交通數(shù)據(jù)及其分析結(jié)果通過可視化方式直觀地展現(xiàn)出來并支持對結(jié)果的交互式篩選和瀏覽,進(jìn)一步加強(qiáng)對其的研究非常有必要,從而提高大數(shù)據(jù)的利用率?;诖吮疚姆治隽私煌ù髷?shù)據(jù)可視分析。
關(guān)鍵詞:交通;大數(shù)據(jù);可視分析
1、交通大數(shù)據(jù)可視化流程中的核心要素
數(shù)據(jù)可視化流程中的核心要素包括3個(gè)方面。
1.1數(shù)據(jù)表示與變換
數(shù)據(jù)可視化的基礎(chǔ)是數(shù)據(jù)表示和變換。為了允許有效的可視化、分析和記錄,輸入數(shù)據(jù)必須從原始狀態(tài)變換到一種便于計(jì)算機(jī)處理的結(jié)構(gòu)化數(shù)據(jù)表示形式。通常這些結(jié)構(gòu)存在于數(shù)據(jù)本身,需要研究有效的數(shù)據(jù)提煉或簡化方法以最大程度地保持信息和知識(shí)的內(nèi)涵及相應(yīng)的上下文。
1.2數(shù)據(jù)的可視化呈現(xiàn)
將數(shù)據(jù)以一種生動(dòng)直觀,容易理解和方便操作的方式呈現(xiàn)給用戶,才能向用戶傳播準(zhǔn)確有效而有價(jià)值的信息。然而數(shù)據(jù)的呈現(xiàn)方式有多種多樣,如何有效地從眾多多樣性呈現(xiàn)方式中選擇出最佳的視覺編碼形式是數(shù)據(jù)可視化的重要任務(wù)。判斷一個(gè)視覺編碼是否符合可視化呈現(xiàn)的因素包括很多方面,如數(shù)據(jù)本身的屬性以及用戶感知與認(rèn)知系統(tǒng)的特性等。大量的數(shù)據(jù)采集通常是以流的形式實(shí)時(shí)獲取的,針對靜態(tài)數(shù)據(jù)發(fā)展起來的可視化顯示方法不能直接拓展到動(dòng)態(tài)數(shù)據(jù)。
1.3用戶交互
對數(shù)據(jù)進(jìn)行可視化和分析的最終目的是解決特定的任務(wù),這些目標(biāo)任務(wù)通常有生成假設(shè)、驗(yàn)證假設(shè)和視覺呈現(xiàn)三類任務(wù)。數(shù)據(jù)可視化可以用于從數(shù)據(jù)中探索新的假設(shè),也可以證實(shí)相關(guān)假設(shè)與數(shù)據(jù)是否吻合,還可以幫助數(shù)據(jù)專家向公眾展示其中的信息。交互是通過可視的手段輔助分析決策的直接推動(dòng)力。
2、交通大數(shù)據(jù)可視方法
大數(shù)據(jù)可視化技術(shù)分為科學(xué)可視化和信息可視化,信息可視化在挖掘信息等方面扮演著重要的作用。信息可視化是將數(shù)據(jù)信息轉(zhuǎn)化為視覺形式的過程,增強(qiáng)數(shù)據(jù)顯示效果,使用戶直觀的觀察和瀏覽數(shù)據(jù),從而發(fā)現(xiàn)數(shù)據(jù)中隱藏的特性、模式以及規(guī)律。早期的可視化主要使用簡單的圖表將復(fù)雜的數(shù)據(jù)簡化,而進(jìn)入20世紀(jì),隨著計(jì)算機(jī)技術(shù)的發(fā)展、處理數(shù)據(jù)能力的提升,用戶可以使用更多的可視化方法觀察自己的數(shù)據(jù),主要領(lǐng)域有數(shù)據(jù)挖掘可視化、網(wǎng)絡(luò)數(shù)據(jù)可視化、社交可視化、交通可視化、文本可視化、生物醫(yī)藥可視化等。
2.1平行坐標(biāo)系
多維數(shù)據(jù)是指研究的對象具有三個(gè)屬性以上的數(shù)據(jù)。多維數(shù)據(jù)難以在平面或空間中建立模型,因此人們對多維數(shù)據(jù)的認(rèn)知也相對困難。但由于多維數(shù)據(jù)分析可以揭示不同維度屬性間的隱藏關(guān)系,所以近年對多維可視化的研究成為熱點(diǎn)。其中,平行坐標(biāo)系為研究應(yīng)用較廣泛的多維可視化技術(shù)。
2.2熱力圖
熱力圖是用一個(gè)帶有顏色的數(shù)據(jù)矩陣表示圖形。起初,熱力圖是由軟件設(shè)計(jì)師CormacKinney在1991年首先提出并注冊,用二維矩陣顯示描述金融市場信息。隨著熱力圖的發(fā)展,呈現(xiàn)了很多不同種類的熱力圖:網(wǎng)絡(luò)熱力圖、生物熱力圖、樹圖等。使用熱力圖可以直觀、清晰的看到數(shù)據(jù)隨著時(shí)間或地理位置的變化狀態(tài),無需任何分析經(jīng)驗(yàn)。熱力圖中的每個(gè)熱力點(diǎn)(HeatPoint)由三個(gè)部分組成(X,Y,Weight),每一個(gè)熱點(diǎn)都有一個(gè)位置和權(quán)重,權(quán)重越大,該點(diǎn)越顯著,也就代表漸變的一個(gè)衰變因素。熱力圖的實(shí)現(xiàn):統(tǒng)計(jì)篩選所有點(diǎn),根據(jù)權(quán)重值和范圍值算法計(jì)算權(quán)重值,并獲取最大和最小權(quán)重的熱力點(diǎn);對照顏色表,采用具體的插值算法獲取權(quán)重值對應(yīng)的顏色。
2.3漏斗圖
漏斗圖為數(shù)據(jù)可視化的一種表達(dá)方式,在GoogleAnalytics中表示目標(biāo)和渠道,在WebTrends中代表場景分析,在Omniture的SiteCatalyst里則為產(chǎn)品轉(zhuǎn)換漏斗。漏斗圖適用于業(yè)務(wù)流程比較規(guī)范、周期長、環(huán)節(jié)多的流程分析,通過漏斗圖各環(huán)節(jié)數(shù)據(jù)的比較,能夠直觀的發(fā)現(xiàn)和說明問題所在。使用漏斗圖進(jìn)行分析的場景有電商代表的網(wǎng)站、營銷推廣等,它具有快速發(fā)現(xiàn)問題、直觀展示兩端數(shù)據(jù)、提高業(yè)務(wù)轉(zhuǎn)化率、提高最終轉(zhuǎn)化率等特點(diǎn)。將漏斗圖應(yīng)用于交通流量數(shù)據(jù)中,統(tǒng)計(jì)交通地感線圈的總流量,按照流量的大小依次遞減分布,顏色的深淺也表示流量的多少,增強(qiáng)表示了地感線圈流量的排列。獲取一定的時(shí)間段中每條路總流量分布情況,了解哪條上車流量較多,哪條路上車流量較少。
3、交通數(shù)據(jù)可視化平臺(tái)系統(tǒng)應(yīng)用
3.1數(shù)據(jù)存儲(chǔ)
數(shù)據(jù)處理是交通數(shù)據(jù)可視化分析的基礎(chǔ),為數(shù)據(jù)分析可視化提供可靠的數(shù)據(jù)來源,從兩部分對數(shù)據(jù)進(jìn)行處理:數(shù)據(jù)庫中提取數(shù)據(jù)、交通數(shù)據(jù)預(yù)處理。從數(shù)據(jù)庫中提取原始數(shù)據(jù)需要根據(jù)時(shí)間、空間的需要進(jìn)行篩選,構(gòu)建相應(yīng)的python語句查詢滿足要求的數(shù)據(jù)。本文使用的數(shù)據(jù)庫為MongoDB,該數(shù)據(jù)庫有高性能、易部署、存儲(chǔ)方便、模式自由等特點(diǎn),是一個(gè)基于分布式文件存儲(chǔ)的數(shù)據(jù)庫。將結(jié)構(gòu)化、非結(jié)構(gòu)化的交通數(shù)據(jù)存儲(chǔ)在MongoDB數(shù)據(jù)庫中,從而可以對數(shù)據(jù)進(jìn)行查詢、搜索、分析等操作。
3.2邏輯處理
邏輯處理是使用交通數(shù)據(jù)對不同應(yīng)用進(jìn)行分析的過程,包括交通狀態(tài)、擁堵路段的判斷,上下客熱點(diǎn)區(qū)域的聚類,具體的理論過程已在第三、四章中進(jìn)行了描述。
3.3可視分析
可視分析為原型系統(tǒng)的展示部分,定義各個(gè)可視化組件的交互事件,實(shí)現(xiàn)了組件之間的交互協(xié)同,實(shí)現(xiàn)不同組件間的交互作用,更好的實(shí)現(xiàn)交通數(shù)據(jù)的可視化。
3.4交通狀態(tài)判別的指標(biāo)
交通狀態(tài)判別是判斷交通道路的狀態(tài)是暢通、輕微擁堵、擁堵或是嚴(yán)重?fù)矶?。本質(zhì)上,交通狀態(tài)判斷是對道路擁擠程度的判斷。而擁堵狀態(tài)可以分為偶然發(fā)生的擁堵和經(jīng)常發(fā)生的擁堵。偶然發(fā)生的擁堵一般由交通事件引起的不定時(shí)、不定點(diǎn)的擁堵,如大型活動(dòng)(足球賽、演唱會(huì)等)、突發(fā)交通事故、惡劣的天氣、道路施工養(yǎng)護(hù)等。雖然偶然發(fā)生的交通擁堵預(yù)測困難,但是對于有計(jì)劃的活動(dòng)引起的交通擁堵可以估測出時(shí)間和地點(diǎn)。
總之,可視分析通過豐富的交互手段為用戶提供從概覽到細(xì)節(jié)的探索能力,其圖形化的分析結(jié)果展示方式也便于用戶理解數(shù)據(jù)中蘊(yùn)藏的規(guī)律。因此,可視分析近年來在智能交通領(lǐng)域受到極大的關(guān)注,需要重點(diǎn)加強(qiáng)研究。
參考文獻(xiàn):
[1]郝娜,李鑫.基于大數(shù)據(jù)的智能交通系統(tǒng)淺析[J].石家莊職業(yè)技術(shù)學(xué)院學(xué)報(bào),2018,30(04):31-33.
[3]梁榮華.“大數(shù)據(jù)可視分析”專欄序[J].中國圖象圖形學(xué)報(bào),2015,20(04):453.
(作者單位:南京市城市與交通規(guī)劃設(shè)計(jì)研究院股份有限公司)