大數(shù)據(jù)在體量上指規(guī)模龐大的信息和海量的數(shù)據(jù),信息量大到無法利用傳統(tǒng)的方法(無論是技術手段還是人工方式)進行分析或有針對性地過濾。同時,大數(shù)據(jù)技術不適用于所有應用場景,也不能解決所有交通問題。但是,仍然有許多企業(yè)為了自身的利益,過度宣傳大數(shù)據(jù)的效用,把大數(shù)據(jù)說成是“包治百病”的“萬能藥”。此外,有許多交通業(yè)務部門由于交通問題解決的迫切性,對大數(shù)據(jù)技術期望太高,認為大數(shù)據(jù)技術能夠解決目前急需解決的問題,投入大量的資金、物力和人力,卻導致了“一窩蜂”的浪費。
大數(shù)據(jù)平臺需要高投入,高投入?yún)s很難帶來高效益,這才是目前大數(shù)據(jù)給交通行業(yè)帶來的不能承受之重。
一方面,過去幾年隨著大數(shù)據(jù)概念的興起,大數(shù)據(jù)技術不斷發(fā)展,IT公司紛紛轉(zhuǎn)型成為大數(shù)據(jù)公司,意圖獲得高估值。但是,大數(shù)據(jù)概念的熱炒,催生了一個又一個泡沫,原因在于概念多于實踐,忽視了技術發(fā)展過程中的問題,如國內(nèi)數(shù)據(jù)開放程度低,沒有充足的“大”數(shù)據(jù);數(shù)據(jù)應用概念不落地,沒有技術支撐;數(shù)據(jù)服務或者技術服務目標不明確,只為建設而建設;定制化屬性難以標準化,難以達成規(guī)模效益。
另一方面,交通管理層對“大數(shù)據(jù)技術”期望太高,無論是否具有大數(shù)據(jù)所必需的基礎,都要建設大數(shù)據(jù)平臺,好像應用了大數(shù)據(jù)技術,建立了大數(shù)據(jù)平臺,便擁有當今最先進的技術,擁有了今后所有業(yè)務系統(tǒng)的基礎,并可以解決所有交通問題。
大數(shù)據(jù)不是萬能的,不可能成為解決關鍵交通問題的靈丹妙藥。
大數(shù)據(jù)應用的業(yè)務鏈條,包括數(shù)據(jù)源、數(shù)據(jù)技術和數(shù)據(jù)應用。國外大數(shù)據(jù)公司可以專注于業(yè)務鏈條中的單一環(huán)節(jié),將一個環(huán)節(jié)做好,便可成長為10億美元以上的獨角獸公司。我國的大數(shù)據(jù)公司僅做好其中一個環(huán)節(jié),業(yè)務開展都非常困難,發(fā)展很容易遇到瓶頸。大數(shù)據(jù)需要數(shù)據(jù)互聯(lián),僅僅一個公司掌握數(shù)據(jù),另一個公司掌握技術,則大數(shù)據(jù)依然發(fā)展不起來。大數(shù)據(jù)之大不可能一家獨大。正如維克多·舍恩伯格所著的《大數(shù)據(jù)時代》所言,大數(shù)據(jù)分析非隨機樣本,而是全體數(shù)據(jù);非精確性,而是混雜性;非因果關系,而是相關關系。因此,只追求數(shù)據(jù)的量不是大數(shù)據(jù)。
比如,車輛的動態(tài)定位數(shù)據(jù)數(shù)量以每秒十幾萬、幾十萬條記,但是若僅用于統(tǒng)計在線率、查找軌跡就并不是大數(shù)據(jù)應用,但要看其時空分布特征,以分析背后原因,僅僅GPS位置數(shù)據(jù)還遠遠不夠。
大量數(shù)字化不是大數(shù)據(jù)。交通管理部門存在大量的文本化紙制文件,又進行了大量的數(shù)字化處理,如掃描、錄入等,這些數(shù)據(jù)并沒有太多的歷史價值和全局性、連續(xù)性特征,只是片面的、臨時性的數(shù)據(jù)積累,因此,不適用于大數(shù)據(jù)處理。數(shù)據(jù)大集合不是大數(shù)據(jù),所有實際上并不存在任何內(nèi)在關聯(lián)的數(shù)據(jù),無論其量如何之大都不適用于大數(shù)據(jù)技術,大數(shù)據(jù)技術是尋找數(shù)據(jù)之間的關系,并分析其規(guī)律。
傳統(tǒng)統(tǒng)計分析不是大數(shù)據(jù)。正如上述所描述,很多交通部門依然延用傳統(tǒng)思維中的統(tǒng)計分析方法,談不上大數(shù)據(jù)分析與大數(shù)據(jù)計算模型。因此,傳統(tǒng)意義上的主題分析不是大數(shù)據(jù)。
大數(shù)據(jù)只是解決特定問題的特定技術,需要體現(xiàn)大數(shù)據(jù)背后的現(xiàn)象、實際,更需要說明原因。在(移動)互聯(lián)網(wǎng)的背景下,分析深度關聯(lián)、多層原因變得更為重要,這就面臨一個大數(shù)據(jù)分析難題:如何提升數(shù)據(jù)分析能力,即如何將數(shù)據(jù)與人的心理、行為聯(lián)系起來。不是簡單的聯(lián)系,而是預測這些關聯(lián)性。大數(shù)據(jù)從龐大繁雜的交通運行數(shù)據(jù)中,尋找到人們所需要的交通問題之邏輯關系,然后“理解”人們更深層的需求,如交通問題原因探究,這才是大數(shù)據(jù)技術真正的價值體現(xiàn)。
大數(shù)據(jù)在帶來機遇的同時,也面臨很多問題: 需要在明確數(shù)據(jù)的屬性、價值及本質(zhì)的基礎上才能進一步挖掘其價值;大數(shù)據(jù)在應用過程中會涉及信息安全及隱私保護問題;整合信息資源需要強大的技術支撐;目前在專業(yè)人才上還存在缺口。
目前,大多數(shù)大數(shù)據(jù)平臺分析系統(tǒng),仍然局限于“條件分析”,遠沒有實現(xiàn)“智能探究”。人為設置的主題和分析方向,大多數(shù)情況下是已經(jīng)知道原因,只是為了得到數(shù)字的驗證。交通管理部門僅使用了大數(shù)據(jù)的存儲和計算技術,但卻大大忽略了大數(shù)據(jù)的分析能力,而這正是需要真正投入研究的。目前,可行的方法還是借助“半人工”方式,通過大數(shù)據(jù)自主分析,人工發(fā)現(xiàn)需要探究的目標,然后再一次挖掘大數(shù)據(jù),循環(huán)往復。
當然,大數(shù)據(jù)技術正在飛速發(fā)展,人工智能的深入研究與介入,對于大數(shù)據(jù)中語義的分析、自然語言的理解、數(shù)據(jù)關聯(lián)性的主動性關聯(lián)等技能不斷發(fā)展,能夠逐步實現(xiàn)行業(yè)期待的大數(shù)據(jù)真正的應用價值——自主發(fā)現(xiàn)、自主探究。
交通大數(shù)據(jù)要取得真正實用的價值,沒有任何捷徑,必須理性地看待這一技術和“工具”的使用,并認清交通大數(shù)據(jù)應用仍然是初級階段。交通大數(shù)據(jù)應用,先從最易入手的分析開始;大數(shù)據(jù)分析,又要先從數(shù)據(jù)互聯(lián)開始。先實現(xiàn)信息傳遞,才能實現(xiàn)價值轉(zhuǎn)移。
交通大數(shù)據(jù)重中之重是需要數(shù)據(jù),有能夠互聯(lián)的數(shù)據(jù)。智能交通管理系統(tǒng)的發(fā)展水平與數(shù)據(jù)的公開化程度息息相關。但是,我國交通管理的“條塊分割”嚴重,政府業(yè)務系統(tǒng)一般被承建企業(yè)把控,系統(tǒng)中的數(shù)據(jù)對接與數(shù)據(jù)互聯(lián)、信息互通,是目前交通大數(shù)據(jù)的最大障礙,是交通管理和參與企業(yè)應該調(diào)度重視的問題。信息公開能帶來諸多便利之處,對于政府來說,信息公開有利于樹立起良好形象;對于企業(yè)來說,信息公開能增加其收益;對于民眾來說,信息公開能保障決策參與權。要提高交通數(shù)據(jù)的利用率,需要提高信息的公開化程度,信息管理方式的開放性較低,無法挖掘信息的價值,更無從談大數(shù)據(jù)價值。
大數(shù)據(jù)公司要為交通管理部門提供優(yōu)質(zhì)的大數(shù)據(jù)分析及其應用和相關服務,數(shù)據(jù)源(對數(shù)據(jù)采集匯聚能力)、數(shù)據(jù)技術(對數(shù)據(jù)處理計算能力)和數(shù)據(jù)應用(對數(shù)據(jù)內(nèi)涵和外延的發(fā)掘能力)3個環(huán)節(jié)都要有獨特競爭力,而交通行業(yè)所有部門,也必須真正基于“大數(shù)據(jù)”技術本身的能力,結(jié)合交通問題的解決意圖建設交通大數(shù)據(jù)系統(tǒng)。
人工智能、區(qū)塊鏈技術的興起,無疑會給大數(shù)據(jù)應用的技術進步帶來更多的發(fā)展空間,但是,這會不會又是一輪新的概念炒作?“大數(shù)據(jù)”成本之大,是大數(shù)據(jù)之殤,對企業(yè)、對政府都是不可承受之重。