陳思恩
大數(shù)據(jù)領(lǐng)域蘊藏很多的商業(yè)機會,而不同的領(lǐng)域里積累了很多數(shù)據(jù),很多專家學(xué)者提到,中國發(fā)展場景化大數(shù)據(jù)是一塊寶地,因為有很多數(shù)據(jù)沉淀、很多場景可以利用。我們可以看到很多企業(yè)在AI與大數(shù)據(jù)方面的發(fā)展相當(dāng)深入,可以解決很多通用問題,當(dāng)針對一個企業(yè)進行剖析時,很多應(yīng)用價值可以被挖掘出來。我們作為一個科技公司,致力于發(fā)展交通領(lǐng)域業(yè)務(wù)。而在交通領(lǐng)域中的民航,它的整個組織架構(gòu)分為三個重要板塊:航空公司、機場和民航管理機構(gòu)。全球約241家航空公司,如果將國外與國內(nèi)航空公司的數(shù)據(jù)結(jié)合起來,形成智能交通數(shù)據(jù)庫,從民航板塊作為出發(fā)點,也可以解決鐵路出行問題。目前,我們和中國鐵路總公司合作,幫助解決客運分析方面的問題,而公路出行不能一盤棋解決所有城市交通,應(yīng)圍繞一個省或一個城市的附屬關(guān)系進行總體考量,若把民航出行、公路出行和鐵路出行這三個方面相互融合,則需要很長時間做深入的研究。
智慧交通領(lǐng)域囊括了很多方面,包括政府、交通管理機構(gòu)和企業(yè)本身的綜合性問題,同時收益也是組織的關(guān)注點,而一些問題也是我們科技谷非常重視的問題,目前整個智慧交通技術(shù)迭代和整體算法衍生迭代較慢,最終導(dǎo)致解決此項問題相對困難。比如在收益模塊的系統(tǒng)價格昂貴,通常一個軟件作用于一個航空公司,其一年的收益就可達到上億元,而解決類似的問題,只能依賴于技術(shù)提升和驅(qū)動。
科技谷從2012年開始著手研究智慧交通的出行架構(gòu)。從云、物理存儲到計算,涉及很多結(jié)構(gòu),包括數(shù)據(jù)函數(shù)驅(qū)動、疊加和集中學(xué)習(xí)等,都需要在市場中打通,要發(fā)展智慧交通需要付出很多時間去耕耘。
我們區(qū)別于其他企業(yè)的是,從不同的場景中進行整體創(chuàng)新,所提供的服務(wù)具有針對性,而發(fā)展智慧交通AI必須有兩個環(huán)節(jié)。第一,引入外部數(shù)據(jù)。把外部數(shù)據(jù)引入進來與內(nèi)部數(shù)據(jù)相結(jié)合,通常的大數(shù)據(jù)公司從事技術(shù)層面開發(fā),科技谷是綜合解決方案的供應(yīng)商,可以幫企業(yè)解決大數(shù)據(jù)問題,引入企業(yè)所需要的數(shù)據(jù)源,同時對數(shù)據(jù)源進行合理的歸集和整合。第二,大數(shù)據(jù)系統(tǒng)需要有數(shù)據(jù)支撐,同時需要一套AI的機器學(xué)習(xí)平臺,很多大型企業(yè)希望能夠在通用部門中建設(shè)一套比較完整的機器學(xué)習(xí)通用模塊,并且由各個部門擴展它的應(yīng)用場景。我們幫助企業(yè)搭建這個平臺去拓展企業(yè)的應(yīng)用場景,包括企業(yè)的整體流程化、管理的精細(xì)化和新算法,這些全部依賴于企業(yè)的數(shù)據(jù)量,在存儲的數(shù)據(jù)增加之后,以新存儲的數(shù)據(jù)帶動算法場景的更新,才有可能創(chuàng)造一個持續(xù)運營并且有價值的場景。場景依賴大數(shù)據(jù)系統(tǒng)建設(shè),我們已經(jīng)在航空公司、機場、民航局、市交委旅游局部署了相關(guān)系統(tǒng)來打通數(shù)據(jù)場景。
此外可通過增加機器學(xué)習(xí)算法,解決人工智能問題。而深度學(xué)習(xí)則更注重技術(shù),所以我們也在集成深度學(xué)習(xí)技術(shù)的同時解決AI中的具體場景。針對交通出行行業(yè)的企業(yè)來說,需要積累互聯(lián)網(wǎng)的海量數(shù)據(jù),這時需要有一個外部AI的分析能力,在平臺上我們增加了這種能力,去分析外部的數(shù)據(jù),而外部的行為結(jié)構(gòu),會對整個收益結(jié)構(gòu)中不同的行為進行分析,所以電商分析起到了決定性作用,因為原來企業(yè)預(yù)測外部數(shù)據(jù)可能需要提前兩周,但是隨著運行效率的提高,準(zhǔn)確率可能提升至10%~20%,對于航空公司而言收益非??捎^。
外部數(shù)據(jù)和內(nèi)部數(shù)據(jù)相結(jié)合,無論是鐵路總局、機場、旅游機構(gòu),都會涉及人群畫像的豐富程度,所以通過外部的數(shù)據(jù)整合,對群體畫像進行完善的前提是必須對關(guān)系路徑進行分析,這需要大量使用圖型數(shù)據(jù)庫,以及各種圖的存儲方式,在每個板塊都通過路徑優(yōu)化的方式進行分析。在畫像和關(guān)系圖譜的基礎(chǔ)牢固之后,再進行整體推進。航空公司的收益是對艙位進行配售和定價,這需要對歷史數(shù)據(jù)和實時行為進行分析,運用分布式處理技術(shù)可以實現(xiàn)單個系統(tǒng)監(jiān)控上百條航線,并以毫秒級的速度把結(jié)果展示出來,同時這種行為也可以用于安全維穩(wěn)。
而PDA(掌中電腦)的使用,可以通過決策數(shù)據(jù)的方式來保證不同的模型,進行集中學(xué)習(xí)。同時我們進行了鐵路的相關(guān)分析。鐵路為了更好地增加服務(wù),開始增加廣告推廣業(yè)務(wù)和配餐等服務(wù),而這些都依賴于基礎(chǔ)設(shè)施建設(shè),而大量的智能化設(shè)備的使用,因為沒有辦法像人一樣的工作方式工作,則出現(xiàn)了以數(shù)據(jù)驅(qū)動決策的企業(yè)開始從事這方面的研發(fā)。
鐵路需要運用區(qū)塊鏈的架構(gòu)實現(xiàn)共享機制,而這種機制同樣可以應(yīng)用到航空公司和鐵路總局中,所以需要一套完整的智慧云服務(wù)體系。
我們在深圳建立了大數(shù)據(jù)民航中心,存儲了全國所有民航數(shù)據(jù),海關(guān)總署可直接調(diào)閱民航中心的數(shù)據(jù),可以對人群特征進行查閱從而到達監(jiān)管目的。而針對每天大量的行李和旅客,如何做好數(shù)據(jù)的分發(fā)清洗,則依賴于底層架構(gòu)技術(shù)對數(shù)據(jù)進行實時分析,要把整個體系做好,產(chǎn)業(yè)鏈上、下游和大數(shù)據(jù)產(chǎn)業(yè)生態(tài)平臺要搭建完整,這需要有投資機構(gòu)、政府資源和企業(yè)共同創(chuàng)建。
(根據(jù)演講內(nèi)容整理,未經(jīng)本人審核)endprint