梅宏
當(dāng)前,工業(yè)大數(shù)據(jù)提出了整個體系和要求,要達到這些目標(biāo),標(biāo)準無疑是關(guān)鍵的一環(huán)。怎么樣做好大數(shù)據(jù)標(biāo)準體系,建設(shè)助力國家大數(shù)據(jù)的實施?圍繞此問題我有以下幾點思考。
可以看到隨著大數(shù)據(jù)的到來,我們正迎來信息化的第三波浪潮。第一波浪潮是1995年以前的單機信息化時代,以單機應(yīng)用為特色的數(shù)字化階段;在過去20年,我們經(jīng)歷了以聯(lián)網(wǎng)應(yīng)用為特征的網(wǎng)絡(luò)化階段,我們稱之為第二波浪潮信息化2.0;現(xiàn)在我們正進入以數(shù)據(jù)的深度挖掘和融合應(yīng)用為特征的智慧化階段,可以說,第三波浪潮正在到來。第三波浪潮也是大數(shù)據(jù)時代的到來,大數(shù)據(jù)應(yīng)用有了各種各樣成功的案例,這些成功案例也激發(fā)了我們努力去基于數(shù)據(jù),從中發(fā)現(xiàn)信息、汲取知識,指導(dǎo)我們的實踐。
在這種情況下,大數(shù)據(jù)給我們帶來了什么?是新的思維,是潛在的巨大的價值,包括一些模式方法學(xué)的變化,從精確求解到近似求解的轉(zhuǎn)變,從因果關(guān)系到關(guān)聯(lián)關(guān)系的轉(zhuǎn)變等等,還有很多其他行業(yè)新的商業(yè)模式的創(chuàng)新,這些新的思維給我們帶來追求價值的愿望。
大數(shù)據(jù)產(chǎn)業(yè)生態(tài)基本雛形已經(jīng)形成,包含基礎(chǔ)設(shè)施、分析和應(yīng)用,還有基礎(chǔ)設(shè)施分析,數(shù)據(jù)源的開放以及相關(guān)的API等。就我國大數(shù)據(jù)產(chǎn)業(yè)的現(xiàn)狀來看,從學(xué)術(shù)界的理解,有以下幾個判斷:我們在基礎(chǔ)設(shè)施和分析技術(shù)方面主要依賴于開源軟件,從定制方面獲取價值;大數(shù)據(jù)分析的基礎(chǔ)和核心算法基本來源于對國外的借鑒;互聯(lián)網(wǎng)大數(shù)據(jù)應(yīng)用達到了國際先進水平;在政府?dāng)?shù)據(jù)和行業(yè)數(shù)據(jù)開放共享方面取得了成功。
當(dāng)然也存在問題,我們在面向核心技術(shù)和算法的研究方面投入不足,很多工作是在做數(shù)據(jù)分析,從美國大數(shù)據(jù)的產(chǎn)業(yè)發(fā)展來看,我國的大數(shù)據(jù)產(chǎn)業(yè)的發(fā)展差距仍較大。如果說美國已經(jīng)進入了傳統(tǒng)行業(yè)的比較,他的數(shù)據(jù)生產(chǎn)已經(jīng)進入工業(yè)化萌芽階段,開始呈現(xiàn)生產(chǎn)率高的狀態(tài),那我們還處在自給自足的小農(nóng)經(jīng)濟時代。
從國家戰(zhàn)略層面看,2015年國務(wù)院印發(fā)了《促進大數(shù)據(jù)發(fā)展行動綱要》,后續(xù)的一些列動作,包括中央工作會議,2016年3月的政府工作報告等,都對我們在信息、大數(shù)據(jù)戰(zhàn)略上做了國家戰(zhàn)略層面的明確部署。
若對《促進大數(shù)據(jù)發(fā)展行動綱要》做一基本解讀,其中涉及到三方面的任務(wù):一是加快政府?dāng)?shù)據(jù)開放共享,推動資源整合,提高治理能力,推動產(chǎn)業(yè)創(chuàng)新發(fā)展,培育新興業(yè)態(tài),助力經(jīng)濟轉(zhuǎn)型,強化安全保障,提高管理水平。數(shù)據(jù)或信息已經(jīng)成為與物質(zhì)能源同等重要的基礎(chǔ)性戰(zhàn)略資源,信息化3.0時代,以數(shù)據(jù)的深度挖掘與融合應(yīng)用為主的特征,從而必然會有新業(yè)態(tài)出現(xiàn)。
當(dāng)前,大數(shù)據(jù)應(yīng)用領(lǐng)域標(biāo)準研制,設(shè)立電子商務(wù)大數(shù)據(jù)和工業(yè)大數(shù)據(jù)技術(shù)專題組,面向產(chǎn)業(yè)、行業(yè)真實需求,選擇典型領(lǐng)域制定相關(guān)標(biāo)準。在大數(shù)據(jù)安全標(biāo)準方面,有大數(shù)據(jù)內(nèi)容安全、隱私保護的需要,通過標(biāo)準規(guī)范數(shù)據(jù)共享、使用和管理。其中最為重頭的是按照國家對大數(shù)據(jù)的重要部署,怎樣實現(xiàn)開放共享?特別是政府?dāng)?shù)據(jù)的開放共享。在國務(wù)院常務(wù)會議上,大數(shù)據(jù)的開放共享是一項非常重要的任務(wù),《促進大數(shù)據(jù)發(fā)展行動綱要》的十大工程,其中很重要的是政府?dāng)?shù)據(jù)開放工程,大數(shù)據(jù)資源聚集管理和開放的前提,是要實現(xiàn)開放共享,按照國際上機構(gòu)排名,我們中國政府?dāng)?shù)據(jù)的公開開放,排在較后的位置,未來幾年實現(xiàn)這件事情標(biāo)準工作非常重要。怎樣能夠?qū)崿F(xiàn)有效地支撐大數(shù)據(jù)的開放共享呢?開放共享毫無疑問應(yīng)該有兩個方面的問題:一是標(biāo)準,大家按照統(tǒng)一標(biāo)準來形成;二是提供技術(shù)手段,通過技術(shù)層面建設(shè)平臺、技術(shù)方案解決大數(shù)據(jù)面臨的孤島問題。標(biāo)準從數(shù)據(jù)表示與描述、數(shù)據(jù)管理流程、數(shù)據(jù)安全隱私等多個視角,建立數(shù)據(jù)共享、開放系列平臺。技術(shù)從互操作技術(shù)入手,解決跨系統(tǒng)間的數(shù)據(jù)交互、共享問題,全方位以標(biāo)準技術(shù)共同支撐的數(shù)據(jù)解決方案。
我們現(xiàn)在在大數(shù)據(jù)開放共享標(biāo)準方面,主要有三個標(biāo)準:技術(shù)標(biāo)準、管理標(biāo)準和安全標(biāo)準。針對大數(shù)據(jù)資源開放共享目標(biāo),重點研究三項國家標(biāo)準,目前申請相關(guān)的國標(biāo)立項,包括大數(shù)據(jù)開放共享的總則,政府?dāng)?shù)據(jù)開放的基本要求,開放評價,大數(shù)據(jù)交易流程和相關(guān)的標(biāo)準。也設(shè)計了2項國家標(biāo)準,正在進行國標(biāo)的立項。
除了標(biāo)準方面,我們還考慮從技術(shù)上有一些支撐,開放共享最重要的挑戰(zhàn)是大數(shù)據(jù)時代的遺產(chǎn)系統(tǒng),怎樣把這些遺產(chǎn)系統(tǒng)保留出來,怎樣把這些遺產(chǎn)信息系統(tǒng)中所具有的數(shù)據(jù)、所隱藏的數(shù)據(jù)挖掘出來,是重中之重的工作。
在我們過去的工作中,大量的數(shù)量數(shù)據(jù)、采集、清洗、組織和管理,10%的大數(shù)據(jù)技術(shù)投資用于真正數(shù)據(jù)價值的業(yè)務(wù)分析,52%流向了數(shù)據(jù)的采集和組織,所以說是市場機遇也是用戶的痛點。從顯性成本來看,如果說我們要完成一個信息系統(tǒng)的開放,實現(xiàn)數(shù)據(jù)的開放把接口拿出來。這里面如果有原系統(tǒng)的開放,那么就需要修改原有系統(tǒng),難度高、工作量大,原系統(tǒng)開發(fā)商由于人員流動、業(yè)務(wù)轉(zhuǎn)型等原因,不再重視開放,并且原系統(tǒng)開發(fā)商因技術(shù)鎖定,掌握議價權(quán)。所以最近北大團隊提供了大數(shù)據(jù)開放共享技術(shù)解決方案,我們中國體系技術(shù)能夠自動把系統(tǒng)價值恢復(fù)出來,完成數(shù)據(jù)的接口,實現(xiàn)數(shù)據(jù)的可操作。甚至有的更高,完成數(shù)據(jù)整體的開采,自動集成信息系統(tǒng)。未來會形成萬億級的工業(yè)化產(chǎn)業(yè):從單元變成多元,從手工進入自動,從批量進入實時,從總結(jié)進入數(shù)據(jù)預(yù)測,從應(yīng)用實現(xiàn)數(shù)據(jù)變現(xiàn)。
總體來看,整體上標(biāo)準原則思路是:立足本質(zhì)、抓主抓重,應(yīng)用創(chuàng)新、注重實效。整體布局,按需規(guī)劃,同時也考慮自主可控,長效發(fā)展。(根據(jù)演講內(nèi)容整理,未經(jīng)本人審核)