梅宏
當(dāng)前,工業(yè)大數(shù)據(jù)提出了整個(gè)體系和要求,要達(dá)到這些目標(biāo),標(biāo)準(zhǔn)無疑是關(guān)鍵的一環(huán)。怎么樣做好大數(shù)據(jù)標(biāo)準(zhǔn)體系,建設(shè)助力國家大數(shù)據(jù)的實(shí)施?圍繞此問題我有以下幾點(diǎn)思考。
可以看到隨著大數(shù)據(jù)的到來,我們正迎來信息化的第三波浪潮。第一波浪潮是1995年以前的單機(jī)信息化時(shí)代,以單機(jī)應(yīng)用為特色的數(shù)字化階段;在過去20年,我們經(jīng)歷了以聯(lián)網(wǎng)應(yīng)用為特征的網(wǎng)絡(luò)化階段,我們稱之為第二波浪潮信息化2.0;現(xiàn)在我們正進(jìn)入以數(shù)據(jù)的深度挖掘和融合應(yīng)用為特征的智慧化階段,可以說,第三波浪潮正在到來。第三波浪潮也是大數(shù)據(jù)時(shí)代的到來,大數(shù)據(jù)應(yīng)用有了各種各樣成功的案例,這些成功案例也激發(fā)了我們努力去基于數(shù)據(jù),從中發(fā)現(xiàn)信息、汲取知識(shí),指導(dǎo)我們的實(shí)踐。
在這種情況下,大數(shù)據(jù)給我們帶來了什么?是新的思維,是潛在的巨大的價(jià)值,包括一些模式方法學(xué)的變化,從精確求解到近似求解的轉(zhuǎn)變,從因果關(guān)系到關(guān)聯(lián)關(guān)系的轉(zhuǎn)變等等,還有很多其他行業(yè)新的商業(yè)模式的創(chuàng)新,這些新的思維給我們帶來追求價(jià)值的愿望。
大數(shù)據(jù)產(chǎn)業(yè)生態(tài)基本雛形已經(jīng)形成,包含基礎(chǔ)設(shè)施、分析和應(yīng)用,還有基礎(chǔ)設(shè)施分析,數(shù)據(jù)源的開放以及相關(guān)的API等。就我國大數(shù)據(jù)產(chǎn)業(yè)的現(xiàn)狀來看,從學(xué)術(shù)界的理解,有以下幾個(gè)判斷:我們?cè)诨A(chǔ)設(shè)施和分析技術(shù)方面主要依賴于開源軟件,從定制方面獲取價(jià)值;大數(shù)據(jù)分析的基礎(chǔ)和核心算法基本來源于對(duì)國外的借鑒;互聯(lián)網(wǎng)大數(shù)據(jù)應(yīng)用達(dá)到了國際先進(jìn)水平;在政府?dāng)?shù)據(jù)和行業(yè)數(shù)據(jù)開放共享方面取得了成功。
當(dāng)然也存在問題,我們?cè)诿嫦蚝诵募夹g(shù)和算法的研究方面投入不足,很多工作是在做數(shù)據(jù)分析,從美國大數(shù)據(jù)的產(chǎn)業(yè)發(fā)展來看,我國的大數(shù)據(jù)產(chǎn)業(yè)的發(fā)展差距仍較大。如果說美國已經(jīng)進(jìn)入了傳統(tǒng)行業(yè)的比較,他的數(shù)據(jù)生產(chǎn)已經(jīng)進(jìn)入工業(yè)化萌芽階段,開始呈現(xiàn)生產(chǎn)率高的狀態(tài),那我們還處在自給自足的小農(nóng)經(jīng)濟(jì)時(shí)代。
從國家戰(zhàn)略層面看,2015年國務(wù)院印發(fā)了《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》,后續(xù)的一些列動(dòng)作,包括中央工作會(huì)議,2016年3月的政府工作報(bào)告等,都對(duì)我們?cè)谛畔?、大?shù)據(jù)戰(zhàn)略上做了國家戰(zhàn)略層面的明確部署。
若對(duì)《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》做一基本解讀,其中涉及到三方面的任務(wù):一是加快政府?dāng)?shù)據(jù)開放共享,推動(dòng)資源整合,提高治理能力,推動(dòng)產(chǎn)業(yè)創(chuàng)新發(fā)展,培育新興業(yè)態(tài),助力經(jīng)濟(jì)轉(zhuǎn)型,強(qiáng)化安全保障,提高管理水平。數(shù)據(jù)或信息已經(jīng)成為與物質(zhì)能源同等重要的基礎(chǔ)性戰(zhàn)略資源,信息化3.0時(shí)代,以數(shù)據(jù)的深度挖掘與融合應(yīng)用為主的特征,從而必然會(huì)有新業(yè)態(tài)出現(xiàn)。
當(dāng)前,大數(shù)據(jù)應(yīng)用領(lǐng)域標(biāo)準(zhǔn)研制,設(shè)立電子商務(wù)大數(shù)據(jù)和工業(yè)大數(shù)據(jù)技術(shù)專題組,面向產(chǎn)業(yè)、行業(yè)真實(shí)需求,選擇典型領(lǐng)域制定相關(guān)標(biāo)準(zhǔn)。在大數(shù)據(jù)安全標(biāo)準(zhǔn)方面,有大數(shù)據(jù)內(nèi)容安全、隱私保護(hù)的需要,通過標(biāo)準(zhǔn)規(guī)范數(shù)據(jù)共享、使用和管理。其中最為重頭的是按照國家對(duì)大數(shù)據(jù)的重要部署,怎樣實(shí)現(xiàn)開放共享?特別是政府?dāng)?shù)據(jù)的開放共享。在國務(wù)院常務(wù)會(huì)議上,大數(shù)據(jù)的開放共享是一項(xiàng)非常重要的任務(wù),《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》的十大工程,其中很重要的是政府?dāng)?shù)據(jù)開放工程,大數(shù)據(jù)資源聚集管理和開放的前提,是要實(shí)現(xiàn)開放共享,按照國際上機(jī)構(gòu)排名,我們中國政府?dāng)?shù)據(jù)的公開開放,排在較后的位置,未來幾年實(shí)現(xiàn)這件事情標(biāo)準(zhǔn)工作非常重要。怎樣能夠?qū)崿F(xiàn)有效地支撐大數(shù)據(jù)的開放共享呢?開放共享毫無疑問應(yīng)該有兩個(gè)方面的問題:一是標(biāo)準(zhǔn),大家按照統(tǒng)一標(biāo)準(zhǔn)來形成;二是提供技術(shù)手段,通過技術(shù)層面建設(shè)平臺(tái)、技術(shù)方案解決大數(shù)據(jù)面臨的孤島問題。標(biāo)準(zhǔn)從數(shù)據(jù)表示與描述、數(shù)據(jù)管理流程、數(shù)據(jù)安全隱私等多個(gè)視角,建立數(shù)據(jù)共享、開放系列平臺(tái)。技術(shù)從互操作技術(shù)入手,解決跨系統(tǒng)間的數(shù)據(jù)交互、共享問題,全方位以標(biāo)準(zhǔn)技術(shù)共同支撐的數(shù)據(jù)解決方案。
我們現(xiàn)在在大數(shù)據(jù)開放共享標(biāo)準(zhǔn)方面,主要有三個(gè)標(biāo)準(zhǔn):技術(shù)標(biāo)準(zhǔn)、管理標(biāo)準(zhǔn)和安全標(biāo)準(zhǔn)。針對(duì)大數(shù)據(jù)資源開放共享目標(biāo),重點(diǎn)研究三項(xiàng)國家標(biāo)準(zhǔn),目前申請(qǐng)相關(guān)的國標(biāo)立項(xiàng),包括大數(shù)據(jù)開放共享的總則,政府?dāng)?shù)據(jù)開放的基本要求,開放評(píng)價(jià),大數(shù)據(jù)交易流程和相關(guān)的標(biāo)準(zhǔn)。也設(shè)計(jì)了2項(xiàng)國家標(biāo)準(zhǔn),正在進(jìn)行國標(biāo)的立項(xiàng)。
除了標(biāo)準(zhǔn)方面,我們還考慮從技術(shù)上有一些支撐,開放共享最重要的挑戰(zhàn)是大數(shù)據(jù)時(shí)代的遺產(chǎn)系統(tǒng),怎樣把這些遺產(chǎn)系統(tǒng)保留出來,怎樣把這些遺產(chǎn)信息系統(tǒng)中所具有的數(shù)據(jù)、所隱藏的數(shù)據(jù)挖掘出來,是重中之重的工作。
在我們過去的工作中,大量的數(shù)量數(shù)據(jù)、采集、清洗、組織和管理,10%的大數(shù)據(jù)技術(shù)投資用于真正數(shù)據(jù)價(jià)值的業(yè)務(wù)分析,52%流向了數(shù)據(jù)的采集和組織,所以說是市場機(jī)遇也是用戶的痛點(diǎn)。從顯性成本來看,如果說我們要完成一個(gè)信息系統(tǒng)的開放,實(shí)現(xiàn)數(shù)據(jù)的開放把接口拿出來。這里面如果有原系統(tǒng)的開放,那么就需要修改原有系統(tǒng),難度高、工作量大,原系統(tǒng)開發(fā)商由于人員流動(dòng)、業(yè)務(wù)轉(zhuǎn)型等原因,不再重視開放,并且原系統(tǒng)開發(fā)商因技術(shù)鎖定,掌握議價(jià)權(quán)。所以最近北大團(tuán)隊(duì)提供了大數(shù)據(jù)開放共享技術(shù)解決方案,我們中國體系技術(shù)能夠自動(dòng)把系統(tǒng)價(jià)值恢復(fù)出來,完成數(shù)據(jù)的接口,實(shí)現(xiàn)數(shù)據(jù)的可操作。甚至有的更高,完成數(shù)據(jù)整體的開采,自動(dòng)集成信息系統(tǒng)。未來會(huì)形成萬億級(jí)的工業(yè)化產(chǎn)業(yè):從單元變成多元,從手工進(jìn)入自動(dòng),從批量進(jìn)入實(shí)時(shí),從總結(jié)進(jìn)入數(shù)據(jù)預(yù)測,從應(yīng)用實(shí)現(xiàn)數(shù)據(jù)變現(xiàn)。
總體來看,整體上標(biāo)準(zhǔn)原則思路是:立足本質(zhì)、抓主抓重,應(yīng)用創(chuàng)新、注重實(shí)效。整體布局,按需規(guī)劃,同時(shí)也考慮自主可控,長效發(fā)展。(根據(jù)演講內(nèi)容整理,未經(jīng)本人審核)