魏 凱
中國(guó)信息通信研究院 北京 100191
對(duì)大數(shù)據(jù)國(guó)家戰(zhàn)略的幾點(diǎn)考慮
魏 凱
中國(guó)信息通信研究院 北京 100191
大數(shù)據(jù)是國(guó)家發(fā)展的重要資源。對(duì)大數(shù)據(jù)資源的掌控與分析能力將成為未來國(guó)家競(jìng)爭(zhēng)力的基礎(chǔ)。我國(guó)大數(shù)據(jù)的發(fā)展及研究已有了良好開端,但也存在大數(shù)據(jù)資源活性不足、行業(yè)應(yīng)用有待深化、關(guān)鍵核心技術(shù)亟待突破、產(chǎn)業(yè)基礎(chǔ)薄弱、網(wǎng)絡(luò)信息安全存在潛在隱患等問題。當(dāng)前,制定國(guó)家大數(shù)據(jù)戰(zhàn)略成為各界人士的共同呼聲。國(guó)家層面的大數(shù)據(jù)戰(zhàn)略究竟應(yīng)該堅(jiān)持什么思路,有哪些要素需要考慮,成為產(chǎn)業(yè)界和政府部門熱議的話題。基于此,結(jié)合國(guó)外實(shí)踐和國(guó)內(nèi)問題,提出一些初步思考。
大數(shù)據(jù);國(guó)家戰(zhàn)略;法律規(guī)范
大數(shù)據(jù)(big data)一詞最早由美國(guó)航空航天局研究人員在1997年提出1http://www. foreignpolicy.com/ articles/2012/10/ 08/big_data,直到2011年麥肯錫公司發(fā)布報(bào)告《大數(shù)據(jù):創(chuàng)新、競(jìng)爭(zhēng)和生產(chǎn)力的下一個(gè)前沿》,才開始引起社會(huì)各界的廣泛關(guān)注。
到目前為止,大數(shù)據(jù)仍然沒有權(quán)威統(tǒng)一的定義,筆者認(rèn)為需要從狹義和廣義兩個(gè)尺度認(rèn)識(shí)大數(shù)據(jù)。狹義理解:大數(shù)據(jù)就是在數(shù)據(jù)采集技術(shù)快速提升、成本急劇下降的背景下,在互聯(lián)網(wǎng)和各種信息系統(tǒng)上形成的體量大、格式多、速度快的數(shù)據(jù)資源,即“數(shù)據(jù)大”。廣義理解:大數(shù)據(jù)不僅是“數(shù)據(jù)大”,還代表了一種新的認(rèn)識(shí)世界的工具,更重要的是蘊(yùn)含了一種“數(shù)據(jù)化”思維方式的變革。通過對(duì)大數(shù)據(jù)的分析,可以從中獲得對(duì)現(xiàn)實(shí)世界的立體化的認(rèn)識(shí),這給人類提供了全新的工具,影響廣泛而深遠(yuǎn),因此有人也把大數(shù)據(jù)與火、電、計(jì)算機(jī)、互聯(lián)網(wǎng)等并列,稱為“通用目的技術(shù)”。筆者認(rèn)為,當(dāng)前大數(shù)據(jù)熱的興起,最重要的成果是一場(chǎng)“用數(shù)據(jù)說話”的思維洗禮。
就技術(shù)和應(yīng)用而言,大數(shù)據(jù)是在互聯(lián)網(wǎng)快速發(fā)展中誕生的。這個(gè)起點(diǎn)可追溯到2000年前后。隨著全球網(wǎng)頁(yè)規(guī)模的暴增,推動(dòng)搜索引擎背后的存儲(chǔ)和分析技術(shù)出現(xiàn)突變,一系列分布式技術(shù)隨之出現(xiàn),是今天大數(shù)據(jù)技術(shù)的源頭。隨后幾年,海量數(shù)據(jù)驅(qū)動(dòng)的業(yè)務(wù)模式及技術(shù)深入互聯(lián)網(wǎng)營(yíng)銷、廣告、電商等核心應(yīng)用,取得巨大的商業(yè)成功,引發(fā)全社會(huì)對(duì)大數(shù)據(jù)的空前重視。
當(dāng)前,大數(shù)據(jù)的技術(shù)、工具和思維理念正在從互聯(lián)網(wǎng)向各個(gè)領(lǐng)域快速擴(kuò)散。Gartner的調(diào)查顯示,業(yè)界對(duì)大數(shù)據(jù)技術(shù)的投資不斷擴(kuò)大,73%的受訪者已經(jīng)投資或者計(jì)劃在未來24個(gè)月內(nèi)投資大數(shù)據(jù)。綜合IDC、Wikibon等公司的報(bào)告,僅大數(shù)據(jù)相關(guān)的數(shù)據(jù)存儲(chǔ)、處理、分析相關(guān)的軟硬件和服務(wù),2013年產(chǎn)值就已達(dá)150~180百億美元量級(jí),未來3年還將維持30%~50%的增長(zhǎng)。在直接的產(chǎn)業(yè)規(guī)模之外,大家更看中大數(shù)據(jù)給各個(gè)行業(yè)帶來的間接價(jià)值。大數(shù)據(jù)技術(shù)幾乎可以應(yīng)用到各個(gè)行業(yè)的價(jià)值創(chuàng)造和分配的全過程,通過降低交易成本,提高市場(chǎng)透明度,精確細(xì)分客戶群,優(yōu)化決策機(jī)制,催生新產(chǎn)品、新服務(wù)和新產(chǎn)業(yè)等方式間接創(chuàng)造價(jià)值巨大2http://www. drc.gov.cn/n/ 20140219/1-224-2878793.htm。大數(shù)據(jù)不光有經(jīng)濟(jì)價(jià)值,還塑造了新的“數(shù)據(jù)空間”,已經(jīng)成為繼陸權(quán)、海權(quán)、空權(quán)、天權(quán)安全之后,另一個(gè)國(guó)家主權(quán)不可分割的組成部分[1]。
2.1 美國(guó)在推動(dòng)大數(shù)據(jù)發(fā)展上最為積極,力圖確立領(lǐng)先地位
美國(guó)依托其互聯(lián)網(wǎng)和IT產(chǎn)業(yè)的領(lǐng)先地位,占據(jù)大數(shù)據(jù)技術(shù)發(fā)展先機(jī),已形成明顯的先發(fā)優(yōu)勢(shì)。Google、Facebook、Yahoo等公司的超大規(guī)模數(shù)據(jù)存儲(chǔ)、分布式計(jì)算、深度機(jī)器學(xué)習(xí)等多項(xiàng)大數(shù)據(jù)關(guān)鍵技術(shù)已領(lǐng)先其他同類技術(shù)平均5~6年。這種技術(shù)領(lǐng)先優(yōu)勢(shì)借助開源模式向外擴(kuò)散,帶動(dòng)Splunk、Tableau、Cloudera和HortonWorks等一大批專業(yè)化的大數(shù)據(jù)技術(shù)和服務(wù)公司不斷涌現(xiàn)。大數(shù)據(jù)技術(shù)不僅在美國(guó)互聯(lián)網(wǎng)搜索、廣告、電子商務(wù)、社交網(wǎng)絡(luò)等得到廣泛應(yīng)用,7成以上傳統(tǒng)行業(yè)企業(yè)也不同程度地應(yīng)用了大數(shù)據(jù)技術(shù),特別是銀行、保險(xiǎn)、制造零售等領(lǐng)域已經(jīng)有不少案例,國(guó)家安全、醫(yī)療、教育、科研等領(lǐng)域的大數(shù)據(jù)應(yīng)用也在快速深化。依靠機(jī)器、算法和大數(shù)據(jù)提供某種程度的智能,從而取得新的增長(zhǎng),正成為美國(guó)各行業(yè)信息化演變的主要方向,“第二次機(jī)器時(shí)代”的轉(zhuǎn)折點(diǎn)正在來臨3美國(guó)麻省理工學(xué)院 教 授Andrew McAfee和 Erik Brynjolfsson在2014年出版的新書《The Second Machine Age: Work, Progress and Prosperity In a Time of Brilliant Technologies》中提出的概念。。
然而即便在領(lǐng)先的美國(guó),大數(shù)據(jù)的發(fā)展初期,很多問題仍無法完全依靠市場(chǎng)自發(fā)解決,突出表現(xiàn)在以下幾點(diǎn):首先是技術(shù)問題,數(shù)據(jù)的采集、高效存儲(chǔ)、深度分析等基礎(chǔ)技術(shù)還不能適應(yīng)發(fā)展需求,醫(yī)療、國(guó)防、交通、科研等方面的大數(shù)據(jù)技術(shù)水平仍然薄弱;其次是數(shù)據(jù),商業(yè)機(jī)構(gòu)往往面臨數(shù)據(jù)短缺,而美國(guó)政府掌握的數(shù)據(jù)僅次于制造業(yè),商業(yè)化利用價(jià)值非常高,但缺較少開放;再次是法律制度,美國(guó)一些隱私保護(hù)組織呼吁加強(qiáng)保護(hù),但以互聯(lián)網(wǎng)公司為代表的商業(yè)機(jī)構(gòu)則主張寬松對(duì)待,雙方在收緊與放松之間展開拉鋸戰(zhàn);最后是人才,麥肯錫的一份報(bào)告預(yù)計(jì):到2018年,美國(guó)在“具備深入分析能力”的大數(shù)據(jù)專業(yè)人才缺口將達(dá)到14萬~18萬人。
美國(guó)政府意識(shí)到必須有所作為,于是2012年在全球率先推出“大數(shù)據(jù)行動(dòng)計(jì)劃(big data initiative)”,強(qiáng)化頂層設(shè)計(jì),統(tǒng)籌推進(jìn)技術(shù)研發(fā)、數(shù)據(jù)開放、率先應(yīng)用和負(fù)面問題應(yīng)對(duì)4http://www. whitehouse.gov/ sites/default/ files/microsites/ ostp/big_data_ press_release_ final_2.pdf。
● 加大技術(shù)研究:資助DARPA、NSF、NASA、NIH等機(jī)構(gòu)開展核心技術(shù)研究。例如,在大數(shù)據(jù)計(jì)劃資助下,加州大學(xué)伯克利分校開發(fā)的開源軟件平臺(tái)“伯克利數(shù)據(jù)分析軟件棧(Berkeley data analytics stack),其中的內(nèi)存計(jì)算軟件Spark性能比大名鼎鼎的Hadoop提高近百倍,有望取代后者,成為大數(shù)據(jù)技術(shù)平臺(tái)的主力5取代而非補(bǔ)充,Spark Summit 2014精彩回顧. http://www. csdn.net/article/ 2014-07-17/ 2820713。
● 數(shù)據(jù)開放方面:在全球較早建立了統(tǒng)一的數(shù)據(jù)門戶(data.gov),已開放37萬個(gè)數(shù)據(jù)集和1 209個(gè)數(shù)據(jù)工具。奧巴馬在2013年5月進(jìn)一步要求,政府必須實(shí)現(xiàn)新增和經(jīng)處理數(shù)據(jù)的開放和機(jī)器可讀,激發(fā)大數(shù)據(jù)創(chuàng)新活力。
● 政府應(yīng)用方面:美國(guó)政府是大數(shù)據(jù)的積極使用者。2013年曝光的“棱鏡門事件”顯示出美國(guó)國(guó)家安全部門大數(shù)據(jù)應(yīng)用的強(qiáng)大實(shí)力,其應(yīng)用范圍之廣、水平之高、規(guī)模之大都遠(yuǎn)遠(yuǎn)超過人們的想象。2012-2013年,美國(guó)國(guó)家安全局(NSA)、聯(lián)邦調(diào)查局(FBI)及中央情報(bào)局(CIA)等聯(lián)邦政府機(jī)構(gòu)還大量采購(gòu)亞馬遜的云服務(wù),以支撐其大數(shù)據(jù)應(yīng)用。
● 關(guān)注負(fù)面影響:隨著應(yīng)用的深入,美國(guó)政府對(duì)大數(shù)據(jù)帶來的負(fù)面影響也更加重視,美國(guó)白宮2014年5月發(fā)布的《大數(shù)據(jù):抓住機(jī)遇,守護(hù)價(jià)值》報(bào)告中提醒,在發(fā)揮正面價(jià)值的同時(shí),應(yīng)該警惕大數(shù)據(jù)應(yīng)用對(duì)隱私、公平等長(zhǎng)遠(yuǎn)價(jià)值帶來的負(fù)面影響。
2.2 英、日、澳、新等國(guó)家迅速跟進(jìn),努力縮小差距
英國(guó)將大數(shù)據(jù)列為戰(zhàn)略性技術(shù),給予高度關(guān)注。英國(guó)政府緊隨美國(guó)之后,推出一系列支持大數(shù)據(jù)發(fā)展舉措。首先是給予研發(fā)資金支持。2013年1月,英國(guó)政府向航天、醫(yī)藥等8類高新技術(shù)領(lǐng)域注資6億英鎊研發(fā),其中大數(shù)據(jù)技術(shù)獲得1.89億英鎊的資金,是獲得資金最多的領(lǐng)域。其次是促進(jìn)政府和公共領(lǐng)域的大數(shù)據(jù)應(yīng)用。據(jù)測(cè)算,通過合理、高效使用大數(shù)據(jù)技術(shù),英國(guó)政府每年可節(jié)省約330億英鎊,相當(dāng)于英國(guó)每人每年節(jié)省約500英鎊。為了在醫(yī)療領(lǐng)域更好地應(yīng)用大數(shù)據(jù),2013年5月,英國(guó)政府和李嘉誠(chéng)基金會(huì)聯(lián)合投資設(shè)立全球首個(gè)綜合運(yùn)用大數(shù)據(jù)技術(shù)的醫(yī)藥衛(wèi)生科研機(jī)構(gòu),將透過高通量生物數(shù)據(jù),與業(yè)界共同界定藥物標(biāo)靶,處理目前在新藥開發(fā)過程中關(guān)鍵的瓶頸,之后還將匯集遺傳學(xué)、流行病學(xué)、臨床、化學(xué)和計(jì)算機(jī)科學(xué)等領(lǐng)域的頂尖人才,集中分析龐大的醫(yī)療數(shù)據(jù)。
日本政府把大數(shù)據(jù)作為提升日本競(jìng)爭(zhēng)力的關(guān)鍵。日本政府認(rèn)為,提升日本競(jìng)爭(zhēng)力,大數(shù)據(jù)應(yīng)用不可或缺。日本在新一輪IT振興計(jì)劃中把發(fā)展大數(shù)據(jù)作為國(guó)家戰(zhàn)略的重要內(nèi)容,新的ICT戰(zhàn)略重點(diǎn)關(guān)注大數(shù)據(jù)應(yīng)用技術(shù)。日本總務(wù)省2012年7月推出了新的綜合戰(zhàn)略“活力ICT日本”,將重點(diǎn)關(guān)注大數(shù)據(jù)應(yīng)用,并將其作為2013年6個(gè)主要任務(wù)之一,聚焦大數(shù)據(jù)應(yīng)用所需的社會(huì)化媒體等智能技術(shù)開發(fā)以及在新醫(yī)療技術(shù)開發(fā)、緩解交通擁堵等公共領(lǐng)域的應(yīng)用。
此外,澳大利亞、新加坡等國(guó)也非常重視大數(shù)據(jù)發(fā)展。2013年8月初,澳大利亞出臺(tái)公共服務(wù)大數(shù)據(jù)政策,提出了大數(shù)據(jù)分析的實(shí)踐指南,希望通過大數(shù)據(jù)分析系統(tǒng)提升公共服務(wù)質(zhì)量,增加服務(wù)種類,為公共服務(wù)提供更好的政策指導(dǎo)。在新加坡,多個(gè)國(guó)際領(lǐng)先企業(yè)在該國(guó)設(shè)立大數(shù)據(jù)技術(shù)研發(fā)中心,加速數(shù)據(jù)分析技術(shù)的商業(yè)應(yīng)用。2014年初,新加坡資訊通信發(fā)展管理局(IDA)還聘請(qǐng)了首任首席數(shù)據(jù)科學(xué)家,專門推進(jìn)政府?dāng)?shù)據(jù)的開放和價(jià)值開發(fā)。
我國(guó)各界高度關(guān)注大數(shù)據(jù)的發(fā)展,積極推進(jìn)相關(guān)技術(shù)研發(fā)和應(yīng)用。目前,百度、騰訊、阿里巴巴等骨干互聯(lián)網(wǎng)企業(yè)已建立了世界上規(guī)模最大的大數(shù)據(jù)平臺(tái),單集群規(guī)模達(dá)到上萬臺(tái),在分布式系統(tǒng)、超大規(guī)模數(shù)據(jù)倉(cāng)庫(kù)、深度學(xué)習(xí)等關(guān)鍵技術(shù)上有所突破。大數(shù)據(jù)驅(qū)動(dòng)的互聯(lián)網(wǎng)、金融、流通、新媒體等跨界業(yè)務(wù)創(chuàng)新加速發(fā)展。但相對(duì)而言,我國(guó)大數(shù)據(jù)發(fā)展的信息化基礎(chǔ)薄弱,大數(shù)據(jù)前沿技術(shù)原創(chuàng)能力不足,關(guān)鍵產(chǎn)品和服務(wù)的供應(yīng)較為落后,大數(shù)據(jù)技術(shù)應(yīng)用的擴(kuò)散速度較慢,急需推動(dòng)促進(jìn)發(fā)展。
對(duì)我國(guó)來說,數(shù)據(jù)資源不豐富、技術(shù)差距大和法律法規(guī)不完善是當(dāng)前大數(shù)據(jù)發(fā)展面臨的主要問題[2]。
一是我國(guó)數(shù)據(jù)源不夠豐富,數(shù)據(jù)開放程度較低。豐富的高質(zhì)量數(shù)據(jù)資源是大數(shù)據(jù)產(chǎn)業(yè)發(fā)展的前提。近幾年在互聯(lián)網(wǎng)產(chǎn)業(yè)及金融、電信信息化快速發(fā)展的帶動(dòng)下,我國(guó)數(shù)據(jù)資源總量有了快速增長(zhǎng),已達(dá)到全球的13%,但其他行業(yè)受信息化水平制約,數(shù)據(jù)儲(chǔ)量仍不豐富。已有數(shù)據(jù)資源還存在標(biāo)準(zhǔn)化、準(zhǔn)確性、完整性低,利用價(jià)值不高的情況。同時(shí),我國(guó)政府、企業(yè)和行業(yè)信息化系統(tǒng)建設(shè)中受到各種因素制約,形成了眾多“信息孤島”。再加上體制機(jī)制、利益關(guān)系等還沒有理順,數(shù)據(jù)開放程度嚴(yán)重滯后于大數(shù)據(jù)發(fā)展需求。
二是我國(guó)大數(shù)據(jù)技術(shù)存在水平不高、技術(shù)擴(kuò)散不暢的問題。我國(guó)大數(shù)據(jù)技術(shù)的發(fā)展模式也與全球類似,互聯(lián)網(wǎng)企業(yè)具備快速將國(guó)際先進(jìn)的開源大數(shù)據(jù)技術(shù)整合到自身系統(tǒng)中的能力,并構(gòu)建了單集群上萬節(jié)點(diǎn)的大型系統(tǒng),但仍缺乏原創(chuàng)技術(shù),對(duì)開源社區(qū)的貢獻(xiàn)不足,進(jìn)而對(duì)前沿技術(shù)路線的影響比較微弱。同時(shí),由于本土開源社區(qū)等產(chǎn)業(yè)組織發(fā)育滯后,國(guó)內(nèi)領(lǐng)先企業(yè)在大數(shù)據(jù)方面的技術(shù)創(chuàng)新也難以向社會(huì)擴(kuò)散。以往我國(guó)在數(shù)據(jù)庫(kù)技術(shù)上的相對(duì)落后局面仍然沒有根本改變,商用大數(shù)據(jù)產(chǎn)品供給能力還比較薄弱,使得依賴供應(yīng)商的傳統(tǒng)行業(yè)大數(shù)據(jù)應(yīng)用水平受到限制。
三是大數(shù)據(jù)相關(guān)的法律法規(guī)有待進(jìn)一步完善。隨著大數(shù)據(jù)挖掘分析越來越精準(zhǔn)、應(yīng)用領(lǐng)域不斷擴(kuò)展,個(gè)人隱私保護(hù)和數(shù)據(jù)安全變得非常緊迫。在隱私保護(hù)方面,現(xiàn)有的法律體系面臨著兩個(gè)方面的挑戰(zhàn):一是法律保護(hù)的個(gè)人隱私,主要體現(xiàn)為個(gè)人可識(shí)別信息(personally identifiable information,PII),但隨著技術(shù)的推進(jìn),以往并非PII的數(shù)據(jù)也可能會(huì)成為PII,使得保護(hù)范圍變得模糊;二是以往建立在“目的明確、事先同意、使用限制”等原則之上的個(gè)人信息保護(hù)制度,在大數(shù)據(jù)場(chǎng)景下變得越來越難以操作。而我國(guó)個(gè)人信息保護(hù)、數(shù)據(jù)跨境流動(dòng)等方面的法律法規(guī)尚不健全,這成為制約大數(shù)據(jù)產(chǎn)業(yè)健康發(fā)展的重要原因之一。需要結(jié)合我國(guó)法治建設(shè)的實(shí)際情況,探索通過行業(yè)自律等方式彌補(bǔ)法律體系不完善的弊端。
針對(duì)大數(shù)據(jù)發(fā)展面臨的問題,需要加強(qiáng)統(tǒng)籌規(guī)劃,圍繞經(jīng)濟(jì)社會(huì)發(fā)展的實(shí)際需求,以市場(chǎng)為導(dǎo)向、以企業(yè)為主體、以加強(qiáng)公共數(shù)據(jù)資源開放共享和推動(dòng)政府和公共服務(wù)領(lǐng)域的大數(shù)據(jù)應(yīng)用為抓手,保障大數(shù)據(jù)安全,營(yíng)造發(fā)展環(huán)境,引領(lǐng)大數(shù)據(jù)在關(guān)鍵行業(yè)應(yīng)用,以突破關(guān)鍵技術(shù)為核心,拉動(dòng)培育自主可控產(chǎn)業(yè)體系,推動(dòng)大數(shù)據(jù)為經(jīng)濟(jì)社會(huì)可持續(xù)發(fā)展做出積極貢獻(xiàn)。本著這樣的思路,建議國(guó)家大數(shù)據(jù)戰(zhàn)略需要考慮數(shù)據(jù)資源、行業(yè)應(yīng)用、技術(shù)產(chǎn)品、法律法規(guī)和安全保障5個(gè)要素。
4.1 促進(jìn)大數(shù)據(jù)資源開放與流通
首先是加快推動(dòng)公共數(shù)據(jù)向社會(huì)開放。堅(jiān)持分級(jí)、分類、分階段開放的原則,著力推進(jìn)地理、人口、法人、金融、稅收、醫(yī)療、社保、農(nóng)業(yè)、交通、統(tǒng)計(jì)等公共數(shù)據(jù)對(duì)外開放力度,提升公共數(shù)據(jù)再利用水平。推進(jìn)政府?dāng)?shù)據(jù)建設(shè),健全政府?dāng)?shù)據(jù)管理制度,規(guī)范數(shù)據(jù)采集,保證信息數(shù)據(jù)質(zhì)量。引導(dǎo)企業(yè)應(yīng)用公共數(shù)據(jù),加大對(duì)民生類公共數(shù)據(jù)應(yīng)用的政策傾斜和支持力度。鼓勵(lì)有條件的地區(qū)開展試點(diǎn)建設(shè),探索開放模式,形成示范效應(yīng)。加強(qiáng)安全保障,保守國(guó)家秘密,維護(hù)社會(huì)倫理,保護(hù)個(gè)人隱私和商業(yè)秘密。
其次是促進(jìn)商業(yè)化數(shù)據(jù)流通交易。支持企業(yè)間點(diǎn)對(duì)點(diǎn)數(shù)據(jù)交換與共享,探索建立大數(shù)據(jù)交易市場(chǎng),開展大數(shù)據(jù)交易試點(diǎn),支持各行業(yè)數(shù)據(jù)的匯聚與交易,通過市場(chǎng)化機(jī)制促進(jìn)數(shù)據(jù)資源的有效流通。依托數(shù)據(jù)流通與交易實(shí)踐,引導(dǎo)形成數(shù)據(jù)流通交易規(guī)則體系,建立數(shù)據(jù)流通交易中的安全與隱私保護(hù)標(biāo)準(zhǔn),確保數(shù)據(jù)資源的有序流通。
4.2 深化行業(yè)大數(shù)據(jù)應(yīng)用
在應(yīng)用方面,政府首當(dāng)其沖,應(yīng)該帶頭利用大數(shù)據(jù)技術(shù)提升政府治理與社會(huì)服務(wù)能力。要培育政府部門應(yīng)用大數(shù)據(jù)提升政府治理能力的理念,重點(diǎn)推動(dòng)政府在國(guó)家統(tǒng)計(jì)、市場(chǎng)監(jiān)管、輿情監(jiān)測(cè)、環(huán)境保護(hù)、公共安全、國(guó)家安全等方面的大數(shù)據(jù)應(yīng)用,鼓勵(lì)政府以外包服務(wù)方式采購(gòu)大數(shù)據(jù)分析基礎(chǔ)設(shè)施和服務(wù)。支持醫(yī)療衛(wèi)生、食品安全、教育科研、城市交通、社會(huì)保障等眾多公共領(lǐng)域的企事業(yè)單位開展大數(shù)據(jù)應(yīng)用,推進(jìn)各公共服務(wù)領(lǐng)域的大數(shù)據(jù)應(yīng)用示范建設(shè),鼓勵(lì)公共領(lǐng)域機(jī)構(gòu)開展大數(shù)據(jù)創(chuàng)新,以提升公共服務(wù)能力并惠及民眾生活。
而在商業(yè)化應(yīng)用方面,政府應(yīng)該退后一步,把工作重點(diǎn)放在完善制度、創(chuàng)造環(huán)境方面,支持互聯(lián)網(wǎng)、電信等數(shù)據(jù)資源豐富、IT能力較強(qiáng)的企業(yè)深化內(nèi)部應(yīng)用,穩(wěn)妥有序地將自身數(shù)據(jù)資源和服務(wù)能力對(duì)外開放。一是鼓勵(lì)互聯(lián)網(wǎng)企業(yè)建設(shè)大數(shù)據(jù)分析平臺(tái),支撐內(nèi)部應(yīng)用,并將大數(shù)據(jù)能力向其他行業(yè)進(jìn)行輻射,推動(dòng)互聯(lián)網(wǎng)企業(yè)以在線云服務(wù)方式向傳統(tǒng)行業(yè)企業(yè)開放大數(shù)據(jù)分析平臺(tái)能力。二是支持電信企業(yè)在保障數(shù)據(jù)安全和個(gè)人隱私的前提下,充分利用電信行業(yè)豐富的數(shù)據(jù)資源,提升電信運(yùn)營(yíng)企業(yè)在客戶管理、市場(chǎng)營(yíng)銷、產(chǎn)品開發(fā)、網(wǎng)絡(luò)優(yōu)化等方面的大數(shù)據(jù)應(yīng)用水平,鼓勵(lì)電信企業(yè)對(duì)外提供數(shù)據(jù)資源與分析能力,為各類企業(yè)、行業(yè)單位和政府部門提供大數(shù)據(jù)服務(wù),促進(jìn)社會(huì)化大數(shù)據(jù)產(chǎn)業(yè)生態(tài)快速、有序發(fā)展。
4.3 突破大數(shù)據(jù)關(guān)鍵技術(shù)產(chǎn)品
首先,要攻克大數(shù)據(jù)核心關(guān)鍵技術(shù)。搭建國(guó)際化的學(xué)術(shù)交流和人才流動(dòng)平臺(tái),產(chǎn)、學(xué)、研、用聯(lián)合開展大數(shù)據(jù)理論研究。攻克面向EB級(jí)超大規(guī)模數(shù)據(jù)集的新型數(shù)據(jù)存儲(chǔ)、表示、管理和查詢關(guān)鍵技術(shù);面向文本、圖像、視頻大數(shù)據(jù)和物聯(lián)網(wǎng)感知數(shù)據(jù),研發(fā)自然語言分析、信息提取、知識(shí)表現(xiàn)、自動(dòng)化推理、機(jī)器學(xué)習(xí)等核心技術(shù),突破基于超大規(guī)模深度神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)相關(guān)理論與技術(shù),研發(fā)數(shù)據(jù)安全與隱私保護(hù)理論與技術(shù)。
其次,要大力培育自主可控的大數(shù)據(jù)產(chǎn)品與服務(wù)。整合國(guó)內(nèi)互聯(lián)網(wǎng)、制造企業(yè)和科研機(jī)構(gòu)力量,共同研發(fā)支持超大吞吐量的新一代融合并行分布式計(jì)算平臺(tái)、支持結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的大規(guī)模數(shù)據(jù)倉(cāng)庫(kù)、基于深度神經(jīng)網(wǎng)絡(luò)的超大規(guī)模數(shù)據(jù)分析引擎等平臺(tái)級(jí)軟件,培育自主開源軟件社區(qū),構(gòu)造生態(tài)鏈。大力發(fā)展面向垂直領(lǐng)域的數(shù)據(jù)分析、數(shù)據(jù)資產(chǎn)管理、商業(yè)智能應(yīng)用軟件和在線服務(wù)。
4.4 完善大數(shù)據(jù)法律法規(guī)
在個(gè)人隱私保護(hù)方面,要嚴(yán)格保護(hù)大數(shù)據(jù)應(yīng)用中的個(gè)人信息。落實(shí)全國(guó)人民代表大會(huì)常務(wù)委員會(huì)關(guān)于加強(qiáng)網(wǎng)絡(luò)信息保護(hù)的決定,探索制定大數(shù)據(jù)環(huán)境下數(shù)據(jù)收集、開放、交換、應(yīng)用等環(huán)節(jié)的個(gè)人信息保護(hù)指南,明確大數(shù)據(jù)應(yīng)用相關(guān)各方的個(gè)人信息保護(hù)義務(wù)和責(zé)任。
在個(gè)人和企業(yè)數(shù)據(jù)資產(chǎn)保護(hù)方面,要探索建立數(shù)據(jù)產(chǎn)權(quán)保護(hù)制度。探索制定信息資產(chǎn)管理制度,建立信息資源基本權(quán)利體系,明確各類市場(chǎng)主體所積累的信息資產(chǎn)所有權(quán)歸屬,建立規(guī)范化管理和使用機(jī)制,保護(hù)信息所有者、信息主體及公眾合法利益。
在國(guó)家數(shù)據(jù)主權(quán)方面,要建立數(shù)據(jù)跨境流動(dòng)管理制度。制定跨境數(shù)據(jù)流動(dòng)分級(jí)分類管理制度,涉及國(guó)家秘密、國(guó)家安全以及經(jīng)濟(jì)安全的數(shù)據(jù)嚴(yán)格禁止跨境,對(duì)政府和公共部門數(shù)據(jù)跨境流動(dòng),實(shí)施安全風(fēng)險(xiǎn)評(píng)估機(jī)制。建立外資安全審查機(jī)制,強(qiáng)化對(duì)外資的數(shù)據(jù)跨境流動(dòng)管理。
4.5 保障大數(shù)據(jù)安全
首先,要構(gòu)建大數(shù)據(jù)安全管理制度體系。加強(qiáng)大數(shù)據(jù)安全頂層設(shè)計(jì),積極推動(dòng)數(shù)據(jù)信息保護(hù)立法,加快大數(shù)據(jù)安全人才隊(duì)伍建設(shè)。探索建立面向政府信息采集和管控、敏感數(shù)據(jù)管理、數(shù)據(jù)交換標(biāo)準(zhǔn)和規(guī)則、個(gè)人隱私等領(lǐng)域的大數(shù)據(jù)安全保障制度,明確數(shù)據(jù)采集、使用、開放等環(huán)節(jié)涉及信息安全的范圍、要求和責(zé)任,確保國(guó)家利益、社會(huì)安全、商業(yè)秘密、個(gè)人隱私等信息不受侵犯。
其次,加強(qiáng)大數(shù)據(jù)安全保障能力建設(shè)。加強(qiáng)大數(shù)據(jù)安全基礎(chǔ)設(shè)施和軟硬件建設(shè),改變傳統(tǒng)的端級(jí)防護(hù)、單點(diǎn)布防的安全解決方案,提高針對(duì)大數(shù)據(jù)網(wǎng)絡(luò)攻擊、數(shù)據(jù)存儲(chǔ)應(yīng)用系統(tǒng)漏洞等安全防護(hù)能力。加強(qiáng)數(shù)據(jù)匿名保護(hù)、數(shù)據(jù)水印、數(shù)據(jù)溯源、角色挖掘、風(fēng)險(xiǎn)自適應(yīng)的訪問控制等大數(shù)據(jù)安全保護(hù)關(guān)鍵技術(shù)研究,從技術(shù)角度降低大數(shù)據(jù)泄露、濫用的風(fēng)險(xiǎn),保障大數(shù)據(jù)信息的合法、合理利用。
大數(shù)據(jù)的發(fā)展涉及資源、技術(shù)、產(chǎn)業(yè)、政策和法律等方方面面,不能完全依靠市場(chǎng),需要政府統(tǒng)籌謀劃,協(xié)同推動(dòng)。無論是從美、日、歐等國(guó)家和地區(qū)的政策實(shí)踐看,還是從國(guó)內(nèi)發(fā)展需求看,各方都認(rèn)為有必要盡快出臺(tái)我國(guó)的大數(shù)據(jù)國(guó)家戰(zhàn)略。
種種跡象表明,大數(shù)據(jù)戰(zhàn)略的出臺(tái)日益臨近。在2014年《政府工作報(bào)告》中就提出“設(shè)立新興產(chǎn)業(yè)創(chuàng)業(yè)創(chuàng)新平臺(tái),在新一代移動(dòng)通信、集成電路、大數(shù)據(jù)、先進(jìn)制造、新能源、新材料等方面趕超先進(jìn),引領(lǐng)未來產(chǎn)業(yè)發(fā)展”。2015年《政府工作報(bào)告》又提出了“推動(dòng)移動(dòng)互聯(lián)網(wǎng)、云計(jì)算、大數(shù)據(jù)、物聯(lián)網(wǎng)等與現(xiàn)代制造業(yè)結(jié)合”。工業(yè)和信息化部2015年工作重點(diǎn)中提出,要推動(dòng)出臺(tái)大數(shù)據(jù)應(yīng)用與發(fā)展指導(dǎo)性文件6http://www.miit. gov.cn/n11293472/ n11293832/ n11293907/ n11368223/ 16342761.html,并制定工業(yè)大數(shù)據(jù)創(chuàng)新發(fā)展指導(dǎo)意見7http://www.miit. gov.cn/n11293472/ n11293832/ n11293907/ n11368223/ 16342761.html。2015年國(guó)家發(fā)展和改革委員會(huì)在高技術(shù)工作年度工作會(huì)議上,進(jìn)一步明確提出要啟動(dòng)“國(guó)家大數(shù)據(jù)戰(zhàn)略及行動(dòng)計(jì)劃”8http://www.dqfgw. gov.cn/fgwweb/ WN010018/16681. htm。相信隨著相關(guān)政策的出臺(tái)和落地,數(shù)據(jù)割據(jù)、技術(shù)薄弱、法規(guī)缺失等問題將得到改善,大數(shù)據(jù)在我國(guó)的應(yīng)用發(fā)展也將邁上新的臺(tái)階。
[1] 沈國(guó)麟. 大數(shù)據(jù)時(shí)代的數(shù)據(jù)主權(quán)和國(guó)家數(shù)據(jù)戰(zhàn)略. 南京社會(huì)科學(xué), 2014(6): 113~119 Shen G L. Data sovereignty and national strategy in big data era. Nanjing Journal of Social Sciences, 2014(6): 113~119
[2] 工業(yè)和信息化部電信研究院. 大數(shù)據(jù)白皮書(2014). http://www.catr.cn/kxyj/qwfb/ bps/201405/t20140512_1017466.html, 2014 China Academy of Telecommunication Research of MIIT. Big data white paper (2014). http://www.catr.cn/kxyj/qwfb/ bps/201405/t20140512_1017466.html, 2014
Wei K. Some considerations on the China national big data strategy. Big Data Research, 2015010
Some Considerations on the China National Big Data Strategy
Wei Kai
China Academy of Information and Communications Technology, Beijing 100191, China
Big data is a kind of critical development resources. The ability of control and analysis on big data become the foundation of a country’s competitiveness in future. Although China's big data development has a good start, there are a couple of challenges ahead, e.g., the open government and public data are insufficient, big data application is not widespread, core technologies R&D still need to be strengthened, privacy and information security are facing new risks. Currently, developing a national big data strategy is approaching a common agreement. While how to develop the strategy and what should to be considered are hot topics among the industry and government experts. Therefore, some considerations were proposed based on both other countries practice and domestic research.
big data, national strategy, law and regulation
魏凱,男,中國(guó)信息通信研究院(原工業(yè)和信息化部電信研究院)通信標(biāo)準(zhǔn)研究所移動(dòng)與大數(shù)據(jù)研究部副主任、高級(jí)工程師,國(guó)際電信聯(lián)盟(ITU-T)標(biāo)準(zhǔn)化局第16研究組Q21聯(lián)合報(bào)告人,數(shù)據(jù)中心聯(lián)盟大數(shù)據(jù)組組長(zhǎng),中關(guān)村大數(shù)據(jù)交易產(chǎn)業(yè)聯(lián)盟副秘書長(zhǎng)。主要從事互聯(lián)網(wǎng)技術(shù)、標(biāo)準(zhǔn)與產(chǎn)業(yè)政策研究工作。主持和參與科學(xué)技術(shù)部、國(guó)家發(fā)展和改革委員會(huì)、工業(yè)和信息化部科研和產(chǎn)業(yè)化項(xiàng)目。近年來參與國(guó)務(wù)院《關(guān)于促進(jìn)云計(jì)算創(chuàng)新發(fā)展培育信息產(chǎn)業(yè)新業(yè)態(tài)的意見》、工業(yè)和信息化部等5個(gè)部委《關(guān)于數(shù)據(jù)中心建設(shè)布局的指導(dǎo)意見》等重要政策文件的起草。發(fā)表論文30多篇,申請(qǐng)發(fā)明專利1項(xiàng),主持完成通信行業(yè)標(biāo)準(zhǔn)10多項(xiàng)、ITU-T國(guó)際建議書2項(xiàng),3次獲得省部級(jí)科學(xué)技術(shù)獎(jiǎng)。
2015-05-03;
2015-05-10
魏凱. 對(duì)大數(shù)據(jù)國(guó)家戰(zhàn)略的幾點(diǎn)考慮. 大數(shù)據(jù), 2015010