茶洪旺 付偉 鄭婷婷
中國數(shù)據(jù)產(chǎn)業(yè)還處于起步階段,在快速發(fā)展的同時,仍然面臨五個方面的問題和挑戰(zhàn)。
部分重要數(shù)據(jù)規(guī)則尚未建立
數(shù)據(jù)權屬是運用市場手段配置數(shù)據(jù)資源和提高數(shù)據(jù)使用效率的基礎,也是當前制約數(shù)據(jù)收集、交易和利用等關鍵環(huán)節(jié)發(fā)展的核心問題。數(shù)據(jù)權屬不清,一方面導致數(shù)據(jù)擁有方不愿或不敢把數(shù)據(jù)拿出來交易和共享,另一方面基于原始的用戶數(shù)據(jù),在去除個人身份屬性之后的數(shù)據(jù)產(chǎn)權的歸屬問題不明確,直接制約了數(shù)據(jù)交易和流動的發(fā)展步伐,也嚴重掣肘了數(shù)據(jù)產(chǎn)業(yè)的發(fā)展。《促進大數(shù)據(jù)發(fā)展行動綱要》明確提出要加快法規(guī)制度建設,研究推動數(shù)據(jù)資源權益相關立法工作。但是,目前數(shù)據(jù)立法工作進展非常緩慢,不利于產(chǎn)業(yè)持續(xù)健康發(fā)展。
由于既缺乏政府監(jiān)管層面對數(shù)據(jù)利用規(guī)則的原則性規(guī)定,也缺少行業(yè)組織針對特殊領域的數(shù)據(jù)交易、處理、共享、利用方面的規(guī)則和指引,企業(yè)普遍不愿與外界共享數(shù)據(jù)、交易數(shù)據(jù),數(shù)據(jù)相關的業(yè)務模式和商業(yè)模式創(chuàng)新方面仍然會面臨一系列問題。與之對應的是,數(shù)據(jù)領域非常容易成為灰色地帶,地下數(shù)據(jù)交易非常猖獗,部分企業(yè)和個人單純追求經(jīng)濟利益鋌而走險,大量收集和濫用個人數(shù)據(jù),甚至是敏感數(shù)據(jù),或供自己利用牟利,或進行出售販賣牟利,完全不顧及個人隱私保護和數(shù)據(jù)所有者的權益保護等問題。
我國數(shù)據(jù)保護相關的法律法規(guī)仍不健全,政府信息資源開放共享制度仍然缺位,適應數(shù)據(jù)產(chǎn)業(yè)發(fā)展的個人信息保護、數(shù)據(jù)資產(chǎn)保護等制度體系尚未建立。部分廠商尚未意識到數(shù)據(jù)的重要性,缺乏保護數(shù)據(jù)資源的意識,而技術能力的不足也使得相關廠商無法真正有效地廣泛存儲、利用和保護屬于自己的數(shù)據(jù)。同時,對侵犯數(shù)據(jù)隱私和安全的相關行為處罰不足,包括攜程、支付寶、天涯網(wǎng)、12306等眾多互聯(lián)網(wǎng)企業(yè)發(fā)生了多起重大的數(shù)據(jù)泄露事件,但是對涉事企業(yè)的處罰力度過輕。
核心技術研發(fā)投入不足
目前,我國數(shù)據(jù)產(chǎn)業(yè)在結構上仍以數(shù)據(jù)應用層為主,企業(yè)仍以中小企業(yè)為主,鮮有營業(yè)收入超過10億元的平臺型生態(tài)企業(yè)。參與工信部2018年大數(shù)據(jù)優(yōu)秀產(chǎn)品和應用解決方案征集活動的企業(yè)中,大數(shù)據(jù)業(yè)務收入低于1000萬元的達205家,占比超40%,僅8家企業(yè)大數(shù)據(jù)業(yè)務收入超過10億元,而146家大數(shù)據(jù)業(yè)務收入占比超過90%的企業(yè)中,研發(fā)投入共計14.76億元,占全部企業(yè)研發(fā)投入的比重僅為1.99%。
此外,中國數(shù)據(jù)產(chǎn)業(yè)生態(tài)建設方面也面臨挑戰(zhàn)。首先,缺乏掌握核心技術的企業(yè)。本土數(shù)據(jù)企業(yè)技術積累薄弱,在底層架構和核心算法方面不具備優(yōu)勢。其次,數(shù)據(jù)產(chǎn)業(yè)鏈構建不完整。數(shù)據(jù)產(chǎn)業(yè)的發(fā)展需要從底層芯片到基礎軟件再到應用分析軟件等信息產(chǎn)業(yè)全產(chǎn)業(yè)鏈的支撐,目前國內(nèi)無論是新型計算平臺、分布式計算架構,還是大數(shù)據(jù)處理、分析和呈現(xiàn)方面與國外均存在較大差距,難以滿足各行各業(yè)數(shù)據(jù)應用需求。最后,缺乏主導生態(tài)建設的企業(yè)。我國關鍵數(shù)據(jù)技術的創(chuàng)新和開源生態(tài)建設方面還處于跟隨狀態(tài),相關企業(yè)主要基于已有的開源平臺進行優(yōu)化和構建適合自身業(yè)務需求的數(shù)據(jù)平臺,缺乏構建產(chǎn)業(yè)生態(tài)的技術實力和資金支持。
數(shù)據(jù)產(chǎn)業(yè)創(chuàng)新要素投入不足
數(shù)據(jù)產(chǎn)業(yè)是典型的知識密集型、資本密集型的新興產(chǎn)業(yè),人才、資本等創(chuàng)新要素投入是驅(qū)動產(chǎn)業(yè)發(fā)展的核心動力。數(shù)據(jù)產(chǎn)業(yè)面臨創(chuàng)新要素投入不足,要素投入帶來的市場績效水平不高的問題。
數(shù)據(jù)產(chǎn)業(yè)發(fā)展需要大量的復合型人才,但目前國內(nèi)數(shù)據(jù)人才隊伍不足,遠不能滿足發(fā)展需要,尤其是缺乏既熟悉行業(yè)業(yè)務需求,又掌握大數(shù)據(jù)技術與管理的綜合型人才。
雖然全社會融資和投資規(guī)模都非??捎^,總的資本要素相對充足,但是流入數(shù)據(jù)產(chǎn)業(yè)領域的資本總量仍然較少,主要以風險投資機構、大中型企業(yè)、公開市場發(fā)行股份等為主。此外,中國數(shù)據(jù)產(chǎn)業(yè)投融資主要集中在數(shù)據(jù)應用層,投資回報周期較長的數(shù)據(jù)資源層和投資風險較大的數(shù)據(jù)技術層獲得較大數(shù)額的投資仍然非常困難。一方面,由于我國的數(shù)據(jù)技術原始創(chuàng)新能力不足,數(shù)據(jù)企業(yè)之間的競爭處于相互壟斷數(shù)據(jù)資源,利用價格戰(zhàn)爭奪數(shù)據(jù)應用市場階段,但是受制于企業(yè)成本不斷增加,提供的數(shù)據(jù)應用服務效果差強人意,使得大量的創(chuàng)新要素投入并沒有產(chǎn)生應有的市場績效。另一方面,數(shù)據(jù)資源規(guī)模和數(shù)據(jù)技術應用深度尚未達到明顯提升企業(yè)市場績效的拐點,因此還顯示出績效水平低于投入成本。應該看到各類創(chuàng)新資源要素的投入所產(chǎn)生的市場效益還未顯現(xiàn)。
地方政府存在急于求成心態(tài)
一些地方政府急于求成的心態(tài)比較嚴重,“囫圇吞棗”出政策、上項目。通過對比發(fā)現(xiàn),各省市區(qū)和地級市層面的政策規(guī)劃和措施同質(zhì)化非常嚴重,沒有充分考慮地方產(chǎn)業(yè)實際,也沒有考慮區(qū)域資源稟賦及周邊環(huán)境等因素,部分文件只是換個名稱而已。通過近幾年的宣傳報道和炒作,數(shù)據(jù)作為重要產(chǎn)業(yè)已是共識。在政績和輿論的雙重壓力下,快速出臺各類數(shù)據(jù)產(chǎn)業(yè)的促進政策文件是政府優(yōu)先考慮的方式之一。以數(shù)據(jù)交易所為例,自2015年貴陽大數(shù)據(jù)交易所成立以來,短期內(nèi)政府主導的數(shù)據(jù)交易所如雨后春筍般涌現(xiàn)出來,上海數(shù)據(jù)交易中心、華東江蘇大數(shù)據(jù)交易平臺、安徽淮南數(shù)海大數(shù)據(jù)交易平臺、浙江大數(shù)據(jù)交易中心、哈爾濱數(shù)據(jù)交易中心、錢塘江大數(shù)據(jù)交易中心、北京大數(shù)據(jù)交易支撐平臺、陜西省大數(shù)據(jù)交易所等紛紛成立。更有甚者,僅武漢就有三個數(shù)據(jù)交易所,即武漢長江數(shù)據(jù)交易所、東湖大數(shù)據(jù)交易中心、華中數(shù)據(jù)交易所。
實際上,流動是數(shù)據(jù)的天然屬性,數(shù)據(jù)流動的自由度越高,越有助于數(shù)據(jù)產(chǎn)業(yè)和數(shù)字經(jīng)濟發(fā)展。地方政府采取分裂割據(jù)的方式新建數(shù)據(jù)交易所,必然會對數(shù)據(jù)自由流動造成阻礙,最終影響數(shù)據(jù)產(chǎn)業(yè)的發(fā)展。
數(shù)據(jù)產(chǎn)業(yè)風險防控能力不足
數(shù)據(jù)安全問題始終是國家關注的重點,安全問題不解決數(shù)據(jù)產(chǎn)業(yè)就難以獲得快速發(fā)展??傮w來看,中國數(shù)據(jù)產(chǎn)業(yè)面臨四個方面的安全問題。
一是數(shù)據(jù)安全保障滯后于發(fā)展步伐,全方位覆蓋國家數(shù)據(jù)安全、數(shù)據(jù)跨境流動管理、企業(yè)數(shù)據(jù)資產(chǎn)管理、數(shù)據(jù)權益歸屬、數(shù)據(jù)流通交易、個人信息保護等方面的數(shù)據(jù)安全保障體系尚不健全。
二是數(shù)據(jù)基礎設施頻受攻擊,數(shù)據(jù)丟失及泄露風險加大。Hadoop、Spark等開源架構在設計之初并未充分考慮安全和隱私保護的需求,其安全機制往往偏簡單和粗放。隨著數(shù)據(jù)應用走向深入,觸及的行業(yè)和領域越來越廣,大數(shù)據(jù)基礎設施在安全技術和標準等方面的不足已經(jīng)逐漸凸顯出來。
三是新型網(wǎng)絡威脅層出不窮,黑客和竊密活動十分猖獗。國家互聯(lián)網(wǎng)應急中心的數(shù)據(jù)顯示,2017年我國監(jiān)測獲得的木馬或僵尸程序控制服務器IP地址總數(shù)為97300個,其中境外木馬或僵尸程序控制服務器IP地址數(shù)量為49957個,占比51.3%,仿冒我國境內(nèi)網(wǎng)站的釣魚頁面49493個,涉及IP地址25048個,其中85.4%位于境外。
可以預見,未來生產(chǎn)生活中大量應用的信息系統(tǒng)和互聯(lián)網(wǎng)基礎設施仍可能出現(xiàn)更多嚴重的漏洞,數(shù)據(jù)平臺和應用面臨巨大的風險。
四是數(shù)據(jù)資源使用需求強烈,開放共享與安全保護矛盾凸顯。開放和共享是發(fā)展數(shù)據(jù)產(chǎn)業(yè)的必然要求,然而脫離安全保護的開放和共享是不現(xiàn)實和危險的。當數(shù)據(jù)應用涉及到多方數(shù)據(jù)的開放和共享時,安全問題就復雜化了,特別是當其中還涉及到用戶隱私數(shù)據(jù)和國計民生數(shù)據(jù)時。如何平衡開放共享的需求和安全保護的需求,這既是一個技術問題也是一個政策問題。