摘要: 文章通過文獻(xiàn)研究追溯概念產(chǎn)生的背景發(fā)現(xiàn),“數(shù)據(jù)資源”概念的產(chǎn)生并非只是由政策話語單一因素主導(dǎo),大數(shù)據(jù)和人工智能算法技術(shù)的成功商用是這一概念產(chǎn)生的直接原因,同時從語言學(xué)的視角看,信息學(xué)與信息社會學(xué)的發(fā)展使得相近概念之間發(fā)生了語義上的借用現(xiàn)象,“信息資源”“資產(chǎn)”等概念對“數(shù)據(jù)資源”概念的形成產(chǎn)生了重要影響,最終在商業(yè)價值和政策價值的共同驅(qū)動下誕生了“數(shù)據(jù)資源”概念。2004年底,國家數(shù)據(jù)局從“價值”角度首次對這一概念做出定義并嘗試以“市場化”為突破口,在匯聚各方的價值實踐中將“數(shù)據(jù)資源”這一復(fù)雜、抽象的概念具象化,至此“數(shù)據(jù)資源”概念的發(fā)展進入價值實踐的新階段。
關(guān)鍵詞:大數(shù)據(jù);信息學(xué);信息社會學(xué);語言學(xué);數(shù)據(jù)資源
中圖分類號:N04;G20DOI:10.12339/j.issn.1673-8578.2025.02.004
An Exploration of the Conceptual Formation of “Data Resources”//YAN Mingchi
Abstract: This article traces the background of the concept through literature research and finds that the emergence of the concept of “data resources” is not solely driven by policy discourse, and the successful commercialization of big data and artificial intelligence algorithm technology is the direct cause of its emergence. At the same time, from a linguistic perspective, the development of informatics and information sociology has led to semantic borrowing between similar concepts. Concepts such as “information resources” and “assets” have had an important impact on the formation of the concept of “data resources”. Ultimately driven by the joint drive of commercial value and policy value, the concept of “data resources” was born. At the end of 2004, the National Data Administration first defined this concept from the perspective of “value” and attempted to use “marketization” as a breakthrough point to concretize the complex and abstract concept of “data resources” by gathering value practices from all parties. Thus, the development of the concept of “data resources” entered a new stage of value practice.
Keywords: big data; informatics; information sociology; linguistics; data resources
0引言
當(dāng)今世界,“數(shù)據(jù)”已然成為社會重要的生產(chǎn)資料和經(jīng)濟資源,盡管接近2024年尾聲這一概念才獲得官方定義[1],但“數(shù)據(jù)資源”的提法卻已在政策文件、行業(yè)交流以及公眾認(rèn)知中廣泛存在。而正是由于長期缺乏對這一概念的準(zhǔn)確界定,實際使用中有關(guān)“數(shù)據(jù)資源”的性質(zhì)、特征、法律地位、使用方式等問題逐步顯露出來,成為阻礙進一步開發(fā)利用、實現(xiàn)資源價值的重要因素。對此,本文認(rèn)為有必要重新回顧此概念產(chǎn)生的背景,由此加深對其概念特性及邊界的認(rèn)識,亦可對概念自身的發(fā)展趨勢做出更為清晰的判斷?!皵?shù)據(jù)資源”概念產(chǎn)生的背景主要包含技術(shù)、理論、現(xiàn)實三方面,其中技術(shù)背景最為直接,而理論背景和現(xiàn)實背景也極為重要,三者共同作用,形成了當(dāng)下我們所熟知的“數(shù)據(jù)資源”概念。
1“數(shù)據(jù)資源”概念產(chǎn)生的技術(shù)背景
追溯“數(shù)據(jù)資源”概念的產(chǎn)生背景,普遍認(rèn)為2015年國務(wù)院發(fā)布《促進大數(shù)據(jù)發(fā)展行動綱要》是這一概念得以正式確立的標(biāo)志,文件首次提出將“數(shù)據(jù)”列為國家基礎(chǔ)性戰(zhàn)略資源,“數(shù)據(jù)資源”的提法第一次被正式寫入國家政策性文件。在此之前,中國信通院2014年發(fā)布的首份大數(shù)據(jù)白皮書將“數(shù)據(jù)資源”和“平臺”共稱為大數(shù)據(jù)技術(shù)創(chuàng)新的基礎(chǔ)條件[2]9-19,由此可見,國家政策話語體系中的“數(shù)據(jù)資源”與大數(shù)據(jù)技術(shù)具有高度相關(guān)性,考察大數(shù)據(jù)技術(shù)的產(chǎn)生和特性對于了解“數(shù)據(jù)資源”概念具有重要參考意義。
1.1“大數(shù)據(jù)”技術(shù)賦予“數(shù)據(jù)資源”基本義
所謂大數(shù)據(jù)技術(shù),是基于云計算技術(shù)的一系列大規(guī)模數(shù)據(jù)處理技術(shù)的總稱。2003年左右,隨著互聯(lián)網(wǎng)門戶搜索需求的增長,以美國谷歌為代表的國外IT公司率先開發(fā)出云計算技術(shù)(包含一系列存儲、分布式計算、虛擬化等技術(shù))以應(yīng)對海量半結(jié)構(gòu)/非結(jié)構(gòu)化數(shù)據(jù)的應(yīng)用需求[2]1,這一技術(shù)的出現(xiàn)將各種原本存儲在終端機的應(yīng)用遷移至服務(wù)器,解決了個人計算機(PC)時代人們對于終端的依賴問題,也激發(fā)了更多諸如遠(yuǎn)程文件操作、計算能力共用、海量數(shù)據(jù)存儲等應(yīng)用需求,當(dāng)然也帶來更大的數(shù)據(jù)量[3]。2006年,基于云計算技術(shù),數(shù)據(jù)計算任務(wù)管理工具MapReduce問世;2010年之后,為應(yīng)對互聯(lián)網(wǎng)業(yè)務(wù)中海量數(shù)據(jù)的存儲、調(diào)用問題,出現(xiàn)了可非隨機讀寫的第二代云計算文件系統(tǒng)CFS和隨機讀寫的BigTable處理系統(tǒng),這些系統(tǒng)與MapReduce、Hadoop、Borg等工具一起被稱為“云資源管理工具”。這一類專門用來解決數(shù)據(jù)匯聚后處理機制問題的技術(shù)被統(tǒng)稱為“大數(shù)據(jù)技術(shù)”[2]9-19,而大數(shù)據(jù)技術(shù)處理對象或者說“大數(shù)據(jù)”本身就是今天“數(shù)據(jù)資源”的基本義。
根據(jù)Gartner的定義:“大數(shù)據(jù)”是“需要具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力處理的海量、高增長率和多樣化的信息資產(chǎn)”,而更為業(yè)界所接受的是關(guān)于“大數(shù)據(jù)”的4V特征(即規(guī)模性、高速性、多樣性、準(zhǔn)確性)[4],因此理論上“數(shù)據(jù)資源”也應(yīng)該具有相同的性質(zhì),“數(shù)據(jù)資源”具有相應(yīng)的技術(shù)特性(大量、高速、可分析)與價值特性,這也為“數(shù)據(jù)資源”確立了基本概念邊界。然而由于國內(nèi)外一直都沒有將“數(shù)據(jù)資源”明確為一個獨立概念,在技術(shù)發(fā)展早期,并沒有“數(shù)據(jù)資源”的慣用提法,與技術(shù)有關(guān)的概念大多習(xí)慣于直接使用技術(shù)名稱,上文提到的“云資源”概念中的“云”字就直接來自“云計算”技術(shù),類似的如“協(xié)議?!薄瓣P(guān)系模型”這些技術(shù)概念中的“協(xié)議”“關(guān)系”[5]等術(shù)語也都有確定的技術(shù)形態(tài),但“數(shù)據(jù)資源”所描述的對象(即以數(shù)據(jù)為形態(tài)的資源)范圍隨著描述對象的發(fā)展而變化,并不屬于某種具體的技術(shù)概念或?qū)S眯g(shù)語①。計算機領(lǐng)域的專業(yè)技術(shù)人員、產(chǎn)品用戶也都很少使用“數(shù)據(jù)資源”這一概念,因此從特征角度來認(rèn)識“數(shù)據(jù)資源”較難形成共識。2014年中國信通院發(fā)布的《大數(shù)據(jù)白皮書》將“數(shù)據(jù)資源”定位為“創(chuàng)新的基礎(chǔ)”而不是“技術(shù)的基礎(chǔ)”,是比較準(zhǔn)確的。
1.2機器學(xué)習(xí)算法技術(shù)推動“數(shù)據(jù)資源”走向商用
除了大數(shù)據(jù)技術(shù),機器學(xué)習(xí)算法技術(shù)對于“數(shù)據(jù)資源”概念的產(chǎn)生也發(fā)揮了重要作用,卻易被忽視。機器學(xué)習(xí)算法從根本上改變了之前計算機只能執(zhí)行有限算法的運行模式(即“規(guī)則模式”),它通過不斷提供“輸入數(shù)據(jù)”和“(人為)結(jié)果判定”,不需要“規(guī)則”計算機就可以從概率中“獲取經(jīng)驗”,盡管并不清楚“經(jīng)驗”的具體機理,但卻能從概率的角度最大限度地拿到正確結(jié)果并自動生成最優(yōu)算法,數(shù)據(jù)量成為影響結(jié)果準(zhǔn)確率的關(guān)鍵因素。“誰有最多的數(shù)據(jù),誰就能學(xué)到最好的模型,誰學(xué)到最好的模型,誰就能吸引最多的用戶”[6],而這一點使得算法在機理上賦予數(shù)據(jù)以“資源”的屬性,這些數(shù)據(jù)以信息、機理(知識)、參數(shù)、流程等變量形式被代入算法,也就成為“算法的資源”。
機器學(xué)習(xí)算法在20世紀(jì)90年代中期就已經(jīng)在語音識別領(lǐng)域開始應(yīng)用,在21世紀(jì)初則通過支撐互聯(lián)網(wǎng)應(yīng)用尤其是郵件自動過濾、搜索結(jié)果排序、廣告業(yè)務(wù)推送等業(yè)務(wù)實現(xiàn)大規(guī)模商用。2006年,基于神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)算法被提出,加之云計算技術(shù)為各種數(shù)據(jù)處理工具(大數(shù)據(jù)技術(shù))打通了“資源”供給的“通道”,“通道”中的各類數(shù)據(jù)被繼續(xù)加工成包括結(jié)構(gòu)/半結(jié)構(gòu)/非結(jié)構(gòu)、流數(shù)據(jù)等可用的“數(shù)據(jù)資源”,提供給不同用途的機器學(xué)習(xí)算法生成最優(yōu)函數(shù)。這一技術(shù)模式早期主要為互聯(lián)網(wǎng)業(yè)務(wù)服務(wù),隨著適用于不同場景的算法不斷涌現(xiàn),原本看似無用的沉淀數(shù)據(jù)都可被加以利用和計算,這種“學(xué)習(xí)—反饋”模式被復(fù)制到各行各業(yè),很快就在商務(wù)分析、生活消費、傳媒娛樂、工業(yè)制造甚至科學(xué)研究領(lǐng)域得到驗證,其商業(yè)價值的受關(guān)注程度在2011—2014年快速增長[7]。以上就是“數(shù)據(jù)資源”概念產(chǎn)生的技術(shù)背景。
2“數(shù)據(jù)資源”概念產(chǎn)生的理論背景
有別于技術(shù)實踐對于概念的直接塑造,基礎(chǔ)理論對于新概念的出現(xiàn)往往秉持更為“科學(xué)”的嚴(yán)肅態(tài)度[8]。盡管“數(shù)據(jù)資源”概念的產(chǎn)生有著復(fù)雜的背景,但還是可以從基礎(chǔ)理論中找到解釋,信息學(xué)、社會學(xué)、語言學(xué)及其分支學(xué)科都在這一過程中發(fā)揮了關(guān)鍵作用。
2.1信息學(xué)和信息社會學(xué)為“數(shù)據(jù)資源”概念的產(chǎn)生提供理論基礎(chǔ)
首先是信息學(xué)理論。1963年,日本社會學(xué)家梅棹忠夫參照“工業(yè)化”概念在其著作《信息產(chǎn)業(yè)論》中首次提出“信息化”概念,4年后日本科技與經(jīng)濟研究會正式提出“信息化”的定義:“信息化是向信息產(chǎn)業(yè)高度發(fā)達(dá)且在產(chǎn)業(yè)結(jié)構(gòu)中占優(yōu)勢地位的社會——信息社會前進的動態(tài)過程,它反映了由可觸摸的物質(zhì)產(chǎn)品起主導(dǎo)作用向難以捉摸的信息產(chǎn)品起主導(dǎo)作用的根本性轉(zhuǎn)變”[9]。幾乎同一時刻,美國經(jīng)濟學(xué)家馬克盧普正從計量經(jīng)濟的角度對“信息”的界定問題發(fā)起挑戰(zhàn),他率先從“信息”中剝離出“知識”這一概念,也因此被后人稱為“信息社會”和“知識產(chǎn)業(yè)”(知識經(jīng)濟)研究的先驅(qū)[10]。此后,“信息”代替“情報”“計算”等概念成為信息概念體系的“元概念”,并在不斷豐富中形成兩條截然不同的發(fā)展路徑。一條是以應(yīng)用計算技術(shù)本身發(fā)展為主線,通過技術(shù)不斷演進衍生出新技術(shù)術(shù)語。20世紀(jì)70年代初,法國學(xué)者提出“信息學(xué)”(Informatique)概念。起初這一提法并不被英語系國家及蘇聯(lián)所接受,“操英語者回避此詞,是因為他們早在法國人之前就已在利用‘計算機科學(xué)’(Computer Science)這一術(shù)語。按其含義而論,它同法語的‘信息學(xué)’(Informatique)可謂等義詞。至于我們(蘇聯(lián))不肯接受這一術(shù)語的根由,是在于我們對待新術(shù)語的看法總持有一種莫名其妙的固執(zhí)的保守思想”[11]。但經(jīng)過廣泛爭論后,“信息學(xué)”概念最終被包括美國在內(nèi)的西方主流學(xué)界所接受,并發(fā)展成為一門融合了信息處理、自動化、計算技術(shù)的獨立學(xué)科,這一概念的出現(xiàn)也被確立為“第三次信息革命”的標(biāo)志。
其次是信息社會學(xué),這也是“信息”概念的另一條發(fā)展路徑,即以理論間橫向發(fā)展為主線,信息研究通過與經(jīng)濟管理學(xué)、社會學(xué)等學(xué)科不斷融合,衍生出“信息經(jīng)濟”“信息社會”“信息管理”等新概念?!靶畔⒐芾怼薄靶畔⑸鐣W(xué)”先后確立了各自的學(xué)科定義、研究對象、研究方法、研究任務(wù),并發(fā)展成為獨立學(xué)科,尤以信息學(xué)與社會學(xué)的結(jié)合——“信息社會學(xué)”最具影響力。20世紀(jì)60—70年代,美國著名社會學(xué)家貝爾開創(chuàng)了“后工業(yè)化社會”理論,他將技術(shù)作為社會類型劃分的標(biāo)準(zhǔn),“資本與勞動是工業(yè)社會的主要結(jié)構(gòu)特征,信息和知識則是后工業(yè)社會的主要結(jié)構(gòu)特征”。1977年,美國經(jīng)濟學(xué)家波拉特延續(xù)定量研究的經(jīng)濟學(xué)傳統(tǒng),創(chuàng)造性地將“信息”確立為一種產(chǎn)業(yè)類型,進而提出“信息經(jīng)濟”的概念,將“信息”研究引向經(jīng)濟學(xué)領(lǐng)域[10]。1978年,法國學(xué)者在政府支持下開展了關(guān)于“社會的信息化”研究,該研究成果于兩年后提交給法國政府,法國也成為第一個在國家層面將“信息化”概念術(shù)語化的西方國家[12]。此后,以美國學(xué)者托夫勒、奈斯比特和日本學(xué)者松田米津等為代表的西方未來學(xué)、社會學(xué)、經(jīng)濟學(xué)學(xué)者紛紛參與到對信息技術(shù)如何影響社會發(fā)展的研究中。20世紀(jì)80年代初,他們撰寫的《第三次浪潮》《預(yù)測與提前》《大趨勢》《信息社會》等著作一經(jīng)引入國內(nèi)便迅速在學(xué)界、產(chǎn)業(yè)界甚至普通民眾中引起了廣泛討論,部分結(jié)論直接被我國高層所接受。我國在20世紀(jì)70年代末開始接受并運用這些概念。1983年8月,我國電子工業(yè)部(現(xiàn)名為工業(yè)和信息化部)在《美國、加拿大電子工業(yè)考察報告》中提到,“美國已進入以電子技術(shù)廣泛應(yīng)用為重要標(biāo)志的信息社會……美國電子工業(yè)構(gòu)成,已經(jīng)從過去以通信、廣播電視工業(yè)為主,發(fā)展成為以電子計算機、通信設(shè)備、半導(dǎo)體工業(yè)為支柱的現(xiàn)代信息產(chǎn)業(yè)”[13]。由此,“信息化理論體系得以建立, 并指導(dǎo)著信息化社會的構(gòu)建”[14]。在信息學(xué)的視域下,信息同材料和能源一樣“已作為一種資源來看待”,“信息資源”以信息庫的形式被加以利用,“不但避免了重復(fù)前人的工作,而且可以代替人類的一部分勞動”[15]。而在信息社會學(xué)看來,信息資源的社會利用、社會信息資源的配置等問題是信息社會學(xué)學(xué)者重點研究的對象[16]。在這些信息理論的影響下,“數(shù)據(jù)資源”概念的提出顯然借鑒了“信息資源”的提法。
2.2語言學(xué)為“數(shù)據(jù)資源”概念的命名提供理論解釋
盡管信息學(xué)和信息社會學(xué)理論為“數(shù)據(jù)”成為“資源”提供了理論上的可能性,“數(shù)據(jù)”究竟是如何“取代”了“信息”的中心位置,這一點還需要從語言學(xué)中尋找答案。概念研究本就是語言學(xué)重要的研究范疇,語言學(xué)及其分支不僅為“信息資源”向“數(shù)據(jù)資源”概念“遷移”提供了解釋,對于概念的結(jié)構(gòu)、釋義、屬性甚至應(yīng)用也都可以做出相應(yīng)的方法論和理論闡釋。
作為語言學(xué)分支,近年來信息技術(shù)領(lǐng)域的術(shù)語學(xué)研究發(fā)現(xiàn),該領(lǐng)域普遍存在通過比喻來創(chuàng)制術(shù)語的現(xiàn)象。比喻型術(shù)語必須有表比喻義的詞項,而對表基本義的詞項則并無硬性要求,比較典型的例子如“信息港”“軟件包”“黑盒測試”等都遵守此原則。術(shù)語學(xué)認(rèn)為信息技術(shù)領(lǐng)域偏好這一現(xiàn)象[17]。近年來通過不斷與其他學(xué)科交叉,語言學(xué)原有的研究范圍和研究方法獲得突破,其中認(rèn)知語言學(xué)就認(rèn)為“比喻(隱喻)”的作用并不僅限于修辭,它還可能被用來編碼,從而被有意識地用來影響讀者的認(rèn)知[18]?!叭祟愒谡J(rèn)識某一新事物的時候往往通過借用已知事物的概念來認(rèn)識、表達(dá)、構(gòu)建新事物?!盵19]
從詞匯學(xué)角度看,“數(shù)據(jù)資源”由“數(shù)據(jù)”和“資源”兩個詞組合而成。相比于“信息資源”,由于大數(shù)據(jù)技術(shù)對當(dāng)下經(jīng)濟、社會的影響更為具體且直觀,使用“數(shù)據(jù)”來代替“信息”符合語言學(xué)的“省力原則”,因此在“數(shù)據(jù)資源”一詞中,“數(shù)據(jù)”可視為表基本義的前項。但考慮到在眾多案例中,數(shù)據(jù)實際就是以信息的形式存在的,由“數(shù)據(jù)”構(gòu)成的資源就是由“信息”構(gòu)成的資源,如2015年國辦〔51〕號文中就將政府信息和社會信息統(tǒng)稱為“大數(shù)據(jù)資源”[20],所以盡管相比“信息”,“數(shù)據(jù)”已然更加具象化,但在使用過程中,“數(shù)據(jù)資源”概念依然存在如何進一步確立概念邊界的問題,這一點根源于指代詞在語義上的重疊。再來看“資源”。與具象的傳統(tǒng)資源類型不同,“資源”與“數(shù)據(jù)”結(jié)合具有一定的隱喻特征。進入21世紀(jì)第二個十年,隨著數(shù)據(jù)對國家經(jīng)濟社會發(fā)展甚至是安全領(lǐng)域重要性的提升,數(shù)據(jù)已成為企業(yè)、國家的重要資產(chǎn),由此產(chǎn)生的關(guān)于數(shù)據(jù)稀缺性和權(quán)屬方面的隱喻,對后續(xù)包括“數(shù)據(jù)資源”在內(nèi)的數(shù)據(jù)概念體系的發(fā)展產(chǎn)生了重大影響,也正是因為“資源”這一隱喻的抽象性和模糊性,“資源”概念一直難以清晰界定,不同屬性的資源在性質(zhì)上區(qū)別明顯,如經(jīng)濟資源與社會資源的價值屬性和價值認(rèn)定原則就差別很大,技術(shù)資源和自然資源與勞動結(jié)合的方式也各不相同。當(dāng)“數(shù)據(jù)資源”中的“資源”義來自“經(jīng)濟資源”時,使用者可能意在表達(dá)“資源”的經(jīng)濟屬性,而當(dāng)“資源”義來自“技術(shù)資源”時,使用者可能僅意在表達(dá)“資源”的技術(shù)功能。
源自術(shù)語學(xué)的方法論為解決模糊性問題提供了寶貴的思路?!靶畔⒓夹g(shù)中的許多概念高度抽象和微觀,所指事物現(xiàn)象的本來面貌無論用什么方法都難以具體地顯示……所選擇的喻體是用來作籠統(tǒng)的比照,不可能表現(xiàn)實際的形態(tài)和精確的細(xì)部”[17]。術(shù)語學(xué)解決這類問題的思路在于“不應(yīng)該試圖為‘術(shù)語’這一事物下定義,而應(yīng)該為作為‘研究對象’的‘術(shù)語’下定義”[21]?!皵?shù)據(jù)資源”是一個科學(xué)概念,不必苛求“數(shù)據(jù)資源”字面意義的精確性,關(guān)鍵是要弄清楚作為“資源”限定語的“數(shù)據(jù)”的功能、類型等特征,即找到“數(shù)據(jù)資源”的價值所在。因此,數(shù)據(jù)的“價值”成為破解“數(shù)據(jù)資源”概念界定、指導(dǎo)“數(shù)據(jù)資源”概念應(yīng)用的關(guān)鍵。
3“數(shù)據(jù)資源”概念產(chǎn)生的現(xiàn)實背景
盡管“數(shù)據(jù)資源”的理論源于信息學(xué)與信息社會學(xué),但商業(yè)、政治等社會因素對概念本身能否誕生至關(guān)重要。商業(yè)競爭不僅推動了數(shù)據(jù)技術(shù)和數(shù)據(jù)產(chǎn)品的發(fā)展,更重要的是激活了技術(shù)、產(chǎn)品對于商業(yè)數(shù)據(jù)和個人數(shù)據(jù)的需求,極大地擴展了數(shù)據(jù)的價值屬性,促成“數(shù)據(jù)資源”這一新概念的誕生。
3.1“數(shù)據(jù)資源”概念的出現(xiàn)與數(shù)據(jù)產(chǎn)品形態(tài)高度相關(guān)
商業(yè)因素對于科學(xué)技術(shù)實用化具有重大影響,商業(yè)應(yīng)用不僅有力地推動了技術(shù)的產(chǎn)品化、市場化,也同步向市場、社會普及了一大批新概念。企業(yè)史研究認(rèn)為大數(shù)據(jù)、云計算技術(shù)的出現(xiàn)成為顛覆傳統(tǒng)軟硬件計算機生態(tài)的關(guān)鍵,谷歌、甲骨文等公司憑此類技術(shù)及其衍生的生態(tài)體系對以IBM、英特爾為代表的大型硬件設(shè)備公司、以微軟為代表的單機操作系統(tǒng)和應(yīng)用程序開發(fā)公司形成了巨大挑戰(zhàn),并間接促成筆記本電腦、平板電腦、智能手機等小型消費電子設(shè)備的出現(xiàn),這些公司也從此成為新一代信息產(chǎn)業(yè)革命的領(lǐng)軍企業(yè)[22]。與IBM、微軟稱霸市場時期的個人終端產(chǎn)品不同,搜索引擎、郵件、云存儲甚至地圖應(yīng)用將用戶的操作行為搬到云端,出現(xiàn)了最早一批(2005年左右)能夠自動獲取的計算機用戶數(shù)據(jù)(大數(shù)據(jù)),并可以將這些數(shù)據(jù)轉(zhuǎn)變?yōu)樗惴ㄙY源的商用產(chǎn)品。
在大數(shù)據(jù)和云技術(shù)商用化不久,科技界就先后迎來了消費互聯(lián)網(wǎng)(2003年)和移動互聯(lián)網(wǎng)浪潮(2014年)。21世紀(jì)初,國內(nèi)外先后興起了一批以電子商務(wù)、即時通訊、社交網(wǎng)絡(luò)、位置導(dǎo)航等服務(wù)為主業(yè)的新型互聯(lián)網(wǎng)公司,誕生了諸如“Web2.0”“UGC”等一批新概念。這些公司與傳統(tǒng)的電信運營商、公共部門及行業(yè)信息化廠商一起成為數(shù)據(jù)生產(chǎn)的主力軍,“引發(fā)了人類歷史上迄今為止最龐大的數(shù)據(jù)爆炸”[23],基于用戶基數(shù)的行為數(shù)據(jù)和算法能力成為左右產(chǎn)品策略甚至企業(yè)戰(zhàn)略的核心。2013年德國“工業(yè)4.0”概念傳入我國后,“工業(yè)互聯(lián)網(wǎng)”概念應(yīng)運而出,結(jié)合傳感器技術(shù)的發(fā)展,對工業(yè)機理的數(shù)據(jù)挖掘和算法沉淀成為工業(yè)企業(yè)競爭力的核心。此后大數(shù)據(jù)技術(shù)和算法技術(shù)開始加速向金融、科技、醫(yī)療、交通、物流等其他社會領(lǐng)域擴散,社會數(shù)據(jù)總量開始呈現(xiàn)井噴式增長,行業(yè)知識和算法設(shè)計依然是實現(xiàn)精準(zhǔn)預(yù)測、顛覆科研范式、實現(xiàn)流程再造等技術(shù)創(chuàng)新的根基,數(shù)據(jù)的經(jīng)濟價值屬性迅速抬升直至迎來人工智能概念的驟然興起。
3.2“數(shù)據(jù)資源”概念的出現(xiàn)與國家戰(zhàn)略規(guī)劃高度相關(guān)
各國政府開始意識到數(shù)據(jù)的價值,世界各國紛紛布局大數(shù)據(jù)戰(zhàn)略規(guī)劃,將大數(shù)據(jù)作為國家發(fā)展的重要資產(chǎn)之一,2012—2016年間,美國政府四次發(fā)布有關(guān)大數(shù)據(jù)技術(shù)的國家級規(guī)劃文件,2012年白宮科學(xué)和技術(shù)政策辦公室發(fā)布的《大數(shù)據(jù)研究和發(fā)展倡議》被視為將大數(shù)據(jù)戰(zhàn)略提升為美國國家戰(zhàn)略的標(biāo)志。此后英國、歐盟、澳大利亞、日本、韓國相繼發(fā)布各自關(guān)于大數(shù)據(jù)的戰(zhàn)略規(guī)劃文件,我國學(xué)術(shù)界、政策界對此已有過充分的比較研究,本文不贅述。
2015年我國國務(wù)院發(fā)布的《促進大數(shù)據(jù)發(fā)展行動綱要》(以下簡稱《綱要》)對“數(shù)據(jù)資源”概念的早期形成具有重要意義?!毒V要》不僅從國家層面肯定了數(shù)據(jù)的“資源”地位,還分別從主體、行為、形態(tài)等角度對“數(shù)據(jù)資源”進行了概念細(xì)分,以政策文件特有的話語體系對這樣一個抽象概念進行具象化?!毒V要》提出現(xiàn)階段的任務(wù)是“提升治理能力”“助力經(jīng)濟轉(zhuǎn)型”和“促進健康發(fā)展”,為此提出一系列實施舉措和政策保障設(shè)計。在機制設(shè)計方面,《綱要》特別指出要“引導(dǎo)培育大數(shù)據(jù)交易市場,開展面向應(yīng)用的數(shù)據(jù)交易市場試點,探索開展大數(shù)據(jù)衍生產(chǎn)品交易,鼓勵產(chǎn)業(yè)鏈各環(huán)節(jié)市場主體進行數(shù)據(jù)交換和交易,促進數(shù)據(jù)資源流通,建立健全數(shù)據(jù)資源交易機制和定價機制”,從而明確了市場機制在“數(shù)據(jù)流動”向“數(shù)據(jù)流通”轉(zhuǎn)變過程中的關(guān)鍵作用。
在此后的幾年中,我國有關(guān)大數(shù)據(jù)、人工智能的政策指引相繼出臺,“數(shù)據(jù)資源”概念的內(nèi)涵不斷得以豐富。2016 年《中華人民共和國國民經(jīng)濟和社會發(fā)展第十三個五年規(guī)劃綱要》出臺,除了確認(rèn)政府?dāng)?shù)據(jù)資源開放共享外,還提出建立“數(shù)據(jù)資源”資產(chǎn)化、信用化機制。2017年7月,國務(wù)院發(fā)布的《新一代人工智能發(fā)展規(guī)劃》提到“加速積累的技術(shù)能力與海量的數(shù)據(jù)資源……形成了我國人工智能發(fā)展的獨特優(yōu)勢”,明確了“數(shù)據(jù)資源”對于人工智能(算法)技術(shù)的重要價值。
黨的十八屆三中全會確立了“市場對資源配置起決定性作用”的改革方向,而“要素的市場化配置是市場決定資源配置的前提和實現(xiàn)形式” [24]。2019年10月,黨的十九屆四中全會通過的《中共中央關(guān)于堅持和完善中國特色社會主義制度 推進國家治理體系和治理能力現(xiàn)代化若干重大問題的決定》首次將“數(shù)據(jù)”列入“生產(chǎn)七要素”,并前瞻性地提出健全包括“數(shù)據(jù)要素”在內(nèi)的要素報酬機制。2020年3月,中共中央、國務(wù)院在《關(guān)于構(gòu)建更加完善的要素市場化配置體制機制的意見》中將數(shù)據(jù)與土地、勞動力、資本、技術(shù)共同納入改革范疇,重新明確了改革突破口,重點強調(diào)“培育數(shù)據(jù)要素市場”,為下一步推進要素市場化配置奠定了基礎(chǔ)。2021年12月,國務(wù)院印發(fā)《“十四五”數(shù)字經(jīng)濟發(fā)展規(guī)劃》,提出到2025年初步建立數(shù)據(jù)要素市場體系,其中包括“數(shù)據(jù)資源體系基本建成”“數(shù)據(jù)要素市場化建設(shè)成效顯現(xiàn)”兩項任務(wù),初步實現(xiàn)了對“數(shù)據(jù)資源”與“數(shù)據(jù)要素”兩者理論、實踐關(guān)系的構(gòu)建。此后,政策重心開始轉(zhuǎn)向“數(shù)據(jù)要素”概念。2024年12月,經(jīng)公開征求社會建議和多輪專家意見咨詢,國家數(shù)據(jù)局發(fā)布首批《數(shù)據(jù)領(lǐng)域常用名詞解釋》(以下簡稱《解釋》),第一次對“數(shù)據(jù)資源”“數(shù)據(jù)要素”等概念給出官方定義[1],填補了“數(shù)據(jù)資源”概念界定的缺失,對準(zhǔn)確把握“數(shù)據(jù)資源”與“數(shù)據(jù)要素”兩者關(guān)系具有重要意義。
4結(jié)語
自“數(shù)據(jù)資源”概念提出以來,政策、市場、理論等各層面都對這一概念展開了充分研究和實踐,產(chǎn)出了豐富的成果。但與此同時,數(shù)據(jù)領(lǐng)域新技術(shù)、新業(yè)態(tài)快速迭代,新概念不斷涌現(xiàn),我們不應(yīng)忽視對基礎(chǔ)概念的區(qū)分和跟蹤研究,這對理解和構(gòu)建政策、概念之間的邏輯關(guān)系具有十分重要的意義。具體到“數(shù)據(jù)資源”這一概念,其自身的價值實現(xiàn)路徑、與其他資源之間的配置模式、與其他概念之間的邏輯關(guān)系等問題,仍須深入研究??上驳氖牵皵?shù)據(jù)要素”市場化配置改革大幕的開啟為解決這些問題提供了新的思路。在國家數(shù)據(jù)局等有關(guān)部門領(lǐng)導(dǎo)下,針對“數(shù)據(jù)資源”“數(shù)據(jù)要素”的概念體系、市場特征、市場機制、市場規(guī)范等核心議題的研究正快速推進,這正是“數(shù)據(jù)資源”概念進一步具象化的體現(xiàn)。
運用好“數(shù)據(jù)資源”的深層目標(biāo)是形成數(shù)字化驅(qū)動國家治理現(xiàn)代化新理念[25],進而實現(xiàn)國家治理體系和治理能力現(xiàn)代化,而市場化可視為“數(shù)據(jù)資源”價值具象化的第一步。隨著我們對數(shù)字技術(shù)運用能力的不斷增強,“數(shù)據(jù)資源”的價值屬性必然會不斷延伸,《綱要》中已經(jīng)隱含了對“數(shù)據(jù)資源”社會價值、經(jīng)濟價值的共同追求,而《解釋》中使用“社會化再利用”的提法正是為“數(shù)據(jù)資源”概念向包括科學(xué)化、公益化在內(nèi)的其他方向發(fā)展預(yù)留了空間。有理由相信,隨著“數(shù)據(jù)實踐”的不斷豐富,在各方力量的共同參與下,我國數(shù)字經(jīng)濟、數(shù)字社會、數(shù)字政府建設(shè)必將翻開嶄新的一頁?!皵?shù)據(jù)資源”在科學(xué)研究、社會治理、安全管理等領(lǐng)域的價值將快速顯現(xiàn),最終為實現(xiàn)網(wǎng)絡(luò)強國、數(shù)字中國戰(zhàn)略任務(wù)貢獻(xiàn)出其應(yīng)有的價值,真正做到“把科技的命脈牢牢掌握在自己手中”。
注釋
①在2018年的《計算機科學(xué)技術(shù)名詞》第3版中沒有“數(shù)據(jù)資源”的提法,只有“數(shù)據(jù)源data source”“信息資源整合 information resource integration”。
參考文獻(xiàn)
[1] 數(shù)據(jù)領(lǐng)域名詞解釋起草專家組. 數(shù)據(jù)領(lǐng)域常用名詞解釋(第一批)[EB/OL].國家數(shù)據(jù)局. (2024-12-30)[2025-02-08]. https://www.nda.gov.cn/sjj/zwgk/zcfb/1230/20241230160715745237413_pc.html.
[2] 大數(shù)據(jù)白皮書(2014年)[Z].工業(yè)和信息化部電信研究院,2014.
[3] 吳軍.浪潮之巔[M].北京:電子工業(yè)出版社,2011:506.
[4] 洪永淼,汪壽陽.大數(shù)據(jù)如何改變經(jīng)濟學(xué)研究范式[J].管理世界,2021(10):42.
[5] 全國科學(xué)技術(shù)名詞審定委員會. 計算機科學(xué)技術(shù)名詞[M].3版. 北京:科學(xué)出版社, 2018: 731, 664.
[6] 多明戈斯. 終極算法:機器學(xué)習(xí)和人工智能如何重塑世界[M]. 黃芳萍,譯. 北京:中信出版集團, 2017:16.
[7] 國務(wù)院發(fā)展研究中心國際技術(shù)經(jīng)濟研究所,中國電子學(xué)會,智慧芽. 人工智能全球格局:未來趨勢與中國位勢[M].北京:中國人民大學(xué)出版社,2019:2.
[8] 鄭述譜.從“概念”一詞的釋義說起:兼論詞義、概念及其關(guān)系[J].外語學(xué)刊,2001(1):16.
[9] 李桑,毛振宇.信息化對產(chǎn)權(quán)市場的影響[J].產(chǎn)權(quán)導(dǎo)刊,2010(12):19.
[10] 吳正荊,靖繼鵬,孫成江.信息社會學(xué)理論流派研究[J].情報資料工作,2007(3):20.
[11] 多羅德尼岑. 信息學(xué):對象與任務(wù)[J].王興權(quán),譯. 國外社會科學(xué),1985(7):59-61,53.
[12] 鄒志仁.試論信息社會學(xué)[J].情報學(xué)報,1997(6):470.
[13] 江澤民.美國、加拿大電子工業(yè)考察報告[M]//江澤民. 論中國信息技術(shù)產(chǎn)業(yè)發(fā)展.北京:中央文獻(xiàn)出版社;上海:上海交通大學(xué)出版社,2008:74.
[14] 劉延風(fēng). 我國電子信息產(chǎn)業(yè)發(fā)展現(xiàn)狀、問題及發(fā)展對策初探[J].管理與發(fā)展,2010(9):167.
[15] 馮秉銓,蔣卡林.漫談信息學(xué)控制學(xué)及其它[J].信息與控制,1978(1):2.
[16] 黃少寬.我國信息社會學(xué)研究綜述[J].情報科學(xué),2008(3):466.
[17] 黃明明.論現(xiàn)代信息技術(shù)中的比喻型術(shù)語[J].無錫教育學(xué)院學(xué)報, 2002(4):15-19.
[18] 梁愛林.論認(rèn)知術(shù)語學(xué)的理論基礎(chǔ)及其應(yīng)用[J].術(shù)語標(biāo)準(zhǔn)化與信息技術(shù),2009(1):5.
[19] 汪雯.從認(rèn)知語言學(xué)角度看計算機術(shù)語中的隱喻現(xiàn)象[J].科教文匯,2009(1):247.
[20] 國務(wù)院辦公廳.關(guān)于運用大數(shù)據(jù)加強對市場主體服務(wù)和監(jiān)管的若干意見[Z].國辦發(fā)[2015]51號,2015-07-01.
[21] 鄭述譜.術(shù)語的定義[J].術(shù)語標(biāo)準(zhǔn)化與信息技術(shù),2005(1):4.
[22] 吳軍.浪潮之巔[M].北京:電子工業(yè)出版社,2013:509-511.
[23] 涂子沛,鄭磊.大數(shù)據(jù)改變中國[M].北京:人民郵電出版社,2019:14.
[24] 洪銀興.完善產(chǎn)權(quán)制度和要素市場化配置機制研究[J].中國工業(yè)經(jīng)濟,2018(6):7.
[25] 王國成.數(shù)字經(jīng)濟視域下的國家治理能力提升[J].天津社會科學(xué),2021(6):103.