楊玫,李瑋,喬思淵,劉巍
國家工業(yè)信息安全發(fā)展研究中心,北京 100040
大數(shù)據(jù)作為數(shù)字經(jīng)濟和實體經(jīng)濟發(fā)展的重要驅(qū)動,具有高滲透性和高融合性特點。隨著大數(shù)據(jù)技術(shù)突破、服務(wù)升級,大數(shù)據(jù)產(chǎn)業(yè)邊界及業(yè)務(wù)范疇不斷擴展。大數(shù)據(jù)產(chǎn)業(yè)[1]是以數(shù)據(jù)生產(chǎn)、采集、存儲、加工、分析、服務(wù)為主的相關(guān)經(jīng)濟活動,包括數(shù)據(jù)資源建設(shè),大數(shù)據(jù)軟硬件產(chǎn)品的開發(fā)、銷售和租賃活動,以及相關(guān)信息技術(shù)服務(wù)等產(chǎn)業(yè)供給側(cè)范疇。沿著計算技術(shù)體系發(fā)展所追求的技術(shù)和產(chǎn)品通用性主線,大數(shù)據(jù)產(chǎn)業(yè)初步形成了以開源框架和軟件為基礎(chǔ),以硬件設(shè)施為支撐,包括數(shù)據(jù)采集工具與匯聚平臺、大規(guī)模數(shù)據(jù)并行處理軟件系統(tǒng)、數(shù)據(jù)分析方案與工具、面向特定領(lǐng)域的大數(shù)據(jù)應(yīng)用系統(tǒng)等多個相互支撐的技術(shù)產(chǎn)品門類的產(chǎn)業(yè)生態(tài)。
“十四五”時期是我國工業(yè)經(jīng)濟向數(shù)字經(jīng)濟大踏步邁進的關(guān)鍵時期,大數(shù)據(jù)產(chǎn)業(yè)將步入集成創(chuàng)新、快速發(fā)展、深度應(yīng)用、結(jié)構(gòu)優(yōu)化的新階段。在此階段和背景下,大數(shù)據(jù)產(chǎn)業(yè)發(fā)展仍然面臨產(chǎn)業(yè)邊界不夠清晰、企業(yè)界定不夠明確、產(chǎn)值測算方法不夠統(tǒng)一等產(chǎn)業(yè)發(fā)展問題,致使產(chǎn)業(yè)主管部門不能科學地掌握和判斷產(chǎn)業(yè)發(fā)展態(tài)勢,不能有效圍繞產(chǎn)業(yè)鏈、價值鏈部署創(chuàng)新鏈,不能根據(jù)產(chǎn)業(yè)實際固根基、揚優(yōu)勢、補短板、強弱項。國家工業(yè)信息安全發(fā)展研究中心基于相關(guān)行業(yè)統(tǒng)計標準和經(jīng)驗,在研究積累的近5 000個大數(shù)據(jù)案例庫、項目庫和企業(yè)庫調(diào)研工作基礎(chǔ)上,圍繞大數(shù)據(jù)產(chǎn)業(yè)鏈范疇、大數(shù)據(jù)企業(yè)認定標準、大數(shù)據(jù)企業(yè)分層分類標準以及大數(shù)據(jù)產(chǎn)業(yè)產(chǎn)值測算方法等方面,建立了一套完備的大數(shù)據(jù)產(chǎn)業(yè)產(chǎn)值測算體系。該方法可為國家掌控大數(shù)據(jù)產(chǎn)業(yè)發(fā)展態(tài)勢、為地方精準把握產(chǎn)業(yè)發(fā)展實際提供數(shù)據(jù)參考。
產(chǎn)業(yè)鏈[2]是各個產(chǎn)業(yè)部門之間基于一定的技術(shù)經(jīng)濟關(guān)聯(lián),并依據(jù)特定的邏輯關(guān)系和時空布局關(guān)系客觀形成的鏈條式關(guān)聯(lián)關(guān)系形態(tài),是一個包含價值鏈、企業(yè)鏈、供需鏈和空間鏈的概念。根據(jù)對大數(shù)據(jù)企業(yè)基本情況的調(diào)研,基于現(xiàn)階段我國大數(shù)據(jù)產(chǎn)業(yè)發(fā)展的客觀現(xiàn)實,以大數(shù)據(jù)產(chǎn)業(yè)供需鏈、企業(yè)上下游關(guān)聯(lián)性為基礎(chǔ),從價值鏈角度將大數(shù)據(jù)產(chǎn)業(yè)鏈劃分為數(shù)據(jù)資源層、基礎(chǔ)硬件層、通用軟件層、行業(yè)應(yīng)用層、安全保障層5個層級,如圖1所示。
圖1 大數(shù)據(jù)產(chǎn)業(yè)鏈各維度相互關(guān)系
● 數(shù)據(jù)資源層:促進數(shù)據(jù)要素資源價值釋放。涵蓋數(shù)據(jù)采集、加工、交易和服務(wù)等從數(shù)據(jù)產(chǎn)生到價值變現(xiàn)的過程,即利用數(shù)據(jù)智能化軟件進行數(shù)據(jù)采集,通過加工處理,最終形成簡潔、規(guī)范、清晰的數(shù)據(jù)集,通過技術(shù)、制度、模式創(chuàng)新消除數(shù)據(jù)壁壘,促進數(shù)據(jù)開放共享、交易服務(wù)及價值實現(xiàn)。
● 基礎(chǔ)硬件層:提供數(shù)據(jù)基礎(chǔ)設(shè)施及相關(guān)服務(wù)。涵蓋數(shù)據(jù)采集、存儲、計算等基礎(chǔ)硬件,以及基于硬件的咨詢、規(guī)劃、定制、優(yōu)化、運維和系統(tǒng)集成服務(wù)。此類經(jīng)濟活動以提升大數(shù)據(jù)基礎(chǔ)硬件的集約化建設(shè)水平為核心,旨在構(gòu)建覆蓋服務(wù)器及存儲設(shè)備、一體機、數(shù)據(jù)采集設(shè)備等的大數(shù)據(jù)硬件生態(tài)。
● 通用軟件層:圍繞大數(shù)據(jù)關(guān)鍵技術(shù)構(gòu)建軟件生態(tài)。涵蓋在Hadoop、Spark、Flink等主流開源框架以及國內(nèi)自研技術(shù)生態(tài)架構(gòu)的基礎(chǔ)上,由包含基礎(chǔ)平臺、數(shù)據(jù)存儲、數(shù)據(jù)管理,以及分析挖掘、可視化、商業(yè)智能(business intelligence,BI)和機器學習等數(shù)據(jù)應(yīng)用在內(nèi)的通用平臺和工具構(gòu)成的大數(shù)據(jù)軟件生態(tài)體系。
● 行業(yè)應(yīng)用層:面向行業(yè)應(yīng)用主體提供產(chǎn)品及服務(wù)。涵蓋利用大數(shù)據(jù)技術(shù)在各行業(yè)、各領(lǐng)域進行融合應(yīng)用,為互聯(lián)網(wǎng)、工業(yè)、金融、政務(wù)、醫(yī)療等領(lǐng)域提供相關(guān)產(chǎn)品、服務(wù)和應(yīng)用解決方案,加速大數(shù)據(jù)與數(shù)字經(jīng)濟、實體經(jīng)濟深度融合發(fā)展的相關(guān)經(jīng)濟活動。
● 安全保障層:支撐安全運行并提供相關(guān)支撐服務(wù)。一方面,涵蓋研發(fā)大數(shù)據(jù)安全技術(shù)產(chǎn)品,提供大數(shù)據(jù)安全相關(guān)服務(wù),以及利用大數(shù)據(jù)完善安全管理機制等內(nèi)容;另一方面,提供包括大數(shù)據(jù)咨詢、標準、測試、培訓等在內(nèi)的相關(guān)產(chǎn)業(yè)支撐服務(wù)。
在對國內(nèi)近5 000家大數(shù)據(jù)企業(yè)的企業(yè)資質(zhì)、業(yè)務(wù)收入、創(chuàng)新能力、產(chǎn)品服務(wù)、經(jīng)營環(huán)境等情況進行深度調(diào)研的基礎(chǔ)上,結(jié)合《軟件和信息技術(shù)服務(wù)業(yè)統(tǒng)計報表制度》中的軟件企業(yè)認定門檻,以及當前地方大數(shù)據(jù)產(chǎn)業(yè)主管部門對大數(shù)據(jù)企業(yè)認定的主流統(tǒng)計標準,本文認為大數(shù)據(jù)企業(yè)[3]需同時滿足以下要求:①在我國境內(nèi)注冊(港澳臺地區(qū)除外),大數(shù)據(jù)業(yè)務(wù)收入超過300萬元的獨立法人單位;②從事以數(shù)據(jù)生產(chǎn)、采集、存儲、加工、分析、服務(wù)為主的相關(guān)經(jīng)濟活動的企業(yè),符合測算體系的大數(shù)據(jù)產(chǎn)業(yè)范疇;③具備與大數(shù)據(jù)業(yè)務(wù)相關(guān)的基礎(chǔ)設(shè)備條件和專門經(jīng)營場所。
根據(jù)上述對大數(shù)據(jù)產(chǎn)業(yè)鏈的劃分及我國大數(shù)據(jù)產(chǎn)業(yè)發(fā)展的實際特征,可將大數(shù)據(jù)企業(yè)分為數(shù)據(jù)資源層、基礎(chǔ)硬件層、通用軟件層、行業(yè)應(yīng)用層、安全保障層5層32類,每一層級細分類別,企業(yè)可根據(jù)其主營業(yè)務(wù)構(gòu)成,選擇所屬產(chǎn)業(yè)鏈環(huán)節(jié),具體分類情況見表1。
表1 大數(shù)據(jù)企業(yè)分類情況
通過對產(chǎn)值測算常用方法進行對比,分析各方法的適用范疇和計算特點。國外的產(chǎn)值測量方法主要分為3類:支出法、收入法、生產(chǎn)法。支出法是從最終的角度反映產(chǎn)值最終去向的方法,主要包括總消費、總投資、凈出口三部分內(nèi)容。計算式為增加值=總消費+總投資+出口-進口。以日本[4]為例,其在計算季度GDP時,分別計算季度各產(chǎn)業(yè)總消費、季度各產(chǎn)業(yè)總投資、季度各產(chǎn)業(yè)進出口,并求和。收入法從收入的角度,把產(chǎn)業(yè)生產(chǎn)過程中得到的各種收入相加。計算式為:增加值=勞動者報酬+營業(yè)盈余+固定資產(chǎn)折舊+生產(chǎn)稅凈額。以德國[5]服務(wù)業(yè)為例,其產(chǎn)業(yè)產(chǎn)值采用收入法計算,按行業(yè)分別計算雇員報酬、生產(chǎn)稅凈額、營業(yè)盈余總額(包含固定資產(chǎn)消耗),最后相加得到增加值。生產(chǎn)法從生產(chǎn)入手,將產(chǎn)業(yè)生產(chǎn)過程中創(chuàng)造的貨物及服務(wù)價值相加,并除去生產(chǎn)過程中投入的中間貨物和服務(wù)價值。計算式為:增加值=最終貨物價值+最終服務(wù)價值-中間貨物價值-中間服務(wù)價值。以意大利[6]制造業(yè)為例,其分別計算出制造業(yè)各方面的總產(chǎn)出及各方面的中間消耗,最后相減得到增加值。
國內(nèi)產(chǎn)值計算方法可以歸納為3類。一是直接核算法,主要包括收入法和生產(chǎn)法。收入法[7]將企業(yè)作為一個整體,按企業(yè)的生產(chǎn)活動最終成果來計算,不同環(huán)節(jié)之間不進行重復(fù)計算,只計算最終的產(chǎn)品產(chǎn)值;生產(chǎn)法[8]從產(chǎn)品和服務(wù)形成的角度入手,剔除生產(chǎn)環(huán)節(jié)中間投入的價值,從而得到新增產(chǎn)值,計算式為:增加值=總產(chǎn)值-中間投入+本期應(yīng)繳增值稅。二是間接核算法,常用方法為分配法[9],即從大數(shù)據(jù)產(chǎn)品生產(chǎn)過程中制造的原始收入初次分配的角度,對大數(shù)據(jù)生產(chǎn)活動最終成果進行核算的一種方法,計算式為:增加值=工資+福利費+折舊費+勞動、待業(yè)保險費+產(chǎn)品銷售稅金及附加+應(yīng)繳增值稅+營業(yè)盈余。三是比例推算法,即通過測算目標行業(yè)增加值在相關(guān)行業(yè)增加值中的占比來測算該行業(yè)增加值,適用于某些與主體行業(yè)易剝離的部分行業(yè)規(guī)模測算,計算式為:增加值=相關(guān)行業(yè)增加值×新興行業(yè)滲透系數(shù)。
總體來看,上述方法基于產(chǎn)業(yè)增加值的概念進行產(chǎn)業(yè)規(guī)模測算,但是由于大數(shù)據(jù)產(chǎn)業(yè)具有泛在賦能、融合深入等特點,使用增加值方式進行核算時可操作性較低。為了更好地反映大數(shù)據(jù)在經(jīng)濟社會發(fā)展中的地位和作用,了解大數(shù)據(jù)與其他產(chǎn)業(yè)發(fā)展的聯(lián)系既能反映大數(shù)據(jù)的發(fā)展現(xiàn)狀,也能反映大數(shù)據(jù)的增長情況,本文擬采用加總法與比例推算法相結(jié)合的形式,部分層級測算通過行業(yè)滲透系數(shù)折算的方式進行,最終結(jié)果計算采取企業(yè)營收加總的形式,無須通過剔除不同企業(yè)之間的中間收入來計算大數(shù)據(jù)產(chǎn)品和服務(wù)的所有產(chǎn)值。
基于全樣本數(shù)據(jù)難以獲取的現(xiàn)實基礎(chǔ),在產(chǎn)值測算的數(shù)據(jù)資源層、基礎(chǔ)硬件層、通用軟件層、行業(yè)應(yīng)用層、安全保障層分別通過獲取相關(guān)層級各細分領(lǐng)域骨干企業(yè)市場營收占比、細分領(lǐng)域骨干企業(yè)大數(shù)據(jù)營收占主營業(yè)務(wù)收入比均值,折算細分領(lǐng)域大數(shù)據(jù)產(chǎn)業(yè)產(chǎn)值。
(1)確定追蹤企業(yè)名單。建立各層企業(yè)追蹤體系,通過對企業(yè)定期調(diào)研,獲取產(chǎn)業(yè)最新的收入變化,為建立數(shù)學模型提供基礎(chǔ),并在跟蹤過程中對數(shù)學模型進行修正完善。
(2)建立測算數(shù)學模型。在對大數(shù)據(jù)產(chǎn)業(yè)鏈各環(huán)節(jié)進行充分調(diào)研、掌握地區(qū)大數(shù)據(jù)產(chǎn)業(yè)發(fā)展現(xiàn)狀的基礎(chǔ)上,按照數(shù)據(jù)資源層、基礎(chǔ)硬件層、通用軟件層、行業(yè)應(yīng)用層、安全保障層,分層級建立數(shù)據(jù)模型。
(3)產(chǎn)值總體結(jié)果估算。根據(jù)調(diào)研的企業(yè)數(shù)據(jù),將相關(guān)數(shù)據(jù)帶入數(shù)學模型中,將各層級產(chǎn)業(yè)進行加總,得到最終大數(shù)據(jù)產(chǎn)業(yè)產(chǎn)值。
大數(shù)據(jù)產(chǎn)業(yè)的產(chǎn)值=∑(數(shù)據(jù)資源層收入+基礎(chǔ)硬件層收入+通用軟件層收入+行業(yè)應(yīng)用層收入+安全保障層收入)。
2.3.1 確定跟蹤企業(yè)名單
(1)數(shù)據(jù)資源層主要包括數(shù)據(jù)采集、數(shù)據(jù)加工、數(shù)據(jù)交易、數(shù)據(jù)服務(wù),數(shù)據(jù)加工包括數(shù)據(jù)清洗、數(shù)據(jù)標注,數(shù)據(jù)服務(wù)包括數(shù)據(jù)應(yīng)用程序接口(application programming interface,API)服務(wù)和數(shù)據(jù)流通服務(wù)等,見表2。
表2 數(shù)據(jù)資源層追蹤企業(yè)名單
(2)基礎(chǔ)硬件層主要包括數(shù)據(jù)采集設(shè)備、生物識別設(shè)備、智能終端、服務(wù)器及存儲設(shè)備、一體機和硬件解決方案,涵蓋數(shù)據(jù)采集、存儲、計算等基礎(chǔ)硬件,以及基于硬件的咨詢、規(guī)劃、定制、優(yōu)化、運維和系統(tǒng)集成服務(wù),見表3。
表3 基礎(chǔ)硬件層追蹤企業(yè)名單
(3)通用軟件層包括基礎(chǔ)平臺、數(shù)據(jù)存儲、數(shù)據(jù)管理以及數(shù)據(jù)應(yīng)用等通用平臺和工具。具體而言,基礎(chǔ)平臺包括集群管理、文件系統(tǒng)、編程模型等;數(shù)據(jù)存儲包括SQL、NoSQL、NewSQL、數(shù)據(jù)倉、數(shù)據(jù)庫運維企業(yè)等;數(shù)據(jù)管理包括從事信息檢索、ETL(數(shù)據(jù)抽取、轉(zhuǎn)換、加載工具)、數(shù)據(jù)建模和數(shù)據(jù)質(zhì)量管理等業(yè)務(wù)的企業(yè);數(shù)據(jù)應(yīng)用包括從事數(shù)據(jù)挖掘、分析、可視化、BI和機器學習等數(shù)據(jù)分析和展示的軟件和工具開發(fā)的服務(wù)商,見表4。
表4 通用軟件層追蹤企業(yè)名單
(4)行業(yè)應(yīng)用層包括為各個行業(yè)提供與實際應(yīng)用緊密相關(guān)的終端應(yīng)用軟件和整體解決方案(即大數(shù)據(jù)技術(shù)、產(chǎn)品、服務(wù)、解決方案)的供給側(cè)企業(yè),見表5。
表5 行業(yè)應(yīng)用層追蹤企業(yè)名單
(5)安全保障層是產(chǎn)業(yè)發(fā)展的支撐,主要包括大數(shù)據(jù)安全、咨詢、標準、測試、培訓等,見表6。
表6 安全保障層追蹤企業(yè)名單
2.3.2 建立測算數(shù)學模型
測算數(shù)學模型基于各層級包含的主要環(huán)節(jié)以及骨干企業(yè)的市場營收占比進行折算,以數(shù)據(jù)資源層為例:數(shù)據(jù)資源層產(chǎn)值=∑(數(shù)據(jù)采集+數(shù)據(jù)加工+數(shù)據(jù)交易+數(shù)據(jù)服務(wù))/30%,系數(shù)30%基于對該領(lǐng)域骨干企業(yè)營收數(shù)據(jù)調(diào)研,結(jié)合行業(yè)滲透率水平得出。2016—2021年數(shù)據(jù)資源層產(chǎn)值見表7。
表7 2016—2021年數(shù)據(jù)資源層產(chǎn)值(單位:億元)
目前,大量傳統(tǒng)企業(yè)開始對大數(shù)據(jù)產(chǎn)業(yè)進行布局,因此數(shù)據(jù)資源層企業(yè)均呈現(xiàn)企業(yè)收入增長較快的態(tài)勢,中共中央、國務(wù)院在《關(guān)于構(gòu)建更加完善的要素市場化配置體制機制的意見》中首次將數(shù)據(jù)作為要素參與分配,數(shù)據(jù)要素的作用逐步凸顯。根據(jù)該層當前所追蹤企業(yè)年增幅(大部分保持在30%以上),結(jié)合該細分領(lǐng)域產(chǎn)業(yè)發(fā)展特征,運用指數(shù)平滑方法,預(yù)計未來5年內(nèi)數(shù)據(jù)資源層產(chǎn)值復(fù)合增長率約為26%。2022—2025年數(shù)據(jù)資源層產(chǎn)值預(yù)測見表8。
表8 2022—2025年數(shù)據(jù)資源層產(chǎn)值預(yù)測(單位:億元)
2.3.3 產(chǎn)值總體結(jié)果估算
根據(jù)上述大數(shù)據(jù)產(chǎn)業(yè)鏈劃分的5個層級,得出大數(shù)據(jù)產(chǎn)業(yè)的產(chǎn)值=∑(數(shù)據(jù)資源層產(chǎn)值+基礎(chǔ)硬件層產(chǎn)值+通用軟件層產(chǎn)值+行業(yè)應(yīng)用層產(chǎn)值+安全保障層產(chǎn)值)。其中,行業(yè)應(yīng)用層的測算是基于《國民經(jīng)濟行業(yè)分類》,結(jié)合我國大數(shù)據(jù)產(chǎn)業(yè)融合應(yīng)用現(xiàn)狀,挑選大數(shù)據(jù)融合應(yīng)用涉及的有關(guān)行業(yè)進行的測算。根據(jù)測算,2019年大數(shù)據(jù)產(chǎn)業(yè)產(chǎn)值為7 866億元,2020年中國大數(shù)據(jù)產(chǎn)業(yè)產(chǎn)值達到10 195億元,2021年中國大數(shù)據(jù)產(chǎn)業(yè)產(chǎn)值達到13 052億元,據(jù)國際數(shù)據(jù)公司(International Data Corporation,IDC)預(yù)計,在2022—2024年中國大數(shù)據(jù)相關(guān)技術(shù)與服務(wù)市場復(fù)合增長率為19.0%?!笆濉睍r期是我國大數(shù)據(jù)產(chǎn)業(yè)萌芽壯大期,在此期間關(guān)鍵技術(shù)攻關(guān)、數(shù)據(jù)平臺建設(shè)、基礎(chǔ)設(shè)施布局等巨大的市場需求驅(qū)動產(chǎn)業(yè)發(fā)展呈爆發(fā)式增長態(tài)勢,實現(xiàn)了年均復(fù)合增長率30%左右的目標。預(yù)計到2025年,大數(shù)據(jù)產(chǎn)業(yè)產(chǎn)值將突破3萬億元,達到31 689億元。2016—2025年大數(shù)據(jù)產(chǎn)業(yè)產(chǎn)值及預(yù)測見表9。
表9 2016—2025年大數(shù)據(jù)產(chǎn)業(yè)產(chǎn)值及預(yù)測(單位:億元)
本文參考軟件和信息技術(shù)服務(wù)業(yè)統(tǒng)計范圍標準,并結(jié)合大數(shù)據(jù)產(chǎn)業(yè)發(fā)展實際,將大數(shù)據(jù)業(yè)務(wù)收入超過300萬元的獨立法人單位作為大數(shù)據(jù)產(chǎn)業(yè)統(tǒng)計認定門檻。根據(jù)產(chǎn)業(yè)鏈各環(huán)節(jié)之間的技術(shù)經(jīng)濟關(guān)聯(lián)性、特定的邏輯關(guān)系和時空布局關(guān)系,基于現(xiàn)階段我國大數(shù)據(jù)產(chǎn)業(yè)發(fā)展的客觀現(xiàn)實,將大數(shù)據(jù)產(chǎn)業(yè)鏈劃分為數(shù)據(jù)資源層、基礎(chǔ)硬件層、通用軟件層、行業(yè)應(yīng)用層、安全保障層5個層級,首次界定了大數(shù)據(jù)相關(guān)概念邊界,填補了大數(shù)據(jù)統(tǒng)計監(jiān)測標準的空白?;谌珮颖緮?shù)據(jù)難以獲取的實際情況,在產(chǎn)值測算的數(shù)據(jù)資源層、基礎(chǔ)硬件層、通用軟件層、安全保障層分別通過獲取相關(guān)層級各細分領(lǐng)域骨干企業(yè)市場營收占比、細分領(lǐng)域骨干企業(yè)大數(shù)據(jù)營收占主營業(yè)務(wù)收入比均值,折算細分領(lǐng)域大數(shù)據(jù)產(chǎn)業(yè)產(chǎn)值,計算過程根據(jù)產(chǎn)業(yè)鏈分層特點進行。在對“十四五”時期大數(shù)據(jù)產(chǎn)業(yè)發(fā)展進行預(yù)測的過程中,參考了IDC等機構(gòu)的預(yù)測結(jié)果,綜合考慮國內(nèi)大數(shù)據(jù)產(chǎn)業(yè)發(fā)展態(tài)勢、國際發(fā)展形勢和疫情影響等因素,科學研判“十四五”時期大數(shù)據(jù)產(chǎn)業(yè)發(fā)展態(tài)勢。希望該方法及相關(guān)理論能為實現(xiàn)全國協(xié)同一致的測算標準,統(tǒng)籌推進全國大數(shù)據(jù)產(chǎn)業(yè)發(fā)展和應(yīng)用,更有效地支撐產(chǎn)業(yè)發(fā)展提供決策參考。