郭明軍,陳沁,安小米,王建冬,易成岐
1. 國(guó)家信息中心,北京 100045;2. 中國(guó)人民大學(xué)信息資源管理學(xué)院,北京 100872;3. 成都數(shù)聯(lián)銘品科技有限公司,四川 成都 610041;4. 中國(guó)人民大學(xué)智慧城市研究中心,北京 100872
指數(shù)是客觀反映事物發(fā)展水平的有效工具之一。隨著大數(shù)據(jù)的快速發(fā)展,大數(shù)據(jù)指數(shù)研究成為學(xué)術(shù)界的重點(diǎn)議題,成為客觀反映中國(guó)大數(shù)據(jù)發(fā)展現(xiàn)狀的重要手段,有助于政府、企業(yè)、社會(huì)了解大數(shù)據(jù)領(lǐng)域的發(fā)展?fàn)顩r,為相關(guān)決策的制定提供參考。
近年來(lái),隨著我國(guó)大數(shù)據(jù)戰(zhàn)略的持續(xù)推進(jìn),如何對(duì)大數(shù)據(jù)發(fā)展水平進(jìn)行量化評(píng)估,為政府科學(xué)決策、精準(zhǔn)施策提供客觀數(shù)據(jù)支撐,成為眾多研究機(jī)構(gòu)的一項(xiàng)重要任務(wù)。許多學(xué)者圍繞大數(shù)據(jù)指數(shù)進(jìn)行了深入研究,形成了豐富的指數(shù)類(lèi)研究成果。但受限于數(shù)據(jù)的可獲得性,目前大數(shù)據(jù)指數(shù)領(lǐng)域研究利用的數(shù)據(jù)或者僅涉及經(jīng)濟(jì)或民生等某一具體領(lǐng)域,或者僅使用政府統(tǒng)計(jì)類(lèi)小數(shù)據(jù)或互聯(lián)網(wǎng)大數(shù)據(jù),數(shù)據(jù)種類(lèi)及數(shù)量不足,難以真正實(shí)現(xiàn)“統(tǒng)籌規(guī)劃政務(wù)數(shù)據(jù)資源和社會(huì)數(shù)據(jù)資源”的目標(biāo)。這成為我國(guó)大數(shù)據(jù)指數(shù)研究的重要瓶頸,亟待突破。本文以2019年貴陽(yáng)數(shù)博會(huì)發(fā)布的《中國(guó)大數(shù)據(jù)發(fā)展指數(shù)報(bào)告(2018年)》提出的大數(shù)據(jù)發(fā)展指數(shù)(2018)為例,充分融合政務(wù)數(shù)據(jù)和社會(huì)數(shù)據(jù)資源,為我國(guó)大數(shù)據(jù)指數(shù)研究探索新的路徑。
在國(guó)外,大數(shù)據(jù)指數(shù)研究首先在預(yù)測(cè)流行病的發(fā)生概率方面取得了顯著成效[1],隨后,大數(shù)據(jù)方法逐步被拓展到經(jīng)濟(jì)學(xué)領(lǐng)域[2],許多學(xué)者圍繞個(gè)人消費(fèi)行為[3]、失業(yè)率預(yù)測(cè)[4-5]、勞動(dòng)供需分析[6]、就業(yè)歧視[7]等進(jìn)行了大數(shù)據(jù)指數(shù)監(jiān)測(cè)預(yù)測(cè)研究。近年來(lái),采用綜合集成方法,融合多視角、多層面、多利益方,把各方面構(gòu)成要素有機(jī)融合,成為大數(shù)據(jù)治理體系框架構(gòu)建的基本思路[8]。在國(guó)內(nèi),大數(shù)據(jù)指數(shù)研究的力度逐漸加強(qiáng),形成了兩種主要類(lèi)型,第一類(lèi)是以高校為代表的學(xué)術(shù)類(lèi)研究,第二類(lèi)是權(quán)威信息化機(jī)構(gòu)發(fā)布的評(píng)估類(lèi)研究報(bào)告。
國(guó)內(nèi)學(xué)術(shù)類(lèi)大數(shù)據(jù)指數(shù)研究主要由高校牽頭,往往聚焦某個(gè)特定領(lǐng)域。比如,一些學(xué)者圍繞消費(fèi)[9]、交通[10]、就業(yè)[11]、融資[12]、生活質(zhì)量[13]等民生領(lǐng)域,編制了大數(shù)據(jù)指數(shù)進(jìn)行預(yù)測(cè)分析研究;也有學(xué)者聚焦經(jīng)濟(jì)領(lǐng)域,通過(guò)形成電力大數(shù)據(jù)指數(shù)[14]、金融風(fēng)險(xiǎn)指數(shù)[15]、制造業(yè)指數(shù)[16]、實(shí)體經(jīng)濟(jì)指數(shù)[17]等,對(duì)經(jīng)濟(jì)發(fā)展趨勢(shì)進(jìn)行監(jiān)測(cè)預(yù)測(cè)研究;還有一些學(xué)者關(guān)注政府治理[18]、互聯(lián)網(wǎng)輿情[19]、居民情緒[20]、社會(huì)信用[21]、城市發(fā)展[22]等社會(huì)治理領(lǐng)域,開(kāi)發(fā)了相關(guān)的大數(shù)據(jù)指數(shù)。
評(píng)估類(lèi)大數(shù)據(jù)指數(shù)研究主要由國(guó)家信息中心、中國(guó)信息通信研究院(以下簡(jiǎn)稱(chēng)中國(guó)信通院)、中國(guó)電子信息產(chǎn)業(yè)發(fā)展研究院(以下簡(jiǎn)稱(chēng)賽迪研究院)等國(guó)家級(jí)信息化機(jī)構(gòu)編制,從國(guó)家層面、區(qū)域?qū)用?、省?jí)層面、產(chǎn)業(yè)層面等對(duì)我國(guó)大數(shù)據(jù)的發(fā)展情況進(jìn)行評(píng)估排名,阿里巴巴集團(tuán)、南方基金管理股份有限公司、新浪財(cái)經(jīng)等企業(yè)也基于自身數(shù)據(jù)資源優(yōu)勢(shì),針對(duì)某個(gè)領(lǐng)域開(kāi)展大數(shù)據(jù)指數(shù)評(píng)估。
根據(jù)數(shù)據(jù)源及分析方法的不同,評(píng)估類(lèi)研究又可分為互聯(lián)網(wǎng)大數(shù)據(jù)分析與統(tǒng)計(jì)數(shù)據(jù)分析兩種情況。互聯(lián)網(wǎng)大數(shù)據(jù)分析的典型代表是國(guó)家信息中心編寫(xiě)的《中國(guó)大數(shù)據(jù)發(fā)展報(bào)告(2017)》,該報(bào)告基于40多億條互聯(lián)網(wǎng)數(shù)據(jù),應(yīng)用大數(shù)據(jù)分析技術(shù),從政策環(huán)境、人才狀況、投資熱度、創(chuàng)新創(chuàng)業(yè)、產(chǎn)業(yè)發(fā)展、網(wǎng)民信心等方面,對(duì)全國(guó)各省大數(shù)據(jù)的發(fā)展情況進(jìn)行評(píng)估。阿里研究院2017年發(fā)布的《品質(zhì)消費(fèi)指數(shù)報(bào)告》[23]從全網(wǎng)采集數(shù)據(jù),使用大數(shù)據(jù)技術(shù)分析了我國(guó)居民消費(fèi)的升級(jí)趨勢(shì)。南方新浪大數(shù)據(jù)指數(shù)則在利用上市公司數(shù)據(jù)的基礎(chǔ)上,將互聯(lián)網(wǎng)大數(shù)據(jù)引入指數(shù)編制中,利用大數(shù)據(jù)對(duì)市場(chǎng)主體的情緒進(jìn)行刻畫(huà)和量化。這類(lèi)評(píng)估的好處在于,基于海量的互聯(lián)網(wǎng)數(shù)據(jù)、使用大數(shù)據(jù)技術(shù)進(jìn)行的分析評(píng)估,其數(shù)據(jù)樣本很大,有的指數(shù)涵蓋數(shù)十億甚至數(shù)百億條數(shù)據(jù),且很多數(shù)據(jù)能夠?qū)崟r(shí)動(dòng)態(tài)更新,同時(shí)使用了數(shù)據(jù)挖掘、文本分析、語(yǔ)義分析等大數(shù)據(jù)技術(shù),是真正意義上的大數(shù)據(jù)分析。不足之處在于,由于數(shù)據(jù)采自互聯(lián)網(wǎng),容易被認(rèn)為是網(wǎng)絡(luò)輿情分析或不能直接反映現(xiàn)實(shí)情況。統(tǒng)計(jì)數(shù)據(jù)分析的典型案例是中國(guó)信通院發(fā)布的《中國(guó)大數(shù)據(jù)發(fā)展調(diào)查報(bào)告(2018年)》,其主要通過(guò)現(xiàn)場(chǎng)訪問(wèn)、電話采訪、在線調(diào)研和專(zhuān)家訪談等方式獲取數(shù)據(jù)。賽迪研究院發(fā)布的《中國(guó)大數(shù)據(jù)發(fā)展指數(shù)報(bào)告(2018年)》也主要以統(tǒng)計(jì)數(shù)據(jù)為基礎(chǔ),對(duì)我國(guó)31個(gè)省、自治區(qū)、直轄市的大數(shù)據(jù)發(fā)展環(huán)境、大數(shù)據(jù)產(chǎn)業(yè)、大數(shù)據(jù)應(yīng)用、技術(shù)研發(fā)創(chuàng)新及數(shù)據(jù)共享開(kāi)放情況進(jìn)行評(píng)估。這類(lèi)評(píng)估主要基于官方統(tǒng)計(jì)數(shù)據(jù)或調(diào)查研究數(shù)據(jù),使用傳統(tǒng)數(shù)據(jù)分析方法進(jìn)行分析評(píng)估,好處是數(shù)據(jù)相對(duì)權(quán)威,不足之處在于這類(lèi)評(píng)估并非真正意義上的大數(shù)據(jù)分析,而是基于傳統(tǒng)統(tǒng)計(jì)方法開(kāi)展的小樣本數(shù)據(jù)分析。
從以上分析可以看出,無(wú)論是學(xué)術(shù)類(lèi)大數(shù)據(jù)指數(shù)研究還是評(píng)估類(lèi)大數(shù)據(jù)指數(shù)研究,雖然都可以在一定程度上進(jìn)行大數(shù)據(jù)預(yù)測(cè)或反映大數(shù)據(jù)的發(fā)展水平,但也存在一些不足。學(xué)術(shù)類(lèi)大數(shù)據(jù)指數(shù)研究由于缺少海量數(shù)據(jù)支撐,即便擁有較好的分析技術(shù)方法,往往也只能對(duì)某一領(lǐng)域進(jìn)行研究,分析對(duì)象無(wú)法覆蓋各個(gè)省市。權(quán)威機(jī)構(gòu)發(fā)布的評(píng)估類(lèi)指數(shù)也存在一定缺陷,從數(shù)據(jù)源來(lái)看,該類(lèi)評(píng)估僅僅基于互聯(lián)網(wǎng)大數(shù)據(jù)或統(tǒng)計(jì)小數(shù)據(jù),不能體現(xiàn)多源數(shù)據(jù)廣泛代表性的優(yōu)勢(shì),同時(shí)由于數(shù)據(jù)獲取困難,評(píng)估對(duì)象只能覆蓋到省級(jí)地區(qū),無(wú)法延伸到地市層面。
為了彌補(bǔ)上述兩類(lèi)方法的不足,國(guó)家信息中心聯(lián)合相關(guān)單位,探索將政府部門(mén)數(shù)據(jù)、政府網(wǎng)站數(shù)據(jù)、統(tǒng)計(jì)數(shù)據(jù)等政務(wù)數(shù)據(jù)與互聯(lián)網(wǎng)大數(shù)據(jù)、企業(yè)數(shù)據(jù)等社會(huì)數(shù)據(jù)進(jìn)行對(duì)接融合,構(gòu)建了大數(shù)據(jù)發(fā)展指數(shù)(2018),使用大數(shù)據(jù)方法對(duì)全國(guó)及各省市大數(shù)據(jù)發(fā)展情況進(jìn)行評(píng)估,從而既體現(xiàn)政務(wù)數(shù)據(jù)的直接性和權(quán)威性,也保證互聯(lián)網(wǎng)等社會(huì)數(shù)據(jù)的鮮活性和大樣本量。
一是數(shù)據(jù)層面,拓展多源數(shù)據(jù)?!爸笜?biāo)好編、數(shù)據(jù)難得”是評(píng)估工作中普遍存在的問(wèn)題,是否擁有廣泛的數(shù)據(jù)源和足夠的數(shù)據(jù)量,直接關(guān)系到定量評(píng)估的效果的好壞。本文通過(guò)大數(shù)據(jù)評(píng)估解決了數(shù)據(jù)源問(wèn)題:一是通過(guò)搭建大數(shù)據(jù)指標(biāo)監(jiān)測(cè)系統(tǒng),抓取互聯(lián)網(wǎng)中與大數(shù)據(jù)評(píng)估相關(guān)的指標(biāo),包括政府大數(shù)據(jù)規(guī)劃及政策、企業(yè)注冊(cè)數(shù)據(jù)、專(zhuān)利數(shù)據(jù)、招聘數(shù)據(jù)、經(jīng)濟(jì)金融產(chǎn)業(yè)中間投入及數(shù)量等數(shù)據(jù);二是采集國(guó)家統(tǒng)計(jì)局、工信部、知識(shí)產(chǎn)權(quán)局發(fā)布的相關(guān)政務(wù)數(shù)據(jù);三是參考借鑒現(xiàn)有研究成果,包括財(cái)新BBD(成都數(shù)聯(lián)銘品科技有限公司)數(shù)字經(jīng)濟(jì)指數(shù)中的產(chǎn)業(yè)指數(shù)、新華三數(shù)字經(jīng)濟(jì)指數(shù)和國(guó)家行政學(xué)院電子政務(wù)研究中心提出的政務(wù)應(yīng)用指數(shù)等。通過(guò)互聯(lián)網(wǎng)數(shù)據(jù)與政務(wù)數(shù)據(jù)融合分析,保證多源數(shù)據(jù)的代表性,同時(shí)也兼顧了數(shù)據(jù)的權(quán)威性。相關(guān)數(shù)據(jù)見(jiàn)表1。
表1 大數(shù)據(jù)發(fā)展指數(shù)的政務(wù)數(shù)據(jù)與社會(huì)數(shù)據(jù)使用情況
二是對(duì)象層面,覆蓋所有城市。此前的評(píng)估主要針對(duì)國(guó)家層面、區(qū)域?qū)用婕笆〖?jí)層面,缺少全方位對(duì)城市層面進(jìn)行的專(zhuān)門(mén)評(píng)估。本文將評(píng)估對(duì)象下沉到城市級(jí),獲取全國(guó)各個(gè)城市的多源異構(gòu)數(shù)據(jù),對(duì)各城市的大數(shù)據(jù)發(fā)展進(jìn)行全景式分析,力求展現(xiàn)各城市的大數(shù)據(jù)發(fā)展水平。
三是技術(shù)層面,使用先進(jìn)技術(shù)。傳統(tǒng)的統(tǒng)計(jì)分析僅能處理小樣本數(shù)據(jù),而對(duì)于數(shù)十億甚至數(shù)百億條的數(shù)據(jù),往往束手無(wú)策。更重要的是,對(duì)于互聯(lián)網(wǎng)上的大量非結(jié)構(gòu)化數(shù)據(jù),只能通過(guò)大數(shù)據(jù)手段,才能進(jìn)行有效的分析挖掘。大數(shù)據(jù)發(fā)展指數(shù)(2018)的數(shù)據(jù)加工處理綜合使用了文本挖掘、語(yǔ)義分析、情感分析、機(jī)器學(xué)習(xí)等先進(jìn)技術(shù)手段,體現(xiàn)了應(yīng)用大數(shù)據(jù)技術(shù)開(kāi)展大數(shù)據(jù)評(píng)估的特點(diǎn)。
為了確保評(píng)價(jià)指標(biāo)的有效性,準(zhǔn)確、全面地衡量我國(guó)大數(shù)據(jù)的發(fā)展水平,本文在設(shè)計(jì)大數(shù)據(jù)發(fā)展指標(biāo)時(shí)堅(jiān)持以下4項(xiàng)原則。
一是完備性。指標(biāo)體系中的指標(biāo)能夠全面地反映評(píng)估對(duì)象的發(fā)展情況,確保不遺漏重要指標(biāo)項(xiàng)。本評(píng)估指標(biāo)體系包含了基礎(chǔ)能力、創(chuàng)新應(yīng)用、綜合保障三大方面,從50個(gè)維度評(píng)估省市的大數(shù)據(jù)發(fā)展情況。
二是客觀性。在指標(biāo)選取及整個(gè)指標(biāo)體系的確立中,每個(gè)環(huán)節(jié)均選取客觀、可量化的指標(biāo),除了能夠在網(wǎng)上直接采集的客觀數(shù)據(jù),也采用了政府部門(mén)及相關(guān)機(jī)構(gòu)發(fā)布的客觀統(tǒng)計(jì)數(shù)據(jù),并借鑒了已有研究成果,盡可能規(guī)避主觀因素帶來(lái)的干擾。
三是導(dǎo)向性。整個(gè)指標(biāo)設(shè)計(jì)突出了應(yīng)用導(dǎo)向,將“創(chuàng)新應(yīng)用”指標(biāo)作為最重要的指標(biāo),并賦予最大的權(quán)重,重點(diǎn)評(píng)估各個(gè)省市在政務(wù)、經(jīng)濟(jì)及民生三大領(lǐng)域的應(yīng)用成效。
四是易操作性。所有指標(biāo)的數(shù)據(jù)均能獲取,有些數(shù)據(jù)甚至可以做到實(shí)時(shí)獲取。評(píng)價(jià)方法采用專(zhuān)家賦權(quán)法,該方法具有很強(qiáng)的操作性。同時(shí),專(zhuān)業(yè)分析人員及大數(shù)據(jù)分析平臺(tái)保證了整個(gè)評(píng)估工作的易操作性。
大數(shù)據(jù)發(fā)展指數(shù)(2018)以“應(yīng)用”為核心,圍繞“能力-成效-保障”3個(gè)方面,構(gòu)建了由基礎(chǔ)能力、創(chuàng)新應(yīng)用、綜合保障構(gòu)成的一級(jí)指標(biāo)。按照每個(gè)一級(jí)指標(biāo)包含的核心要素,設(shè)置了9個(gè)二級(jí)指標(biāo),同時(shí),根據(jù)數(shù)據(jù)的可獲得性以及為了充分體現(xiàn)政務(wù)數(shù)據(jù)與社會(huì)數(shù)據(jù)的融合,構(gòu)建了50個(gè)三級(jí)指標(biāo),形成了我國(guó)大數(shù)據(jù)發(fā)展指數(shù)。大數(shù)據(jù)發(fā)展指數(shù)屬于大數(shù)據(jù)指數(shù)范疇,兩者在數(shù)據(jù)采集匯聚、加工處理以及編制思路等方面基本相似,只是大數(shù)據(jù)發(fā)展指數(shù)更加強(qiáng)調(diào)發(fā)展應(yīng)用,“能力-成效-保障”3個(gè)維度更加突出發(fā)展的導(dǎo)向。
(1)基礎(chǔ)能力指標(biāo)
基礎(chǔ)能力指標(biāo)主要衡量地區(qū)的大數(shù)據(jù)基礎(chǔ),包括數(shù)據(jù)、算力、算法3個(gè)二級(jí)指標(biāo)和20個(gè)三級(jí)指標(biāo),見(jiàn)表2。
表2 基礎(chǔ)能力指標(biāo)
(2)創(chuàng)新應(yīng)用指標(biāo)
創(chuàng)新應(yīng)用指標(biāo)包括政務(wù)應(yīng)用、經(jīng)濟(jì)應(yīng)用和民生應(yīng)用3個(gè)二級(jí)指標(biāo)和24個(gè)三級(jí)指標(biāo),體現(xiàn)大數(shù)據(jù)在政府治理、產(chǎn)業(yè)發(fā)展和便民服務(wù)領(lǐng)域的應(yīng)用,見(jiàn)表3。
表3 創(chuàng)新應(yīng)用指標(biāo)
(3)綜合保障指標(biāo)
綜合保障指標(biāo)包含政策保障、合作保障和安全保障3個(gè)二級(jí)指標(biāo)及6個(gè)三級(jí)指標(biāo),著重分析大數(shù)據(jù)應(yīng)用的穩(wěn)定性及可持續(xù)性,見(jiàn)表4。
表4 綜合保障指標(biāo)
指標(biāo)使用了所有可獲得的能夠度量大
數(shù)據(jù)發(fā)展的年度城市數(shù)據(jù),并創(chuàng)新地納入了全網(wǎng)大數(shù)據(jù)。例如,“數(shù)據(jù)”二級(jí)指標(biāo)主要來(lái)自其他指數(shù)的評(píng)估結(jié)果,包括復(fù)旦大學(xué)發(fā)布的中國(guó)開(kāi)放數(shù)林指數(shù)、新華三的中國(guó)城市數(shù)字經(jīng)濟(jì)指數(shù);“算力”二級(jí)指標(biāo)主要來(lái)自各項(xiàng)統(tǒng)計(jì)指標(biāo);而“算法”部分則主要來(lái)自大數(shù)據(jù),從人才總量和專(zhuān)利申請(qǐng)、專(zhuān)利流轉(zhuǎn)3個(gè)方面度量大數(shù)據(jù)的技術(shù)水平,選用的數(shù)據(jù)總量達(dá)20億條。各種類(lèi)型數(shù)據(jù)的使用保證了在更細(xì)、更高頻維度上度量城市大數(shù)據(jù)的發(fā)展情況,這也是目前其他機(jī)構(gòu)發(fā)布的大數(shù)據(jù)指標(biāo)中未能體現(xiàn)的特點(diǎn)。
大數(shù)據(jù)發(fā)展指數(shù)的測(cè)算采用主觀賦權(quán)法對(duì)指標(biāo)體系中的各指標(biāo)進(jìn)行賦權(quán),通過(guò)專(zhuān)家打分再求平均值獲得各指標(biāo)的權(quán)重,在保證指標(biāo)體系科學(xué)性、全面性的同時(shí),力求指標(biāo)權(quán)重的穩(wěn)定性。
使用定基標(biāo)準(zhǔn)化方法將測(cè)算結(jié)果進(jìn)行標(biāo)準(zhǔn)化處理,既可以較方便地進(jìn)行橫向和縱向比較,也能與2018年北京的數(shù)值進(jìn)行對(duì)標(biāo),有利于各個(gè)地方找到大數(shù)據(jù)發(fā)展過(guò)程中自身存在的短板。
使用定基標(biāo)準(zhǔn)化方法的原理如下:
● 設(shè)原始值為Xijt,其中i表示指標(biāo)項(xiàng),j表示城市,t表示時(shí)間;
● 選擇2018年北京各項(xiàng)數(shù)值作為基期,標(biāo)準(zhǔn)化數(shù)值為100,記錄其縮放比例,即當(dāng)j=北京、t=2018時(shí),記錄Φi= 100/Xi;
● 將所有指標(biāo)數(shù)值乘以對(duì)應(yīng)的iΦ,得到Xijt=XijtΦi;
● 將Xijt作為新的指標(biāo)數(shù)值進(jìn)行計(jì)算。
按照此設(shè)計(jì)方法,本文對(duì)9個(gè)二級(jí)指標(biāo)權(quán)重進(jìn)行了賦值,見(jiàn)表5。從表5可知,創(chuàng)新應(yīng)用指標(biāo)的權(quán)重最高,達(dá)到45%,體現(xiàn)了創(chuàng)新應(yīng)用的重要性,突出了發(fā)展導(dǎo)向的指標(biāo)制定思路。
表5 大數(shù)據(jù)發(fā)展指數(shù)的指標(biāo)權(quán)重賦值
大數(shù)據(jù)發(fā)展指數(shù)(2018)編制形成之后,從橫向、縱向兩個(gè)維度驗(yàn)證了指標(biāo)體系在評(píng)估國(guó)家及城市大數(shù)據(jù)發(fā)展水平方面的有效性。通過(guò)對(duì)2015—2018年全國(guó)大數(shù)據(jù)發(fā)展水平進(jìn)行縱向?qū)Ρ仍u(píng)估,比較了歷年大數(shù)據(jù)發(fā)展的變化情況。通過(guò)對(duì)351個(gè)城市的大數(shù)據(jù)發(fā)展水平進(jìn)行橫向?qū)Ρ仍u(píng)估,分析了各城市大數(shù)據(jù)發(fā)展特點(diǎn)及存在的短板。
基于構(gòu)建的大數(shù)據(jù)發(fā)展指標(biāo),筆者對(duì)2015—2018年全國(guó)大數(shù)據(jù)發(fā)展指數(shù)進(jìn)行了測(cè)算,如圖1所示。結(jié)果顯示,4年來(lái),我國(guó)大數(shù)據(jù)發(fā)展總體呈現(xiàn)上升趨勢(shì),但2018年略有下降。從具體指標(biāo)來(lái)看,2015—2018年我國(guó)大數(shù)據(jù)發(fā)展的基礎(chǔ)能力始終保持上升態(tài)勢(shì),但由于創(chuàng)新應(yīng)用水平在2018年有所下降,總指數(shù)下降了0.3。
圖1 2015—2018年全國(guó)大數(shù)據(jù)發(fā)展指數(shù)
通過(guò)進(jìn)一步的分析發(fā)現(xiàn),2018年指數(shù)下降主要有兩方面原因。一是我國(guó)經(jīng)濟(jì)增速放緩,經(jīng)濟(jì)下行壓力增大,“資本寒冬”持續(xù)存在,給大數(shù)據(jù)行業(yè)的發(fā)展造成了影響,數(shù)據(jù)顯示,2018年大數(shù)據(jù)行業(yè)的風(fēng)險(xiǎn)投資額度只有2017年的20%;二是前幾年由政府主導(dǎo)推動(dòng)的大數(shù)據(jù)應(yīng)用因補(bǔ)貼高速擴(kuò)張而在2018年資金短缺時(shí)無(wú)法持續(xù),一些大數(shù)據(jù)公司2018年支付高級(jí)人才的工資也不如2017年高,招聘數(shù)量也出現(xiàn)明顯萎縮。
筆者對(duì)2018年全國(guó)351個(gè)城市大數(shù)據(jù)的發(fā)展水平進(jìn)行了評(píng)估,2018年大數(shù)據(jù)發(fā)展指數(shù)排名前40名的城市如圖2所示。結(jié)果顯示,2018年城市大數(shù)據(jù)發(fā)展指數(shù)排名前十的分別為深圳、北京、上海、杭州、成都、廣州、天津、南京、東莞、武漢,呈現(xiàn)出一線城市引領(lǐng),成都、天津等地快速跟進(jìn)的特點(diǎn)。
圖2 2018年大數(shù)據(jù)發(fā)展指數(shù)排名前40名的城市
● 分項(xiàng)指標(biāo)方面,一線城市在經(jīng)濟(jì)及民生應(yīng)用方面遙遙領(lǐng)先,而江蘇、浙江、廣東等地的政務(wù)應(yīng)用水平位居前列,算法優(yōu)勢(shì)集中于北京、上海、深圳等地,而算力資源在東北地區(qū)較為豐富。
● 數(shù)據(jù)指標(biāo)排名前五的分別為成都、深圳、廣州、青島和福州,它們均為數(shù)據(jù)資源及經(jīng)濟(jì)基礎(chǔ)較好的城市。
● 算力指標(biāo)排名前五的為大慶、牡丹江、哈爾濱、長(zhǎng)春和北京。東北之所以排名靠前,主要是因?yàn)樗懔χ笜?biāo)主要的計(jì)算來(lái)源是與大數(shù)據(jù)相關(guān)的信息系統(tǒng)基礎(chǔ),東北三省在人均光纖長(zhǎng)度、人均互聯(lián)網(wǎng)端口數(shù)量等方面均處全國(guó)領(lǐng)先地位。
● 算法指標(biāo)排名前五的為北京、深圳、東莞、上海和西安,這主要得益于城市科教資源豐富、對(duì)大數(shù)據(jù)領(lǐng)域人才吸引力較強(qiáng)。
● 政務(wù)應(yīng)用指標(biāo)排名前五的分別為東莞、深圳、無(wú)錫、南通和金華,主要集中于江蘇、浙江、廣東,其政府部門(mén)的大數(shù)據(jù)整體應(yīng)用水平相對(duì)較高。
● 經(jīng)濟(jì)應(yīng)用和民生應(yīng)用方面,上海、北京、深圳和杭州位居前四,這表明這4個(gè)城市在大數(shù)據(jù)推動(dòng)產(chǎn)業(yè)發(fā)展及提升便民服務(wù)水平方面位居全國(guó)前列。
● 綜合保障指標(biāo)方面排名前五的分別是天津、杭州、寧波、武漢和成都,表明這些城市在政策、合作和安全方面的保障力度較大,可持續(xù)發(fā)展能力較強(qiáng)。
本文將政務(wù)數(shù)據(jù)與社會(huì)數(shù)據(jù)進(jìn)行融合,構(gòu)建了國(guó)內(nèi)第一個(gè)將政務(wù)數(shù)據(jù)與社會(huì)數(shù)據(jù)融合、全景式展示城市大數(shù)據(jù)“畫(huà)像”的大數(shù)據(jù)發(fā)展指數(shù),彌補(bǔ)了大數(shù)據(jù)指標(biāo)存在的數(shù)據(jù)源單一、無(wú)法下沉到城市的不足??傮w來(lái)看,該指標(biāo)體系具有“專(zhuān)、新、多”三大特點(diǎn):“專(zhuān)”,評(píng)估對(duì)象聚焦到市,覆蓋全國(guó)351個(gè)城市;“新”,充分利用大數(shù)據(jù)手段,包括數(shù)據(jù)挖掘、語(yǔ)義分析、社會(huì)網(wǎng)絡(luò)分析等技術(shù);“多”,將政務(wù)數(shù)據(jù)、統(tǒng)計(jì)數(shù)據(jù)、企業(yè)數(shù)據(jù)、互聯(lián)網(wǎng)數(shù)據(jù)融合,應(yīng)用數(shù)據(jù)量達(dá)20億條。未來(lái)研究將基于多類(lèi)數(shù)據(jù)融合的思路,進(jìn)一步拓展數(shù)據(jù)資源范圍,充分利用大數(shù)據(jù)分析技術(shù),構(gòu)建更為合理的指標(biāo)體系,客觀評(píng)估我國(guó)國(guó)家、區(qū)域、領(lǐng)域及省市縣各級(jí)大數(shù)據(jù)發(fā)展水平,為政府治理、產(chǎn)業(yè)發(fā)展及民生服務(wù)能力提升提供客觀參考。