馬 麗
(江蘇省統(tǒng)計局,江蘇 南京 210013)
大數(shù)據(jù)是必須借助現(xiàn)代信息技術(shù)收集處理后才能具有更強(qiáng)決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長和多樣化的信息資產(chǎn)。大數(shù)據(jù)之“大”不僅僅體現(xiàn)在可供分析和使用的數(shù)據(jù)數(shù)量巨大,更在于通過交換、整合、分析這些數(shù)據(jù),探尋新規(guī)律,創(chuàng)造新價值,催生“大知識”、“大服務(wù)”、“大科技”、“大利潤”和“大發(fā)展”。
大數(shù)據(jù)涵蓋數(shù)字、文本、聲音、圖片、視頻等各種信息類型,多源異構(gòu)、分布廣泛、快速增長是其主要特點,數(shù)據(jù)的收集、保存、維護(hù)、處理以及應(yīng)用相較傳統(tǒng)發(fā)生了翻天覆地的變化。
1.數(shù)據(jù)生產(chǎn)應(yīng)用社會化。大數(shù)據(jù)時代,隨著電子商務(wù)、即時通訊、搜索引擎和網(wǎng)絡(luò)游戲等為主體的互聯(lián)網(wǎng)經(jīng)濟(jì)飛躍發(fā)展,物聯(lián)網(wǎng)、手機(jī)、平板電腦、PC以及遍布全球的各種傳感器,都成為數(shù)據(jù)的來源或載體,數(shù)據(jù)采集不再局限于人工,政府統(tǒng)計部門不再是海量數(shù)據(jù)的唯一擁有和發(fā)布者。大數(shù)據(jù)的開發(fā)應(yīng)用日益成為經(jīng)濟(jì)價值的重要來源之一,正滲透到商業(yè)、科技、醫(yī)療、政府、教育、經(jīng)濟(jì)、人文以及社會的各個領(lǐng)域。
2.數(shù)據(jù)產(chǎn)生處理快速化。大數(shù)據(jù)時代,數(shù)據(jù)產(chǎn)生會隨時隨地發(fā)生,從生成到消耗,間隔時間極短?;ヂ?lián)網(wǎng)上的數(shù)據(jù)“以秒更新”,數(shù)以億計的在線用戶時時刻刻都在產(chǎn)生巨量的信息交互;無所不在的移動設(shè)備、傳感器、實時監(jiān)控系統(tǒng)每分每秒都在產(chǎn)生和記錄數(shù)據(jù);經(jīng)濟(jì)金融領(lǐng)域中股票、期貨等交易數(shù)據(jù)瞬息萬變。數(shù)據(jù)量的飛速增長,對處理分析的時效性要求相應(yīng)提高,特別是在商業(yè)領(lǐng)域,一旦數(shù)據(jù)處理超過一定時限,就很可能失去價值。
3.數(shù)據(jù)需求層次多元化。大數(shù)據(jù)時代,人們第一次有機(jī)會和條件在非常廣泛的領(lǐng)域和非常深入的層次獲得和使用全面數(shù)據(jù)、完整數(shù)據(jù)和系統(tǒng)數(shù)據(jù)。政府層面,可應(yīng)用大數(shù)據(jù)來提高應(yīng)急處置和安全防范能力,改進(jìn)治安管理和社會管理。企業(yè)層面,可以衍生許多基于大數(shù)據(jù)分析的商業(yè)模式。公眾層面,則可以享用到更多人性化、個性化、多樣化的商業(yè)產(chǎn)品、公共服務(wù)。
4.數(shù)據(jù)分析方法智能化。大數(shù)據(jù)時代,數(shù)據(jù)的預(yù)測功能成為核心。傳統(tǒng)的統(tǒng)計數(shù)據(jù)主要通過單個數(shù)據(jù)來反映當(dāng)時狀態(tài),且由于數(shù)據(jù)產(chǎn)生收集的時滯性,往往只能進(jìn)行事后反映。而通過分析持續(xù)海量數(shù)據(jù),能夠發(fā)現(xiàn)相對穩(wěn)定的運行規(guī)律,便于對未來展開預(yù)測。如果把大量非結(jié)構(gòu)化或半結(jié)構(gòu)化的數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化的數(shù)據(jù)后加以有效的分析,還能洞察出語義、態(tài)度、情感、社會關(guān)系、效果等傳統(tǒng)數(shù)據(jù)分析難以解決的問題。
數(shù)據(jù)是開展統(tǒng)計工作的基石,其生產(chǎn)應(yīng)用方式的深刻變革,勢必對政府統(tǒng)計帶來影響與沖擊,但同時也催生了思維理念的轉(zhuǎn)變、生產(chǎn)管理的變革、方法技術(shù)的創(chuàng)新。
1.統(tǒng)計部門職能地位面臨沖擊,為促進(jìn)體制機(jī)制改革提供契機(jī)。大數(shù)據(jù)背景下,通訊、電力、金融、電商、搜索引擎等越來越多的行業(yè)擁有統(tǒng)計系統(tǒng)以外的海量數(shù)據(jù),越來越多的企業(yè)和社會調(diào)查機(jī)構(gòu)具備開發(fā)、挖掘和利用大數(shù)據(jù)資源的能力,政府統(tǒng)計部門不再是數(shù)據(jù)的主要提供者,也不再是數(shù)據(jù)的唯一發(fā)布者,政府統(tǒng)計的權(quán)威性將受到極大挑戰(zhàn)。隨著全球“開放政府?dāng)?shù)據(jù)”的呼聲日益高漲,大數(shù)據(jù)還將成為啟動透明政府的利器。只有讓數(shù)據(jù)作為生產(chǎn)資料自由流動起來,才能推動創(chuàng)新經(jīng)濟(jì)、知識經(jīng)濟(jì)和網(wǎng)絡(luò)經(jīng)濟(jì)發(fā)展。只有打破部門、行業(yè)間壁壘,建立信息合作共享機(jī)制,完善信息發(fā)布職能,強(qiáng)化統(tǒng)計服務(wù)功能等,才能實現(xiàn)統(tǒng)計體制機(jī)制改革的新飛躍。
2.統(tǒng)計調(diào)查方法面臨嬗變,為深化統(tǒng)計改革創(chuàng)造機(jī)遇。政府統(tǒng)計的調(diào)查方法以周期性普查為基礎(chǔ),以經(jīng)常性抽樣調(diào)查為主體。大數(shù)據(jù)客觀上更有助于提高抽樣樣本的隨機(jī)性,可以不再拘泥于按照收入、地址、年齡等自然屬性進(jìn)行抽樣,抽樣對象更加全面,抽樣方式更加靈活,抽樣推算結(jié)果的準(zhǔn)確性也大大提高。抽樣調(diào)查的目的是用最少的數(shù)據(jù)獲取最多的信息,是信息匱乏、處理能力受限時代的產(chǎn)物。大數(shù)據(jù)時代“樣本即總體”將成為趨勢,現(xiàn)行的抽樣調(diào)查方法可能需要作出根本性的調(diào)整和改變。統(tǒng)計部門必須加快推進(jìn)“四大工程”,改進(jìn)數(shù)據(jù)收集方法,同時充分整合利用現(xiàn)有的海量數(shù)據(jù)來源渠道,確保統(tǒng)計生產(chǎn)方式緊跟時代需求。
3.統(tǒng)計指標(biāo)體系面臨調(diào)整,為促進(jìn)統(tǒng)計事業(yè)科學(xué)發(fā)展增添動力。目前的統(tǒng)計指標(biāo)主要從宏觀層面反映經(jīng)濟(jì)社會發(fā)展?fàn)顩r,一般只細(xì)分到產(chǎn)品、行業(yè)層面,調(diào)查發(fā)布頻率通常為月度、季度,時效性相對較差,而阿里巴巴集團(tuán)依托大數(shù)據(jù)推出的網(wǎng)絡(luò)零售價格指數(shù),時效性強(qiáng)、可信度高、發(fā)布頻次快,已成為輔助了解通貨膨脹、經(jīng)濟(jì)增長、居民消費等宏觀經(jīng)濟(jì)情況的重要指標(biāo)。未來隨著大數(shù)據(jù)應(yīng)用范圍的日益廣泛,數(shù)據(jù)挖掘技術(shù)的日臻成熟,更多來自于民間非官方機(jī)構(gòu)的統(tǒng)計指標(biāo)將應(yīng)運而生,傳統(tǒng)統(tǒng)計指標(biāo)的實用性、價值性、科學(xué)性將面臨巨大挑戰(zhàn)。只有面對真實的用戶需求,積極改進(jìn)統(tǒng)計指標(biāo)、分類標(biāo)準(zhǔn)和計算方法,調(diào)整數(shù)據(jù)發(fā)布內(nèi)容,才能全面推進(jìn)統(tǒng)計事業(yè)科學(xué)發(fā)展。
4.統(tǒng)計分析方法面臨創(chuàng)新,為增強(qiáng)統(tǒng)計服務(wù)能力提供依據(jù)。傳統(tǒng)的統(tǒng)計分析主要針對結(jié)構(gòu)化數(shù)據(jù)展開,方法相對單一、固化,對相關(guān)關(guān)系的論證通常需要人為選擇關(guān)聯(lián)因子和假設(shè)前提。而海量數(shù)據(jù)往往能更直接、更準(zhǔn)確、更快速地揭示事物之間的相關(guān)關(guān)系,且不受偏見影響。大數(shù)據(jù)背景下的統(tǒng)計分析將不僅僅是簡單的數(shù)據(jù)匯總、羅列和比較,更需要專業(yè)化的數(shù)據(jù)挖掘與處理技術(shù)。把大數(shù)據(jù)方法論、數(shù)據(jù)挖掘技術(shù)和現(xiàn)代分析方法應(yīng)用于統(tǒng)計分析中,將大大提升統(tǒng)計服務(wù)決策,服務(wù)社會,服務(wù)發(fā)展的能力。
5.統(tǒng)計數(shù)據(jù)質(zhì)量亟待提高,為提升統(tǒng)計形象迎來轉(zhuǎn)機(jī)。統(tǒng)計調(diào)查數(shù)據(jù)的獲取,需要被調(diào)查者的參與,人工采集、整理數(shù)據(jù)的方式本身就會產(chǎn)生一定的誤差,一旦調(diào)查對象不予配合或者采用虛報、瞞報、亂報等方式消極配合,數(shù)據(jù)質(zhì)量更加難以保證。而真實性恰恰是大數(shù)據(jù)的主要特征之一,一方面因數(shù)據(jù)來源于客觀交易行為和實時的個體行為,目的指向性不強(qiáng)且人為干擾程度低,另一方面因可以多源頭多維度對同一對象進(jìn)行驗證,從而剝離一定的假數(shù)據(jù)。從近年來統(tǒng)計執(zhí)法查處的大量違法案件到社會公眾對部分統(tǒng)計數(shù)據(jù)的質(zhì)疑可以看出,借助大數(shù)據(jù)來提高統(tǒng)計數(shù)據(jù)質(zhì)量,提升統(tǒng)計公信力的現(xiàn)實需求刻不容緩。
大數(shù)據(jù)對政府統(tǒng)計帶來的機(jī)遇和挑戰(zhàn)前所未有,只有順應(yīng)歷史潮流,迎難而上,開拓創(chuàng)新,才能在這場變革中贏取主動,適應(yīng)時代的發(fā)展與進(jìn)步,在更新更高層面上不斷開創(chuàng)現(xiàn)代政府統(tǒng)計的新局面。
1.推動職能轉(zhuǎn)變,全力構(gòu)建服務(wù)型政府統(tǒng)計。一是優(yōu)化統(tǒng)計機(jī)構(gòu)設(shè)置。統(tǒng)計制度設(shè)計要更加貼近用戶的真實需求,數(shù)據(jù)采集要開拓整合更多可用的渠道來源,統(tǒng)計分析要運用更加專業(yè)化的數(shù)據(jù)分析手段。二是完善統(tǒng)計發(fā)布職能。要利用現(xiàn)代信息技術(shù)盡量縮短數(shù)據(jù)采集、傳輸、匯總、存儲、發(fā)布等主要環(huán)節(jié)的時間,建立及時有效的數(shù)據(jù)發(fā)布和分析系統(tǒng),采用可視化技術(shù)直觀地展示數(shù)據(jù)。三是強(qiáng)化社會服務(wù)職能。政府統(tǒng)計只有真正做到面向公眾,服務(wù)社會,才能在競爭中維護(hù)統(tǒng)計部門的權(quán)威地位。
2.完善制度方法,全面加快統(tǒng)計改革步伐。一是豐富統(tǒng)計指標(biāo)。收集政府統(tǒng)計系統(tǒng)以外的統(tǒng)計指標(biāo),分析其與現(xiàn)行統(tǒng)計指標(biāo)在口徑、范圍、內(nèi)涵、定義等方面的差異,調(diào)整、規(guī)范和完善現(xiàn)有指標(biāo)體系。二是改進(jìn)完善調(diào)查方法。加快研究利用行政記錄、商業(yè)交易記錄和搜索引擎等調(diào)查方法,采集反映物價、通貨膨脹、就業(yè)、消費等領(lǐng)域的數(shù)據(jù)信息。三是拓展數(shù)據(jù)收集渠道。整合運用現(xiàn)有的如GPS 定位測量、超市收銀管理系統(tǒng)、ETC 電子收費系統(tǒng)等信息平臺,加強(qiáng)與其他政府職能部門的橫向合作,積極探索開展第三方合作。
3.提升業(yè)務(wù)水平,積極探索現(xiàn)代化統(tǒng)計新模式。一是改進(jìn)數(shù)據(jù)處理技術(shù)。針對大數(shù)據(jù)的多源異構(gòu)性,加快研究數(shù)據(jù)清洗技術(shù),積極推動數(shù)據(jù)處理方式從簡單匯總向數(shù)據(jù)挖掘方向轉(zhuǎn)變。二是創(chuàng)新統(tǒng)計分析方法。要針對大數(shù)據(jù)速度快、存在形式多樣且關(guān)聯(lián)性強(qiáng)的特點,加強(qiáng)實時、關(guān)聯(lián)和可視化分析。利用大數(shù)據(jù)在分析相關(guān)關(guān)系方面的優(yōu)勢,提升預(yù)警預(yù)測能力。三是開發(fā)統(tǒng)計新產(chǎn)品。在做優(yōu)做強(qiáng)統(tǒng)計數(shù)據(jù)、統(tǒng)計分析、統(tǒng)計監(jiān)測等傳統(tǒng)產(chǎn)品的基礎(chǔ)上,研制開發(fā)更高層次的統(tǒng)計產(chǎn)品及服務(wù)。如精準(zhǔn)實用的預(yù)測模型、個性化定制咨詢服務(wù)、便捷開放的數(shù)據(jù)查詢系統(tǒng)等。
4.健全法律法規(guī),切實保障各類主體隱私安全。大數(shù)據(jù)時代,并不意味著數(shù)據(jù)可以無條件、無原則地絕對公開。安全和隱私、法律法規(guī)的約束和限制仍是必須重視和直面的問題。個人、家庭隱私以及企業(yè)經(jīng)營、管理等商業(yè)數(shù)據(jù)均是神圣不可觸碰的底線。必須進(jìn)一步健全數(shù)據(jù)采集、使用、分享等相關(guān)法律法規(guī),做好統(tǒng)計制度方法改革與《統(tǒng)計法》等現(xiàn)有法律法規(guī)的銜接,確保在保密安全的前提下,讓數(shù)據(jù)通過合法、合理的機(jī)制,實現(xiàn)社會共享,真正實現(xiàn)取之于民、用之于民。
[1] 維克托·邁爾-舍恩伯格,肯尼思·庫克耶.大數(shù)據(jù)時代[M].盛楊燕,周濤譯.浙江人民出版社.
[2] 涂子沛.大數(shù)據(jù)[M].廣西師范大學(xué)出版社.
[3] 許小樂. “大數(shù)據(jù)”與政府統(tǒng)計改革[J].調(diào)研世界,2013(5):42-45.
[4] 李翔.淺議大數(shù)據(jù)技術(shù)對統(tǒng)計工作的影響[J].遼寧經(jīng)濟(jì)統(tǒng)計,2013(5):21-24.
[5] 吳立鋒,李世超.淺談大數(shù)據(jù)時代的政府服務(wù)型統(tǒng)計[N].中國信息報.2013-6-19.