茹艷娜
隨著社會生產力的不斷發(fā)展,特別是進入IT時代以來,人類積累了海量的數(shù)據(jù)。互聯(lián)網上一天的數(shù)據(jù)告訴我們,一天之中互聯(lián)網產生的全部內容可以刻滿1.68億張DVD;發(fā)出的郵件有2940億封之多;200萬篇博客文章在網上發(fā)布,相當于《時代》雜志刊發(fā)770年的總量……更重要的是,數(shù)據(jù)已經不僅僅是數(shù)據(jù)本身了,已變成了一種業(yè)務。毋庸置疑,大數(shù)據(jù)時代已經來臨。面對日新月異的形勢,作為生產和管理數(shù)據(jù)的政府統(tǒng)計部門,面對大數(shù)據(jù)帶來的新形勢和新變化,更是機遇和挑戰(zhàn)并存,動力與壓力同在。而近幾年來,中國政府統(tǒng)計系統(tǒng)積極推進以一套表為核心的統(tǒng)計“四大工程”,極大地提升了政府統(tǒng)計工作的信息化水平,也為大數(shù)據(jù)的應用奠定了相對較好的基礎。我們要高度重視大數(shù)據(jù)對政府統(tǒng)計工作正在帶來和將要帶來的各種影響,充分認識推進大數(shù)據(jù)應用的必要性和緊迫性,加強頂層設計,分專業(yè)分步驟實施,以推動統(tǒng)計生產方式的變革和統(tǒng)計生產力水平的提升。
一、“大數(shù)據(jù)”對統(tǒng)計的沖擊
(一)對統(tǒng)計理念的沖擊
“大數(shù)據(jù)”改變了人們對數(shù)據(jù)的需求層次。過去,人類的認知能力有限,受數(shù)據(jù)獲取技術的制約,想要獲取大范圍的情況比較困難,只能感知身邊的個體數(shù)據(jù)乃至群體(中觀)數(shù)據(jù),人們對世界的認識不夠全面客觀。另一方面,統(tǒng)計數(shù)據(jù)反映的是總體趨勢,往往無法對應到具體的個體情況。但“大數(shù)據(jù)”時代的來臨使人類第一次有機會和條件在非常多的領域和非常深入的層次獲得和使用全面數(shù)據(jù)、完整數(shù)據(jù)和系統(tǒng)數(shù)據(jù)。在此基礎上形成的數(shù)據(jù)可以更加偏向個體情況,更加符合個體的感知,產生宏觀數(shù)據(jù)無法實現(xiàn)的價值。
(二)對統(tǒng)計生產流程的沖擊
(1)制度設計多樣化
傳統(tǒng)的統(tǒng)計設計是根據(jù)統(tǒng)計研究的目的和研究對象的特點,設定統(tǒng)計指標、統(tǒng)計報表以及調查、匯總方法等制度,通過調查、訪問將生產行為轉化為可以量化的數(shù)據(jù)?!按髷?shù)據(jù)”下的制度設計面對的是已經存在的或通過一定手段可以獲取的大量數(shù)據(jù),需要解決數(shù)據(jù)從哪里來的問題。弄清楚已經存在的相關數(shù)據(jù)是通過什么方式產生的,從哪些領域產生的,會對研究目的產生哪些影響,進而確定采用什么樣的數(shù)據(jù)來反映統(tǒng)計目標。此外,“大數(shù)據(jù)”客觀上為傳統(tǒng)的統(tǒng)計提供了更多的方法,并且可在一定程度上免除調查過程中的人為因素干擾。
(2)數(shù)據(jù)采集智能化
傳統(tǒng)統(tǒng)計是通過結構化的報表和統(tǒng)一的計量方式將被調查對象的行為轉化為可用的數(shù)據(jù),這其中需要被調查者的參與,統(tǒng)計數(shù)據(jù)的質量難以控制,并且矯正這些調查誤差的成本很高。但在大數(shù)據(jù)時代,數(shù)據(jù)來源于信息技術記錄下的原始數(shù)據(jù),這些數(shù)據(jù)的參與僅僅依賴于測量方法(如GPS定位測量、超市收銀管理系統(tǒng)),而不需要調查對象長期、認真的配合。同時互聯(lián)網、云計算等技術將大大提高數(shù)據(jù)采集的智能化水平,這種智能化的數(shù)據(jù)采集方式是傳統(tǒng)統(tǒng)計調查難以相比的。
(3)數(shù)據(jù)分析專業(yè)化
傳統(tǒng)的統(tǒng)計分析是根據(jù)統(tǒng)計制度設計的要求以及對研究對象的認知,對采集上來的結構化統(tǒng)計數(shù)據(jù)進行計算分析,重點描述過去的這段時間發(fā)生的變化,對未來的發(fā)展情況進行統(tǒng)計意義上的預測?!按髷?shù)據(jù)”背景下的數(shù)據(jù)分析,面臨的是大量存儲于各處的非結構化或半結構化數(shù)據(jù)環(huán)境,要將這些無法識別和運算的信息轉化為結構化的數(shù)據(jù),還需洞察出語義、態(tài)度、情感、社會關系、效果等傳統(tǒng)統(tǒng)計難以解決的問題。即使針對結構化的海量數(shù)據(jù),所要做的更為重要的是分析挖掘數(shù)據(jù)之間的內在關系,尋找更多有價值的信息。在這種背景下,數(shù)據(jù)分析變成統(tǒng)計部門一個關鍵性的環(huán)節(jié),需要專業(yè)化的數(shù)據(jù)挖掘與處理技術。
(4)統(tǒng)計發(fā)布透明化
“大數(shù)據(jù)”的背景下,數(shù)據(jù)的獲取分析將全社會共享,而非統(tǒng)計部門一家獨享。統(tǒng)計數(shù)據(jù)的產品屬性會更加突出,面臨的市場競爭壓力會更大。在發(fā)布結果上,僅僅告訴別人一個結果是遠遠不夠的,還需要通過可視化、交互等方式給予用戶更加方便、高效的使用方式提供更為詳盡的“意義”信息。也正是由于數(shù)據(jù)的大量存儲和共享,統(tǒng)計數(shù)據(jù)發(fā)布的公開透明程度將會極高,沒有公開詳細、公允計算方法的數(shù)據(jù)將會被其他數(shù)據(jù)替代。
(三)對政府統(tǒng)計職能的沖擊
從中國經濟發(fā)展與政府統(tǒng)計的關系上看,統(tǒng)計的重要性往往是與傳統(tǒng)的經濟模式連接在一起的。統(tǒng)計數(shù)據(jù)為經濟管理者提供了依據(jù)。隨著市場化的深入,市場內部的自我調節(jié)機制逐步替代了政府對經濟的干預。經濟發(fā)展的主導力量由宏觀逐漸走向了微觀,統(tǒng)計數(shù)據(jù)的價值發(fā)生了變化。從現(xiàn)已發(fā)生的變革上來看,包括進出口、貨幣供給、財政等數(shù)據(jù)已經不需要專門進行統(tǒng)計了,在各項相應的行政記錄里均可查詢。而物聯(lián)網等網絡經濟的發(fā)展,使得工業(yè)生產、運輸物流、最終消費、服務等各種交易生成直接可用的數(shù)據(jù),而不需要再經過專門的統(tǒng)計采集。因此,“大數(shù)據(jù)”背景下,政府統(tǒng)計的地位和職能將受到極大的挑戰(zhàn)。
二、借力“大數(shù)據(jù)”加速統(tǒng)計改革
大數(shù)據(jù)不僅是產業(yè),也是資源。同時,它也是一種科學,有非常重要的值得我們關注的發(fā)展空間。統(tǒng)計部門應當借助于“大數(shù)據(jù)”所帶來的有利條件,主動順應數(shù)據(jù)社會化的趨勢,加快推進政府統(tǒng)計的改革。
(一)統(tǒng)一統(tǒng)計標準。對政府統(tǒng)計部門應用大數(shù)據(jù)的統(tǒng)計標準進行統(tǒng)一規(guī)范,要特別重視和研究如何對非結構化數(shù)據(jù)進行標準化處理。
(二)規(guī)范統(tǒng)計指標。分析大數(shù)據(jù)的指標數(shù)據(jù)與政府統(tǒng)計指標在口徑、范圍、內涵、定義等方面的差異,以對政府統(tǒng)計應用大數(shù)據(jù)的統(tǒng)計指標進行設計、調整、規(guī)范和完善。
(三)改革調查方法。改進和完善大型周期性普查、抽樣調查等傳統(tǒng)調查方法,研究在“全樣本”基礎上進行抽樣或計算的方法,研究利用行政記錄、商業(yè)交易記錄和網上搜索信息進行測算的方法。
(四)完善采集方式。研究對非結構化數(shù)據(jù)進行采集的方式,開辟新的采集渠道,應用新的采集技術,探索如何通過搜索、購買、合作等其他方式,采集重要的基礎數(shù)據(jù)。
(五)改進數(shù)據(jù)處理。積極推動數(shù)據(jù)處理方式從簡單匯總向數(shù)據(jù)挖掘方向轉變,加強對數(shù)據(jù)的預處理,提高數(shù)據(jù)處理的智能化程度,要豐富分析手段,提高統(tǒng)計分析的時效性、趨勢性和直觀性,提升統(tǒng)計工作的分析水平和預警預測能力。
(六)完善數(shù)據(jù)發(fā)布。增加統(tǒng)計數(shù)據(jù)發(fā)布的內容,豐富數(shù)據(jù)發(fā)布的形式,提高數(shù)據(jù)發(fā)布的頻率和時效性,加強對數(shù)據(jù)的解讀,更好地滿足社會各界對統(tǒng)計數(shù)據(jù)的多樣化需求。
(七)要加強橫向合作。既要加強與其他政府職能部門的合作,也要加強與各種類型的大數(shù)據(jù)生產企業(yè)的合作,以研究和推動商業(yè)交易記錄、網上搜索信息的搜集、處理和轉換。
“大數(shù)據(jù)”的本質實際上是數(shù)據(jù)生產的社會化,其對統(tǒng)計尤其是政府統(tǒng)計的沖擊是重大的,可以大膽預測,未來政府統(tǒng)計的政府角色會被統(tǒng)計專業(yè)性取代,經濟分析的職能會被更為專業(yè)的經濟分析部門取代,宏觀數(shù)據(jù)的重要性會讓位于更有信息價值的微觀數(shù)據(jù)。統(tǒng)計部門需要正視這種變革,順應這種潮流,并借助于“大數(shù)據(jù)”的變革的有利形勢,加快提高統(tǒng)計能力,使其在大變革中處于優(yōu)勢地位。