□褚英國 阮圣健
本文闡述了大數(shù)據(jù)在統(tǒng)計工作中應用的歷史機遇,總結了大數(shù)據(jù)在統(tǒng)計工作中的應用實踐,分析了大數(shù)據(jù)統(tǒng)計應用面臨的困難,提出了樹立大數(shù)據(jù)思維,實現(xiàn)理念創(chuàng)新;健全工作機制,加強人才培養(yǎng);上下多管齊下,跨越數(shù)據(jù)鴻溝;推進模型研究,明確應用方向;建立統(tǒng)一平臺,全省統(tǒng)籌協(xié)調;突破傳統(tǒng)模式,完善統(tǒng)計體系等推進大數(shù)據(jù)統(tǒng)計應用的具體建議。
大數(shù)據(jù)時代的到來,為統(tǒng)計工作現(xiàn)代化建設提供了新的技術和思維方式,對推進統(tǒng)計工作轉型,提升統(tǒng)計數(shù)據(jù)生產和服務水平帶來了機遇。研究大數(shù)據(jù)在統(tǒng)計中的應用成為統(tǒng)計應對社會變革和創(chuàng)新的重要途徑,如何利用好大數(shù)據(jù)服務統(tǒng)計改革發(fā)展,推動統(tǒng)計工作數(shù)字化轉型,是擺在統(tǒng)計部門面前的新課題、新機遇,也是新挑戰(zhàn)。
2010年,歐盟發(fā)起“歐洲數(shù)字化議程”,開放最原始數(shù)據(jù),鼓勵數(shù)據(jù)開發(fā)與應用。2012年,美國推出大數(shù)據(jù)國家發(fā)展計劃,鼓勵多方合作推進技術創(chuàng)新,為大數(shù)據(jù)提供最根本的支持。同年,聯(lián)合國推出“數(shù)據(jù)脈動”計劃。2013年,日本推出以大數(shù)據(jù)為核心的新IT國家戰(zhàn)略。2015年,國務院發(fā)布《促進大數(shù)據(jù)發(fā)展行動綱要》,提出全面推進大數(shù)據(jù)發(fā)展和應用,加快建設數(shù)據(jù)強國。2018年政府工作報告明確指出要深入推動大數(shù)據(jù)廣泛應用。隨著國內外大數(shù)據(jù)基礎設施建設的完善,大數(shù)據(jù)技術架構的成熟,以人工智能、智慧城市等為代表應用的落地,DT時代已來臨,大數(shù)據(jù)技術應用必然迎來井噴之勢。
據(jù)IDC預測,2020年全球擁有的數(shù)據(jù)量將比2011年增長近20倍,近2年產生的數(shù)據(jù)總量相當于人類有史以來所有數(shù)據(jù)量的總和。在此背景下引發(fā)的問題復雜性與不確定性使得政府治理難以再單純依靠經驗解決,從問題的界定、原因分析、政策制定與執(zhí)行,都需要大數(shù)據(jù)來支撐,要用數(shù)據(jù)說話。習總書記在中央政治局國家大數(shù)據(jù)戰(zhàn)略第二次集體學習會上指出:要運用大數(shù)據(jù)提升國家治理現(xiàn)代化水平,要建立健全大數(shù)據(jù)輔助科學決策和社會治理的機制,推進政府管理和社會治理模式創(chuàng)新,實現(xiàn)政府決策科學化、社會治理精準化、公共服務高效化,提高對風險的感知、預測、防范能力。
統(tǒng)計是經濟社會發(fā)展重要的基礎性工作,是宏觀調控的重要依據(jù)。近年來,統(tǒng)計數(shù)據(jù)質量問題層出不窮,十九大報告明確指出要完善統(tǒng)計體制,黨和國家領導同志多次對統(tǒng)計工作作出重要指示:要順應時代潮流,以更加開放的態(tài)度擁抱大數(shù)據(jù),積極推動大數(shù)據(jù)技術與現(xiàn)代統(tǒng)計的深度融合,運用大數(shù)據(jù)思維實現(xiàn)統(tǒng)計業(yè)務流程再造,提升統(tǒng)計數(shù)據(jù)生產效率,提高數(shù)據(jù)資源開發(fā)利用水平,豐富統(tǒng)計產品和成果,為宏觀調控和科學決策提供更加及時優(yōu)質的統(tǒng)計服務?!督y(tǒng)計法實施條例》明確提出“推進大數(shù)據(jù)在統(tǒng)計工作中的應用,滿足經濟社會發(fā)展需要”。國家統(tǒng)計局落實黨的十九大關于完善統(tǒng)計體制重要部署工作方案中提出“加快建立基于大數(shù)據(jù)云計算廣泛應用的統(tǒng)計生產方式”。
2016年初,浙江省統(tǒng)計局成立促進大數(shù)據(jù)發(fā)展實施計劃領導小組及辦公室,正式部署大數(shù)據(jù)統(tǒng)計應用工作。與浙江移動合作開展人口及就業(yè)移動大數(shù)據(jù)合作,研究全省及各市縣(區(qū)、市)人口、都市區(qū)及其核心城區(qū)八大產業(yè)就業(yè)人口的變化趨勢、性別比例、年齡結構。與省商務廳、中津研究院合作,利用爬蟲技術探索獲取全國主要電子商務交易數(shù)據(jù),反映全省電子商務總量規(guī)模、結構、發(fā)展趨勢。與阿里巴巴合作,測算全省及分市縣未在庫賣家零售額。依托省政府公共數(shù)據(jù)交換平臺,啟動《浙江統(tǒng)計數(shù)字化應用平臺》建設,形成省市縣三級跨專業(yè)、跨部門數(shù)據(jù)共享機制,推進內部數(shù)據(jù)跨專業(yè)利用、外部數(shù)據(jù)跨部門利用。利用省政府“多證合一”平臺數(shù)據(jù)審核企業(yè)基礎信息,讓“數(shù)據(jù)跑路”代替“群眾跑腿”,為“一套表”調查單位審核提供更為準確的基礎庫。獲取稅務部門基層數(shù)據(jù)進行統(tǒng)計數(shù)據(jù)質量評估。
近年來,各市統(tǒng)計局積極開展大數(shù)據(jù)統(tǒng)計應用探索,并取得一定效果。杭州積極利用稅務部門數(shù)據(jù)評估統(tǒng)計數(shù)據(jù)質量,開展跨境電子商務統(tǒng)計。寧波市縣兩級利用電力數(shù)據(jù)進行經濟形勢和耗能情況比對分析,利用稅務數(shù)據(jù)進行相關單位營業(yè)收入核查。溫州研發(fā)行業(yè)分類智能編碼系統(tǒng),實現(xiàn)行業(yè)代碼智能編碼和編碼詞條庫實時學習更新,應用于全國基本單位名錄庫管理、四經普單位清查比對與普查,顯著提高了全國行業(yè)編碼的效率和準確性。嘉興與阿里學院、高校開展合作,調查企業(yè)、住戶等電子商務活動參與者的基本特征與發(fā)展態(tài)勢。衢州與移動公司合作開展城鎮(zhèn)化人口動態(tài)監(jiān)測。義烏建設了電子商務大數(shù)據(jù)應用統(tǒng)計平臺,利用爬蟲技術抓取電商成交額,分析解讀義烏市電子商務成交額、主要銷售產品類型。
2017年,國家統(tǒng)計局與貴州省簽署《共辦大數(shù)據(jù)統(tǒng)計學院戰(zhàn)略合作協(xié)議》,2018年舉辦以“大數(shù)據(jù)新統(tǒng)計”為主題的大數(shù)據(jù)統(tǒng)計論壇,并成立大數(shù)據(jù)統(tǒng)計學院,培養(yǎng)大數(shù)據(jù)統(tǒng)計創(chuàng)新型高端人才,促進大數(shù)據(jù)與統(tǒng)計深度融合。2018年,國家統(tǒng)計局成立“人口統(tǒng)計大數(shù)據(jù)實驗室”,利用大數(shù)據(jù)探索開展人口統(tǒng)計。全面推進部門數(shù)據(jù)在全國第四次經濟普查中的應用。制定《大數(shù)據(jù)應用工作方案》,強化大數(shù)據(jù)在統(tǒng)計工作中的運用。2016年,青海省統(tǒng)計局成立旅游大數(shù)據(jù)研究課題組,制定《大數(shù)據(jù)在旅游人次數(shù)統(tǒng)計中的應用方案》,推進旅游大數(shù)據(jù)統(tǒng)計工作。2017年,四川省統(tǒng)計局成立大數(shù)據(jù)中心,推進統(tǒng)計大數(shù)據(jù)分析利用。2018年,北京市統(tǒng)計局與北京騰云天下科技有限公司合作,推進利用智能終端大數(shù)據(jù)進行人口動態(tài)監(jiān)測,實現(xiàn)北京市及京津冀人口的流動情況分析,為北京市疏解非首都功能、京津冀協(xié)同發(fā)展提供參考。2018年,海南省統(tǒng)計局正式啟動海南“統(tǒng)計大數(shù)據(jù)”建設,充分挖掘數(shù)據(jù)資源,打造海南統(tǒng)計大數(shù)據(jù)平臺。
傳統(tǒng)統(tǒng)計思維主要體現(xiàn)在自上而下實證統(tǒng)計理論為基礎的統(tǒng)計理論制度,以層層匯總上報的全面統(tǒng)計和局部樣本來描述與推測總體的抽樣調查方法為主,數(shù)據(jù)采集基本靠人為采集。大數(shù)據(jù)技術通過各種客觀設備與系統(tǒng)直接、無意識地獲取全面數(shù)據(jù),更加準確、客觀、全面反映社會經濟發(fā)展情況。這是一種科學認識現(xiàn)實世界和分析判斷事物發(fā)展規(guī)律的全新方法,必然導致統(tǒng)計制度的顛覆性改革。而統(tǒng)計系統(tǒng)長期實施實證統(tǒng)計理論的普查、全面統(tǒng)計、抽樣調查,思維上很難快速發(fā)生轉變,最終體現(xiàn)在制度方法、業(yè)務流程、管理機制等改革上舉步維艱。
一方面,隨著互聯(lián)網和移動互聯(lián)網的快速發(fā)展,阿里巴巴、騰訊、百度、京東等國內大型互聯(lián)網公司擁有大量的社會化大數(shù)據(jù)資源,這些公司都將數(shù)據(jù)作為其核心資產加以保護,在國家沒有相關法律法規(guī)明確約束的前提下,省及以下統(tǒng)計部門很難取得全量數(shù)據(jù)并加以分析利用。利用網絡爬蟲技術抓取數(shù)據(jù)存在法律風險并且易受反爬蟲技術干擾。這些都制約社會化大數(shù)據(jù)的獲取與利用。另一方面,其他政府部門的電子政務數(shù)據(jù),統(tǒng)計部門主要依靠各地政府主導的數(shù)據(jù)資源共享機制獲取,目前尚處起步階段,政府統(tǒng)一歸集的數(shù)據(jù)資源還不足以完全滿足統(tǒng)計工作的需要。
模型是能否讓大數(shù)據(jù)在統(tǒng)計工作中真正落地發(fā)揮作用的關鍵。不考慮以傳統(tǒng)數(shù)據(jù)分析為主的廣義大數(shù)據(jù)統(tǒng)計應用,由于大數(shù)據(jù)資源有限,真正意義上的大數(shù)據(jù)統(tǒng)計應用模型主要集中在利用通信運營商的移動信令數(shù)據(jù)建模進行人口、旅游、交通等方面的監(jiān)測,利用電商平臺數(shù)據(jù)建模進行電子商務監(jiān)測,以及利用其他政府部門數(shù)據(jù)建模進行數(shù)據(jù)質量評估。同時,受統(tǒng)計制度限制,針對特定對象制定的統(tǒng)計報表中有許多指標無法從其他大數(shù)據(jù)中取得,限制了大數(shù)據(jù)在統(tǒng)計工作應用的范圍,即使有了一些大數(shù)據(jù)應用的成果,也只是作為驗證傳統(tǒng)調查結果準確性的輔助手段,未能發(fā)揮大數(shù)據(jù)真正的內在價值。
大數(shù)據(jù)統(tǒng)計應用的本質是數(shù)據(jù)分析和挖掘數(shù)據(jù)價值,這就需要大量的數(shù)據(jù)分析師。不僅需要掌握數(shù)學、計算機等知識,而且也需要掌握統(tǒng)計、經濟、政府治理、公共服務等知識。當前社會上具備單一知識結構的人才相對不少,但具備復合知識結構的人才不多,在統(tǒng)計部門工作的復合型人才更少。統(tǒng)計部門針對各級統(tǒng)計干部進行大數(shù)據(jù)相關知識的系統(tǒng)培訓較少,統(tǒng)計干部的知識結構和綜合素質還難以適應大數(shù)據(jù)時代統(tǒng)計改革發(fā)展的要求。
大數(shù)據(jù)的本質不在于大,而在于其蘊含的大數(shù)據(jù)思維,核心是全面思維和相關性思維。全面思維就是從樣本分析掌握全局轉向分析相關的、幾乎所有的數(shù)據(jù)來掌握全局,統(tǒng)計數(shù)據(jù)從少量、靜態(tài)、單一的樣本數(shù)據(jù)轉變?yōu)楹A俊討B(tài)、多樣的“全體數(shù)據(jù)”,從而更全面分析經濟形勢。相關性思維是系統(tǒng)而非孤立分析數(shù)據(jù)、分析事物間的內在聯(lián)系。樹立大數(shù)據(jù)思維之于統(tǒng)計工作,就是要突破原有做法,將全面思維、相關性思維運用到統(tǒng)計方法制度設計、業(yè)務流程再造、管理機制完善等方面。
進一步完善業(yè)務部門主導、技術部門保障的工作格局,定期開展大數(shù)據(jù)統(tǒng)計應用工作交流,建立大數(shù)據(jù)統(tǒng)計應用模型研究專班機制。對已明確的應用方向,建立項目專班,投入力量推進應用落地。注重培養(yǎng)與引進具有大數(shù)據(jù)思維、統(tǒng)計專業(yè)知識、信息技術技能、經濟知識、數(shù)據(jù)分析能力等復合型人才。加強跨專業(yè)、跨領域間干部的交流,組織數(shù)據(jù)分析、深度挖掘等大數(shù)據(jù)相關的知識培訓,組織CDA數(shù)據(jù)分析師認證培訓考試,打造一支大數(shù)據(jù)統(tǒng)計應用的專門隊伍。
法律法規(guī)層面上,建議國家統(tǒng)計局協(xié)調相關部門盡快完善相關法律法規(guī),在保證數(shù)據(jù)安全、個人隱私、商業(yè)秘密的前提下,明確大數(shù)據(jù)公司有義務向國家提供其所擁有的所有數(shù)據(jù)資源。全國性社會化大數(shù)據(jù)層面上,建議國家統(tǒng)計局協(xié)調國家部委和行業(yè)主管部門或直接與BAT、通信運營商、物流平臺、網銀公司等大數(shù)據(jù)公司開展大數(shù)據(jù)合作,及時獲取大數(shù)據(jù)公司的數(shù)據(jù)并返回各省使用。政府部門大數(shù)據(jù)層面上,充分依托各地政府統(tǒng)一建立的公共數(shù)據(jù)交換平臺,推動跨部門的數(shù)據(jù)共享,鼓勵各專業(yè)根據(jù)業(yè)務需要申請使用平臺已有其他部門數(shù)據(jù)資源,建議政府加快拓展平臺數(shù)據(jù)廣度和深度。
開展利用大數(shù)據(jù)推進統(tǒng)計調查和統(tǒng)計分析現(xiàn)代化的大數(shù)據(jù)統(tǒng)計應用模型研究,充分利用統(tǒng)計系統(tǒng)、高校、社會科研機構、大數(shù)據(jù)企業(yè)等力量,探索確定可落地操作的應用模型,厘清大數(shù)據(jù)內容、大數(shù)據(jù)頻率、大數(shù)據(jù)來源等關鍵要素。應用模型成熟后,探索建立具體大數(shù)據(jù)統(tǒng)計制度,使用大數(shù)據(jù)直接進行統(tǒng)計數(shù)據(jù)生產。充分利用稅務、市場監(jiān)管等部門以及大數(shù)據(jù)企業(yè)數(shù)據(jù),對工業(yè)、能源、投資、貿易、服務業(yè)、人口就業(yè)、社會科技等專業(yè)數(shù)據(jù)進行核實、比對和評估,提高統(tǒng)計數(shù)據(jù)質量?;诖髷?shù)據(jù)應用的智能化、精準化統(tǒng)計分析服務,提高統(tǒng)計服務黨委政府決策的精準度。積極推進各級統(tǒng)計部門創(chuàng)新思路、試點試驗,在實踐中探索、積累、總結、推廣。
構建全省統(tǒng)一的、數(shù)據(jù)深度挖掘的統(tǒng)計監(jiān)測分析系統(tǒng)為核心的《浙江統(tǒng)計數(shù)字化應用平臺》,部署全省統(tǒng)一的R、SPSS等專業(yè)數(shù)據(jù)分析軟件,充分利用平臺歸集的數(shù)據(jù),定制大數(shù)據(jù)統(tǒng)計應用分析模型,加強經濟運行實時分析、經濟發(fā)展質量評價、經濟指標預測和分析研判,實現(xiàn)大數(shù)據(jù)統(tǒng)計應用模型的積累與分享以及低門檻可視化操作。堅持“平臺上移、服務下延”的理念,全省一盤棋,統(tǒng)一規(guī)劃、統(tǒng)籌推進、整體協(xié)調,杜絕重復建設、無序發(fā)展,鼓勵各地在統(tǒng)一框架下積極探索大數(shù)據(jù)統(tǒng)計應用建設。
在大數(shù)據(jù)統(tǒng)計應用發(fā)展到一定程度,應積極推進完善統(tǒng)計體系。一是統(tǒng)計方法完善。逐步取消層層上報的全面統(tǒng)計報表制度,依托大數(shù)據(jù)改進周期性普查和抽樣調查制度,建立大數(shù)據(jù)統(tǒng)計制度,重構統(tǒng)計內容、對象等制度內涵。二是統(tǒng)計流程完善。統(tǒng)計數(shù)據(jù)處理流程從以層層上報的“調查對象->統(tǒng)計部門”模式為主向“調查對象->大數(shù)據(jù)企業(yè)->統(tǒng)計部門”、“調查對象->部門統(tǒng)計->統(tǒng)計部門”等模式與其并重轉變。三是統(tǒng)計職能完善。大數(shù)據(jù)時代,大數(shù)據(jù)企業(yè)、各行業(yè)主管部門都是大數(shù)據(jù)的主要直接生產者,統(tǒng)計部門要強化在數(shù)據(jù)管理、發(fā)布、使用上的職能,加強對大數(shù)據(jù)企業(yè)、部門統(tǒng)計的統(tǒng)計管理職能,真正實現(xiàn)從做統(tǒng)計到既做又管統(tǒng)計的轉變。