◎ 文/雷款婷
探析大數(shù)據(jù)對(duì)官方統(tǒng)計(jì)的影響
◎ 文/雷款婷
隨著計(jì)算機(jī)、網(wǎng)絡(luò)技術(shù)和數(shù)字技術(shù)的迅速發(fā)展,移動(dòng)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、電子政務(wù)、電子商務(wù)等應(yīng)運(yùn)而生,電子數(shù)據(jù)量日新月異,紛繁多樣,其規(guī)模呈指數(shù)級(jí)增長(zhǎng),把人類社會(huì)帶進(jìn)了以“PB(1PB=1048576GB)”為單位的大數(shù)據(jù)時(shí)代。大數(shù)據(jù)是未來(lái)信息技術(shù)新的科技爆發(fā)點(diǎn)。當(dāng)前,美國(guó)在大數(shù)據(jù)運(yùn)用上剛剛起步,我國(guó)與美國(guó)站在同一條起跑線上,但我國(guó)的人口和經(jīng)濟(jì)規(guī)模決定了數(shù)據(jù)的規(guī)模為全球最大,可為大數(shù)據(jù)研究提供許多創(chuàng)新角度和實(shí)踐樣本,使官方統(tǒng)計(jì)數(shù)據(jù)有了新的供給渠道。
1.大數(shù)據(jù)亟待官方統(tǒng)計(jì)進(jìn)行技術(shù)創(chuàng)新、管理創(chuàng)新和應(yīng)用創(chuàng)新
何謂大數(shù)據(jù)?業(yè)界沒(méi)有統(tǒng)一的定義,可以描述為人們利用所有硬件環(huán)境和軟件工具收集、存儲(chǔ)、管理和分析的電子數(shù)據(jù)集。大數(shù)據(jù)除了具有數(shù)量大、速率快、多樣化和不穩(wěn)定的特點(diǎn)外,還具備需要做相關(guān)性分析、需要實(shí)時(shí)或準(zhǔn)實(shí)時(shí)流式采集、需要長(zhǎng)時(shí)間存儲(chǔ)的特點(diǎn)??梢灶A(yù)見(jiàn),大數(shù)據(jù)與云計(jì)算共同構(gòu)成了未來(lái)信息經(jīng)濟(jì)的生態(tài)系統(tǒng),過(guò)去無(wú)法收集與分析的數(shù)據(jù)如今都被云計(jì)算、互聯(lián)傳感設(shè)備、無(wú)線信號(hào)識(shí)別等新的技術(shù)手段賦予了可能性,大數(shù)據(jù)的收集、編譯、鏈接和分析系統(tǒng)等正在不斷發(fā)展和完善,面向大數(shù)據(jù)市場(chǎng)的新技術(shù)、新產(chǎn)品、新服務(wù)、新業(yè)態(tài)正不斷涌現(xiàn)。未來(lái)國(guó)家的核心競(jìng)爭(zhēng)力很大程度上將依賴于數(shù)據(jù)轉(zhuǎn)化為信息和知識(shí)的速度與能力,而這實(shí)際上取決于掌控大數(shù)據(jù)的技術(shù)能力。
2.官方統(tǒng)計(jì)應(yīng)積極搭建和發(fā)展大數(shù)據(jù)平臺(tái),獲取屬于自己的大數(shù)據(jù)
在國(guó)外,越來(lái)越多的社會(huì)研究和調(diào)查咨詢等非官方機(jī)構(gòu)開(kāi)始使用大數(shù)據(jù)收集、整理、發(fā)布與官方統(tǒng)計(jì)機(jī)構(gòu)定期常規(guī)發(fā)布相重復(fù)或基本重復(fù)的統(tǒng)計(jì)產(chǎn)品,如商品零售額、商品價(jià)格指數(shù)等。其結(jié)果是,當(dāng)非官方機(jī)構(gòu)發(fā)布的數(shù)據(jù)與官方統(tǒng)計(jì)一致時(shí),會(huì)造成資源的浪費(fèi),不一致時(shí),則會(huì)擾亂正常的統(tǒng)計(jì)數(shù)據(jù)發(fā)布秩序,影響公眾的使用,形成對(duì)官方統(tǒng)計(jì)權(quán)威的質(zhì)疑。從發(fā)展趨勢(shì)看,政府對(duì)物聯(lián)網(wǎng)、云計(jì)算的重視將有力推進(jìn)大數(shù)據(jù)在我國(guó)的落地和應(yīng)用。官方統(tǒng)計(jì)應(yīng)積極主動(dòng)適應(yīng)大數(shù)據(jù)時(shí)代的新挑戰(zhàn),適應(yīng)現(xiàn)代科技革命的新變化,加快全系統(tǒng)的信息化建設(shè)步伐,奮力推動(dòng)統(tǒng)計(jì)改革創(chuàng)新,適應(yīng)社會(huì)大眾對(duì)統(tǒng)計(jì)的新要求,將數(shù)據(jù)核心話語(yǔ)權(quán)牢牢掌握在自己的手中。
1.大數(shù)據(jù)促使官方統(tǒng)計(jì)數(shù)據(jù)更接近總體,更具公信力
統(tǒng)計(jì)研究的對(duì)象是總體。統(tǒng)計(jì)的總體思想使統(tǒng)計(jì)始終要站在研究對(duì)象的整體角度來(lái)看問(wèn)題。從2011年1月起,國(guó)家統(tǒng)計(jì)局正式實(shí)施的《房地產(chǎn)價(jià)格統(tǒng)計(jì)報(bào)表制度》規(guī)定,新建住宅銷售價(jià)格直接采用當(dāng)?shù)胤康禺a(chǎn)管理部門的網(wǎng)簽數(shù)據(jù),不再另行調(diào)查。從實(shí)際運(yùn)行情況看,房地產(chǎn)交易部門提供的網(wǎng)簽數(shù)據(jù)涵蓋了當(dāng)?shù)匦陆ㄗ≌娜拷灰浊闆r,基礎(chǔ)數(shù)據(jù)的信息詳實(shí)和及時(shí)完整性得到了明顯改善,與采用非全面調(diào)查方法的舊方案相比,優(yōu)勢(shì)明顯,更具公信力。
當(dāng)前,官方統(tǒng)計(jì)的很多數(shù)據(jù)通過(guò)抽樣調(diào)查獲取。抽樣調(diào)查首先要保證一定的樣本容量,其次樣本要能很好地代表總體,以避免調(diào)查受到社會(huì)傾向的影響。過(guò)去,由于受人力、物力、經(jīng)費(fèi)、信息處理技術(shù)等制約,人們通過(guò)抽樣去推斷總體,但抽樣調(diào)查數(shù)據(jù)的精確度和覆蓋范圍有限,有時(shí)還要面對(duì)“拒絕回答”等情況。大數(shù)據(jù)時(shí)代,人們可以放棄隨機(jī)抽樣而選擇收集和分析覆蓋全部(或近乎全部)對(duì)象的數(shù)據(jù)資料,甚至可以處理和某個(gè)特別現(xiàn)象相關(guān)的所有數(shù)據(jù)。
2.大數(shù)據(jù)促使官方統(tǒng)計(jì)數(shù)據(jù)更具時(shí)效和降低調(diào)查成本
(1)科學(xué)開(kāi)發(fā)和利用大數(shù)據(jù)能夠縮短官方統(tǒng)計(jì)數(shù)據(jù)生產(chǎn)的周期,彌補(bǔ)官方統(tǒng)計(jì)調(diào)查在及時(shí)性方面的不足。
(2)大數(shù)據(jù)的應(yīng)用將促使政府各機(jī)構(gòu)協(xié)同辦公效率和為民辦事效率大幅提高,統(tǒng)計(jì)調(diào)查員隊(duì)伍數(shù)量將會(huì)減少,調(diào)查者的負(fù)擔(dān)減輕,政府開(kāi)支將會(huì)逐漸降低。與國(guó)外相比,我國(guó)信息化建設(shè)標(biāo)準(zhǔn)規(guī)范滯后、不一致的問(wèn)題比較突出。物聯(lián)網(wǎng)行業(yè)應(yīng)用標(biāo)準(zhǔn)缺失,導(dǎo)致設(shè)備不能互相兼容、互操作性差。據(jù)統(tǒng)計(jì),2011年上海市40%的部門的業(yè)務(wù)系統(tǒng)由于技術(shù)標(biāo)準(zhǔn)不同難以與其他部門實(shí)現(xiàn)互聯(lián)互通??缭较到y(tǒng)、跨越平臺(tái)、跨越數(shù)據(jù)結(jié)構(gòu)的大數(shù)據(jù)應(yīng)用將跨越政府內(nèi)部協(xié)同的鴻溝,打開(kāi)政府各部門間、政府與市民間的邊界,大幅削減信息孤島現(xiàn)象,共享數(shù)據(jù)成為可能。
3.大數(shù)據(jù)促使官方統(tǒng)計(jì)方法制度、工作流程發(fā)生改變
每一次重大技術(shù)的發(fā)明與應(yīng)用,將推動(dòng)社會(huì)整體或局部的變革。大數(shù)據(jù)時(shí)代,官方統(tǒng)計(jì)在數(shù)據(jù)源、數(shù)據(jù)采集傳統(tǒng)方式方面的改變也必將帶來(lái)工作流程和制度方法的改變。
(1)從已發(fā)生的變革看,進(jìn)出口、貨幣供給、財(cái)政等數(shù)據(jù)已經(jīng)不需要專門進(jìn)行統(tǒng)計(jì),在各項(xiàng)相應(yīng)的行政記錄里均可查詢。
(2)當(dāng)前官方統(tǒng)計(jì)工作仍然存在人口普查、經(jīng)濟(jì)普查等大型普查人財(cái)物花費(fèi)巨大等情況。有些國(guó)家利用大數(shù)據(jù)已經(jīng)或正在改變這種情況。例如,新加坡已經(jīng)利用商場(chǎng)和超市商業(yè)記錄的價(jià)格信息計(jì)算CPI;丹麥、芬蘭等國(guó)家均已停止傳統(tǒng)意義上的人口普查,而使用日常行政登記數(shù)據(jù)進(jìn)行人口普查。
(3)物聯(lián)網(wǎng)等網(wǎng)絡(luò)經(jīng)濟(jì)的發(fā)展,也將使工業(yè)生產(chǎn)、運(yùn)輸物流、最終消費(fèi)、服務(wù)業(yè)等各種交易生成直接可用的數(shù)據(jù),而不需要再經(jīng)過(guò)專門的統(tǒng)計(jì)采集。在這種變化趨勢(shì)下,現(xiàn)行的一些統(tǒng)計(jì)指標(biāo),如工業(yè)增加值、固定資產(chǎn)投資、鐵路公路里程等,數(shù)據(jù)采集方式都會(huì)發(fā)生改變。
(4)大量的歷史統(tǒng)計(jì)數(shù)據(jù)、基層數(shù)據(jù)、各類普查原始數(shù)據(jù)以及從工商局、稅務(wù)局等部門取得的大量數(shù)據(jù),因來(lái)源于不同的系統(tǒng),具有不同的格式,指標(biāo)體系也不一致。因?yàn)闆](méi)有經(jīng)過(guò)整合,利用率比較低,無(wú)法在同一個(gè)軟件系統(tǒng)中對(duì)這些數(shù)據(jù)進(jìn)行查詢、比對(duì)和分析展現(xiàn)。大數(shù)據(jù)平臺(tái)的統(tǒng)一應(yīng)用將打破這種局限,為統(tǒng)計(jì)“四大工程”的拓展延伸提供廣闊的發(fā)展空間和機(jī)遇。
4.大數(shù)據(jù)促使官方統(tǒng)計(jì)分析和服務(wù)提升到新高度
(1)大數(shù)據(jù)的相關(guān)分析準(zhǔn)確、快速,不易受偏見(jiàn)影響。在小數(shù)據(jù)時(shí)代,相關(guān)分析要從建立假設(shè)開(kāi)始,然后進(jìn)行檢驗(yàn)。但由于基于假設(shè),相關(guān)分析就有受偏見(jiàn)影響的可能,而且極易出現(xiàn)錯(cuò)誤信息。大數(shù)據(jù)時(shí)代,官方統(tǒng)計(jì)因可用數(shù)據(jù)數(shù)量極多不會(huì)受假設(shè)、偏見(jiàn)等影響,反而會(huì)產(chǎn)生更多數(shù)據(jù)相關(guān)分析創(chuàng)新。例如,電力行業(yè)使用的智能電網(wǎng)數(shù)據(jù)不再受每月一次抄表的限制,耗電信息會(huì)以秒鐘或分鐘為間隔被測(cè)量。遍布電網(wǎng)的精巧傳感器,使數(shù)據(jù)的使用變得與以往完全不同,以此開(kāi)展的相關(guān)分析會(huì)在用電管理、費(fèi)率套餐等方面產(chǎn)生很多創(chuàng)新。
(2)大數(shù)據(jù)促使官方統(tǒng)計(jì)的分析和服務(wù)更趨精細(xì)。大數(shù)據(jù)超越了傳統(tǒng)的數(shù)據(jù)分析方法,除了可以對(duì)純數(shù)據(jù)、言論、圖表等進(jìn)行深度挖掘,利用Google的搜索、Facebook的文章以及Twitter的消息中對(duì)行為、情緒、主張等進(jìn)行精細(xì)地衡量和趨勢(shì)分析外,還可以提供客戶的偏好、未來(lái)意向及動(dòng)機(jī)等真實(shí)信息,或利用時(shí)間數(shù)據(jù)與位置數(shù)據(jù)等對(duì)社會(huì)人群進(jìn)行細(xì)分,對(duì)不同人群進(jìn)行針對(duì)性服務(wù)。
(3)大數(shù)據(jù)將極大推動(dòng)我國(guó)經(jīng)濟(jì)轉(zhuǎn)型和提升政府社會(huì)治理能力。當(dāng)前我國(guó)經(jīng)濟(jì)發(fā)展中轉(zhuǎn)型升級(jí)的許多難題,包括資源配置、戰(zhàn)略性新興產(chǎn)業(yè)、食品安全、環(huán)境保護(hù)以及新型城鎮(zhèn)化過(guò)程中遇到的住房、教育、交通等問(wèn)題,將有望通過(guò)大數(shù)據(jù)的分析研究得以解決,而大數(shù)據(jù)的精準(zhǔn)性將會(huì)提高公共政策的科學(xué)化和精細(xì)化管理水平。
1.不斷規(guī)范適應(yīng)大數(shù)據(jù)的分類標(biāo)準(zhǔn)和統(tǒng)計(jì)口徑
為保證官方統(tǒng)計(jì)的專業(yè)性、權(quán)威性,大數(shù)據(jù)的基礎(chǔ)框架和整體設(shè)計(jì)要適應(yīng)官方統(tǒng)計(jì)對(duì)大數(shù)據(jù)應(yīng)用的要求,大數(shù)據(jù)收集時(shí)應(yīng)盡可能與官方統(tǒng)計(jì)指標(biāo)的口徑和分類標(biāo)準(zhǔn)相統(tǒng)一,至少在推算或估算時(shí)要一致。開(kāi)始階段可以將大數(shù)據(jù)作為統(tǒng)計(jì)數(shù)據(jù)的有效補(bǔ)充,經(jīng)過(guò)一定時(shí)期規(guī)范化和標(biāo)準(zhǔn)化的成熟應(yīng)用后,逐步擴(kuò)大其應(yīng)用范圍。官方統(tǒng)計(jì)可成立專門的大數(shù)據(jù)分析部門,掌握最新技術(shù),特別要注意厘清可能的數(shù)據(jù)來(lái)源、范圍及其分類,制定或調(diào)整相應(yīng)的統(tǒng)計(jì)分類標(biāo)準(zhǔn),以保證依靠非傳統(tǒng)數(shù)據(jù)源加工生產(chǎn)的統(tǒng)計(jì)數(shù)據(jù)的規(guī)范、標(biāo)準(zhǔn)、真實(shí)、準(zhǔn)確。同時(shí)要不斷強(qiáng)化基礎(chǔ)工作,不斷完善統(tǒng)一編碼系統(tǒng)和登記記錄系統(tǒng),以方便統(tǒng)籌和鏈接使用大數(shù)據(jù)。
2.深入推進(jìn)和拓展統(tǒng)計(jì)“四大工程”,為大數(shù)據(jù)的應(yīng)用夯實(shí)基礎(chǔ)
利用大數(shù)據(jù)可以更快速、更全面、更精準(zhǔn)地審查、驗(yàn)證基層報(bào)送數(shù)據(jù)的準(zhǔn)確性和真實(shí)性。當(dāng)前,統(tǒng)計(jì)“四大工程”系統(tǒng)使用的聯(lián)網(wǎng)直報(bào)軟件,都具備了報(bào)表制度定義、數(shù)據(jù)錄入、編輯審核、數(shù)據(jù)匯總、數(shù)據(jù)上報(bào)等功能,覆蓋了統(tǒng)計(jì)數(shù)據(jù)生產(chǎn)過(guò)程的所有技術(shù)環(huán)節(jié)。但當(dāng)前仍有部分調(diào)查專業(yè)尚未納入統(tǒng)計(jì)“四大工程”,農(nóng)產(chǎn)品產(chǎn)量、生豬規(guī)模養(yǎng)殖戶和城鄉(xiāng)一體化調(diào)查等專業(yè)的網(wǎng)上直報(bào)系統(tǒng)尚待建立和完善。隨著統(tǒng)計(jì)“四大工程”的深入推進(jìn),各專業(yè)采用統(tǒng)一的軟件進(jìn)行各類統(tǒng)計(jì)調(diào)查的數(shù)據(jù)采集和處理,并實(shí)現(xiàn)數(shù)據(jù)共享,為大數(shù)據(jù)的應(yīng)用提供堅(jiān)實(shí)的框架和基礎(chǔ)。
3.官方統(tǒng)計(jì)必須重視大數(shù)據(jù)信息安全
當(dāng)前信息安全所面臨的危險(xiǎn)已經(jīng)滲透于社會(huì)經(jīng)濟(jì)、軍事科技、國(guó)家安全、知識(shí)產(chǎn)權(quán)、商業(yè)秘密乃至個(gè)人隱私等各個(gè)方面。因此,不但要具備防治病毒、提高系統(tǒng)抵抗外來(lái)非法黑客入侵的能力,還要提高對(duì)遠(yuǎn)程數(shù)據(jù)傳輸?shù)谋C苄?,避免在傳輸途中遭受非法竊取。大數(shù)據(jù)時(shí)代,對(duì)于數(shù)據(jù)處理的實(shí)時(shí)性有很高的要求,如何有效地防止或檢測(cè)對(duì)網(wǎng)絡(luò)的攻擊或?qū)?shù)據(jù)的篡改應(yīng)成為官方統(tǒng)計(jì)的頭等大事。官方統(tǒng)計(jì)對(duì)大數(shù)據(jù)系統(tǒng)安全性和穩(wěn)定性的要求應(yīng)遠(yuǎn)高于社交平臺(tái),必須對(duì)其使用專門的安全性高的服務(wù)器、數(shù)據(jù)儲(chǔ)存技術(shù)和網(wǎng)絡(luò)設(shè)備等,更要采用專門的數(shù)據(jù)分析方法和使用體系。我國(guó)官方統(tǒng)計(jì)有必要將數(shù)據(jù)采集安全上升到國(guó)家級(jí)戰(zhàn)略,在服務(wù)器、存儲(chǔ)、網(wǎng)絡(luò)、軟件等各環(huán)節(jié),在理念、系統(tǒng)、人才、管理等各方面努力打造信息安全機(jī)制,建立切實(shí)可行的系統(tǒng)網(wǎng)絡(luò)運(yùn)行應(yīng)急機(jī)制。
4.大數(shù)據(jù)應(yīng)用相關(guān)立法工作有待加強(qiáng)和完善
大數(shù)據(jù)從數(shù)據(jù)生成、信息收集到數(shù)據(jù)的分析和應(yīng)用,在法律法規(guī)上還存在一定的空白和欠缺,例如關(guān)于用戶隱私、政府信息收集和管控、敏感數(shù)據(jù)管理、數(shù)據(jù)質(zhì)量方面都需要進(jìn)一步通過(guò)法律來(lái)進(jìn)行規(guī)范和保障。可通過(guò)修訂《統(tǒng)計(jì)法實(shí)施細(xì)則》,規(guī)范行政記錄和商業(yè)記錄的使用目的、內(nèi)容、方法和工作流程,建立配套的保密措施和發(fā)布機(jī)制。
5.不斷增強(qiáng)挖掘大數(shù)據(jù)的核心能力
“大數(shù)據(jù)”時(shí)代采用的是自下而上的數(shù)據(jù)挖掘方式,是從大量實(shí)際產(chǎn)生數(shù)據(jù)中通過(guò)數(shù)據(jù)挖掘技術(shù)找到數(shù)據(jù)之間的關(guān)系并建立模型,生成對(duì)經(jīng)濟(jì)社會(huì)發(fā)展規(guī)律的新認(rèn)識(shí)和新見(jiàn)解。這種方式是以數(shù)據(jù)為先導(dǎo),不需要預(yù)先設(shè)定一個(gè)研究目的或方法,是對(duì)傳統(tǒng)研究范式的一種顛覆。大數(shù)據(jù)潮流勢(shì)不可擋,誰(shuí)能率先實(shí)現(xiàn)大數(shù)據(jù),誰(shuí)對(duì)大數(shù)據(jù)的挖掘更為深刻,誰(shuí)就將搶占未來(lái)先機(jī)。
(1)官方統(tǒng)計(jì)要不斷加強(qiáng)數(shù)據(jù)整合的能力,不僅是官方統(tǒng)計(jì)內(nèi)部數(shù)據(jù)的整合,更重要的是與大數(shù)據(jù)鏈條上其他外部數(shù)據(jù)整合的能力。通過(guò)信息整合和治理,創(chuàng)造更接近真實(shí)、準(zhǔn)確的數(shù)據(jù)源,獲得更加完整的數(shù)據(jù)視圖,從而進(jìn)行更為高效的數(shù)據(jù)挖掘。
(2)及時(shí)發(fā)布統(tǒng)計(jì)數(shù)據(jù),并對(duì)統(tǒng)計(jì)數(shù)據(jù)進(jìn)行詳細(xì)解讀。加強(qiáng)統(tǒng)計(jì)系統(tǒng)內(nèi)部各單位之間的數(shù)據(jù)交流,及時(shí)交換已核實(shí)的統(tǒng)計(jì)數(shù)據(jù),向公眾提供高質(zhì)量統(tǒng)計(jì)數(shù)據(jù)。
(3)招募和培養(yǎng)精通大數(shù)據(jù)管理和分析的高級(jí)人才,借鑒國(guó)際先進(jìn)統(tǒng)計(jì)手段,充分運(yùn)用大數(shù)據(jù)海量信息和研發(fā)成果進(jìn)行深入挖掘,努力促進(jìn)數(shù)據(jù)分析創(chuàng)新,數(shù)據(jù)驅(qū)動(dòng)決策,不斷增強(qiáng)對(duì)我國(guó)及世界經(jīng)濟(jì)走勢(shì)的監(jiān)測(cè)和分析,共同書寫我國(guó)官方統(tǒng)計(jì)真正的“大數(shù)據(jù)傳奇”。
(作者單位:國(guó)家統(tǒng)計(jì)局東莞調(diào)查隊(duì))
編輯:田佳奇