徐楊
摘 要:隨著政府對經(jīng)濟活動認識的不斷深入,統(tǒng)計調(diào)查的方式也由全面普查到抽樣調(diào)查,再發(fā)展到大數(shù)據(jù)時代的全面調(diào)查。大數(shù)據(jù)擁有的智能化、高效率的優(yōu)勢,在與傳統(tǒng)調(diào)查方式的對比中逐漸凸顯出來。本文對大數(shù)據(jù)時代下抽樣調(diào)查存在的意義和方式進行探討,比較分析大數(shù)據(jù)在政府統(tǒng)計中的應(yīng)用和抽樣調(diào)查的優(yōu)缺點,探索大數(shù)據(jù)和抽樣調(diào)查有效銜接的可行性,達到兩者融合發(fā)展的目的。
關(guān)鍵詞:大數(shù)據(jù)? 抽樣調(diào)查? 政府統(tǒng)計
中圖分類號:F270.7?文獻標識碼:A?文章編號:2096-0298(2020)03(b)--02
1 數(shù)據(jù)獲取方式的發(fā)展過程
1.1 抽樣調(diào)查技術(shù)發(fā)展回顧
抽樣調(diào)查是19世紀從概率論中發(fā)展而來的一門調(diào)查技術(shù),抽樣調(diào)查方法在我國經(jīng)歷了曲折的發(fā)展,具體來說,新中國成立以來抽樣調(diào)查技術(shù)的發(fā)展變化主要有以下幾個階段:
抽樣調(diào)查技術(shù)的運用首先是在農(nóng)業(yè)領(lǐng)域。20世紀60年代初期,成立了全國各級農(nóng)產(chǎn)量調(diào)查隊,運用抽樣調(diào)查的方式進行農(nóng)作物產(chǎn)量調(diào)查,標志著我國運用抽樣技術(shù)完成統(tǒng)計調(diào)查的開始。
然而隨后的20世紀60年代時期,抽樣調(diào)查技術(shù)的發(fā)展一度陷入停滯,20世紀70年代,人們重新開始重視抽樣調(diào)查的科學性和重要性。1980年4月,國務(wù)院恢復(fù)職工家庭生活抽樣調(diào)查。這一時期,存在著以全面統(tǒng)計為主,抽樣調(diào)查為輔的兩種統(tǒng)計方法。
從1994 年開始,政府統(tǒng)計系統(tǒng)對統(tǒng)計調(diào)查制度進行修訂,提出采用抽樣調(diào)查和全面調(diào)查相結(jié)合的方法。改革開放使經(jīng)濟、科學技術(shù)飛速發(fā)展,也對統(tǒng)計調(diào)查范圍提出新的要求。1996年國務(wù)院開始對全國第二、三產(chǎn)業(yè)中各種經(jīng)濟類型、各種經(jīng)濟規(guī)模的企業(yè)進行抽樣調(diào)查。與此同時,抽樣調(diào)查在更多的領(lǐng)域得到廣泛應(yīng)用。1993—2000年,我國建立了人口、工業(yè)、農(nóng)業(yè)、第三產(chǎn)業(yè)、基本單位和對外經(jīng)濟等普查制度,基本單位名錄庫更新維護制度,建立了個體私營企業(yè)名錄庫定期更新維護制度,為開展各種抽樣調(diào)查提供了全面準確的點名庫和抽樣框,為拓展抽樣調(diào)查奠定了堅實基礎(chǔ)。
1.2 大數(shù)據(jù)時代來臨
大數(shù)據(jù),指無法在一定時間范圍內(nèi)用常規(guī)軟件工具進行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn) 。
大數(shù)據(jù)的特征有以下四點:(1)數(shù)據(jù)量巨大。(2)類型繁多。(3)價值密度低。(4)速度快、時效高。隨著大數(shù)據(jù)的發(fā)展速度不斷加快,政府統(tǒng)計工作的方法也在發(fā)生變化,逐漸由傳統(tǒng)的抽樣調(diào)查方法向大數(shù)據(jù)分析過渡。例如,近年來國家統(tǒng)計局通過與阿里巴巴、百度、騰訊等17家企業(yè)簽署大數(shù)據(jù)戰(zhàn)略合作協(xié)議,直接獲取互聯(lián)網(wǎng)上部分電商交易、行業(yè)平臺、搜索引擎等多方面的海量數(shù)據(jù),這些數(shù)據(jù)可以對政府統(tǒng)計工作進行有效補充。由于大數(shù)據(jù)無可比擬的優(yōu)勢,使得傳統(tǒng)抽樣調(diào)查方法的地位受到挑戰(zhàn),因此,其在今后的政府統(tǒng)計工作中應(yīng)該何去何從是一個值得探討的問題。
2 調(diào)查方法優(yōu)劣勢分析
2.1 抽樣調(diào)查優(yōu)勢與不足
抽樣調(diào)查是一種非全面調(diào)查,它是按照一定程序從總體中抽取一部分單位作為樣本進行調(diào)查,并根據(jù)樣本調(diào)查結(jié)果來推斷總體特征的數(shù)據(jù)調(diào)查方法。一般來說,抽樣調(diào)查既能節(jié)省人力、物力、財力,又可以提高資料的時效性,具有許多優(yōu)點。在統(tǒng)計工作中采用抽樣調(diào)查的好處:第一,經(jīng)濟性。由于調(diào)查的樣本單位通常是總體單位中的很小一部分,調(diào)查的工作量小,因此調(diào)查費用較低。第二,時效性強。抽樣調(diào)查可以迅速、及時地獲得所需要的信息。由于工作量小,調(diào)查的準備時間、調(diào)查時間、數(shù)據(jù)處理時間等都可以大大縮減,從而提高數(shù)據(jù)的時效性。第三,適應(yīng)面廣。抽樣調(diào)查可以獲得更廣泛的信息,它適用于對各個領(lǐng)域、各種問題的調(diào)查。例如,產(chǎn)品質(zhì)量檢查、農(nóng)產(chǎn)品實驗、醫(yī)藥的臨床試驗等。第四,準確性高。由于抽樣調(diào)查工作量小,可使各環(huán)節(jié)的工作做得更細致,誤差往往更小。
當然,抽樣調(diào)查也存在明顯缺陷。第一,抽樣調(diào)查對樣本的代表性和有效性有比較嚴苛的要求,而在實際工作中常常難以得到理想的樣本,使得統(tǒng)計工作難以保證抽樣的科學性和推算的準確性。第二,抽樣調(diào)查存在一定的誤差,可能產(chǎn)生于調(diào)查方案設(shè)計、抽樣設(shè)計、數(shù)據(jù)搜集、數(shù)據(jù)處理及分析等各個階段與環(huán)節(jié)。第三,在總體數(shù)據(jù)過少的情況下,采用抽樣調(diào)查的隨機性會受到限制,影響抽樣的代表性。第四,對于調(diào)查的結(jié)果來說,一旦樣本調(diào)查結(jié)果不夠準確,意味著在總體進行推算的時候會有較大的誤差。
2.2 大數(shù)據(jù)在政府統(tǒng)計中的作用分析
與傳統(tǒng)的抽樣調(diào)查方法產(chǎn)生的信息數(shù)據(jù)不同,大數(shù)據(jù)具有數(shù)據(jù)大量化、類型多樣化、快速化、價值高等特征。現(xiàn)代信息技術(shù)使海量網(wǎng)絡(luò)數(shù)據(jù)成為統(tǒng)計數(shù)據(jù)的來源之一。如在居民消費價格統(tǒng)計(CPI)中,利用互聯(lián)網(wǎng)信息特別是電商交易價格數(shù)據(jù)以補充完善調(diào)查樣本;在農(nóng)業(yè)統(tǒng)計中,結(jié)合使用衛(wèi)星影像、空間高分辨圖像和地面定位系統(tǒng)采集設(shè)備、傳感器、物聯(lián)網(wǎng)等技術(shù),獲取有關(guān)農(nóng)作物種植面積、農(nóng)作物種類等海量數(shù)據(jù)。大數(shù)據(jù)并不僅僅擁有海量的數(shù)據(jù)信息,還包括對數(shù)據(jù)采取專業(yè)化處理。利用大數(shù)據(jù)和云計算在獲取大量實時數(shù)據(jù)的同時,通過對這些數(shù)據(jù)的清洗、處理、挖掘和分析,可以在第一時間了解當前經(jīng)濟社會的發(fā)展狀況,對發(fā)現(xiàn)的問題快速決策快速解決,提高統(tǒng)計能力和工作效率。
相較于傳統(tǒng)的抽樣調(diào)查方法,大數(shù)據(jù)在政府統(tǒng)計中的優(yōu)勢主要有:
(1)快速獲取數(shù)據(jù)信息。大數(shù)據(jù)可以直接調(diào)用現(xiàn)成的、已有的數(shù)據(jù),不需要進行抽樣調(diào)查的一系列工作,減少了獲取數(shù)據(jù)所花費的時間,提高了獲得數(shù)據(jù)的時效性。
(2)在抽樣調(diào)查中,根據(jù)樣本數(shù)據(jù)推論總體狀況往往會不可避免地存在一定誤差,而大數(shù)據(jù)則不存在這一問題,數(shù)據(jù)經(jīng)過層層記錄毫無保留地呈現(xiàn),能夠有效避免傳統(tǒng)抽樣調(diào)查方法的弊端。
(3)省去抽樣調(diào)查中諸如調(diào)查方案設(shè)計、精確度估計等環(huán)節(jié),相對于抽樣調(diào)查方法更進一步節(jié)省人力物力,提高效率。
(4)為發(fā)現(xiàn)不同領(lǐng)域數(shù)據(jù)間的關(guān)系提供可能。由于大數(shù)據(jù)強大的數(shù)據(jù)處理能力,使得其可以發(fā)現(xiàn)不同領(lǐng)域數(shù)據(jù)間的相關(guān)性,進而揭示這些不同領(lǐng)域的數(shù)據(jù)間存在怎樣的聯(lián)系,這使得數(shù)據(jù)的價值超越了統(tǒng)計工作預(yù)先設(shè)定的目的。
因此,運用大數(shù)據(jù)開展統(tǒng)計工作是大勢所趨,是時代發(fā)展的必然選擇。
2.3 融合方法探索
大數(shù)據(jù)與抽樣數(shù)據(jù)互為補充。
一是將大數(shù)據(jù)融入抽樣調(diào)查數(shù)據(jù)搜集階段??梢岳没ヂ?lián)網(wǎng)和手機移動端、數(shù)字化的行政商業(yè)記錄等方式降低調(diào)查成本,縮短調(diào)查時間,彌補政府抽樣調(diào)查中出現(xiàn)的數(shù)據(jù)難以獲取、數(shù)據(jù)造假、抽樣總體不一致等問題。
二是將大數(shù)據(jù)融入抽樣調(diào)查數(shù)據(jù)處理階段。在大數(shù)據(jù)資源不斷生成的今天,抽樣調(diào)查可以利用大數(shù)據(jù)的資源,讓大數(shù)據(jù)幫助抽樣調(diào)查統(tǒng)計中存在的數(shù)據(jù)誤差問題,將調(diào)查數(shù)據(jù)與記錄數(shù)據(jù)相結(jié)合,對采集數(shù)據(jù)起到互相驗證的作用,從而提高數(shù)據(jù)真實性。
三是將大數(shù)據(jù)融入抽樣調(diào)查數(shù)據(jù)分析階段。新時期下,政府統(tǒng)計部門的任何統(tǒng)計調(diào)查活動,都是為反映發(fā)展規(guī)律、服務(wù)科學決策、體現(xiàn)經(jīng)濟社會發(fā)展而制定和實施的,因此,統(tǒng)計調(diào)查的落腳點在于通過對搜集上來的數(shù)據(jù)進行分析,利用統(tǒng)計分析打造經(jīng)濟運行的“千里眼”、民生發(fā)展的“晴雨表”、企業(yè)運行的“百寶箱”??梢酝ㄟ^使用大數(shù)據(jù)的分析挖掘技術(shù),將大量數(shù)據(jù)轉(zhuǎn)換為自己所需要的數(shù)據(jù)并進行儲存,進而構(gòu)建一個智能分析體系,再結(jié)合抽樣數(shù)據(jù)找到數(shù)據(jù)間的關(guān)聯(lián)性,了解存在的因果關(guān)系。
四是利用部門大數(shù)據(jù)提高抽樣調(diào)查效率。通過整合政府統(tǒng)計機構(gòu)和各政府部門資源,建立全面、系統(tǒng)的統(tǒng)計制度及部門協(xié)作機制。由于現(xiàn)在的統(tǒng)計調(diào)查趨于多元化,如果僅依靠統(tǒng)計部門,得到的數(shù)據(jù)是不全面的、低效率的。政府統(tǒng)計部門應(yīng)順應(yīng)時代發(fā)展需要,利用現(xiàn)有的技術(shù)手段和行政記錄避免許多中間環(huán)節(jié),提高調(diào)查效率,通過嘗試部門數(shù)據(jù)采集方法,搭建地方政府統(tǒng)計信息共享數(shù)據(jù)庫,保證抽樣調(diào)查數(shù)據(jù)的全面性、完整性。
3 結(jié)語
信息化的快速發(fā)展給統(tǒng)計調(diào)查工作創(chuàng)造了新形勢、新環(huán)境,我們希望用較少的時間、較少的人力、物力,提供準確的統(tǒng)計信息,達到快速獲取數(shù)據(jù)、科學分析數(shù)據(jù)的目的。本文在分析抽樣調(diào)查存在的優(yōu)點和不足,以及大數(shù)據(jù)在政府統(tǒng)計中的作用的基礎(chǔ)上,提出將大數(shù)據(jù)分析與抽樣調(diào)查分析相結(jié)合的思路,認為政府抽樣調(diào)查要適應(yīng)新環(huán)境,要將大數(shù)據(jù)應(yīng)用在抽樣調(diào)查的數(shù)據(jù)搜集、數(shù)據(jù)處理及分析等各環(huán)節(jié),完成一個調(diào)查項目不僅需要選擇合適的抽樣方案和抽樣技術(shù),還需要實時的樣本數(shù)據(jù)資料進行驗證,使調(diào)查數(shù)據(jù)與記錄數(shù)據(jù)相結(jié)合,同時發(fā)揮部門大數(shù)據(jù)的優(yōu)勢,加強政府部門間的協(xié)調(diào)合作,體現(xiàn)抽樣調(diào)查工作的科學性。
參考文獻
[1]劉建平,王克林.中美抽樣調(diào)查發(fā)展的比較與思考[J].統(tǒng)計研究,2009(9).
[2]寧鑫.大數(shù)據(jù)時代的政府應(yīng)急管理研究[J].廈門廣播電視大學學報,2017(15).
[3]金勇進,戴明峰.我國政府統(tǒng)計抽樣調(diào)查的回顧與思考[J].統(tǒng)計與咨詢,2012(4).
[4]王瑩,萬舒晨.大數(shù)據(jù)時代抽樣調(diào)查面臨的挑戰(zhàn)與機遇[J].統(tǒng)計與信息論壇,2016(6).
[5]郭新穎.大數(shù)據(jù)背景下的抽樣問題探討[D].蘭州:蘭州財經(jīng)大學,2017.
[6]杜西平,曹宗泉,等.大政府統(tǒng)計構(gòu)建中部門數(shù)據(jù)共享的實踐與研究[J].中國統(tǒng)計,2016(10).