□ 彭小玲
近年來,統(tǒng)計信息化建設(shè)的發(fā)展為統(tǒng)計進步及地方政府輔助決策提供了強有力的技術(shù)保障,但隨著大數(shù)據(jù)、云計算、移動互聯(lián)網(wǎng)的發(fā)展,一個以海量信息和數(shù)據(jù)挖掘為特征的大數(shù)據(jù)時代正在到來。在政府大力倡導(dǎo)服務(wù)型、智慧型統(tǒng)計的背景下,加快建立現(xiàn)代統(tǒng)計體系,構(gòu)建一個涵蓋全面、調(diào)查精準(zhǔn)、核算科學(xué)、運轉(zhuǎn)高效的服務(wù)型統(tǒng)計勢在必行。如何充分發(fā)揮統(tǒng)計職能更好地為政府決策提供參考,更好地對微觀經(jīng)濟運行進行監(jiān)測,是統(tǒng)計現(xiàn)代化改革的重要課題。作為統(tǒng)計業(yè)務(wù)的基礎(chǔ)支撐,現(xiàn)在統(tǒng)計信息化面臨的問題繁多,如對統(tǒng)計微觀數(shù)據(jù)的收集、處理、存檔方式陳舊,數(shù)據(jù)開發(fā)、挖掘程度落后,利用大數(shù)據(jù)技術(shù)不強,系統(tǒng)平臺還未脫離傳統(tǒng)關(guān)系型數(shù)據(jù)庫等,以及對于現(xiàn)代海量數(shù)據(jù)處理跟不上發(fā)展步伐,統(tǒng)計時效性差,歸檔數(shù)據(jù)格式標(biāo)準(zhǔn)不統(tǒng)一,入庫難、分析不夠深入、監(jiān)測及時性不足等問題比較突出。統(tǒng)計微觀經(jīng)濟運行監(jiān)測平臺開辟統(tǒng)計工作集約化、高效化、現(xiàn)代化之路,是推進統(tǒng)計現(xiàn)代化改革的強大動力。面對新形勢、新任務(wù),打造“智慧統(tǒng)計”“高效統(tǒng)計”“開放統(tǒng)計”,是實現(xiàn)統(tǒng)計現(xiàn)代化的重要手段。把統(tǒng)計微觀經(jīng)濟運行監(jiān)測平臺打造成縱向覆蓋統(tǒng)計系統(tǒng),橫向涵蓋政府部門的信息共享平臺,具有十分重要的意義。
長期以來,統(tǒng)計系統(tǒng)很多從部門獲取的微觀數(shù)據(jù)仍以Excel 等電子表格的形式保存于各個專業(yè)人員的電腦中,對新技術(shù)的應(yīng)用仍不充分。大數(shù)據(jù)時代發(fā)展,要求政府部門數(shù)據(jù)交換和共享,特別是統(tǒng)計部門需要更廣泛的部門明細(xì)數(shù)據(jù),以便支撐統(tǒng)計分析和經(jīng)濟運行監(jiān)測。
目前統(tǒng)計調(diào)查數(shù)據(jù)采集基本實現(xiàn)聯(lián)網(wǎng)直報,解決了數(shù)據(jù)采集的低效率問題,但統(tǒng)計微觀數(shù)據(jù)的分析、比對手段仍較為落后,成為制約充分發(fā)揮統(tǒng)計信息資源價值的瓶頸,不利于數(shù)據(jù)資源分析功能的發(fā)揮,需建立和完善微觀大數(shù)據(jù)的現(xiàn)代分析手段,為發(fā)揮統(tǒng)計數(shù)據(jù)價值提供技術(shù)支撐。
目前統(tǒng)計報表業(yè)務(wù)愈加豐富,微觀數(shù)據(jù)也越來越多,而微觀數(shù)據(jù)對于地方政府行使公共管理職能和制定發(fā)展規(guī)劃的重要性不言而喻,在進行數(shù)據(jù)處理時對信息系統(tǒng)功能的全面性要求也越來越高。為了順應(yīng)統(tǒng)計微觀數(shù)據(jù)業(yè)務(wù)處理發(fā)展的特點,迫切需要建立統(tǒng)計微觀經(jīng)濟運行監(jiān)測平臺。
在加強統(tǒng)計數(shù)據(jù)標(biāo)準(zhǔn)化的大環(huán)境下,需要通過對跨歷史時期和跨部門數(shù)據(jù)進行規(guī)范化的匯聚、整合、清洗,創(chuàng)建完整、有效的管理資源方法和手段,加強對微觀經(jīng)濟運行數(shù)據(jù)的監(jiān)督和應(yīng)用。
隨著經(jīng)濟社會的發(fā)展,新理念、新事物、新業(yè)態(tài)的不斷涌現(xiàn),對政府統(tǒng)計工作也提出了新要求,需要各部門加強信息共享與業(yè)務(wù)協(xié)同,提升黨委、政府把握經(jīng)濟發(fā)展動態(tài)、服務(wù)企業(yè)的能力和質(zhì)量。
無論從時代發(fā)展趨勢、智慧城市發(fā)展戰(zhàn)略,還是從統(tǒng)計工作業(yè)務(wù)本身的基礎(chǔ)性需要,以及提高政府微觀數(shù)據(jù)共享和管理的需要來看,城市發(fā)展、社會管理和服務(wù)經(jīng)濟社會運行監(jiān)測都對建立統(tǒng)計微觀經(jīng)濟運行監(jiān)測平臺的必要性和緊迫性提出了現(xiàn)實要求。
數(shù)據(jù)倉庫是決策支持系統(tǒng)(DSS)和聯(lián)機分析應(yīng)用數(shù)據(jù)源的結(jié)構(gòu)化數(shù)據(jù)環(huán)境,研究和解決從數(shù)據(jù)庫中獲取信息的問題。
數(shù)據(jù)倉庫,由數(shù)據(jù)倉庫之父比爾·恩門(Bill Inmon)于1990 年提出,主要功能是組織處理資訊系統(tǒng)的聯(lián)機事務(wù)處理(OLTP)經(jīng)年累月所累積的大量資料,透過數(shù)據(jù)倉庫理論所特有的資料儲存架構(gòu),做系統(tǒng)分析整理,利用如聯(lián)機分析處理(OLAP)、數(shù)據(jù)挖掘(Data Mining)等各種分析方法,對數(shù)據(jù)做系統(tǒng)的分析整理,并進一步支持如決策支持系統(tǒng)(DSS)、主管資訊系統(tǒng)(EIS)的創(chuàng)建,幫助決策者能快速有效地從大量資料中分析出有價值的資訊,以有利于決策擬定及快速回應(yīng)外在環(huán)境變動,幫助建構(gòu)商業(yè)智能(BI)[1]。
數(shù)據(jù)挖掘(Data Mining),又譯為資料探勘、數(shù)據(jù)采礦。它是數(shù)據(jù)庫知識發(fā)現(xiàn)中的一個步驟。數(shù)據(jù)挖掘一般是指從大量的數(shù)據(jù)中通過算法搜索隱藏于其中信息的過程,通常與計算機科學(xué)有關(guān),并通過統(tǒng)計、在線分析處理、情報檢索、機器學(xué)習(xí)、專家系統(tǒng)和模式識別等諸多方法來實現(xiàn)上述目標(biāo)[2]。
若將數(shù)據(jù)倉庫比喻作礦坑,數(shù)據(jù)挖掘就是深入礦坑采礦的工作。畢竟數(shù)據(jù)挖掘不是一種無中生有的魔術(shù),若沒有足夠豐富完整的數(shù)據(jù),很難期待數(shù)據(jù)挖掘能挖掘出有意義的信息。將數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術(shù)結(jié)合,能保證收集的數(shù)據(jù)得到最大程度的價值挖掘,從而擴展更多的分析、應(yīng)用與服務(wù)。
ETL 即數(shù)據(jù)抽取、轉(zhuǎn)換和加載,是數(shù)據(jù)倉庫實現(xiàn)過程中,將數(shù)據(jù)由業(yè)務(wù)系統(tǒng)向數(shù)據(jù)倉庫加載的主要過程。業(yè)務(wù)系統(tǒng)數(shù)據(jù)源中的實體與數(shù)據(jù)倉庫主題域中的實體并不是簡單的一對一映射關(guān)系,而是比較復(fù)雜的多對多關(guān)系,這種映射關(guān)系構(gòu)成了數(shù)據(jù)倉庫系統(tǒng)ETL 過程的主要內(nèi)容。
從功能上看,整個ETL 包括三個部分:數(shù)據(jù)抽取、數(shù)據(jù)轉(zhuǎn)換和數(shù)據(jù)加載。
ETL 實現(xiàn)過程的流程圖如圖1所示。
圖1 ETL實現(xiàn)過程的流程圖
指標(biāo)數(shù)據(jù)以何種方式存儲,直接關(guān)系到系統(tǒng)對指標(biāo)數(shù)據(jù)的應(yīng)用程度。考慮到統(tǒng)計制度和統(tǒng)計方法的不斷改進,指標(biāo)的定義和統(tǒng)計口徑也需要不斷適應(yīng)業(yè)務(wù)的變化。因此采用多維的方式來存儲指標(biāo)數(shù)據(jù),利用多維模型的靈活性和可自定義性,以實現(xiàn)和統(tǒng)計業(yè)務(wù)的完美結(jié)合。用維度來描述計量單位、統(tǒng)計分組、統(tǒng)計范圍、頻度、發(fā)布范圍及時間、來源部門等;度量是具體考察的數(shù)量值,可以用度量來描述各個統(tǒng)計指標(biāo),包括經(jīng)濟社會發(fā)展、資源環(huán)境、生活就業(yè)、城市建設(shè)等各大類的指標(biāo)信息。通過維度和度量的結(jié)合,形成多維分析模型,來靈活構(gòu)建統(tǒng)計指標(biāo)體系。
以上工具和技術(shù)近年來在業(yè)界都有廣泛的應(yīng)用,且已產(chǎn)生明顯效益,所以建設(shè)統(tǒng)計微觀經(jīng)濟運行監(jiān)測平臺在技術(shù)上是完全可行的。
統(tǒng)計微觀指標(biāo)體系建設(shè)是整個平臺建設(shè)的基礎(chǔ),也是最重要的組成部分。根據(jù)平臺建設(shè)要求,制定各部門的微觀數(shù)據(jù)采集標(biāo)準(zhǔn),理清數(shù)據(jù)來源、原有標(biāo)準(zhǔn)、指標(biāo)含義和口徑等,制定數(shù)據(jù)整合規(guī)范和標(biāo)準(zhǔn)。對采集的指標(biāo)數(shù)據(jù)進行建模計算,以及經(jīng)濟運行監(jiān)測與分析,從而進行科學(xué)測評,為政府決策提供經(jīng)濟運行狀況的數(shù)據(jù)支撐。
當(dāng)前,政府各部門微觀數(shù)據(jù)不集中、數(shù)據(jù)獲取方式不夠規(guī)范,在數(shù)據(jù)采集、存儲、應(yīng)用等各個流程上都缺乏系統(tǒng)的基礎(chǔ)性信息化支撐,存在數(shù)據(jù)處理流程不夠完善,數(shù)據(jù)格式不相統(tǒng)一,數(shù)據(jù)存儲轉(zhuǎn)為分散化,數(shù)據(jù)綜合開發(fā)利用效率不夠高等問題。建立以統(tǒng)計報表為中心的微觀統(tǒng)計制度,規(guī)范統(tǒng)計口徑和范圍,確認(rèn)指標(biāo)來源及相關(guān)屬性,實現(xiàn)微觀數(shù)據(jù)統(tǒng)計制度的在線設(shè)計、修訂、發(fā)布和查詢,使得統(tǒng)計數(shù)據(jù)和統(tǒng)計信息具有內(nèi)在一致性,為微觀數(shù)據(jù)共享和流轉(zhuǎn)、交換、處理、應(yīng)用奠定基礎(chǔ)。
微觀經(jīng)濟數(shù)據(jù)庫作為平臺將來微觀數(shù)據(jù)產(chǎn)生、存放,以及業(yè)務(wù)數(shù)據(jù)歸集的核心數(shù)據(jù)庫,需要按照元數(shù)據(jù)的方式對原始數(shù)據(jù)、指標(biāo)數(shù)據(jù)及其他數(shù)據(jù)進行標(biāo)準(zhǔn)化存儲,并最終形成一個統(tǒng)一的、標(biāo)準(zhǔn)規(guī)范的微觀經(jīng)濟數(shù)據(jù)庫,實現(xiàn)業(yè)務(wù)數(shù)據(jù)、元數(shù)據(jù)和管理數(shù)據(jù)的統(tǒng)一管理、采集和存儲。
指標(biāo)體系建立完成后,通過建設(shè)數(shù)據(jù)采集平臺,實現(xiàn)微觀數(shù)據(jù)多種采集方式的指標(biāo)數(shù)據(jù)、報表數(shù)據(jù)的入庫,利用完善的數(shù)據(jù)管理功能,保障數(shù)據(jù)的一致性和完整性,并通過數(shù)據(jù)建模,實現(xiàn)主題分析、效益評價、預(yù)警分析、綜合監(jiān)測等多種分析服務(wù)方式和可視化分析手段,為各級政府部門提供數(shù)據(jù)運行分析平臺,對經(jīng)濟運行進行監(jiān)測和綜合分析,以標(biāo)準(zhǔn)文本、圖像等形式反映分析結(jié)果,用于了解、掌握經(jīng)濟社會發(fā)展情況。
為了確保不同部門和不同采集方式的數(shù)據(jù),都能夠協(xié)調(diào)成一個整體,為經(jīng)濟運行監(jiān)測服務(wù),規(guī)劃業(yè)務(wù)流程如圖2 所示。
圖2 數(shù)據(jù)采集業(yè)務(wù)流程圖
因此,為了充分發(fā)揮數(shù)據(jù)集中效率,打破部門“信息孤島”,可以將統(tǒng)計微觀經(jīng)濟運行監(jiān)測平臺建成微觀經(jīng)濟社會發(fā)展運行的監(jiān)測與評價中心,以促進經(jīng)濟社會健康發(fā)展,有效輔助政府決策。
統(tǒng)計微觀經(jīng)濟運行監(jiān)測平臺以建立微觀經(jīng)濟社會發(fā)展相關(guān)指標(biāo)體系為核心,支持從規(guī)劃設(shè)計、數(shù)據(jù)采集、數(shù)據(jù)整合加工、分析應(yīng)用、發(fā)布與共享到信息服務(wù)與推送的全流程的正常運轉(zhuǎn)和平滑可擴展,并通過數(shù)據(jù)分析服務(wù)體系持續(xù)地、高質(zhì)量地體現(xiàn)微觀經(jīng)濟數(shù)據(jù)庫的基礎(chǔ)性信息資源的戰(zhàn)略意義。
為了支持平臺在功能和性能上的動態(tài)可擴展,持續(xù)滿足用戶不斷變化和擴展的信息服務(wù)需求,統(tǒng)計微觀經(jīng)濟運行監(jiān)測平臺建設(shè)采用多層架構(gòu),將系統(tǒng)邏輯上劃分為數(shù)據(jù)資源層、業(yè)務(wù)支撐層、業(yè)務(wù)應(yīng)用層、數(shù)據(jù)服務(wù)層等四個層次以及標(biāo)準(zhǔn)規(guī)范管理和系統(tǒng)運維管理兩大支撐保障體系??傮w體系架構(gòu)如圖3 所示。
圖3 統(tǒng)計微觀經(jīng)濟運行監(jiān)測平臺總體體系架構(gòu)圖
本系統(tǒng)的數(shù)據(jù)來源包括政府各部門數(shù)據(jù)、企業(yè)數(shù)據(jù);數(shù)據(jù)資源層主要存儲通過數(shù)據(jù)采集和交換平臺獲取的相關(guān)源數(shù)據(jù),從而完成政府各部門、各企事業(yè)單位各類信息的采集。通過存儲按照業(yè)務(wù)管理、決策支持和數(shù)據(jù)服務(wù)等需要,構(gòu)建指標(biāo)體系及處理和加工后的微觀數(shù)據(jù),實現(xiàn)對各類數(shù)據(jù)資源的統(tǒng)一存儲和管理。主要包括元數(shù)據(jù)庫、中心數(shù)據(jù)庫及備份數(shù)據(jù)庫。
業(yè)務(wù)支撐層為上層的業(yè)務(wù)應(yīng)用平臺提供了應(yīng)用支撐、應(yīng)用整合、集成展現(xiàn)和應(yīng)用擴展等功能,同時屏蔽了復(fù)雜的底層技術(shù),為各類數(shù)據(jù)的采集和整合提供了方便。主要包括報表定制工具、搜索引擎、數(shù)據(jù)建模以及數(shù)據(jù)可視化等。
業(yè)務(wù)支撐層提供了可以縱向貫通各類不同層級的信息資源與上層應(yīng)用之間的垂直通道,構(gòu)建高效、實時、共享、準(zhǔn)確的信息流;橫向通過各類業(yè)務(wù)組件組裝,滿足跨部門、跨領(lǐng)域的信息共享和協(xié)同應(yīng)用,最終達成資源共享、協(xié)同管理、多元服務(wù)的總體目標(biāo)。
業(yè)務(wù)應(yīng)用層從滿足多樣化的應(yīng)用需求出發(fā),以科學(xué)、規(guī)范、高質(zhì)量的各類微觀經(jīng)濟社會數(shù)據(jù)資源為基礎(chǔ),開發(fā)實現(xiàn)的各類應(yīng)用服務(wù)。主要包括由指標(biāo)體系管理、報表制度管理、行為日志收集等組成的業(yè)務(wù)管理中心,以及由指標(biāo)查詢匯總、指標(biāo)統(tǒng)計分析、整表查詢等組成的應(yīng)用中心。
業(yè)務(wù)應(yīng)用層基于強大完整的數(shù)據(jù)資源層,構(gòu)建多層次、多形式的數(shù)據(jù)應(yīng)用,并通過數(shù)據(jù)服務(wù)層的平臺面向各類用戶提供信息服務(wù)。
數(shù)據(jù)服務(wù)層為整個系統(tǒng)所建立的頂層綜合平臺,以創(chuàng)新應(yīng)用模式為重點,以各類業(yè)務(wù)角色的用戶為中心,匯聚信息與服務(wù),通過不同的方式呈現(xiàn)給用戶,從而提高信息與服務(wù)的有效性和信息增值。
數(shù)據(jù)服務(wù)層面向黨政領(lǐng)導(dǎo)、政府各部門等不同用戶群體,為他們提供內(nèi)容豐富、形式多樣、有針對性、可個性化的信息服務(wù)。
認(rèn)真執(zhí)行國家、省級政府電子政務(wù)標(biāo)準(zhǔn)體系,按照信息化的實際情況實施全方位標(biāo)準(zhǔn)化建設(shè),以實戰(zhàn)實效為主導(dǎo),管理與技術(shù)并重,針對系統(tǒng)運行環(huán)境、數(shù)據(jù)和安全管理等方面可能受到的安全威脅,制定相應(yīng)的安全策略和安全措施。
統(tǒng)計微觀經(jīng)濟運行監(jiān)測平臺建成后,將充分發(fā)揮數(shù)據(jù)集中效率,打破部門“信息孤島”,成為黨委、政府微觀經(jīng)濟社會發(fā)展運行的監(jiān)測與評價中心、行業(yè)管理與服務(wù)中心,促進經(jīng)濟社會健康發(fā)展、有效輔助政府決策,為監(jiān)測經(jīng)濟運行、加強行業(yè)管理、制定行業(yè)發(fā)展規(guī)劃以及培育經(jīng)濟增長點,為政府部門、企事業(yè)單位、社會公眾提供更加全面、準(zhǔn)確、高效的統(tǒng)計信息咨詢服務(wù)。