□ 文 張芹娥 陳曙光 王鴻泉 馬 薇
在大數(shù)據(jù)時代,數(shù)據(jù)治理已逐步成為政府進行智慧決策的重要基礎,能夠幫助政府在復雜的市場活動中,快速高效地處理分析海量的數(shù)據(jù)信息,針對各種情況制定切實有效的政策?;诖?,本文以河北省工業(yè)和信息化廳統(tǒng)計監(jiān)測和信息管理平臺(以下簡稱“統(tǒng)計監(jiān)測平臺”)為探討對象,闡述數(shù)據(jù)治理運用于其中的重要意義,集中分析如何通過數(shù)據(jù)治理,提高數(shù)據(jù)質(zhì)量,并且為如何保障數(shù)據(jù)有效治理提供了一定的應對策略。
河北省工信廳統(tǒng)計監(jiān)測和信息管理平臺已經(jīng)實現(xiàn)了省、市、縣、鄉(xiāng)、企業(yè)及機構數(shù)據(jù)一體化分平臺管理,進行數(shù)據(jù)統(tǒng)一記錄、歸納和整理,實現(xiàn)了數(shù)據(jù)快速、有效、高質(zhì)量采集和匯總,解決了基層單位和企業(yè)多頭報送、負擔重的問題,為了解企業(yè)運行情況提供了有力的技術保障,進一步節(jié)約了人力和物力資源,提高了監(jiān)測管理的總體效率。
伴隨統(tǒng)計監(jiān)測平臺的廣泛運用,對其中存在潛在的數(shù)據(jù)問題,如何正確理解這些數(shù)據(jù)?如何行之有效地對匯集的數(shù)據(jù)進行“精準治理”,提高數(shù)據(jù)質(zhì)量,使數(shù)據(jù)可用、可信,提升對數(shù)據(jù)的管理和運用能力,成了日常工作中的要點、難點。
統(tǒng)計監(jiān)測平臺是建立在互聯(lián)網(wǎng)和云上的綜合監(jiān)測管理網(wǎng)絡平臺。具體來說,是以企業(yè)自行報送為基本需求的數(shù)據(jù)采集、處理、查詢、匯總的平臺軟件。通過互聯(lián)網(wǎng)信息采集和處理,實現(xiàn)報表的定義、發(fā)布、填報、審核、匯總和查詢等管理的一體化業(yè)務處理,通過控制系統(tǒng)功能權限,實現(xiàn)不同級別用戶的報表需求和數(shù)據(jù)管理。該系統(tǒng)將信息采集、處理、分析和內(nèi)容整合等多種先進科學技術用于統(tǒng)計監(jiān)測工作,為全面掌握企業(yè)發(fā)展情況、及時反映企業(yè)運行動態(tài)、科學研判發(fā)展趨勢和領導決策提供數(shù)據(jù)支撐;為加快企業(yè)轉(zhuǎn)型升級、破解社會經(jīng)濟發(fā)展難題提供科學依據(jù);為全省政府主管部門的工作提供全面數(shù)據(jù)和信息支撐,從而提高工作效率,不斷提升服務經(jīng)濟發(fā)展的水平和能力。
在當下數(shù)據(jù)已成為政務部門、企事業(yè)單位的寶貴資產(chǎn),隨著互聯(lián)網(wǎng)技術的迅猛發(fā)展,數(shù)據(jù)的采集、傳輸、分析、展示等問題越來越重要,在企業(yè)和政府日常生產(chǎn)和工作過程中,會產(chǎn)生海量的數(shù)據(jù),但這些數(shù)據(jù)往往沒有統(tǒng)一的記錄、歸納和整理,或者錄入了系統(tǒng)卻分散在不同部門而未持續(xù)歸集,無法為后期的數(shù)據(jù)應用和分析挖掘提供服務。
為能處理復雜的報表格式及采集流程,滿足當代社會數(shù)據(jù)來源多樣化的特點,支持多種報送方式,統(tǒng)計監(jiān)測平臺主要解決以下問題:
■ 數(shù)據(jù)來源的形式不統(tǒng)一,支撐人工填報、文件導入等多種數(shù)據(jù)采集方式,支持C/S、B/S多種應用架構體系;
■ 對數(shù)據(jù)時效性高,管理人員應能快速編輯報表、發(fā)布報表、快速回收數(shù)據(jù);
■ 對數(shù)據(jù)的質(zhì)量要求較高,應提供強大的運算和審核引擎、二次審批、數(shù)據(jù)鎖定等多種質(zhì)量控制措施;
■ 對工作的效率要求較高,應能由系統(tǒng)自動完成大部分審核、匯總、退回、導入、催報、導出等數(shù)據(jù)管理工作;
■ 業(yè)務的需求變化較快,采集的指標口徑、流程應能隨著業(yè)務需求變化快速適應和調(diào)整,并能自動完成系統(tǒng)和數(shù)據(jù)的動態(tài)升級;
■ 對數(shù)據(jù)的安全性要求高,能夠嚴格控制數(shù)據(jù)的訪問權限。
統(tǒng)計監(jiān)測平臺采用報表來歸納、整理和統(tǒng)計數(shù)據(jù)信息,它將面向技術的數(shù)據(jù)庫表以業(yè)務的形式呈現(xiàn)給用戶,并通過業(yè)務的方式進行數(shù)據(jù)查看、操作和管理。
2016年4月19日,習近平總書記在網(wǎng)絡安全和信息化工作座談會上進一步指出:“信息是國家治理的重要依據(jù),要發(fā)揮其在這個進程中的重要作用”;要“統(tǒng)籌發(fā)展電子政務,構建一體化在線服務平臺,分級分類推進新型智慧城市建設,打通信息壁壘,構建全國信息資源共享體系,更好利用信息化手段感知社會態(tài)勢、暢通溝通渠道、輔助科學決策”。在大數(shù)據(jù)時代,數(shù)據(jù)正在呈指數(shù)級增長,世界上的許多國家都把大數(shù)據(jù)上升到國家戰(zhàn)略的高度,實施國家大數(shù)據(jù)戰(zhàn)略,為政府治理的變革和創(chuàng)新開拓新局面。以“精準”為口號的數(shù)據(jù)治理為提升各政務部門的公共服務、市場監(jiān)管、宏觀調(diào)控、科學決策、資源配置等提供了契機。在這種現(xiàn)實的需求下,探尋統(tǒng)計監(jiān)測平臺數(shù)據(jù)治理具有十分重要的意義。
信息匯集是省工信廳重要的基礎性工作。面向重點聯(lián)系企業(yè)開展企業(yè)主要經(jīng)濟指標月度調(diào)查、年度調(diào)查、企業(yè)經(jīng)濟效益指標完成情況、企業(yè)產(chǎn)銷存情況、企業(yè)出口情況的調(diào)查等,對掌握企業(yè)生產(chǎn)、節(jié)能、節(jié)水、環(huán)保、裝備水平、研發(fā)水平等與企業(yè)生產(chǎn)經(jīng)營、轉(zhuǎn)型升級發(fā)展密切相關的指標,了解這些情況對掌握企業(yè)發(fā)展情況具有重要意義。但有許多因素會導致這些數(shù)據(jù)出現(xiàn)“真實性”問題,比如臟數(shù)據(jù)、錯誤數(shù)據(jù)、異常值數(shù)據(jù)、重復數(shù)據(jù),數(shù)據(jù)精度不夠、數(shù)據(jù)前后邏輯不對、數(shù)據(jù)標準沒有統(tǒng)一,編碼不統(tǒng)一、缺少相關規(guī)范、對數(shù)據(jù)理解的不充分等等。這導致我們對數(shù)據(jù)進行匯總分析和數(shù)據(jù)挖掘時,分析的結(jié)果有很大的偏差,為決策者帶來了負面影響。
IBM對于數(shù)據(jù)治理的定義是:“數(shù)據(jù)治理是一種質(zhì)量控制規(guī)程,用于在管理、使用、改進和保護組織信息的過程中添加新的嚴謹性和紀律性?!薄?/p>
數(shù)據(jù)治理的目標總體來說就是提高數(shù)據(jù)質(zhì)量、在降低風險的同時實現(xiàn)數(shù)據(jù)資產(chǎn)價值的最大化。由此,數(shù)據(jù)治理從本質(zhì)上看就是對一個機構(政府部門或企業(yè))的數(shù)據(jù)從收集融合到分析管理和利用進行評估、指導和監(jiān)督(EDM)的過程,通過提供不斷創(chuàng)新的數(shù)據(jù)服務為企業(yè)創(chuàng)造價值。
數(shù)據(jù)治理的處理對象是海量的分布在各個系統(tǒng)中的數(shù)據(jù),這些不同系統(tǒng)的數(shù)據(jù)往往存在一定的差異:數(shù)據(jù)代碼標準不一樣、數(shù)據(jù)格式不一樣、數(shù)據(jù)標識不一樣,甚至可能存在錯誤的數(shù)據(jù)。這就需要建立一套標準化的體系,對這些存在差異的數(shù)據(jù)統(tǒng)一標準,符合行業(yè)的規(guī)范,使得在同樣的指標下進行分析,保證數(shù)據(jù)分析結(jié)果的可靠性。
統(tǒng)計監(jiān)測平臺以建立數(shù)據(jù)標準規(guī)范為基礎,運用數(shù)據(jù)處理、數(shù)據(jù)清洗、數(shù)據(jù)分析、數(shù)據(jù)可視化等技術建立數(shù)據(jù)綜合治理體系,從前期數(shù)據(jù)調(diào)研規(guī)劃、到中期建立數(shù)據(jù)標準、后期持續(xù)數(shù)據(jù)質(zhì)量改進管理等工作,來逐步提高數(shù)據(jù)的真實性、完整性、規(guī)范性、一致性、邏輯性,來降低數(shù)據(jù)管理成本,減少因數(shù)據(jù)不可用導致的分析挖掘的偏差和損失,實現(xiàn)數(shù)據(jù)的“精準治理”,為深度挖掘數(shù)據(jù)的價值奠定堅實的基礎。
首先針對統(tǒng)計平臺各業(yè)務系統(tǒng)的數(shù)據(jù)資源進行調(diào)研,了解數(shù)據(jù)情況,梳理數(shù)據(jù)調(diào)研報告。隨后根據(jù)數(shù)據(jù)調(diào)研情況,從數(shù)據(jù)標準規(guī)劃、元數(shù)據(jù)管理和數(shù)據(jù)質(zhì)量管理等方面著手逐步開展數(shù)據(jù)治理工作。
數(shù)據(jù)標準規(guī)劃工作主要包括:標準設計定義、標準設計發(fā)布、標準查詢等。
元數(shù)據(jù)規(guī)劃工作主要包括:元數(shù)據(jù)定義、元數(shù)據(jù)采集和查詢、來源和影響分析等。
數(shù)據(jù)質(zhì)量規(guī)劃工作主要包括:質(zhì)量檢查規(guī)則定義、質(zhì)量檢查方案定義、質(zhì)量檢查評估、質(zhì)量問題分析及報告等。
通過上述工作,可以從整體上對平臺中的數(shù)據(jù)概念、標準和質(zhì)量進行全面梳理規(guī)劃,并能夠確保后續(xù)的數(shù)據(jù)治理清晰、有序。
統(tǒng)計監(jiān)測平臺涉及的業(yè)務面眾多,比如電子信息、中小企業(yè)、民營經(jīng)濟、融資擔保等企業(yè)運行數(shù)據(jù),如果缺少統(tǒng)一的標準進行約束,容易導致在數(shù)據(jù)計算、處理和整合的差異,從而導致不可信數(shù)據(jù)的產(chǎn)生。
數(shù)據(jù)標準工作就是對資源信息進行定義、評估、分析,實現(xiàn)信息的描述和格式化,達到對數(shù)據(jù)標準管理工作,為元數(shù)據(jù)管理提供相應的業(yè)務元數(shù)據(jù)信息,為數(shù)據(jù)治理提供相應的治理標準,大大降低數(shù)據(jù)治理人工成本。
先以元數(shù)據(jù)為基礎,構建數(shù)據(jù)資源管理體系。從數(shù)據(jù)應用的角度說清楚統(tǒng)計監(jiān)測平臺數(shù)據(jù)有哪些,哪些數(shù)據(jù)能夠使用?;诘谝徊叫纬傻臄?shù)據(jù)資源管理體系,梳理、整合各業(yè)務系統(tǒng)的數(shù)據(jù)資源,建立了數(shù)據(jù)資產(chǎn)目錄樹,對不同數(shù)據(jù)類型制定相應的規(guī)范約束,對相應的數(shù)據(jù)指標項行梳理和制定規(guī)范要求。
在數(shù)據(jù)治理過程中,最重要的是要建立數(shù)據(jù)質(zhì)量管理體系,來有效識別統(tǒng)計監(jiān)測平臺的各類數(shù)據(jù)質(zhì)量問題、找出數(shù)據(jù)質(zhì)量原因、監(jiān)控問題發(fā)展趨勢,并提供問題明細查詢和質(zhì)量改進建議,全面提升數(shù)據(jù)完整性、準確性、及時性,一致性以及合法性等方面的問題。
首先我們基于數(shù)據(jù)資產(chǎn)目錄建立數(shù)據(jù)質(zhì)量規(guī)則,定義關鍵數(shù)據(jù)項的質(zhì)量檢測規(guī)則,依據(jù)對業(yè)務的理解對不同數(shù)據(jù)項建立完整性評價、規(guī)范性評價、邏輯性評價、及時性評價、重復性評價、外建關聯(lián)性、波動分析、平衡分析等不同的質(zhì)量檢查規(guī)則。
然后依據(jù)質(zhì)量規(guī)則制定數(shù)據(jù)質(zhì)量檢查方案,包括檢查的范圍、檢查的時間、檢查的規(guī)則、評分的規(guī)則、檢查的責任人等,對統(tǒng)計監(jiān)測平臺匯集的數(shù)據(jù)按照制定的方案進行檢查。
最后根據(jù)檢查結(jié)果、數(shù)據(jù)質(zhì)量管理和監(jiān)控要求,對問題數(shù)據(jù)進行統(tǒng)計分析,并對檢查產(chǎn)生的結(jié)果通過界面、郵件、短信等方式告警,找出問題數(shù)據(jù)出現(xiàn)的原因,采取手段持續(xù)改進,避免問題重復出現(xiàn),周而復始,逐步提高數(shù)據(jù)質(zhì)量。
想要開展數(shù)據(jù)治理工作,就必須先建立相應的組織機構,開展統(tǒng)一的治理工作,組建治理委員會,制定監(jiān)管政策,明確如果數(shù)據(jù)出了問題是誰負責,在各部門、各應用系統(tǒng)中落實責任,保障組織間高效的溝通。
制定數(shù)據(jù)管理的辦法、管理的流程、治理的規(guī)則、治理的要求、崗位要求、角色人員、獎懲措施、保密措施等,保證支撐治理工作正常、有序、有效、及時的開展。
加強數(shù)據(jù)的規(guī)范約束,能有效提高采集數(shù)據(jù)的質(zhì)量,對核心業(yè)務數(shù)據(jù)項定義完整性、規(guī)范性、可度量等標準規(guī)范約束規(guī)則,主要針對元數(shù)據(jù)、主數(shù)據(jù)等制定相應的數(shù)據(jù)規(guī)范。
采購和開發(fā)相應的數(shù)據(jù)管理軟件系統(tǒng),解決數(shù)據(jù)治理過程中遇到的問題,通過系統(tǒng),提高元數(shù)據(jù)管理、數(shù)據(jù)資產(chǎn)管理、數(shù)據(jù)標準管理、數(shù)據(jù)質(zhì)量管理、數(shù)據(jù)問題分析等能力,來保障數(shù)據(jù)治理工作的順利開展。
總之,在各類政府服務數(shù)字化轉(zhuǎn)型過程中,越來越多的數(shù)據(jù)被匯集整合,統(tǒng)計監(jiān)測平臺有效的保障了各類數(shù)據(jù)信息匯集和處理,符合管理的實際需要,應長期推廣。
數(shù)據(jù)治理的核心目標就是在降低風險的同時增加價值,合理的數(shù)據(jù)治理能夠建立規(guī)范的數(shù)據(jù)應用標準,消除數(shù)據(jù)的不一致性,提高數(shù)據(jù)質(zhì)量,推動數(shù)據(jù)廣泛共享,充分發(fā)揮數(shù)據(jù)對政府及企業(yè)的業(yè)務、管理、以及戰(zhàn)略決策的重要作用。
未來數(shù)據(jù)的“精準治理”將為各政務部門提供更及時更準確更全面的數(shù)據(jù),在及時了解情況、惠企服務、科學研判等方面提供的數(shù)據(jù)支撐,更好支撐政務工作的開展?!?/p>