鄧小燕
摘 要:本文對(duì)高校數(shù)據(jù)治理現(xiàn)狀進(jìn)行分析的基礎(chǔ)上提出了高校數(shù)據(jù)治理的主要內(nèi)容。并通過構(gòu)建數(shù)據(jù)共享平臺(tái)的方式將主數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)和分析數(shù)據(jù)三類數(shù)據(jù)進(jìn)行匯集、開發(fā)形成數(shù)據(jù)資產(chǎn),從而為高校的領(lǐng)導(dǎo)決策、行政管理和信息系統(tǒng)提供快捷的數(shù)據(jù)服務(wù)。
關(guān)鍵詞:高校;數(shù)據(jù)治理;數(shù)據(jù)共享
中圖分類號(hào):TP311.13 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2095-9052(2020)03-0186-02
隨著互聯(lián)網(wǎng)和信息技術(shù)的高速發(fā)展,全球數(shù)據(jù)出現(xiàn)了爆發(fā)式增長。截至2016年全球的數(shù)據(jù)體量為16.1ZB,根據(jù)國際數(shù)據(jù)公司(IDC)發(fā)布的數(shù)據(jù)發(fā)展白皮書《數(shù)據(jù)時(shí)代2015》中預(yù)測(cè),2025年全球的數(shù)據(jù)量將達(dá)到163ZB,將是2016年的10倍[1]。在數(shù)據(jù)體量高速增長的背景下,云計(jì)算、大數(shù)據(jù)、人工智能等新技術(shù)也推動(dòng)了數(shù)據(jù)分析、數(shù)據(jù)融合、數(shù)據(jù)開放等方面的持續(xù)升級(jí),各行各業(yè)均增強(qiáng)了對(duì)數(shù)據(jù)管理和數(shù)據(jù)利用的研究。在如此迅猛的大數(shù)據(jù)發(fā)展背景下,高校作為信息技術(shù)發(fā)展的前沿陣地,既是大數(shù)據(jù)技術(shù)的利用者,也推動(dòng)著大數(shù)據(jù)技術(shù)的發(fā)展。高校普遍擁有多個(gè)信息系統(tǒng)、APP、輕應(yīng)用等,形成了一個(gè)又一個(gè)的業(yè)務(wù)豎井,這些系統(tǒng)擁有大量數(shù)據(jù)與資源。高校如何利用好校內(nèi)已有信息系統(tǒng)內(nèi)的數(shù)據(jù)資源,為高校的教學(xué)、管理提供決策支撐,是順應(yīng)信息化發(fā)展浪潮,推動(dòng)高校信息化、智能化發(fā)展的良好時(shí)機(jī)。
1 數(shù)據(jù)治理的高校數(shù)據(jù)共享模式構(gòu)架
目前,國內(nèi)各高校或多或少都進(jìn)行著大數(shù)據(jù)的研究和應(yīng)用,通過數(shù)據(jù)共享、數(shù)據(jù)分析、數(shù)據(jù)挖掘等技術(shù),獲取數(shù)據(jù)深層次的價(jià)值。然而縱觀高校教育信息化的發(fā)展現(xiàn)狀,各業(yè)務(wù)部門在開發(fā)或選用各種應(yīng)用系統(tǒng)時(shí)都是單一的追求各自業(yè)務(wù)的實(shí)現(xiàn),沒有從全局視角進(jìn)行業(yè)務(wù)數(shù)據(jù)流分析,缺乏統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn)和規(guī)范,各部門都按照“自產(chǎn)自用”的模式管理自有數(shù)據(jù),導(dǎo)致數(shù)據(jù)全生命周期管理不完整,同一數(shù)據(jù)多系統(tǒng)管理,數(shù)據(jù)不一致,數(shù)據(jù)冗余等問題日益凸顯。因此,對(duì)數(shù)據(jù)進(jìn)行治理是提升高校數(shù)據(jù)管理與服務(wù)水平的關(guān)鍵舉措。高校應(yīng)建立長期有效的數(shù)據(jù)治理體系,挖掘數(shù)據(jù)價(jià)值,提升精細(xì)化管理水平,增強(qiáng)教學(xué)、管理的決策能力。
高校的數(shù)據(jù)資產(chǎn)可分為主數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)和分析數(shù)據(jù)三類[2]。主數(shù)據(jù)是學(xué)校各個(gè)信息系統(tǒng)中最核心,被多個(gè)系統(tǒng)需要的數(shù)據(jù),如教職工基本信息、學(xué)生基本信息、組織架構(gòu)信息等。業(yè)務(wù)數(shù)據(jù)描述的是各個(gè)業(yè)務(wù)系統(tǒng)運(yùn)行中所產(chǎn)生的業(yè)務(wù)數(shù)據(jù),如學(xué)工系統(tǒng)的學(xué)生考勤、獎(jiǎng)評(píng)助貸等信息,教務(wù)系統(tǒng)的授課信息等。分析數(shù)據(jù)是對(duì)業(yè)務(wù)數(shù)據(jù)進(jìn)行加工、整理和分析后所產(chǎn)生的數(shù)據(jù),如教學(xué)質(zhì)量與監(jiān)測(cè)系統(tǒng)里所產(chǎn)生的數(shù)據(jù)。由于主數(shù)據(jù)是高校數(shù)據(jù)資產(chǎn)中最核心、最需要共享的基礎(chǔ)數(shù)據(jù),是高校數(shù)據(jù)治理工作中最為基礎(chǔ)的一環(huán),也是業(yè)務(wù)數(shù)據(jù)和分析數(shù)據(jù)治理的基礎(chǔ)。高校應(yīng)建立行之有效的主數(shù)據(jù)管理體系,充分挖掘主數(shù)據(jù)的價(jià)值,持續(xù)提升主數(shù)據(jù)質(zhì)量,進(jìn)而充分體現(xiàn)高校數(shù)據(jù)資產(chǎn)的價(jià)值。
2 數(shù)據(jù)治理的內(nèi)容
數(shù)據(jù)治理是一個(gè)完整的體系,是一項(xiàng)長期存在的數(shù)據(jù)管理活動(dòng),涉及高校多個(gè)層面,是管理制度與信息技術(shù)的綜合運(yùn)用。加強(qiáng)數(shù)據(jù)治理是高校數(shù)據(jù)中心建設(shè)的一項(xiàng)重要工作。高校數(shù)據(jù)治理的范疇主要包括主數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)、分析數(shù)據(jù)等全量數(shù)據(jù)。高校需要厘清主數(shù)據(jù)與業(yè)務(wù)數(shù)據(jù)、分析數(shù)據(jù)之間的關(guān)系,落實(shí)“一數(shù)一源”,將核心實(shí)體業(yè)務(wù)的數(shù)據(jù),如師生基本信息、科研、教學(xué)、圖書、資產(chǎn)等歸劃到高校主數(shù)據(jù)管理,從而形成全校范圍內(nèi)統(tǒng)一、完備、準(zhǔn)確的核心業(yè)務(wù)數(shù)據(jù)。數(shù)據(jù)治理是一項(xiàng)管理工作,需要對(duì)各業(yè)務(wù)系統(tǒng)推行統(tǒng)一的信息標(biāo)準(zhǔn),數(shù)據(jù)標(biāo)準(zhǔn),以制度管理為抓手,自上而下的推動(dòng)數(shù)據(jù)治理工作,提升源頭數(shù)據(jù)質(zhì)量,確保源頭數(shù)據(jù)的完整性、準(zhǔn)確性與及時(shí)性。
2.1 制度與組織保證
習(xí)近平總書記在“十三五”規(guī)劃中建議,實(shí)施國家大數(shù)據(jù)戰(zhàn)略,推進(jìn)數(shù)據(jù)資源開放共享。教育部2016年印發(fā)了《教育信息化“十三五”規(guī)劃》,該規(guī)劃要求:制訂出臺(tái)教育數(shù)據(jù)管理辦法,規(guī)范數(shù)據(jù)采集、存儲(chǔ)、處理、使用、共享等全生命周期管理,實(shí)現(xiàn)教育基礎(chǔ)數(shù)據(jù)的有序開放與共享[3]。近幾年來,各高校積極響應(yīng)國家教育信息化發(fā)展規(guī)劃,構(gòu)建各自的信息化體系,但是普遍存在項(xiàng)目先行,制度后補(bǔ)現(xiàn)象,導(dǎo)致數(shù)據(jù)管理不規(guī)范等問題。數(shù)據(jù)治理工作,作為一項(xiàng)長期持續(xù)的工作,需要建立合適的組織架構(gòu),首先要獲取高校一把手的支持,由高校首席信息官(CIO)作為數(shù)據(jù)治理的負(fù)責(zé)人,設(shè)置學(xué)校層面的專職數(shù)據(jù)資產(chǎn)管理員及各個(gè)業(yè)務(wù)系統(tǒng)層面的業(yè)務(wù)數(shù)據(jù)資產(chǎn)管理員,規(guī)范各層級(jí)人員的職責(zé)與數(shù)據(jù)管理辦法,規(guī)范數(shù)據(jù)采集與共享流程,做到“一數(shù)一源”,并形成正式的管理制度規(guī)范。
2.2 信息標(biāo)準(zhǔn)
數(shù)據(jù)治理的首要工作就是要制定高校統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn)與規(guī)范,為實(shí)現(xiàn)各業(yè)務(wù)系統(tǒng)的信息集成、數(shù)據(jù)共享和業(yè)務(wù)協(xié)同做好信息化的基礎(chǔ)保障。經(jīng)調(diào)研分析可知,目前很多高校都完成了對(duì)學(xué)校原有應(yīng)用系統(tǒng)和新建應(yīng)用系統(tǒng)之間的集成。但在進(jìn)行數(shù)據(jù)集成過程中,常常存在以下問題:由于各應(yīng)用系統(tǒng)沒有遵循統(tǒng)一的信息編碼標(biāo)準(zhǔn),從而導(dǎo)致數(shù)據(jù)不完整;不同系統(tǒng)描述同一業(yè)務(wù)的數(shù)據(jù)代碼存在差異,從而導(dǎo)致數(shù)據(jù)不統(tǒng)一;多個(gè)系統(tǒng)記錄相同數(shù)據(jù),違反“一數(shù)一源”原則,從而導(dǎo)致數(shù)據(jù)不一致;各部門數(shù)據(jù)不能協(xié)同,不能及時(shí)更新數(shù)據(jù),從而導(dǎo)致數(shù)據(jù)不及時(shí)。因此,為了消除數(shù)據(jù)壁壘,實(shí)現(xiàn)對(duì)數(shù)據(jù)真正有效整合,確保數(shù)據(jù)的準(zhǔn)確性與完備性,需要制定一個(gè)統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn),包括元數(shù)據(jù)定義規(guī)范、業(yè)務(wù)數(shù)據(jù)集規(guī)范、代碼和編碼規(guī)則規(guī)范。為了便于業(yè)務(wù)集成及數(shù)據(jù)交換,各高校應(yīng)以《CELTS-33 高等學(xué)校管理信息標(biāo)準(zhǔn)》為范本,結(jié)合學(xué)校自身特點(diǎn)裁剪符合學(xué)校發(fā)展的信息標(biāo)準(zhǔn)。
2.3 數(shù)據(jù)質(zhì)量
數(shù)據(jù)質(zhì)量管理包含對(duì)數(shù)據(jù)的絕對(duì)質(zhì)量管理、過程質(zhì)量管理和使用質(zhì)量管理。絕對(duì)質(zhì)量即數(shù)據(jù)的真實(shí)性、完備性、自治性是數(shù)據(jù)本身應(yīng)具有的屬性。過程質(zhì)量即使用質(zhì)量、存儲(chǔ)質(zhì)量和傳輸質(zhì)量,數(shù)據(jù)的使用質(zhì)量是指數(shù)據(jù)被正確的使用。再正確的數(shù)據(jù),如果被錯(cuò)誤的使用,就不可能得出正確的結(jié)論。數(shù)據(jù)質(zhì)量是影響信息系統(tǒng)運(yùn)行與數(shù)據(jù)共享的關(guān)鍵因素。因此,信息系統(tǒng)數(shù)據(jù)質(zhì)量管理是非常重要的一項(xiàng)工作,各高校應(yīng)強(qiáng)化全面數(shù)據(jù)尤其是主數(shù)據(jù)質(zhì)量管理的理念,把這一理念滲透到數(shù)據(jù)生命周期的全過程。制定合適的數(shù)據(jù)質(zhì)量管理體系,及時(shí)全面的發(fā)現(xiàn)數(shù)據(jù)治理過程中遇到的問題并加以分析,從而推進(jìn)數(shù)據(jù)質(zhì)量的持續(xù)提升。數(shù)據(jù)質(zhì)量的改進(jìn)和提高,須從源頭開始,以管理為抓手,對(duì)各類數(shù)據(jù)的質(zhì)量進(jìn)行全方位、全過程的監(jiān)控,分析原因,探索科學(xué)有效的監(jiān)測(cè)方法和治理措施。
3 建設(shè)數(shù)據(jù)共享平臺(tái)
數(shù)據(jù)治理的最終目的是實(shí)現(xiàn)數(shù)據(jù)融合,為把原本分散異構(gòu)的信息系統(tǒng)數(shù)據(jù)資源進(jìn)行有效整合,靈活實(shí)現(xiàn)不同信息系統(tǒng)間的信息交換、信息共享與業(yè)務(wù)協(xié)同,使用統(tǒng)一的標(biāo)準(zhǔn)和口徑為其它應(yīng)用系統(tǒng)提供數(shù)據(jù)共享服務(wù),高校需要建立一個(gè)先進(jìn)技術(shù)標(biāo)準(zhǔn)和規(guī)范,以構(gòu)建數(shù)據(jù)資產(chǎn)體系、數(shù)據(jù)資產(chǎn)價(jià)值為核心的數(shù)據(jù)共享平臺(tái)。數(shù)據(jù)共享平臺(tái)實(shí)現(xiàn)了數(shù)據(jù)與業(yè)務(wù)的分離,快速實(shí)現(xiàn)跨系統(tǒng)、跨平臺(tái)、跨數(shù)據(jù)庫之間基于不同傳輸協(xié)議的數(shù)據(jù)交換和信息共享,為校內(nèi)各信息系統(tǒng)和管理決策支持提供良好的數(shù)據(jù)環(huán)境。
數(shù)據(jù)共享平臺(tái)需要具備數(shù)據(jù)匯集、數(shù)據(jù)開發(fā)、數(shù)據(jù)資產(chǎn)、數(shù)據(jù)服務(wù)[4]四個(gè)核心管理能力,實(shí)現(xiàn)數(shù)據(jù)的一次采集,多系統(tǒng)共享,為高校的各個(gè)業(yè)務(wù)系統(tǒng)提供快捷、準(zhǔn)確、規(guī)范、完整的數(shù)據(jù)服務(wù)。(如圖1所示)
3.1 數(shù)據(jù)匯集
數(shù)據(jù)共享平臺(tái)本身是不產(chǎn)生數(shù)據(jù)的,所有數(shù)據(jù)均來源于各個(gè)信息系統(tǒng)、網(wǎng)絡(luò)、運(yùn)行日志等,通過平臺(tái)的采集工具將異構(gòu)系統(tǒng)和數(shù)據(jù)庫及平臺(tái)文件等集中抽取至高校中心數(shù)據(jù)庫,作為后續(xù)加工、分析、利用的基礎(chǔ)。
圖1 數(shù)據(jù)共享平臺(tái)總體架構(gòu)圖
3.2 數(shù)據(jù)開發(fā)
數(shù)據(jù)匯集所采集到的數(shù)據(jù)都是未經(jīng)開發(fā),各業(yè)務(wù)系統(tǒng)的原生數(shù)據(jù)。數(shù)據(jù)開發(fā)類似于工廠里商品的加工生產(chǎn)過程,對(duì)數(shù)據(jù)進(jìn)行深挖細(xì)掘,將數(shù)據(jù)加工成對(duì)業(yè)務(wù)有價(jià)值的形式,是一個(gè)將沒有價(jià)值的數(shù)據(jù)轉(zhuǎn)變?yōu)橛袃r(jià)值的數(shù)據(jù)資產(chǎn)的過程。
3.3 數(shù)據(jù)資產(chǎn)
數(shù)據(jù)資產(chǎn)管理是將經(jīng)過開發(fā)的各類數(shù)據(jù)進(jìn)行整理上架的過程,通過數(shù)據(jù)可視化界面對(duì)高校的主數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)、分析數(shù)據(jù)等進(jìn)行分類,形成數(shù)據(jù)資產(chǎn)。建立資產(chǎn)目錄,標(biāo)識(shí)元數(shù)據(jù),評(píng)估數(shù)據(jù)質(zhì)量,對(duì)數(shù)據(jù)的全生命數(shù)據(jù)周期進(jìn)行統(tǒng)一管理。
3.4 數(shù)據(jù)服務(wù)
數(shù)據(jù)服務(wù)是將數(shù)據(jù)資產(chǎn)轉(zhuǎn)換為數(shù)據(jù)服務(wù)的能力,是數(shù)據(jù)的出口,可以有效解決數(shù)據(jù)交換“最后一公里”問題,以API接口的形式提供數(shù)據(jù)服務(wù),可以快速實(shí)現(xiàn)校內(nèi)各個(gè)層次、不同信息系統(tǒng)的數(shù)據(jù)應(yīng)用需要。
四、結(jié)語
本文對(duì)高校數(shù)據(jù)治理的現(xiàn)狀進(jìn)行分析的基礎(chǔ)上提出了高校應(yīng)該加強(qiáng)對(duì)數(shù)據(jù)的治理工作,以管理為抓手,落實(shí)“一數(shù)一源”,狠抓數(shù)據(jù)質(zhì)量。通過數(shù)據(jù)共享平臺(tái)的方式將主數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)和分析數(shù)據(jù)三類數(shù)據(jù)進(jìn)行加工、開發(fā)形成條目清晰的數(shù)據(jù)資產(chǎn)體系,為高校的領(lǐng)導(dǎo)決策、行政管理和信息系統(tǒng)提供快捷的數(shù)據(jù)服務(wù)。數(shù)據(jù)治理工作,技術(shù)是手段,管理才是原動(dòng)力,數(shù)據(jù)治理的成效與數(shù)據(jù)價(jià)值的開發(fā)程度如何,需要一支專業(yè)、穩(wěn)定的校內(nèi)技術(shù)團(tuán)隊(duì)和相應(yīng)的管理制度、經(jīng)濟(jì)作為保障。
參考文獻(xiàn):
[1]王兆君,王鉞,曹朝輝.主數(shù)據(jù)驅(qū)動(dòng)的數(shù)據(jù)治理:原理、技術(shù)與實(shí)踐[M].清華大學(xué)出版社,2019:3.
[2]許曉東,彭嫻,周可.美國通用教育數(shù)據(jù)標(biāo)準(zhǔn)對(duì)我國高等教育數(shù)據(jù)治理的啟示[J].高等工程教育研究,2019(1):103-108.
[3]中華人民共和國教育部公報(bào).教育部關(guān)于印發(fā)《教育信息化“十三五”規(guī)劃》的通知[Z].教技〔2016〕2號(hào).
[4]付登坡,等.數(shù)據(jù)中臺(tái):讓數(shù)據(jù)用起來[M].機(jī)械工業(yè)出版社,2020:53-57.
(責(zé)任編輯:李凌峰)