王加祥
(南京郵電大學(xué) 江蘇 南京 210023)
近年來,隨著大數(shù)據(jù)技術(shù)的發(fā)展,越來越多的國家開始重視大數(shù)據(jù)對于提升本國治理能力和競爭力的作用,2015年我國已將大數(shù)據(jù)提升為國家層面的戰(zhàn)略資源,2017年國家主席習(xí)近平強(qiáng)調(diào)要運用大數(shù)據(jù)提升國家治理現(xiàn)代化水平[1]。2018年,教育部發(fā)布《教育信息化2.0行動計劃》,文件指出要完善教育管理信息化的頂層設(shè)計,提升大數(shù)據(jù)在在教育管理及決策等方面的支撐與保障作用[2]。教育宏觀決策大數(shù)據(jù)庫的建設(shè)和應(yīng)用已成為一項科技智庫建設(shè)工程,將成為教育決策創(chuàng)新的重要驅(qū)動力,同時這也是一個龐大而且復(fù)雜的系統(tǒng)工程,其數(shù)據(jù)涉及社會多領(lǐng)域的眾多業(yè)務(wù)系統(tǒng),要從如此量大且結(jié)構(gòu)復(fù)雜的數(shù)據(jù)中清洗挖掘出有用的教育決策研究信息進(jìn)而轉(zhuǎn)化為智庫知識,需要建立一套規(guī)范的數(shù)據(jù)標(biāo)準(zhǔn)體系,以標(biāo)準(zhǔn)化的方式規(guī)范和整合資源,為教育決策大數(shù)據(jù)的健康發(fā)展打下基礎(chǔ)。
歐美、日本等發(fā)達(dá)國家在推進(jìn)本國經(jīng)濟(jì)發(fā)展、提升社會治理水平等方面,都非常重視大數(shù)據(jù)的應(yīng)用,大數(shù)據(jù)在提升其綜合競爭力方面起著很重要的作用。大數(shù)據(jù)的采集和應(yīng)用離不開大數(shù)據(jù)標(biāo)準(zhǔn)化的制定,標(biāo)準(zhǔn)化工作需要科學(xué)的頂層設(shè)計,其中ISO/IEC JTC1、ITU-T、IEEE BDGMM、NIST等大數(shù)據(jù)研究組織,專門成立了大數(shù)據(jù)標(biāo)準(zhǔn)化的研究小組,研究制定和協(xié)調(diào)大數(shù)據(jù)領(lǐng)域的關(guān)鍵技術(shù),包括大數(shù)據(jù)參考模型、大數(shù)據(jù)元數(shù)據(jù)框架和概念模型、大數(shù)據(jù)治理和元數(shù)據(jù)管理、大數(shù)據(jù)互操作性框架以及大數(shù)據(jù)安全等,旨在規(guī)范大數(shù)據(jù)的具體應(yīng)用和保護(hù)信息安全。
我國同樣非常重視大數(shù)據(jù)標(biāo)準(zhǔn)體系的研究工作,首先,在政策方面,相繼出臺了《促進(jìn)大數(shù)據(jù)發(fā)展行動綱要》、《大數(shù)據(jù)產(chǎn)業(yè)發(fā)展規(guī)劃(2016-2020年)》等文件,均明確指出要建立和推進(jìn)大數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范體系建設(shè),加強(qiáng)大數(shù)據(jù)標(biāo)準(zhǔn)化頂層設(shè)計,逐步完善標(biāo)準(zhǔn)體系,發(fā)揮標(biāo)準(zhǔn)化對產(chǎn)業(yè)發(fā)展的重要支撐作用的重點任務(wù)。其次,在機(jī)構(gòu)建設(shè)方面,2014年12月全國信息技術(shù)標(biāo)準(zhǔn)化技術(shù)委員會大數(shù)據(jù)標(biāo)準(zhǔn)工作組正式成立,并有100多家單位申請參與標(biāo)準(zhǔn)制定。近年來,該工作組積極開展標(biāo)準(zhǔn)化研究工作,其中有6項國家標(biāo)準(zhǔn)已完成并發(fā)布,處于報批階段的有3項,正在研制中的為15項,并在2018年正式發(fā)布大數(shù)據(jù)安全標(biāo)準(zhǔn)化白皮書(2018版)[3]。這些措施和成果為加強(qiáng)我國大數(shù)據(jù)體系架構(gòu)研究和標(biāo)準(zhǔn)化工作提供了重要的政策保障和技術(shù)基礎(chǔ)。
目前我國的教育宏觀決策大數(shù)據(jù)庫建設(shè)還處于初期研究階段,在數(shù)據(jù)標(biāo)準(zhǔn)體系建設(shè)方面主要存在以下兩方面難點。
教育宏觀決策大數(shù)據(jù)不同于一般教育實踐數(shù)據(jù),其涉及面廣,首先,基礎(chǔ)數(shù)據(jù)方面,涵蓋學(xué)前教育、基礎(chǔ)教育、職業(yè)教育、高等教育、繼續(xù)教育等各階段基本信息,如學(xué)生人數(shù)、師資情況、教育經(jīng)費等數(shù)據(jù),教育政策和研究方面涵蓋各層級教育發(fā)展戰(zhàn)略、教育體制機(jī)制改革研究、教育政策研究、以及教育比較研究等方面的數(shù)據(jù)。其次,教育宏觀決策還涉及經(jīng)濟(jì)、人口、就業(yè)等社會管理及公共服務(wù)數(shù)據(jù),需要與多部門進(jìn)行數(shù)據(jù)同步。此外還包含來自教育政策執(zhí)行者在政策實踐后的實時反饋信息,以及目前國家十分重視的網(wǎng)絡(luò)媒體發(fā)出的關(guān)于教育政策的輿情信息數(shù)據(jù)。這些數(shù)據(jù)既有諸如統(tǒng)計數(shù)據(jù)的結(jié)構(gòu)化數(shù)據(jù),同時也存在各種文檔、報表、圖形、音視頻文件等非結(jié)構(gòu)化數(shù)據(jù),而非結(jié)構(gòu)化數(shù)據(jù)因其格式類型繁多,與結(jié)構(gòu)化數(shù)據(jù)相比更難標(biāo)準(zhǔn)化和理解。
大數(shù)據(jù)建設(shè)離不開對數(shù)據(jù)的采集,除了對互聯(lián)網(wǎng)數(shù)據(jù)的采集,還有一部分?jǐn)?shù)據(jù)需要通過數(shù)據(jù)共享來獲取,但目前數(shù)據(jù)共享仍存在一定障礙,一方面,長期以來國家級、省級、市縣級各層級的教育業(yè)務(wù)信息系統(tǒng)多數(shù)只運行在本組織內(nèi)部,相關(guān)數(shù)據(jù)的跨領(lǐng)域、跨部門、跨平臺安全共享以及數(shù)據(jù)系統(tǒng)之間的接口尚未打通、互操作尚未實現(xiàn),導(dǎo)致沉積的海量歷史數(shù)據(jù)只能在有限范圍內(nèi)共享,造成數(shù)據(jù)資源不能完全發(fā)揮其價值。另一方面,在這些應(yīng)用系統(tǒng)建設(shè)過程中并未建立統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn),數(shù)據(jù)格式不一致、系統(tǒng)異構(gòu)的現(xiàn)象較為普遍,要重新建立統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn),必然需要調(diào)動各級業(yè)務(wù)部門進(jìn)行統(tǒng)一協(xié)作,不僅工作量大耗時長,且調(diào)動難度大。
通過對教育宏觀決策大數(shù)據(jù)標(biāo)準(zhǔn)化建設(shè)需求和數(shù)據(jù)特點分析,結(jié)合當(dāng)前其他領(lǐng)域大數(shù)據(jù)標(biāo)準(zhǔn)化設(shè)計和應(yīng)用的實踐及發(fā)展趨勢,本文將主要從基礎(chǔ)標(biāo)準(zhǔn)、數(shù)據(jù)標(biāo)準(zhǔn)、技術(shù)標(biāo)準(zhǔn)、管理標(biāo)準(zhǔn)等幾方面對教育宏觀決策大數(shù)據(jù)標(biāo)準(zhǔn)體系進(jìn)行研究,并構(gòu)建標(biāo)準(zhǔn)體系框架模型(如圖1)。各類標(biāo)準(zhǔn)之間互相聯(lián)系,也互為補(bǔ)充,是一個完整的體系。同時,該標(biāo)準(zhǔn)體系符合開放、共享和可擴(kuò)展的原則,在對教育宏觀決策數(shù)據(jù)庫建設(shè)進(jìn)行規(guī)范化的同時,也能夠為教育領(lǐng)域其他業(yè)務(wù)平臺的數(shù)據(jù)庫建設(shè)起到指導(dǎo)作用,并隨著教育領(lǐng)域數(shù)據(jù)應(yīng)用的深入和拓展而不斷細(xì)化和完善。
圖1 教育宏觀決策大數(shù)據(jù)標(biāo)準(zhǔn)體系框架模型
4.2.1 基礎(chǔ)標(biāo)準(zhǔn)
基礎(chǔ)標(biāo)準(zhǔn)是對教育宏觀決策大數(shù)據(jù)標(biāo)準(zhǔn)體系建設(shè)的工作規(guī)范和適用范圍進(jìn)行說明,包括基本術(shù)語、標(biāo)準(zhǔn)編制規(guī)范、標(biāo)準(zhǔn)體系構(gòu)建原則等。其中,術(shù)語類標(biāo)準(zhǔn)用于規(guī)范和統(tǒng)一數(shù)據(jù)庫中常用的技術(shù)術(shù)語和應(yīng)用系統(tǒng)中的業(yè)務(wù)術(shù)語等。建立術(shù)語規(guī)范有利于業(yè)務(wù)人員和技術(shù)人員在數(shù)據(jù)采集調(diào)用、系統(tǒng)設(shè)計、使用維護(hù)等方面對術(shù)語的含義形成統(tǒng)一的理解。標(biāo)準(zhǔn)編制規(guī)范用于明確大數(shù)據(jù)標(biāo)準(zhǔn)化的工作規(guī)程、標(biāo)準(zhǔn)編制、實施和修改的基本要求,對標(biāo)準(zhǔn)制定起指導(dǎo)作用。
4.2.2 數(shù)據(jù)標(biāo)準(zhǔn)
數(shù)據(jù)標(biāo)準(zhǔn)是對教育數(shù)據(jù)資源的數(shù)據(jù)來源和數(shù)據(jù)共享進(jìn)行規(guī)范,對元數(shù)據(jù)參考模型,數(shù)據(jù)分類與編碼規(guī)范,基礎(chǔ)教育、高等教育、教育政策等主題數(shù)據(jù)庫元數(shù)據(jù)規(guī)范,在數(shù)據(jù)管理過程中,采用數(shù)據(jù)字典和元數(shù)據(jù)管理,可以方便地規(guī)范數(shù)據(jù)資源。通過建立數(shù)據(jù)共享及數(shù)據(jù)服務(wù)評價標(biāo)準(zhǔn),提升數(shù)據(jù)服務(wù)質(zhì)量。
4.2.3 技術(shù)標(biāo)準(zhǔn)
技術(shù)標(biāo)準(zhǔn)包括數(shù)據(jù)采集與存儲、數(shù)據(jù)清洗、數(shù)據(jù)接口、互操作技術(shù)規(guī)范、數(shù)據(jù)質(zhì)量控制、數(shù)據(jù)溯源、數(shù)據(jù)安全等技術(shù)規(guī)范。如網(wǎng)絡(luò)教育輿情數(shù)據(jù)采集規(guī)范,公共服務(wù)數(shù)據(jù)庫數(shù)據(jù)的采集整合管理規(guī)范,元數(shù)據(jù)訪問服務(wù)接口規(guī)范,數(shù)據(jù)跨域互操作技術(shù)規(guī)范,用戶統(tǒng)一認(rèn)證接口規(guī)范等。數(shù)據(jù)安全作為大數(shù)據(jù)標(biāo)準(zhǔn)體系的重要部分,保障了數(shù)據(jù)不被非法冒充、竊取、篡改[4]。安全規(guī)范是對數(shù)據(jù)全生命周期提出安全防護(hù)要求,包括數(shù)據(jù)安全技術(shù)實施規(guī)范、安全評估標(biāo)準(zhǔn)及方法等。
4.2.4 管理標(biāo)準(zhǔn)
管理標(biāo)準(zhǔn)是用于規(guī)范教育宏觀決策數(shù)據(jù)庫應(yīng)用與維護(hù)過程中涉及的各種標(biāo)準(zhǔn),在數(shù)據(jù)的整個生命周期中發(fā)揮著重要管理支撐作用。包括數(shù)據(jù)質(zhì)量管理標(biāo)準(zhǔn)、運維管理標(biāo)準(zhǔn)、數(shù)據(jù)共享管理標(biāo)準(zhǔn)等,確保數(shù)據(jù)庫中的數(shù)據(jù)正確性,為不同來源數(shù)據(jù)分類管理,明確數(shù)據(jù)運維工作指南,對數(shù)據(jù)共享內(nèi)容、范圍、對象、級別等作出明確界定,以確保數(shù)據(jù)庫中的數(shù)據(jù)安全和可持續(xù)發(fā)展。
在國家層面,雖然已經(jīng)出臺了針對促進(jìn)數(shù)據(jù)公開、開放共享及保障數(shù)據(jù)安全等方面的政策法規(guī)與制度,但由于數(shù)據(jù)割據(jù)、數(shù)據(jù)孤島等現(xiàn)象的存在,教育相關(guān)數(shù)據(jù)的共享效果并不及預(yù)期,仍需加強(qiáng)政策保障力度,鼓勵地方出臺相應(yīng)細(xì)則,加大宣傳和培訓(xùn),提高相關(guān)機(jī)構(gòu)和部門的數(shù)據(jù)共享意愿,加快數(shù)據(jù)共享的步伐,為推動標(biāo)準(zhǔn)體系的制定和實施提供更有力的政策支持。
教育宏觀決策大數(shù)據(jù)標(biāo)準(zhǔn)編制工作難度大,應(yīng)保持與國家大數(shù)據(jù)標(biāo)準(zhǔn)委員會相關(guān)工作組的溝通,在遵循國家標(biāo)準(zhǔn)的基礎(chǔ)上,結(jié)合教育行業(yè)數(shù)據(jù)特點,有針對性地進(jìn)行標(biāo)準(zhǔn)體系的建設(shè),并積極與大數(shù)據(jù)應(yīng)用已成功落地的行業(yè)進(jìn)行交流,汲取成功經(jīng)驗和先進(jìn)理念,推動教育決策大數(shù)據(jù)標(biāo)準(zhǔn)體系建設(shè)[5]。
應(yīng)充分重視人才在教育宏觀決策大數(shù)據(jù)建設(shè)和應(yīng)用中的重要作用,抓緊設(shè)立專門數(shù)據(jù)管理崗位,通過與高校及科研單位合作,定向培養(yǎng)教育決策研究和大數(shù)據(jù)技術(shù)方面的跨學(xué)科復(fù)合人才隊伍,為實現(xiàn)教育宏觀決策大數(shù)據(jù)庫的綜合發(fā)展利用、輔助科學(xué)決策做好數(shù)據(jù)人才儲備。
標(biāo)準(zhǔn)體系建設(shè)作為教育宏觀決策大數(shù)據(jù)庫建設(shè)的基礎(chǔ)工作,在編制過程中,既要考慮存量數(shù)據(jù)資源特點和數(shù)據(jù)服務(wù)的成熟技術(shù),又要兼顧數(shù)據(jù)標(biāo)準(zhǔn)和技術(shù)標(biāo)準(zhǔn)的新進(jìn)展和新趨勢,確保標(biāo)準(zhǔn)體系框架的相對穩(wěn)定性。標(biāo)準(zhǔn)體系制定不可能一蹴而就,應(yīng)兼顧近期需求和長遠(yuǎn)規(guī)劃,避免閉門造車,并隨著研究的深入不斷完善,以保障教育宏觀決策大數(shù)據(jù)庫的可持續(xù)發(fā)展。