季 紅
(天津職業(yè)大學(xué)網(wǎng)絡(luò)安全和信息化辦公室,天津 300400)
隨著高校信息化的建設(shè)和發(fā)展,數(shù)據(jù)的問(wèn)題逐步顯現(xiàn)出來(lái)。如何有效地管理和利用數(shù)據(jù),成為高校信息化發(fā)展的新方向。“十三五”智慧校園建設(shè)積累了大量的數(shù)據(jù)、日志信息,這些數(shù)據(jù)來(lái)源眾多,缺乏統(tǒng)一的建設(shè)標(biāo)準(zhǔn),獨(dú)立存儲(chǔ),缺乏有效的整合,形成了新的“數(shù)據(jù)孤島”,嚴(yán)重阻礙了學(xué)校的發(fā)展。按照《2020教育信息化和網(wǎng)絡(luò)安全工作要點(diǎn)》的工作部署,推動(dòng)教育數(shù)據(jù)的有序共享,實(shí)現(xiàn)更好的支撐校園服務(wù)應(yīng)用[1]。高校要通過(guò)數(shù)據(jù)的治理與挖掘,提高數(shù)據(jù)信息價(jià)值,從而輔助學(xué)校決策,提高信息化管理服務(wù)水平。
學(xué)校缺乏統(tǒng)一的數(shù)據(jù)建設(shè)標(biāo)準(zhǔn),缺少頂層規(guī)劃,數(shù)據(jù)信息建設(shè)中各自為政,獨(dú)立存儲(chǔ),無(wú)法實(shí)現(xiàn)數(shù)據(jù)的共建共享。系統(tǒng)數(shù)據(jù)在采集和存儲(chǔ)過(guò)程中雜亂無(wú)章,缺乏有效的管理,不能形成權(quán)威數(shù)據(jù)源,無(wú)法形成標(biāo)準(zhǔn)校本數(shù)據(jù)。
學(xué)校雖然建設(shè)了數(shù)據(jù)交換中心,但數(shù)據(jù)存在嚴(yán)重的質(zhì)量問(wèn)題,數(shù)據(jù)來(lái)源不唯一,一致性差,固定格式的數(shù)據(jù)中存在無(wú)關(guān)字符,數(shù)據(jù)內(nèi)容不完整,接口數(shù)據(jù)流失嚴(yán)重。數(shù)據(jù)中心里的數(shù)據(jù)沒有進(jìn)行精細(xì)化、全面化的管理,數(shù)據(jù)冗余較大,臟數(shù)據(jù)較多,工作效率極低。不能為數(shù)據(jù)展示分析、綜合利用提供高質(zhì)量的數(shù)據(jù)。
學(xué)校數(shù)據(jù)對(duì)外開放多采用中間庫(kù)的方式,形式單一,共享內(nèi)容不可控,對(duì)數(shù)據(jù)使用人員技術(shù)要求較高。無(wú)法做到全校重視,全體參與,負(fù)責(zé)數(shù)據(jù)的教師需要頻繁與業(yè)務(wù)部門對(duì)接,重復(fù)開發(fā)大量數(shù)據(jù)視圖或中間庫(kù),效率低下。學(xué)校管理缺乏數(shù)據(jù)的深度挖掘和綜合利用,沒有真正地發(fā)揮數(shù)據(jù)價(jià)值,無(wú)法為各級(jí)領(lǐng)導(dǎo)及廣大師生提供校務(wù)數(shù)據(jù)綜合展示的服務(wù)。
從學(xué)校信息化建設(shè)的實(shí)際情況出發(fā),以國(guó)標(biāo)、教標(biāo)以及信息化行業(yè)標(biāo)準(zhǔn)為指導(dǎo),對(duì)全校數(shù)據(jù)資源和數(shù)據(jù)模型進(jìn)行頂層規(guī)劃設(shè)計(jì),形成統(tǒng)一、全面的學(xué)校標(biāo)準(zhǔn),使不同部門建設(shè)的應(yīng)用系統(tǒng)之間數(shù)據(jù)相互流通共享,實(shí)現(xiàn)數(shù)據(jù)精細(xì)化的管理。建立校本數(shù)據(jù)模型,建立長(zhǎng)期的數(shù)字資源集成共享機(jī)制。
建設(shè)數(shù)據(jù)治理體系,形成數(shù)據(jù)資源池,構(gòu)建全校資源主數(shù)據(jù)、共享數(shù)據(jù)、歷史數(shù)據(jù)、數(shù)據(jù)倉(cāng)庫(kù),形成學(xué)校新舊應(yīng)用系統(tǒng)的數(shù)據(jù)交換體系,實(shí)現(xiàn)不同部門或單位的業(yè)務(wù)協(xié)同和信息融合[2],并為后續(xù)新建系統(tǒng)的無(wú)縫對(duì)接提供規(guī)范與基礎(chǔ)。建設(shè)一站式綜合數(shù)據(jù)服務(wù)平臺(tái),提供業(yè)務(wù)數(shù)據(jù)的采集、清洗、存儲(chǔ)、服務(wù)、監(jiān)控的全生命周期管理。
利用信息和網(wǎng)絡(luò)技術(shù),用數(shù)據(jù)反映學(xué)校教學(xué)基本狀態(tài),校務(wù)管理的執(zhí)行情況。進(jìn)行深入的數(shù)據(jù)挖掘,進(jìn)行數(shù)據(jù)關(guān)聯(lián)分析,靈活運(yùn)用聚類、分類等算法,探索或預(yù)測(cè)導(dǎo)致事件發(fā)生的相關(guān)性因素[3],為學(xué)校不同的用戶群體提供智能的數(shù)據(jù)檢索服務(wù)。為學(xué)校搭建學(xué)生安全管理、校外媒體監(jiān)測(cè)、網(wǎng)絡(luò)日志分析等豐富的校園大數(shù)據(jù)應(yīng)用,支撐決策層集中掌握校園整體運(yùn)行情況,打造大數(shù)據(jù)時(shí)代的智慧校園。
高校數(shù)據(jù)治理旨在深化學(xué)校的數(shù)據(jù)規(guī)范,建立一套符合學(xué)校實(shí)際需要的數(shù)據(jù)標(biāo)準(zhǔn)化體系,充分挖掘、共享、分析、利用數(shù)據(jù)資源,發(fā)揮數(shù)據(jù)價(jià)值。數(shù)據(jù)治理工作從數(shù)據(jù)質(zhì)量出發(fā),建立學(xué)校數(shù)據(jù)質(zhì)量建設(shè)和管理準(zhǔn)則。將制度落地,通過(guò)數(shù)據(jù)治理系統(tǒng)平臺(tái)實(shí)現(xiàn)數(shù)據(jù)的集中采集、動(dòng)態(tài)監(jiān)控、規(guī)則執(zhí)行和數(shù)據(jù)任務(wù)調(diào)度,從而發(fā)現(xiàn)數(shù)據(jù)問(wèn)題,并形成預(yù)警,及時(shí)整改,實(shí)現(xiàn)數(shù)據(jù)的實(shí)時(shí)更新和同步。利用數(shù)據(jù)分析工具產(chǎn)生有用數(shù)據(jù),輔助學(xué)校各項(xiàng)工作開展,為學(xué)校的智慧校園建設(shè)提供數(shù)據(jù)支撐。數(shù)據(jù)治理平臺(tái)應(yīng)包括數(shù)據(jù)標(biāo)準(zhǔn)管理、全量數(shù)據(jù)中心、數(shù)據(jù)質(zhì)量管理、數(shù)據(jù)共享交換和數(shù)據(jù)挖掘分析等功能。
首先對(duì)學(xué)校數(shù)據(jù)建設(shè)情況進(jìn)行全面梳理,實(shí)現(xiàn)數(shù)據(jù)信息從生產(chǎn)、存儲(chǔ)、流動(dòng)到使用的全過(guò)程進(jìn)行調(diào)研,明確業(yè)務(wù)流程和數(shù)據(jù)應(yīng)用關(guān)系,按照規(guī)范化的表達(dá)方式,展現(xiàn)出學(xué)校的業(yè)務(wù)現(xiàn)狀和未來(lái)發(fā)展需求的公共基礎(chǔ)數(shù)據(jù)模型及業(yè)務(wù)數(shù)據(jù)模型[4]。建立數(shù)據(jù)標(biāo)準(zhǔn)管理平臺(tái),為數(shù)據(jù)治理和大數(shù)據(jù)分析提供一定的標(biāo)準(zhǔn)規(guī)范,以保證信息的高效匯集和交換。進(jìn)行信息化標(biāo)準(zhǔn)體系建設(shè),厘清數(shù)據(jù)關(guān)系,明確各項(xiàng)數(shù)據(jù)責(zé)任人,全面掌握目前院內(nèi)業(yè)務(wù)系統(tǒng)數(shù)據(jù)現(xiàn)狀,使學(xué)院在信息的采集、處理、交換、傳輸?shù)倪^(guò)程中有統(tǒng)一的規(guī)范,并且能夠有效指導(dǎo)未來(lái)各個(gè)業(yè)務(wù)系統(tǒng)升級(jí)和建設(shè)工作,切實(shí)提高學(xué)院的信息化標(biāo)準(zhǔn)水平。
建設(shè)學(xué)校全量數(shù)據(jù)中心,覆蓋整個(gè)業(yè)務(wù)域,從業(yè)務(wù)系統(tǒng)中提取核心數(shù)據(jù),通過(guò)抽取(extract)、轉(zhuǎn)換(transform)、加載(load)過(guò)程,存儲(chǔ)到全量數(shù)據(jù)庫(kù)中。再進(jìn)行集中數(shù)據(jù)的清洗和驗(yàn)證。依據(jù)信息標(biāo)準(zhǔn)規(guī)范,對(duì)全量數(shù)據(jù)庫(kù)進(jìn)行配置化備份建設(shè)歷史數(shù)據(jù)庫(kù);通過(guò)核驗(yàn)功能,對(duì)數(shù)據(jù)庫(kù)的規(guī)范性進(jìn)行定期校驗(yàn),強(qiáng)化數(shù)據(jù)庫(kù)的規(guī)范性;最終數(shù)據(jù)中心以服務(wù)的方式把統(tǒng)一的、完整的、準(zhǔn)確的、具有權(quán)威性的主題數(shù)據(jù)傳送給學(xué)校范圍內(nèi)需要使用這些數(shù)據(jù)的操作型應(yīng)用系統(tǒng)和分析型應(yīng)用系統(tǒng)[5]。
建成數(shù)據(jù)質(zhì)量監(jiān)控平臺(tái),根據(jù)不同類型的數(shù)據(jù)問(wèn)題,項(xiàng)目將采取相對(duì)應(yīng)的數(shù)據(jù)質(zhì)量檢測(cè)和治理方式。對(duì)全校的數(shù)據(jù)進(jìn)行實(shí)時(shí)監(jiān)控,借助數(shù)據(jù)質(zhì)量監(jiān)控工具,形成權(quán)威的數(shù)據(jù)質(zhì)量報(bào)告,推動(dòng)學(xué)校數(shù)據(jù)質(zhì)量完善,深度挖掘數(shù)據(jù)價(jià)值。要求實(shí)現(xiàn):(1)完備性,數(shù)據(jù)擁有所有必須或適當(dāng)?shù)牟糠?,擁有的是整個(gè)成品的全部。完備性的第一條件是存在性,數(shù)據(jù)必須存在。(2)一致性,同時(shí)滿足穩(wěn)定性和連貫性,必須實(shí)現(xiàn)不存在變異或變更。(3)及時(shí)性,數(shù)據(jù)顯示要求及時(shí)更新,對(duì)于數(shù)據(jù)處理,及時(shí)性與數(shù)據(jù)的可用性相關(guān),要求在一定程度上在正確的時(shí)間有他們需要的數(shù)據(jù)。(4)有效性,數(shù)據(jù)對(duì)一組業(yè)務(wù)規(guī)則、標(biāo)準(zhǔn)或已定義的數(shù)據(jù)值域的符合程度。(5)完整性,數(shù)據(jù)對(duì)(由數(shù)據(jù)模型定義的)數(shù)據(jù)關(guān)系規(guī)則的符合程度,這些規(guī)則的目的是確保數(shù)據(jù)對(duì)概念進(jìn)行完備、一致和有效地表示。
構(gòu)建數(shù)據(jù)開放共享平臺(tái),實(shí)現(xiàn)數(shù)據(jù)的共享開放。數(shù)據(jù)開放共享的意義在于把高校的數(shù)據(jù)服務(wù),像水、電、煤一樣輸送給有需要的業(yè)務(wù)部門、應(yīng)用系統(tǒng)、開發(fā)者、學(xué)生和教工團(tuán)體。面向校級(jí)業(yè)務(wù)部門、二級(jí)學(xué)院、廣大師生及個(gè)人用戶提供基于權(quán)限控制的應(yīng)用平臺(tái),向各類用戶開放數(shù)據(jù)集、數(shù)據(jù)接口和數(shù)據(jù)應(yīng)用3類資源。規(guī)范部門間的數(shù)據(jù)交換,將對(duì)開放的數(shù)據(jù)進(jìn)行集中管理,使學(xué)校數(shù)據(jù)中心成為發(fā)布數(shù)據(jù)唯一的權(quán)威來(lái)源。
最終通過(guò)大數(shù)據(jù)的分析和挖掘技術(shù),關(guān)聯(lián)分析學(xué)生、老師以及其它幾個(gè)層面的深度畫像,清新地展示不同對(duì)象的個(gè)性化特性,助力教學(xué)及管理過(guò)程的個(gè)性化和特色化。對(duì)在校學(xué)生個(gè)人信息和學(xué)生行為信息的關(guān)聯(lián)進(jìn)行分析?;趯W(xué)校的學(xué)生素質(zhì)評(píng)價(jià)體系,構(gòu)建每個(gè)學(xué)生的多個(gè)維度的模型,綜合各個(gè)維度的情況建立全校學(xué)生個(gè)人行為畫像和綜合畫像,樹立學(xué)校優(yōu)秀學(xué)生的行為畫像,宏觀和微觀展現(xiàn)學(xué)生各方面的情況,有利于學(xué)生了解自身整體情況以及和優(yōu)秀學(xué)生的差距,有利于學(xué)校統(tǒng)籌規(guī)劃學(xué)生的培養(yǎng)和管理。同時(shí),分析每個(gè)學(xué)生的素質(zhì)、技能的發(fā)展趨勢(shì)和學(xué)校排名,剖析綜合素質(zhì)和專業(yè)技能上升和下降的原因,提供學(xué)生、班級(jí)和學(xué)院的目前素質(zhì)狀況、歷史對(duì)比和排名對(duì)比的行為畫像分析報(bào)告。
通過(guò)大數(shù)據(jù)治理,形成標(biāo)準(zhǔn)化校本數(shù)據(jù),以真實(shí)的數(shù)據(jù)進(jìn)行深度挖掘和數(shù)據(jù)分析,形成學(xué)校人、財(cái)、物的綜合展現(xiàn)和動(dòng)態(tài)監(jiān)控,為領(lǐng)導(dǎo)決策提供數(shù)據(jù)參考。同時(shí)通過(guò)多維度的分析,掌握學(xué)生學(xué)習(xí)和生活狀態(tài),記錄成長(zhǎng)軌跡;推動(dòng)個(gè)性化的學(xué)習(xí)和就業(yè),實(shí)現(xiàn)精準(zhǔn)教學(xué)和管理,促進(jìn)學(xué)校的發(fā)展。