何磊 龐欽 萬暢
摘? 要:高職教育信息化要求高職院校系統(tǒng)構建校本數(shù)據(jù)中心,開展以數(shù)據(jù)為驅(qū)動的智慧校園建設并加強數(shù)據(jù)應用。為實現(xiàn)數(shù)據(jù)交換、數(shù)據(jù)處理和數(shù)據(jù)服務等功能,需要構建包括數(shù)據(jù)源、數(shù)據(jù)基礎架構、數(shù)據(jù)資源體系、數(shù)據(jù)管理軟件體系、數(shù)據(jù)管理規(guī)范制度體系在內(nèi)的完整架構,并按照籌劃準備、建設執(zhí)行、問題檢查和反饋優(yōu)化的流程分步實施。圍繞個人數(shù)據(jù)管理、部門資源管理、校級決策支撐等體系開展數(shù)據(jù)應用和服務。
關鍵詞:高職院校;數(shù)字化轉型;智慧校園;校本數(shù)據(jù)中心
中圖分類號:TP311? ? 文獻標識碼:A 文章編號:2096-4706(2021)17-0059-06
Abstract: Higher vocational education informatization requires higher vocational colleges to systematically build school-based data center, carry out data-driven smart campus construction and strengthen data application. In order to realize the functions of data exchange, data processing and data service, it is necessary to construct a complete framework, including data source, data infrastructure, data resource system, data management software system, data management standard system, which should be implemented step by step according to the process of planning preparation, construction implementation, problem checking and feedback optimization. Carry out data application and services around personal data management, department resource management, school level decision support and other systems.
Keywords: vocational college; digital transformation; smart campus; school-based data center
0? 引? 言
校本數(shù)據(jù)中心是高等職業(yè)院校智慧校園建設的核心組成部分,是提升學校治理能力、深化教育大數(shù)據(jù)應用、實施教育大資源共享的關鍵平臺,是開展智慧教育創(chuàng)新、構建智慧學習支持環(huán)境、推動高職院校數(shù)字化轉型的重要基礎設施。2020年9月,教育部等九部門聯(lián)合印發(fā)《職業(yè)教育提質(zhì)培優(yōu)行動計劃(2020—2023年)》,明確提出,要“推動各地研制校本數(shù)據(jù)中心建設指南,指導職業(yè)學校系統(tǒng)設計學校信息化整體解決方案”[1]。系統(tǒng)構建支撐智慧校園長期演進的校本數(shù)據(jù)中心,全面開展由數(shù)據(jù)驅(qū)動的智慧校園建設,加強數(shù)據(jù)應用和服務,已成為高職教育信息化和高職院校數(shù)字化轉型的重要任務。
1? 校本數(shù)據(jù)中心的建設要求、目標與原則
在不同的領域和場景中,數(shù)據(jù)中心有著不同的定義和內(nèi)涵。本文所指的校本數(shù)據(jù)中心是指在高職院校學校管理范圍內(nèi),由一系列軟件、服務和管理體系構成的,實現(xiàn)智慧校園總體框架中支撐平臺層數(shù)據(jù)交換、數(shù)據(jù)處理、數(shù)據(jù)服務等模塊功能[2],通過統(tǒng)一接口對外提供各類數(shù)據(jù)資源服務,并具備數(shù)據(jù)資源相關信息安全體系、技術規(guī)范與保障體系的數(shù)據(jù)支撐平臺。
1.1? 建設要求
目前,高職院校信息化建設從功能驅(qū)動向數(shù)據(jù)驅(qū)動轉換、從數(shù)字校園向智慧校園演進,在應用系統(tǒng)形態(tài)上也發(fā)生了架構性的變化。主要表現(xiàn)在:從大型復雜的MIS系統(tǒng)向流程化、移動化、平臺化的服務體系轉變;從面向部門管理的應用系統(tǒng)向面向師生提供高質(zhì)量、高體驗的流程化服務轉變;從主要面向部門內(nèi)部事務處理向?qū)崿F(xiàn)跨部門綜合服務轉變;從線下非實時審批流轉為主向高效、線上、近實時的審批流轉轉變;從事務性管理為主向包含態(tài)勢感知、大數(shù)據(jù)分析和輔助決策的綜合管理轉變。
應用系統(tǒng)形態(tài)上改變對校本數(shù)據(jù)體系提出了更高的要求,主要表現(xiàn)在:數(shù)據(jù)標準要格式規(guī)范、代碼標準、全局一致;數(shù)據(jù)維度要全、信息覆蓋面要廣;數(shù)據(jù)內(nèi)容要質(zhì)量高、內(nèi)容完整準確;數(shù)據(jù)服務要具備多種手段、適應多種應用體系;數(shù)據(jù)服務過程中要滿足信息安全的要求,做到事前可管、事中可控、事后可查;數(shù)據(jù)管理要做到“一數(shù)一源”,滿足數(shù)據(jù)資源可視可查可管的要求。
1.2? 建設目標
為實現(xiàn)以上要求,校本數(shù)據(jù)中心應以建成體系健全、內(nèi)容和維度完整、數(shù)據(jù)規(guī)范可信、平臺安全可靠的新一代數(shù)據(jù)支撐平臺為目標,采用完善的支撐軟件、數(shù)據(jù)治理服務和數(shù)據(jù)管理體系對學校擁有的數(shù)據(jù)資源進行有效管理、維護、更新和服務,打破數(shù)據(jù)孤島,實現(xiàn)校本數(shù)據(jù)的一數(shù)一源、伴隨式數(shù)據(jù)采集和分級分層有效共享[3],從而增強學校治理能力、優(yōu)化教學實訓管理,提升校園師生服務,促進科學決策支持。具體目標包括:
(1)建成全域數(shù)據(jù)中心。通過全維度的數(shù)據(jù)采集、集中和治理,使校本數(shù)據(jù)滿足表達規(guī)范、內(nèi)容準確、維度完整的要求,形成標準統(tǒng)一、分類清晰、質(zhì)量可信的數(shù)據(jù)倉庫和數(shù)據(jù)集市。
(2)建成全生命周期管理數(shù)據(jù)軟件體系。通過軟件體系實現(xiàn)對校本數(shù)據(jù)資源的全生命周期管理,涵蓋數(shù)據(jù)采集、數(shù)據(jù)倉庫管理、數(shù)據(jù)接口開放、數(shù)據(jù)資源發(fā)布、服務狀態(tài)呈現(xiàn)等功能。
(3)為全業(yè)務場景提供數(shù)據(jù)服務。提供多類型的統(tǒng)一數(shù)據(jù)接口,為學校教學實訓、管理與服務的全業(yè)務場景,和面向國家管理平臺的數(shù)據(jù)上報提供數(shù)據(jù)服務。
1.3? 建設原則
校本數(shù)據(jù)中心的建設應遵循以下原則:
(1)統(tǒng)籌規(guī)劃,分步實施。應遵循國家有關數(shù)據(jù)管理的法律法規(guī)和技術規(guī)范,在學校信息化建設頂層設計和總體框架下,兼顧已有信息系統(tǒng)和數(shù)據(jù)平臺現(xiàn)狀,統(tǒng)籌規(guī)劃開展校本數(shù)據(jù)中心的建設、使用和管理。建設應以規(guī)劃目標為導向、以業(yè)務需求為驅(qū)動,按照“基礎先行、急用先行”的策略,制定科學合理的實現(xiàn)路徑和建設計劃,分步驟實施。
(2)平臺開放、適度超前。應充分考慮校本數(shù)據(jù)中心平臺的開放性,保證多系統(tǒng)、多廠家環(huán)境下的系統(tǒng)對接和數(shù)據(jù)共享。應選擇成熟主流的體系架構和技術路線,適度超前,保證良好的可演進性和可擴展性。同等功能條件下,優(yōu)先選擇國產(chǎn)技術或開源技術構建校本數(shù)據(jù)中心。
(3)分權使用,確保安全。應按照“誰產(chǎn)生、誰管理、誰負責”的數(shù)據(jù)管理原則,在數(shù)據(jù)物理集中和邏輯聚合的基礎上,對數(shù)據(jù)的敏感性、機密性進行分級管理。對于公共數(shù)據(jù)的使用,由數(shù)據(jù)管理部門根據(jù)業(yè)務和軟件功能需求進行常規(guī)管理;對于涉及個人隱私、管理秘密的數(shù)據(jù)使用,由數(shù)據(jù)源頭部門授權,并設置健全的審核確認流程,保障數(shù)據(jù)調(diào)用過程的信息安全。
2? 校本數(shù)據(jù)中心的構成
2.1? 總體架構
校本數(shù)據(jù)中心具體包括數(shù)據(jù)源、數(shù)據(jù)基礎架構、數(shù)據(jù)資源體系、數(shù)據(jù)管理軟件體系、數(shù)據(jù)管理規(guī)范制度體系等組成部分,總體架構詳如圖1所示。
在總體架構中,數(shù)據(jù)資源體系是校本數(shù)據(jù)中心的核心,由數(shù)據(jù)源通過數(shù)據(jù)采集提供數(shù)據(jù)供給,由數(shù)據(jù)基礎架構提供數(shù)據(jù)資源的承載。在數(shù)據(jù)資源體系中,采集的數(shù)據(jù)進入數(shù)據(jù)湖,通過清洗集成,根據(jù)校級數(shù)據(jù)標準建模形成標準化數(shù)據(jù)倉庫,再通過關聯(lián)、聚合和計算形成各類數(shù)據(jù)集市。數(shù)據(jù)管理軟件體系和數(shù)據(jù)管理規(guī)范制度體系分別為校本數(shù)據(jù)中心提供管理運維的支撐和制度保障。校本數(shù)據(jù)中心通過統(tǒng)一數(shù)據(jù)接口為智慧校園應用體系提供數(shù)據(jù)服務。
2.2? 各部分構成
2.2.1? 數(shù)據(jù)源
數(shù)據(jù)源指數(shù)據(jù)的來源,包括管理信息系統(tǒng)、電子表格文件、一般文檔、IT設備、物聯(lián)網(wǎng)系統(tǒng)、互聯(lián)網(wǎng)等。
2.2.2? 數(shù)據(jù)基礎架構
數(shù)據(jù)基礎架構指承載數(shù)據(jù)資源的底層技術,包括關系型數(shù)據(jù)庫、大數(shù)據(jù)集群、非關系型數(shù)據(jù)庫等。
關系型數(shù)據(jù)庫承載著目前核心的數(shù)據(jù)資源。數(shù)據(jù)內(nèi)容主要包括:來自管理信息系統(tǒng)的結構化數(shù)據(jù)、來自線下電子表格的結構化數(shù)據(jù)、標準化數(shù)據(jù)倉庫中各主題下的數(shù)據(jù)、基于海量日志計算結果集生成的小體量數(shù)據(jù)、統(tǒng)計計算生成的匯總聚合數(shù)據(jù)和指標數(shù)據(jù)、以拉鏈表形式存儲的歷史數(shù)據(jù)等。
大數(shù)據(jù)集群承載著用于大量可用于輔助決策分析的數(shù)據(jù),其數(shù)據(jù)量正在迅速增長。數(shù)據(jù)內(nèi)容主要包括:來自管理信息系統(tǒng)的大體量結構化數(shù)據(jù)、來自物聯(lián)網(wǎng)系統(tǒng)的大體量數(shù)據(jù)、來自IT設備的網(wǎng)絡日志、來自互聯(lián)網(wǎng)的WEB捕獲數(shù)據(jù)等。
非關系型數(shù)據(jù)庫的數(shù)據(jù)內(nèi)容主要是互聯(lián)網(wǎng)爬取的數(shù)據(jù),如論文、科研成果、專業(yè)文獻等。
2.2.3? 數(shù)據(jù)資源體系
數(shù)據(jù)資源與各個智慧校園應用系統(tǒng)對接,支持各種數(shù)據(jù)應用和分析的運行,通常以數(shù)據(jù)倉庫的形式實現(xiàn)。數(shù)據(jù)資源體系一般包括數(shù)據(jù)湖層、標準化數(shù)據(jù)倉庫層和數(shù)據(jù)集市層。
數(shù)據(jù)湖層實現(xiàn)在數(shù)據(jù)基礎架構中各數(shù)據(jù)源原始數(shù)據(jù)的全量副本集中。通過將所有異構、不同實例的原始數(shù)據(jù)存儲到同一架構、同一實例的數(shù)據(jù)庫中,并進行集中治理,實現(xiàn)數(shù)據(jù)的同構化、同實例化操作。
標準化數(shù)據(jù)倉庫層以校本數(shù)據(jù)標準作為數(shù)據(jù)模型定義,以范式建模為主,實現(xiàn)對數(shù)據(jù)湖層原始數(shù)據(jù)副本的清洗、整合和轉換,實現(xiàn)與數(shù)據(jù)模型匹配的標準化數(shù)據(jù)的形成,實現(xiàn)按照主題進行分類、分子類的存儲操作。
數(shù)據(jù)集市層實現(xiàn)與應用系統(tǒng)的數(shù)據(jù)對接,支持從標準化數(shù)據(jù)倉庫中摘選合適的數(shù)據(jù)內(nèi)容,在必要的預處理后,形成針對特定應用系統(tǒng)的數(shù)據(jù)資源集合,并以適當?shù)慕涌谛问较驊孟到y(tǒng)供應數(shù)據(jù)。根據(jù)數(shù)據(jù)結構特征和服務場景的不同,可分成3種數(shù)據(jù)集市:面向OLTP業(yè)務的數(shù)據(jù)集市,為事務類軟件服務提供數(shù)據(jù)支持;面向OLAP的數(shù)據(jù)集市,為分析類軟件服務提供數(shù)據(jù)支持;面向統(tǒng)計的數(shù)據(jù)集市,為報表類軟件服務提供數(shù)據(jù)支持。
2.2.4? 數(shù)據(jù)管理軟件體系
數(shù)據(jù)管理軟件一般包括:
(1)數(shù)據(jù)采集工具:支持業(yè)務數(shù)據(jù)集成、離線數(shù)據(jù)集成、機器數(shù)據(jù)集成等功能,實現(xiàn)數(shù)據(jù)采集管理。
(2)數(shù)據(jù)開發(fā)工具:提供計算任務管理和調(diào)度管理,支持數(shù)據(jù)建模、數(shù)據(jù)集成、腳本開發(fā)、工作流編排等功能,實現(xiàn)數(shù)據(jù)開發(fā)管理。
(3)元數(shù)據(jù)管理軟件:支持元數(shù)據(jù)采集、元數(shù)據(jù)識別、元數(shù)據(jù)分類、元數(shù)據(jù)展示、元數(shù)據(jù)應用、元數(shù)據(jù)搜索等功能,實現(xiàn)元數(shù)據(jù)管理。
(4)主數(shù)據(jù)管理軟件:支持主數(shù)據(jù)存儲與整合、主數(shù)據(jù)管理、主數(shù)據(jù)分析、主數(shù)據(jù)分發(fā)與共享等功能,實現(xiàn)主數(shù)據(jù)管理。
(5)數(shù)據(jù)質(zhì)量管理軟件:支持質(zhì)量需求管理、規(guī)則設置、規(guī)則校驗、任務管理、監(jiān)控分析、質(zhì)量報警、報告生成等功能,實現(xiàn)數(shù)據(jù)質(zhì)量管理。
(6)數(shù)據(jù)標準管理軟件:支持標準生成、標準映射、變更查詢、映射查詢、維護標準、標準版本查詢、標準導出、標準文檔管理等功能,實現(xiàn)數(shù)據(jù)標準管理。
(7)數(shù)據(jù)模型管理軟件:支持數(shù)據(jù)模型設計、模型差異稽核、數(shù)據(jù)模型變更管控、模型可視化等功能,實現(xiàn)數(shù)據(jù)模型管理。
(8)數(shù)據(jù)開放管理軟件:支持API接口服務、數(shù)據(jù)庫連接服務、離線數(shù)據(jù)下載服務、數(shù)據(jù)安全管控等功能,實現(xiàn)數(shù)據(jù)開放管理。
(9)數(shù)據(jù)運維監(jiān)控軟件:支持數(shù)據(jù)使用審計、任務監(jiān)控、告警管理等功能,實現(xiàn)數(shù)據(jù)運維監(jiān)控。
(10)數(shù)據(jù)可視化軟件:支持圖表管理、看板管理、用戶設置等功能,實現(xiàn)數(shù)據(jù)可視化管理。
(11)報表生成和管理工具:支持表單設計、權限管理等功能,實現(xiàn)報表生成和管理。
2.2.5? 數(shù)據(jù)管理規(guī)范制度體系
數(shù)據(jù)管理規(guī)范制度體系一般包括:
(1)數(shù)據(jù)安全管理規(guī)范:保證數(shù)據(jù)被合法合規(guī)、安全可靠地采集、傳輸、存儲和使用。
(2)數(shù)據(jù)質(zhì)量管理規(guī)范:保證校本數(shù)據(jù)表達的一致性、有效性和適用性。
(3)數(shù)據(jù)共享管理規(guī)范:規(guī)范數(shù)據(jù)資源的交換與共享,實現(xiàn)數(shù)據(jù)資源優(yōu)化配置和增值利用。
(4)數(shù)據(jù)采集與存儲管理規(guī)范:實現(xiàn)管理信息系統(tǒng)數(shù)據(jù)的規(guī)范采集、公共數(shù)據(jù)資源的集中存儲和統(tǒng)一管理。
3? 校本數(shù)據(jù)中心的建設流程
3.1? 總體建設流程
校本數(shù)據(jù)中心的總體建設流程包括籌劃準備階段、建設執(zhí)行階段、問題檢查階段和反饋優(yōu)化階段,形成建設閉環(huán)實現(xiàn)分期實施和迭代優(yōu)化。建設流程和各階段主要工作任務如圖2所示。
各階段應針對每個單獨的數(shù)據(jù)內(nèi)容進行微循環(huán)。針對每個數(shù)據(jù)項,從采集階段即關注其來源的合理性、內(nèi)容的完整性、質(zhì)量的規(guī)范性、與數(shù)據(jù)標準的匹配性,并按計劃進行指標的試算,發(fā)現(xiàn)問題時快速反饋、快速整改、快速解決。
3.2? 籌劃準備階段
該階段的主要工作有:
(1)工作目標確定。從需支持的數(shù)據(jù)報表、應用、流程和用戶角色等多維度細化工作目標,并針對每種目標進行分解,確定對應的數(shù)據(jù)內(nèi)容。
(2)工作邊界確定。以匹配目標為原則確定數(shù)據(jù)采集范圍,根據(jù)數(shù)據(jù)采集的內(nèi)容和類型確定采集工具,根據(jù)數(shù)據(jù)管理的要求確定數(shù)據(jù)管理軟件,基于數(shù)據(jù)采集的類型和體量確定數(shù)據(jù)基礎架構。
(3)工作計劃確定。根據(jù)項目工作量和重難點,結合學校全局工作規(guī)劃和資源保障情況,設置科學合理的建設周期和階段劃分,并完成詳細的工作計劃分解。
(4)資源準備。根據(jù)數(shù)據(jù)軟件和數(shù)據(jù)基礎架構的運行需求,準備項目所需IT類資源和數(shù)據(jù)治理相關知識性資源。
(5)組織機構準備。根據(jù)工作邊界、工作難度、專業(yè)性要求、職能邊界等因素,明確建設責任部門和負責人,并組建跨部門的建設團隊。根據(jù)數(shù)據(jù)的歸屬或來源明確部門分工,建立溝通協(xié)調(diào)機制。
(6)制度準備。逐步建立數(shù)據(jù)資源管理相關制度,為校本數(shù)據(jù)中心的長期可持續(xù)運營提供制度保障。
3.3? 建設執(zhí)行階段
該階段的主要工作有:
(1)組織管理與數(shù)據(jù)調(diào)研。學校層面開展以組織管理為主的調(diào)研。業(yè)務部門層面開展以業(yè)務邏輯、數(shù)據(jù)供需關系和交換共享要求為主的調(diào)研。業(yè)務系統(tǒng)層面開展以原始數(shù)據(jù)來源、質(zhì)量和結構,及業(yè)務系統(tǒng)功能和使用情況為主的調(diào)研。
(2)數(shù)據(jù)標準制定。依據(jù)上級標準,結合學校已有合格標準,考慮兼容性、一致性和可擴展性,以匹配本校業(yè)務管理特性為原則制定校本數(shù)據(jù)標準。確定數(shù)據(jù)子集分類方式和編碼規(guī)范,落實數(shù)據(jù)和編碼權威來源,明確業(yè)務邊界與數(shù)據(jù)標準范圍對應關系。
(3)軟件工具部署。根據(jù)不同項目的需求配置,部署相關軟件及功能模塊。原則上應盡量配置完整的數(shù)據(jù)管理軟件體系。
(4)數(shù)據(jù)識別、采集與質(zhì)量檢查。從數(shù)據(jù)源中識別目標數(shù)據(jù)所在的庫、表、字段、格式等,利用數(shù)據(jù)采集軟件進行采集。制定數(shù)據(jù)質(zhì)量規(guī)則并綁定到每個字段,識別不符合質(zhì)量規(guī)則的數(shù)據(jù),形成數(shù)據(jù)質(zhì)量報告用于評估數(shù)據(jù)質(zhì)量狀況、定位有問題的數(shù)據(jù)指導數(shù)據(jù)質(zhì)量提升。
(5)數(shù)據(jù)質(zhì)量提升。對于代碼集定義、表達格式、數(shù)據(jù)單位不一致等結構性質(zhì)量問題,通過批量、規(guī)則化處理轉換成符合標準的數(shù)據(jù)。對于數(shù)據(jù)缺失、內(nèi)容錯誤等難以通過簡單批量轉換修復的內(nèi)容性質(zhì)量問題,由數(shù)據(jù)對應的責任部門進行核實、采集、重新填報后形成有效數(shù)據(jù)。
(6)數(shù)據(jù)倉庫建模、數(shù)據(jù)生成與封裝發(fā)布。根據(jù)校本數(shù)據(jù)標準對標準化數(shù)據(jù)倉庫進行分類、建模,形成表結構。將各種清洗轉換完成、符合數(shù)據(jù)標準的數(shù)據(jù)導入到表結構中,形成質(zhì)量達標的成果數(shù)據(jù),即可用的數(shù)據(jù)倉庫。成果數(shù)據(jù)由數(shù)據(jù)倉庫管理系統(tǒng)進行存儲,并通過API接口、數(shù)據(jù)庫訪問、表格文件、ETL接口等方式向各應用系統(tǒng)、數(shù)據(jù)使用部門提供數(shù)據(jù)調(diào)用和數(shù)據(jù)共享交換服務。
(7)數(shù)據(jù)集定制。在深度理解校本業(yè)務數(shù)據(jù)邏輯的基礎上,定制數(shù)據(jù)集作為支撐全校流程服務,數(shù)據(jù)調(diào)用、交換和共享,大數(shù)據(jù)分析輔助決策等事務的基礎集。
3.4? 問題檢查階段
該階段的主要工作有:
(1)數(shù)據(jù)內(nèi)容缺失檢查。數(shù)據(jù)采集治理過程中動態(tài)檢查數(shù)據(jù)內(nèi)容。包括計劃采集數(shù)據(jù)是否入庫、已采集數(shù)據(jù)內(nèi)容與計劃是否一致、數(shù)據(jù)內(nèi)容是否有效完整等。
(2)數(shù)據(jù)一致性檢查。數(shù)據(jù)采集治理過程中動態(tài)檢查數(shù)據(jù)集(尤其是來自不同部門的數(shù)據(jù))間的內(nèi)容一致性。如不同系統(tǒng)中學號與姓名的對應關系是否一致等。
(3)數(shù)據(jù)質(zhì)量問題檢查。數(shù)據(jù)采集治理過程中動態(tài)檢查數(shù)據(jù)集質(zhì)量。常見問題有重要數(shù)據(jù)缺失、數(shù)據(jù)表達錯誤等。
(4)數(shù)據(jù)指標準確性檢查。數(shù)據(jù)內(nèi)容基本齊備后,應設置數(shù)據(jù)指標并進行計算,計算結果與其他途徑的指標結果(如部門的手工統(tǒng)計結果等)進行比對,驗證指標計算的正確性和精確度。
(5)數(shù)據(jù)標準有效性檢查。數(shù)據(jù)采集治理過程中動態(tài)檢查校本數(shù)據(jù)標準的有效性。常見問題有標準元數(shù)據(jù)中存在“同名不同義”“同義不同名”的元數(shù)據(jù)定義;數(shù)據(jù)模型中存在標準元數(shù)據(jù)集合之外的“游離”元數(shù)據(jù)項;數(shù)據(jù)模型與實際業(yè)務邏輯不兼容,無法正確或完整反映業(yè)務過程等。
3.5? 反饋優(yōu)化階段
該階段的主要工作有:
(1)補充調(diào)整數(shù)據(jù)采集范圍。當出現(xiàn)重要數(shù)據(jù)內(nèi)容批量缺失、重要數(shù)據(jù)間一致性問題嚴重等情況時,應對數(shù)據(jù)進行溯源,落實數(shù)據(jù)采集的來源是否合理,必要時補充采集新的數(shù)據(jù),或調(diào)整采集的來源部門、系統(tǒng)替換原有數(shù)據(jù)。
(2)數(shù)據(jù)質(zhì)量反饋和提升。數(shù)據(jù)產(chǎn)生時就存在較大質(zhì)量問題時,應由數(shù)據(jù)來源部門負責解決。常見問題及解決方案有:
1)業(yè)務系統(tǒng)功能未啟動導致數(shù)據(jù)線下保存而未記錄到系統(tǒng)數(shù)據(jù)庫??蓪㈦娮颖砀駭?shù)據(jù)或紙質(zhì)文件數(shù)據(jù)補采進數(shù)據(jù)湖中作為補充數(shù)據(jù)資源。
2)數(shù)據(jù)錄入格式不規(guī)范導致難以識別;業(yè)務系統(tǒng)設計不完善導致無法記錄必要數(shù)據(jù)項;組織架構或工作流程銜接不合理,導致業(yè)務流轉不正常或相關業(yè)務未能正常開展??赏晟啤⑸壭畔⑾到y(tǒng),優(yōu)化調(diào)整工作流程、組織架構。
3)指標數(shù)據(jù)計算準確性問題。分析業(yè)務部門線下指標與校本數(shù)據(jù)中心設定指標在計算方式、統(tǒng)計口徑、篩選條件等的一致性,確定正確的參數(shù)和計算邏輯。
4)數(shù)據(jù)質(zhì)量導致的指標計算出錯問題,如重要字段無有效數(shù)據(jù)、數(shù)據(jù)中存在非法字符、數(shù)據(jù)表達不一致。應對相應工作模塊返工重新開展數(shù)據(jù)治理。
(3)根據(jù)數(shù)據(jù)治理的問題分析,對業(yè)務系統(tǒng)升級優(yōu)化替換、工作流程優(yōu)化、組織架構優(yōu)化等提出優(yōu)化建議。
4? 校本數(shù)據(jù)中心的基礎應用
4.1? 數(shù)據(jù)應用體系
校本數(shù)據(jù)中心實現(xiàn)數(shù)據(jù)的集中治理、管理和共享,并通過與智慧校園應用體系的對接充分發(fā)揮數(shù)據(jù)價值。按照數(shù)據(jù)服務對象主體的不同,可將數(shù)據(jù)應用分為個人數(shù)據(jù)管理、部門資源管理和校級決策支撐等三類。
個人數(shù)據(jù)管理主要包括個人數(shù)據(jù)匯總展示、個人數(shù)據(jù)糾錯補錄、面向個人的數(shù)據(jù)報告等。
部門資源管理主要包括面向職能部門和二級學院的各種應用,包括數(shù)據(jù)填報、部門和學院專題數(shù)據(jù)分析、數(shù)據(jù)報表,以及各種智慧校園應用等。
校級決策支撐主要面向領導層和發(fā)展規(guī)劃部門提供大數(shù)據(jù)輔助決策,包括內(nèi)部質(zhì)量管理、校級綜合報表、領導駕駛艙、綜合校情分析等。
校本數(shù)據(jù)中心常用的基礎數(shù)據(jù)應用包括一表通數(shù)據(jù)填報、智慧校園應用開發(fā)數(shù)據(jù)服務和大數(shù)據(jù)輔助決策等。
4.2? 基礎數(shù)據(jù)應用
4.2.1? 一表通數(shù)據(jù)填報
解決學校各類數(shù)據(jù)重復填報、內(nèi)容不一致的問題,實現(xiàn) “一次填報、全網(wǎng)共享”的一表通數(shù)據(jù)填報[4]。通過基礎數(shù)據(jù)自動補全和模板化、定制化、自動化的表單功能,實現(xiàn)快速便捷的多業(yè)務場景表單填報和信息收集。通過為廣大師生提供數(shù)據(jù)自動糾錯、填補和補錄通知等功能逐步提高數(shù)據(jù)質(zhì)量。系統(tǒng)界面如圖3所示。
4.2.2? 智慧校園應用開發(fā)數(shù)據(jù)服務
為辦公辦事、教學實訓、校園服務、管理應用和便捷工具等各類業(yè)務系統(tǒng)、微應用和微服務提供統(tǒng)一的應用開發(fā)數(shù)據(jù)服務。明確校本數(shù)據(jù)的資源目錄、共享規(guī)范和審核制度,明確信息系統(tǒng)的技術框架、數(shù)據(jù)規(guī)范和接口標準,推動智慧校園的統(tǒng)一開發(fā)管理。典型應用包括部門數(shù)據(jù)中心、個人數(shù)據(jù)中心,如圖4、圖5所示。
4.2.3? 大數(shù)據(jù)輔助決策
開展大數(shù)據(jù)分析和挖掘提供大數(shù)據(jù)輔助決策。通過學校、專業(yè)(群)、課程、教師和學生等五個層面的數(shù)據(jù)畫像和對比分析,圍繞學校內(nèi)部質(zhì)量體系進行指標的多維度動態(tài)量化跟蹤和評估,實現(xiàn)各層面的“一頁紙”診斷報告和指標預警[5]。針對不同專題開展大數(shù)據(jù)應用,實現(xiàn)學生安全、學生就業(yè)、學校發(fā)展等大數(shù)據(jù)綜合分析和預警。內(nèi)部質(zhì)量體系管理系統(tǒng)界面如圖6所示。
5? 結? 論
校本數(shù)據(jù)中心建設的重點在于形成合理、穩(wěn)定的體系架構,按照規(guī)范流程定期開展數(shù)據(jù)治理持續(xù)提升數(shù)據(jù)質(zhì)量,通過豐富的數(shù)據(jù)應用提升學校教學、管理和服務的效能。通過逐步完善、長期演進,依托校本數(shù)據(jù)中心形成“數(shù)據(jù)驅(qū)動”的智慧校園建設模式和決策機制。
參考文獻:
[1] 中華人民共和國教育部.教育部等九部門關于印發(fā)《職業(yè)教育提質(zhì)培優(yōu)行動計劃(2020—2023年)》的通知(教職成〔2020〕7號) [EB/OL].(2020-9-23).http://www.moe.gov.cn/srcsite/A07/zcs_zhgg/202009/t20200929_492299.html?from= timeline.
[2]. 全國信息技術標準化技術委員會(SAC/TC 28).智慧校園總體框架:GB/T-36342-2018 [S].北京:中國標準出版社,2018.
[3] 中華人民共和國教育部.教育部關于印發(fā)《教育信息化2.0行動計劃》的通知(教技〔2018〕6號) [R/OL].(2018-4-18).http://www.moe.gov.cn/srcsite/A16/s3342/201804/t20180425_334188.html.
[4] 李引,陳敏鋒.高校數(shù)據(jù)中心生態(tài)的研究與應用 [J].現(xiàn)代信息科技,2020,4(19):99-103+108.
[5] 王愛紅.高職院校質(zhì)量保證體系診改數(shù)據(jù)平臺建設的探索 [J].現(xiàn)代職業(yè)教育,2019(20):64-65.
作者簡介:何磊(1978—),男,漢族,河南駐馬店人,高級工程師,碩士,研究方向:教育信息化;龐欽(1987—),男,漢族,廣西欽州人,高級工程師,本科,研究方向:大數(shù)據(jù)技術;萬暢(1976—),女,漢族,四川渠縣人,副教授,碩士,研究方向:大數(shù)據(jù)技術。