羅永星 楊帆(通訊作者) 胡巨波 重慶市教育信息技術與裝備中心
近幾年,國家強調教育智能化建設,大力推進智能教育,隨著智能教學教研設備的逐漸裝備,數(shù)據(jù)采集的方式和內容都發(fā)生了重大的變化。但現(xiàn)在的系統(tǒng)開發(fā)、數(shù)據(jù)設計管理模式還不能完全適應這種變化,主要體現(xiàn)在對數(shù)據(jù)的統(tǒng)一性、完整性和時序性不能進行有效的管理和應用,不能形成真正有用的大數(shù)據(jù)為決策服務。例如,教師、學生、家長的身份信息和生產數(shù)據(jù)存在于不同的應用系統(tǒng)中,由于各個應用系統(tǒng)都有自己的身份管理體系,所有的生產數(shù)據(jù)都封裝在獨自的應用體系里,使得業(yè)務數(shù)據(jù)無法進行統(tǒng)一歸檔,這就導致數(shù)據(jù)孤島越來越多。
因此,需要建立一個能夠關聯(lián)各個應用的身份管理體系,為各個應用建立起數(shù)據(jù)交換的橋梁,既實現(xiàn)數(shù)據(jù)身份的多因子聚合,又實現(xiàn)應用數(shù)據(jù)的輸出與管理。
1.建立身份中臺,搭建數(shù)據(jù)關聯(lián)的橋梁
身份中臺是對應用和訪問數(shù)據(jù)的組織、訪問者的身份與角色等提供統(tǒng)一認證、授權服務。在實際運用中,需要對數(shù)據(jù)對象構建統(tǒng)一關聯(lián)標識(包括人、物),通過統(tǒng)一的身份ID構建起來自不同應用的多因子身份關系數(shù)據(jù)的訪問橋梁,再通過統(tǒng)一的身份ID,實現(xiàn)應用數(shù)據(jù)的關聯(lián)與共享,以適應不同應用場景的身份標識聚合,最終構建起基于時間、位置、生產者、數(shù)據(jù)對象的管理與服務模式。
2.建立數(shù)據(jù)中臺,實現(xiàn)教育數(shù)據(jù)的顆粒管理
數(shù)據(jù)中臺通過身份中臺從業(yè)務系統(tǒng)中采集業(yè)務數(shù)據(jù),對數(shù)據(jù)按照數(shù)據(jù)標準字典進行數(shù)據(jù)清洗,然后對數(shù)據(jù)進行標簽化處理,最終實現(xiàn)對數(shù)據(jù)的顆?;芾?,形成服務于應用和大數(shù)據(jù)分析的標準數(shù)據(jù)倉庫,通過建立基于應用及對象的標準數(shù)據(jù)接口API和算法引擎,為數(shù)據(jù)共享、數(shù)據(jù)分析提供全方位服務。
3.以標準為基礎,構建數(shù)據(jù)連接池
建立數(shù)據(jù)中臺,除了數(shù)據(jù)身份的統(tǒng)一外,其關鍵是數(shù)據(jù)交換安全。數(shù)據(jù)連接池就是在數(shù)據(jù)倉庫和數(shù)據(jù)應用之間構建一個緩沖層來為數(shù)據(jù)提供安全保障。數(shù)據(jù)清洗確權都在連接池中完成,接口API和算法引擎通過數(shù)據(jù)連接池實現(xiàn)數(shù)據(jù)的交換。
4.規(guī)范應用授權,開放數(shù)據(jù)接口
使用“三重授權原則”,即“管理授權+平臺授權+用戶授權”的模式,開放身份接口和數(shù)據(jù)接口。身份中臺和數(shù)據(jù)中臺在授權機制協(xié)調下將請求數(shù)據(jù)通過Open API將數(shù)據(jù)推送到連接池,應用系統(tǒng)則通過Private API將生產數(shù)據(jù)推送到數(shù)據(jù)連接池,從而實現(xiàn)數(shù)據(jù)交換。
1.總體架構
教育數(shù)據(jù)中臺整體方案框架包括身份中臺和數(shù)據(jù)中臺兩個部分。其中,身份中臺匯聚各應用的身份信息,為各種應用建立起身份關聯(lián)關系,為其后的應用建設和服務升級提供統(tǒng)一的身份認證服務和授權服務。而數(shù)據(jù)中臺是基于身份中臺實現(xiàn)區(qū)域內各系統(tǒng)的業(yè)務數(shù)據(jù)的整合與應用,為各應用提供統(tǒng)一的業(yè)務數(shù)據(jù)交換服務,減少應用數(shù)據(jù)對接的難度,提升數(shù)據(jù)使用價值,為數(shù)據(jù)分析和數(shù)據(jù)可視化展示提供方便。雙中臺總體架構如圖1所示。
2.身份中臺的基本框架
身份中臺由前臺、中臺、后臺三部分構成。
(1)身份中臺的前臺應用
通過身份中臺的前臺管理應用實現(xiàn)區(qū)縣-學校二級分級分權的角色管理,將身份中臺身份庫的基本管理功能下放到每所學校和機構,由學校/機構的管理員維護和管理自己學校/機構的人員、組織等身份的基本信息和角色劃分。
(2)身份中臺的中臺應用
①基于教師、學生、組織等身份信息構建統(tǒng)一的身份庫,完成身份數(shù)據(jù)清洗以及身份數(shù)據(jù)標準的建設,并統(tǒng)一通過身份API接口服務向所有前臺應用提供身份服務以及統(tǒng)一認證、數(shù)據(jù)授權服務(和數(shù)據(jù)中臺聯(lián)動)。
②通過身份中臺的分級管理應用平臺,對教職工、學生、行政組織、崗位角色,學生和監(jiān)護人關系等身份信息進行區(qū)縣-學校/機構二級分級分權管理。
③通過身份中臺的自助管理平臺,使教職工、學生能夠自主完成自身身份信息的申請和維護。
④通過身份中臺對前臺其他業(yè)務系統(tǒng),如閱讀服務系統(tǒng),無線上網認證系統(tǒng),辦公OA、教職工管理、學生管理、教育教學、教研培訓等業(yè)務系統(tǒng)提供標準的身份API接口服務,用于支撐前臺業(yè)務系統(tǒng)的身份信息日常使用以及數(shù)據(jù)的共享和交換。
(3)身份中臺的身份源后臺
身份源后臺系統(tǒng)由三部分組成:
①現(xiàn)有身份文件導入(來自于現(xiàn)有的學生、教職工數(shù)據(jù),并進行身份數(shù)據(jù)清洗后完成數(shù)據(jù)導入)。
②對接中小學學籍系統(tǒng),實現(xiàn)定期或者自動的身份信息同步到身份中臺。
③對接教師管理系統(tǒng),學籍系統(tǒng)類似,實現(xiàn)定期或自動進行身份信息手工導入。
3.數(shù)據(jù)中臺的基本結構
數(shù)據(jù)中臺支持各類型數(shù)據(jù)的歸類管理(如設備數(shù)據(jù)、互聯(lián)網數(shù)據(jù)和校內業(yè)務系統(tǒng)數(shù)據(jù)等);提供可擴展的分布式大數(shù)據(jù)平臺存儲和計算資源,為海量數(shù)據(jù)的存儲和分析提供高效支撐;通過大數(shù)據(jù)分析和可視化應用,將數(shù)據(jù)進行直觀呈現(xiàn);提供監(jiān)管組件對應用數(shù)據(jù)進行管理監(jiān)控,保障數(shù)據(jù)中臺的穩(wěn)定性,形成一站式的數(shù)據(jù)服務,適應信息化建設與應用中的問題和挑戰(zhàn)。整體架構如下頁圖2所示。
圖2
(1)數(shù)據(jù)采集和建模(含數(shù)據(jù)倉庫)
數(shù)據(jù)建模模塊負責與外部系統(tǒng)進行數(shù)據(jù)交互,包含如下功能:①ODS層(Operation Data Store數(shù)據(jù)操作存儲層)支持外部結構化、非結構化數(shù)據(jù)的實時以及批量數(shù)據(jù)采集。②數(shù)據(jù)倉庫層對數(shù)據(jù)進行加工處理,按照指定模型存儲。③提供數(shù)據(jù)的南、北向共享交互接口,或者ETL。④提供ETL任務的調度監(jiān)控。
數(shù)據(jù)倉庫是為教育主管部門所需主題數(shù)據(jù)提供所有類型數(shù)據(jù)支持的戰(zhàn)略集合,是為了支撐分析性報告和決策支持而創(chuàng)建,具備分層存儲、面向主題、海量數(shù)據(jù)、匯總且可冗余、查詢性能優(yōu)先等功能。
(2)數(shù)據(jù)分析和運維管控
數(shù)據(jù)分析模塊提供數(shù)據(jù)計算引擎,包含流計算、批處理、數(shù)據(jù)挖掘、圖計算等數(shù)據(jù)處理分析能力,并提供高可靠、安全、容錯、易用的集群管理能力,支持集群的安裝部署、監(jiān)控、告警、用戶管理、權限管理、審計、服務管理、健康檢查、問題定位等功能。
(3)數(shù)據(jù)可視化應用系統(tǒng)
數(shù)據(jù)展示模塊用于展現(xiàn)數(shù)據(jù)分析結果,為讓展現(xiàn)更加直觀,使用了各類圖表(如二維表、交叉表、柱狀圖、餅狀圖、環(huán)圖、趨勢圖等)展現(xiàn)分析結果。
該模塊通過Web服務對外展現(xiàn)數(shù)據(jù),方便各類終端訪問。同時,嵌入了各種強大的統(tǒng)計功能:①通過報表編輯工具的搭配組合,如子報表、分組計算表、交叉表、數(shù)據(jù)過濾控制、全局變量控制等快速實現(xiàn)實時數(shù)據(jù)分析。②通過敏捷、可視化的操作,控制各種報表和參數(shù)編輯器。③通過多層次報表的擴展,除靜態(tài)展示報表外,還可以與查詢數(shù)據(jù)互動,實時分析、鉆取、提煉各種數(shù)據(jù)源。
(4)數(shù)據(jù)共享
數(shù)據(jù)共享模塊用于向外發(fā)布數(shù)據(jù)倉庫中的規(guī)范業(yè)務數(shù)據(jù)以及數(shù)據(jù)操作標準規(guī)范。通過數(shù)據(jù)共享實現(xiàn)以下功能:
①提升數(shù)據(jù)價值。通過數(shù)據(jù)共享,數(shù)據(jù)倉庫不僅用于支撐決策分析,還可以被各類信息系統(tǒng)使用。
②驅動業(yè)務系統(tǒng)持續(xù)優(yōu)化。通過數(shù)據(jù)共享,將數(shù)據(jù)倉庫的規(guī)范數(shù)據(jù)反饋給業(yè)務系統(tǒng),讓數(shù)據(jù)實現(xiàn)“業(yè)務系統(tǒng)→數(shù)據(jù)倉庫→業(yè)務系統(tǒng)”的循環(huán),驅動業(yè)務系統(tǒng)的完善與更新。
③業(yè)務系統(tǒng)聯(lián)動。數(shù)據(jù)共享不僅使數(shù)據(jù)倉庫與各業(yè)務系統(tǒng)間的數(shù)據(jù)互通,同時,也使業(yè)務流程實現(xiàn)聯(lián)動。
4.數(shù)據(jù)連接池的技術實現(xiàn)
數(shù)據(jù)連接池是保障數(shù)據(jù)存儲安全的一道防線,也是在應用數(shù)據(jù)交換過程中保證數(shù)據(jù)存儲規(guī)范的交換屏障。在身份中臺的確權下,各個應用系統(tǒng)通過數(shù)據(jù)連接池實現(xiàn)北向數(shù)據(jù)清洗和南向數(shù)據(jù)交換。它主要包含一個與核心數(shù)據(jù)庫同樣結構的中間庫、一個用于數(shù)據(jù)清洗的標準庫、一個API接口文件庫、一個記錄用戶操作的日志文件等四個部分。
5.API的管理、授權規(guī)范
由于每一個應用或用戶分配的數(shù)據(jù)使用和存儲權限都不相同,API接口管理就是解決因應用對接太多帶來的數(shù)據(jù)安全問題。
使用者通過應用對接進行自助申請、管理員審核,減少應用之間的溝通成本,快速推動業(yè)務落地,并對API接口實施有效管理。
API的管理與授權主要包括用戶信息管理接口、組織崗位管理接口、標簽信息管理接口、身份標準管理接口、角色數(shù)據(jù)使用接口等。為了應用規(guī)范,接口統(tǒng)一采用restful風格,并提供如token、http basic的安全驗證機制。用戶在應用數(shù)據(jù)時,針對獲取的數(shù)據(jù)進行使用授權。
①構建多級管理體系,補全用戶業(yè)務鏈。對區(qū)域內整個教師、學生、職工、管理員、所有中小學、機構、行政組織、監(jiān)護人等身份信息基于教育部標準以及區(qū)域實際情況進行身份數(shù)據(jù)的清洗、聚合,構建完成區(qū)域基礎教育身份庫和身份標準。②建立身份數(shù)據(jù)規(guī)范,保障中臺數(shù)據(jù)正確性。通過標準化的導入和系統(tǒng)聯(lián)動,將學籍系統(tǒng)、教師管理系統(tǒng)、辦公系統(tǒng)(釘釘)、上網實名認證系統(tǒng)等身份信息清洗和聚合流程做到規(guī)則化和自動化,保障后續(xù)身份庫維護的快捷和正確性,建立一套自動運行的身份源區(qū)域數(shù)據(jù)規(guī)范。③規(guī)范身份庫管理流程,多級協(xié)同共同維護?;趨^(qū)域基礎教育身份庫,為區(qū)教委、學校提供二級管理平臺,管理基礎教育身份標準,對教師、學生、學校、組織、崗位、角色等各類身份信息進行維護,建立區(qū)域基礎教育身份庫管理規(guī)范流程。④建立區(qū)域內接入統(tǒng)一認證,提供標準化認證方式。基于基礎教育身份庫,為上網認證系統(tǒng)、釘釘?shù)认到y(tǒng)提供標準化的統(tǒng)一認證方式,建立區(qū)域內應用統(tǒng)一認證接入流程。⑤身份信息自動同步,保障數(shù)據(jù)中臺信息實時性?;诨A教育身份庫,為上網認證系統(tǒng)提供基于教師、學生、管理員的自動身份同步服務,保障區(qū)域內新增、更新、歸檔賬號、組織、角色等身份信息的實時性和準確性。⑥沉淀用戶身份數(shù)據(jù),提升決策能力?;谏暇W認證系統(tǒng)、上網行為分析系統(tǒng),構建基于教委、學校的上網行為態(tài)勢感知主題報表,為學校和教委對網絡資源的使用情況和均衡決策提供客觀、具象化的判斷依據(jù)。
隨著現(xiàn)代信息技術、人工智能和大數(shù)據(jù)應用的迅猛發(fā)展,教育大數(shù)據(jù)正以全新方式驅動教育決策、學習方式、教學管理和評價體系的智能化,基于身份源教育數(shù)據(jù)中臺的發(fā)展和構建對未來智能教育的發(fā)展具有重要意義,為打造面向全用戶、全終端覆蓋、全場景支持的智慧校園生態(tài)奠定了基礎。