程晨 馬守明 周祎
摘? ?要:隨著教育信息化的不斷推進、教育教學改革的不斷深化,高校在教學活動中所形成和積累的具有保存價值的文字、圖表、音像等不同載體的教學檔案材料越來越多。高校教學檔案是體現(xiàn)學校教育質(zhì)量和管理水平的重要標志,是高校工作總結(jié)的重要內(nèi)容和制訂工作計劃的重要依據(jù)。在大數(shù)據(jù)信息化時代,這些教學檔案對改善教學管理、提升人才質(zhì)量有非常重要的作用,必須進行規(guī)范化管理,全面提升其利用率。
關(guān)鍵詞:教育信息化;教學檔案;大數(shù)據(jù)分布式處理技術(shù)
中圖分類號:G647.24 文獻標志碼:A 文章編號:1673-8454(2021)01-0043-03
隨著云計算技術(shù)的高速發(fā)展以及大數(shù)據(jù)時代的降臨,高校教學檔案的儲存和管理面臨著雙重的機遇和挑戰(zhàn)。高校的教學檔案是在實際教學運行中產(chǎn)生的動態(tài)性資料和載體,真實地還原了階段性的教學狀態(tài)并進一步反映出教學活動的實際效用。教學檔案不再僅囿于簡單的儲存和佐證功能,它日積月累了海量不同價值和不同類型的圖片、表格、印象等管理材料??梢哉f,教學檔案是高校日常進行教學年度總結(jié)、頂層設計下一階段教學計劃、持續(xù)改進教學管理效果、提升人才培養(yǎng)質(zhì)量的重要參考標準。如何對現(xiàn)已產(chǎn)生、預先對即將產(chǎn)生的教學檔案進行規(guī)范化、科學化、信息化管理,對其多維度縱深化全面提升利用效率,給很多高校的教學檔案管理人員提出了嚴峻的挑戰(zhàn)??梢哉f,從長遠來看,打通大范圍和多元種類的檔案信息資源互補與共享、 實行教學檔案的信息化是目前檔案管理的必然趨勢。
大數(shù)據(jù)(big data)是指無法在一定時間范圍內(nèi)用常規(guī)軟件工具進行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的,海量、高增長率和多樣化的信息資產(chǎn)。要實現(xiàn)大數(shù)據(jù)分析分布式計算,首先需要搭建分布式計算平臺,然后要建立一個分布式計算框架,在此框架下設計分布式計算模型,編寫分布式計算程序。[1]借助大數(shù)據(jù)分布式處理技術(shù),有利于從大量的教學檔案數(shù)據(jù)中挖掘出隱藏著的有特殊關(guān)系的信息,更全面、更深刻地了解和掌握高校教學的狀況,做出更準確的分析和決策,避免由于信息不完全造成的教學態(tài)勢誤判,從而促使高校提高教學水平。同時有利于高校教學檔案管理工作方式的轉(zhuǎn)變,促進教學檔案管理從以往側(cè)重記錄和保管轉(zhuǎn)變?yōu)榻虒W檔案的綜合高效利用,充分挖掘教學檔案的潛在價值。
一、大數(shù)據(jù)背景下的教學檔案一體化構(gòu)建面臨的多重困境
信息化檔案管理人員隊伍水平參差不齊,而教學檔案的有效管理和開發(fā)利用依托于管理人員的專業(yè)水平?,F(xiàn)如今許多高校的檔案管理人員多為教學秘書作為兼職人員,并不是專業(yè)的檔案管理出身。教學秘書的工作繁蕪多雜,疲于應付日常的教學管理活動。無論是從精力上還是專業(yè)素養(yǎng)方面,都與專業(yè)檔案人員存在相當大的差距。教學管理信息化對從業(yè)人員的檔案管理和計算機專業(yè)輔助能力都有相當高的要求。如果不是專業(yè)人員進行管理,那么教學檔案產(chǎn)生、維護、管理、更新、利用的全過程化環(huán)節(jié)都無法發(fā)揮檔案的最大效能;更容易出現(xiàn)收集不及時、材料遴選標準缺乏、儲存地方不規(guī)范、依賴于傳統(tǒng)紙質(zhì)檔案的管理困境。同時,我國尚未建立專業(yè)檔案職業(yè)資格認證制度,對于檔案從業(yè)人員缺乏統(tǒng)一的從業(yè)標準,也成為掣肘我國高校教學檔案信息化建設的因素之一。[2]
1.多數(shù)院校對檔案價值重要性認識不夠,教學檔案管理機制不健全
無論是從校級層面還是二級學院層面,均對教學檔案價值重要性認識不夠,簡單認為教學方案是教學運行后自然產(chǎn)生的必然資料,僅為上一階段教學環(huán)節(jié)的總結(jié),與整體教學環(huán)節(jié)的指導性和應用性關(guān)聯(lián)不大。從意識上不重視對現(xiàn)已產(chǎn)生的教學檔案深度利用和開發(fā)。一方面,學校雖然具備檔案館,但是收集的材料多種多樣,并非精細化專門化的教學檔案。學校檔案館傾向于按照年度收集各部門的已生成材料,涉及行政、人事、學工、教學、后勤等材料。材料多雜,但是對教學管理活動價值不大。沒有成立專門的教學檔案管理組織機構(gòu),更有許多高校為了迎接教學審核性評估,臨時成立教學檔案的檢查小組,對于檢查的內(nèi)容,不管是二三級目錄是否科學還是儲存材料是否具備價值,都難以做出專業(yè)判斷。另一方面,二級學院作為主要的教學單位,對教學檔案的管理缺乏行之有效歷久彌新的管理制度和管理辦法。普遍重視具體的日常教學活動和人才質(zhì)量的提升,對有價值的材料如何進行管理意識薄弱。但目前有的地方性高校成立不久,檔案的信息化才剛剛起步,信息化檔案的收集、整理責任制缺失,管理流程亟待進一步梳理,導致各部門各環(huán)節(jié)檔案信息資源混亂,形成了信息孤島,給檔案信息資源的開發(fā)利用帶來了進一步的困難。
2.硬件設施設備條件不足,教學檔案管理標準不統(tǒng)一
隨著互聯(lián)網(wǎng)技術(shù)的高速發(fā)展,傳統(tǒng)的紙質(zhì)檔案因需要大量專門的儲藏空間,或者因為地址變更,導致材料難以完整留存。除此之外, 因為例行教學檔案每學年都會產(chǎn)生,如何管理這些紙質(zhì)檔案,比如甄選、儲存、維護、收集等環(huán)節(jié)無不消耗大量人力。這就預示著紙質(zhì)檔案的管理方法逐漸會被數(shù)字化方法更迭,數(shù)字化信息化教學檔案管理趨勢即將到來。然而,目前高校教學檔案信息化建設中,硬件設備配備上存在不足,軟件基礎(chǔ)也十分薄弱,檔案信息化管理水平較低。[3]
當前,高校的電子檔案具有分散碎片化特征,沒有統(tǒng)一的管理標準。教學檔案的信息化對計算機硬件和網(wǎng)絡支撐有很高的要求,否則會難以保存。服務器資源共享建設速度慢,開發(fā)利用程度低。同時,電子檔案因存儲在計算機中,校內(nèi)師生在訪問和查詢的過程中,操作不當或者校園防火墻功能不足,很容易讓計算機遭遇病毒。給電子檔案信息安全帶來極大隱患。
二、基于大數(shù)據(jù)分布式處理技術(shù)的教學檔案的應用研究
1.教學檔案的應用版式
(1)設計教學檔案一體化目錄模型
教學信息目錄是教學檔案一體化的基礎(chǔ),可以將教學檔案分為綜合類、學科建設與實驗室建設類、招生類、學籍管理類、課堂教學與教學實踐類、學位管理類、畢業(yè)生管理類、教材管理類及附錄類。主要研究教學檔案一體化目錄的配置、組合、擴展、版本控制和應用等,支撐教學信息資源的標準化、規(guī)范化管理,為深化教學檔案應用提供基礎(chǔ)支撐。
(2)研究全覆蓋的教學檔案模型
以一體化目錄為依據(jù),以教師和學生為基礎(chǔ),以學校、二級學院、專業(yè)系等領(lǐng)域為支撐,研究教學檔案分類模型和面向不同領(lǐng)域的教學檔案分類模型,支持多級、多域的教學數(shù)據(jù)加工,最終形成全覆蓋的教學檔案。
(3)建立教學檔案一體化查詢報告應用服務
以驗證一體化教學檔案庫為目標,研究以不同主體在多領(lǐng)域、多層級等維度定義多種模版,支持按需配置和快速檢索,形成規(guī)范、統(tǒng)一的教學檔案查詢報告,滿足各類具體應用的多樣化需求。
2.教學檔案庫構(gòu)建設計
依據(jù)統(tǒng)一的教學檔案目錄標準,基于教學檔案基礎(chǔ)庫,按照不同檔案主體,構(gòu)建形成不同層級、不同領(lǐng)域的教學檔案數(shù)據(jù)庫。技術(shù)實現(xiàn)上,一體化教學檔案庫采用大數(shù)據(jù)分布式處理技術(shù),經(jīng)過抽取、處理、存儲,滿足一體化應用服務需要。
(1)教學檔案數(shù)據(jù)抽取
依據(jù)統(tǒng)一的教學檔案目錄標準,遵循統(tǒng)一的教學信息查詢規(guī)范,按照統(tǒng)一的教學信息報告格式,基于MapReduce構(gòu)建大數(shù)據(jù)的離線抽取處理框架。根據(jù)不同檔案主體、不同層級、不同領(lǐng)域,在任務調(diào)度器中,定義任務調(diào)度策略,減少系統(tǒng)瓶頸,將教學檔案目錄的數(shù)據(jù)抽取到對應的資源庫中。
(2)教學檔案數(shù)據(jù)處理
基于大數(shù)據(jù)并行計算框架以及流處理框架,采用并行批處理任務,構(gòu)建不同教學檔案主體,多層次、多維度的教學檔案主體標識生成算法,教學檔案數(shù)據(jù)關(guān)聯(lián)處理算法,快速構(gòu)建教學檔案庫。
(3)教學檔案數(shù)據(jù)存儲
按照不同教學檔案主體、不同領(lǐng)域及不同層級,分別構(gòu)建相應的分布式教學檔案數(shù)據(jù)庫,支持以SQL、NoSQL等多種方式進行數(shù)據(jù)的統(tǒng)一存儲和聯(lián)合查詢,支撐教學檔案高效存儲、高并發(fā)訪問需求。
3.教學檔案查詢報告模版設計
教學檔案查詢報告模版可以按照不同層級、不同領(lǐng)域進行靈活配置,既可配置使用統(tǒng)一的、通用的教學檔案查詢報告模版,可以配置不同教學檔案主體的報告模版,又可面向業(yè)務領(lǐng)域配置相應的教學檔案主體報告模版。同時校級單位可以管理院級及系級單位報告模版,同時支持跨域的模版管理,構(gòu)建專有的教學檔案查詢報告模版。
教學檔案查詢報告模版可以包括報告頭、報告主體、報告水印、報告結(jié)尾等信息,其中報告頭包括報告編號、報告時間、報告二維碼信息、報告有效期、報告標題、報告出具單位等內(nèi)容;報告結(jié)尾包括報告的聲明、報告說明等信息?;跇?gòu)建好的各種教學檔案庫及報告模版,教學檔案查詢報告可實時生成,文件為經(jīng)過統(tǒng)一數(shù)字簽名的 PDF 格式,文件按照統(tǒng)一的報告編號規(guī)則,基于分布式文件系統(tǒng)進行存儲。報告支持在線驗證功能,通過統(tǒng)一的報告編號、報告二維碼,可以實現(xiàn)報告真?zhèn)螌崟r在線驗證。
4.總體業(yè)務框架(見圖1)
(1)教學檔案庫目錄管理
主要包括目錄管理、目錄分類管理、目錄標簽管理及元數(shù)據(jù)管理。目錄管理提供教學檔案目錄編輯、修改、發(fā)布、排序、層級管理、統(tǒng)計分析、快速檢索等功能。目錄要素包括目錄編碼、目錄標識、共享屬性、開放屬性、目錄描述、目錄所屬分類等。目錄分類管理主要包括新增、刪除、修改、查看等功能。分類要素包括建立的時間、狀態(tài)、編碼、所屬分級及分類等。目錄標簽管理通過標簽實現(xiàn)檔案數(shù)據(jù)資源目錄的分類。目錄標簽為目錄構(gòu)建多維搜索查詢,在繁多的數(shù)據(jù)資源中快速定位,為快速查詢、應用服務等提供了基礎(chǔ)。標簽要素包括標簽名稱、標簽編號、描述等。元數(shù)據(jù)是對數(shù)據(jù)的描述,本課題的元數(shù)據(jù)管理主要管理教學檔案涉及的業(yè)務元數(shù)據(jù)。要素包括基本信息(編號、名稱、類型、長度、約束)、限制信息等。
(2)教學檔案庫分類管理
教學檔案庫分類主要指按學院、系部、專業(yè)等多種分類方式, 通過不同的分類方式,構(gòu)建不同主體、多領(lǐng)域、多層級等維度教學檔案。主要包括教學檔案數(shù)據(jù)資源目錄管理、教學檔案庫資源管理以及教學檔案庫生成。教學檔案數(shù)據(jù)資源目錄管理主要是根據(jù)不同主體、不同領(lǐng)域、多層級的業(yè)務需求,構(gòu)建相應教學檔案資源目錄,為教學檔案庫數(shù)據(jù)的生成提供支撐。教學檔案庫資源管理可對不同主體、不同領(lǐng)域、多層級的教學檔案庫進行管理,也可對教學檔案庫數(shù)據(jù)來源進行統(tǒng)一管理。主要包括教學檔案庫資源管理及數(shù)據(jù)源管理。教學檔案數(shù)據(jù)生成是基于教學檔案模型,通過數(shù)據(jù)建模,構(gòu)建教學檔案庫,配置相應的數(shù)據(jù)生成周期,自動同步生成教學信息檔案數(shù)據(jù)。
(3)教學檔案查詢報告管理
基于教學檔案,提供教學查詢報告模版管理、院部和個人查詢報告生產(chǎn)功能。教學查詢報告模版管理主要管理通用模版和特色模版。通用模版適用于根據(jù)基本目錄信息類生成的報告;特色模版是在通用模版的基礎(chǔ)上加上特色目錄信息類。教學檔案查詢報告是基于規(guī)范化、標準化、可配置、易管理的報告格式模版,保證出具的檔案查詢報告來源一致及格式一致。此外,還提供統(tǒng)一服務接口,可以支撐網(wǎng)絡服務和移動服務。
大數(shù)據(jù)分布式處理技術(shù)有利于從大量的教學檔案數(shù)據(jù)中挖掘出隱藏著的有特殊關(guān)系性的信息,更全面、更深刻地了解和掌握高校教學的狀況,做出更準確的分析和決策,避免由于信息不完全造成的教學態(tài)勢誤判,從而促進高校提高教學水平。
參考文獻:
[1]陸紅.機器學習分布式大數(shù)據(jù)分析模型構(gòu)建方法[J].現(xiàn)代信息科技,2018(9).
[2]王玉新.大數(shù)據(jù)背景下的高校教學檔案信息化建設[J].蘭臺內(nèi)外,2018(8).
[3]連伊娜,文佑云.數(shù)字化時代高校教學檔案信息化建設的策略研究[J].發(fā)明與創(chuàng)新(大科技),2018(9).
(編輯:王天鵬)