林宇帆 卜心田/浙江開放大學(xué)
檔案治理著重于攻克數(shù)字化時代檔案信息化等關(guān)鍵難題,通過信息化檢索工具,融入現(xiàn)代化、信息化數(shù)據(jù)管理模式,更加精準(zhǔn)、有效、客觀地向社會大眾開放檔案[1]。而在高校檔案治理中,有以下數(shù)據(jù)問題:一是檔案數(shù)據(jù)資產(chǎn)歸屬不明。具體表現(xiàn)在高校檔案數(shù)據(jù)雜亂繁多且存放于各級學(xué)院與部門,源頭數(shù)據(jù)發(fā)布時間、質(zhì)量、準(zhǔn)確度、歸口部門、責(zé)任老師等信息不明確。二是檔案數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范缺失。不存在統(tǒng)一代碼標(biāo)準(zhǔn)、程序規(guī)范、數(shù)據(jù)治理等管理制度。三是檔案數(shù)據(jù)質(zhì)量參差不齊。缺乏數(shù)據(jù)質(zhì)量準(zhǔn)入和考核標(biāo)準(zhǔn),對于矯正與提升檔案數(shù)據(jù)質(zhì)量的支持不充足,檔案數(shù)據(jù)難達(dá)到最低使用要求。四是檔案數(shù)據(jù)共享機制落后。受傳統(tǒng)檔案管理模式慣性影響, 檔案信息資源建設(shè)與服務(wù)的傳統(tǒng)思維弊端依舊存在,檔案數(shù)據(jù)的流通性極低且都是以被動共享的形式被其他部門所了解,缺乏時效性與準(zhǔn)確性。
針對上述問題,基于數(shù)據(jù)中臺的高校檔案管理系統(tǒng)的解決模型要素可被歸納為以下幾類:人才隊伍建設(shè)、資源整合投入、高新技術(shù)支持、系統(tǒng)數(shù)據(jù)梳理、扶持機制完善。高校首先應(yīng)做好檔案信息化人才隊伍建設(shè),開展檔案信息化、數(shù)據(jù)中臺等其他實用新型工具的相關(guān)使用培訓(xùn)。檔案數(shù)據(jù)資產(chǎn)歸屬不明主要體現(xiàn)在對接OLTP(事務(wù)處理)和OLAP(報表分析)的基礎(chǔ)過程中,相關(guān)使用培訓(xùn)可在源頭環(huán)節(jié)減少歸屬不清的OLTP。為改善檔案數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范缺失及檔案數(shù)據(jù)質(zhì)量不佳的弊端,高??梢劳懈咝驴萍计髽I(yè),建設(shè)數(shù)據(jù)共享平臺,這是平臺建設(shè)投入的可取方式,平臺應(yīng)包含數(shù)據(jù)可視化、用戶畫像BI分析等決策支持模塊。推動檔案數(shù)據(jù)質(zhì)量整體進(jìn)步的關(guān)鍵是匹配支持?jǐn)?shù)據(jù)中臺的高新數(shù)據(jù)處理平臺工具,如Hadoop及阿里的odps[2]。高校數(shù)據(jù)在進(jìn)入數(shù)據(jù)中臺前,可根據(jù)隱私等級實施對稱或不對稱加密,并通過標(biāo)簽設(shè)置進(jìn)行初步分類。進(jìn)入中臺后,在海量共享數(shù)據(jù)的收集基礎(chǔ)上,通過一系列數(shù)據(jù)清洗、定向分類,豐富數(shù)據(jù)字典和數(shù)據(jù)倉庫,進(jìn)一步擴充中臺數(shù)據(jù)維度和廣度。系統(tǒng)數(shù)據(jù)梳理方面,在數(shù)據(jù)模型管理的輔助下,高校可進(jìn)一步規(guī)劃管理元數(shù)據(jù)與主數(shù)據(jù),做好表管理與數(shù)據(jù)集管理。高校檔案數(shù)據(jù)要確保能轉(zhuǎn)化為數(shù)據(jù)資產(chǎn),在經(jīng)過計算邏輯封裝后通過API接口等形式對外開放服務(wù)并支持業(yè)務(wù)系統(tǒng)的便捷使用,數(shù)據(jù)可轉(zhuǎn)化為服務(wù)能力,最大程度釋放數(shù)據(jù)價值,反向激活整個數(shù)據(jù)中臺。還可配備相應(yīng)的扶持機制并主動完善已有的數(shù)據(jù)保護(hù)機制。其中,動態(tài)反饋和效果評估機制是對檔案質(zhì)量的矯正保障,在ETL數(shù)據(jù)處理的過程節(jié)點中就做到必要的矯正干預(yù),從而節(jié)約處理成本。另外,數(shù)據(jù)安全處理與應(yīng)急機制為服務(wù)網(wǎng)絡(luò)編研建立起網(wǎng)絡(luò)安全屏障。
數(shù)據(jù)中臺通過數(shù)據(jù)服務(wù)化的流程,進(jìn)一步減少數(shù)據(jù)的重復(fù)加工,提高數(shù)據(jù)的共享以及復(fù)用能力,從而盤活數(shù)據(jù)平臺及管理體系。在搭建研發(fā)全過程視圖過程中,增加涉及數(shù)據(jù)清洗和篩選的數(shù)據(jù)治理流程,以及對服務(wù)化升級的數(shù)據(jù)處理步驟。中臺通過有效聚合與治理,將海量數(shù)據(jù)抽象封裝成數(shù)據(jù)服務(wù),并提供給高校業(yè)務(wù)系統(tǒng)使用。在統(tǒng)一數(shù)據(jù)中心中間件的銜接下,通過垂直數(shù)據(jù)中心、公共數(shù)據(jù)倉庫以及內(nèi)部數(shù)據(jù)中心的相互配合,中臺對高校核心業(yè)務(wù)主體結(jié)構(gòu)進(jìn)行統(tǒng)一數(shù)據(jù)模型管理。中臺在高校檔案模型建構(gòu)中,從數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)分析、數(shù)據(jù)交互、用戶畫像、BI分析中心、關(guān)聯(lián)預(yù)警、模型管理等方面發(fā)揮作用。隨著數(shù)據(jù)模型和流程學(xué)習(xí)更為豐富飽滿,中臺成為提供標(biāo)準(zhǔn)化數(shù)據(jù)資源的有效手段,同時也是后期海量數(shù)據(jù)共享共用的工具基礎(chǔ)。在數(shù)據(jù)中臺的運行保障和平臺的正向循環(huán)運維下,高校檔案管理系統(tǒng)在技術(shù)、機制、人力、資源的協(xié)調(diào)配備下,可逐步適用于以下5個高校場景模塊:數(shù)字黨建、數(shù)字圖書館、數(shù)字校務(wù)、數(shù)字科研及數(shù)字資源。
圖1:高校檔案管理系統(tǒng)模型技術(shù)架構(gòu)圖
以現(xiàn)有的釘釘云上黨建為例,高校黨建模塊主要分為門戶管理、活動管理、會議管理、黨務(wù)工作、學(xué)習(xí)管理,呈現(xiàn)給用戶最多的是門戶管理。數(shù)字黨建主要完成黨委空間、總支空間、支部空間、個人空間、駕駛艙大屏、數(shù)據(jù)歸檔以及相應(yīng)的后臺支撐功能。因此建立和完善一套高校黨建中臺數(shù)據(jù)標(biāo)準(zhǔn)迫在眉睫,可涵蓋定義、操作、應(yīng)用多層次數(shù)據(jù),分為基礎(chǔ)性標(biāo)準(zhǔn)和應(yīng)用性標(biāo)準(zhǔn)。在中臺數(shù)據(jù)標(biāo)準(zhǔn)基礎(chǔ)上,堅持“一數(shù)一源”原則,確立黨建數(shù)據(jù)確權(quán)規(guī)則,深化黨建主題數(shù)據(jù)倉的數(shù)據(jù)歸集,實現(xiàn)黨建數(shù)據(jù)的統(tǒng)一運維和共享,建立有效聚合、共用共享、追蹤溯源的高校黨建數(shù)據(jù)共享服務(wù)機制。在中臺數(shù)據(jù)統(tǒng)計方面,根據(jù)個人黨員學(xué)習(xí)情況、支部活動和學(xué)習(xí)教育參與情況、志愿者服務(wù)情況等生成個人黨員積分?jǐn)?shù)據(jù),根據(jù)黨員積分?jǐn)?shù)據(jù)、黨員發(fā)展數(shù)據(jù)、黨建活動數(shù)據(jù)、黨建考核數(shù)據(jù)和黨建輿情數(shù)據(jù)等,生成集體黨建指數(shù)。在中臺數(shù)據(jù)分析方面,實現(xiàn)關(guān)聯(lián)分析、預(yù)警分析、趨勢分析,根據(jù)高校需求自主拖拽統(tǒng)計數(shù)據(jù)實現(xiàn)相關(guān)數(shù)據(jù)分析,智能預(yù)測關(guān)鍵指標(biāo)近期發(fā)展趨勢,預(yù)警提醒采取干預(yù)行動,實現(xiàn)對高校黨建數(shù)據(jù)精準(zhǔn)督導(dǎo)。通過事先設(shè)定彈性數(shù)據(jù)指標(biāo),中臺通過云計算實現(xiàn)各類黨建工作數(shù)據(jù)自動預(yù)警、主動提醒和及時反饋?;陉P(guān)鍵指標(biāo)的歷史數(shù)據(jù),數(shù)字黨建進(jìn)一步搭建基層黨組織和黨員畫像檔案庫,強化數(shù)據(jù)挖掘深度與維度,實現(xiàn)自動用數(shù)據(jù)對基層黨組織和普通黨員精準(zhǔn)畫像,繪制各類性格標(biāo)簽。該檔案庫可有效掌握學(xué)校黨員的思想認(rèn)知、工作作風(fēng)、能力水平、黨性修養(yǎng)等信息,服務(wù)高校精細(xì)化人才管理模式,并可針對不同性格標(biāo)簽的黨員開展個性化黨員教育和相關(guān)職務(wù)調(diào)配。數(shù)字黨建還涉及針對中層及以上領(lǐng)導(dǎo)干部的干部檔案管理庫的建設(shè)與運維,信息類型除包含與黨員情況類似的基本情況外,校外工作經(jīng)歷、職務(wù)任免等隱私性強的考核信息也被涵蓋。
隨著圖書館每日吞吐的數(shù)據(jù)量急劇飆升,涉及數(shù)據(jù)的品類和形式也日趨豐富,傳統(tǒng)運行機制顯然難以滿足。因此,人們提出了數(shù)字圖書館的創(chuàng)想,它是用數(shù)字化高新工具處理并篩選各類圖文文獻(xiàn)材料的多媒體相關(guān)的分布式數(shù)據(jù)處理平臺[3]。在數(shù)字圖書館的搭建基礎(chǔ)上,從中臺數(shù)據(jù)共享角度,高校圖書檔案數(shù)字管理模塊重新梳理可提供的綜合功能,包括用戶訪問、數(shù)據(jù)管理、資料編目、利用查詢、安全運維等。用戶訪問可沿用高校之前的統(tǒng)一門戶跳轉(zhuǎn)單點登陸的方式,內(nèi)網(wǎng)用戶實現(xiàn)一鍵式快捷登錄;外網(wǎng)用戶通過vpn設(shè)備實現(xiàn)安全校驗。中臺管理主要涉及對圖書檔案的過程數(shù)據(jù)資源二次處理、存放、引用等。一是將原有紙質(zhì)檔案轉(zhuǎn)化為易維護(hù)的電子版本,二是對電子檔案做好存儲、編目、借閱管理。按照國家和高校有關(guān)規(guī)定,過程中還涉及對業(yè)務(wù)系統(tǒng)及數(shù)據(jù)庫的維護(hù)、開發(fā)和數(shù)據(jù)備份工作;數(shù)據(jù)庫資源、網(wǎng)絡(luò)資源的建設(shè)及日常維護(hù)工作;圖書館Web網(wǎng)頁及移動端的建設(shè)和日常更新、運維工作等。其中,隨著數(shù)據(jù)處理插件的日漸進(jìn)步,有關(guān)數(shù)字圖書檔案版權(quán)的侵權(quán)行為變得隨處可見。因此在前期數(shù)據(jù)錄入中臺前做好版本管理和版權(quán)人明確變得尤為重要。應(yīng)在獲得電子授權(quán)的基礎(chǔ)上進(jìn)行數(shù)據(jù)編輯工作,并明確版權(quán)人及錄入負(fù)責(zé)人。資料編目、利用查詢功能可參考原先的高校圖書館編目規(guī)則,并在編目中增設(shè)查詢關(guān)鍵詞搜索子功能。利用查詢上可對電子圖書檔案劃定精確的關(guān)鍵詞管理,用戶可通過檢索相應(yīng)明顯關(guān)鍵詞獲得與之密切相關(guān)的文獻(xiàn)資料。模塊同時提供在線咨詢服務(wù)和光盤檢索服務(wù),服務(wù)用戶檢索查詢到所需的數(shù)據(jù)文獻(xiàn)。
高校的業(yè)務(wù)缺乏細(xì)致數(shù)據(jù)梳理以及后期的流程檔案管理,導(dǎo)致出現(xiàn)電子簽章流程混亂及與線下流程互相矛盾的情況。為響應(yīng)高校“最多跑一次”的數(shù)字改革,齊全校務(wù)功能建設(shè),提升網(wǎng)上辦事效率,高校校務(wù)流程檔案管理模塊勢在必行。該模塊需借助數(shù)據(jù)中臺完善與各類業(yè)務(wù)系統(tǒng)的數(shù)據(jù)認(rèn)證對接,包括公文、數(shù)據(jù)申報、數(shù)據(jù)分析等系統(tǒng)。該模塊在界面設(shè)計上需最大程度與業(yè)務(wù)系統(tǒng)對接,界面上初步設(shè)定排列以下板塊:上線辦事流程、流程審批事項、處理流程總耗時、校內(nèi)公告、一周安排、公文處理。以“日常報銷審批”為例,需填寫預(yù)約單號等報銷事由,經(jīng)過是否會簽、實物購置的判別,到達(dá)經(jīng)費部門負(fù)責(zé)人審核、財務(wù)審核,最后閉環(huán)回到申請人閱知。此類高校業(yè)務(wù)部門涉及的流程繁多,需在前期調(diào)研過程中充分了解相關(guān)需求,做好數(shù)據(jù)流程梳理工作,使電子流程真正替代原有線下流程并循環(huán)使用起來,在后期以教職工工號為存儲標(biāo)簽歸入數(shù)據(jù)中臺管理。在數(shù)據(jù)中臺的管理存儲中,對類似流程可采用數(shù)據(jù)歸納收集,統(tǒng)一測算流程報表,在后臺中導(dǎo)出子節(jié)點流程具體數(shù)量,以及對處理流程總耗小時數(shù)的精確掌握,做到流程量化、工作量可預(yù)估。在中臺數(shù)據(jù)分析上,進(jìn)一步為業(yè)務(wù)部門流程工作量的精確把控提供數(shù)據(jù)支持,輔助高校管理層了解業(yè)務(wù)部門的涉外流程實際數(shù)量及現(xiàn)階段的工作重點,可有針對性地進(jìn)行業(yè)務(wù)側(cè)重及資源投入調(diào)整。同時,于高校校務(wù)而言,滿足教職工移動辦公需求的移動端建設(shè)也需中臺的數(shù)據(jù)服務(wù)支撐,要求與PC端的校務(wù)流程保持實時數(shù)據(jù)交互。
按《高??蒲薪?jīng)費監(jiān)督系統(tǒng)數(shù)據(jù)規(guī)范1.0(試行)》要求,數(shù)字科研進(jìn)一步延伸系統(tǒng)數(shù)據(jù)的梳理工作。在原系統(tǒng)基礎(chǔ)上,嵌入科研檔案預(yù)警監(jiān)督模塊,并通過與財務(wù)、采購及人事管理系統(tǒng)等對接,構(gòu)建數(shù)字科研數(shù)據(jù)資源池,實現(xiàn)數(shù)據(jù)互通共享。在模塊上增設(shè)數(shù)據(jù)監(jiān)督平臺,在中臺原有模型基礎(chǔ)上設(shè)計對應(yīng)預(yù)警模型,開展與中臺的數(shù)據(jù)分析、歷史比對;完善問題處置流程機制,將異常狀況按照分管部門、程度情況分級分類地推送至高校各部門開展核實處理,從而形成覆蓋數(shù)字科研全周期的科研檔案監(jiān)管平臺。系統(tǒng)數(shù)據(jù)梳理的歸集數(shù)據(jù)步驟,遵照全員、全量、全流程、全要素的原則,同步推進(jìn)監(jiān)察、人事信息共享。中臺資源池應(yīng)包含以下基礎(chǔ)數(shù)據(jù)元素:科研機構(gòu)、項目人員、具體項目信息等。中臺服務(wù)于模塊建設(shè),梳理監(jiān)督需求,建立預(yù)警規(guī)則,不斷充實問題需求清單,打造高質(zhì)量的預(yù)警模型集群。預(yù)警模型的初期建設(shè)需找出高校科研與違紀(jì)問題之間的因果關(guān)聯(lián),建立分色塊預(yù)警模型。預(yù)警模型清單需根據(jù)學(xué)校自身情況進(jìn)行定制,數(shù)據(jù)元素包括預(yù)警模型名稱、預(yù)警規(guī)則、數(shù)據(jù)基礎(chǔ)邏輯關(guān)系、對應(yīng)處置單位等要素。
為規(guī)范模塊使用,高校還應(yīng)建立科研人員檔案中臺信息庫,對存在違規(guī)行為的科研人員向歸口部門發(fā)出預(yù)警,為責(zé)任單位的審批提供依據(jù)。科研檔案數(shù)據(jù)共享和加密機制的完善也是必要的機制支持,按照上層部門的數(shù)據(jù)要求,通過高校DSC大數(shù)據(jù)鏈路系統(tǒng)向總倉傳輸科研檔案數(shù)據(jù),并提供較完善的數(shù)據(jù)加密機制,確??蒲袛?shù)據(jù)存儲和傳輸?shù)陌踩浴T撃K在管理模式上采用中臺分級分權(quán)的規(guī)則,對不同級別用戶默認(rèn)限制不同操作權(quán)限和數(shù)據(jù)訪問范圍,并可根據(jù)學(xué)校實際情況靈活調(diào)整。模塊的架構(gòu)設(shè)計兼容各類系統(tǒng)升級,并根據(jù)中臺用戶畫像提供匹配的操作界面。
課程資源檔案共享模塊的邏輯設(shè)計可參考杭州國家版本館。在保障數(shù)據(jù)安全方面,該館承擔(dān)中央總館的異地容災(zāi)備份,并作為江南地區(qū)的版本檔案匯聚中心[4]。該模塊的中臺應(yīng)用為資源檔案中心,為高校學(xué)習(xí)者提供多元化資源、多終端課程、多媒體教學(xué)、個性化學(xué)習(xí)的數(shù)字資源檔案支持,涉及人才培養(yǎng)方案、課程注冊、學(xué)生照片管理、學(xué)籍?dāng)?shù)據(jù)統(tǒng)計、畢業(yè)結(jié)果統(tǒng)計等。在課程注冊及學(xué)生注冊的基礎(chǔ)上完善學(xué)籍管理,可存儲并自動查詢檔案中心的學(xué)生學(xué)籍信息,并批量導(dǎo)入學(xué)生入學(xué)和畢業(yè)照片,做好照片的檔案分類管理。學(xué)籍?dāng)?shù)據(jù)統(tǒng)計和畢業(yè)結(jié)果統(tǒng)計則使用中臺的BI分析中心,從不同數(shù)據(jù)維度統(tǒng)計具體招生及畢業(yè)情況。在模塊的框架搭建上,統(tǒng)一學(xué)習(xí)門戶與標(biāo)準(zhǔn)體系,為各類數(shù)字資源平臺的功能對接提供統(tǒng)一API,聚合數(shù)據(jù)中臺,實現(xiàn)檔案、資源和數(shù)據(jù)的共享。在相關(guān)高新工具的運用上,模塊重點研究基于中臺規(guī)則的個性化推薦和基于協(xié)作過濾的數(shù)據(jù)分析。前者利用數(shù)據(jù)挖掘來記錄學(xué)習(xí)者的個人資料、瀏覽規(guī)律,以及關(guān)鍵詞的資源搜索,不斷擴充設(shè)置的規(guī)則,從而根據(jù)學(xué)習(xí)者的專注狀態(tài)、瀏覽興趣等相關(guān)行為數(shù)據(jù)推薦匹配的學(xué)習(xí)資源并歸入數(shù)據(jù)中臺的運維。在中臺的學(xué)習(xí)規(guī)則完善后,可自動為其他相似學(xué)習(xí)者推送個性化的學(xué)習(xí)資源。后者通過資源檔案中心主動記錄學(xué)習(xí)者的學(xué)習(xí)狀態(tài),包括登錄時長、有效學(xué)習(xí)時間、論壇交流情況、師生在線溝通情況、積分累計情況等。將不同空間與時間的數(shù)據(jù)納入檔案數(shù)據(jù)中臺,研究基于協(xié)作過濾的數(shù)據(jù)分析,更深層次地對學(xué)習(xí)者的相關(guān)數(shù)據(jù)進(jìn)行挖掘處理,為學(xué)習(xí)者提供改進(jìn)在線學(xué)習(xí)建議,并為數(shù)字資源的形式升級提供決策依據(jù)。在扶持機制上,高校注重課程資源的實時開放共享,轉(zhuǎn)化精品資源為數(shù)據(jù)資產(chǎn)并投入市場,最大化地發(fā)揮數(shù)據(jù)資產(chǎn)價值。
數(shù)據(jù)中臺的本質(zhì)是整合建設(shè)一套可讓數(shù)據(jù)真正有價值的機制,匹配可協(xié)調(diào)資源,做到從根本上提高數(shù)據(jù)質(zhì)量,從源頭上節(jié)約數(shù)據(jù)運維成本,從機制上協(xié)同業(yè)務(wù)系統(tǒng)[5]。隨著模型和流程學(xué)習(xí)更為豐富飽滿,上述基于數(shù)據(jù)中臺建構(gòu)的高校檔案系統(tǒng)模型場景也為未來高校檔案治理提供了新的思路與路徑參考,以數(shù)據(jù)引領(lǐng)高校檔案信息化,緊跟國家信息化戰(zhàn)略。