李愛華
摘? 要:大數(shù)據(jù)時代已經(jīng)到了,正在影響各個行業(yè),檔案也不例外,高校檔案如何在大數(shù)據(jù)時代進行管理創(chuàng)新,將檔案中蘊含的數(shù)據(jù)價值凸顯出來,助力高校各項工作的開展成為高校檔案人面臨的挑戰(zhàn)。
關(guān)鍵詞:大數(shù)據(jù);檔案管理;數(shù)據(jù)挖掘
高校檔案是高校在日常管理、招生教學(xué)、基礎(chǔ)建設(shè)、科學(xué)研究等活動中直接形成的對社會、學(xué)校和學(xué)生具有保存價值的歷史記錄;是對高校辦學(xué)歷史、辦學(xué)經(jīng)驗、辦學(xué)成果全面真實的記錄;是反映高校黨政管理、培養(yǎng)人才、科學(xué)研究、服務(wù)社會、對外交流等各項工作的綜合記錄,從時間維度看,具有非常大的數(shù)據(jù)價值。
大數(shù)據(jù)時代,伴隨著高校智慧校園建設(shè)不斷推進,高校檔案的利用服務(wù)需求日益增長、利用方式日趨豐富,原有的管理模式已經(jīng)不能滿足需求,迫切需要轉(zhuǎn)變管理機制、創(chuàng)新管理模式,將高校檔案中蘊含的數(shù)據(jù)價值凸顯出來,服務(wù)支撐高校各項事業(yè)的發(fā)展。
1 高校檔案電子化管理是必然性
1.1 檔案信息化是大勢所趨。近年來,網(wǎng)絡(luò)信息技術(shù)高速發(fā)展,我國檔案信息化的進程也不斷加快。據(jù)經(jīng)濟日報報道,中國第一歷史檔案館、中國第二歷史檔案館數(shù)字化工作成效顯著,各級檔案館數(shù)字檔案資源的比例均有大幅提高,全國數(shù)字化檔案資源達(dá)2243萬GB。[1]
此次新的檔案法修訂草案新增“檔案信息化建設(shè)”一章,其中第28條規(guī)定,各級人民政府應(yīng)當(dāng)將檔案信息化納入信息化發(fā)展規(guī)劃,保障電子檔案、傳統(tǒng)載體檔案數(shù)字化成果等檔案數(shù)字資源的安全保存和有效利用。同時,修訂草案第30條還明確,電子檔案應(yīng)當(dāng)符合來源可靠、程序規(guī)范、要素合規(guī)的要求,不得僅因為電子檔案采用電子形式而否認(rèn)其法律效力。具有法律效力的電子檔案可以以電子形式作為憑證使用。
1.2 高校各項工作要求驅(qū)使。目前,教育部對高校實行“五年一輪”的普通高等學(xué)校教學(xué)工作水平評估制度。在教育部對高校的評估指標(biāo)體系中,每個評估點都與檔案密切相關(guān),都需要規(guī)范完整的檔案材料支撐,在教學(xué)評估中,檔案發(fā)揮了極其重要的作用。
近年來,黨中央高度重視巡視巡察工作,紀(jì)委監(jiān)察部門對高校的巡視巡察工作已經(jīng)成為常態(tài)。在每次的巡視巡察中巡視組都需要查閱大量的檔案資料,比如黨政管理的文書檔案、干部職工人事檔案、財務(wù)會計檔案等。
校史展覽、學(xué)歷認(rèn)證、教育部教學(xué)評估、紀(jì)委監(jiān)察部門的巡視巡察等對檔案工作提出了高的要求,要求各類檔案收集全面、整理規(guī)范、查詢利用方便快捷,給傳統(tǒng)的檔案工作機制帶來挑戰(zhàn),迫使檔案部門要將檔案進行數(shù)字化來適應(yīng)高校各項工作開展要求。
1.3 智慧校園建設(shè)推動。進入21世紀(jì)以來,特別是近幾年,信息技術(shù)迅速發(fā)展,各種技術(shù)應(yīng)用層出不窮;教育信息化、智慧化建設(shè)正如火如荼進行,教育部《2018年教育信息化和網(wǎng)絡(luò)安全工作要點》中明確指出要設(shè)立“智慧教育示范區(qū)”、引導(dǎo)各級學(xué)校開展數(shù)字校園和智慧校園建設(shè)與應(yīng)用。河南廣播電視大學(xué)也在積極開展智慧校園建設(shè)與應(yīng)用探索,檔案信息化建設(shè)作為智慧校園建設(shè)的一部分,得到前所未有的重視。借助智慧校園信息化建設(shè),電子檔案管理機制有了技術(shù)保障。
1.4 各項關(guān)鍵技術(shù)的成熟應(yīng)用。目前包括光學(xué)字符識別技術(shù)、自然語言處理、數(shù)據(jù)挖掘與分析技術(shù)等各項關(guān)鍵技術(shù)已經(jīng)成熟。
高校的檔案數(shù)字化工作利用OCR識別系統(tǒng),可以將紙質(zhì)檔案掃描后的圖像檔案進行一個轉(zhuǎn)換,使圖像檔案內(nèi)的圖片繼續(xù)保存,有表格,則表格內(nèi)資料及圖像內(nèi)的文字,一律變成計算機文字,識別出的文字可再使用及分析形成可編輯的電子文檔格式,減少因鍵盤輸入花費的人力與時間,從而提高工作效率。
自然語言指的是日常使用的語言,如漢語、英語和日語等。而自然語言處理(Natural Language Processing,NLP)則是指運用計算機技術(shù)對自然語言進行處理、理解并運用,它是人工智能和語言學(xué)的分支學(xué)科。作為人工智能領(lǐng)域研究的重要方向之一,自然語言處理的主要目的是通過自然語言的形式實現(xiàn)人和計算機之間的交互。將NLP技術(shù)應(yīng)用到高校電子檔案的管理之中,將會極大地提升檔案查詢利用的效率和效果。
大數(shù)據(jù)挖掘技術(shù)的基礎(chǔ)應(yīng)用功能是挖掘與分析數(shù)據(jù)信息。高校檔案信息的來源渠道非常豐富,門禁、監(jiān)控、食堂以及圖書館等都是信息來源;數(shù)據(jù)內(nèi)容十分冗雜繁復(fù),比如學(xué)生學(xué)籍信息、教務(wù)信息、網(wǎng)絡(luò)瀏覽信息、校園采購、多媒體教室使用、校園出入以及實時監(jiān)控等。大數(shù)據(jù)挖掘技術(shù)可以從上述數(shù)據(jù)信息中挖掘出關(guān)聯(lián)性較強的數(shù)據(jù),將其分別轉(zhuǎn)化成獨特編碼,聯(lián)系大的信息規(guī)整為一類,例如某同學(xué)的校園出入記錄、食堂用餐消費、圖書館借閱信息等,便于校園管理者查詢,可以有效降低學(xué)校工作者和智慧系統(tǒng)的負(fù)擔(dān)。
利用大數(shù)據(jù)挖掘技術(shù)可以對檔案中的價值數(shù)據(jù)進行挖掘,助力高校各項業(yè)務(wù)工作的開展,為校領(lǐng)導(dǎo)的有關(guān)決策提供數(shù)據(jù)支撐。
2 高校電子檔案管理創(chuàng)新
2.1 紙質(zhì)檔案數(shù)字化及電子文件歸檔。高校的檔案數(shù)字化工作的重點通常是紙質(zhì)檔案的數(shù)字化工作,由紙質(zhì)檔案而轉(zhuǎn)換形成的各種格式的電子文檔也成為數(shù)量最多、內(nèi)容最廣泛、最為重要的數(shù)字檔案資源。一般高校紙質(zhì)檔案的數(shù)字化工作分為幾個步驟:檔案整理、檔案掃描、圖像處理、圖像存儲、目錄建庫、數(shù)據(jù)掛接。很多高校的檔案管理部門通過以上六個步驟基本實現(xiàn)了紙質(zhì)檔案的數(shù)字化,建立起了數(shù)字檔案目錄數(shù)據(jù)庫,由于與數(shù)字檔案目錄數(shù)據(jù)庫相關(guān)聯(lián)的數(shù)據(jù)格式為圖片格式,所以有的高校除了提供數(shù)字檔案目錄查詢的功能外,又提供了縮略圖查詢功能。
可以將高校檔案管理系統(tǒng)與高校辦公自動化系統(tǒng)及其他業(yè)務(wù)系統(tǒng)如教務(wù)管理系統(tǒng)等進行對接,在線實時進行電子文件的歸檔工作,既提升了檔案收集的效率,同時也降低了檔案數(shù)字化的工作量。
2.2 檔案數(shù)據(jù)化及數(shù)據(jù)清洗。在高校檔案管理工作中,需要以大數(shù)據(jù)為抓手,使傳統(tǒng)意義上的人工化、扁平化的管理模式有效改變,確保檔案管理工作從“數(shù)字化”向“數(shù)據(jù)化”的轉(zhuǎn)化。
在實際的檔案管理過程中,需要把僵化死板的檔案掃描全文和目錄,轉(zhuǎn)變成活靈活現(xiàn)的大數(shù)據(jù)檔案,從根本上實現(xiàn)檔案的數(shù)據(jù)化管理。[2]針對檔案全文的著錄,要有效進行數(shù)據(jù)化加工,針對文本和圖像中的數(shù)字內(nèi)容要進行數(shù)據(jù)化的識別、分類、著錄和標(biāo)引,通過這樣的方法,才能真正意義上提供更優(yōu)質(zhì)的檔案信息服務(wù),使高校更好地利用檢索詞檢索到與之相對應(yīng)的檔案信息內(nèi)容。
高校在前期信息化建設(shè)中,搭建了數(shù)字化校園基礎(chǔ)平臺,完成了部分資源的共享互聯(lián)工作。隨著業(yè)務(wù)部門應(yīng)用系統(tǒng)的增加,以及對信息化需求的不斷擴張,大量教學(xué)、科研、人事、行政、后勤管理等方面的業(yè)務(wù)數(shù)據(jù)資源日益積累下來。在保證學(xué)校原有IT資源的前提下,高校需要對這些資源進行充分合理的利用,通過數(shù)據(jù)清洗的手段,采用全面有效的、權(quán)威準(zhǔn)確的信息數(shù)據(jù),形成服務(wù)資源,分類型存儲在數(shù)據(jù)庫中,并對這些數(shù)據(jù)進行挖掘和分析,為高校檔案管理提供數(shù)據(jù)支持。
2.3 檔案數(shù)據(jù)挖掘與分析。數(shù)據(jù)挖掘分析在高校檔案管理中,主要應(yīng)用于檔案分類、檔案收集、檔案保留,以及為檔案部門提供服務(wù)。高校檔案數(shù)據(jù)的挖掘與分析不僅可以提高高校檔案管理的效率、增強檔案管理的安全性、推動高校檔案管理體系的完善,還有利于提高高校檔案信息知識轉(zhuǎn)化能力、檔案信息知識服務(wù)水平,推動智慧校園信息資源建設(shè)等。
2.4 數(shù)據(jù)分析展現(xiàn),為決策提供支撐服務(wù)。在大數(shù)據(jù)時代,高校比以往任何時候都面臨著更為復(fù)雜的生存環(huán)境,高校檔案數(shù)據(jù)分析可以對建校以來的數(shù)據(jù)進行挖掘分析,為高校的各項業(yè)務(wù)開展提供業(yè)務(wù)決策支撐。[3]可視化的數(shù)據(jù)分析展現(xiàn)結(jié)果可以很清晰地為決策提供服務(wù)支撐。
3 小結(jié)
在大數(shù)據(jù)時代,變化是不變的趨勢,創(chuàng)新檔案管理機制,以檔案信息化建設(shè)為依托,轉(zhuǎn)變服務(wù)理念,從傳統(tǒng)的館藏中心模式向服務(wù)中心模式轉(zhuǎn)變向業(yè)務(wù)決策支撐轉(zhuǎn)變,變“被動”為“主動”,緊密結(jié)合學(xué)校各項實際應(yīng)用需求提供數(shù)據(jù)支撐服務(wù),提升檔案工作在高校各項工作中的重要性,充分發(fā)揮檔案的數(shù)據(jù)價值,更好地服務(wù)于高校的各項工作開展。
參考文獻:
[1]牛力.數(shù)字時代檔案創(chuàng)新開發(fā)利用的幾點思考[C].中國檔案學(xué)會、中國文獻影像技術(shù)協(xié)會.2019年海峽兩岸檔案暨縮微學(xué)術(shù)交流會論文集.中國檔案學(xué)會、中國文獻影像技術(shù)協(xié)會:中國檔案學(xué)會,2019:53-57.
[2]劉永,龐宇飛.檔案數(shù)據(jù)化之原生數(shù)據(jù)源全鏈?zhǔn)焦芾矸治鯷J].檔案管理,2018(05):11-18.
[3]趙旭,辛玉明.大數(shù)據(jù)背景下高校檔案信息化管理探析[J].蘭臺內(nèi)外,2017(4).
(作者單位:河南廣播電視大學(xué)?? 來稿日期:2019-11-18)