關(guān)鍵詞:人工智能;高校檔案;信息安全;數(shù)字化;歸檔;檔案管理;檔案編研
1 引言
人工智能的應(yīng)用正在深刻影響檔案管理的實踐,從檔案資源的物理形態(tài)到檔案工作的組織方式、再到檔案服務(wù)的模式內(nèi)容都正在發(fā)生根本性的變化。2020年6月頒布的《中華人民共和國檔案法》專設(shè)檔案信息化建設(shè)一章,強調(diào)“提高檔案信息化建設(shè)水平”。[1]2021年6月,國務(wù)院辦公廳印發(fā)的《“十四五”全國檔案事業(yè)發(fā)展規(guī)劃》中提出:“新一代信息技術(shù)廣泛應(yīng)用,檔案工作環(huán)境、對象、內(nèi)容發(fā)生巨大變化,迫切要求創(chuàng)新檔案工作理念、方法、模式,加快全面數(shù)字轉(zhuǎn)型和智能升級?!盵2]2022年10月,黨的二十大報告指出,要加快建設(shè)網(wǎng)絡(luò)強國、數(shù)字中國。在相關(guān)政策大力推動人工智能融入檔案事業(yè)的背景下,人工智能嵌入檔案管理既是必然選擇,也是發(fā)展智慧檔案的應(yīng)時之舉。
對中國全文期刊數(shù)據(jù)庫,如中國知網(wǎng)(CNKI)、萬方數(shù)據(jù)庫、維普數(shù)據(jù)庫、超星數(shù)字圖書館等平臺進行文獻檢索、系統(tǒng)梳理可知,有關(guān)人工智能技術(shù)如何賦能檔案工作高質(zhì)量發(fā)展的論文數(shù)量急速增長,成為檔案學(xué)研究領(lǐng)域的熱點話題。但人工智能在高校檔案領(lǐng)域應(yīng)用鮮有學(xué)者涉及,研究論文僅有數(shù)十篇?;诖耍疚耐ㄟ^分析人工智能時代高校檔案工作所面臨的挑戰(zhàn),探索人工智能在高校檔案工作中的應(yīng)用路徑,并有針對性地提出優(yōu)化策略,以期為高校檔案領(lǐng)域更廣泛更深入地應(yīng)用人工智能技術(shù)提供參考,為高校檔案工作發(fā)展提供新思路。
2 人工智能時代高校檔案工作面臨的挑戰(zhàn)
2.1 投入不足。大多數(shù)高校在檔案管理方面的主要困境是對檔案工作定位僅僅停留在為學(xué)校提供支撐保障作用,管理層未能充分認識到檔案工作的重要性以及在數(shù)字化和智能化轉(zhuǎn)型方面的迫切需求,從而不愿意給予足夠的資金投入。檔案工作作為高校的基礎(chǔ)性工作,其智能化進程離不開充足的資金支持。其一,無論是開發(fā)人工智能相關(guān)檔案系統(tǒng)等軟件設(shè)備,還是購買計算機、掃描儀、大容量存儲器等硬件設(shè)備,均需要穩(wěn)定的資金投入。其二,人工智能技術(shù)在高校檔案工作中的應(yīng)用,必須有具備相關(guān)專業(yè)技能的人才,因此要加大對專業(yè)人才的引進,而專業(yè)人才的引進,同樣需要高校投入大量的資金。其三,隨著人工智能技術(shù)的不斷進步,原有的軟硬件設(shè)施設(shè)備后期需要持續(xù)優(yōu)化和迭代,也需要穩(wěn)定的資金支持。然而,目前部分高校檔案管理的基礎(chǔ)設(shè)施建設(shè)明顯滯后,由于缺乏資金,檔案數(shù)字化的軟硬件設(shè)施無法及時升級和完善。引入人工智能技術(shù)需要投入大量的資金成本,這給高校檔案管理智能化帶來不小的挑戰(zhàn)。
2.2 檔案工作者數(shù)字化素養(yǎng)不夠。人工智能高度依賴于技術(shù)支持,其在高校檔案管理中的應(yīng)用,要求檔案工作人員具有全新的思維方式和技能,并愿意投入更多的時間和精力去深入理解和適應(yīng)這種創(chuàng)新的管理方式。
盡管近年來高校不斷加強檔案隊伍建設(shè),檔案工作人員的數(shù)字化素養(yǎng)和水平有了大幅度的提升,但從整體上看,仍存在一些問題。經(jīng)過對高校檔案從業(yè)隊伍的綜合分析,我們發(fā)現(xiàn)該隊伍存在年齡結(jié)構(gòu)不合理的問題,中老年人員占比較大,而年輕人則相對較少。女性群體在該隊伍中占比也較高。此外,還存在學(xué)歷水平偏低,缺乏較強的數(shù)字化意識等問題。這些問題的存在使得高校檔案工作人員對快速涌現(xiàn)的人工智能技術(shù)的接納能力比較有限,應(yīng)用能力比較弱,數(shù)字化素養(yǎng)不夠。雖然有些檔案工作者可以完成基礎(chǔ)數(shù)字化工具的操作,但對于如何高效地進行數(shù)字化管理、如何保證數(shù)字化檔案的質(zhì)量和安全等方面則缺乏更深入的了解和實踐。檔案工作者數(shù)字化素養(yǎng)不夠限制了人工智能技術(shù)在高校檔案管理中的應(yīng)用。
2.3 檔案管理效率較低。檔案管理效率未能達到理想水平,對傳統(tǒng)高校檔案管理工作造成了一定困擾。在人工操作的模式下,檔案管理員需要投入大量的時間和精力進行檔案整理和編目,同時還要負責(zé)文檔的借閱和檢索等工作,這使得整個流程變得異常繁瑣和低效。查找資料時,管理員需要通過檢索目錄進行人工查找,再從檔案庫中手動找出所需的檔案,從檢索到使用的過程既耗時又費力。隨著計算機網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,高校檔案管理逐漸實現(xiàn)了數(shù)字化,但目前這種數(shù)字化的進程仍然停留在文本信息的錄入、編輯和打印等初級階段。大多數(shù)高校檔案管理的數(shù)字化仍然需要人工操作,并未實現(xiàn)全過程自動化和智能化,檔案管理效率較低,很大程度上制約了高校檔案工作全程智能化的建設(shè)水平。
2.4 檔案數(shù)字化程度不高。檔案數(shù)字化的優(yōu)勢在于,它不僅能夠極大提升檔案的保存和管理效率,更能實現(xiàn)檔案信息的快速檢索與共享。同時,數(shù)字化管理還有助于維護紙質(zhì)檔案的原始狀態(tài),有效避免頻繁翻閱和復(fù)制帶來的物理損耗。盡管新時代對高校檔案工作提出了更高的要求,但當(dāng)前部分高校的檔案工作仍停留在紙質(zhì)檔案管理階段,各級、各類檔案的數(shù)字化進程緩慢,信息化水平亟待提升。一方面,電子檔案收集環(huán)節(jié)存在明顯短板,未能實現(xiàn)應(yīng)收盡收,導(dǎo)致部分重要文件和數(shù)據(jù)未能及時數(shù)字化保存,存在散失的風(fēng)險;另一方面,現(xiàn)有紙質(zhì)檔案的數(shù)字化水平普遍不足。高校原有館藏檔案以紙質(zhì)檔案為主,館藏內(nèi)容豐富、案卷數(shù)量龐大、年代跨度廣泛。由于長期以來處于封閉管理狀態(tài),且各歷史時期檔案的整理質(zhì)量標準不統(tǒng)一,導(dǎo)致檔案數(shù)據(jù)資源分散化、碎片化現(xiàn)象嚴重。人工智能技術(shù)的應(yīng)用需要大量的數(shù)據(jù)支持,數(shù)據(jù)量不足無法讓智能機器(或系統(tǒng))得到充分的特定場景的學(xué)習(xí)和訓(xùn)練,極大限制相關(guān)智能技術(shù)的應(yīng)用。[3]
2.5 檔案信息安全存在潛在風(fēng)險。高校檔案是高校開展教研、科研、學(xué)術(shù)和黨建等多方面工作的信息匯總產(chǎn)物,[4]其中包含大量敏感的師生個人信息、教育教研數(shù)據(jù)、科研成果以及校史校情等內(nèi)容,這些信息的泄露將可能會給學(xué)校和師生帶來嚴重的負面影響。隨著信息技術(shù)的迅猛進步,高校檔案信息的安全性面臨著潛在的威脅和風(fēng)險。部分高校在技術(shù)防護方面存在明顯短板,如缺乏高效防火墻和入侵檢測系統(tǒng)等關(guān)鍵防護措施。這使得黑客有機會運用病毒、木馬及拒絕服務(wù)攻擊等手段,對檔案管理系統(tǒng)發(fā)動侵襲,進而引發(fā)數(shù)據(jù)泄露和系統(tǒng)崩潰等嚴重后果。在檔案管理方面,眾多高校未能建立健全的管理制度,責(zé)任劃分不明確,操作流程亦缺乏規(guī)范性,導(dǎo)致檔案信息的安全性受到嚴重威脅。此外,隨著人工智能技術(shù)的廣泛應(yīng)用,高校檔案管理涉及大量敏感數(shù)據(jù)的處理。如何確保這些數(shù)據(jù)的安全與隱私,已成為高校檔案管理中亟待解決的重要問題。
3 人工智能在高校檔案工作中的應(yīng)用路徑
3.1 智能化管理高校檔案。在2020年全國檔案局長館長會議上,國家檔案局局長陸國強提出,要探索將大數(shù)據(jù)、區(qū)塊鏈、人工智能等新一代信息技術(shù)應(yīng)用于檔案管理中,推動數(shù)字檔案館(室)建設(shè)向更具智慧化方向發(fā)展。[5]鑒于此,高校應(yīng)積極響應(yīng)號召,引入人工智能技術(shù),以實現(xiàn)檔案管理的智能化,從而更好地滿足時代的需求和發(fā)展。目前,智能化管理檔案已經(jīng)在高校檔案工作實踐中得到廣泛應(yīng)用。越來越多的高校開始采用智能化管理檔案的方式,實現(xiàn)檔案的自動化分類、整理、存儲和檢索。同時,一些檔案管理軟件公司也推出了更加智能化、高效的檔案管理軟件,以滿足高校檔案管理的不同需求。隨著技術(shù)的不斷發(fā)展,智能化管理檔案將會越來越普及,成為高校檔案管理工作中不可或缺的一部分。智能化管理高校檔案的應(yīng)用路徑主要有自動分類、自動歸檔、智能化鑒定、智能化保管和備份四個方面。
3.1.1 自動分類。利用人工智能技術(shù)對檔案進行自動分類,通過對大量數(shù)據(jù)的訓(xùn)練和學(xué)習(xí),構(gòu)建出一個分類模型,再利用自然語言處理技術(shù)中的文本分類算法,根據(jù)文檔內(nèi)容,識別出它們的主題或類別,將其自動歸類到相應(yīng)的文件夾中。例如,通過OCR(Optical Character Recognition,光學(xué)字符識別)技術(shù)識別掃描文檔中的文字信息,自動提取關(guān)鍵信息,進行分類存儲。安徽省檔案館借助OCR技術(shù)對簡體手寫體檔案和民國繁體檔案等歷史檔案進行識別,[6]實現(xiàn)自動分類,就是一個典型的案例。高校檔案涉及種類繁多,包括教學(xué)、科研、學(xué)生、設(shè)備等11個大類,每一個種類都有不同的分類標準和歸檔要求。人工智能在高校檔案自動分類方面的應(yīng)用已經(jīng)成為許多高校研究和實施領(lǐng)域。目前,一些高校檔案管理部門正在嘗試利用自然語言處理、圖像識別和語音識別等技術(shù),通過開發(fā)自己的人工智能模型來實現(xiàn)檔案的自動分類。
3.1.2 自動歸檔。高校檔案自動歸檔實現(xiàn)主要依賴于自然語言處理技術(shù)和機器學(xué)習(xí)算法。首先,通過對大量的檔案數(shù)據(jù)進行預(yù)處理,提取出關(guān)鍵信息,如標題、作者、日期等。然后,利用自然語言處理技術(shù)對這些信息進行語義分析和特征提取,形成特征向量。最后,通過機器學(xué)習(xí)算法對這些特征向量進行訓(xùn)練,構(gòu)建出分類模型。再通過對每個文件的格式、內(nèi)容、屬性進行分析,自動將其歸類到相應(yīng)的檔案中,并生成相應(yīng)的電子標簽和紙質(zhì)標簽,方便后續(xù)的查詢和使用。山東省推進國家級單套制、單軌制試點過程中,使用智能采集模型的人工智能技術(shù),實現(xiàn)電子文件區(qū)域智能歸檔整理。[7]
3.1.3 智能化鑒定。智能化鑒定是指利用人工智能技術(shù)對檔案進行分類、評估和篩選。通過對檔案內(nèi)容的分析,可以確定其重要性、保密級別、價值等信息,從而為后續(xù)的整理和保存提供有力的支持。如,遼寧省檔案館借助機器學(xué)習(xí)、專家系統(tǒng)、語義分析等人工智能技術(shù),構(gòu)建多維語義理解算法模型,從敏感詞、敏感語句、敏感圖像等多角度對檔案全件進行語義分析,提升檔案價值鑒定業(yè)務(wù)的智能化水平。[8]
在檔案智能化鑒定方面,高校應(yīng)采取如下措施:第一,構(gòu)建健全的檔案管理系統(tǒng)。借助尖端的檔案管理軟件,實現(xiàn)檔案的自動化分類、編目和索引,以提升鑒定工作的精確性和效率。第二,深化檔案內(nèi)容的分析。運用自然語言處理、圖像識別等先進技術(shù),對檔案內(nèi)容進行深入分析,提取核心信息,為后續(xù)評估和篩選提供堅實支撐。第三,引入專家系統(tǒng)。借助具備專業(yè)知識和豐富經(jīng)驗的專家系統(tǒng),對檔案進行評估和篩選,進一步提高鑒定工作的專業(yè)性和準確性。第四,制定智能化鑒定標準。通過構(gòu)建完善的智能化鑒定標準體系,為鑒定工作提供科學(xué)的依據(jù)和指導(dǎo),確保鑒定工作的規(guī)范性和準確性。在高校檔案管理工作中,智能化鑒定和整理檔案已成為一種發(fā)展趨勢。
3.1.4 智能化保管和備份。在當(dāng)前高校檔案管理的進程中,智能化保管與備份已逐漸凸顯出其重要性。通過采用前沿科技手段,我們不僅能夠極大提升檔案完整性與安全性的保障水平,還能顯著提高檔案管理的工作效率和服務(wù)質(zhì)量。因此,高校檔案管理部門可考慮引入智能化保管系統(tǒng)。此類系統(tǒng)借助智能化管理軟件,能夠?qū)崿F(xiàn)對檔案資料的精準分類、系統(tǒng)整理、妥善保管以及高效備份等多重功能。同時,該系統(tǒng)還具備檔案跟蹤與監(jiān)控機制,從而全面確保檔案的完整性和安全性。此外,還可以引入云備份技術(shù)。通過該技術(shù),檔案信息得以安全存儲于云端,即便遭遇意外情況,亦能確保檔案信息的完整性與安全性不受影響。同時,云備份技術(shù)還支持遠程備份功能。借助此功能,高校檔案管理部門能夠隨時隨地訪問和獲取檔案信息,極大地提升了檔案管理的便捷性與效率。
3.2 智能化利用服務(wù)?!丁笆奈濉比珖鴻n案事業(yè)發(fā)展規(guī)劃》將“滿足人民群眾的檔案信息和檔案文化需求”[9]作為檔案利用服務(wù)工作重要任務(wù)之一。引入人工智能技術(shù),為師生提供更加便捷的檔案查詢和使用體驗,實現(xiàn)智能化服務(wù),可以很好地滿足他們對檔案信息文化的需求。智能化利用服務(wù)主要體現(xiàn)在檔案信息智能化檢索、個性化推薦服務(wù)、檔案信息的共享與協(xié)同三個方面。
3.2.1 檔案信息智能化檢索。通過自然語言處理技術(shù)、搜索引擎等,實現(xiàn)檔案信息的快速檢索和精準匹配。其一,關(guān)鍵詞檢索。例如,當(dāng)師生需要查找一些學(xué)習(xí)資料時,只需要在智能化檔案系統(tǒng)中輸入關(guān)鍵詞或者句子,系統(tǒng)就會自動為其匹配相關(guān)的檔案信息,并按照相關(guān)性和重要性進行排序。這樣不僅提高了檔案查詢的效率,而且避免了師生在海量的檔案信息中迷失方向。其二,圖像檢索。高校檔案中有很多珍貴的照片、手稿等圖像資料,這些資料蘊含著豐富的歷史和文化信息。通過智能化圖像識別技術(shù),可以對這些圖像資料進行自動化識別和索引,從而方便用戶進行檢索和利用。其三,全文檢索。智能化檢索技術(shù)可以實現(xiàn)對檔案全文的自動掃描和解析,將檔案中所有文字信息轉(zhuǎn)化為計算機可讀的數(shù)據(jù)格式,并建立全文索引。如,合肥工業(yè)大學(xué)檔案館以利用 OCR技術(shù)實現(xiàn)檔案信息的全文檢索,提升了服務(wù)效率。其四,數(shù)據(jù)挖掘和可視化分析?!爸悄芑瘷z索技術(shù)可以利用數(shù)據(jù)挖掘和可視化分析技術(shù),對檔案中的大量數(shù)據(jù)進行分析和挖掘”[10],發(fā)現(xiàn)數(shù)據(jù)之間的關(guān)聯(lián)和規(guī)律,細化檔案資源的顆粒度,并將結(jié)果以圖表、圖像等形式呈現(xiàn)給用戶,可以幫助師生更好地理解和利用檔案信息,盤活和激發(fā)檔案信息的潛在價值。
3.2.2 個性化推薦服務(wù)。借助先進的大數(shù)據(jù)技術(shù),對龐大的檔案信息庫進行深入分析和精細處理。通過分析師生的搜索歷史、瀏覽行為等關(guān)鍵數(shù)據(jù),能夠精準地為他們推薦相關(guān)的檔案資源,從而更好地滿足他們的個性化需求。結(jié)合用戶畫像與專家系統(tǒng)等先進技術(shù)手段,能夠深入挖掘用戶的需求與偏好,準確預(yù)測其興趣點。在此基礎(chǔ)上,再運用高效的推薦算法,為師生提供有針對性的檔案信息推送服務(wù)。例如,通過分析學(xué)生的學(xué)習(xí)專業(yè)、課程成績、研究方向等信息,可以推薦相關(guān)的檔案資源、學(xué)術(shù)論文、課程材料等,學(xué)生可以更方便地獲取與他們學(xué)習(xí)專業(yè)相關(guān)的檔案資源,以支持他們的學(xué)習(xí)和研究。在實際應(yīng)用案例中,廣州市婦女兒童醫(yī)療中心借助人工智能技術(shù)挖掘病例檔案數(shù)據(jù),實現(xiàn)了兒科疾病的智能化診斷。[11]
3.2.3 檔案信息的共享與協(xié)同。通過云計算和大數(shù)據(jù)等技術(shù),將各類檔案信息進行整合,構(gòu)建校園統(tǒng)一的檔案信息共享平臺,打破“信息孤島”,實現(xiàn)檔案資源的優(yōu)化配置,這意味著高校的各個部門和師生可以更加方便地共享和使用檔案信息。如,燕山大學(xué)開發(fā)學(xué)校檔案遠程服務(wù)利用系統(tǒng),疫情防控期間為近萬人次提供檔案服務(wù),深受師生校友好評。此外,集約化應(yīng)用虛擬現(xiàn)實(VR)、增強現(xiàn)實(AR)等技術(shù),師生可以沉浸式體驗檔案文化,進一步提升檔案利用的體驗感。
3.3 智能化輔助決策。高校檔案不僅具備證明價值,其擁有的重要參考價值也不容忽視。為了有效地挖掘高校檔案的價值,為學(xué)校領(lǐng)導(dǎo)和各部門提供決策支持,高校檔案工作需進一步走深走實,助力高校高質(zhì)量發(fā)展。因此,引入人工智能技術(shù),實現(xiàn)智能化輔助決策,是高校檔案工作發(fā)展的大勢所趨。智能化輔助決策主要體現(xiàn)在:通過人工智能的數(shù)據(jù)挖掘與分析技術(shù),對海量的檔案數(shù)據(jù)進行深度挖掘與分析,提取出有價值的信息,為高校決策提供堅實的數(shù)據(jù)支撐。例如,利用該技術(shù)對歷年招生數(shù)據(jù)進行挖掘和分析,可以揭示不同年份、不同專業(yè)的招生趨勢和規(guī)律,為高校制定更為精準的招生計劃提供數(shù)據(jù)依據(jù)。同樣,該技術(shù)也可以應(yīng)用于科研數(shù)據(jù)和教學(xué)數(shù)據(jù)的挖掘與分析,可發(fā)現(xiàn)科研團隊的研究方向及成果產(chǎn)出情況,以及學(xué)生的學(xué)習(xí)情況和教師的教學(xué)質(zhì)量,為高校優(yōu)化科研資源配置、改進教學(xué)方法和提高教學(xué)質(zhì)量提供有力參考。
3.4 智能化檔案編研。傳統(tǒng)的高校檔案編研流程高度依賴人工操作,效率低下且耗費大量人力物力。為了應(yīng)對這一挑戰(zhàn),我們積極探索智能化高校檔案編研的新模式。該模式利用現(xiàn)代信息技術(shù)和智能化手段,旨在實現(xiàn)高校檔案的高效、精確和全面整理、研究及利用。通過實現(xiàn)大規(guī)模檔案的自動化處理,我們可以顯著提升編研工作的效率和質(zhì)量。
智能化高校檔案編研的核心技術(shù)包括:一是大數(shù)據(jù)技術(shù)。該技術(shù)能夠收集并整合各類高校檔案資源,如紙質(zhì)檔案、電子檔案以及音視頻檔案等,構(gòu)建統(tǒng)一的數(shù)據(jù)庫。隨后,通過對檔案數(shù)據(jù)的采集、處理和分析,為檔案編研工作提供豐富而全面的數(shù)據(jù)支持。二是數(shù)據(jù)挖掘技術(shù)。該技術(shù)能夠?qū)A康臋n案數(shù)據(jù)進行深入的挖掘和分析,揭示出有價值的信息及其之間的關(guān)聯(lián)性,從而為檔案編研工作提供堅實的支撐。三是人工智能技術(shù)。通過應(yīng)用機器學(xué)習(xí)、自然語言處理等技術(shù)手段,我們可以實現(xiàn)檔案文本的自動分類、關(guān)鍵詞提取和語義分析等功能,進而提升檔案編研工作的自動化水平。四是云計算技術(shù)。該技術(shù)為搭建檔案編研云平臺提供了可能,實現(xiàn)了檔案數(shù)據(jù)的集中存儲、分析和共享,從而顯著提高了檔案編研的效率。此外,我們還可以引入人工智能助手,以協(xié)助檔案人員完成編研過程中的繁瑣任務(wù),從而減輕檔案管理人員的工作負擔(dān)。
4 人工智能賦能高校檔案工作的優(yōu)化策略
4.1 強化智能化管理意識。教育部27號令《高等學(xué)校檔案管理辦法》第五章第三十八條規(guī)定:“高等學(xué)校應(yīng)當(dāng)設(shè)立專項經(jīng)費,為檔案機構(gòu)配置檔案管理現(xiàn)代化、檔案信息化所需的設(shè)備設(shè)施,加快數(shù)字檔案館(室)建設(shè),保障檔案信息化建設(shè)與學(xué)校數(shù)字化校園建設(shè)同步進行?!盵12]因此,高校管理者應(yīng)強化檔案智能化管理意識,不斷提高對檔案數(shù)字化、智能化管理重要性的認識,將檔案智能化發(fā)展納入院校發(fā)展規(guī)劃中,提前布局謀劃。“高??蓪n案管理智能化納入‘智慧校園’發(fā)展規(guī)劃,以此契機建設(shè)較為完善的檔案信息化基礎(chǔ)設(shè)施,開展業(yè)務(wù)流程再造,打破信息壁壘,走出數(shù)據(jù)孤島,促進校園數(shù)據(jù)的充分共享,構(gòu)建檔案綜合管理及業(yè)務(wù)整合的服務(wù)信息化體系?!盵13]同時,高校應(yīng)將人工智能技術(shù)在檔案工作中的應(yīng)用納入學(xué)校經(jīng)費預(yù)算,加大對應(yīng)用人工智能技術(shù)實現(xiàn)檔案工作全程智能化的經(jīng)費投入,為高校檔案智能化建設(shè)提供必要的經(jīng)費保障。
4.2 重視技術(shù)研發(fā)和應(yīng)用。為了推進“人工智能+檔案”的發(fā)展,科技攻關(guān)和技術(shù)研發(fā)是不可或缺的一環(huán)。以國家檔案局檔案科學(xué)技術(shù)研究所與科大訊飛的全面戰(zhàn)略合作協(xié)議為例,雙方通過利用人工智能技術(shù),共同開展檔案數(shù)字化、管理智慧化、使用便捷化等方面的聯(lián)合攻關(guān),成立聯(lián)合實驗室,從而構(gòu)建新型人工智能智慧檔案行業(yè)標準。[14]這些工作取得了顯著的成果,如智能語音識別和實時轉(zhuǎn)寫技術(shù)的成功應(yīng)用,實現(xiàn)了口述征集的智能語音檔案著錄、音視頻數(shù)字檔案檢索利用等革命性成果。OCR技術(shù)在識別民國繁體文書類檔案方面也取得了突破性進展,識別率達到八成以上,達到了可用級別。此外,基于機器學(xué)習(xí)的檔案數(shù)字化加工系統(tǒng)研制及知識庫建設(shè),結(jié)合OCR技術(shù)和智能語音技術(shù),利用檔案行業(yè)規(guī)則和知識庫學(xué)習(xí),創(chuàng)新數(shù)字化加工應(yīng)用,提升了整體效能近一半。首款檔案行業(yè)AI創(chuàng)新型產(chǎn)品——訊飛檔案機的推出,也是人工智能在檔案管理中的重要應(yīng)用。上述先進成果和技術(shù)應(yīng)用,在科大訊飛強大的科研實力推動下,為檔案管理工作注入了新的活力,對檔案事業(yè)的未來發(fā)展起到了至關(guān)重要的作用。
鑒于此,高校應(yīng)充分認識到人工智能在檔案工作中的重要性,并依托高校自身強大的科研實力,積極推動人工智能技術(shù)在檔案工作中技術(shù)研發(fā)和應(yīng)用。一方面可以在高校檔案協(xié)會的統(tǒng)籌協(xié)調(diào)下,建立區(qū)域性的高校研發(fā)團隊,并加強與相關(guān)企業(yè)的交流合作,實現(xiàn)研發(fā)工作的集約化推進。另一方面高校還可以與互聯(lián)網(wǎng)企業(yè)、檔案機構(gòu)、科研機構(gòu)等開展跨界協(xié)同合作,實現(xiàn)技術(shù)研發(fā)與應(yīng)用實踐的深度融合,不斷優(yōu)化和完善人工智能技術(shù)在高校檔案工作中的應(yīng)用體系。只有這樣,高校檔案工作才能更好地應(yīng)對數(shù)字化時代帶來的挑戰(zhàn)和機遇,不斷提升智能化水平。
4.3 完善智能化檔案管理系統(tǒng)。為了更有效地運用人工智能技術(shù),高校應(yīng)構(gòu)建一個全面且高效的檔案管理技術(shù)體系。這一體系需涵蓋自動化檔案管理、智能化檔案推薦、個性化檔案服務(wù)以及檔案信息安全保障等核心技術(shù)模塊。這些模塊間的協(xié)同工作,將構(gòu)成一個全面智能化的高校檔案管理系統(tǒng)。具體來說,該系統(tǒng)應(yīng)能夠?qū)崿F(xiàn)檔案的自動分類、歸檔、檢索、借閱等操作流程,從而大幅提高工作效率。同時,根據(jù)用戶的需求和興趣,系統(tǒng)應(yīng)能夠智能推薦相關(guān)檔案信息和資源,提升用戶滿意度。在信息安全方面,系統(tǒng)需具備自動監(jiān)控、入侵檢測、加密保護等功能,確保檔案信息的安全性和保密性。此外,該系統(tǒng)還應(yīng)具備一些獨特功能,如智能提醒、自動排版和數(shù)字化處理等,以滿足高校檔案管理的特殊需求。目前,已有許多高校開始引入智能化檔案管理系統(tǒng),如中國科學(xué)技術(shù)大學(xué)的“智慧檔案館”和上海交通大學(xué)的“數(shù)字檔案館”等。這些成功案例表明,智能化檔案管理系統(tǒng)在高校的應(yīng)用前景廣闊,有望為高校檔案管理工作帶來革命性的變革。
4.4 加速檔案數(shù)字化進程。在人工智能領(lǐng)域,數(shù)據(jù)的質(zhì)量和數(shù)量對于技術(shù)的應(yīng)用至關(guān)重要。由于每個場景都有不同的數(shù)據(jù)分布和特征,需要大量的數(shù)據(jù)來支持人工智能系統(tǒng)的學(xué)習(xí)和訓(xùn)練。因此人工智能若要在高校檔案中能夠有效應(yīng)用,就必須加速檔案數(shù)字化,建立數(shù)字化檔案庫。一方面要大力推動高校檔案“增量電子化”;另一方面要利用新技術(shù)持續(xù)推進高校檔案“存量數(shù)字化”,將傳統(tǒng)紙質(zhì)檔案逐步轉(zhuǎn)化為數(shù)字檔案,同時可以進一步拓寬思路,用3D掃描技術(shù)將非紙質(zhì)的實體檔案數(shù)字化,以3D文件的形式存儲下來,逐步建立以檔案數(shù)字資源為主導(dǎo)的檔案資源體系。
在加速檔案數(shù)字化進程中,需要解決一些關(guān)鍵問題。一是制定檔案數(shù)字化戰(zhàn)略,明確檔案數(shù)字化目標和實施方案,細化各項工作任務(wù),明確責(zé)任部門和完成時限。對現(xiàn)有檔案資源進行全面梳理,區(qū)分輕重緩急,制定合理的檔案數(shù)字化工作計劃。針對不同類型的檔案,采用相應(yīng)的數(shù)字化技術(shù),如紙質(zhì)檔案掃描、電子檔案轉(zhuǎn)換等,將數(shù)字檔案建設(shè)作為一項系統(tǒng)性、長期性的工程。如英國國家檔案館為推進數(shù)字檔案資源建設(shè),分別于2017年和2019年相繼出臺了《國家檔案館數(shù)字戰(zhàn)略》和《國家檔案館數(shù)字能力建設(shè)戰(zhàn)略》。[15,16]二是選擇合適的數(shù)字化設(shè)備和軟件,確保數(shù)字化過程的準確性和完整性。升級檔案管理系統(tǒng),采用功能強大、安全可靠的檔案管理系統(tǒng),實現(xiàn)電子檔案的全程電子化管理。三是建立制度標準規(guī)范。數(shù)字化建設(shè)是一項系統(tǒng)工程,涉及范圍廣,需要從制度層面給予保障,制定一套切實可行的標準規(guī)范,[17]包括管理性標準規(guī)范建設(shè)、業(yè)務(wù)性標準規(guī)范建設(shè)以及技術(shù)性標準規(guī)范建設(shè),[18]通過建立完善的數(shù)字化管理流程和標準規(guī)范,明確電子檔案的生成、歸檔、存儲、利用和銷毀等環(huán)節(jié)的要求,完善電子檔案管理流程,確保電子檔案從生成、流轉(zhuǎn)、歸檔到利用的全過程都在可控、可追溯的范圍內(nèi),實現(xiàn)數(shù)字化工作的規(guī)范化和標準化。
4.5 提升檔案管理人員的數(shù)字化素養(yǎng)。數(shù)字化素養(yǎng)是指個體在信息社會中,為應(yīng)對信息化環(huán)境所必須具有的能力,包括運用現(xiàn)代信息技術(shù)進行信息獲取、處理、傳遞和應(yīng)用。對于高校檔案管理人員而言,數(shù)字化素養(yǎng)主要涵蓋以下幾個方面:首先,掌握檔案管理相關(guān)的數(shù)字化技術(shù),如計算機操作、網(wǎng)絡(luò)通信和數(shù)據(jù)庫查詢等;其次,熟悉檔案管理相關(guān)的軟件應(yīng)用,如檔案管理系統(tǒng)、圖像處理軟件和文本編輯軟件等;再次,具備數(shù)字化思維,能夠?qū)鹘y(tǒng)檔案管理方式與現(xiàn)代信息技術(shù)相結(jié)合,創(chuàng)新檔案管理方法;最后,擁有信息安全意識,確保檔案數(shù)據(jù)的安全性和完整性。這些素養(yǎng)對于高校檔案管理人員在信息化環(huán)境中高效、準確地管理檔案至關(guān)重要。
根據(jù)上述數(shù)字化素養(yǎng)具體構(gòu)成內(nèi)容,可以著重從以下四個方面去提升高校檔案管理人員的數(shù)字化素養(yǎng)。一是加強培訓(xùn)。讓他們掌握更多的數(shù)字化技術(shù)和管理知識。通過數(shù)字化技能培訓(xùn),包括數(shù)字化技術(shù)應(yīng)用能力、數(shù)字檔案資源的管理能力、數(shù)字化服務(wù)能力等,加速檔案管理人員掌握所需的數(shù)字化技能和知識,提高檔案管理人員的數(shù)字化技能水平。在培訓(xùn)工作中可以充分發(fā)揮設(shè)有檔案專業(yè)的高校、檔案學(xué)會、協(xié)會以及三方機構(gòu)等組織機構(gòu)的重要作用,探索檔案管理人員社會聯(lián)合培訓(xùn)的職業(yè)培養(yǎng)模式。二是強化引導(dǎo)。如通過宣傳、參觀交流、實際應(yīng)用、表彰激勵等措施,加強觀念引導(dǎo),不斷強化高校檔案工作者數(shù)字化意識,提高對電子檔案價值的認識,增強他們收集和保護電子檔案的自覺性。此外,還可以積極推進高校檔案工作數(shù)字化變革,不斷引進數(shù)字化技術(shù),以這種方式倒逼檔案工作人員形成并強化數(shù)字化意識。[19]三是建立一個良好的數(shù)字化環(huán)境,為檔案工作者提供更好的支持和保障。這包括提供先進的數(shù)字化硬件設(shè)備和軟件工具、建立完善的數(shù)字化檔案管理制度等。四是加強數(shù)據(jù)安全教育,讓檔案管理人員充分認識到數(shù)據(jù)安全的重要性,牢固樹立數(shù)據(jù)安全觀,并不斷掌握數(shù)據(jù)保護的方法。
4.6 保障檔案信息安全。高校檔案工作中應(yīng)用人工智能技術(shù),必須采取一系列嚴格的安全措施,堅持“以防為主,防治結(jié)合”的原則,確保檔案信息安全。一是建立完善的信息安全管理制度,包括機房管理、網(wǎng)絡(luò)管理、數(shù)據(jù)及加密管理、應(yīng)急處理等制度。通過制度規(guī)范檔案管理人員的操作行為,確保檔案信息的安全可靠。結(jié)合檔案利用環(huán)節(jié),將借閱審批的流程、檔案文件的復(fù)制簽章和歸檔交接等業(yè)務(wù)內(nèi)容涉及的安全管理要求,利用安全技術(shù)措施形成管理系統(tǒng)功能。二是利用智能防火墻和入侵檢測技術(shù)。實時發(fā)現(xiàn)并阻斷外部攻擊和內(nèi)部泄露,應(yīng)用數(shù)據(jù)加密技術(shù)保護師生個人信息的機密性,防止信息被未經(jīng)授權(quán)的第三方獲取。三是定時對檔案數(shù)據(jù)進行備份。數(shù)據(jù)備份并脫機保存到其他介質(zhì)上,同時運用云備份技術(shù)將檔案信息備份到云端,實現(xiàn)遠程備份,防止網(wǎng)絡(luò)遭到攻擊或違規(guī)操作等造成檔案信息丟失或更改。例如,科大訊飛的檔案超腦平臺2.0版本內(nèi)置專業(yè)語料庫,形成完全本地化保存的檔案數(shù)據(jù),實現(xiàn)與互聯(lián)網(wǎng)的完全隔離,保證檔案數(shù)據(jù)的安全可靠。[20]四是制定合理的災(zāi)備策略。若突發(fā)緊急事件,將數(shù)字檔案信息存儲的安全性和完整性作為首要考慮內(nèi)容,確保數(shù)字檔案信息能夠在第一時間調(diào)出,并能夠迅速恢復(fù)數(shù)字檔案信息。上述各項措施的全面落實,可以構(gòu)建一個安全、可靠且高效的檔案安全管理系統(tǒng)。