摘要:隨著大數(shù)據(jù)和人工智能技術(shù)的飛速發(fā)展,高校數(shù)字檔案館的建設(shè)面臨前所未有的機(jī)遇。本文深入探討了大數(shù)據(jù)和人工智能時(shí)代高校數(shù)字檔案館的建設(shè)思路,分析了當(dāng)前高校檔案館數(shù)字化建設(shè)的特點(diǎn)和現(xiàn)狀,提出了針對性的建設(shè)策略,如多渠道拓展數(shù)字資源、應(yīng)用人工智能技術(shù)挖掘大數(shù)據(jù)、建立數(shù)字檔案管理系統(tǒng),加強(qiáng)智能化、個(gè)性化服務(wù)、構(gòu)筑信息安全防護(hù)體系等,以有效提升高校數(shù)字檔案館的服務(wù)水平,為高校的教學(xué)、管理、科研提供有力支持,為發(fā)展新質(zhì)生產(chǎn)力、服務(wù)經(jīng)濟(jì)社會(huì)發(fā)展發(fā)揮應(yīng)有的作用。
關(guān)鍵詞:大數(shù)據(jù)和人工智能時(shí)代;高校;數(shù)字檔案館;策略
高校作為知識(shí)和信息的信源地、集散地,其檔案館承載著記錄學(xué)校歷史、教學(xué)、科研等重要信息的使命,如何構(gòu)建一個(gè)適應(yīng)大數(shù)據(jù)時(shí)代需求、融合人工智能技術(shù)的高校數(shù)字檔案館,已經(jīng)成為各高校信息化建設(shè)的重要方面。
一、大數(shù)據(jù)和人工智能時(shí)代高校檔案館建設(shè)面臨的機(jī)遇
在大數(shù)據(jù)和AI迅猛發(fā)展的背景下,高校檔案館數(shù)字化建設(shè)和發(fā)展面臨一些新的機(jī)遇。一是高校檔案數(shù)字化建設(shè)是落實(shí) “十四五”規(guī)劃、實(shí)現(xiàn)檔案資源數(shù)字轉(zhuǎn)型的必然要求。中辦、國辦印發(fā)的 《“十四五”全國檔案事業(yè)發(fā)展規(guī)劃》明確提出加快檔案資源數(shù)字轉(zhuǎn)型,加強(qiáng)國家檔案數(shù)字資源規(guī)劃管理,逐步建立以檔案數(shù)字資源為主導(dǎo)的檔案資源體系。[1]二是大數(shù)據(jù)和人工智能技術(shù)的發(fā)展為高校檔案館建設(shè)提供了更廣闊的空間。大數(shù)據(jù)和人工智能技術(shù)的應(yīng)用可以推動(dòng)高校檔案建設(shè)的數(shù)字化轉(zhuǎn)型,傳統(tǒng)的檔案管理方式、方法已經(jīng)不能適應(yīng)信息化建設(shè)要求,而通過大數(shù)據(jù)技術(shù),可以將紙質(zhì)檔案轉(zhuǎn)化為電子檔案,實(shí)現(xiàn)檔案信息的數(shù)字化管理,這不僅可以節(jié)省存儲(chǔ)空間、提高管理效率,還方便用戶進(jìn)行遠(yuǎn)程訪問。三是高校檔案館數(shù)字化建設(shè)是人工智能發(fā)展的內(nèi)在要求,承擔(dān)著為 “數(shù)字檔案館”向 “智慧檔案館”轉(zhuǎn)變提供 “海量”數(shù)據(jù)的任務(wù)。大數(shù)據(jù)技術(shù)可以幫助高校檔案館實(shí)現(xiàn)數(shù)據(jù)資源的整合和共享,高校各部門在日常工作中會(huì)產(chǎn)生大量的數(shù)據(jù)資源,這些數(shù)據(jù)資源對于檔案建設(shè)具有重要價(jià)值,通過大數(shù)據(jù)技術(shù),可以將這些分散的數(shù)據(jù)資源進(jìn)行整合,實(shí)現(xiàn)數(shù)據(jù)的互通互聯(lián),這些 “海量”的數(shù)字資源為人工智能技術(shù)應(yīng)用于檔案數(shù)字化建設(shè)打下了堅(jiān)實(shí)的基礎(chǔ)。
二、高校檔案館特點(diǎn)和當(dāng)前數(shù)字化建設(shè)現(xiàn)狀
(一)高校檔案館特點(diǎn)是館藏檔案資源數(shù)量大、種類多但價(jià)值密度偏低
高校檔案館大多館藏了建校以來大量的原始實(shí)體檔案。以筆者所在的臨沂大學(xué)為例,該校庫藏黨群、行政、教學(xué)、科研、外事、財(cái)會(huì)等十大類檔案共計(jì)5.7萬余卷 (冊),檔案數(shù)據(jù)信息達(dá)到了3.9TB,隨著紙質(zhì)檔案數(shù)字化加工和檔案館信息化建設(shè)進(jìn)程,檔案數(shù)據(jù)容量正呈指數(shù)級增長。隨著信息技術(shù)的快速發(fā)展,高校檔案館不再局限于傳統(tǒng)的紙質(zhì)實(shí)體檔案,而是納入了多元數(shù)據(jù),不僅包括電子文件、聲像、圖表等,還涵蓋社交媒體數(shù)據(jù)、系統(tǒng)流程數(shù)據(jù)等各種形式的信息。這些數(shù)據(jù)的格式多樣且來源于不同的部門、機(jī)構(gòu),每個(gè)部門都有其獨(dú)特的數(shù)據(jù)生成方式,不同的數(shù)據(jù)格式也帶來了存儲(chǔ)方式的多樣化。此外,高校檔案館的館藏?cái)?shù)量大、數(shù)據(jù)種類多,意味著數(shù)據(jù)價(jià)值密度的降低,因?yàn)榉从惩粚ο蟮臋n案可能分散在不同的數(shù)據(jù)類型中,需要通過對各種數(shù)據(jù)進(jìn)行提取、分析,才能發(fā)現(xiàn)其潛在的價(jià)值。高校檔案館保存了大量反映高校歷史、教學(xué)、科研等方面的珍貴檔案,具有很高的保存價(jià)值,對于學(xué)校的決策、規(guī)劃、育人等方面具有重要的應(yīng)用價(jià)值。以臨沂大學(xué)為例,該校始于抗戰(zhàn)時(shí)期的抗大一分校,學(xué)校館藏了大量抗戰(zhàn)時(shí)期師生抗日斗爭的珍貴史料,這些史料對于學(xué)校開展愛國主義教育、堅(jiān)守共產(chǎn)黨人的初心使命具有很高的研究、宣傳價(jià)值。然而,正是因?yàn)楦咝n案中涉及的信息種類多,這些檔案可能存在相互關(guān)聯(lián)或重復(fù)的情況,因此,高校檔案館需要采用有效的技術(shù)手段,提高檔案數(shù)據(jù)的價(jià)值密度。[2]
(二)高校檔案館數(shù)字化建設(shè)現(xiàn)狀
一是材料歸檔方式單一,數(shù)據(jù)資源收集主動(dòng)性不強(qiáng)。當(dāng)前,大多高校僅依靠人工進(jìn)行數(shù)據(jù)信息搜集,不僅難以保障信息的準(zhǔn)確性、完整性,還大大增加了管理工作的難度。許多高校數(shù)字檔案管理缺少與時(shí)俱進(jìn)的制度設(shè)計(jì),其原有的管理制度已跟不上數(shù)字化發(fā)展的需要。[3]尤其缺少各類專門數(shù)字檔案管理制度,導(dǎo)致數(shù)據(jù)檔案的歸檔不全面、不完整、隨機(jī)性比較強(qiáng)。沒有實(shí)現(xiàn)電子文件 “應(yīng)歸盡歸”和電子檔案 “應(yīng)收盡收”。二是部分高校檔案管理系統(tǒng)老化,基礎(chǔ)設(shè)備落后、服務(wù)效率較低。目前,各高校都在大力推進(jìn)檔案數(shù)字化建設(shè),檔案數(shù)字化資源占比逐漸提高,但由于一些高校檔案管理部門投入有限,未配備信息化管理平臺(tái)或管理平臺(tái)落后,缺少對檔案信息統(tǒng)計(jì)、信息數(shù)據(jù)分析、數(shù)據(jù)管理等功能的升級和大數(shù)據(jù)技術(shù)的使用,不能完全適應(yīng)當(dāng)前檔案管理數(shù)字化的發(fā)展需要,無法提供簡潔、高效的智能化服務(wù)。三是檔案管理和服務(wù)觀念還較為傳統(tǒng)和保守。目前,各高校檔案還是以紙質(zhì)檔案為主,隨著高校檔案數(shù)字化建設(shè)的發(fā)展,檔案管理人員轉(zhuǎn)變傳統(tǒng)檔案管理和服務(wù)觀念勢在必行,將 “重藏輕用”的觀念向 “藏用并重”轉(zhuǎn)變,提升檔案管理人員的業(yè)務(wù)能力和服務(wù)意識(shí)。
三、大數(shù)據(jù)和人工智能時(shí)代高校數(shù)字檔案館建設(shè)思路
(一)多渠道拓展數(shù)字資源,為數(shù)字檔案館建設(shè)“筑底”
高校作為國家重要的人才聚集地,讓科研學(xué)術(shù)資源、創(chuàng)新成果更好地服務(wù)于經(jīng)濟(jì)社會(huì)發(fā)展,是發(fā)展新質(zhì)生產(chǎn)力的內(nèi)在要求。沒有大量基礎(chǔ)數(shù)據(jù)資源的支撐并完成高校檔案數(shù)字化,在數(shù)字檔案館建設(shè)中人工智能技術(shù)將無用武之地,所以,拓展數(shù)字資源建設(shè)是實(shí)現(xiàn)數(shù)字檔案館的首要任務(wù)。以下從三個(gè)角度進(jìn)行分析,首先,從技術(shù)角度分析,高??梢岳门老x技術(shù)、API接口等方式,自動(dòng)收集數(shù)據(jù)資源,整合到數(shù)字檔案館中,通過大數(shù)據(jù)分析,對收集到的數(shù)字資源進(jìn)行深入挖掘,提取有價(jià)值的信息,然后使用云計(jì)算、分布式存儲(chǔ)等技術(shù),實(shí)現(xiàn)數(shù)字資源的高效管理;其次,從用戶角度分析,充分利用人工智能大模型,通過用戶行為分析等方式,了解用戶對數(shù)字資源的需求,為資源建設(shè)提供指導(dǎo),這一過程中要優(yōu)化檢索界面、增強(qiáng)交互性等,并建立用戶反饋系統(tǒng),及時(shí)收集用戶意見,持續(xù)改進(jìn)數(shù)字資源建設(shè)和用戶服務(wù)體驗(yàn);最后,從管理角度分析,要制訂數(shù)字資源建設(shè)計(jì)劃,明確建設(shè)目標(biāo),并建立數(shù)字資源的質(zhì)量評估標(biāo)準(zhǔn),確保資源的準(zhǔn)確性,此外還要與其他機(jī)構(gòu)建立合作關(guān)系,共享、共建數(shù)字資源。
(二)應(yīng)用人工智能技術(shù)挖掘大數(shù)據(jù),為數(shù)字檔案館建設(shè)“筑基”
高校數(shù)字檔案館收集、歸檔、存儲(chǔ)大量數(shù)字資源,目的是充分利用這些資源,開展大數(shù)據(jù)挖掘、分析、提取工作,以發(fā)現(xiàn)隱藏在數(shù)據(jù)中的有價(jià)值的信息。所以,高校數(shù)字檔案館需要組建一支具備數(shù)據(jù)挖掘技能的專業(yè)團(tuán)隊(duì),設(shè)計(jì)挖掘項(xiàng)目,明確挖掘目標(biāo)、范圍、標(biāo)準(zhǔn)和要求,除了挖掘本校檔案館內(nèi)的資源,團(tuán)隊(duì)還需要整合其他來源的數(shù)據(jù),多源數(shù)據(jù)的整合有助于發(fā)現(xiàn)更全面的信息。此外,數(shù)據(jù)挖掘團(tuán)隊(duì)要充分運(yùn)用人工智能數(shù)據(jù)挖掘技術(shù),幫助團(tuán)隊(duì)從海量數(shù)據(jù)中提取出有效信息,不斷加強(qiáng)機(jī)器學(xué)習(xí),優(yōu)化挖掘策略,以提高挖掘結(jié)果的準(zhǔn)確性。[4]在智能分類檔案信息時(shí),AI技術(shù)可以按照不同的檔案介質(zhì),運(yùn)用相應(yīng)的關(guān)鍵技術(shù)對其進(jìn)行智能化分類。數(shù)字檔案館可以運(yùn)用人工智能技術(shù)來智能挖掘檔案信息,運(yùn)用數(shù)據(jù)挖掘技術(shù)進(jìn)行檔案價(jià)值的智能鑒定。最終的挖掘結(jié)果要以易于理解的方式呈現(xiàn)給用戶,所以團(tuán)隊(duì)需要使用數(shù)據(jù)可視化工具,將挖掘結(jié)果以圖表、報(bào)告、語音等形式展示出來,并解釋其含義和應(yīng)用價(jià)值。
(三)多體系支撐為數(shù)字檔案館建設(shè)“筑路”
1.數(shù)字檔案管理系統(tǒng)
高校數(shù)字檔案館的建設(shè)要注重系統(tǒng)的整合性和功能性,建立數(shù)字檔案管理系統(tǒng),是實(shí)現(xiàn)這一目標(biāo)的關(guān)鍵。明確數(shù)字檔案管理系統(tǒng)的整體架構(gòu)和技術(shù)路線,通過調(diào)研,深入了解用戶對數(shù)字檔案管理的具體需求,根據(jù)需求分析結(jié)果設(shè)計(jì)系統(tǒng)的各個(gè)模塊,確保系統(tǒng)能夠滿足用戶的需求。選擇合適的技術(shù),進(jìn)行系統(tǒng)的開發(fā)工作,高??梢圆捎媚K化的設(shè)計(jì)思想,提高系統(tǒng)的可擴(kuò)展性。將高校數(shù)字檔案館現(xiàn)有的數(shù)字資源進(jìn)行整合,確保它們能夠無縫地集成到新的數(shù)字檔案管理系統(tǒng)中,并將舊系統(tǒng)中的數(shù)據(jù)遷移到新系統(tǒng)中,確保數(shù)據(jù)的完整性,充分利用AI技術(shù),根據(jù)用戶需求,實(shí)現(xiàn)數(shù)據(jù)分析、個(gè)性化推薦等高級功能,提升系統(tǒng)的使用價(jià)值。[5]
2.檔案資源數(shù)據(jù)庫
高校數(shù)字檔案館要構(gòu)建一個(gè)全面、靈活的檔案資源數(shù)據(jù)庫,以滿足日益增長的數(shù)據(jù)存儲(chǔ)、檢索和利用需求。要分析高校檔案資源的種類、存儲(chǔ)需求等,明確數(shù)據(jù)庫的建設(shè)目標(biāo),根據(jù)需求分析結(jié)果,設(shè)計(jì)數(shù)據(jù)庫的邏輯結(jié)構(gòu)和物理結(jié)構(gòu),通過自動(dòng)化工具、人工錄入等方式,構(gòu)建多主體參與、多渠道供給、多形式服務(wù)的數(shù)字檔案資源供給體系,收集高校內(nèi)部的各類檔案資源,充分發(fā)揮數(shù)字化 “工具箱”作用,構(gòu)建穩(wěn)定、可靠的數(shù)據(jù)庫管理系統(tǒng)。
(四)以人工智能技術(shù)為支撐,為數(shù)字檔案館實(shí)現(xiàn)智慧服務(wù)“筑智”
1.建立用戶需求感知引擎和智能化人機(jī)交互系統(tǒng)
檔案工作者要緊密關(guān)注用戶需求,并據(jù)此不斷優(yōu)化服務(wù)內(nèi)容,建立用戶需求感知引擎和智能化人機(jī)交互系統(tǒng)。要明確需求感知引擎的主要目標(biāo),并通過用戶調(diào)查等多種渠道,收集用戶的訪問記錄、反饋意見等數(shù)據(jù)。人工智能促使人機(jī)交互從傳統(tǒng)的 “由輸入到反饋”循環(huán)轉(zhuǎn)變?yōu)橹悄艿?“由推薦到選擇”循環(huán),在此基礎(chǔ)上,數(shù)字檔案館可以建立智能檔案信息利用服務(wù)系統(tǒng),通過該系統(tǒng)與利用者進(jìn)行語音交互、視覺交互以及觸覺交互,從而向利用者提供個(gè)性化的智能服務(wù)。利用系統(tǒng)分析工具對交互數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)用戶的訪問規(guī)律、檢索頻率、常用服務(wù)、興趣偏好等,根據(jù)數(shù)據(jù)分析結(jié)果,建立用戶需求感知模型,這一模型能夠識(shí)別用戶的顯性需求和隱性需求,并為用戶提供個(gè)性化的服務(wù)推薦。此外,要建立實(shí)時(shí)響應(yīng)機(jī)制,確保需求感知引擎能夠在第一時(shí)間捕捉到用戶的需求變化,向用戶提供更高品質(zhì)的個(gè)性化、智慧化服務(wù)。
2.提升遠(yuǎn)程服務(wù)智能和效能
高校數(shù)字檔案館不僅需要滿足校內(nèi)師生的需求,還要積極向校外用戶提供服務(wù),而當(dāng)前大多數(shù)檔案館的查檔方式還是實(shí)地查檔,所以,提升遠(yuǎn)程服務(wù)能力是非常重要的。一是要將人工智能大模型運(yùn)用到高校數(shù)字檔案館建設(shè)之中,利用基于AI的自動(dòng)化處理引擎,進(jìn)一步降本增效;二是要積極運(yùn)用、優(yōu)化遠(yuǎn)程智能訪問界面,設(shè)計(jì)簡潔的用戶界面和交互語言,確保校外用戶能夠輕松訪問檔案資源;三是要加強(qiáng)宣傳和用戶在線智能服務(wù),積極運(yùn)用官網(wǎng)、微信公眾號(hào)等宣傳媒介積極宣傳、推廣數(shù)字檔案館的遠(yuǎn)程智能服務(wù),提高校外用戶的認(rèn)知度和使用率,幫助用戶更好地了解和使用遠(yuǎn)程智能服務(wù)。
(五)加強(qiáng)信息安全防護(hù)體系建設(shè),為數(shù)字檔案館建設(shè)“筑墻”
在大數(shù)據(jù)和人工智能時(shí)代,數(shù)字檔案館在為我們帶來便捷高效服務(wù)的同時(shí)也面臨更加嚴(yán)峻的安全挑戰(zhàn),構(gòu)筑高效的信息安全防護(hù)體系尤為重要。一是要制定信息安全政策,明確數(shù)字檔案館的信息安全要求,并定期對政策進(jìn)行審查,確保其適應(yīng)不斷變化的安全威脅;二是要對數(shù)字檔案館的硬件設(shè)施進(jìn)行加固,防止未經(jīng)授權(quán)訪問,并部署高性能的防火墻和入侵檢測系統(tǒng),防止惡意軟件的入侵,設(shè)計(jì)合理的訪問控制策略,確保只有授權(quán)用戶能夠訪問特定的數(shù)字檔案資源;三是要定期對數(shù)字檔案數(shù)據(jù)進(jìn)行備份,制訂應(yīng)急響應(yīng)計(jì)劃,以便在發(fā)生安全事故時(shí)迅速恢復(fù)數(shù)據(jù);四是嚴(yán)格落實(shí)數(shù)據(jù)檔案安全工作責(zé)任制,開展數(shù)據(jù)安全監(jiān)測預(yù)警、應(yīng)急演練、專項(xiàng)檢查,提升對數(shù)據(jù)檔案安全的態(tài)勢感知、應(yīng)急處置和追蹤溯源能力。
四、結(jié)束語
當(dāng)前,高校數(shù)字檔案館建設(shè)機(jī)遇與挑戰(zhàn)并存,通過多渠道拓展數(shù)字資源、應(yīng)用人工智能技術(shù)挖掘大數(shù)據(jù)、建立數(shù)字檔案管理系統(tǒng)和數(shù)據(jù)庫、構(gòu)筑信息安全防護(hù)體系等策略,可以構(gòu)建一個(gè)智能、安全、綠色、高效的數(shù)字檔案館,這不僅有利于提升高校檔案服務(wù)效率,還能為高校的科研和管理提供數(shù)據(jù)支持。推進(jìn)檔案事業(yè)數(shù)字化、智能化是一個(gè)系統(tǒng)性、長期性、漸進(jìn)性的過程,檔案工作人員還需要不斷加強(qiáng)理論探索和實(shí)踐創(chuàng)新,以適應(yīng)高校信息化發(fā)展需求,開創(chuàng)高校檔案數(shù)字化、智能化服務(wù)體系建設(shè)的新局面。
參考文獻(xiàn):
[1] 中辦國辦印發(fā) 《“十四五”全國檔案事業(yè)發(fā)展規(guī)劃》[EB/OL]. [2024-03-20].https://www.saac.gov.cn/daj/toutiao/202106/ecca2de5bce44a0eb55c890762868683.shtml.
[2] 余子丹.大數(shù)據(jù)時(shí)代高校數(shù)字檔案館建設(shè)思路[J].蘭臺(tái)世界,2018(12):50-53.
[3] 志偉.基于SWOT分析方法的高校數(shù)字檔案館建設(shè)思路探討[J].蘭臺(tái)世界,2023(07):59-63.
[4] 羅家靖.新 《檔案法》背景下高校數(shù)字檔案館建設(shè)突破路徑:以深圳大學(xué)數(shù)字檔案館建設(shè)為例[J].黑龍江檔案,2023(02):311-313.
[5] 李倩.人工智能對高校數(shù)字檔案館建設(shè)的影響與挑戰(zhàn)[J].辦公室業(yè)務(wù),2023(11):183-185+189.