文/隴東學(xué)院學(xué)科建設(shè)與研究生處 孟琰昕
隨著新一代信息技術(shù)特別是人工智能(Artificial Intelligence,即AI)技術(shù)應(yīng)用不斷深入,對(duì)檔案工作的運(yùn)行環(huán)境、工作模式、處理對(duì)象及服務(wù)要求等發(fā)生了巨大變化。而檔案工作作為一項(xiàng)存史育人的崇高事業(yè),迫切需要?jiǎng)?chuàng)新工作理念、服務(wù)方法和運(yùn)行模式。因此運(yùn)用人工智能技術(shù),實(shí)現(xiàn)檔案工作信息化戰(zhàn)略轉(zhuǎn)型,對(duì)于推動(dòng)“十四五”時(shí)期檔案事業(yè)高質(zhì)量發(fā)展,適應(yīng)國(guó)家治理體系和治理能力現(xiàn)代化要求具有十分重要的意義。
(一)檔案工作與人工智能結(jié)合是時(shí)代趨勢(shì)。人工智能是引領(lǐng)未來(lái)的前沿核心技術(shù),正在對(duì)經(jīng)濟(jì)發(fā)展、社會(huì)進(jìn)步和人類(lèi)生活產(chǎn)生深遠(yuǎn)影響。2017年,國(guó)務(wù)院在《新一代人工智能發(fā)展規(guī)劃》中提出了人工智能產(chǎn)業(yè)“三步走”的發(fā)展戰(zhàn)略,明確“在2030年之前要實(shí)現(xiàn)人工智能在生產(chǎn)生活、社會(huì)治理、國(guó)防建設(shè)各方面應(yīng)用的廣度深度極大拓展?!蹦壳?,隨著科研院校的廣泛參與,科技公司大力布局,人工智能技術(shù)開(kāi)始廣泛應(yīng)用于社交、金融、醫(yī)療、國(guó)防等多個(gè)領(lǐng)域,展現(xiàn)出可觀的商業(yè)價(jià)值和巨大的發(fā)展?jié)摿?。未?lái)十年,人工智能還將繼續(xù)引領(lǐng)科技發(fā)展,助力傳統(tǒng)行業(yè)革新。而檔案工作作為國(guó)家公共文化事業(yè)的重要組成部分,更需要積極順應(yīng)時(shí)代潮流和發(fā)展趨勢(shì),應(yīng)用新技術(shù),創(chuàng)新管理模式,提升服務(wù)質(zhì)效,實(shí)現(xiàn)轉(zhuǎn)型升級(jí)。
(二)檔案工作在大數(shù)據(jù)背景下的管理困境。大數(shù)據(jù)時(shí)代的顯著特點(diǎn)就是信息的爆炸式增長(zhǎng)。在當(dāng)前時(shí)代背景下,檔案資源在數(shù)量上呈現(xiàn)出指數(shù)級(jí)的增長(zhǎng),數(shù)據(jù)量級(jí)由傳統(tǒng)的GB、TB向PB發(fā)展,檔案資源種類(lèi)也隨之增多,包含文本檔案、語(yǔ)音檔案以及圖形檔案、聲像檔案等等,數(shù)據(jù)格式更是千差萬(wàn)別。在這種情況下,已不能單純依靠人力去完成檔案資源的搜集整理,如何實(shí)現(xiàn)檔案資源的科學(xué)管理與精準(zhǔn)查詢(xún),是目前檔案工作亟須解決的問(wèn)題。將人工智能技術(shù)應(yīng)用于檔案工作的全過(guò)程,創(chuàng)新檔案工作的管理方式,實(shí)現(xiàn)智能檢索、智能錄入、智能交互,是解決目前檔案工作管理困境的有效途徑之一。
(三)檔案工作的智能化服務(wù)需求不斷增強(qiáng)。隨著智慧服務(wù)理念的不斷深入,人們對(duì)檔案工作的要求,已經(jīng)由傳統(tǒng)的記錄、借閱變?yōu)榱烁又悄芑姆?wù)。迫切需要檔案工作加快開(kāi)放力度,擴(kuò)大利用范圍。人工智能作為一項(xiàng)逐漸完善的智能技術(shù),很大程度上滿(mǎn)足了人們對(duì)于檔案工作服務(wù)水平提升的要求。例如,借助基于人工智能的用戶(hù)畫(huà)像技術(shù),通過(guò)對(duì)用戶(hù)身份信息搜索、瀏覽和借閱記錄等結(jié)構(gòu)化數(shù)據(jù)及微博等社交軟件的言論進(jìn)行分析,發(fā)現(xiàn)用戶(hù)的隱性需求,進(jìn)而提供針對(duì)性的服務(wù)。還有利用人工智能的模糊識(shí)別技術(shù),降低用戶(hù)在檔案資料搜索查閱過(guò)程中的復(fù)雜度,提升資料的查閱效率。因此,人工智能技術(shù)能夠更好地從技術(shù)層面上提高檔案利用效率,提升檔案服務(wù)能力,使檔案工作更好地服務(wù)人民群眾,滿(mǎn)足人們的檔案信息需求。
(一)人工智能助力檔案工作的數(shù)字化轉(zhuǎn)型。當(dāng)前的檔案管理模式下,為了更好地對(duì)紙質(zhì)檔案、實(shí)物檔案、照片檔案等進(jìn)行保護(hù),在原始檔案收集整理完畢后,都會(huì)進(jìn)行數(shù)字化轉(zhuǎn)換,形成電子檔案。利用人工智能技術(shù),可以加速電子檔案的制作進(jìn)程。例如,對(duì)于口述類(lèi)型的語(yǔ)音檔案,可以采用基于人工智能的語(yǔ)音識(shí)別技術(shù),將語(yǔ)音轉(zhuǎn)換為電子文本進(jìn)行存儲(chǔ)。目前,已經(jīng)有公司提出了基于人工智能的語(yǔ)音識(shí)別解決方案,且有了大面積的商業(yè)使用,不僅可以對(duì)中英文等基本語(yǔ)種進(jìn)行識(shí)別,還包含多種方言的識(shí)別。此外,由于部分紙質(zhì)檔案受潮、破損,以及拍攝中部分因素導(dǎo)致在轉(zhuǎn)為電子檔案時(shí)出現(xiàn)圖像模糊、分辨率不足的情況,還可以利用基于深度學(xué)習(xí)的圖像處理技術(shù),進(jìn)行圖像增強(qiáng),超分辨率重建,提升檔案的使用價(jià)值。
對(duì)于已經(jīng)數(shù)字化的電子檔案,還需進(jìn)行價(jià)值鑒定,從而完成電子檔案的歸檔?!皺n案價(jià)值鑒定工作是一項(xiàng)專(zhuān)業(yè)性很強(qiáng)的檔案管理業(yè)務(wù)工作”,對(duì)鑒定人員的業(yè)務(wù)能力有著較高要求,然而在對(duì)海量的檔案資源進(jìn)行鑒定時(shí),僅僅依靠人力不僅需要耗費(fèi)較大精力,完成時(shí)效與工作質(zhì)量也難以保證。為解決這一問(wèn)題,可以利用基于人工智能的分類(lèi)技術(shù),形成對(duì)檔案價(jià)值進(jìn)行鑒定的智能體,其結(jié)構(gòu)如圖1所示,首先利用帶有價(jià)值標(biāo)簽的檔案資料庫(kù)作為訓(xùn)練樣本,對(duì)智能體進(jìn)行訓(xùn)練,使之能夠形成從檔案的文本屬性到價(jià)值屬性的推斷能力,隨后利用訓(xùn)練完畢的智能體對(duì)新的檔案資料進(jìn)行價(jià)值鑒定,進(jìn)而模擬檔案鑒定專(zhuān)家的決策過(guò)程。建立這樣的智能鑒別系統(tǒng)不僅能快速對(duì)檔案保管期限、保管密級(jí)和借閱權(quán)限做出判定,還能為錯(cuò)綜復(fù)雜的不確定事件提供最佳的解決方案和參考案例,從而提升檔案管理工作的智能化水平。
圖1 基于人工智能的電子檔案鑒別模型示意圖
(二)人工智能構(gòu)筑檔案工作的安全防線(xiàn)?!丁笆奈濉比珖?guó)檔案事業(yè)發(fā)展規(guī)劃》提出:“深入推進(jìn)檔案安全體系建設(shè),筑牢平安中國(guó)的檔案安全防線(xiàn)。”隨著檔案數(shù)字化轉(zhuǎn)型的不斷深入,檔案的安全問(wèn)題越來(lái)越受到重視。然而傳統(tǒng)的依靠人力的檔案管理工作存在較多不確定性,一旦檔案管理人員自身出現(xiàn)問(wèn)題,就很容易發(fā)生核心檔案資料泄露問(wèn)題。
基于人工智能的網(wǎng)絡(luò)態(tài)勢(shì)感知技術(shù)是將人工智能與安全防護(hù)相結(jié)合的新方案,且已經(jīng)應(yīng)用于電力網(wǎng)絡(luò)、計(jì)算機(jī)網(wǎng)絡(luò)以及通信網(wǎng)絡(luò)的安全防護(hù)之中。對(duì)于檔案安全工作而言,可以將每一份檔案存放在設(shè)備中,重點(diǎn)的檔案工作人員操作行為、檔案系統(tǒng)內(nèi)部網(wǎng)絡(luò)共同納入網(wǎng)絡(luò)安全態(tài)勢(shì)感知系統(tǒng)中,其結(jié)構(gòu)如圖2所示。
圖2 基于人工智能的網(wǎng)絡(luò)安全態(tài)勢(shì)感知系統(tǒng)
利用監(jiān)控設(shè)備觀察保存的實(shí)地狀態(tài),分析檔案存放設(shè)備的運(yùn)行情況,同時(shí)對(duì)檔案系統(tǒng)內(nèi)部網(wǎng)絡(luò)進(jìn)行流量監(jiān)測(cè)和入侵檢測(cè),及時(shí)發(fā)現(xiàn)可能的網(wǎng)絡(luò)攻擊行為,此外分析重點(diǎn)檔案工作的操作行為,查看是否存在越級(jí)操作及重要文件的泄露隱患。這樣將涉及檔案工作的各類(lèi)信息納入統(tǒng)一的管理態(tài)勢(shì)之中,形成對(duì)檔案安全的綜合感知,再利用人工智能常見(jiàn)算法進(jìn)行關(guān)聯(lián)分析,實(shí)時(shí)感知和預(yù)判檔案面臨的威脅,達(dá)到動(dòng)態(tài)監(jiān)測(cè)以及指導(dǎo)防護(hù)決策的目的。
(三)人工智能提升檔案工作的智能服務(wù)水平。《“十四五”全國(guó)檔案事業(yè)發(fā)展規(guī)劃》提出:“隨著人民生活水平的顯著提高,對(duì)檔案信息、檔案文化的需求日益增長(zhǎng),迫切要求各公共檔案館加快檔案開(kāi)放、擴(kuò)大檔案利用、提供優(yōu)質(zhì)高效服務(wù)?!比欢壳皺n案工作還存在開(kāi)放程度不高,公眾利用不便等問(wèn)題,可以采用以下基于人工智能的技術(shù)進(jìn)行改善:
一是基于人工智能的智能檢索技術(shù)。檔案資料快速檢索是開(kāi)展高質(zhì)量檔案信息服務(wù)的前提條件。近年來(lái),隨著電子檔案資源的大量增長(zhǎng),如何使用戶(hù)更為便捷地查詢(xún)到目標(biāo)結(jié)果變得越來(lái)越重要。傳統(tǒng)的檔案檢索,常常以標(biāo)題、關(guān)鍵字以及關(guān)聯(lián)度排序來(lái)展示搜索結(jié)果,這對(duì)沒(méi)有明確檢索目的的用戶(hù)來(lái)說(shuō),檢索難度較大。利用知識(shí)圖譜的智能檢索系統(tǒng),能夠通過(guò)對(duì)自然語(yǔ)言的語(yǔ)義解析,理解用戶(hù)操作意圖,通過(guò)推理計(jì)算形成用戶(hù)自然語(yǔ)言表達(dá)的內(nèi)容并反饋給用戶(hù)。因此,公共檔案館利用知識(shí)圖譜等智能檢索技術(shù),實(shí)現(xiàn)對(duì)館藏資源的智能化搜索,便于用戶(hù)更快捷地查詢(xún)自己需要的信息,提升檔案工作的服務(wù)效能。二是基于人工智能的推送。公共檔案館可以結(jié)合用戶(hù)的屬性數(shù)據(jù)與行為數(shù)據(jù)(之前的搜索記錄、檢索習(xí)慣等),利用大數(shù)據(jù)分析的方法,將用戶(hù)感興趣的信息和檔案服務(wù)進(jìn)行智能化、個(gè)性化的推送。從而幫助用戶(hù)減少資料搜索的時(shí)間,方便用戶(hù)了解自己的興趣,提升檔案館的綜合服務(wù)水平。三是基于人工智能的智能交互。當(dāng)用戶(hù)需要向檔案館咨詢(xún)問(wèn)題時(shí),傳統(tǒng)的交互方式是利用人工客服進(jìn)行一對(duì)一解答,這種方式等待時(shí)間較長(zhǎng),且只能在規(guī)定的時(shí)間和空間內(nèi)開(kāi)展,難以滿(mǎn)足用戶(hù)全時(shí)段的咨詢(xún)需求?;谌斯ぶ悄芗夹g(shù)的參考咨詢(xún)服務(wù),打破了傳統(tǒng)服務(wù)模式對(duì)時(shí)間和空間的依賴(lài)性。線(xiàn)上可以采用智能客服系統(tǒng),對(duì)客戶(hù)的常見(jiàn)問(wèn)題進(jìn)行解答,線(xiàn)下可以應(yīng)用智能咨詢(xún)機(jī)器人來(lái)提供服務(wù)。利用線(xiàn)上線(xiàn)下結(jié)合的方式,進(jìn)一步方便了用戶(hù)對(duì)檔案資源的利用,能夠提升服務(wù)效率和服務(wù)的滿(mǎn)意度。
《“十四五”全國(guó)檔案事業(yè)發(fā)展規(guī)劃》中特別強(qiáng)調(diào),檔案工作要緊跟科技發(fā)展,特別是開(kāi)展新一代信息技術(shù)在檔案管理中的應(yīng)用。本文從人工智能技術(shù)應(yīng)用于檔案工作的必要性及重點(diǎn)應(yīng)用場(chǎng)景兩個(gè)角度,論證了人工智能對(duì)于解決當(dāng)前檔案工作發(fā)展困境的重要意義。檔案工作者應(yīng)該抓住人工智能技術(shù)發(fā)展的時(shí)代契機(jī),推動(dòng)檔案工作創(chuàng)新發(fā)展,實(shí)現(xiàn)智能化轉(zhuǎn)型。