人工智能尤其是生成式人工智能,憑借其強(qiáng)大的學(xué)習(xí)、生成能力,在檔案智能分類、深度檢索、文本生成等方面展現(xiàn)出其強(qiáng)大優(yōu)勢(shì)。將人工智能技術(shù)應(yīng)用于檔案管理領(lǐng)域,推動(dòng)檔案管理從傳統(tǒng)向智能化加速演進(jìn),提升檔案管理效率,增強(qiáng)檔案服務(wù)質(zhì)量?!丁笆奈濉比珖?guó)檔案事業(yè)發(fā)展規(guī)劃》中就“十四五”時(shí)期,我國(guó)檔案面臨的形勢(shì)與挑戰(zhàn)分析時(shí)指出,新一代信息技術(shù)廣泛應(yīng)用,檔案工作環(huán)境、對(duì)象、內(nèi)容發(fā)生巨大變化,迫切要求創(chuàng)新檔案工作理念,加快全面智能升級(jí)。但人工智能技術(shù)應(yīng)用也在算法歧視、隱私保護(hù)、知識(shí)產(chǎn)權(quán)、檔案泄露、倫理合規(guī)等方面給檔案管理帶來(lái)全新挑戰(zhàn)。本文分析了人工智能技術(shù)在檔案管理中的應(yīng)用及其面臨的倫理風(fēng)險(xiǎn),提出了健全倫理治理機(jī)制,保障數(shù)據(jù)安全、遵守倫理規(guī)范的路徑措施等,保障人工智能技術(shù)應(yīng)用的安全。
1人工智能在檔案領(lǐng)域應(yīng)用場(chǎng)景分析
機(jī)器學(xué)習(xí)、知識(shí)圖譜、語(yǔ)言處理等人工智能技術(shù)應(yīng)用于檔案采集、整理、保管、利用等環(huán)節(jié),通過(guò)檔案語(yǔ)義關(guān)聯(lián)構(gòu)建,字符識(shí)別、全文建庫(kù)及檔案內(nèi)容深度理解、檢索,有效提高檔案管理智能化水平。人工智能均可在檔案管理收集、整理、保管、利用等環(huán)節(jié)場(chǎng)景中得到深度應(yīng)用。
1.1檔案收集
收集是指檔案館(室)接收及征集檔案和其他有關(guān)文獻(xiàn)的活動(dòng),是檔案工作的起點(diǎn)和基礎(chǔ)。數(shù)智時(shí)代,隨著辦公自動(dòng)化OA系統(tǒng)、HIS智慧醫(yī)療系統(tǒng)等業(yè)務(wù)應(yīng)用成為常態(tài),電子文件、音視頻資料、電子郵件等非結(jié)構(gòu)化、碎片化數(shù)據(jù)越來(lái)越多,傳統(tǒng)檔案收集模式難以適應(yīng)。通過(guò)應(yīng)用人工智能技術(shù),例如OCR技術(shù)、 Ωt -SNT算法、DFA搜索算法、語(yǔ)義分析、自然語(yǔ)言處理等技術(shù)[2],能夠識(shí)別敏感詞、判讀片段信息相似性等,抽取碎片化、非結(jié)構(gòu)化數(shù)據(jù)中的檔案特征信息(如主題、關(guān)鍵詞、人名、地名等),形成結(jié)構(gòu)化、語(yǔ)義化的檔案知識(shí)單元,運(yùn)用本體模型將知識(shí)單元組織為知識(shí)圖譜,使其符合檔案收集要求。
1.2檔案整理
檔案收集后,需要按照來(lái)源、全宗、事由等原則對(duì)檔案實(shí)體進(jìn)行分類、組合、排列、編號(hào)及編目,使之有序化。機(jī)器學(xué)習(xí)中文本分類算法人工智能技術(shù)的應(yīng)用,訓(xùn)練檔案分類模型,實(shí)現(xiàn)檔案自動(dòng)分類。包括樸素貝葉斯等監(jiān)督學(xué)習(xí)算法,以及聚類算法、主題模型等無(wú)監(jiān)督學(xué)習(xí)算法,通過(guò)分類模型的反復(fù)應(yīng)用,運(yùn)用知識(shí)圖譜技術(shù),建立基于檔案資源內(nèi)在聯(lián)系的語(yǔ)義網(wǎng)絡(luò)。如以醫(yī)院人事檔案為例,通過(guò)實(shí)體命名識(shí)別抽取醫(yī)院?jiǎn)T工姓名、學(xué)歷、職稱等基礎(chǔ)信息,再利用關(guān)聯(lián)關(guān)系抽取技術(shù)獲取該員工上下級(jí)、從業(yè)簡(jiǎn)歷等關(guān)系,構(gòu)建醫(yī)院完整的人事知識(shí)圖譜,借助圖譜鏈接預(yù)測(cè)等算法,形成圍繞該名員工的知識(shí)圖譜。又如輔助人工智能技術(shù)提取時(shí)長(zhǎng)、類型、題名等音視頻檔案條目著錄項(xiàng),經(jīng)結(jié)構(gòu)化數(shù)據(jù)標(biāo)簽、副本解析抽取至檔案著錄頁(yè)面,完成人工智能技術(shù)應(yīng)用于音視頻檔案的自動(dòng)著錄。
1.3檔案存儲(chǔ)
檔案管理部門(mén)根據(jù)《歸檔范圍和保管期限表》,綜合社會(huì)、歷史、時(shí)間等綜合因素,將具有保存價(jià)值的檔案存儲(chǔ)于檔案館(室)。由于人的主觀立場(chǎng)、觀點(diǎn)不同,判斷檔案價(jià)值也會(huì)因人而異,直接影響檔案價(jià)值判斷的客觀性,最終影響檔案存儲(chǔ)工作的質(zhì)量。此外,隨著信息技術(shù)的應(yīng)用,電子檔案數(shù)量和規(guī)模呈現(xiàn)出大幅增長(zhǎng)趨勢(shì),碎片化、非結(jié)構(gòu)化、海量化檔案數(shù)據(jù)、檔案知識(shí)需要對(duì)其進(jìn)行集中統(tǒng)一、分層分級(jí)存儲(chǔ)。應(yīng)用人工智能技術(shù)的語(yǔ)義分析,判斷其存儲(chǔ)歸檔年限范圍,增強(qiáng)了檔案價(jià)值的客觀性。此外,利用Hadoop、Spark等大數(shù)據(jù)框架,將分散于系統(tǒng)中的結(jié)構(gòu)化、非結(jié)構(gòu)化檔案數(shù)據(jù)進(jìn)行ETL處理,實(shí)現(xiàn)檔案數(shù)據(jù)集中存儲(chǔ)、集成融合。
1.4檔案利用
檔案具有存史資政育人功能,檔案利用的目的包括編研、展覽、鑒證、憑據(jù)等。人工智能技術(shù)應(yīng)用于檔案管理,通過(guò)智能檢索、知識(shí)圖譜、個(gè)性化推薦等,在信息處理效率及個(gè)性化利用服務(wù)方面發(fā)揮著重要作用。尤其是生成式人工智能技術(shù)應(yīng)用,通過(guò)生成模型、擴(kuò)散模型等訓(xùn)練,滿足檔案編研及敘事需求,還可提供可視化、多模態(tài)、多感官的體驗(yàn)形式,如音視頻自動(dòng)解說(shuō)播放、無(wú)障礙AI機(jī)器人等,為用戶提供沉浸式的服務(wù)體驗(yàn)。此外,生成式人工智能技術(shù)應(yīng)用讓檔案利用者能夠直接參與其中,實(shí)現(xiàn)檔案資源共享、產(chǎn)品共創(chuàng)、文化共建等4。尤其是AR、VR、三維可視化技術(shù)的應(yīng)用,讓檔案利用更具交互式、沉浸式,持續(xù)釋放檔案利用的活力。
2檔案管理倫理風(fēng)險(xiǎn)挑戰(zhàn)
2.1社會(huì)層面
人工智能技術(shù)是在特定背景下開(kāi)發(fā)、設(shè)計(jì)、訓(xùn)練,并隨著技術(shù)迭代、數(shù)據(jù)集的變化及檔案管理領(lǐng)域的行業(yè)變革。人工智能技術(shù)應(yīng)用表現(xiàn)出的算法歧視、偏見(jiàn)影響檔案“存史資政育人”社會(huì)功能的發(fā)揮。此外,人工智能技術(shù)作為一項(xiàng)前沿科技,在檔案管理領(lǐng)域的應(yīng)用還處于探索完善階段,社會(huì)層普通公眾在檔案利用過(guò)程中應(yīng)用人工智能技術(shù)的認(rèn)可度、接納度還較低。即人工智能技術(shù)應(yīng)用于檔案管理領(lǐng)域面臨著的算法偏見(jiàn)、算法歧視等問(wèn)題,挑戰(zhàn)社會(huì)公平正義。
2.2經(jīng)濟(jì)層面
人工智能技術(shù)及其應(yīng)用成本高,檔案管理中引人人工智能技術(shù),要發(fā)揮人工智能技術(shù)優(yōu)勢(shì),離不開(kāi)大量檔案數(shù)據(jù)信息及先進(jìn)的人工智能技術(shù),這都需要一定的物質(zhì)做基礎(chǔ)。人工智能技術(shù)先進(jìn)性及經(jīng)費(fèi)高投入的特性,使其在檔案管理中的應(yīng)用及推廣受到制約,尤其是人員較少、經(jīng)費(fèi)保障較低的檔案管理部門(mén)難以突破現(xiàn)實(shí)窠白。此外,AI模型訓(xùn)練及運(yùn)行高能耗,也是對(duì)“雙碳”目標(biāo)及可持續(xù)發(fā)展理念的現(xiàn)實(shí)挑戰(zhàn)。
2.3技術(shù)層面
人工智能技術(shù)應(yīng)用于檔案管理面臨著技術(shù)倫理風(fēng)險(xiǎn),主要表現(xiàn)在:一方面是技術(shù)高度依賴與技術(shù)不信任之間的矛盾。人工智能技術(shù)廣泛應(yīng)用于檔案收集、整理、存儲(chǔ)及利用全過(guò)程、各環(huán)節(jié),檔案管理對(duì)人工智能技術(shù)的依賴性越來(lái)越深。但由于人工智能缺乏檔案管理的合規(guī)標(biāo)準(zhǔn)評(píng)價(jià),易導(dǎo)致檔案信息丟失,技術(shù)應(yīng)用不能解決檔案管理中所有現(xiàn)實(shí)問(wèn)題。另一方面是程序透明要求與解釋之間缺乏有效兼顧。人工智能技術(shù)算法“黑箱”,影響檔案管理可信、公正,管理結(jié)果缺乏可解釋性。此外,算法歸檔與保存也存在倫理風(fēng)險(xiǎn)。人工智能算法依賴于特定運(yùn)行環(huán)境、訓(xùn)練數(shù)據(jù)集及技術(shù)支持,人工智能技術(shù)迭代、檔案管理標(biāo)準(zhǔn)變化都會(huì)導(dǎo)致算法無(wú)法在未來(lái)環(huán)境中正常運(yùn)行,導(dǎo)致檔案無(wú)法識(shí)別、讀取等。
2.4法律層面
人工智能技術(shù)應(yīng)用于檔案管理,易造成數(shù)據(jù)隱私、版權(quán)、所有權(quán)、權(quán)責(zé)歸屬等方面的倫理風(fēng)險(xiǎn)。主要表現(xiàn)在:人工智能技術(shù)接觸大量敏感數(shù)據(jù)信息,技術(shù)本身易成為攻擊對(duì)象,導(dǎo)致敏感數(shù)據(jù)隱私被泄露,威脅檔案安全。人工智能應(yīng)用于檔案輔助管理生成的原生電子檔案,其原生性派生出“原創(chuàng)性”,涉及電子檔案版權(quán)及歸屬問(wèn)題。此外,人工智能技術(shù)應(yīng)用于檔案管理系統(tǒng),易出現(xiàn)責(zé)任不明,尤其是辦公自動(dòng)化、業(yè)務(wù)應(yīng)用系統(tǒng)處理檔案信息時(shí),對(duì)于檔案管理出現(xiàn)信息缺失、數(shù)據(jù)錯(cuò)誤歸責(zé)于算法本身、檔案工作者還是技術(shù)提供者存在較大爭(zhēng)議。
3檔案管理倫理風(fēng)險(xiǎn)原因
3.1工具理性與價(jià)值理性的內(nèi)在張力關(guān)系
工具理性偏重追求技術(shù)效能最大化,而價(jià)值理性則更強(qiáng)調(diào)符合人文倫理,二者既有矛盾又相互依存。人工智能技術(shù)作為應(yīng)用于檔案管理的輔助工具,是檔案管理者基于人工智能技術(shù)輔助的工具價(jià)值理性分析,對(duì)工具應(yīng)用產(chǎn)生價(jià)值期許,達(dá)到檔案管理的預(yù)期目的或效果。而價(jià)值理性則是檔案管理者有意識(shí)地對(duì)檔案管理行為的無(wú)條件、固有價(jià)值的純粹信仰,如電子檔案“四性”目標(biāo)等。人工智能技術(shù)應(yīng)用于檔案管理,工具理性是用,價(jià)值理性是本,工具理性服務(wù)于價(jià)值理性,并通過(guò)價(jià)值理性來(lái)實(shí)現(xiàn)或評(píng)價(jià)工具理性。但在此過(guò)程中人工智能技術(shù)迭代升級(jí),檔案人員的價(jià)值理性未必能與工具理性相耦合,存在滯后于工具理性,導(dǎo)致人工智能技術(shù)各種風(fēng)險(xiǎn)的發(fā)生。
3.2算法黑箱與技術(shù)不確定性的內(nèi)在因素
從人工智能技術(shù)應(yīng)用于檔案管理所引起的倫理風(fēng)險(xiǎn)內(nèi)部因素分析來(lái)看,主要是算法黑箱及技術(shù)自身不確定性所致。前者,主要是指人工智能技術(shù)應(yīng)用越來(lái)越具有類人屬性,且算法的自主性更強(qiáng),算法隱層的存在勢(shì)必會(huì)出現(xiàn)“算法黑箱”,所帶來(lái)的直接影響便是技術(shù)應(yīng)用的不可預(yù)測(cè)性、不可解釋性,增加了技術(shù)應(yīng)用的倫理風(fēng)險(xiǎn)。后者,主要表現(xiàn)為人工智能技術(shù)的現(xiàn)實(shí)應(yīng)用和未來(lái)發(fā)展為人類增加很多不確定性,即技術(shù)迭代升級(jí)帶來(lái)不確定性,將其應(yīng)用到檔案管理,也會(huì)產(chǎn)生不確定性信息,基于這些不確定性信息做出的分析、評(píng)估,同樣會(huì)導(dǎo)致檔案知識(shí)信息自身的不確定性。
3.了感知倫理風(fēng)險(xiǎn)與應(yīng)對(duì)不足的外在原因
人工智能技術(shù)應(yīng)用于檔案管理存在倫理風(fēng)險(xiǎn),可甄別出的倫理風(fēng)險(xiǎn)感知影響因素有個(gè)體自主論、文化塑造論、資源分配論、社會(huì)信任論5,基于檔案管理者知識(shí)體系及其認(rèn)知差異,所感知到的人工智能技術(shù)應(yīng)用倫理風(fēng)險(xiǎn)也有差異,或淪為“工具人”,對(duì)人工智能技術(shù)全盤(pán)接受,忽視技術(shù)應(yīng)用背后的倫理風(fēng)險(xiǎn)。此外,檔案管理部門(mén)缺乏有效應(yīng)對(duì)倫理風(fēng)險(xiǎn)的機(jī)制,一旦引發(fā)檔案管理倫理風(fēng)險(xiǎn),就會(huì)成為風(fēng)險(xiǎn)的制造者和承受著。
4人工智能應(yīng)用下檔案管理倫理風(fēng)險(xiǎn)的應(yīng)對(duì)
4.1制度:健全檔案安全標(biāo)準(zhǔn)體系
人工智能應(yīng)用于檔案管理,使檔案管理內(nèi)外部安全形勢(shì)發(fā)生巨大變化,需要從制度層面規(guī)避倫理風(fēng)險(xiǎn)。圍繞《國(guó)家新一代人工智能標(biāo)準(zhǔn)體系建設(shè)指南》《生成式人工智能服務(wù)管理暫行辦法》等人工智能方面的政策文件,結(jié)合《檔案法》《檔案法實(shí)施條例》等法律法規(guī),進(jìn)一步健全檔案安全管理行業(yè)標(biāo)準(zhǔn)、規(guī)范體系,明確人工智能應(yīng)用于檔案收集、整理、存儲(chǔ)與利用場(chǎng)景的標(biāo)準(zhǔn)規(guī)范,如生成式人工智能檔案管理規(guī)則,制定人工智能倫理風(fēng)險(xiǎn)監(jiān)管制度等,確保全生命周期倫理風(fēng)險(xiǎn)得到有效應(yīng)對(duì)。
4.2技術(shù):夯實(shí)檔案安全技術(shù)屏障
人工智能技術(shù)應(yīng)用改變了傳統(tǒng)檔案的管理模式,也使其在社會(huì)、經(jīng)濟(jì)、技術(shù)及法律等層面面臨全新的倫理風(fēng)險(xiǎn)挑戰(zhàn)。針對(duì)人工智能應(yīng)用的特點(diǎn)及規(guī)律,引入?yún)^(qū)塊鏈、數(shù)字孿生技術(shù)、可信時(shí)間戳、非對(duì)稱加密技術(shù)等前沿科技,為檔案管理加把“安全鎖”。此外,要注重各種先進(jìn)技術(shù)的集成應(yīng)用,融合應(yīng)用智能合約與共識(shí)機(jī)制,確保檔案數(shù)據(jù)具有可追溯性。密切關(guān)注人工智能技術(shù)的迭代升級(jí),實(shí)時(shí)做好技術(shù)應(yīng)對(duì)。運(yùn)用實(shí)時(shí)感知技術(shù)、數(shù)據(jù)監(jiān)測(cè)技術(shù)及可追溯技術(shù),為檔案高效管理及智能安全決策提供技術(shù)支持。
4.3管理:重視檔案安全柔性治理
人機(jī)失衡是倫理風(fēng)險(xiǎn)發(fā)生的根本原因,解決人工智能技術(shù)應(yīng)用背景下檔案管理倫理風(fēng)險(xiǎn),就要注重做好價(jià)值引領(lǐng),既不唯“人工智能技術(shù)”馬首是瞻,也不望“人工智能技術(shù)”而卻步,避免人工智能技術(shù)應(yīng)用于檔案管理的極端化,堅(jiān)持“技術(shù)適當(dāng)”的比例原則,從“技術(shù)本位”向“人之本位”的“以人為本”轉(zhuǎn)變,避免過(guò)度依賴人工智能技術(shù),同時(shí)也要防止技術(shù)過(guò)當(dāng)使用。強(qiáng)化檔案管理部門(mén)及人員的安全責(zé)任意識(shí),增強(qiáng)解決人工智能技術(shù)“算法黑箱”問(wèn)題的自覺(jué)性、主動(dòng)性,適當(dāng)增加檔案訓(xùn)練數(shù)據(jù)集,通過(guò)清洗、標(biāo)注等,使檔案數(shù)據(jù)格式及質(zhì)量滿足檔案管理標(biāo)準(zhǔn)和要求。
4.4監(jiān)督:強(qiáng)化檔案安全多方監(jiān)管
三分建,七分管。要構(gòu)建人工智能應(yīng)用背景下檔案管理倫理風(fēng)險(xiǎn)多方協(xié)同監(jiān)管機(jī)制,切實(shí)降低檔案收集、整理、存儲(chǔ)及利用全鏈條的倫理風(fēng)險(xiǎn)。作為檔案管理部門(mén),應(yīng)主動(dòng)加強(qiáng)與人工智能技術(shù)企業(yè)的聯(lián)系,邀請(qǐng)第三方監(jiān)管機(jī)構(gòu)及人工智能領(lǐng)域?qū)<业龋攸c(diǎn)圍繞人工智能技術(shù)應(yīng)用于檔案管理各個(gè)環(huán)節(jié)的監(jiān)管,共同織密檔案管理安全風(fēng)險(xiǎn)防線。同時(shí),要制定人工智能應(yīng)用于檔案管理領(lǐng)域倫理風(fēng)險(xiǎn)責(zé)任清單,嚴(yán)格落實(shí)責(zé)任制,確保檔案?jìng)惱盹L(fēng)險(xiǎn)防范責(zé)任到部門(mén)、到人,增強(qiáng)檔案安全倫理風(fēng)險(xiǎn)防范的自覺(jué)性、主動(dòng)性。
4.5人員:提高檔案安全素質(zhì)能力
人工智能技術(shù)應(yīng)用是檔案管理智能化轉(zhuǎn)型發(fā)展的必然選擇,檔案管理人員要積極應(yīng)用人工智能技術(shù),不斷提高安全風(fēng)險(xiǎn)應(yīng)對(duì)處置的能力和水平。既要圍繞深度學(xué)習(xí)、語(yǔ)義分析、數(shù)據(jù)挖掘、信息檢索等人工智能技術(shù)的學(xué)習(xí)應(yīng)用,也要注重做好數(shù)據(jù)安全、隱私保護(hù)領(lǐng)域的法律法規(guī)、行業(yè)標(biāo)準(zhǔn)、人工智能技術(shù)的學(xué)習(xí),不斷提高檔案管理人員安全風(fēng)險(xiǎn)應(yīng)對(duì)的素質(zhì)能力。同時(shí),還要做好各種安全風(fēng)險(xiǎn)應(yīng)急處置演練,提高實(shí)戰(zhàn)能力。
參考文獻(xiàn)
[1]杜霞.人工智能技術(shù)在企業(yè)檔案管理中的應(yīng)用場(chǎng)景、模式創(chuàng)新與未來(lái)展望[J].山西檔案,2024(5):152-155.
[2]李財(cái)富,王碩.人工智能技術(shù)賦能檔案館的應(yīng)用前景研究—基于信息生命周期視角[J].山西檔案,2024(1):108-115.
[3]林空,李衍.人工智能技術(shù)在音視頻檔案整理利用中的應(yīng)用研究[J].中國(guó)檔案,2023(7):62-63.
[4]張笑瑋,吳建華.生成式人工智能賦能檔案館服務(wù)質(zhì)量的優(yōu)化路徑研究[J].檔案與建設(shè),2025(2):62-70.
[5]蒲曉紅,趙海棠.互聯(lián)網(wǎng)使用對(duì)公眾風(fēng)險(xiǎn)感知的影響機(jī)制—基于政府回應(yīng)視角[J].中國(guó)行政管理,2021(5):146-154.
作者簡(jiǎn)介:李艷誠(chéng)(1979.9—),碩士學(xué)位,濱州醫(yī)學(xué)院館員,主要從事檔案信息管理研究。