Abstract: This report focuses onthe archival technologyapplicationand innovation development in 2024.By analyzing the scienceandtechnologyprojectapproval,excelentsientificesearchesultsawardsoftheNationalAchivesAdmiistration, andarchivalscienceandtechologypatents,itisfoundthatteaplicationofrchivaltechnologiesinChinathisyarprsets a cuting-edgeanddeepdevelopmenttrend.Fromthe projecttheme,it iscloselyrelatedtothe14thFive-Year PlanNational ArchivesDevelopmentPlan,focusingonarchivaldataelectronicrecordsandother fields;theexcelentscientificrsearch resultsaward pays moreatention tothe appicationonthebasis ofthe theorycovering the archivedata governance,etc.; the patent authorization shows thatthe percentage ofpatented technologies used in archival management has increased.The electronicrecords management and single-set system are valued.Further analysis concluded thatthe archival technology applications andscenarioshotspots mainlyinclude sixaspectssuchasdata archival management technologyanditsaplication, the applicationof large language model for the development and utilization of archival resources,andthe value mining technologyofarchivedataelements.Atthesametime,relevantsuggestionsarealsoputforwardfortheproblemsexisting inthe development of archival technologies in China.
Keywords:ArchivalTechnology;TechnologyApplication;Technological Innovation;ArchivalScienceandTechnologyPatent
在《中華人民共和國(guó)檔案法》(下文簡(jiǎn)稱《檔案法》)宏觀指導(dǎo)及《“十四五”全國(guó)檔案事業(yè)發(fā)展規(guī)劃》(下文簡(jiǎn)稱《規(guī)劃》)全面落實(shí)的背景下,我國(guó)檔案工作數(shù)字化、智能化水平穩(wěn)步提高,檔案技術(shù)應(yīng)用與創(chuàng)新水平不斷提升,檔案科技事業(yè)正邁入全新的發(fā)展階段。為全面了解和分析2024年我國(guó)檔案技術(shù)應(yīng)用與創(chuàng)新發(fā)展?fàn)顩r和整體特征,本報(bào)告采用編碼統(tǒng)計(jì)、文本挖掘、主題網(wǎng)絡(luò)分析等方法,對(duì)國(guó)家檔案局科技項(xiàng)目立項(xiàng)、國(guó)家檔案局優(yōu)秀科技成果獎(jiǎng)、檔案科技專利和典型技術(shù)應(yīng)用情況進(jìn)行分析。
12024年度國(guó)家檔案局科技項(xiàng)目立項(xiàng)分析
國(guó)家檔案局檔案科技項(xiàng)目立項(xiàng)是我國(guó)檔案技術(shù)應(yīng)用及創(chuàng)新發(fā)展的重要風(fēng)向標(biāo)。2024年2月27日,國(guó)家檔案局發(fā)布了《2024年國(guó)家檔案局科技項(xiàng)目立項(xiàng)選題指南》。該指南緊密貼合當(dāng)下檔案事業(yè)發(fā)展的新形勢(shì)與新需求,詳細(xì)列出了檔案治理體系、檔案資源體系、檔案利用體系、檔案安全體系和檔案信息化建設(shè)五個(gè)方面的選題方向,并提出了十個(gè)重點(diǎn)項(xiàng)目選題,為本年度的科技項(xiàng)目選題提供了方向性指導(dǎo)。同年6月25日,國(guó)家檔案局科技信息化司公示了2024年度科技項(xiàng)目擬立項(xiàng)情況:100多家單位承擔(dān)的108項(xiàng)科技項(xiàng)目被批準(zhǔn)立項(xiàng),其中常規(guī)項(xiàng)目98項(xiàng),重點(diǎn)項(xiàng)目10項(xiàng)。
圍繞科技立項(xiàng)項(xiàng)目主題,本報(bào)告建立了以二元詞組和關(guān)鍵詞為主體的主題詞表,結(jié)合人工編碼的方式,確定了相關(guān)主題詞,通過文本分析工具對(duì)主題詞的詞頻進(jìn)行了統(tǒng)計(jì),并進(jìn)一步通過詞云的方式進(jìn)行了可視化。
從圖1可知,2024年國(guó)家檔案局科技項(xiàng)目的主題詞涵蓋了檔案數(shù)據(jù)、電子文件、檔案管理、人工智能、數(shù)據(jù)安全、開發(fā)利用、體系構(gòu)建等。相關(guān)主題涉及大數(shù)據(jù)、數(shù)字化實(shí)驗(yàn)實(shí)訓(xùn)、版式文檔格式轉(zhuǎn)換、知識(shí)圖譜、電子文件、人工智能等檔案數(shù)據(jù)開發(fā)相關(guān)技術(shù)以及檔案管理技術(shù)。與2023年相比,2024年的項(xiàng)目主題呈現(xiàn)出四個(gè)顯著特點(diǎn):一是對(duì)新興技術(shù)應(yīng)用的拓展與深化。2024年不僅延續(xù)了2023年對(duì)人工智能等技術(shù)在檔案領(lǐng)域應(yīng)用的關(guān)注,還進(jìn)一步拓展到更多細(xì)分場(chǎng)景和新興技術(shù)融合。如2024年出現(xiàn)了將人工智能用于修復(fù)字跡涸化擴(kuò)散檔案、企業(yè)檔案多模態(tài)信息智能管理大模型等更具針對(duì)性和創(chuàng)新性的應(yīng)用研究。二是對(duì)多元檔案資源保護(hù)與開發(fā)的全面升級(jí)。2024年在檔案資源的關(guān)注范圍上更加廣泛,除了延續(xù)對(duì)紅色檔案資源開發(fā)利用的重視外,文化遺產(chǎn)和非物質(zhì)文化遺產(chǎn)的檔案保護(hù)與利用也成為重點(diǎn)。三是對(duì)檔案數(shù)據(jù)安全與治理的高度聚焦。隨著數(shù)字化轉(zhuǎn)型的深入,2024年更加突出檔案數(shù)據(jù)的安全管理和治理。這反映出在數(shù)據(jù)時(shí)代,檔案管理對(duì)數(shù)據(jù)安全這一關(guān)鍵要素的高度重視,以保障檔案數(shù)據(jù)在數(shù)字化環(huán)境下的可靠存儲(chǔ)、利用和共享。四是檔案管理智能化與服務(wù)創(chuàng)新的協(xié)同發(fā)展。2024年檔案管理的智能化和智慧化趨勢(shì)更為明顯,且與檔案服務(wù)創(chuàng)新緊密結(jié)合。
為了進(jìn)一步探究國(guó)家檔案局科技項(xiàng)目立項(xiàng)項(xiàng)目主題之間的關(guān)聯(lián)和分類,本報(bào)告采用主題共現(xiàn)網(wǎng)絡(luò)分析方法對(duì)立項(xiàng)主題進(jìn)行了分析。具體來說,在主題詞表的基礎(chǔ)上,進(jìn)一步根據(jù)主題詞與主題詞在同一個(gè)題目中出現(xiàn)的頻次,構(gòu)建了主題共現(xiàn)矩陣,并基于該矩陣構(gòu)造了主題共現(xiàn)網(wǎng)絡(luò)。為了便于觀測(cè)核心主題之間的關(guān)聯(lián),本報(bào)告采用K核分解法對(duì)網(wǎng)絡(luò)進(jìn)行分解,形成了科技項(xiàng)目主題網(wǎng)絡(luò)的核心網(wǎng)絡(luò)。為了進(jìn)一步對(duì)主題關(guān)系進(jìn)行量化分析,本報(bào)告采用網(wǎng)絡(luò)社群發(fā)現(xiàn)的相關(guān)方法,基于共現(xiàn)關(guān)系對(duì)主題詞進(jìn)行網(wǎng)絡(luò)聚合(見圖2)。結(jié)果發(fā)現(xiàn),2024年度國(guó)家檔案局科技項(xiàng)目立項(xiàng)主題主要分為四類:第一類以檔案數(shù)據(jù)為核心,涉及檔案數(shù)據(jù)治理、服務(wù)、安全、標(biāo)準(zhǔn)等問題,該類別在整個(gè)主題網(wǎng)絡(luò)中處于中心位置,說明該主題在本年度的檔案科技項(xiàng)目中是一個(gè)相對(duì)核心的主題,這也與上文主題詞詞頻分析的結(jié)果相互印證。第二類以檔案資源的建設(shè)與應(yīng)用為核心,涉及檔案數(shù)字化建設(shè)、人工智能模型構(gòu)建及智能化技術(shù)等,在主題網(wǎng)絡(luò)中也占據(jù)重要地位。第三類以電子文件(檔案)為核心,關(guān)注電子文件(檔案)的歸檔和管理,同時(shí)著重強(qiáng)調(diào)單套制管理模式下電子檔案的證據(jù)效力維護(hù)、質(zhì)量控制等問題。第四類以檔案資源服務(wù)創(chuàng)新為核心,開發(fā)利用各類檔案資源,構(gòu)建資源庫(kù)并開展編研,同時(shí)搭建平臺(tái),借用大模型新技術(shù)實(shí)現(xiàn)便捷、個(gè)性、智能服務(wù),滿足多元需求。
22024年度國(guó)家檔案局優(yōu)秀科技成果獎(jiǎng)分析
國(guó)家檔案局優(yōu)秀科技成果獎(jiǎng)是國(guó)家檔案局為了鼓勵(lì)在推動(dòng)檔案科學(xué)技術(shù)發(fā)展中做出重要貢獻(xiàn)的單位和個(gè)人而設(shè)立的檔案科技獎(jiǎng)項(xiàng)。獲獎(jiǎng)成果是體現(xiàn)本年度具有創(chuàng)新性、實(shí)用性、可推廣性,高科學(xué)水平和技術(shù)難度,以及顯著社會(huì)效益和經(jīng)濟(jì)效益的檔案科技成果。2024年度共有25個(gè)科技成果獲得國(guó)家檔案局優(yōu)秀科技成果獎(jiǎng)。其中,一等獎(jiǎng)2項(xiàng),包括“超大型跨海集群工程交通建設(shè)項(xiàng)目電子檔案全域管理體系及成套關(guān)鍵技術(shù)研究與應(yīng)用”等;二等獎(jiǎng)7項(xiàng),包括“人工智能技術(shù)在音視頻檔案數(shù)據(jù)治理工作中的應(yīng)用研究”等;三等獎(jiǎng)16項(xiàng),包括“館藏檔案內(nèi)容結(jié)構(gòu)化分析及知識(shí)化應(yīng)用研究”等。
圍繞檔案優(yōu)秀科技成果獎(jiǎng)獲獎(jiǎng)成果的主題,本報(bào)告采用主題共現(xiàn)網(wǎng)絡(luò)分析方法進(jìn)行分析。由圖3可知,2024年度國(guó)家檔案局科技成果主題主要分為三類:第一類是圍繞檔案管理體系及資源建設(shè)的相關(guān)成果,主要包括電子檔案全生命周期單套制歸檔體系研究、數(shù)字人文技術(shù)在檔案資源開發(fā)與保護(hù)中的實(shí)踐、人工智能助力檔案資源專題知識(shí)庫(kù)構(gòu)建等。第二類是圍繞電子文件管理歸檔技術(shù)及系統(tǒng)的相關(guān)成果,主要包括人工智能與檔案管理的結(jié)合、電子檔案全域管理體系及成套關(guān)鍵技術(shù)的研究與應(yīng)用、區(qū)塊鏈技術(shù)及多模態(tài)檔案檢索技術(shù)研究等。第三類是圍繞檔案館建設(shè)的相關(guān)研究成果,主要包括智能檔案管理系統(tǒng)建設(shè)研究、檔案數(shù)據(jù)智能開放鑒定及審核研究、館藏檔案內(nèi)容結(jié)構(gòu)化分析及知識(shí)化應(yīng)用研究、基于全程管控的檔案智慧治理及專題數(shù)據(jù)庫(kù)建設(shè)方法研究等。綜合分析可看出,2024年度國(guó)家檔案局優(yōu)秀成果獎(jiǎng)的獲獎(jiǎng)成果更多地集中在電子文件管理、人工智能助力檔案資源開發(fā)以及數(shù)字技術(shù)應(yīng)用檔案館綜合建設(shè)三個(gè)領(lǐng)域,基本符合2024年度檔案局科技項(xiàng)目的立項(xiàng)要求。
32024年度檔案科技專利分析
科技專利是一個(gè)領(lǐng)域技術(shù)發(fā)展的重要體現(xiàn),也是整個(gè)社會(huì)對(duì)該領(lǐng)域的技術(shù)需求和關(guān)注點(diǎn)。本報(bào)告選取2024年授權(quán)公告的專利作為分析對(duì)象,通過在專利數(shù)據(jù)庫(kù)檢索并采集了共計(jì)2013項(xiàng)與檔案技術(shù)相關(guān)的專利。其中,外觀設(shè)計(jì)專利161項(xiàng)、實(shí)用新型專利1226項(xiàng)、發(fā)明專利626項(xiàng)。結(jié)合專利分析的相關(guān)方法與工具,本報(bào)告對(duì)專利的題名、摘要、分類、所在區(qū)域、所屬機(jī)構(gòu)等數(shù)據(jù)進(jìn)行分析,以期深入揭示2024年度我國(guó)檔案技術(shù)應(yīng)用及創(chuàng)新的主題分布特征、區(qū)域發(fā)展特征和機(jī)構(gòu)類型特征,從而更好地把握和解讀我國(guó)檔案技術(shù)應(yīng)用及創(chuàng)新的實(shí)踐規(guī)律。
3.1區(qū)域發(fā)展及機(jī)構(gòu)人才特征
圍繞區(qū)域發(fā)展特征,本報(bào)告分析了檔案科技領(lǐng)域?qū)@谖覈?guó)各省、自治區(qū)、直轄市的數(shù)量分布情況。一般來說,申請(qǐng)專利數(shù)量越多的省份,對(duì)該領(lǐng)域有足夠的重視程度,或擁有一定的優(yōu)勢(shì)。2024年省級(jí)行政區(qū)域的檔案科技專利授權(quán)規(guī)模呈現(xiàn)明顯的“東高西低”的整體特征,華東地區(qū)檔案科技授權(quán)專利數(shù)最多,其次是華南和華北地區(qū),再次是華中、東北、西南地區(qū),這種分布形態(tài)與我國(guó)經(jīng)濟(jì)發(fā)展的空間特征以及人口分布有著一定的關(guān)聯(lián),也在一定程度上說明了檔案科技的發(fā)展需要以經(jīng)濟(jì)和人才為基礎(chǔ)和支撐。此外,2024年我國(guó)檔案技術(shù)專利授權(quán)規(guī)模最多的五個(gè)省份(山東、廣東、江蘇、浙江、北京),共計(jì)獲得授權(quán)專利770項(xiàng),占全國(guó)檔案科技專利授權(quán)數(shù)的 63.77% 。結(jié)合2024年的專利授權(quán)情況來看,上述省份基本形成了檔案科技研發(fā)的人才隊(duì)伍和檔案技術(shù)應(yīng)用的市場(chǎng)需求,檔案技術(shù)在上述省份更有可能實(shí)現(xiàn)突破和創(chuàng)新。
本報(bào)告圍繞檔案科技專利申請(qǐng)機(jī)構(gòu)和人才發(fā)展特征,進(jìn)一步分析了該領(lǐng)域授權(quán)專利的申請(qǐng)人類型分布和申請(qǐng)人數(shù)分布情況,并根據(jù)不同類型申請(qǐng)人的授權(quán)專利數(shù)量進(jìn)行深入分析。相較于2023年,2024年各類申請(qǐng)人的申請(qǐng)數(shù)量排序基本一致,企業(yè)和社會(huì)組織申請(qǐng)占比略有升高,個(gè)人和院校申請(qǐng)占比則略有降低。其中,企業(yè)的授權(quán)專利數(shù)最多,這是由于企業(yè)對(duì)于檔案技術(shù)有著直接的研發(fā)和應(yīng)用需求,在檔案科技專利申請(qǐng)方面比較重視。一般情況下,某個(gè)機(jī)構(gòu)所申請(qǐng)的相關(guān)專利涉及發(fā)明人數(shù)量越多,說明該申請(qǐng)人在該領(lǐng)域掌握更多的高級(jí)人才,具有絕對(duì)的優(yōu)勢(shì),因此本報(bào)告進(jìn)一步統(tǒng)計(jì)了各企業(yè)檔案科技授權(quán)專利所涉及的發(fā)明人數(shù)。據(jù)統(tǒng)計(jì),在2024年的企業(yè)檔案科技專利申請(qǐng)中,吉林銀瑞信息技術(shù)服務(wù)有限公司以15項(xiàng)發(fā)明領(lǐng)先,顯示了其在該領(lǐng)域的領(lǐng)導(dǎo)地位,緊隨其后的是浙江星漢信息技術(shù)股份有限公司和江蘇迅捷裝具科技有限公司,分別擁有13項(xiàng)和12項(xiàng)發(fā)明。與2023年相比,2024年的前十名中出現(xiàn)了更多的信息技術(shù)服務(wù)公司和科技公司,這反映了檔案科技領(lǐng)域正逐漸向數(shù)字化和智能化轉(zhuǎn)型。據(jù)相關(guān)數(shù)據(jù)顯示,專利申請(qǐng)相對(duì)集中于少數(shù)企業(yè),這表明這些企業(yè)在檔案科技領(lǐng)域具有較強(qiáng)的技術(shù)積累和市場(chǎng)競(jìng)爭(zhēng)力。此外,2024年的前十名中沒有出現(xiàn)高等院校,說明高校更重視科研項(xiàng)目、論文成果,忽視了專利成果,這種傾向不利于推進(jìn)檔案技術(shù)應(yīng)用與創(chuàng)新。同時(shí),這也進(jìn)一步凸顯了企業(yè)在檔案科技專利申請(qǐng)中的主導(dǎo)地位。檔案科技領(lǐng)域的專利申請(qǐng)活躍度可能預(yù)示著該市場(chǎng)的巨大潛力和快速發(fā)展的趨勢(shì),隨著數(shù)字化轉(zhuǎn)型的推進(jìn)和信息技術(shù)的不斷進(jìn)步,檔案科技領(lǐng)域有望吸引更多的研發(fā)投入、激發(fā)更多的創(chuàng)新活力。
3.2主題分布特征
本報(bào)告通過對(duì)檔案科技專利的題名、摘要、技術(shù)關(guān)鍵詞進(jìn)行分析,以統(tǒng)計(jì)、抽取、編碼、篩選、建模等方式,獲得專利的主題詞并對(duì)主題進(jìn)行共現(xiàn)分析(見圖4)
利申請(qǐng)的重要領(lǐng)域,這體現(xiàn)了對(duì)提高檔案管理效率、促進(jìn)檔案數(shù)字化和智能化的持續(xù)追求。這些技術(shù)的發(fā)展有助于實(shí)現(xiàn)檔案管理的自動(dòng)化和智能化,提高檔案的可訪問性和安全性??偟膩碚f,2024年的檔案科技專利主題分布揭示了檔案存放設(shè)備、檔案管理系統(tǒng)、電子檔案管理技術(shù)以及智能化和自動(dòng)化解決方案的持續(xù)重要性。這些趨勢(shì)不僅反映了檔案管理行業(yè)對(duì)提高管理效率、保障檔案安全、促進(jìn)數(shù)字化轉(zhuǎn)型和應(yīng)用新技術(shù)的不斷追求,也顯示了對(duì)檔案存放設(shè)備設(shè)計(jì)與研發(fā)的特別關(guān)注。
為了進(jìn)一步探究檔案科技專利主題之間的關(guān)聯(lián)和分類,本報(bào)告采用主題共現(xiàn)網(wǎng)絡(luò)分析的相關(guān)方法對(duì)專利主題進(jìn)行分析并構(gòu)造主題共現(xiàn)網(wǎng)絡(luò)。為了進(jìn)一步對(duì)主題關(guān)系進(jìn)行量化分析,本報(bào)告采用網(wǎng)絡(luò)社群發(fā)現(xiàn)算法對(duì)主題詞進(jìn)行網(wǎng)絡(luò)聚合。
由圖5可知,2024年度檔案科技專利可以分為兩大主題:一是檔案存放設(shè)備相關(guān)主題,這一主題依然占據(jù)主導(dǎo)地位,表明此類專利在2024年的高研究熱度。圍繞檔案柜、檔案盒、檔案架等存放設(shè)備及其部件,形成了龐大且突出的主題區(qū)域。此外,檔案存放設(shè)備數(shù)字化、機(jī)械化特征愈發(fā)凸顯,旨在提升檔案存放的便捷性、空間利用率和安全性。這一主題更聚焦于檔案管理實(shí)際業(yè)務(wù)中存放設(shè)備的創(chuàng)新設(shè)計(jì)與技術(shù)升級(jí),與國(guó)家檔案局科技項(xiàng)目立項(xiàng)多聚焦于檔案應(yīng)用、數(shù)據(jù)等宏觀層面形成鮮明對(duì)比,致力于解決檔案存儲(chǔ)過程中的具體問題。二是電子檔案與智能化管理技術(shù)主題,其廣度和深度較2023年均有拓展,電子檔案管理系統(tǒng)的研發(fā)正朝著與人工智能、大數(shù)據(jù)等技術(shù)深度融合的方向發(fā)展,如通過計(jì)算機(jī)程序?qū)崿F(xiàn)電子檔案的智能分類、檢索以及利用大數(shù)據(jù)分析挖掘檔案價(jià)值等。同時(shí),智能化和自動(dòng)化貫穿檔案管理全流程,涵蓋數(shù)據(jù)采集、處理、存儲(chǔ)、利用等環(huán)節(jié),側(cè)重于前沿技術(shù)在電子檔案管理中的應(yīng)用創(chuàng)新以及實(shí)際操作層面的技術(shù)解決方案,以提升電子檔案管理的效率、安全性和可利用性??傮w來看,2024年檔案科技專利主題在延續(xù)2023年部分方向的基礎(chǔ)上,更加注重新技術(shù)的融合應(yīng)用以及對(duì)檔案管理實(shí)際業(yè)務(wù)問題的針對(duì)性解決,充分展現(xiàn)了檔案科技領(lǐng)域不斷創(chuàng)新和發(fā)展的態(tài)勢(shì)。
4檔案技術(shù)應(yīng)用與場(chǎng)景熱點(diǎn)討論
4.1數(shù)據(jù)檔案化治理技術(shù)及其應(yīng)用
在數(shù)字化轉(zhuǎn)型的大背景下,數(shù)據(jù)檔案化治理成為檔案事業(yè)發(fā)展的關(guān)鍵領(lǐng)域。面對(duì)數(shù)據(jù)量的爆發(fā)式增長(zhǎng)和對(duì)數(shù)據(jù)管理要求的不斷提高,如何運(yùn)用先進(jìn)技術(shù)實(shí)現(xiàn)數(shù)據(jù)的有效治理,成為研究的重點(diǎn)方向。[]數(shù)據(jù)檔案化治理旨在將檔案學(xué)理念融入數(shù)據(jù)管理,確保數(shù)據(jù)的長(zhǎng)期保存、安全性和穩(wěn)定性,為各領(lǐng)域決策和發(fā)展提供有力支持。
在數(shù)據(jù)檔案化治理技術(shù)的研究與實(shí)踐中,相關(guān)成果不斷涌現(xiàn)。2023年,杭州易康信科技有限公司攜手嘉興市檔案部門深入推進(jìn)檔案數(shù)字化改革,采用“數(shù)據(jù)級(jí) + 文件級(jí)”存證方式,制定樣表規(guī)范采集項(xiàng),實(shí)現(xiàn)了現(xiàn)役原生業(yè)務(wù)系統(tǒng)連續(xù)性歸檔,并采用區(qū)塊鏈和數(shù)字摘要等技術(shù)數(shù)據(jù)存證,保障數(shù)據(jù)可靠合規(guī)。[2]嵊州市的“個(gè)人全生命周期數(shù)據(jù)檔案化治理”項(xiàng)目,創(chuàng)新應(yīng)用大數(shù)據(jù)技術(shù),通過統(tǒng)一標(biāo)準(zhǔn)、代碼和建模,搭建智能算法對(duì)歸集的數(shù)據(jù)進(jìn)行驗(yàn)證和加工,建立個(gè)人數(shù)據(jù)專題檔案庫(kù)。[3]王強(qiáng)等學(xué)者在結(jié)構(gòu)化數(shù)據(jù)歸檔方面提出了根據(jù)業(yè)務(wù)對(duì)象組織數(shù)據(jù)體的歸檔路徑,并以石油天然氣勘探開發(fā)結(jié)構(gòu)化數(shù)據(jù)歸檔實(shí)踐進(jìn)行驗(yàn)證。在這一過程中,運(yùn)用ETL工具進(jìn)行數(shù)據(jù)抽取,將關(guān)系型數(shù)據(jù)庫(kù)轉(zhuǎn)換為XML格式存儲(chǔ),以降低軟件依賴性,確保數(shù)據(jù)能夠有效歸檔與長(zhǎng)期保存。[4]
盡管數(shù)據(jù)檔案化治理技術(shù)取得了一定進(jìn)展,但仍面臨采集標(biāo)準(zhǔn)規(guī)范缺乏、存證技術(shù)不成熟、“數(shù)據(jù)孤島”現(xiàn)象普遍等問題。在未來,應(yīng)著重加強(qiáng)標(biāo)準(zhǔn)規(guī)范建設(shè),統(tǒng)一數(shù)據(jù)采集、存儲(chǔ)、利用等環(huán)節(jié)的標(biāo)準(zhǔn),確保數(shù)據(jù)的一致性和互操作性;深化技術(shù)創(chuàng)新,持續(xù)探索人工智能、區(qū)塊鏈等新技術(shù)的應(yīng)用,提升數(shù)據(jù)管理的智能化水平和安全性。
4.2面向檔案資源開發(fā)利用的大語言模型應(yīng)用
《規(guī)劃》強(qiáng)調(diào):“檔案工作環(huán)境、對(duì)象、內(nèi)容發(fā)生巨大變化,迫切要求創(chuàng)新檔案工作理念、方法、模式,加快全面數(shù)字轉(zhuǎn)型和智能升級(jí),積極探索知識(shí)管理、人工智能、數(shù)字人文等技術(shù)在檔案信息深層加工和利用中的應(yīng)用?!贝笳Z言模型(LargeLanguageModel,LLM)作為參數(shù)量級(jí)在十億及以上的大型預(yù)訓(xùn)練語言模型,在自然語言理解、知識(shí)發(fā)現(xiàn)、邏輯分析處理等方面具有顯著優(yōu)勢(shì)。在大規(guī)模文本語料數(shù)據(jù)庫(kù)和自監(jiān)督預(yù)訓(xùn)練技術(shù)的加持下,大語言模型為人工智能領(lǐng)域的研究帶來了革命性的變化,現(xiàn)已成為各領(lǐng)域的研究熱點(diǎn),同時(shí)也使得檔案資源開發(fā)利用具有良好的發(fā)展前景。
我國(guó)檔案學(xué)界面向檔案資源開發(fā)利用的大語言模型應(yīng)用展開了廣泛的研究。李根在梳理大模型技術(shù)特點(diǎn)的基礎(chǔ)上,分析其在圖情檔領(lǐng)域的應(yīng)用現(xiàn)狀,并圍繞領(lǐng)域知識(shí)庫(kù)構(gòu)建、大模型與知識(shí)庫(kù)融合的問答、檔案知識(shí)可視化、問答質(zhì)量評(píng)估等關(guān)鍵技術(shù)進(jìn)行深入探討。[5]牛力等從大模型核心技術(shù)出發(fā),分析檔案工作數(shù)智轉(zhuǎn)型現(xiàn)狀、大模型實(shí)踐場(chǎng)景和理論研究,明確大模型技術(shù)嵌入檔案工作的必要性和可行性,并結(jié)合CVP技術(shù)棧思想提出知識(shí)空間檔案工作“大模型 + ”技術(shù)嵌入框架,探索檔案知識(shí)“收管存用”新模式。[傅予等從數(shù)字人文視角關(guān)注數(shù)字化開發(fā)傳播的深層效果,系統(tǒng)性探究深層與表層效果影響機(jī)理的異同,在大語言模型等新興技術(shù)的加持下,從文化信息分析的三個(gè)階段進(jìn)行方法改進(jìn),并為文化資源數(shù)字化開發(fā)和傳播實(shí)踐提供科學(xué)參考和有力支撐。[7]劉文俏的研究則深入探討大模型技術(shù)賦能古籍檔案文化遺產(chǎn)數(shù)字化保護(hù)與利用的路徑設(shè)計(jì),并站在理論與實(shí)踐相結(jié)合的高度,充分挖掘大模型技術(shù)在傳統(tǒng)檔案文化遺產(chǎn)保護(hù)與傳播中的變革性作用,為推動(dòng)古籍檔案資源保護(hù)和文化創(chuàng)新利用提供有力的技術(shù)支撐。「8]徐擁軍在探討2023年中國(guó)檔案學(xué)研究現(xiàn)狀、特點(diǎn)及發(fā)展趨勢(shì)時(shí)認(rèn)為,數(shù)智轉(zhuǎn)型的大趨勢(shì)也為檔案學(xué)拓展出多元研究空間,檔案學(xué)科與新興信息技術(shù)大模型等不斷疊合交融,為推動(dòng)理論邊界的拓展和應(yīng)用實(shí)踐的豐富作出重要貢獻(xiàn)。[9]
盡管現(xiàn)有研究針對(duì)大語言模型技術(shù)在檔案資源開發(fā)利用領(lǐng)域取得了較多的分析性成果,但是研究依舊停留在較為初級(jí)、淺層、非技術(shù)的階段。而人工智能領(lǐng)域的發(fā)展日新月異,亟待學(xué)者緊跟技術(shù)前進(jìn)的步伐,堅(jiān)持檔案工作主體地位,開發(fā)出真正面向檔案管理與資源開發(fā)的大語言模型技術(shù)。
4.3檔案數(shù)據(jù)要素價(jià)值化挖掘技術(shù)
在數(shù)字化浪潮下,數(shù)據(jù)成為關(guān)鍵生產(chǎn)要素,深度融入經(jīng)濟(jì)社會(huì)各領(lǐng)域,檔案領(lǐng)域也受其影響。檔案數(shù)據(jù)要素成為研究與實(shí)踐焦點(diǎn),其海量增長(zhǎng)成為檔案資源新形態(tài)和管理新對(duì)象。[10]檔案數(shù)據(jù)要素價(jià)值,指檔案數(shù)據(jù)作為經(jīng)濟(jì)、管理、知識(shí)、文化、生態(tài)等特色要素,能支撐經(jīng)濟(jì)運(yùn)行、行政決策、知識(shí)創(chuàng)新、文化傳承以及生態(tài)和諧。國(guó)家高度重視數(shù)據(jù)要素發(fā)展,《“數(shù)據(jù)要素 × ”三年行動(dòng)計(jì)劃(2024—2026年)》《國(guó)家數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)指引》等發(fā)布出臺(tái),為檔案數(shù)據(jù)要素的價(jià)值化發(fā)展提供了政策支持。在此背景下,檔案數(shù)據(jù)要素價(jià)值化挖掘技術(shù)的研究與應(yīng)用意義重大。
檔案數(shù)據(jù)要素價(jià)值化挖掘,旨在從海量檔案數(shù)據(jù)中提取有價(jià)值的信息,且轉(zhuǎn)化為可利用的資源。2023年中國(guó)文化研究院推出“與抗日戰(zhàn)士AI對(duì)話平臺(tái),該平臺(tái)運(yùn)用AI、配音、語音合成及3D立體采樣等技術(shù),根據(jù)口述檔案合成可互動(dòng)的虛擬老兵,為香港學(xué)校開展愛國(guó)主義教育提供創(chuàng)新途徑。[11]2024年,甘肅省科學(xué)院應(yīng)用自主研發(fā)的多光譜圖像超高分辨率采集設(shè)備,完成館藏大寶積經(jīng)等珍貴檔案數(shù)字采集,并運(yùn)用多維度數(shù)字資源信息深度挖掘算法,推動(dòng)檔案的深度開發(fā)與利用。[12]黎安潤(rùn)澤等認(rèn)為,通過語義挖掘、知識(shí)圖譜、機(jī)器學(xué)習(xí)等技術(shù),對(duì)企業(yè)檔案數(shù)據(jù)進(jìn)行細(xì)粒度開發(fā)利用,可釋放其價(jià)值潛能。[13]張達(dá)提出將區(qū)塊鏈技術(shù)與IPFS的分布式存儲(chǔ)技術(shù)結(jié)合,可解決師德檔案信息數(shù)據(jù)在存儲(chǔ)、共享和安全傳輸中的問題。[14]
當(dāng)前檔案數(shù)據(jù)要素價(jià)值化挖掘技術(shù)的研究進(jìn)展呈現(xiàn)出多技術(shù)融合、注重實(shí)際應(yīng)用場(chǎng)景和強(qiáng)調(diào)數(shù)據(jù)安全的特點(diǎn)。未來,技術(shù)發(fā)展將聚焦智能化知識(shí)發(fā)現(xiàn)、深度化語義關(guān)聯(lián)與跨域協(xié)同共享三大方向,推動(dòng)檔案數(shù)據(jù)從靜態(tài)資源向動(dòng)態(tài)生產(chǎn)要素轉(zhuǎn)化,為數(shù)字中國(guó)建設(shè)提供基礎(chǔ)性戰(zhàn)略資源支撐
4.4智能化技術(shù)在檔案開放審核中的深化應(yīng)用
檔案開放審核工作是各級(jí)國(guó)家綜合檔案館的一項(xiàng)基礎(chǔ)性業(yè)務(wù)工作,是檔案資源從保管到利用必要且關(guān)鍵的環(huán)節(jié),也是檔案資源走向開放的前提和保障?!稒n案法》在檔案開放方面提出了更高的要求,積極探索檔案智能開放審核,有助于解決當(dāng)前檔案開放審核滯后的問題,對(duì)提高檔案開放審核效率和檔案利用水平意義重大。
北京市昌平區(qū)檔案館積極建設(shè)輔助鑒定系統(tǒng),構(gòu)建“人工智能 + ”檔案開放審核模式。該館建立了具有館藏特色的鑒定詞庫(kù)及成果模型,能夠?qū)崿F(xiàn)對(duì)館藏?cái)?shù)據(jù)敏感詞的快速匹配。[15]卞咸杰的研究通過分析敏感詞識(shí)別技術(shù)與方法,從理論上構(gòu)建了基于大模型與多模態(tài)訓(xùn)練的敏感詞庫(kù),通過系統(tǒng)架構(gòu)設(shè)計(jì)、數(shù)據(jù)庫(kù)設(shè)計(jì)、界面設(shè)計(jì)等,實(shí)現(xiàn)檔案開放智能審核中敏感詞的自動(dòng)化、智能化處理,以增強(qiáng)檔案信息的安全性和可靠性。[16]聶博馨等在研究中探討利用人工智能、大語言模型以及自然語言處理技術(shù),構(gòu)建一個(gè)基于自然語言處理的綜合檔案館檔案分級(jí)開放審核機(jī)制與應(yīng)用程序,以期提高檔案開放審核的效率與準(zhǔn)確率,促進(jìn)檔案管理工作的智能化發(fā)展。[17]劉越男等針對(duì)當(dāng)前智能檔案開放審核所面臨的挑戰(zhàn),即智能開放審核規(guī)則構(gòu)建依據(jù)不清、訓(xùn)練數(shù)據(jù)可獲取性不強(qiáng)、審核結(jié)論可解釋性不足等問題,提出基于大語言模型的檔案開放審核任務(wù)框架,并設(shè)計(jì)具體實(shí)施的技術(shù)路徑,強(qiáng)調(diào)通過提示工程引導(dǎo)大模型完成復(fù)雜多樣的檔案開放審核任務(wù)。[18]
當(dāng)前AI輔助檔案開放審核的工作實(shí)踐成效顯著,不少檔案館將自然語言處理、深度學(xué)習(xí)等智能技術(shù)融入開放審核流程,有效提升了審核效率,但該領(lǐng)域工作仍處于起步探索階段,檔案智能開放審核目前依舊面臨著巨大挑戰(zhàn),在體制機(jī)制、技術(shù)獨(dú)立、人才隊(duì)伍等方面仍存在諸多亟待解決的問題。在未來,應(yīng)持續(xù)推進(jìn)檔案開放審核等工作的智能化、數(shù)智化,助力檔案信息化建設(shè),實(shí)現(xiàn)檔案領(lǐng)域的數(shù)字化轉(zhuǎn)型、智能化升級(jí)。
4.5自主可控的電子檔案真實(shí)性保障技術(shù)
在數(shù)字化轉(zhuǎn)型加速的當(dāng)下,電子文件單套歸檔與電子檔案單套管理成為檔案管理重要趨勢(shì)。隨著電子文件、檔案的廣泛應(yīng)用,其真實(shí)性保障成為檔案管理領(lǐng)域的熱點(diǎn)議題。[19]電子檔案的真實(shí)性是指其內(nèi)容始終保持與最初形成文件時(shí)的原始狀態(tài)一致,未被篡改、偽造或?yàn)E用。這一特性是電子檔案作為可靠信息資源和法律證據(jù)的基礎(chǔ)。因此,如何通過技術(shù)手段和管理措施確保電子檔案的真實(shí)性,成為檔案管理實(shí)踐中亟待解決的關(guān)鍵問題。
在該領(lǐng)域,諸多成果涌現(xiàn)。山東省檔案館開展“基于政務(wù)云的統(tǒng)一政務(wù)數(shù)據(jù)和電子文件歸檔體系建設(shè)研究”項(xiàng)目,探索使用區(qū)塊鏈技術(shù),在電子檔案證據(jù)保全系統(tǒng)中實(shí)現(xiàn)電子檔案全流程真實(shí)性驗(yàn)證[20]許振哲分析了數(shù)字摘要、時(shí)間戳、電子簽名、區(qū)塊鏈等技術(shù)在電子檔案真實(shí)性維護(hù)中的應(yīng)用,提出將數(shù)字摘要技術(shù)與離線歸檔模式相結(jié)合的復(fù)合型檔案真實(shí)性維護(hù)路徑。[21]丁海斌等針對(duì)電子印章“去技術(shù)化”問題,提出在電子文件歸檔前將電子印章相關(guān)信息轉(zhuǎn)化為管理元數(shù)據(jù),并利用輕量級(jí)區(qū)塊鏈技術(shù)強(qiáng)化安全管理的解決方案。[22]夏天等構(gòu)建了銀行數(shù)字函證歸檔策略體系框架,運(yùn)用區(qū)塊鏈、數(shù)字摘要等技術(shù)保障銀行數(shù)字函證歸檔的真實(shí)性和完整性。[23]
未來電子檔案真實(shí)性保障技術(shù)將朝著更加智能化、高效化、自主可控的方向發(fā)展。隨著人工智能、量子計(jì)算等新興技術(shù)的發(fā)展,電子檔案真實(shí)性保障技術(shù)須不斷創(chuàng)新和完善,以應(yīng)對(duì)新的挑戰(zhàn)。
4.6文化遺產(chǎn)多模態(tài)知識(shí)服務(wù)技術(shù)
國(guó)家對(duì)文化遺產(chǎn)的重視和保護(hù)程度在日益提升,通過檔案載體將其記錄,并以數(shù)字化形式長(zhǎng)久保存,形成大量文化遺傳數(shù)字檔案資源。數(shù)字時(shí)代,檔案資源形態(tài)逐步從單一模態(tài)向文字、圖像、音頻、視頻等多模態(tài)轉(zhuǎn)變。文化遺產(chǎn)的開發(fā)利用與保護(hù)迫切需要在融入新興技術(shù)的同時(shí)提供多模態(tài)檔案資源的知識(shí)服務(wù),以最大限度實(shí)現(xiàn)文化遺產(chǎn)檔案資源的價(jià)值。
基于此,王曉光等從文化遺產(chǎn)信息資源、敘事性架構(gòu)、數(shù)字化呈現(xiàn)、系統(tǒng)本身的功能建設(shè)和知識(shí)服務(wù)等層面,打造文化遺產(chǎn)數(shù)字?jǐn)⑹滦湃文P?,以提升文化遺產(chǎn)的數(shù)智化活化利用水平、文化遺產(chǎn)內(nèi)容的深度挖掘、敘事內(nèi)容的創(chuàng)意演繹、文化內(nèi)涵的有效闡釋與呈現(xiàn)等,助力文化遺產(chǎn)數(shù)字化轉(zhuǎn)型發(fā)展。[24]鮑志芳等從數(shù)字人文視域出發(fā),注重對(duì)非遺數(shù)字檔案價(jià)值的深層挖掘,并提出以資源為基礎(chǔ)、知識(shí)服務(wù)為目標(biāo)、用戶需求為導(dǎo)向的知識(shí)服務(wù)原則,以期豐富社會(huì)記憶并推進(jìn)非遺檔案智庫(kù)建設(shè)。[25]王玉等基于檔案文獻(xiàn)遺產(chǎn)領(lǐng)域數(shù)字技術(shù)應(yīng)用于知識(shí)服務(wù)略顯不足的現(xiàn)狀,依據(jù)本體和圖譜建構(gòu)設(shè)計(jì)出數(shù)據(jù)驅(qū)動(dòng)的檔案文獻(xiàn)遺產(chǎn)價(jià)值挖掘與活化方案,從數(shù)據(jù)抽取、知識(shí)組織、知識(shí)發(fā)現(xiàn)到價(jià)值表達(dá)等面向知識(shí)服務(wù)提出可行活化路徑。[26]周樹斌等立足非遺資源的數(shù)字化保護(hù)和傳承需要,對(duì)多模態(tài)非遺數(shù)字資源的知識(shí)內(nèi)涵進(jìn)行細(xì)粒度挖掘和語義關(guān)聯(lián)建構(gòu),引入本體構(gòu)建面向茶類多模態(tài)非遺數(shù)字資源語義描述模型,為非遺領(lǐng)域跨場(chǎng)景、跨時(shí)空、跨資源的多維組織與融合應(yīng)用提供借鑒,也為非遺系統(tǒng)性保護(hù)的數(shù)字化方案提供一定參考。[27]
文化遺產(chǎn)數(shù)字資源知識(shí)內(nèi)涵豐富,應(yīng)在現(xiàn)有研究基礎(chǔ)上對(duì)知識(shí)粒度作進(jìn)一步細(xì)化,并結(jié)合最新的技術(shù)方法從更廣泛的渠道去提取深層次、多維度、細(xì)粒度的知識(shí)內(nèi)涵,推進(jìn)文化遺產(chǎn)資源的開發(fā)利用與知識(shí)服務(wù)延展,使之實(shí)現(xiàn)創(chuàng)造性轉(zhuǎn)化與創(chuàng)新性發(fā)展。
5問題與建議
5.1問題
本報(bào)告認(rèn)為,我國(guó)2024年度檔案技術(shù)及相關(guān)技術(shù)的應(yīng)用取得了顯著進(jìn)展,深度契合數(shù)智社會(huì)的發(fā)展趨勢(shì)。從國(guó)家檔案局科技項(xiàng)目立項(xiàng)主題及優(yōu)秀科技成果獎(jiǎng)來看,2024年度的立項(xiàng)主題緊密圍繞新時(shí)代檔案事業(yè)高質(zhì)量發(fā)展需求,重點(diǎn)聚焦電子檔案與電子文件的管理和歸檔、多元檔案資源保護(hù)與開發(fā)、檔案數(shù)據(jù)化建設(shè)等。從2024年度我國(guó)檔案科技專利授權(quán)情況來看,檔案科技專利主題詞網(wǎng)絡(luò)中有關(guān)檔案管理方向的專利技術(shù)是最大熱點(diǎn)詞,其中電子檔案管理技術(shù)成為重要組成部分,反映出電子文件管理及單套制受檔案領(lǐng)域高度重視,且在實(shí)踐上有序推進(jìn)。同時(shí),檔案存放設(shè)備相關(guān)專利在數(shù)量上仍占據(jù)優(yōu)勢(shì),且數(shù)字化、機(jī)械化特征愈發(fā)凸顯,提升了檔案存放的便捷性、空間利用率和安全性。當(dāng)然,2024年我國(guó)檔案科技事業(yè)在取得進(jìn)步的同時(shí),也存在以下問題:
一是新興技術(shù)與檔案科技事業(yè)融合不深入。盡管國(guó)家檔案局科技項(xiàng)目立項(xiàng)已對(duì)新興技術(shù)在檔案領(lǐng)域的應(yīng)用有所關(guān)注,如研究人工智能用于檔案字跡修復(fù)等,但多局限于特定場(chǎng)景,未形成系統(tǒng)性、全方位融合。實(shí)際應(yīng)用中,許多檔案管理部門對(duì)新興技術(shù)理解掌握不夠,缺乏融入工作流程的能力。以區(qū)塊鏈為例,其潛力雖大,但因技術(shù)門檻高、與現(xiàn)有系統(tǒng)兼容性差,推廣速度較慢。同時(shí),新興技術(shù)快速迭代,檔案工作者難以跟上,導(dǎo)致技術(shù)應(yīng)用效果欠佳,限制了檔案科技事業(yè)創(chuàng)新,無法充分發(fā)揮新興技術(shù)優(yōu)勢(shì)。
二是檔案技術(shù)區(qū)域、機(jī)構(gòu)發(fā)展不均衡與創(chuàng)新主體協(xié)同困難。檔案技術(shù)在區(qū)域和機(jī)構(gòu)層面存在顯著的發(fā)展不平衡現(xiàn)象。從區(qū)域上看,專利分析顯示我國(guó)檔案科技專利授權(quán)規(guī)模呈現(xiàn)“東高西低”的特征,華東、華南等地因經(jīng)濟(jì)和人才優(yōu)勢(shì),在檔案技術(shù)研發(fā)和應(yīng)用上處于領(lǐng)先地位。而中西部地區(qū)則因資金短缺、基礎(chǔ)設(shè)施薄弱而相對(duì)滯后,其差距體現(xiàn)在專利數(shù)量、新技術(shù)應(yīng)用水平等多方面。在機(jī)構(gòu)方面,企業(yè)主導(dǎo)檔案科技專利申請(qǐng),院校和科研機(jī)構(gòu)參與度低。其主要原因是企業(yè)重實(shí)用性和商業(yè)價(jià)值,院校和科研機(jī)構(gòu)側(cè)重理論研究,各方未能形成有效協(xié)同。
三是數(shù)據(jù)安全技術(shù)瓶頸制約檔案科技事業(yè)發(fā)展。在數(shù)據(jù)存儲(chǔ)環(huán)節(jié),面對(duì)海量檔案數(shù)據(jù),如何確保長(zhǎng)期存儲(chǔ)的完整性、可靠性和可讀性是難題?,F(xiàn)有存儲(chǔ)介質(zhì)和技術(shù)有壽命限制,數(shù)據(jù)遷移易丟失或損壞。在數(shù)據(jù)傳輸和利用環(huán)節(jié),其面臨著網(wǎng)絡(luò)攻擊、泄露等威脅,現(xiàn)有加密技術(shù)難以應(yīng)對(duì)黑客技術(shù)升級(jí)。在檔案數(shù)據(jù)共享中,平衡開放利用與安全保護(hù)關(guān)系較為棘手,由于缺乏有效的數(shù)據(jù)安全技術(shù)手段,檔案部門在推進(jìn)檔案數(shù)據(jù)共享和開放時(shí)往往有較多顧慮,影響資源開發(fā)利用效率。
四是資金和人才培養(yǎng)支持力度較為薄弱。資金方面,檔案科技研發(fā)投入不足且來源單一,主要依靠政府財(cái)政撥款,社會(huì)資本投資積極性不高,導(dǎo)致項(xiàng)自因資金短缺難以開展。人才培養(yǎng)方面,既懂檔案業(yè)務(wù)又掌握先進(jìn)技術(shù)的復(fù)合型人才比較匱乏。院校檔案專業(yè)教育課程與新興技術(shù)接軌不足,培養(yǎng)的學(xué)生尚無法滿足行業(yè)需求。此外,檔案科技領(lǐng)域薪酬待遇和職業(yè)發(fā)展空間有限,難以吸引和留住人才,加劇了人才短缺困境。
5.2建議
一是加快新興技術(shù)與檔案科技事業(yè)的融合。檔案科技創(chuàng)新是檔案事業(yè)發(fā)展的關(guān)鍵驅(qū)動(dòng)力和檔案工作走向現(xiàn)代化的重要支撐要素。本報(bào)告認(rèn)為,應(yīng)該持續(xù)加大檔案數(shù)字化的投入,對(duì)紙質(zhì)檔案進(jìn)行全面數(shù)字化轉(zhuǎn)換并建立大規(guī)模的數(shù)字檔案資源庫(kù);同時(shí),利用云計(jì)算技術(shù)構(gòu)建統(tǒng)一的檔案管理云平臺(tái),實(shí)現(xiàn)檔案資源的集中存儲(chǔ)、彈性擴(kuò)展和統(tǒng)一管理,方便檔案的檢索、共享和備份;最后,應(yīng)面向檔案領(lǐng)域的重難點(diǎn)及待突破的問題開展自主可控的技術(shù)研發(fā)工作,提升我國(guó)檔案科技事業(yè)發(fā)展的獨(dú)立自主性,并加強(qiáng)現(xiàn)代信息技術(shù)與檔案管理的整合,使得檔案專利質(zhì)與量同時(shí)達(dá)到突破。
二是協(xié)同創(chuàng)新主體并平衡區(qū)域機(jī)構(gòu)發(fā)展。本報(bào)告認(rèn)為,為解決檔案技術(shù)區(qū)域、機(jī)構(gòu)發(fā)展不均與創(chuàng)新主體協(xié)同困境,可從多方面著手。首先,在區(qū)域?qū)用?,政府可以通過政策扶持與資金傾斜,搭建技術(shù)共享平臺(tái)促進(jìn)區(qū)域合作并助力中西部地區(qū)發(fā)展;其次,針對(duì)機(jī)構(gòu)問題,政府可制定激勵(lì)政策并鼓勵(lì)院校、科研機(jī)構(gòu)和企業(yè)積極參與搭建產(chǎn)學(xué)研合作平臺(tái),促進(jìn)各方溝通協(xié)作;最后,在協(xié)同層面,應(yīng)明確各方定位,企業(yè)負(fù)責(zé)技術(shù)轉(zhuǎn)化,院校和科研機(jī)構(gòu)專注理論研究與技術(shù)突破,以此形成協(xié)同創(chuàng)新的良好局面。
三是加強(qiáng)檔案數(shù)據(jù)安全保護(hù)技術(shù)的研發(fā)應(yīng)用。新興技術(shù)的發(fā)展必然向數(shù)據(jù)安全管理發(fā)起挑戰(zhàn),加強(qiáng)獨(dú)立自主的數(shù)據(jù)安全防護(hù)技術(shù)的研發(fā)至關(guān)重要。一方面,檔案安全風(fēng)險(xiǎn)評(píng)估和安全漏洞審查是開展安全保護(hù)的前提,提前捕獲風(fēng)險(xiǎn)對(duì)于數(shù)據(jù)管理尤為重要,同時(shí)應(yīng)加強(qiáng)對(duì)加密技術(shù)、數(shù)據(jù)備份和恢復(fù)技術(shù)等檔案安全保護(hù)技術(shù)的研發(fā)投人。另一方面,檔案工作人員的信息安全意識(shí)和技能培訓(xùn)工作依舊任重道遠(yuǎn),應(yīng)建立一套完善的信息安全管理制度,通過制度約束與規(guī)范進(jìn)一步筑牢檔案數(shù)據(jù)安全防線,多管齊下,檔案數(shù)據(jù)安全問題的解決便更有保障。
四是加大檔案科技事業(yè)資金和人才投入力度。針對(duì)資金支持不足的問題,建議檔案及科技部門增加對(duì)檔案科技領(lǐng)域的研發(fā)投入,如增設(shè)專項(xiàng)基金支持、拓展社會(huì)融資渠道、加強(qiáng)資金使用效率等,最終實(shí)現(xiàn)科技創(chuàng)新項(xiàng)目的順利開展和科技成果的轉(zhuǎn)化應(yīng)用。同時(shí),在人才問題上,前沿新興技術(shù)需要高端復(fù)合型人才以保障檔案科技創(chuàng)新事業(yè)創(chuàng)新能力和應(yīng)用成果持續(xù)輸出,因此應(yīng)通過與高校、研究機(jī)構(gòu)的合作建立檔案科技人才培養(yǎng)交流機(jī)制及獎(jiǎng)懲機(jī)制、提高人才待遇福利給予人才關(guān)懷、加強(qiáng)檔案科技事業(yè)職業(yè)培訓(xùn)等,最終夯實(shí)檔案科技人才隊(duì)伍的建設(shè)基礎(chǔ)。
*本文節(jié)選自中國(guó)人民大學(xué)檔案事業(yè)發(fā)展研究中心著、人民日?qǐng)?bào)出版社出版的《中國(guó)檔案事業(yè)發(fā)展報(bào)告(2025)》。轉(zhuǎn)載已獲相關(guān)授權(quán)。
作者貢獻(xiàn)說明
楊建梁:設(shè)計(jì)研究思路,確定論文框架,撰寫和修改論文;鄭夢(mèng)霏:參與撰寫論文;楊格秀:參與撰寫論文。
注釋與參考文獻(xiàn)
校師德檔案信息數(shù)據(jù)共享平臺(tái)建構(gòu)策略[J].檔案學(xué)研究,2024(2):126-133.
[1」仇壯麗,劉敏.數(shù)據(jù)檔案化治理的協(xié)調(diào)路徑探析[J].山西檔案,2024(8):12-19.
2張雷.結(jié)構(gòu)化數(shù)據(jù)環(huán)境下政務(wù)類原生數(shù)據(jù)采集的研究[J].中國(guó)信息界,2024(3):114-116.
[3]張雷,王青云.嵊州:數(shù)據(jù)有“檔”智治智用[EB/OL].[2024-12-25].https://zjrb.zjol.com.cn/html/2024-02/07/content_3719736.htm?div =-1 :
[4]王強(qiáng),符京生.根據(jù)業(yè)務(wù)對(duì)象組織數(shù)據(jù)體的結(jié)構(gòu)化數(shù)據(jù)歸檔路徑探析—基于勘探開發(fā)結(jié)構(gòu)化數(shù)據(jù)歸檔實(shí)踐的思考[J].檔案學(xué)通訊,2024(4):22-29.
[5]李根.基于大模型技術(shù)的檔案文化遺產(chǎn)自動(dòng)問答平臺(tái)構(gòu)建研究[J].山西檔案,2024(9):156-158.
[6」牛力,金持,黎安潤(rùn)澤.大模型在檔案工作數(shù)智轉(zhuǎn)型中的應(yīng)用:新機(jī)遇、新模式和新轉(zhuǎn)變[J].檔案學(xué)通訊,2024(6):30-38.
[7]傅予,李博然,徐擁軍.數(shù)字人文視角下文化資源數(shù)字化開發(fā)和傳播要素與影響機(jī)理研究[J].圖書情報(bào)工作,2023(20):45-57.
[8]劉文俏.大模型與古籍檔案文化遺產(chǎn)數(shù)字化:價(jià)值、挑戰(zhàn)與應(yīng)對(duì)[J].山西檔案,2024(1):104-107.
[9」徐擁軍,張群群,嘎拉森.2023年中國(guó)檔案學(xué)研究現(xiàn)狀、特點(diǎn)及發(fā)展趨勢(shì)[J].檔案學(xué)研究,2024(2):13-21.
[10」金波,楊鵬,劉娟娟.檔案數(shù)據(jù)要素價(jià)值內(nèi)涵要義與生成機(jī)理[J].檔案學(xué)通訊,2024(6):4-12.
[11]中國(guó)文化研究院.與抗日戰(zhàn)士AI對(duì)話路[EB/OL].[2024-12-25] .https://aistory.chiculture.org.hk/.
[12]甘肅省檔案館甘肅省科學(xué)院舉行檔案超高 精度數(shù)字采集成果交接儀式[EB/OL].[2024-12- 25].https : //www.cngsda.net/gjdt/48280.jhtml.
[13]黎安潤(rùn)澤,牛力,王睿.積聚、激活與實(shí)現(xiàn):新質(zhì)生產(chǎn)力背景下企業(yè)檔案數(shù)據(jù)要素價(jià)值化探析[J].檔案學(xué)通訊,2025(1):46-55..
[14]張達(dá).基于區(qū)塊鏈和星際文件系統(tǒng)技術(shù)的高
[15]北京昌平激活智能新引擎打造鑒定新模 式[EB/OL].[2024-12-25」.https://www.saac.gov. cn/daj/c100163/202406/8fdd81300db74889a2e6d92b8b ef3812.shtml.
[16」卞咸杰.檔案開放智能審核中的敏感詞識(shí)別與控制技術(shù)研究[J].檔案管理,2024(5):29-32.
[17]聶博馨,曹月.利用人工智能及自然語言技術(shù)輔助檔案分級(jí)開放審核研究[J].黑龍江檔案,2024(2):14-17.
[18]劉越男,張茜雅,楊建梁.大語言模型在檔案開放審核中的應(yīng)用框架與路徑探究[J].檔案學(xué)通訊,2025(2):31-38.
[19]陳永生,楊茜茜,侯衡,等.電子政務(wù)系統(tǒng)中的檔案管理:?jiǎn)栴}與思考[J].檔案學(xué)研究,2015(2):28-37.
[20]李世華.基于政務(wù)云的統(tǒng)一政務(wù)數(shù)據(jù)和電子文件歸檔體系[J].中國(guó)檔案,2024(3):44-45.
[21]許振哲.電子檔案真實(shí)性維護(hù)—唯技術(shù)論與去技術(shù)化之爭(zhēng)[J].檔案,2024(2):72-76.
[22]丁海斌,馬超.電子檔案中電子印章“去技術(shù)化”的實(shí)質(zhì)及其解決方案[J].檔案管理,2024(6):20-27.
[23]夏天,余芊蓉,彭欣然.銀行數(shù)字函證歸檔策略與方法研究[J].檔案學(xué)研究,2024(6):100-109
[24]王曉光,趙珂.文化遺產(chǎn)數(shù)字?jǐn)⑹滦湃文P停焊拍钆c框架[J」.中國(guó)圖書館學(xué)報(bào),2024(2):30-41.
[25]鮑志芳,馬嘉悅,湯沛儀,等數(shù)字人文視閾下非遺數(shù)字檔案資源知識(shí)服務(wù)研究[J」.資源信息與工程,2024(6):118-122.
[26」王玉,程爍.數(shù)據(jù)驅(qū)動(dòng)的檔案文獻(xiàn)遺產(chǎn)價(jià)值挖掘與活化研究[J].圖書與情報(bào),2024(4):65-80.
[27]周樹斌,高勁松,高琳霞,等.我國(guó)茶類多模態(tài)非遺數(shù)字資源知識(shí)圖譜構(gòu)建[J].圖書館論壇,2024(9):79-89.
(責(zé)任編輯:馮婧愷張帆)