摘 要:人工智能技術作為當前最熱門的檔案管理新工具,在檔案開發(fā)利用方面具有獨特優(yōu)勢。本文從人工智能應用維度出發(fā),認為在開發(fā)利用中自主開放審核技術、語義分析技術、數(shù)字檔案編研技術能夠提升效果。在實踐中,市政檔案管理部門存在著制度、技術、安全等方面的隱患,需要加強系統(tǒng)建設、技術應用、制度供給,推動市政工程技術檔案開發(fā)利用工作提檔升級。
關鍵詞:人工智能;市政工程;檔案;開發(fā)利用
市政工程技術檔案是指市政設施在規(guī)劃、建設、維護中形成的、具有較高保存價值的文字、圖表、音視頻、數(shù)據(jù)等。這些檔案資源在實現(xiàn)設施監(jiān)督、管理、維護和保證人民群眾利益方面具有重要作用。人工智能技術拓展了檔案開發(fā)利用的價值廣度和效率,成為檔案管理的變革因素,為市政工程技術檔案開發(fā)利用提供了廣闊的空間。
1 人工智能技術在檔案開發(fā)利用中的應用維度
人工智能技術在服務檔案開發(fā)利用中主要通過以下幾個維度展開。
1.1 自主開放審核技術
開展市政工程技術檔案開放鑒定工作。劃分檔案開放與控制使用范圍,是提升城市智慧化建設的內(nèi)在要求,也是服務民生、服務社會的直接體現(xiàn)。隨著市政工程技術檔案數(shù)量的不斷增加、收集范圍的不斷延伸以及群眾需求的不斷增強,檔案利用的需求不斷擴大,檔案的利用面不斷拓展,使得檔案開放鑒定工作顯得尤為重要。目前依靠人工判斷的方式,影響和制約檔案鑒定的效率和質量。開展智能審核方法和技術的研究十分必要。通過借助自主開放審核技術,建立智能開放審核系統(tǒng),進一步融合專業(yè)鑒定人員的專業(yè)知識和經(jīng)驗,建立具有突出層次關系的語義層次網(wǎng)絡,建立適配于市政工程檔案劃控開放鑒定的語義規(guī)范、框架、模型和知識庫,從而提升檔案開放審核的速度和質量。
1.2 語義分析技術
近年來,伴隨數(shù)據(jù)化的發(fā)展,市政工程檔案存儲形式發(fā)生根本轉變,數(shù)字資源呈現(xiàn)指數(shù)式增長態(tài)勢。但是,數(shù)據(jù)化檔案通過關鍵詞準確率不高的弊端逐步顯現(xiàn),如何效滿足數(shù)字時代檔案利用的效率要求成為主要課題。語音識別技術在圖像識別、語音識別等多個領域的突破性進展,為信息高效準確查詢提供了新的途徑。語義分析(Semantic Analysis)是人工智能的一個分支,是自然語言處理技術的幾個核心任務,涉及語言學、計算語言學、機器學習以及認知語言等多個學科,語義分析任務有助于促進其他自然語言處理任務的快速發(fā)展。語音識別技術融入檔案管理系統(tǒng),利用其深度學習優(yōu)勢,通過建立有效的模型和系統(tǒng),實現(xiàn)在各個語言單位的自動語義分析,促使自然語言處理能力的提高,在輸入自然語言時,能夠檢索出與其相關的更多詞匯,避免機械匹配的不足,提升模糊查詢的準確率,協(xié)助查詢者快速找到目標。
1.3 數(shù)字檔案編研技術
人工智能技術可以運用知識表示與處理技術實現(xiàn)檔案垂直領域的知識優(yōu)化,并通過大數(shù)據(jù)手段進行用戶需求分析,助力檔案數(shù)據(jù)價值、知識價值的發(fā)揮,滿足用戶多元化、個性化的利用需求。具體而言,數(shù)字檔案編研技術包含三個層次:一是基礎檔案數(shù)據(jù)庫。這是智能編研的基礎,數(shù)據(jù)庫以專題檔案為基礎,構建基于數(shù)據(jù)結構的知識圖譜和單元,建立系統(tǒng)化的資源結構和脈絡。二是借助數(shù)據(jù)挖掘、文本分析等技術,對異構資源進行優(yōu)化組合,根據(jù)用戶需要調整,通過私有化部署大型語言模型直接生成編研內(nèi)容或者提綱。三是可視化展示。編研成果通過App、網(wǎng)站、新媒體等平臺向公眾推廣,展示檔案文化的獨特魅力。
2 人工智能技術在檔案開發(fā)利用中的不足
人工智能作為新技術,在市政部門檔案管理應用中還存在不少不足和困境。
2.1 制度供給不足
人工智能技術應用的制度環(huán)境不夠完善。在制度規(guī)劃上頂層設計不足,主要表現(xiàn)在市政工程行業(yè)對人工智能技術的認識不足,習慣性地認為人工智能只應用于傳統(tǒng)產(chǎn)業(yè)轉型升級、政府治理現(xiàn)代化和民生改善等領域,忽視了在檔案領域中的應用,缺乏具體的實施辦法和操作指南。人工智能在市政工程中的制度環(huán)境、應用范圍、準入條件等謀劃不夠,缺乏長遠的系統(tǒng)規(guī)劃和評估體系。人工智能技術的應用需要制定更多更明確的法規(guī)政策、行業(yè)規(guī)范,保障人工智能在應用中的數(shù)據(jù)安全,確保人工智能安全、可靠、可控。
2.2 信息共享不足
開發(fā)利用需要豐富的信息資源作為基礎,隨著數(shù)字時代的到來,產(chǎn)生了大量市政工程技術檔案數(shù)字資源,但是部門之間普遍存在“不愿”“不敢”和“不會”共享開放的問題,制約共享共建的落實,市政工程技術檔案管理部門在規(guī)劃、組織、體系和資金建設方面存在共享“藩籬”。部門、行業(yè)、機構之間橫向聯(lián)系不足,常態(tài)化機制不健全,導致信息資源共享不順暢,信息價值無法充分發(fā)揮。研究團隊、部門之間檔案信息資源互動不充分,大數(shù)據(jù)應用呈現(xiàn)出發(fā)展初級階段特征,處于“盲人摸象”階段。
2.3 技術應用不足
市政工程領域人工智能還局限在服務智慧化階段,在檔案開發(fā)利用上應用較少。在“一次辦好”理念的指引下,市政部門對政務檔案服務重視高,但是利用如知識庫技術、專家系統(tǒng)、模糊信息處理技術、數(shù)據(jù)挖掘技術、智能平臺等不足,檔案資源無法有效地向用戶展示,影響檔案服務利用效果。同時,隨著人工智能在各行業(yè)的廣泛應用,該領域人才需求呈爆發(fā)式增長,人才供給總量卻嚴重不足,市政工程部門人才引進難度高,供需不平衡的矛盾較為凸顯。
2.4 安全建設不足
保障數(shù)據(jù)安全是促進人工智能應用的重要基礎。一方面,人工智能技術本身就具有多重風險,系統(tǒng)內(nèi)風險和衍生風險交織,安全問題異常復雜。另一方面,市政部門缺乏較為完善的制度規(guī)定和規(guī)范,有的重要數(shù)據(jù)未能進行分級分層管理,涉密數(shù)據(jù)失密風險加大。有的將人工智能技術完全代替人工審核,增加危及數(shù)據(jù)主權、信息安全的潛在風險。面對生成式人工智能引發(fā)的不確定性,需提前研判可能的安全風險,找好人工智能與開發(fā)利用的平衡點,重視防范風險,構建安全可靠的開發(fā)利用環(huán)境。
3 人工智能技術在市政工程技術檔案開發(fā)利用中的進路
在新技術革命大潮下,人工智能技術融入開發(fā)利用已成為必然選擇,市政檔案管理部門需要從以下幾個方面進行探索。
3.1 應用好自主開放審核成果
要將開放審核流程再造與市政工程檔案信息化建設深度融合,堅持前置和事后審核相結合,在數(shù)字檔案歸檔前開展前置審核,對存量檔案開展事后審核。
3.1.1用好自然語言處理技術(NLP)。作為人工智能的重要分支,該技術融合計算機科學、人工智能和語言學的知識,旨在讓計算機能夠更好地與人類進行自然語言交流。在開放審核時,采用NLP技術可以使系統(tǒng)更好地理解檔案文本內(nèi)容,根據(jù)上下文對關鍵詞進行語義分析,從而避免僅憑關鍵詞產(chǎn)生的錯判與漏判問題。
3.1.2用好手寫體識別技術。在市政工程技術檔案眾多的圖紙、圖表、竣工圖中,存在大量字跡差距較大的手寫體,OCR識別率不高,影響檔案開放審核的進度。引入人工智能識別技術后,可以對不同字跡進行分析與學習,建立語義通順度模型,根據(jù)行業(yè)特點引入文本糾錯機制,以此提升手寫體OCR可識別率及準確率。對于涉密檔案,通過批量智能化檢測待校核掃描件,對數(shù)字化加工工作查漏補缺,精準、快速地發(fā)現(xiàn)疑似涉密的檔案,并注明疑似涉密的標識信息,對密級、時效等智能化分析,以實現(xiàn)對涉密文件的有效管理。
3.1.3用好機器學習技術。機器學習通過訓練算法模型形成數(shù)據(jù)模式,實現(xiàn)對檔案的分類、聚合等任務,該技術能夠將審核依據(jù)與結果轉化為審核知識庫,借助訓練模型持續(xù)提升學習能力,不斷提升審核準確率,成為自助審核的關鍵技術。
3.2 構建好語義分析利用體系
3.2.1融入語義分析技術。在檔案管理系統(tǒng)融入語義分析技術,在文本分類和情感分析的基礎上利用好問答系統(tǒng)和信息抽取功能。該功能作為語義分析技術的最新成果,能夠使計算機回答問題和從大量文本中提取所需信息。
3.2.2應用搜索引擎。在市政工程技術檔案應用領域,搜索引擎通過理解查詢意圖和分析網(wǎng)頁內(nèi)容來提供相關搜索結果,將相關內(nèi)容直接推送給查詢者,實現(xiàn)檔案資源供給最大化;在科研方面,文本處理和語義分析技術被用于從技術文獻中提取有用信息,為利用者提供市政技術豐富的文獻資源,為科研提供支持,推動工程技術能力的提高。
同時,虛擬助手能夠回答查詢者的語音指令,實現(xiàn)智能化的對話交互,提高工作效率。在實踐中,語義分析技術也面臨著處理復雜的上下文依賴、識別隱含信息和處理多語種等方面的問題,需要進一步優(yōu)化突破。
3.3 發(fā)揮好數(shù)字檔案編研優(yōu)勢
數(shù)據(jù)挖掘、文本挖掘和知識圖譜是數(shù)字編研技術支撐,在提升市政工程技術檔案編研智慧化方面具有顯著作用。
3.3.1數(shù)據(jù)挖掘。它被視為人工智能的一個子領域,通過發(fā)現(xiàn)數(shù)據(jù)中的模式和關聯(lián)來幫助訓練和改進人工智能系統(tǒng),為提升人工智能水平提供重要的數(shù)據(jù)支持。在市政技術工程檔案中的結構設計原理、工程測量、道路勘察設計、城市軌道交通的資料是城市規(guī)劃設計和可持續(xù)發(fā)展的重要參考,對這些檔案數(shù)據(jù)進行價值挖掘,促使人工智能系統(tǒng)構建數(shù)據(jù)預測模型。
3.3.2文本挖掘。文本挖掘可以對市政工程技術檔案中施工、管理、設計、養(yǎng)護等文字、音視頻、圖像、高頻詞等無序內(nèi)容進行結構化處理,從而實現(xiàn)對檔案數(shù)據(jù)庫資料的全方位掌握。
3.3.3智慧化編研系統(tǒng)。市政工程技術檔案編研以文獻為研究對象,以挖掘的檔案信息為內(nèi)容,對檔案信息進行再加工、再篩選、再整理,轉化為不同形式的編研成果。在系統(tǒng)設置上,根據(jù)檔案特點,建立專題策劃、數(shù)據(jù)模型、知識分析、編研類型、內(nèi)容分析等功能模塊,通過智能圖譜技術,融合人工需求,如大事記、資政參考、技術匯編分析等,系統(tǒng)可直接生成編研內(nèi)容。
3.4 運用好數(shù)字展陳新成果
數(shù)字展陳是以多媒體和數(shù)字化技術作為展示技術,使用最新的影視動畫技術,結合獨到的圖形數(shù)字和人工智能技術,以各類新穎的技術吸引參觀者,實現(xiàn)人機交互方式的展廳形式。數(shù)字展陳主要應用三維建模和渲染、虛擬現(xiàn)實和增強現(xiàn)實等元宇宙技術,能夠帶給觀眾身臨其境、虛擬相生的極致體驗。市政工程技術檔案中涵蓋豐富的城市記憶、文化基因,是進行精神文明建設的重要素材。數(shù)字展陳方式可以突破傳統(tǒng)開發(fā)方式的局限性,人工智能技術融入展覽布置中,為受眾提供更便捷、高效的參觀體驗,滿足受眾個性化的服務要求。市政部門利用人工智能技術手段打造現(xiàn)代化市政工程技術展示空間,通過虛擬現(xiàn)實、三維模型等技術,采用多媒體展示手段,如視頻、音頻、圖片等形式在公眾號、網(wǎng)站呈現(xiàn),使受眾更加深入地了解建設過程中的各種細節(jié),從而更好地理解市政工程的復雜性和難度。
3.5 釋放好人工智能新動能
3.5.1持續(xù)深化數(shù)據(jù)要素供給。數(shù)據(jù)是人工智能的教材,決定智能的范圍,高質量數(shù)據(jù)要素供給是人工智能高質量發(fā)展的重要保障。市政部門要搭建檔案數(shù)據(jù)共享平臺,建立多模態(tài)數(shù)據(jù)集合,利用隱私計算、數(shù)據(jù)安全流通等技術,將各工程的數(shù)據(jù)融通使用,適應開發(fā)利用的新需求。
3.5.2持續(xù)深化制度要素供給。要提高思想認識,將人工智能技術作為檔案開發(fā)利用的助推器,找準工作結合點和切入點,把握發(fā)展規(guī)律,爭取資金支持。要堅持以人為本理念,人工智能在內(nèi)的任何技術在市政工程領域應用,出發(fā)點都要放在增強民眾的獲得感和滿足感上。要把安全制度建設放在突出位置,系統(tǒng)分析風險防控措施是否具有針對性和有效性,加強檔案數(shù)據(jù)分類分級管理,強化重要數(shù)據(jù)和敏感信息保護,防范化解在開發(fā)利用中的安全風險。
3.5.3持續(xù)加強人才要素供給。市政部門要圍繞檔案事業(yè)發(fā)展需要和人才需求,研究和探索人工智能人才的發(fā)展目標和路徑。要在引才增智上下功夫,營造人工智能人才發(fā)展的良好生態(tài)環(huán)境,激發(fā)人才創(chuàng)新創(chuàng)業(yè)活力,為開發(fā)利用工作提供堅強的人才保證和廣泛的智力支持。
推進檔案開發(fā)利用是新《檔案法》《“十四五”全國檔案事業(yè)發(fā)展規(guī)劃》的內(nèi)在要求。人工智能技術極大提升了檔案開放審核的效率和準確性,為市政工程檔案服務提供更強大的支持。市政部門要從數(shù)字政府建設要求出發(fā),發(fā)揮好人工智能在開發(fā)利用方面的驅動力,構建人工智能開發(fā)利用模型,制作檔案開放審核關鍵詞表,提升自主編研水平和效果,展示檔案的時代價值和特色,更好地為經(jīng)濟社會發(fā)展服務。
參考文獻
[1]談立.語義分析技術在滿意度測評領域應用研究[N].《中國質量與標準導報》,2019(02):14-15.
[2]劉思含.人工智能與檔案開發(fā)利用:應用、愿景與進路 鄭慧;[J].《山西檔案》,2023(05):11—12.
[3]丁德勝.新時代新征程檔案工作呼喚智慧檔案戰(zhàn)略——智慧檔案館室數(shù)字技術創(chuàng)新應用20個典型場景展望[N].《中國檔案報》,2023(07):20.
作者簡介:徐瑩 (1989—) ,大學學歷 ,西安市市政設施管理中心助理館員,研究方向:市政工程技術檔案。