趙宣哲
摘要:傳統(tǒng)的聲像檔案著錄模式已不能滿足新時代人們對數(shù)字聲像檔案的需求,該文提出了數(shù)字聲像檔案智能標注,詳細分析了可能出現(xiàn)的問題,并深入思考相應(yīng)的對策建議。由于技術(shù)的先進性,這僅僅是筆者的一種構(gòu)想,以期未來檔案領(lǐng)域能夠引入更多新技術(shù),提高數(shù)字聲像檔案管理水平。
關(guān)鍵詞:數(shù)字聲像檔案 人工智能 智能標注 檔案管理
在信息技術(shù)不斷進步的今天,數(shù)字聲像檔案管理工作逐漸成為當前檔案工作的重難點問題,智能標注的應(yīng)用能夠簡化數(shù)字聲像檔案管理工作對人工的依賴,是對聲像檔案工作的創(chuàng)新性探索,對促進檔案事業(yè)發(fā)展有著重要意義。
數(shù)字聲像檔案智能標注是依賴計算機系統(tǒng)直接利用人工智能技術(shù)完成對數(shù)字聲像檔案內(nèi)容信息的處理,達到生成多個關(guān)鍵詞的目的。為了與傳統(tǒng)的“標引”有所區(qū)別,本文采用了“標注”的概念。傳統(tǒng)的自動標引,又稱計算機輔助標引,即根據(jù)文獻內(nèi)容,依靠系統(tǒng)程序全部或部分按照主題法掃描內(nèi)容給出主題詞,通常主要用于文本分類、主題詞標引等,對于數(shù)字聲像檔案來說不太適用。而“智能標注”可以說是一個全新的概念,利用人工智能技術(shù)從根本上解決檔案工作者在數(shù)字聲像檔案內(nèi)容信息標注上的難題。
(一)內(nèi)生動力不足
相對于文書檔案,當前大量生成數(shù)字聲像檔案的機關(guān)單位較少,一些具有執(zhí)法職能的行政管理部門,由于歷史的原因,可能會存有較多執(zhí)法過程中的聲像檔案。這些檔案大多被存放在形成部門(如各機關(guān)的執(zhí)法大隊),沒有集中到單位的檔案部門管理,導致檔案部門對數(shù)字聲像檔案的形成、保管及查詢使用情況不了解,對新變化不敏感。另外,綜合檔案館的電子檔案接收工作是近年來才開展的,機關(guān)單位向檔案館移交電子檔案的過程中更多的是移交文書檔案,而數(shù)字聲像檔案相對較少。因此,無論是機關(guān)單位還是作為永久保存基地的綜合檔案館,在數(shù)字聲像檔案管理方面探索新管理方式的動力不足。
此外,隨著“放管服”改革等政策的不斷深入和改善營商環(huán)境的持續(xù)推進,政府部門在加強事中事后監(jiān)管方面新的措施不斷出臺,數(shù)字聲像檔案的記錄和憑證作用也將進一步深化。如果檔案部門不能敏銳地發(fā)現(xiàn)和應(yīng)對新的變化,勢必造成今后管理工作上的被動。
(二)標準規(guī)范不完善
信息技術(shù)已經(jīng)發(fā)展到智能信息處理階段,而目前大多數(shù)單位仍然認為一些新技術(shù)應(yīng)用于數(shù)字聲像檔案管理較為困難,根本原因是當前的制度和指導性文件不完善,導致在管理過程中方向性不強。根據(jù)國家檔案局2017年8月發(fā)布的《錄音錄像類電子檔案元數(shù)據(jù)方案》(DA/T 63—2017)中的內(nèi)容判斷,聲像檔案標準規(guī)范仍然沒有擺脫傳統(tǒng)的管理理念。2020年5月發(fā)布的《錄音錄像檔案管理規(guī)范》(DA/T 78—2019)提到了著錄的要求,但是基本沿襲了傳統(tǒng)聲像檔案著錄的內(nèi)容,主要是從其形式特征的角度進行描述,缺乏對聲像檔案內(nèi)容特征的描述,對技術(shù)前瞻性及新技術(shù)應(yīng)用的指導性建議不足。現(xiàn)有標準規(guī)范的指導意義具有局限性,并沒有給新技術(shù)新手段留有一定空間。機關(guān)及企事業(yè)單位在數(shù)字聲像檔案大量生成、查詢需求明顯增強的情況下,若還是使用傳統(tǒng)的管理手段,不利于提高數(shù)字聲像檔案的標注效率,更不利于數(shù)字聲像檔案的快速、高效檢索。
(三)檔案部門尚不具備獨立開發(fā)能力
數(shù)字聲像檔案智能標注對管理水平和技術(shù)水平要求高,但大多數(shù)聲像檔案管理部門在數(shù)字聲像檔案管理的信息化研究和開發(fā)方面明顯能力不足,主要是單位自身并不具備獨立開發(fā)的能力。目前人工智能尚屬前沿技術(shù),該技術(shù)在交通運輸領(lǐng)域應(yīng)用較為廣泛,主要是由于國家支持,社會力量參與廣泛,但在檔案領(lǐng)域應(yīng)用較少。在幾類檔案館中,綜合檔案館資源豐富,但技術(shù)力量相對較弱;一般企業(yè)規(guī)模較小,企業(yè)檔案室館藏資源不夠豐富;專業(yè)檔案館雖然館藏資源、技術(shù)力量尚可,但其缺乏資金的支持。即使資金到位,由于其檔案部門中技術(shù)開發(fā)人才占比較少,也不利于數(shù)字聲像檔案智能標注技術(shù)的研發(fā)。
(四)數(shù)字聲像檔案智能標注缺少大數(shù)據(jù)支持
數(shù)字聲像檔案智能標注技術(shù)驗證中重要的階段就是訓練模型階段,這一階段各類人工智能技術(shù)較為依賴大數(shù)據(jù)模型。在智能標注的過程中是需要通過監(jiān)督式學習自我訓練建立標準的,而這個過程是需要一定量級數(shù)據(jù)支持的,比如人臉識別所需的人臉庫,音頻識別所需的聲紋庫,場景識別所需的場景特征庫等。而數(shù)字聲像檔案管理中無法獲取到所需的大數(shù)據(jù),其根本原因在于各個部門的大數(shù)據(jù)資源缺乏共享。如若缺少大數(shù)據(jù)對數(shù)字聲像檔案進行有效的識別分析,則會使智能標注過程中,出現(xiàn)錯誤的概率加大,并會導致識別率下降等情況,無法起到很好的輔助聲像檔案管理的作用。
(五)數(shù)字聲像檔案管理水平參差不齊
現(xiàn)階段,不少機關(guān)單位數(shù)字聲像檔案收集困難,缺乏較為完備的儲存介質(zhì),加之預(yù)算有限,在數(shù)字聲像檔案的形成、管理、加工利用等各方面的管理手段均比較落后,水平參差不齊。有的檔案部門在形成或者收集聲像檔案的過程中,存在不注重“質(zhì)”強調(diào)“量”,以及清晰度等關(guān)鍵要素沒有達到標準就接收的現(xiàn)象,嚴重影響數(shù)字聲像檔案智能標注的應(yīng)用與發(fā)展。
(一)提高對數(shù)字聲像檔案的認識程度
為從源頭上改善并創(chuàng)新數(shù)字聲像檔案管理模式,需要轉(zhuǎn)變檔案工作者的管理觀念。一是要轉(zhuǎn)變對聲像檔案的傳統(tǒng)認知。由于近年來聲像檔案的憑證作用明顯加強,檔案工作者要積極學習與現(xiàn)代經(jīng)濟社會相適應(yīng)的聲像檔案管理方式。改善單一地對聲像信息處理只能通過人工判斷轉(zhuǎn)化為文本信息再進行處理的間接處理方式,大膽創(chuàng)新,應(yīng)用先進的人工智能技術(shù)成果,探索以圖找圖、以聲尋影的由計算機系統(tǒng)判斷的直接處理方式。二是要加強宣傳力度。各檔案館要利用好各類型宣傳陣地積極宣傳,公開展示一批精品數(shù)字聲像檔案、模擬辦理數(shù)字聲像檔案利用手續(xù)、宣講優(yōu)秀數(shù)字聲像檔案利用案例,使檔案工作者借此進一步加深對數(shù)字聲像檔案認識的同時,也讓大眾親身體驗到數(shù)字聲像檔案發(fā)揮的作用。
(二)制定數(shù)字聲像檔案管理規(guī)范
建議有關(guān)部門盡早出臺數(shù)字聲像檔案管理的相關(guān)規(guī)范要求,重點強調(diào)以下三點內(nèi)容:一是對于在數(shù)字聲像檔案管理中應(yīng)用人工智能技術(shù)給予明確具體的指導性意見;二是在起草修訂制度過程中應(yīng)有前瞻性,給新技術(shù)新手段留有制度空間;三是為促進各部門共建共享數(shù)據(jù)庫,實現(xiàn)數(shù)據(jù)庫資源共享等發(fā)展要求,建議檔案管理部門進一步統(tǒng)籌出臺細則,明確對聲像檔案內(nèi)容特征的要求,促進各檔案館根據(jù)標準規(guī)范,充分利用現(xiàn)代信息化技術(shù),實現(xiàn)數(shù)字聲像檔案資源的共享,以制度建設(shè)促進數(shù)字聲像檔案管理工作提質(zhì)增效。
(三)鼓勵相關(guān)領(lǐng)域合作研發(fā)和開展技術(shù)試點
建議國家檔案局與公安、交通、高新技術(shù)公司等合作,也可以與有研發(fā)能力的大學開展相關(guān)技術(shù)的研發(fā)。同時,應(yīng)鼓勵開展跨行業(yè)技術(shù)研發(fā),嘗試建立“單位+企業(yè)”等多種融合機制,加速推進聲像檔案資源的開發(fā)。有的機關(guān)單位將數(shù)字聲像檔案智能系統(tǒng)外包,不僅有助于削減成本,更有助于提高聲像檔案資源開發(fā)的效率。在實施數(shù)字聲像檔案智能標注的同時,有必要引入資質(zhì)高、信譽好的外包公司,以獲得優(yōu)質(zhì)、高效、全面的解決方案,攻克應(yīng)用難點以確保數(shù)字聲像檔案智能標注的安全和效率;也可在大型高新企業(yè)開展試點,以便借助其人員與技術(shù)優(yōu)勢。
此外,應(yīng)倡導有關(guān)部門建立開放共享大數(shù)據(jù)的有效機制。大數(shù)據(jù)是智能標注技術(shù)應(yīng)用的基礎(chǔ),直接決定著智能標注技術(shù)是否能夠正常實行。依照相關(guān)法律開放共享大數(shù)據(jù)資源是技術(shù)發(fā)展的需要。因此,鼓勵相關(guān)部門將其所擁有的大數(shù)據(jù)成果共享,有助于推動數(shù)字聲像檔案智能標注技術(shù)的推廣與應(yīng)用。
(四)提高數(shù)字聲像檔案管理水平
安全可靠的軟硬件環(huán)境是開展數(shù)字聲像檔案智能標注的基礎(chǔ)保障,直接決定著數(shù)字聲像檔案的管理水平。因此,應(yīng)用新技術(shù)的首要條件就是全面提升軟硬件基礎(chǔ)設(shè)施,及時做好系統(tǒng)升級優(yōu)化,減少系統(tǒng)運行錯誤,加強系統(tǒng)易用性,多方面提高系統(tǒng)的安全性、可靠性。尤其需要注意的是,在數(shù)字聲像檔案收集方面,應(yīng)明確對有價值的聲像文件應(yīng)歸盡歸,還應(yīng)明確收集時的數(shù)據(jù)內(nèi)容要具有真實性、完整性和可用性,以及格式要滿足相應(yīng)條件。例如,聲像采集應(yīng)采用高清及以上攝錄設(shè)備,以不低于1080P像素進行記錄,推薦采用4K\8K標準,從源頭優(yōu)化數(shù)字聲像檔案質(zhì)量,提高數(shù)字聲像檔案管理水平。
傳統(tǒng)的數(shù)字聲像檔案標注由于投入人力成本高、聲像信息雜亂、標注困難等,已漸漸無法滿足現(xiàn)代化業(yè)務(wù)工作的需求,若還用舊方法標注,難免會影響數(shù)字聲像檔案利用工作的開展。因此,開發(fā)數(shù)字聲像檔案管理新手段迫在眉睫,筆者建議有能力的單位盡早探索如數(shù)字聲像檔案智能標注等“新技術(shù)+檔案”的新管理手段,充分發(fā)揮人工智能技術(shù)在數(shù)字聲像檔案管理中的作用,全面試點新的數(shù)字聲像檔案管理模式,提高數(shù)字聲像檔案資源的標注質(zhì)量和水平,最終實現(xiàn)數(shù)字聲像檔案資源的高效利用。
參考文獻:
[1]高建輝.精準扶貧數(shù)碼照片音視頻檔案專題數(shù)據(jù)庫應(yīng)用平臺開發(fā)研究[J].北京檔案,2021(11):25-28.
[2]盧曉峰.特殊載體檔案概述[J].黑龍江科技信息,2012(18):112.
[3]段長征.視頻內(nèi)容分析技術(shù)剖析及在校園視頻監(jiān)控系統(tǒng)的應(yīng)用探討[J].山東農(nóng)業(yè)大學學報(自然科學版)2012,43(1):100-104.
[4]王雪飛.數(shù)字化背景下聲像檔案管理的若干思考[J].大眾科技,2011(10):247-248.
[5]智敏.基于內(nèi)容的視頻檢索和瀏覽的關(guān)鍵技術(shù)[D].北京:北京郵電大學,2006.
[6]路程.視頻內(nèi)容檢索技術(shù)概述[J].山西科技,2018,33(2):56-58.
[7]許琪瑋.論高校檔案管理與大數(shù)據(jù)技術(shù)的應(yīng)用[J].辦公室業(yè)務(wù),2018(14):157.
[8]楊曉宇.基于深度學習智能標注圖片關(guān)鍵字系統(tǒng)的設(shè)計與實現(xiàn)[D].廣州:中山大學,2014.
作者單位:交通運輸部檔案館