• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    人工智能在檔案工作中的應(yīng)用實踐與挑戰(zhàn)

    2019-09-10 07:22:44陳會明史愛麗王寧金文光
    檔案與建設(shè) 2019年7期
    關(guān)鍵詞:自然語言處理模式識別檔案

    陳會明 史愛麗 王寧 金文光

    摘要:隨著深度學(xué)習(xí)技術(shù)的迅速發(fā)展,人工智能逐漸進(jìn)入行業(yè)應(yīng)用階段,也為檔案工作的智能化發(fā)展提供了契機(jī),尤其是文本處理、信息抽取、模式識別、專家系統(tǒng)等技術(shù)在檔案工作中體現(xiàn)出廣闊的應(yīng)用前景。文章以北京市市場監(jiān)督管理局為案例,分析了其引入人工智能技術(shù)進(jìn)行檔案智能挑選和智能鑒定劃控等工作取得的成果,并研究探索了人工智能技術(shù)在檔案審核和音視頻檔案管理中的應(yīng)用思路,最后對人工智能在檔案領(lǐng)域中的挑戰(zhàn)和對策進(jìn)行了思考。

    關(guān)鍵詞:人工智能;檔案;深度學(xué)習(xí);模式識別;自然語言處理

    分類號:G271

    近年來,人工智能技術(shù)的發(fā)展取得了較大的突破,尤其是在大量數(shù)據(jù)的推動下,深度學(xué)習(xí)技術(shù)日益成熟,在醫(yī)療、交通、教育、企業(yè)管理等多個領(lǐng)域呈現(xiàn)出良好的應(yīng)用態(tài)勢,“人工智能+”在多個行業(yè)逐漸落地。世界主要發(fā)達(dá)國家正在把發(fā)展人工智能技術(shù)作為提升國家核心科技競爭力的關(guān)鍵目標(biāo),將人工智能提到前所未有的戰(zhàn)略高度。人工智能呈現(xiàn)出的跨界融合、人機(jī)協(xié)同等特征,與產(chǎn)業(yè)發(fā)展的基礎(chǔ)層、技術(shù)層和應(yīng)用層相互配合、相互促進(jìn),將成為今后人工智能與產(chǎn)業(yè)發(fā)展融合的主要方向[1]。人工智能技術(shù)在檔案行業(yè)中的應(yīng)用也正在不斷突破發(fā)展,“大”數(shù)據(jù)成為數(shù)字時代檔案資源的顯著特征,為人工智能技術(shù)提供了充分的數(shù)據(jù)儲備,使得模式識別、文本處理、信息抽取、專家系統(tǒng)等技術(shù)在檔案智能管理中能夠發(fā)揮重要的作用。經(jīng)過不斷迭代,人工智能技術(shù)的應(yīng)用將從很大程度上提高檔案管理工作的效率,節(jié)省人力物力資源,提升管理和服務(wù)質(zhì)量,并適應(yīng)檔案數(shù)據(jù)化發(fā)展的趨勢,推動檔案工作的智能化變革。而在未來發(fā)展過程中,也要著眼于人工智能技術(shù)應(yīng)用的風(fēng)險控制路徑和人機(jī)協(xié)作與融合發(fā)展問題,以取得更高的效益和提供良好的人機(jī)環(huán)境。

    一、人工智能與深度學(xué)習(xí)

    人工智能是通過人類設(shè)定相應(yīng)的程序并操作,使計算機(jī)可以模擬人類思維過程與智能行為的技術(shù),是計算機(jī)科學(xué)發(fā)展到一定階段衍生出來的產(chǎn)物[2]。經(jīng)過半個多世紀(jì)的坎坷發(fā)展歷程,近年來迎來新的發(fā)展曙光,尤其是云計算和大數(shù)據(jù)技術(shù)的巨大發(fā)展,為人工智能的突破提供了強(qiáng)大的計算平臺和充實的數(shù)據(jù)資源。在這一過程中,最顯著的便是深度學(xué)習(xí)的突破。深度學(xué)習(xí)技術(shù)在機(jī)器學(xué)習(xí)技術(shù)的基礎(chǔ)上發(fā)展而來,依托更多的數(shù)據(jù)資源和更高級的算法,實現(xiàn)更精確的學(xué)習(xí)輸出和效率,在自然語言理解、計算機(jī)視覺技術(shù)等學(xué)習(xí)中具有突出表現(xiàn)。機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的本質(zhì)是從數(shù)據(jù)中尋找規(guī)律的過程,通過給定的摘要信息或數(shù)據(jù)對尋找規(guī)律,并設(shè)計出算法和模型,應(yīng)用于解決預(yù)測問題、分類分析、聚類分析等實踐問題。

    在檔案工作中最常用到的人工智能和深度學(xué)習(xí)技術(shù)主要包括文本處理技術(shù)、信息抽取技術(shù)、模式識別技術(shù)、專家系統(tǒng)等關(guān)鍵技術(shù)成果。(詳見表1)

    二、北京市市場監(jiān)督管理局的檔案智能化應(yīng)用與探索

    企業(yè)登記檔案是市場監(jiān)督管理機(jī)關(guān)依法對企業(yè)法人登記注冊、監(jiān)督管理過程中形成的具有保存價值的文字、圖表、聲像等形式的歷史記錄,它們對于規(guī)范市場主體行為、保障企業(yè)合法權(quán)益、促進(jìn)社會信用體系建設(shè)具有十分重要的意義。北京市市場監(jiān)督管理局近幾年將人工智能技術(shù)和思維引入局內(nèi)檔案的管理工作中,經(jīng)過多次迭代,在檔案智能挑選、檔案智能鑒定劃控方面取得了一定的實踐應(yīng)用成果,同時不斷探究智能音視頻檔案管理和智能審核等功能實現(xiàn)方案,是人工智能在檔案行業(yè)的應(yīng)用典型。

    1.智能檔案精準(zhǔn)檢索

    從內(nèi)容而言,企業(yè)登記檔案包含了對企業(yè)法人登記注冊和監(jiān)督管理過程中形成的公司章程、驗資報告、財務(wù)審計報告、法人承諾書、企業(yè)法人和股東的身份證明和聯(lián)系方式等數(shù)十種材料。但是在檔案的查詢利用過程中,用戶未必要用到一份企業(yè)登記檔案中的全部材料,可能只需要檢索和利用其中一項材料或者一頁內(nèi)容、一條數(shù)據(jù),那么如何在短時間內(nèi)在體量龐大的數(shù)十種材料中定位到用戶想要利用的目標(biāo)性內(nèi)容,是目前企業(yè)登記檔案利用服務(wù)中迫切需要解決的問題之一。

    針對這一需求,北京市市場監(jiān)督管理局引入人工智能技術(shù)中的圖像識別技術(shù)和信息抽取技術(shù)等,針對檔案利用過程中無法直接查找定位身份證明文件等精細(xì)化利用問題,研發(fā)了檔案圖文智能定位與精細(xì)化檢索工具,實現(xiàn)了對存量數(shù)字化圖像內(nèi)容的批量智能自動識別預(yù)處理和精確查找定位,目前部分類型的檔案智能精確檢索率已經(jīng)超過90%,在很大程度上提升了檔案利用效率,提高了用戶滿意度。

    2.智能檔案劃控鑒定

    檔案開放是各級各類檔案館和組織機(jī)構(gòu)開展檔案利用服務(wù)的主要形式,館藏檔案在開放前,都必須要進(jìn)行劃控鑒定。檔案劃控鑒定是檔案館館藏檔案達(dá)到開放年限后經(jīng)過組織鑒定審查、劃控、審核、審批,向社會開放的過程[5]。

    北京市市場監(jiān)督管理局的企業(yè)登記檔案具有利用率高、共享性強(qiáng)的特點(diǎn)。企業(yè)登記檔案的利用采用頁面級安全控制,但部分早期館藏沒有進(jìn)行檔案頁面內(nèi)容的公開屬性鑒定,且不同歷史時期檔案內(nèi)容公開屬性的鑒定標(biāo)準(zhǔn)有所不同,導(dǎo)致在檔案共享利用過程中存在檔案信息泄露等安全隱患。面對高達(dá)數(shù)億頁的海量檔案,原來只能根據(jù)查詢要求進(jìn)行人工鑒定。針對這一情況,北京市市場監(jiān)督管理局采用檔案圖像識別和內(nèi)容識別等人工智能技術(shù),結(jié)合專家系統(tǒng)的應(yīng)用,研發(fā)了某些類型檔案的頁面公開級別智能鑒定工具。該工具在企業(yè)登記檔案大數(shù)據(jù)的基礎(chǔ)上,通過大量檔案圖像數(shù)據(jù)樣本學(xué)習(xí)訓(xùn)練出可靠的算法模型,首先保證海量圖像內(nèi)容的識別精度,然后再按照現(xiàn)有的鑒定標(biāo)準(zhǔn),采用批量智能識別處理的模式對存量檔案圖像頁面的公開級別進(jìn)行全自動鑒定與校核處理,有效消除了檔案共享利用過程中的檔案信息泄露等安全隱患,促進(jìn)檔案安全體系建設(shè),同時降低了成本、提高了鑒定效率,有效促進(jìn)了檔案管理工作方式的創(chuàng)新。

    3.智能檔案審核、音視頻檔案管理

    在電子文件增量迅速擴(kuò)大的背景下,在線電子化歸檔成為企業(yè)登記檔案中最主要的歸檔方式之一,需要提高電子檔案的數(shù)據(jù)質(zhì)量、歸檔效率和查詢時效性。針對現(xiàn)階段在線電子歸檔的質(zhì)量問題,北京市市場監(jiān)督管理局發(fā)現(xiàn)電子化檔案歸檔審核難度大、效率低,以及檔案查詢利用的時效性低等,因而研究采用檔案圖像內(nèi)容識別等人工智能相關(guān)技術(shù),正在設(shè)計研發(fā)智能化在線歸檔的處理工具,實現(xiàn)對在線歸檔的原生電子文件圖文質(zhì)量進(jìn)行智能化的自動批量校核,包括圖像清晰度、內(nèi)容完整性和規(guī)范性等方面的質(zhì)量檢查,在確保企業(yè)登記檔案大數(shù)據(jù)質(zhì)量的同時,有助于提高電子文件在線歸檔效率及查詢時效性。

    音視頻檔案也包含有大量管理性和業(yè)務(wù)性價值信息,但是大量音視頻檔案并不便于查詢利用,例如行政執(zhí)法等多媒體檔案文件片段多、內(nèi)容不連貫無規(guī)律,利用十分不便。對此,北京市市場監(jiān)督管理局嘗試研究采納語音識別技術(shù)、計算機(jī)視覺技術(shù)等,探索以視、音頻信息服務(wù)為主體的多媒體內(nèi)容分析處理等智能化信息處理工具,研究對行政執(zhí)法過程的視頻和音頻文件進(jìn)行自動分類管理和智能檢索利用的工作方法,以提高音視頻檔案的利用率,同時最大程度地對其中有價值的數(shù)據(jù)信息進(jìn)行挖掘和分析。

    北京市市場監(jiān)督管理局的檔案管理現(xiàn)實需求構(gòu)成了人工智能技術(shù)應(yīng)用的驅(qū)動力,并將人工智能的深度學(xué)習(xí)技術(shù)真正納入智能檔案管理的實踐層面,說明檔案領(lǐng)域的人工智能也已經(jīng)進(jìn)入實踐應(yīng)用階段,并且在未來檔案行業(yè)專家和技術(shù)應(yīng)用相結(jié)合的過程中,還將更有可為。

    三、人工智能在檔案行業(yè)應(yīng)用的挑戰(zhàn)與對策

    將人工智能應(yīng)用于檔案管理工作中具有重要的價值。首先,效率和成本方面,能夠大大提高檔案審核、鑒別和檢索服務(wù)的效率,在準(zhǔn)確率方面也超出人工管理的平均水平,同時能夠節(jié)省大量的人力資源,以二十四小時工作的機(jī)器人代替人類完成大量程序性操作。此外,伴隨著大數(shù)據(jù)時代的到來,檔案管理的“數(shù)據(jù)化”趨勢也將不可逆轉(zhuǎn),單憑人腦來分析、處理和挖掘大量檔案數(shù)據(jù)中的信息幾乎不現(xiàn)實,人工智能技術(shù)的應(yīng)用是必然的選擇。而將人工智能技術(shù)應(yīng)用到檔案行業(yè)中,尚處于不斷摸索的階段,同樣面臨著諸多的風(fēng)險和挑戰(zhàn),需要合理規(guī)劃和應(yīng)對。

    1.人工智能應(yīng)用的風(fēng)險控制

    人工智能技術(shù)雖然已經(jīng)大規(guī)模應(yīng)用,但是整體上仍處于“弱人工智能”階段,是在一瘸一拐的摸索中前行,其自身技術(shù)革新的局限性也必然會導(dǎo)致在檔案行業(yè)中應(yīng)用的風(fēng)險。

    一方面,人工智能的深度學(xué)習(xí)技術(shù)是建立在大量數(shù)據(jù)儲備基礎(chǔ)上的,為了提高操作的準(zhǔn)確率和效率,檔案應(yīng)用人工智能技術(shù)必然需要大量的用戶數(shù)據(jù)進(jìn)行機(jī)器學(xué)習(xí),以提供更加精準(zhǔn)和便捷的用戶服務(wù),因而存在用戶信息安全與隱私保護(hù)方面的風(fēng)險[6]。尤其是隨著人工智能技術(shù)的大規(guī)模應(yīng)用,機(jī)器將有越來越多的機(jī)會接觸數(shù)據(jù),并且是龐大的數(shù)據(jù)體,那么數(shù)據(jù)泄露等風(fēng)險將成為重要性問題。另一方面,人工智能技術(shù)是在學(xué)習(xí)人腦知識和人腦思維的基礎(chǔ)上進(jìn)行應(yīng)用,機(jī)器對于數(shù)據(jù)和信息的識別和理解能力也具有一定的局限性,技術(shù)的不成熟、檔案專家系統(tǒng)的不完善等要素,都會成為人工智能應(yīng)用水平的重要影響因素。因而在實踐應(yīng)用過程中和人類一樣會出現(xiàn)操作失誤,甚至?xí)竿ǔG闆r下人類并不會犯的錯誤,易導(dǎo)致檔案內(nèi)容誤讀、頁面安全級別鑒定錯誤等工作風(fēng)險。

    對此,有必要在人工智能技術(shù)引入檔案工作實踐的同時,充分考慮到其潛在的風(fēng)險問題,采取風(fēng)險控制措施。針對人工智能應(yīng)用存在的數(shù)據(jù)泄露和隱私安全風(fēng)險問題,需要建立有效的用戶信息安全保護(hù)制度,在信息授權(quán)、信息傳遞等方面明確機(jī)器學(xué)習(xí)的權(quán)限,有效規(guī)避在人工智能應(yīng)用過程中潛在的信息泄露風(fēng)險。在人工智能管理者、技術(shù)人員和用戶之間建立起合理的利用觀念,在遵守倫理道德的前提下利用人工智能[7]。同時,面對機(jī)器可能造成的失誤,在應(yīng)用測試階段對人工智能的失誤率進(jìn)行有效評估,不斷優(yōu)化目標(biāo)函數(shù),并保證在多次迭代達(dá)到可控風(fēng)險的階段才能真正納入實踐應(yīng)用,實現(xiàn)人工智能應(yīng)用的損失控制,在必要時采用人工輔助的手段進(jìn)行風(fēng)險保留。

    2.人機(jī)協(xié)作融合的發(fā)展走向

    將人工智能技術(shù)應(yīng)用到檔案工作中,雖然很大程度上是要實現(xiàn)解放人類勞動力,提升工作效率的目標(biāo),但并不意味著人工智能要替代人類工作,當(dāng)然也不可能替代人類工作。相反,技術(shù)的局限性和技術(shù)為人服務(wù)的本質(zhì),要求人和機(jī)器更好地協(xié)作,人機(jī)協(xié)作和融合才是人工智能行業(yè)應(yīng)用的最佳圖景。

    人工智能技術(shù)在檔案行業(yè)的應(yīng)用過程中,必然也要解決人工智能技術(shù)迭代和革新過程中的人工參與和人機(jī)并存問題。首先,作為設(shè)計者和管理者的角色,檔案工作者和技術(shù)人員應(yīng)該不斷增強(qiáng)自身對檔案信息資源的理解能力,增強(qiáng)對用戶需求理解的能力,并將這種能力盡可能應(yīng)用到機(jī)器學(xué)習(xí)和迭代的設(shè)計流程中,同時盡可能多地將功能需求、專家系統(tǒng)和糾錯方案等要素納入機(jī)器學(xué)習(xí)過程,對其安全性、可靠性和準(zhǔn)確性等進(jìn)行不斷改進(jìn),使得機(jī)器在學(xué)習(xí)檔案業(yè)務(wù)的同時也不斷學(xué)習(xí)人類思維,促進(jìn)人工智能技術(shù)的成功應(yīng)用。其次,人要給機(jī)器學(xué)習(xí)檔案工作創(chuàng)造好的條件和環(huán)境,此時人將作為協(xié)助者的角色,在功能要求、行業(yè)知識、檔案數(shù)據(jù)等關(guān)鍵要素設(shè)定完備的前提下,在機(jī)器學(xué)習(xí)和運(yùn)行的過程中,盡可能少地干擾其學(xué)習(xí)和工作過程,給予其充分自我學(xué)習(xí)和解決問題的發(fā)展空間,充分發(fā)揮機(jī)器在某些特定工作環(huán)境中的主導(dǎo)作用。

    人工智能不僅是一種技術(shù),更是一種思維。目前國內(nèi)外人工智能技術(shù)本身及各行業(yè)應(yīng)用的發(fā)展速度雖然很快,但其在檔案工作中的應(yīng)用還在起步階段,仍然存在技術(shù)發(fā)展欠缺、管理理念落后、資源挖掘不足等問題,可謂機(jī)遇與挑戰(zhàn)并存。在知識融合和信息大爆炸的時代,相對滯后的檔案人工智能行業(yè)應(yīng)用需要主動迎接新技術(shù)新思想,結(jié)合自身的數(shù)據(jù)資源優(yōu)勢和行業(yè)專家水平,將科學(xué)技術(shù)與檔案人文精神相結(jié)合,不斷推進(jìn)人工智能在檔案領(lǐng)域的更深層次和高水平的發(fā)展。

    *本文系國家檔案局“人工智能技術(shù)在工商檔案管理中的應(yīng)用研究”(課題編號:2018-X-23)及北京市檔案局“人工智能技術(shù)在工商檔案管理中的應(yīng)用研究”(課題編號:2019- 06)科研項目階段性研究成果。

    注釋及參考文獻(xiàn)

    [1]宋之杰,肖寒.加強(qiáng)人工智能和產(chǎn)業(yè)發(fā)展融合[N].河北日報,2019-02-13(7).

    [2]陳映村,程鵬飛.人工智能的發(fā)展現(xiàn)狀及應(yīng)用[J].信息與電腦,2019(2):136.

    [3]人工智能/騰訊研究院.人工智能[M].北京:中國人民大學(xué)出版社,2017:24.

    [4]信息抽取技術(shù)及前景淺析.[EB/ OL].[2018-03-09].http://www.docin.com/ p-70263324.html.

    [5]張師師.如何做好檔案開放中的劃控鑒定工作[J].黑龍江檔案,2018(4):74.

    [6][7]楊九龍,陽玉堃,許碧涵.人工智能在圖書館應(yīng)用的理論邏輯、現(xiàn)實困境與路徑展望[J].圖書情報工作,2019(4):35+36.

    猜你喜歡
    自然語言處理模式識別檔案
    淺談模式識別在圖像識別中的應(yīng)用
    電子測試(2017年23期)2017-04-04 05:06:50
    第四屆亞洲模式識別會議
    基于組合分類算法的源代碼注釋質(zhì)量評估方法
    如何做好鄉(xiāng)鎮(zhèn)計劃生育檔案管理工作
    檔案的開發(fā)利用在供電公司全面管理中的作用
    淺談北京衛(wèi)視《檔案》的敘述方式
    新聞世界(2016年10期)2016-10-11 20:31:45
    新常態(tài)下高校檔案工作發(fā)展研究
    面向機(jī)器人導(dǎo)航的漢語路徑自然語言組塊分析方法研究
    漢哈機(jī)器翻譯中的文字轉(zhuǎn)換技術(shù)研究
    HowNet在自然語言處理領(lǐng)域的研究現(xiàn)狀與分析
    科技視界(2016年5期)2016-02-22 11:41:39
    宿松县| 新丰县| 咸丰县| 太和县| 宁津县| 会东县| 久治县| 贵州省| 东海县| 柳州市| 名山县| 台东县| 滁州市| 红桥区| 怀化市| 贵港市| 阿瓦提县| 松桃| 睢宁县| 理塘县| 元氏县| 南投县| 苏州市| 京山县| 濉溪县| 揭阳市| 泸州市| 公安县| 土默特左旗| 黄浦区| 观塘区| 绥阳县| 互助| 梁河县| 武强县| 阿巴嘎旗| 阿勒泰市| 察隅县| 缙云县| 高碑店市| 邛崃市|