• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于深度學習的文本自動糾錯系統(tǒng)設計與實現(xiàn)

    2023-03-04 13:25:40張靜靜蔡紅維劉皓挺才金山杜曉平高美萍
    計算機測量與控制 2023年2期
    關鍵詞:文檔辦公要素

    楊 輝,張靜靜,熊 濤,蔡紅維,劉皓挺, 才金山,杜曉平,高美萍

    (1.中國航天員科研訓練中心,北京 100094;2.北京科技大學 自動化學院 北京市工業(yè)波譜成像工程技術研究中心,北京 100083;3.西昌衛(wèi)星發(fā)射中心,四川 西昌 615000)

    0 引言

    電子文檔是現(xiàn)代重要的信息交換媒介,對電子文檔進行編輯排版、格式校對和內容檢查是辦公人員重要的日常工作。隨著電子文檔應用越來越廣泛,且在特定的辦公場合,固定版式文檔的規(guī)范性和標準性標準越來越高[1]。文檔格式排版繁瑣且具有重復性,若辦公人員對文檔格式不熟悉,將會造成工作效率低下無法保證排版質量。當辦公人員對語言掌握不足或工作疏忽大意時,電子文檔中就不可避免地會存在字詞、語法和標點符號錯誤,這些錯誤嚴重時會造成其他人對文本內容的理解偏差[2]。目前雖然存在文本內容糾錯技術,然而這些技術的糾錯率比較低,文本內容查錯主要還是依賴辦公人員細致的檢查。為減輕辦公人員進行文檔編輯寫作時繁重的文本校對工作,并提升文本內容糾錯準確率,本文研究基于深度學習的文本自動糾錯系統(tǒng),用來輔助辦公人員的文檔寫作和文本糾錯工作,以提升辦公人員的工作效率并確保文檔內容的規(guī)范性和正確性。

    目前已有相關研究和技術實現(xiàn)對文檔格式校對和文本內容的糾錯。文獻[3]和[4]開展了對標準論文模板的分析與設定,提出了畢業(yè)論文格式自動檢查系統(tǒng)。文獻[5]實現(xiàn)了軟件項目文檔格式自動檢查和修改,降低了文檔編寫人員在文檔格式編寫的出錯率。文獻[6]開發(fā)的Word文檔格式自動排版系統(tǒng),能夠自定義文檔的格式。隨著自然語言處理的迅速發(fā)展,中文文本糾錯技術也愈加成熟。文獻[7]將中文文本糾錯技術分為基于字詞混淆集而形成候選字符串方法、基于概率統(tǒng)計分析上下文方法和基于規(guī)則和固定搭配關系的方法等。文獻[8]結合二元語法模型和散串技術,在混淆集中選出最優(yōu)糾錯候選集,提出了一種基于窗口技術的校對方法。文獻[9]對句子進行分詞和詞性標注解決字詞錯誤,通過模式匹配解決搭配錯誤問題,利用成分分析解決成分錯誤問題。文獻[10]采用規(guī)則與概率統(tǒng)計相結合的方法實現(xiàn)中文文本自動查錯。文獻[11]構建專業(yè)領域詞語搭配知識庫,并設計基于語法和詞語搭配的雙重中文文本校對算法。

    隨著信息化時代的迅速發(fā)展,現(xiàn)有文本糾錯技術難以適應多樣性的糾錯任務,近幾年許多研究者紛紛將深度學習方法引入文本糾錯任務。深度學習算法自動編碼器的自主學習特征可以通過對語言模型的不斷訓練實現(xiàn)糾錯[12]。目前常用的基于深度學習糾錯方法主要包括基于序列模型的糾錯方法、基于注意力機制的糾錯方法和基于預訓練模型的糾錯方法。文獻[13]通過基于規(guī)則、統(tǒng)計和深度學習網(wǎng)絡結合的方式提升中文文本糾錯率。文獻[14]將神經(jīng)網(wǎng)絡模型引入于中文文本糾錯,并設計兩個糾錯子模塊檢查中文語法錯誤和拼寫錯誤。文獻[15]提出基于注意力機制的深度學習糾錯方法,在非標注中文語料庫上用降噪編碼器訓練糾錯模型實現(xiàn)字級別和句子級別糾錯任務。為實現(xiàn)文本的格式和內容糾錯任務,本文提出設計一種基于深度學習的文本自動糾錯系統(tǒng)。系統(tǒng)主要由文本格式糾錯和文本內容糾錯功能組成,能夠檢查文本格式和內容錯誤同時生成檢查報告并通過一鍵校對實現(xiàn)文本自動糾錯任務。

    1 文本自動糾錯系統(tǒng)總體方案設計

    1.1 系統(tǒng)相關原理介紹

    分析總結常見的文本格式錯誤主要包括以下幾種:1)文檔結構錯誤:表現(xiàn)為固定版式文檔缺乏一些文本要素,如缺乏文檔標題;2)正文段落格式不符合規(guī)范,表現(xiàn)為文本段落縮進和行間距不正確等;3)文本格式不符合規(guī)范:表現(xiàn)為文本的字體和字號不正確等;4)頁碼不符合規(guī)范:表現(xiàn)為文檔頁碼的對齊方式或字體不正確等。系統(tǒng)的文本格式糾錯功能主要基于VBA(visual basic for applications)技術實現(xiàn)的。VBA是微軟用來拓展Office功能設計的開發(fā)語言[16]。Office中元素都以對象形式表示出來,而VBA具有特有的對象屬性和方法,可用于表示Office對象并對其進行查詢和調整[17]。對于固定版式的文檔,文本要素組成及對應格式是固定的。因此系統(tǒng)格式校對功能實現(xiàn)主要在于識別出文檔中的文本要素,根據(jù)格式要求檢查并校對文本的格式。此外VBA宏代碼保存在“所有文檔Normal.dotm”中,可利用Python編程語言設計程序調取VBA宏代碼對Word文檔進行格式校對。

    分析總結常見文本內容錯誤主要包括以下幾種:1)字詞錯誤:包括音似、形似和易錯字詞的錯誤;2)語法錯誤:分為搭配錯誤和成分相關錯誤;3)標點符號錯誤:表現(xiàn)標點符號冗余和半角全角標點符號誤用;4)用語不符合規(guī)范:主要是固定地名、人名、單位名稱和專業(yè)用語使用錯誤[18]?;谏疃葘W習的序列模型是典型的自然語言處理模型,它采用自循環(huán)的計算方式,從序列起始端開始計算循環(huán)迭代一直計算到序列最后一個節(jié)點,以獲取更多的特征信息,從而提高模型分類和預測精度。序列模型常用于機器翻譯、語音識別、文本自動摘要和自動問答的任務處理[19],將其引入文本糾錯任務中是將錯誤句子作為源文本,正確句子作為目標文本,將源文本和目標文本一起作為訓練數(shù)據(jù)來訓練文本糾錯模型[20]。本文采用序列到序列模型(Seq2Seq, sequence to sequence)來訓練查錯模型實現(xiàn)字詞和語法查錯,標點符號糾錯采用代碼邏輯去判斷。Seq2Seq模型的思路表示從一個序列到另一個序列,輸入和輸出均為序列,它有自由度高、方便靈活的特點,是一種比較常見的處理文本序列數(shù)據(jù)的模型[21]。

    1.2 系統(tǒng)總體設計方案

    辦公人員在進行固定版式文檔寫作時,會因為不清楚文檔標準格式而造成寫作效率低下且校對負擔較大。即使文檔標準格式模板是固定的,辦公人員在寫作時的復制粘貼、調整格式等操作也會使得文本格式不符合規(guī)范要求。此外文檔中會存在的一些字詞、語法和標點符號的錯誤,文本錯誤將嚴重影響到相關人員對內容的理解。因此本文對文本格式和內容糾錯方法進行研究,以實現(xiàn)對文檔中字體、段落格式和頁碼格式錯誤,以及文本中字詞、語法、標點符號和規(guī)范用語錯誤進行全方位的錯誤識別與自動校對。根據(jù)辦公人員文檔寫作和文本糾錯需求,設計文本自動糾錯系統(tǒng)由三個功能組成,即文檔模板生成、文本格式校對和文本內容糾錯功能。系統(tǒng)的總體設計方案如圖1所示。

    圖1 系統(tǒng)設計框圖

    辦公人員在起草文檔時,利用文檔模板生成功能選擇生成標準格式Word模板,在該格式模板的基礎上進行文檔寫作。當文檔編輯完成時,利用文本格式校對功能對成稿文檔進行格式校對,最后利用文本糾錯功能對文本內容進行檢查和糾錯。本文設計的文本自動糾錯系統(tǒng)能夠極大地提升辦公人員的工作效率,并在一定程度上保證文本的規(guī)范性和正確性。

    2 文本自動糾錯系統(tǒng)功能設計與實現(xiàn)

    2.1 基于VBA技術的文本格式校對

    本文格式校對功能是基于VBA技術對Word文檔解析完成。使用VBA技術可以調用Word對象,獲取Word文檔的文本信息和格式信息,并對文檔頁面、文本段落和字體等格式進行調整。Word對象結構層次如圖2所示,Application是Word應用中最大的對象,它共包含四種對象,它們分別為Document是文件類,Selection是文字內容類,Bookmark是書簽類,還有Range是區(qū)域類。由于可通過不同方式訪問同一個對象,所以類之間存在各樣的重疊。除了這些屬于頂層類型還有設置文本字體、段落等的格式的類。使用VBA技術可以獲取Word對象,分析對象格式信息并對Word文檔進行讀寫及格式調整。

    圖2 Word對象結構層次

    本文研究固定版式文檔的格式校對功能,即文檔中文本要素組成和要素格式是固定的。文本格式校對流程如圖3所示。首先要對文檔進行初始化設置,主要是刪除文檔中的超鏈接、調整頁面大小和頁邊距以及進行字體初始化設置。接著要根據(jù)文本要素特點識別出文本要素所在區(qū)域并插入書簽,然后檢查文本要素的字體和段落格式是否滿足標準格式要求,當不符合標準格式就修改文本要素的字體和段落格式。對于不同文檔類型,其文檔結構是不同的,主要表現(xiàn)為存在不同的文本要素,所以要根據(jù)文檔類型對文檔結構做出調整。最后由于不同類型文檔頁碼格式不同且辦公人員制作的文檔頁碼常常不符合規(guī)范要求,因此刪除原來的頁碼重新插入符合標準格式的頁碼。

    圖3 格式校對流程圖

    對于不同固定版式的文檔如公司招投標文件、高校畢業(yè)論文、期刊雜志論文和機關公文等,文檔的文本要素組成和格式標準相差很大。對這些文檔格式進行校對,必須通過分析文本要素特點,明確一篇文檔都由哪些必要文本要素組成,并根據(jù)文本要素特點設計相應的文本要素識別方法。文本要素特點包括文本要素內容特點,如論文標題一般含有“基于”、“方法”和“研究”等詞語;文本要素格式特點,如論文標題字體字號和正文標題字體、字號不同;本文要素位置特點,如論文標題一般位于首頁的第一行等等。結合文本要素的內容、格式和位置特點,設計方法識別出文檔中各文本要素的區(qū)域并插入對應名稱的書簽。以標題為例,文本要素的定位流程如圖4所示。即使文本內容有了新的插入或刪除操作,書簽定位的位置和內容也不會發(fā)生改變。后續(xù)文本要素的格式檢查和校對都是對這些書簽的內容分析與格式調整,極大地簡化程序,確保格式校對的準確率。

    圖4 標題定位流程圖

    識別出文本要素并在文本區(qū)域插入書簽之后,就可以對文本要素進行格式檢查。以文檔標題為例各文本要素的檢查流程包括如圖5所示的部分。主要檢查文本要素的字體、字號以及段落的間距和對齊方式等,當文本要素格式不符合要求,系統(tǒng)會以批注的形式展示在當前文檔。

    圖5 文本要素檢查流程圖

    為便于對文本要素進行格式校對,系統(tǒng)利用Word文檔樣式設置功能,將文本要素的樣式保存為格式模板文檔style.dotm的內置樣式。程序開始將文本要素的樣式導入當前文檔,當檢查到文本要素格式不符合要求就將文本要素的格式設置為對應的樣式,并對段落格式進行調整。對文檔結構的調整主要是對文檔中必要文本要素的調整,對文檔的結構調整只需根據(jù)文檔類型尋找必要文本要素的書簽并進行增加或刪減操作。一篇文檔各文本要素之間會存在空行的要求,對這些空行的調整主要是定位兩文本要素區(qū)域并進行刪除和增添空行的操作。文檔頁碼格式復雜且會存在奇偶頁碼格式不一致或首頁碼不同的情況,而辦公人員在文檔寫作時一般不檢查頁碼格式,因此系統(tǒng)必須對文檔頁碼進行校對。首先刪除原來文檔的頁碼,接著根據(jù)文檔要求設置是否奇偶頁不同或首頁不同,然后分別插入不同區(qū)域的頁碼并進行格式設置。通過這種方式插入頁碼,當文檔新增或刪減頁時頁碼格式依舊符合規(guī)范要求。

    2.2 基于Seq2Seq模型的文本內容糾錯

    為實現(xiàn)文本內容糾錯功能,系統(tǒng)采用深度學習模型來訓練中文文本糾錯模型,并總結文檔寫作時的規(guī)范用語與固定搭配,創(chuàng)建輔助詞庫以提升糾錯準確率。文本內容糾錯流程如圖6所示。首先對文本內容進行預處理,主要是提取文檔正文內容部分并把正文的每一段分別存放于列表中。接著把預處理后的正文內容輸入到預先訓練好的算法模型。然后算法模型對正文內容進行檢測,若檢測結果與原文一致,則原文基本不存在內容錯誤,若不一致,則原文可能存在疑似錯誤。此時模型會輸出正文中可能出現(xiàn)的字詞錯誤、語法錯誤和標點錯誤的檢測結果。然后系統(tǒng)查找可能發(fā)生錯誤的文字與標點,并對其以批注的形式展示在當前文檔。最后一鍵糾錯將會按照批注的糾錯建議直接替換錯誤文本。

    圖6 內容糾錯流程圖

    本文采用Seq2Seq模型來訓練字詞和語法糾錯模型。文本糾錯任務可以看作不同序列的轉化過程,原來的句子是源語句,正確的句子是目標語句,因此可以把Seq2Seq模型作為序列轉化模型引入文本糾錯。并且Seq2Seq深度學習模型相比于傳統(tǒng)的規(guī)則和統(tǒng)計的模型能夠更好地擬合錯誤語句到正確語句的轉化過程。Seq2Seq模型的底層結構是一個Encoder-Decoder的網(wǎng)絡模型,其中Encoder是編碼器,它會對輸入的文本序列進行編碼,使其變成長度一定的向量表達。Decoder解碼器對Encoder編碼器獲得的長度一定的向量表達進行解碼,并將其轉化為輸出序列,解碼和編碼器模型一般用循環(huán)神經(jīng)網(wǎng)絡(recurrent neural network, RNN)模型,Encoder-Decoder的設計決定了Seq2Seq模型的核心功能[21]。

    從統(tǒng)計概率學方面看,Seq2Seq模型是在給定輸入文本x的條件下,找出使條件概率為最大值的目標文本y,即使條件概率p(y1,y2,…,yN′|x1,x2,…,xN)最大,其中x1,x2,…,xN是給定的輸入文本序列,y1,y2,…,yN′是該給定文本對應的輸出序列,兩個序列的長度N和N′不一定相等。我們先使用訓練的數(shù)據(jù)集對算法模型進行擬合,使句子對的條件概率p(y1,y2,…,yN′|x1,x2,…,xN)最大化。當訓練的模型對參數(shù)擬合完成之后,給算法模型輸入文本,訓練好的Seq2Seq模型就會尋找使條件概率最大的文本,并將其作為模型的輸出,計算公式如式(1)所示:

    p(y1,y2,…,yN′|x1,x2,…,xN)=

    (1)

    從算法模型結構角度看,當向Seq2Seq模型輸入一個文本序列后,Seq2Seq模型的Decoder會通過本身RNN模型對其進行編碼,使文本序列成為長度固定向量,該向量包含文本語義。如圖7所示,可以將Encoder編碼器輸出的隱狀態(tài)直接定義為語義向量,也可以對其先進行變換處理,然后把變換處理后的結果定義為語義向量。接下來Seq2Seq模型會把該語義向量輸入到Decoder解碼器,Decoder解碼器會以該語義向量作為依據(jù)并計算,并得出一個長度不固定的文本序列。在圖7的常規(guī)Seq2Seq模型結構中,語義向量只作為一個Decoder解碼器的輸入數(shù)據(jù),它并不參加Decoder解碼器內部的后續(xù)計算。

    圖7 常規(guī)Seq2Seq模型結構

    由于存在錯誤文本的句子在自動分詞時會受到錯誤文本影響導致分詞錯誤。本文引入注意力機制(Attention Mechanism)來解決分詞時長序列到定長序列轉化過程部分信息丟失的問題[22]。Attention機制的本質是對給定目標通過生成權重系數(shù)對輸入加權求和,來識別輸入中哪些對于目標是重要的特征。將Attention機制引入Seq2Seq糾錯模型,可以加強編碼端和解碼端的對應關系。Attention機制把原數(shù)據(jù)看作鍵值對形式,根據(jù)給定任務目標的查詢值計算鍵值和查詢值的相似系數(shù),即得到向量值得權重系數(shù),之后利用權重系數(shù)對向量值加權求和得到注意力機制輸出。在Seq2Seq糾錯模型中加入Attention機制來學習句子之間的長距離依賴,計算公式為:

    Attention(Q,K,V)=softmax(QKT)V

    (2)

    式中,K代表詞的鍵向量,Q代表編碼詞的查詢向量,V代表值向量。通過計算權重得到注意力機制分布情況,從而得到對于當前輸出位置相對重要的輸入位置權重,在預測輸出時相應地也會占較大的比重。即解碼端自動選擇與正在生成目標詞相關源語句的詞匯,進而提升了模型糾錯的準確率。

    基于Seq2Seq文本糾錯模型的糾錯準確率會受到訓練數(shù)據(jù)集影響,因此要對訓練語料預處理。先去除語料中非文字符號,接著對句子進行分詞編碼;然后分析數(shù)據(jù)獲取訓練數(shù)據(jù)的統(tǒng)計性信息,最后對句子重新排列以優(yōu)化訓練過程。本文基于Seq2Seq的糾錯模型由編碼器和解碼器構成,在解碼端加入注意力機制分散對輸入語句各個詞的關注度以掌握輸入序列的細節(jié)信息,降低了錯誤文本對最終生成結果的影響。由于解碼器前一時刻輸出影響當前時刻輸入,因此在模型訓練時要清楚每一刻正確輸入形式。那么對于所有訓練樣本,訓練結果應使得全部訓練樣本預測概率之和最大,通過最大化似然函數(shù)獲取最佳糾錯模型。

    本文內容糾錯算法的流程如圖8所示,首先,系統(tǒng)加載并初始化算法模型,然后使用正則匹配方法,對正文部分以中文標點符號的分句規(guī)則進行分句,待檢測句子逐句輸入文本糾錯模型,模型讀入該檢測句子后會計算并返回一個算法認為正確的句子并與原句子進行對比,若兩句相同,則待檢測語句沒有錯誤;若兩句不同,則待檢測語句可能存在疑似錯誤,算法將返回結果作為糾錯建議。

    圖8 內容糾錯算法流程圖

    對于標點符號的錯誤,由于辦公人員疏忽而多打了一個標點符號,造成標點符號的冗余。本系統(tǒng)采用遍歷循環(huán)的算法遍歷全文,定位每一個標點符號的位置,判斷該位置標點符號的數(shù)量,若出現(xiàn)兩個以及以上的標點符號,判斷標點符號冗余,返回標點符號錯誤的位置并以批注的形式顯示出來。此外文檔的標點大部分是全角符號,而辦公人員在寫作時可能會誤用半角的標點符號。本系統(tǒng)在遍歷全文標點的基礎上,判斷每個標點是否為半角,若判斷結果為半角標點,則返回標點錯誤的位置并以批注的形式標注出來。

    3 文本自動糾錯系統(tǒng)測試結果分析

    3.1 系統(tǒng)開發(fā)軟硬件條件

    本文采用Python編程語言,基于VBA技術和Seq2Seq深度學習模型,在硬件設備為Windows10的64位操作系統(tǒng),處理器為Intel Core i5-7200U,內存為8G的計算機上開發(fā)了一套文本自動糾錯系統(tǒng)。系統(tǒng)界面如圖9所示,主要由模板生成、格式校對和內容糾錯三個功能組成。辦公人員利用模板生成功能選擇對應類型的文檔模板,在模板基礎上進行內容寫作,內容編輯完成分別利用格式校對和內容糾錯功能對文本進行格式和內容糾錯,保證最終成稿文檔的規(guī)范性和正確性。

    圖9 文本自動糾錯系統(tǒng)界面

    3.2 系統(tǒng)測試結果分析

    將文本自動糾錯系統(tǒng)應用到某機關的公文糾錯工作中。分析機關常用公文類型與格式要求,系統(tǒng)制作常見公文類型Word版的格式模板供辦公人員起草公文使用。以請示公文為例,Word版公文模板如圖10所示。公文模板一般由版頭、主體和版記三部分組成,其中文本要素的段落與字體格式是固定不變的,辦公人員只需要在相應文本要素的位置進行內容編輯即可。

    圖10 請示公文模板

    辦公人員在使用格式校對功能時先選擇需校對的文檔及文檔類型,再選擇是否檢查文檔格式并對文檔進行格式校對。首先點擊“選擇文件”按鈕打開需要格式校對的文檔,接著點擊“選擇公文類型”下拉框選擇需要校對的文檔類型。若點擊“開始檢查”按鈕,系統(tǒng)會打開文檔檢查文本格式錯誤并生成批注,同時如圖11所示,會在“檢測信息”文本框顯示格式檢查的結果供用戶參考。若點擊“保存結果”按鈕,就會將“檢測信息”框的內容保存為.txt文件。若點擊“格式校對”按鈕,系統(tǒng)就會對當前文檔進行格式校對,并彈出“格式校正完成”提示信息框。該功能減輕了辦公人員格式校對的工作負擔,并且通過分析格式檢查結果有利于了解文檔常見的格式錯誤以加強辦公人員的寫作規(guī)范性。

    圖11 格式檢查的結果

    以信函公文為例,圖12展示了文檔格式校對結果的部分截圖。該截圖展示了格式校對功能對文本要素的字體段落格式以及空白段落的校對。在字體格式校對方面:調整主送機關為楷體,一級標題為黑體等;在段落格式校對方面:調整主體內容第一段為兩端對齊、首行縮進兩字符的格式,調整一級和二級的層次標題段落縮進兩字符等;在結構調整方面:在標題和主送機關之間插入一行空白段落。系統(tǒng)的格式校對功能可以實現(xiàn)對文檔寫作中常見格式錯誤的校對。

    圖12 格式校對結果圖

    文本內容檢查功能無需選擇文檔類型。首先點擊“選擇文件”按鈕打開需要內容校對的文檔,若點擊“開始檢查”按鈕,系統(tǒng)會打開公文文檔檢查公文內容錯誤并生成批注。以通知公文為例,圖13展示了文本內容糾錯的部分截圖。

    圖13 內容檢查的結果

    此時在“檢測信息”文本框也會顯示內容檢查的結果供用戶參考。若點擊“保存結果”按鈕,就會將“檢測信息”框的內容保存為.txt文件。若點擊“一鍵糾正”按鈕,系統(tǒng)就會根據(jù)內容查錯結果對當前文檔進行內容糾錯。如圖14所示,內容檢查文檔以文本文檔保存,文檔內包含了字詞錯誤、冗余錯誤、標點錯誤的查錯結果及糾錯建議。其中“偵查”是基于文檔常出現(xiàn)文本錯誤建立的自定義糾錯庫而檢查出來的文本錯誤。內容糾錯功能保證了文檔內容正確性,通過將內容檢查的糾錯建議加入到用戶自定義糾錯庫中有助于提升文本糾錯準確率。

    圖14 內容檢查文檔的效果圖

    本文將基于深度學習的文本自動糾錯系統(tǒng)應用到機關公文糾錯工作中,通過對30篇公文文檔的糾錯測試發(fā)現(xiàn),對文檔常見格式糾錯準確率在60%以上,對文本內容糾錯準確率在20%以上。該系統(tǒng)能夠滿足辦公人員基本的文本糾錯需求,極大地提升辦公效率并降低校對工作的負擔。

    4 結束語

    隨著信息化時代不斷發(fā)展,電子文檔應用越來越廣泛,面對電子文檔復雜的格式和內容錯誤,需要文本自動糾錯系統(tǒng)作為輔助以減輕校對工作的負擔。結合當前辦公人員的糾錯需求并參考當前文本糾錯技術,本文提出基于深度學習的文本自動糾錯系統(tǒng),設計系統(tǒng)由文檔模板生成、文本格式糾錯和文本內容糾錯三個功能組成,實現(xiàn)生成不同類型的標準格式文檔模板,對文檔進行格式校對與內容糾錯同時生成檢查文檔供用戶參考糾錯建議。本文首先設計文本要素識別與檢查算法并基于VBA技術實現(xiàn)文本格式校對。然后基于Seq2Seq深度學習模型訓練字詞、語法和標點符號查錯模型完成公文內容糾錯。然而系統(tǒng)的格式校對功能無法校對一些特殊的文本格式,如調整兩行標題居中對齊及分別設置不同行的縮進格式。此外可以通過降低模型訓練過程的過擬合或優(yōu)化神經(jīng)網(wǎng)絡結構參數(shù)的方式進一步提升文本糾錯準確率。最終,通過系統(tǒng)測試實驗結果表明,本文的文本自動糾錯系統(tǒng)的格式和內容糾錯率都基本了滿足辦公人員的糾錯需求,極大地提升了辦公人員的寫作效率和文本糾錯的準確性,推動了電子辦公時代的快速發(fā)展。

    猜你喜歡
    文檔辦公要素
    X辦公總部
    Base4Work共享辦公空間
    有人一聲不吭向你扔了個文檔
    掌握這6點要素,讓肥水更高效
    X-workingspace辦公空間
    觀賞植物的色彩要素在家居設計中的應用
    論美術中“七大要素”的辯證關系
    基于RI碼計算的Word復制文檔鑒別
    也談做人的要素
    山東青年(2016年2期)2016-02-28 14:25:36
    Persistence of the reproductive toxicity of chlorpiryphos-ethyl in male Wistar rat
    天天一区二区日本电影三级| 久久久久久免费高清国产稀缺| 校园春色视频在线观看| 久久中文字幕一级| 国产又色又爽无遮挡免费看| 亚洲成人免费电影在线观看| 国产精品国产高清国产av| 9191精品国产免费久久| 精品第一国产精品| 日韩欧美在线二视频| www国产在线视频色| 可以在线观看的亚洲视频| 香蕉国产在线看| 亚洲国产欧美一区二区综合| av在线天堂中文字幕| 亚洲性夜色夜夜综合| 哪里可以看免费的av片| 日韩三级视频一区二区三区| 99在线人妻在线中文字幕| 亚洲熟妇中文字幕五十中出| 美女黄网站色视频| 黄色女人牲交| 精品国产美女av久久久久小说| 成人三级黄色视频| 在线视频色国产色| 精品人妻1区二区| 天天躁夜夜躁狠狠躁躁| 不卡一级毛片| 午夜两性在线视频| 亚洲中文字幕日韩| 黑人巨大精品欧美一区二区mp4| 手机成人av网站| netflix在线观看网站| 50天的宝宝边吃奶边哭怎么回事| 亚洲av电影不卡..在线观看| 久久草成人影院| 国产亚洲欧美98| 欧美中文日本在线观看视频| 国产单亲对白刺激| 女警被强在线播放| 首页视频小说图片口味搜索| 国产69精品久久久久777片 | av在线播放免费不卡| 美女午夜性视频免费| 国产高清激情床上av| 2021天堂中文幕一二区在线观| 国产av在哪里看| 国产不卡一卡二| 久久精品夜夜夜夜夜久久蜜豆 | 波多野结衣高清作品| 亚洲精品美女久久久久99蜜臀| 久久久精品欧美日韩精品| 日韩欧美在线乱码| 99热6这里只有精品| 首页视频小说图片口味搜索| 首页视频小说图片口味搜索| 一卡2卡三卡四卡精品乱码亚洲| 久久久久精品国产欧美久久久| 久久人妻av系列| 久久久精品大字幕| 50天的宝宝边吃奶边哭怎么回事| 久久国产精品人妻蜜桃| 黄色a级毛片大全视频| 色综合婷婷激情| 亚洲欧美日韩东京热| 久久久久国产精品人妻aⅴ院| 国内精品一区二区在线观看| 亚洲色图av天堂| 全区人妻精品视频| 12—13女人毛片做爰片一| 国产精品综合久久久久久久免费| 国产一级毛片七仙女欲春2| 精品不卡国产一区二区三区| 妹子高潮喷水视频| 一进一出抽搐gif免费好疼| 亚洲专区中文字幕在线| 男人舔女人的私密视频| 97碰自拍视频| 亚洲乱码一区二区免费版| 国产亚洲精品第一综合不卡| 国产成人系列免费观看| 色噜噜av男人的天堂激情| 成人三级黄色视频| 久久天堂一区二区三区四区| 久久婷婷人人爽人人干人人爱| 国产精品香港三级国产av潘金莲| 色综合亚洲欧美另类图片| 国产精品一区二区三区四区久久| 国产欧美日韩精品亚洲av| 国产黄a三级三级三级人| 波多野结衣高清作品| 久久中文字幕一级| 最近最新免费中文字幕在线| 久久九九热精品免费| 毛片女人毛片| 午夜精品在线福利| 亚洲一卡2卡3卡4卡5卡精品中文| 一进一出抽搐动态| 18禁黄网站禁片午夜丰满| 97超级碰碰碰精品色视频在线观看| 成人三级做爰电影| 亚洲天堂国产精品一区在线| 久久国产精品人妻蜜桃| 法律面前人人平等表现在哪些方面| 国产又黄又爽又无遮挡在线| 国产av麻豆久久久久久久| 国产熟女xx| av免费在线观看网站| 久久婷婷成人综合色麻豆| 999久久久国产精品视频| 日韩免费av在线播放| 亚洲国产看品久久| www日本黄色视频网| 18禁黄网站禁片免费观看直播| 日本 av在线| 国产免费av片在线观看野外av| 久久天堂一区二区三区四区| 亚洲精品美女久久av网站| 丝袜美腿诱惑在线| 18美女黄网站色大片免费观看| 两性夫妻黄色片| 午夜激情福利司机影院| 色尼玛亚洲综合影院| 国产精品电影一区二区三区| 国产精品电影一区二区三区| 搡老熟女国产l中国老女人| 国产亚洲精品av在线| 国产伦一二天堂av在线观看| 熟妇人妻久久中文字幕3abv| 久久久久国产精品人妻aⅴ院| 麻豆久久精品国产亚洲av| 亚洲专区中文字幕在线| 久久这里只有精品中国| 亚洲激情在线av| 99精品欧美一区二区三区四区| 制服丝袜大香蕉在线| 久久人妻福利社区极品人妻图片| 在线观看午夜福利视频| 禁无遮挡网站| 国产亚洲欧美在线一区二区| 国内毛片毛片毛片毛片毛片| 最近最新中文字幕大全免费视频| 午夜激情福利司机影院| 欧美精品亚洲一区二区| 91九色精品人成在线观看| 特级一级黄色大片| 国产精品1区2区在线观看.| 午夜福利高清视频| 国产亚洲精品第一综合不卡| 国产精品久久久久久精品电影| 国产一区二区在线av高清观看| av视频在线观看入口| 国产熟女午夜一区二区三区| 国产精品影院久久| 宅男免费午夜| 免费看美女性在线毛片视频| www.www免费av| 婷婷丁香在线五月| 黄色毛片三级朝国网站| 亚洲欧美精品综合一区二区三区| 国内少妇人妻偷人精品xxx网站 | 麻豆久久精品国产亚洲av| 午夜福利18| 亚洲精品久久成人aⅴ小说| 在线免费观看的www视频| 国产精品自产拍在线观看55亚洲| 最近最新免费中文字幕在线| 99久久精品国产亚洲精品| 久久人妻av系列| 国产成+人综合+亚洲专区| 日本成人三级电影网站| 日韩欧美 国产精品| 亚洲国产精品999在线| 久久精品影院6| 男女视频在线观看网站免费 | 亚洲欧美精品综合一区二区三区| 国产精品综合久久久久久久免费| 久久亚洲精品不卡| 90打野战视频偷拍视频| 丝袜人妻中文字幕| 亚洲第一欧美日韩一区二区三区| 男女那种视频在线观看| 亚洲专区字幕在线| 12—13女人毛片做爰片一| 草草在线视频免费看| a级毛片a级免费在线| 99riav亚洲国产免费| bbb黄色大片| 国内久久婷婷六月综合欲色啪| 精品高清国产在线一区| 婷婷精品国产亚洲av| 人人妻人人澡欧美一区二区| 国产精品香港三级国产av潘金莲| 亚洲国产欧美人成| 久久久久国内视频| 99热6这里只有精品| 国产成人av激情在线播放| www日本在线高清视频| 人妻夜夜爽99麻豆av| 一区福利在线观看| 最近视频中文字幕2019在线8| 欧美色视频一区免费| √禁漫天堂资源中文www| 一级毛片精品| 亚洲精品在线美女| 亚洲美女视频黄频| 90打野战视频偷拍视频| 在线观看午夜福利视频| xxxwww97欧美| 国产1区2区3区精品| 国产视频一区二区在线看| www日本黄色视频网| a级毛片a级免费在线| a在线观看视频网站| 欧美日韩亚洲国产一区二区在线观看| 亚洲成av人片在线播放无| 日本成人三级电影网站| av国产免费在线观看| 亚洲18禁久久av| 久久精品成人免费网站| 欧美中文日本在线观看视频| 成人精品一区二区免费| 人妻夜夜爽99麻豆av| 亚洲男人天堂网一区| 亚洲精华国产精华精| 日本撒尿小便嘘嘘汇集6| 欧美久久黑人一区二区| 两性午夜刺激爽爽歪歪视频在线观看 | 别揉我奶头~嗯~啊~动态视频| 国产成人aa在线观看| 国产97色在线日韩免费| 看免费av毛片| 一二三四在线观看免费中文在| 精品久久久久久,| 天堂√8在线中文| 亚洲黑人精品在线| 成年女人毛片免费观看观看9| 高潮久久久久久久久久久不卡| 麻豆成人av在线观看| 亚洲精品久久成人aⅴ小说| 成在线人永久免费视频| 国产熟女午夜一区二区三区| 国产aⅴ精品一区二区三区波| 精品福利观看| 此物有八面人人有两片| 波多野结衣高清作品| 丝袜人妻中文字幕| 日本在线视频免费播放| 日韩欧美在线乱码| 精品久久久久久久久久久久久| 亚洲专区字幕在线| 日本五十路高清| 黄色视频不卡| 男插女下体视频免费在线播放| 国产人伦9x9x在线观看| 在线a可以看的网站| 国产av一区二区精品久久| 18禁美女被吸乳视频| 欧美3d第一页| 国产熟女xx| 亚洲真实伦在线观看| 亚洲国产欧洲综合997久久,| 十八禁人妻一区二区| 蜜桃久久精品国产亚洲av| 国产精品免费视频内射| 亚洲电影在线观看av| 精品国产美女av久久久久小说| 国产高清有码在线观看视频 | 91老司机精品| 亚洲熟女毛片儿| 美女黄网站色视频| 嫁个100分男人电影在线观看| 一本精品99久久精品77| 亚洲欧美精品综合一区二区三区| 久久精品夜夜夜夜夜久久蜜豆 | 午夜精品久久久久久毛片777| 制服人妻中文乱码| 亚洲成人免费电影在线观看| 久久精品aⅴ一区二区三区四区| 一级片免费观看大全| 在线播放国产精品三级| 亚洲色图av天堂| 国产蜜桃级精品一区二区三区| 亚洲欧美一区二区三区黑人| aaaaa片日本免费| 欧美 亚洲 国产 日韩一| 精华霜和精华液先用哪个| 一夜夜www| 99热6这里只有精品| 欧美高清成人免费视频www| 亚洲精品在线观看二区| or卡值多少钱| 欧美3d第一页| 成人高潮视频无遮挡免费网站| 国产av在哪里看| 中文字幕熟女人妻在线| 国产亚洲欧美98| 欧美日本视频| 国产男靠女视频免费网站| 欧美日韩乱码在线| www.精华液| av福利片在线观看| 丰满的人妻完整版| 精品久久久久久久末码| 国产精品永久免费网站| 亚洲专区国产一区二区| 国产蜜桃级精品一区二区三区| a在线观看视频网站| 日本一本二区三区精品| 日本黄色视频三级网站网址| 亚洲av成人av| bbb黄色大片| 国产亚洲精品综合一区在线观看 | 久9热在线精品视频| 精品久久久久久久人妻蜜臀av| 欧美日本亚洲视频在线播放| 最近视频中文字幕2019在线8| 最新在线观看一区二区三区| 老司机深夜福利视频在线观看| 啦啦啦免费观看视频1| 一级片免费观看大全| 最新美女视频免费是黄的| 12—13女人毛片做爰片一| 国产亚洲欧美在线一区二区| 久久久精品国产亚洲av高清涩受| 国产1区2区3区精品| 97碰自拍视频| 久久久国产精品麻豆| 午夜老司机福利片| 熟妇人妻久久中文字幕3abv| 久久精品aⅴ一区二区三区四区| 香蕉国产在线看| 99国产精品99久久久久| 亚洲精品在线观看二区| 日本免费a在线| 法律面前人人平等表现在哪些方面| 亚洲色图av天堂| 欧美黄色片欧美黄色片| 亚洲人成电影免费在线| 欧美乱色亚洲激情| 国产真人三级小视频在线观看| 又大又爽又粗| 中文字幕久久专区| 久久欧美精品欧美久久欧美| 男女之事视频高清在线观看| 日本在线视频免费播放| 国产精品亚洲一级av第二区| 欧美午夜高清在线| 精品欧美国产一区二区三| 久久久久久久久中文| 18禁黄网站禁片免费观看直播| 精品久久久久久久末码| 夜夜躁狠狠躁天天躁| 女人高潮潮喷娇喘18禁视频| 成人午夜高清在线视频| 久久人妻av系列| 国内少妇人妻偷人精品xxx网站 | 淫秽高清视频在线观看| 精品午夜福利视频在线观看一区| 国产精品99久久99久久久不卡| 欧美黑人欧美精品刺激| 黄色片一级片一级黄色片| 一本综合久久免费| 日韩精品免费视频一区二区三区| 欧美成人一区二区免费高清观看 | 中文字幕久久专区| 在线视频色国产色| 国模一区二区三区四区视频 | 欧美最黄视频在线播放免费| 嫩草影视91久久| a级毛片a级免费在线| 国产精品久久电影中文字幕| 国产精品久久久久久久电影 | 国产麻豆成人av免费视频| 久久 成人 亚洲| 999精品在线视频| 亚洲激情在线av| 99精品久久久久人妻精品| 国产午夜精品论理片| 国产精品一及| 美女 人体艺术 gogo| 国产精品国产高清国产av| 亚洲18禁久久av| 亚洲欧美激情综合另类| 老熟妇乱子伦视频在线观看| 十八禁网站免费在线| 国产亚洲欧美98| 亚洲欧美精品综合一区二区三区| 国产午夜精品久久久久久| 精品午夜福利视频在线观看一区| 夜夜看夜夜爽夜夜摸| 床上黄色一级片| 美女扒开内裤让男人捅视频| 国产一区二区三区视频了| 精品久久久久久久毛片微露脸| 免费av毛片视频| 国产精华一区二区三区| 亚洲av片天天在线观看| 99久久精品热视频| 美女 人体艺术 gogo| 国产视频一区二区在线看| 极品教师在线免费播放| 日本三级黄在线观看| 亚洲全国av大片| 丝袜人妻中文字幕| 久久精品国产综合久久久| 欧美黑人欧美精品刺激| 首页视频小说图片口味搜索| 国产午夜福利久久久久久| 男女之事视频高清在线观看| 制服人妻中文乱码| 欧美日本亚洲视频在线播放| 亚洲成av人片免费观看| 无限看片的www在线观看| 日韩欧美三级三区| 精品无人区乱码1区二区| 精品少妇一区二区三区视频日本电影| 欧美性猛交黑人性爽| 日韩欧美在线二视频| 麻豆久久精品国产亚洲av| 少妇裸体淫交视频免费看高清 | 国产精品乱码一区二三区的特点| 亚洲男人天堂网一区| 欧美黄色淫秽网站| 国产亚洲精品久久久久久毛片| 国产精品爽爽va在线观看网站| 观看免费一级毛片| 欧美日本亚洲视频在线播放| 91国产中文字幕| 特级一级黄色大片| 亚洲熟妇中文字幕五十中出| 欧美中文日本在线观看视频| 亚洲精品中文字幕在线视频| 99国产精品一区二区蜜桃av| 50天的宝宝边吃奶边哭怎么回事| 精华霜和精华液先用哪个| 在线观看免费午夜福利视频| 精品少妇一区二区三区视频日本电影| 亚洲性夜色夜夜综合| 欧美久久黑人一区二区| 精品免费久久久久久久清纯| 香蕉av资源在线| 狂野欧美激情性xxxx| 日韩欧美 国产精品| 18美女黄网站色大片免费观看| 好看av亚洲va欧美ⅴa在| 亚洲激情在线av| 色综合欧美亚洲国产小说| 日本免费一区二区三区高清不卡| 最近最新免费中文字幕在线| 亚洲国产欧美网| 欧美黑人精品巨大| 美女 人体艺术 gogo| 精品少妇一区二区三区视频日本电影| 欧美日韩亚洲综合一区二区三区_| 蜜桃久久精品国产亚洲av| 欧美一区二区精品小视频在线| 男女视频在线观看网站免费 | 亚洲18禁久久av| 欧美成人免费av一区二区三区| 18禁观看日本| 一本久久中文字幕| 欧美性长视频在线观看| 在线免费观看的www视频| 精品无人区乱码1区二区| 欧美成人午夜精品| 极品教师在线免费播放| 国产精品电影一区二区三区| 久久99热这里只有精品18| 性欧美人与动物交配| 亚洲 国产 在线| 欧美成狂野欧美在线观看| 欧美激情久久久久久爽电影| 日韩欧美免费精品| 精品国内亚洲2022精品成人| 男女做爰动态图高潮gif福利片| 国产亚洲欧美98| 18禁观看日本| 国产亚洲av嫩草精品影院| 欧美精品亚洲一区二区| 久久人妻福利社区极品人妻图片| 99精品在免费线老司机午夜| 久久精品夜夜夜夜夜久久蜜豆 | 国产成+人综合+亚洲专区| 国产三级黄色录像| 91大片在线观看| 99re在线观看精品视频| 国产成人一区二区三区免费视频网站| 国产亚洲精品久久久久久毛片| 日日干狠狠操夜夜爽| 人人妻人人看人人澡| www.999成人在线观看| 级片在线观看| 美女免费视频网站| 午夜老司机福利片| 两个人的视频大全免费| 高清毛片免费观看视频网站| 777久久人妻少妇嫩草av网站| 听说在线观看完整版免费高清| 欧美一级a爱片免费观看看 | 色av中文字幕| 日本五十路高清| 成人av在线播放网站| 日本黄大片高清| 一边摸一边抽搐一进一小说| 国产亚洲精品综合一区在线观看 | 精品日产1卡2卡| 神马国产精品三级电影在线观看 | 一二三四在线观看免费中文在| 免费观看人在逋| 亚洲av中文字字幕乱码综合| 国产黄a三级三级三级人| 国产精品一区二区免费欧美| 在线观看一区二区三区| 夜夜夜夜夜久久久久| 婷婷精品国产亚洲av在线| 后天国语完整版免费观看| 又紧又爽又黄一区二区| 国产精品久久久久久人妻精品电影| 国产伦在线观看视频一区| 女生性感内裤真人,穿戴方法视频| 级片在线观看| 国产一区在线观看成人免费| 桃色一区二区三区在线观看| 人妻夜夜爽99麻豆av| 午夜免费激情av| 国产乱人伦免费视频| а√天堂www在线а√下载| 亚洲av成人一区二区三| 亚洲精品美女久久av网站| 欧美久久黑人一区二区| 久久精品夜夜夜夜夜久久蜜豆 | 又黄又粗又硬又大视频| 变态另类丝袜制服| 日日爽夜夜爽网站| 男女床上黄色一级片免费看| 男女那种视频在线观看| 亚洲成人国产一区在线观看| 国产aⅴ精品一区二区三区波| 国产免费av片在线观看野外av| 国产亚洲欧美98| 91字幕亚洲| 黄色片一级片一级黄色片| 午夜福利高清视频| 午夜精品久久久久久毛片777| 欧美日韩黄片免| 黄片大片在线免费观看| 熟女电影av网| 欧美乱妇无乱码| 亚洲中文字幕一区二区三区有码在线看 | 性欧美人与动物交配| 久久人人精品亚洲av| 国产日本99.免费观看| 欧美日本亚洲视频在线播放| av福利片在线| 12—13女人毛片做爰片一| 亚洲色图 男人天堂 中文字幕| 欧美不卡视频在线免费观看 | 久久精品亚洲精品国产色婷小说| 国产精品精品国产色婷婷| netflix在线观看网站| 亚洲狠狠婷婷综合久久图片| 99久久99久久久精品蜜桃| 天天添夜夜摸| 久久精品国产综合久久久| 亚洲人成77777在线视频| 男男h啪啪无遮挡| 天天添夜夜摸| 欧美绝顶高潮抽搐喷水| 最近最新中文字幕大全免费视频| 国产精品一区二区三区四区免费观看 | 亚洲成人久久性| 成年人黄色毛片网站| av免费在线观看网站| 麻豆av在线久日| 精品不卡国产一区二区三区| 18美女黄网站色大片免费观看| 国产精品98久久久久久宅男小说| 亚洲精华国产精华精| 麻豆成人av在线观看| 桃红色精品国产亚洲av| 日本黄大片高清| 一进一出抽搐动态| av中文乱码字幕在线| 成年女人毛片免费观看观看9| 中文字幕人成人乱码亚洲影| 蜜桃久久精品国产亚洲av| 色综合亚洲欧美另类图片| 亚洲人成网站高清观看| 亚洲熟妇中文字幕五十中出| 真人做人爱边吃奶动态| 亚洲九九香蕉| 成人国产综合亚洲| 18禁裸乳无遮挡免费网站照片| 亚洲欧美精品综合一区二区三区| 丝袜人妻中文字幕| 久久婷婷成人综合色麻豆| 狂野欧美白嫩少妇大欣赏| 免费看a级黄色片| 国产v大片淫在线免费观看| 久久精品夜夜夜夜夜久久蜜豆 | 国产精品免费视频内射| 成年人黄色毛片网站| 大型黄色视频在线免费观看| 一进一出抽搐动态| 日韩成人在线观看一区二区三区| 亚洲国产中文字幕在线视频| 日韩欧美三级三区| 免费观看精品视频网站| 九九热线精品视视频播放| 免费在线观看视频国产中文字幕亚洲| 99国产精品一区二区蜜桃av| 国产亚洲精品久久久久久毛片| 成人av在线播放网站| 无遮挡黄片免费观看|