• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于深度學習的文本自動糾錯系統(tǒng)設計與實現(xiàn)

    2023-03-04 13:25:40張靜靜蔡紅維劉皓挺才金山杜曉平高美萍
    計算機測量與控制 2023年2期
    關鍵詞:文檔辦公要素

    楊 輝,張靜靜,熊 濤,蔡紅維,劉皓挺, 才金山,杜曉平,高美萍

    (1.中國航天員科研訓練中心,北京 100094;2.北京科技大學 自動化學院 北京市工業(yè)波譜成像工程技術研究中心,北京 100083;3.西昌衛(wèi)星發(fā)射中心,四川 西昌 615000)

    0 引言

    電子文檔是現(xiàn)代重要的信息交換媒介,對電子文檔進行編輯排版、格式校對和內容檢查是辦公人員重要的日常工作。隨著電子文檔應用越來越廣泛,且在特定的辦公場合,固定版式文檔的規(guī)范性和標準性標準越來越高[1]。文檔格式排版繁瑣且具有重復性,若辦公人員對文檔格式不熟悉,將會造成工作效率低下無法保證排版質量。當辦公人員對語言掌握不足或工作疏忽大意時,電子文檔中就不可避免地會存在字詞、語法和標點符號錯誤,這些錯誤嚴重時會造成其他人對文本內容的理解偏差[2]。目前雖然存在文本內容糾錯技術,然而這些技術的糾錯率比較低,文本內容查錯主要還是依賴辦公人員細致的檢查。為減輕辦公人員進行文檔編輯寫作時繁重的文本校對工作,并提升文本內容糾錯準確率,本文研究基于深度學習的文本自動糾錯系統(tǒng),用來輔助辦公人員的文檔寫作和文本糾錯工作,以提升辦公人員的工作效率并確保文檔內容的規(guī)范性和正確性。

    目前已有相關研究和技術實現(xiàn)對文檔格式校對和文本內容的糾錯。文獻[3]和[4]開展了對標準論文模板的分析與設定,提出了畢業(yè)論文格式自動檢查系統(tǒng)。文獻[5]實現(xiàn)了軟件項目文檔格式自動檢查和修改,降低了文檔編寫人員在文檔格式編寫的出錯率。文獻[6]開發(fā)的Word文檔格式自動排版系統(tǒng),能夠自定義文檔的格式。隨著自然語言處理的迅速發(fā)展,中文文本糾錯技術也愈加成熟。文獻[7]將中文文本糾錯技術分為基于字詞混淆集而形成候選字符串方法、基于概率統(tǒng)計分析上下文方法和基于規(guī)則和固定搭配關系的方法等。文獻[8]結合二元語法模型和散串技術,在混淆集中選出最優(yōu)糾錯候選集,提出了一種基于窗口技術的校對方法。文獻[9]對句子進行分詞和詞性標注解決字詞錯誤,通過模式匹配解決搭配錯誤問題,利用成分分析解決成分錯誤問題。文獻[10]采用規(guī)則與概率統(tǒng)計相結合的方法實現(xiàn)中文文本自動查錯。文獻[11]構建專業(yè)領域詞語搭配知識庫,并設計基于語法和詞語搭配的雙重中文文本校對算法。

    隨著信息化時代的迅速發(fā)展,現(xiàn)有文本糾錯技術難以適應多樣性的糾錯任務,近幾年許多研究者紛紛將深度學習方法引入文本糾錯任務。深度學習算法自動編碼器的自主學習特征可以通過對語言模型的不斷訓練實現(xiàn)糾錯[12]。目前常用的基于深度學習糾錯方法主要包括基于序列模型的糾錯方法、基于注意力機制的糾錯方法和基于預訓練模型的糾錯方法。文獻[13]通過基于規(guī)則、統(tǒng)計和深度學習網(wǎng)絡結合的方式提升中文文本糾錯率。文獻[14]將神經(jīng)網(wǎng)絡模型引入于中文文本糾錯,并設計兩個糾錯子模塊檢查中文語法錯誤和拼寫錯誤。文獻[15]提出基于注意力機制的深度學習糾錯方法,在非標注中文語料庫上用降噪編碼器訓練糾錯模型實現(xiàn)字級別和句子級別糾錯任務。為實現(xiàn)文本的格式和內容糾錯任務,本文提出設計一種基于深度學習的文本自動糾錯系統(tǒng)。系統(tǒng)主要由文本格式糾錯和文本內容糾錯功能組成,能夠檢查文本格式和內容錯誤同時生成檢查報告并通過一鍵校對實現(xiàn)文本自動糾錯任務。

    1 文本自動糾錯系統(tǒng)總體方案設計

    1.1 系統(tǒng)相關原理介紹

    分析總結常見的文本格式錯誤主要包括以下幾種:1)文檔結構錯誤:表現(xiàn)為固定版式文檔缺乏一些文本要素,如缺乏文檔標題;2)正文段落格式不符合規(guī)范,表現(xiàn)為文本段落縮進和行間距不正確等;3)文本格式不符合規(guī)范:表現(xiàn)為文本的字體和字號不正確等;4)頁碼不符合規(guī)范:表現(xiàn)為文檔頁碼的對齊方式或字體不正確等。系統(tǒng)的文本格式糾錯功能主要基于VBA(visual basic for applications)技術實現(xiàn)的。VBA是微軟用來拓展Office功能設計的開發(fā)語言[16]。Office中元素都以對象形式表示出來,而VBA具有特有的對象屬性和方法,可用于表示Office對象并對其進行查詢和調整[17]。對于固定版式的文檔,文本要素組成及對應格式是固定的。因此系統(tǒng)格式校對功能實現(xiàn)主要在于識別出文檔中的文本要素,根據(jù)格式要求檢查并校對文本的格式。此外VBA宏代碼保存在“所有文檔Normal.dotm”中,可利用Python編程語言設計程序調取VBA宏代碼對Word文檔進行格式校對。

    分析總結常見文本內容錯誤主要包括以下幾種:1)字詞錯誤:包括音似、形似和易錯字詞的錯誤;2)語法錯誤:分為搭配錯誤和成分相關錯誤;3)標點符號錯誤:表現(xiàn)標點符號冗余和半角全角標點符號誤用;4)用語不符合規(guī)范:主要是固定地名、人名、單位名稱和專業(yè)用語使用錯誤[18]?;谏疃葘W習的序列模型是典型的自然語言處理模型,它采用自循環(huán)的計算方式,從序列起始端開始計算循環(huán)迭代一直計算到序列最后一個節(jié)點,以獲取更多的特征信息,從而提高模型分類和預測精度。序列模型常用于機器翻譯、語音識別、文本自動摘要和自動問答的任務處理[19],將其引入文本糾錯任務中是將錯誤句子作為源文本,正確句子作為目標文本,將源文本和目標文本一起作為訓練數(shù)據(jù)來訓練文本糾錯模型[20]。本文采用序列到序列模型(Seq2Seq, sequence to sequence)來訓練查錯模型實現(xiàn)字詞和語法查錯,標點符號糾錯采用代碼邏輯去判斷。Seq2Seq模型的思路表示從一個序列到另一個序列,輸入和輸出均為序列,它有自由度高、方便靈活的特點,是一種比較常見的處理文本序列數(shù)據(jù)的模型[21]。

    1.2 系統(tǒng)總體設計方案

    辦公人員在進行固定版式文檔寫作時,會因為不清楚文檔標準格式而造成寫作效率低下且校對負擔較大。即使文檔標準格式模板是固定的,辦公人員在寫作時的復制粘貼、調整格式等操作也會使得文本格式不符合規(guī)范要求。此外文檔中會存在的一些字詞、語法和標點符號的錯誤,文本錯誤將嚴重影響到相關人員對內容的理解。因此本文對文本格式和內容糾錯方法進行研究,以實現(xiàn)對文檔中字體、段落格式和頁碼格式錯誤,以及文本中字詞、語法、標點符號和規(guī)范用語錯誤進行全方位的錯誤識別與自動校對。根據(jù)辦公人員文檔寫作和文本糾錯需求,設計文本自動糾錯系統(tǒng)由三個功能組成,即文檔模板生成、文本格式校對和文本內容糾錯功能。系統(tǒng)的總體設計方案如圖1所示。

    圖1 系統(tǒng)設計框圖

    辦公人員在起草文檔時,利用文檔模板生成功能選擇生成標準格式Word模板,在該格式模板的基礎上進行文檔寫作。當文檔編輯完成時,利用文本格式校對功能對成稿文檔進行格式校對,最后利用文本糾錯功能對文本內容進行檢查和糾錯。本文設計的文本自動糾錯系統(tǒng)能夠極大地提升辦公人員的工作效率,并在一定程度上保證文本的規(guī)范性和正確性。

    2 文本自動糾錯系統(tǒng)功能設計與實現(xiàn)

    2.1 基于VBA技術的文本格式校對

    本文格式校對功能是基于VBA技術對Word文檔解析完成。使用VBA技術可以調用Word對象,獲取Word文檔的文本信息和格式信息,并對文檔頁面、文本段落和字體等格式進行調整。Word對象結構層次如圖2所示,Application是Word應用中最大的對象,它共包含四種對象,它們分別為Document是文件類,Selection是文字內容類,Bookmark是書簽類,還有Range是區(qū)域類。由于可通過不同方式訪問同一個對象,所以類之間存在各樣的重疊。除了這些屬于頂層類型還有設置文本字體、段落等的格式的類。使用VBA技術可以獲取Word對象,分析對象格式信息并對Word文檔進行讀寫及格式調整。

    圖2 Word對象結構層次

    本文研究固定版式文檔的格式校對功能,即文檔中文本要素組成和要素格式是固定的。文本格式校對流程如圖3所示。首先要對文檔進行初始化設置,主要是刪除文檔中的超鏈接、調整頁面大小和頁邊距以及進行字體初始化設置。接著要根據(jù)文本要素特點識別出文本要素所在區(qū)域并插入書簽,然后檢查文本要素的字體和段落格式是否滿足標準格式要求,當不符合標準格式就修改文本要素的字體和段落格式。對于不同文檔類型,其文檔結構是不同的,主要表現(xiàn)為存在不同的文本要素,所以要根據(jù)文檔類型對文檔結構做出調整。最后由于不同類型文檔頁碼格式不同且辦公人員制作的文檔頁碼常常不符合規(guī)范要求,因此刪除原來的頁碼重新插入符合標準格式的頁碼。

    圖3 格式校對流程圖

    對于不同固定版式的文檔如公司招投標文件、高校畢業(yè)論文、期刊雜志論文和機關公文等,文檔的文本要素組成和格式標準相差很大。對這些文檔格式進行校對,必須通過分析文本要素特點,明確一篇文檔都由哪些必要文本要素組成,并根據(jù)文本要素特點設計相應的文本要素識別方法。文本要素特點包括文本要素內容特點,如論文標題一般含有“基于”、“方法”和“研究”等詞語;文本要素格式特點,如論文標題字體字號和正文標題字體、字號不同;本文要素位置特點,如論文標題一般位于首頁的第一行等等。結合文本要素的內容、格式和位置特點,設計方法識別出文檔中各文本要素的區(qū)域并插入對應名稱的書簽。以標題為例,文本要素的定位流程如圖4所示。即使文本內容有了新的插入或刪除操作,書簽定位的位置和內容也不會發(fā)生改變。后續(xù)文本要素的格式檢查和校對都是對這些書簽的內容分析與格式調整,極大地簡化程序,確保格式校對的準確率。

    圖4 標題定位流程圖

    識別出文本要素并在文本區(qū)域插入書簽之后,就可以對文本要素進行格式檢查。以文檔標題為例各文本要素的檢查流程包括如圖5所示的部分。主要檢查文本要素的字體、字號以及段落的間距和對齊方式等,當文本要素格式不符合要求,系統(tǒng)會以批注的形式展示在當前文檔。

    圖5 文本要素檢查流程圖

    為便于對文本要素進行格式校對,系統(tǒng)利用Word文檔樣式設置功能,將文本要素的樣式保存為格式模板文檔style.dotm的內置樣式。程序開始將文本要素的樣式導入當前文檔,當檢查到文本要素格式不符合要求就將文本要素的格式設置為對應的樣式,并對段落格式進行調整。對文檔結構的調整主要是對文檔中必要文本要素的調整,對文檔的結構調整只需根據(jù)文檔類型尋找必要文本要素的書簽并進行增加或刪減操作。一篇文檔各文本要素之間會存在空行的要求,對這些空行的調整主要是定位兩文本要素區(qū)域并進行刪除和增添空行的操作。文檔頁碼格式復雜且會存在奇偶頁碼格式不一致或首頁碼不同的情況,而辦公人員在文檔寫作時一般不檢查頁碼格式,因此系統(tǒng)必須對文檔頁碼進行校對。首先刪除原來文檔的頁碼,接著根據(jù)文檔要求設置是否奇偶頁不同或首頁不同,然后分別插入不同區(qū)域的頁碼并進行格式設置。通過這種方式插入頁碼,當文檔新增或刪減頁時頁碼格式依舊符合規(guī)范要求。

    2.2 基于Seq2Seq模型的文本內容糾錯

    為實現(xiàn)文本內容糾錯功能,系統(tǒng)采用深度學習模型來訓練中文文本糾錯模型,并總結文檔寫作時的規(guī)范用語與固定搭配,創(chuàng)建輔助詞庫以提升糾錯準確率。文本內容糾錯流程如圖6所示。首先對文本內容進行預處理,主要是提取文檔正文內容部分并把正文的每一段分別存放于列表中。接著把預處理后的正文內容輸入到預先訓練好的算法模型。然后算法模型對正文內容進行檢測,若檢測結果與原文一致,則原文基本不存在內容錯誤,若不一致,則原文可能存在疑似錯誤。此時模型會輸出正文中可能出現(xiàn)的字詞錯誤、語法錯誤和標點錯誤的檢測結果。然后系統(tǒng)查找可能發(fā)生錯誤的文字與標點,并對其以批注的形式展示在當前文檔。最后一鍵糾錯將會按照批注的糾錯建議直接替換錯誤文本。

    圖6 內容糾錯流程圖

    本文采用Seq2Seq模型來訓練字詞和語法糾錯模型。文本糾錯任務可以看作不同序列的轉化過程,原來的句子是源語句,正確的句子是目標語句,因此可以把Seq2Seq模型作為序列轉化模型引入文本糾錯。并且Seq2Seq深度學習模型相比于傳統(tǒng)的規(guī)則和統(tǒng)計的模型能夠更好地擬合錯誤語句到正確語句的轉化過程。Seq2Seq模型的底層結構是一個Encoder-Decoder的網(wǎng)絡模型,其中Encoder是編碼器,它會對輸入的文本序列進行編碼,使其變成長度一定的向量表達。Decoder解碼器對Encoder編碼器獲得的長度一定的向量表達進行解碼,并將其轉化為輸出序列,解碼和編碼器模型一般用循環(huán)神經(jīng)網(wǎng)絡(recurrent neural network, RNN)模型,Encoder-Decoder的設計決定了Seq2Seq模型的核心功能[21]。

    從統(tǒng)計概率學方面看,Seq2Seq模型是在給定輸入文本x的條件下,找出使條件概率為最大值的目標文本y,即使條件概率p(y1,y2,…,yN′|x1,x2,…,xN)最大,其中x1,x2,…,xN是給定的輸入文本序列,y1,y2,…,yN′是該給定文本對應的輸出序列,兩個序列的長度N和N′不一定相等。我們先使用訓練的數(shù)據(jù)集對算法模型進行擬合,使句子對的條件概率p(y1,y2,…,yN′|x1,x2,…,xN)最大化。當訓練的模型對參數(shù)擬合完成之后,給算法模型輸入文本,訓練好的Seq2Seq模型就會尋找使條件概率最大的文本,并將其作為模型的輸出,計算公式如式(1)所示:

    p(y1,y2,…,yN′|x1,x2,…,xN)=

    (1)

    從算法模型結構角度看,當向Seq2Seq模型輸入一個文本序列后,Seq2Seq模型的Decoder會通過本身RNN模型對其進行編碼,使文本序列成為長度固定向量,該向量包含文本語義。如圖7所示,可以將Encoder編碼器輸出的隱狀態(tài)直接定義為語義向量,也可以對其先進行變換處理,然后把變換處理后的結果定義為語義向量。接下來Seq2Seq模型會把該語義向量輸入到Decoder解碼器,Decoder解碼器會以該語義向量作為依據(jù)并計算,并得出一個長度不固定的文本序列。在圖7的常規(guī)Seq2Seq模型結構中,語義向量只作為一個Decoder解碼器的輸入數(shù)據(jù),它并不參加Decoder解碼器內部的后續(xù)計算。

    圖7 常規(guī)Seq2Seq模型結構

    由于存在錯誤文本的句子在自動分詞時會受到錯誤文本影響導致分詞錯誤。本文引入注意力機制(Attention Mechanism)來解決分詞時長序列到定長序列轉化過程部分信息丟失的問題[22]。Attention機制的本質是對給定目標通過生成權重系數(shù)對輸入加權求和,來識別輸入中哪些對于目標是重要的特征。將Attention機制引入Seq2Seq糾錯模型,可以加強編碼端和解碼端的對應關系。Attention機制把原數(shù)據(jù)看作鍵值對形式,根據(jù)給定任務目標的查詢值計算鍵值和查詢值的相似系數(shù),即得到向量值得權重系數(shù),之后利用權重系數(shù)對向量值加權求和得到注意力機制輸出。在Seq2Seq糾錯模型中加入Attention機制來學習句子之間的長距離依賴,計算公式為:

    Attention(Q,K,V)=softmax(QKT)V

    (2)

    式中,K代表詞的鍵向量,Q代表編碼詞的查詢向量,V代表值向量。通過計算權重得到注意力機制分布情況,從而得到對于當前輸出位置相對重要的輸入位置權重,在預測輸出時相應地也會占較大的比重。即解碼端自動選擇與正在生成目標詞相關源語句的詞匯,進而提升了模型糾錯的準確率。

    基于Seq2Seq文本糾錯模型的糾錯準確率會受到訓練數(shù)據(jù)集影響,因此要對訓練語料預處理。先去除語料中非文字符號,接著對句子進行分詞編碼;然后分析數(shù)據(jù)獲取訓練數(shù)據(jù)的統(tǒng)計性信息,最后對句子重新排列以優(yōu)化訓練過程。本文基于Seq2Seq的糾錯模型由編碼器和解碼器構成,在解碼端加入注意力機制分散對輸入語句各個詞的關注度以掌握輸入序列的細節(jié)信息,降低了錯誤文本對最終生成結果的影響。由于解碼器前一時刻輸出影響當前時刻輸入,因此在模型訓練時要清楚每一刻正確輸入形式。那么對于所有訓練樣本,訓練結果應使得全部訓練樣本預測概率之和最大,通過最大化似然函數(shù)獲取最佳糾錯模型。

    本文內容糾錯算法的流程如圖8所示,首先,系統(tǒng)加載并初始化算法模型,然后使用正則匹配方法,對正文部分以中文標點符號的分句規(guī)則進行分句,待檢測句子逐句輸入文本糾錯模型,模型讀入該檢測句子后會計算并返回一個算法認為正確的句子并與原句子進行對比,若兩句相同,則待檢測語句沒有錯誤;若兩句不同,則待檢測語句可能存在疑似錯誤,算法將返回結果作為糾錯建議。

    圖8 內容糾錯算法流程圖

    對于標點符號的錯誤,由于辦公人員疏忽而多打了一個標點符號,造成標點符號的冗余。本系統(tǒng)采用遍歷循環(huán)的算法遍歷全文,定位每一個標點符號的位置,判斷該位置標點符號的數(shù)量,若出現(xiàn)兩個以及以上的標點符號,判斷標點符號冗余,返回標點符號錯誤的位置并以批注的形式顯示出來。此外文檔的標點大部分是全角符號,而辦公人員在寫作時可能會誤用半角的標點符號。本系統(tǒng)在遍歷全文標點的基礎上,判斷每個標點是否為半角,若判斷結果為半角標點,則返回標點錯誤的位置并以批注的形式標注出來。

    3 文本自動糾錯系統(tǒng)測試結果分析

    3.1 系統(tǒng)開發(fā)軟硬件條件

    本文采用Python編程語言,基于VBA技術和Seq2Seq深度學習模型,在硬件設備為Windows10的64位操作系統(tǒng),處理器為Intel Core i5-7200U,內存為8G的計算機上開發(fā)了一套文本自動糾錯系統(tǒng)。系統(tǒng)界面如圖9所示,主要由模板生成、格式校對和內容糾錯三個功能組成。辦公人員利用模板生成功能選擇對應類型的文檔模板,在模板基礎上進行內容寫作,內容編輯完成分別利用格式校對和內容糾錯功能對文本進行格式和內容糾錯,保證最終成稿文檔的規(guī)范性和正確性。

    圖9 文本自動糾錯系統(tǒng)界面

    3.2 系統(tǒng)測試結果分析

    將文本自動糾錯系統(tǒng)應用到某機關的公文糾錯工作中。分析機關常用公文類型與格式要求,系統(tǒng)制作常見公文類型Word版的格式模板供辦公人員起草公文使用。以請示公文為例,Word版公文模板如圖10所示。公文模板一般由版頭、主體和版記三部分組成,其中文本要素的段落與字體格式是固定不變的,辦公人員只需要在相應文本要素的位置進行內容編輯即可。

    圖10 請示公文模板

    辦公人員在使用格式校對功能時先選擇需校對的文檔及文檔類型,再選擇是否檢查文檔格式并對文檔進行格式校對。首先點擊“選擇文件”按鈕打開需要格式校對的文檔,接著點擊“選擇公文類型”下拉框選擇需要校對的文檔類型。若點擊“開始檢查”按鈕,系統(tǒng)會打開文檔檢查文本格式錯誤并生成批注,同時如圖11所示,會在“檢測信息”文本框顯示格式檢查的結果供用戶參考。若點擊“保存結果”按鈕,就會將“檢測信息”框的內容保存為.txt文件。若點擊“格式校對”按鈕,系統(tǒng)就會對當前文檔進行格式校對,并彈出“格式校正完成”提示信息框。該功能減輕了辦公人員格式校對的工作負擔,并且通過分析格式檢查結果有利于了解文檔常見的格式錯誤以加強辦公人員的寫作規(guī)范性。

    圖11 格式檢查的結果

    以信函公文為例,圖12展示了文檔格式校對結果的部分截圖。該截圖展示了格式校對功能對文本要素的字體段落格式以及空白段落的校對。在字體格式校對方面:調整主送機關為楷體,一級標題為黑體等;在段落格式校對方面:調整主體內容第一段為兩端對齊、首行縮進兩字符的格式,調整一級和二級的層次標題段落縮進兩字符等;在結構調整方面:在標題和主送機關之間插入一行空白段落。系統(tǒng)的格式校對功能可以實現(xiàn)對文檔寫作中常見格式錯誤的校對。

    圖12 格式校對結果圖

    文本內容檢查功能無需選擇文檔類型。首先點擊“選擇文件”按鈕打開需要內容校對的文檔,若點擊“開始檢查”按鈕,系統(tǒng)會打開公文文檔檢查公文內容錯誤并生成批注。以通知公文為例,圖13展示了文本內容糾錯的部分截圖。

    圖13 內容檢查的結果

    此時在“檢測信息”文本框也會顯示內容檢查的結果供用戶參考。若點擊“保存結果”按鈕,就會將“檢測信息”框的內容保存為.txt文件。若點擊“一鍵糾正”按鈕,系統(tǒng)就會根據(jù)內容查錯結果對當前文檔進行內容糾錯。如圖14所示,內容檢查文檔以文本文檔保存,文檔內包含了字詞錯誤、冗余錯誤、標點錯誤的查錯結果及糾錯建議。其中“偵查”是基于文檔常出現(xiàn)文本錯誤建立的自定義糾錯庫而檢查出來的文本錯誤。內容糾錯功能保證了文檔內容正確性,通過將內容檢查的糾錯建議加入到用戶自定義糾錯庫中有助于提升文本糾錯準確率。

    圖14 內容檢查文檔的效果圖

    本文將基于深度學習的文本自動糾錯系統(tǒng)應用到機關公文糾錯工作中,通過對30篇公文文檔的糾錯測試發(fā)現(xiàn),對文檔常見格式糾錯準確率在60%以上,對文本內容糾錯準確率在20%以上。該系統(tǒng)能夠滿足辦公人員基本的文本糾錯需求,極大地提升辦公效率并降低校對工作的負擔。

    4 結束語

    隨著信息化時代不斷發(fā)展,電子文檔應用越來越廣泛,面對電子文檔復雜的格式和內容錯誤,需要文本自動糾錯系統(tǒng)作為輔助以減輕校對工作的負擔。結合當前辦公人員的糾錯需求并參考當前文本糾錯技術,本文提出基于深度學習的文本自動糾錯系統(tǒng),設計系統(tǒng)由文檔模板生成、文本格式糾錯和文本內容糾錯三個功能組成,實現(xiàn)生成不同類型的標準格式文檔模板,對文檔進行格式校對與內容糾錯同時生成檢查文檔供用戶參考糾錯建議。本文首先設計文本要素識別與檢查算法并基于VBA技術實現(xiàn)文本格式校對。然后基于Seq2Seq深度學習模型訓練字詞、語法和標點符號查錯模型完成公文內容糾錯。然而系統(tǒng)的格式校對功能無法校對一些特殊的文本格式,如調整兩行標題居中對齊及分別設置不同行的縮進格式。此外可以通過降低模型訓練過程的過擬合或優(yōu)化神經(jīng)網(wǎng)絡結構參數(shù)的方式進一步提升文本糾錯準確率。最終,通過系統(tǒng)測試實驗結果表明,本文的文本自動糾錯系統(tǒng)的格式和內容糾錯率都基本了滿足辦公人員的糾錯需求,極大地提升了辦公人員的寫作效率和文本糾錯的準確性,推動了電子辦公時代的快速發(fā)展。

    猜你喜歡
    文檔辦公要素
    X辦公總部
    Base4Work共享辦公空間
    有人一聲不吭向你扔了個文檔
    掌握這6點要素,讓肥水更高效
    X-workingspace辦公空間
    觀賞植物的色彩要素在家居設計中的應用
    論美術中“七大要素”的辯證關系
    基于RI碼計算的Word復制文檔鑒別
    也談做人的要素
    山東青年(2016年2期)2016-02-28 14:25:36
    Persistence of the reproductive toxicity of chlorpiryphos-ethyl in male Wistar rat
    老熟妇乱子伦视频在线观看| 日韩欧美 国产精品| 国产精品久久久久久久电影| 久久精品人妻少妇| 99热只有精品国产| 一本久久中文字幕| 欧美色欧美亚洲另类二区| 精品日产1卡2卡| 欧美成人精品欧美一级黄| 欧美3d第一页| 国产精品伦人一区二区| 99久国产av精品| 直男gayav资源| 可以在线观看毛片的网站| 亚洲无线观看免费| 国产伦在线观看视频一区| 波多野结衣巨乳人妻| 久久人妻av系列| 亚洲人成网站高清观看| 国产探花在线观看一区二区| kizo精华| 亚洲av中文av极速乱| 亚洲自偷自拍三级| 性色avwww在线观看| 亚洲精品乱码久久久v下载方式| 国产免费男女视频| 久久精品久久久久久噜噜老黄 | 18禁黄网站禁片免费观看直播| 91久久精品国产一区二区三区| 亚洲五月天丁香| 国产中年淑女户外野战色| 干丝袜人妻中文字幕| 人妻久久中文字幕网| 免费黄网站久久成人精品| 精品99又大又爽又粗少妇毛片| 99热这里只有是精品50| 悠悠久久av| 亚洲av成人av| 亚洲成人久久爱视频| 啦啦啦观看免费观看视频高清| 在线天堂最新版资源| 免费电影在线观看免费观看| 亚洲精品国产av成人精品| 别揉我奶头 嗯啊视频| 婷婷亚洲欧美| 日日撸夜夜添| 一边摸一边抽搐一进一小说| 亚洲在线自拍视频| 国产乱人视频| av女优亚洲男人天堂| 又黄又爽又刺激的免费视频.| 日本熟妇午夜| 中文欧美无线码| 国产午夜精品久久久久久一区二区三区| 日韩精品有码人妻一区| 男人舔女人下体高潮全视频| 精品人妻一区二区三区麻豆| 非洲黑人性xxxx精品又粗又长| 亚洲高清免费不卡视频| 六月丁香七月| 色综合站精品国产| 亚洲内射少妇av| 亚洲国产欧美在线一区| 国产成人91sexporn| 精品久久久久久久久亚洲| 色噜噜av男人的天堂激情| 久久久久久伊人网av| 国产精品三级大全| 亚洲18禁久久av| 麻豆久久精品国产亚洲av| 少妇熟女aⅴ在线视频| 久久久欧美国产精品| 可以在线观看毛片的网站| 亚洲国产日韩欧美精品在线观看| 久久热精品热| a级毛片a级免费在线| 一级黄片播放器| 国产 一区 欧美 日韩| 18+在线观看网站| 99精品在免费线老司机午夜| a级毛色黄片| 亚洲欧美清纯卡通| 日韩高清综合在线| 亚洲va在线va天堂va国产| 麻豆国产av国片精品| 一级黄片播放器| 国产久久久一区二区三区| 国产成人精品一,二区 | 日韩av不卡免费在线播放| 国产高潮美女av| 三级男女做爰猛烈吃奶摸视频| 天天一区二区日本电影三级| 国产毛片a区久久久久| 色5月婷婷丁香| 欧美日韩综合久久久久久| 色综合亚洲欧美另类图片| videossex国产| 少妇熟女欧美另类| 亚洲久久久久久中文字幕| 一卡2卡三卡四卡精品乱码亚洲| 日本一二三区视频观看| 毛片一级片免费看久久久久| 精品久久久久久久末码| 能在线免费看毛片的网站| 1024手机看黄色片| 国产大屁股一区二区在线视频| 精品不卡国产一区二区三区| 亚州av有码| 日本欧美国产在线视频| 中文字幕免费在线视频6| 在线播放国产精品三级| 成年av动漫网址| 乱系列少妇在线播放| 国产淫片久久久久久久久| 可以在线观看的亚洲视频| 麻豆精品久久久久久蜜桃| 九九爱精品视频在线观看| 亚洲最大成人中文| 国产精品人妻久久久影院| 日韩亚洲欧美综合| 国产精品美女特级片免费视频播放器| 日韩欧美在线乱码| 在线天堂最新版资源| 哪个播放器可以免费观看大片| 免费电影在线观看免费观看| 亚州av有码| 男女边吃奶边做爰视频| 国产精品一区二区三区四区久久| 麻豆国产97在线/欧美| 最近视频中文字幕2019在线8| 18禁在线无遮挡免费观看视频| 久99久视频精品免费| 又爽又黄无遮挡网站| 国产综合懂色| 国产一区二区在线av高清观看| 国产在线男女| 久久久欧美国产精品| 亚洲国产精品合色在线| 国语自产精品视频在线第100页| 国产麻豆成人av免费视频| 桃色一区二区三区在线观看| 美女高潮的动态| 国产在视频线在精品| 伦精品一区二区三区| 久久精品国产自在天天线| 亚洲精品影视一区二区三区av| 国产高清三级在线| 美女大奶头视频| 一区二区三区免费毛片| 国产午夜精品一二区理论片| 成人国产麻豆网| 一本久久中文字幕| 亚洲无线观看免费| 菩萨蛮人人尽说江南好唐韦庄 | 精品免费久久久久久久清纯| 色尼玛亚洲综合影院| 寂寞人妻少妇视频99o| a级毛片a级免费在线| 成人亚洲精品av一区二区| 在线观看免费视频日本深夜| 精品久久久久久久久av| 国产久久久一区二区三区| 麻豆久久精品国产亚洲av| 欧美一区二区亚洲| 真实男女啪啪啪动态图| 亚洲自拍偷在线| 亚洲五月天丁香| 国产探花在线观看一区二区| 国产精品无大码| 日韩欧美精品免费久久| 欧美日韩国产亚洲二区| 国产成人精品婷婷| 老司机福利观看| 夜夜看夜夜爽夜夜摸| 国产视频首页在线观看| 亚洲第一电影网av| 国产午夜精品久久久久久一区二区三区| 精品久久久久久久末码| 国产伦理片在线播放av一区 | 国产视频内射| 永久网站在线| 丝袜美腿在线中文| 成人一区二区视频在线观看| 久久婷婷人人爽人人干人人爱| 男人和女人高潮做爰伦理| 国产伦在线观看视频一区| 国产精品一及| 久久久国产成人精品二区| 在线天堂最新版资源| 综合色av麻豆| 最近最新中文字幕大全电影3| 亚洲av中文av极速乱| av卡一久久| 亚洲av中文字字幕乱码综合| www.色视频.com| 能在线免费观看的黄片| 国产白丝娇喘喷水9色精品| 亚洲熟妇中文字幕五十中出| 亚洲国产精品久久男人天堂| 亚洲精品久久久久久婷婷小说 | 久久久久九九精品影院| 天天一区二区日本电影三级| 九九热线精品视视频播放| 成年av动漫网址| 国内少妇人妻偷人精品xxx网站| 两个人视频免费观看高清| 日韩大尺度精品在线看网址| 欧美日韩在线观看h| 国产亚洲av嫩草精品影院| 波多野结衣巨乳人妻| 久久亚洲精品不卡| 99热这里只有是精品在线观看| 亚洲成人av在线免费| a级毛片免费高清观看在线播放| 亚洲国产精品久久男人天堂| 黄片无遮挡物在线观看| 国产精品久久久久久精品电影小说 | 久久99热6这里只有精品| 免费av不卡在线播放| 色哟哟·www| 国产久久久一区二区三区| 亚洲av中文av极速乱| 成人无遮挡网站| 97超碰精品成人国产| 99久久精品热视频| 欧美色欧美亚洲另类二区| 熟女电影av网| 偷拍熟女少妇极品色| 久久久久久久亚洲中文字幕| 搡女人真爽免费视频火全软件| 一本久久精品| 蜜桃久久精品国产亚洲av| 国产伦在线观看视频一区| 成年女人看的毛片在线观看| 丰满的人妻完整版| 91久久精品国产一区二区三区| 国产精品久久久久久精品电影小说 | 欧美日韩精品成人综合77777| 超碰av人人做人人爽久久| 桃色一区二区三区在线观看| 91久久精品电影网| 毛片一级片免费看久久久久| 久久精品国产亚洲av涩爱 | 好男人视频免费观看在线| a级毛色黄片| 日本爱情动作片www.在线观看| 少妇熟女欧美另类| 国产免费男女视频| 久久热精品热| 黑人高潮一二区| 亚洲精品影视一区二区三区av| 蜜桃久久精品国产亚洲av| 国产成人一区二区在线| 91av网一区二区| 日韩av在线大香蕉| 欧美日韩国产亚洲二区| 99在线人妻在线中文字幕| 干丝袜人妻中文字幕| 国产女主播在线喷水免费视频网站 | 欧美日韩国产亚洲二区| 久久精品综合一区二区三区| 欧美一级a爱片免费观看看| 亚洲国产精品sss在线观看| 老司机影院成人| 网址你懂的国产日韩在线| 国产精品精品国产色婷婷| 国产色婷婷99| 免费电影在线观看免费观看| 国内久久婷婷六月综合欲色啪| 最好的美女福利视频网| 日韩欧美精品免费久久| 国产精品电影一区二区三区| 天天躁夜夜躁狠狠久久av| 青青草视频在线视频观看| 免费黄网站久久成人精品| 亚洲成人久久性| 中国国产av一级| 女的被弄到高潮叫床怎么办| 国产精品久久久久久久电影| 亚洲无线在线观看| 亚洲欧美精品综合久久99| av.在线天堂| 一级二级三级毛片免费看| 晚上一个人看的免费电影| 插逼视频在线观看| 哪里可以看免费的av片| 一卡2卡三卡四卡精品乱码亚洲| 99久久久亚洲精品蜜臀av| 中文字幕熟女人妻在线| 免费黄网站久久成人精品| 天天躁夜夜躁狠狠久久av| 一个人免费在线观看电影| 国产91av在线免费观看| 在线天堂最新版资源| 亚洲最大成人av| a级毛色黄片| h日本视频在线播放| 日日撸夜夜添| 久久午夜亚洲精品久久| 国产欧美日韩精品一区二区| 99国产极品粉嫩在线观看| 亚洲av一区综合| 免费看日本二区| 少妇熟女aⅴ在线视频| 26uuu在线亚洲综合色| 美女xxoo啪啪120秒动态图| 99久国产av精品| 变态另类成人亚洲欧美熟女| 亚洲aⅴ乱码一区二区在线播放| 中文资源天堂在线| 欧美性猛交黑人性爽| 亚洲在线观看片| 久久99热这里只有精品18| 欧美成人免费av一区二区三区| 国产高潮美女av| 久久国内精品自在自线图片| 国产亚洲精品久久久久久毛片| 一个人观看的视频www高清免费观看| 尾随美女入室| av在线天堂中文字幕| 国产欧美日韩精品一区二区| 亚洲熟妇中文字幕五十中出| 啦啦啦观看免费观看视频高清| 丰满人妻一区二区三区视频av| 欧美高清性xxxxhd video| 哪个播放器可以免费观看大片| a级毛色黄片| 日韩精品青青久久久久久| 亚洲国产色片| 在线观看av片永久免费下载| 国产人妻一区二区三区在| 日本黄大片高清| 日韩欧美精品免费久久| 网址你懂的国产日韩在线| 狠狠狠狠99中文字幕| 欧美+日韩+精品| 欧美性猛交╳xxx乱大交人| 欧美变态另类bdsm刘玥| 中文精品一卡2卡3卡4更新| 久久久a久久爽久久v久久| 亚洲美女视频黄频| 国产v大片淫在线免费观看| 日本与韩国留学比较| 久久精品国产亚洲网站| 自拍偷自拍亚洲精品老妇| 国产中年淑女户外野战色| 大型黄色视频在线免费观看| 秋霞在线观看毛片| 久久久久久九九精品二区国产| 老司机影院成人| 国产一级毛片七仙女欲春2| 插阴视频在线观看视频| av天堂中文字幕网| videossex国产| 人人妻人人澡人人爽人人夜夜 | 日本与韩国留学比较| 99热全是精品| 免费看a级黄色片| 久久久久性生活片| 波多野结衣高清无吗| 最近2019中文字幕mv第一页| 男女啪啪激烈高潮av片| 最近2019中文字幕mv第一页| 日本五十路高清| 免费在线观看成人毛片| 日本免费一区二区三区高清不卡| 美女 人体艺术 gogo| 亚洲成人久久性| 麻豆成人午夜福利视频| 寂寞人妻少妇视频99o| 午夜精品在线福利| 亚洲一区二区三区色噜噜| 男人和女人高潮做爰伦理| 亚洲一区二区三区色噜噜| 一本一本综合久久| 久久精品91蜜桃| 99久国产av精品国产电影| 成人特级黄色片久久久久久久| 一边摸一边抽搐一进一小说| 日本-黄色视频高清免费观看| 春色校园在线视频观看| 99视频精品全部免费 在线| 国产精品久久视频播放| 精品不卡国产一区二区三区| 日本欧美国产在线视频| 永久网站在线| 国产麻豆成人av免费视频| 亚洲精品日韩在线中文字幕 | 国产精品爽爽va在线观看网站| 老师上课跳d突然被开到最大视频| 午夜福利高清视频| 久久久久久国产a免费观看| 国产爱豆传媒在线观看| 成人特级av手机在线观看| 午夜激情欧美在线| 伊人久久精品亚洲午夜| av视频在线观看入口| 国产亚洲av片在线观看秒播厂 | 麻豆国产97在线/欧美| 欧美xxxx性猛交bbbb| 人体艺术视频欧美日本| 最近视频中文字幕2019在线8| 中文亚洲av片在线观看爽| 亚洲人与动物交配视频| 秋霞在线观看毛片| 久久久精品94久久精品| 噜噜噜噜噜久久久久久91| 偷拍熟女少妇极品色| 免费大片18禁| 国产高清有码在线观看视频| 日韩av在线大香蕉| 国产真实乱freesex| 久久午夜亚洲精品久久| 性欧美人与动物交配| 最近最新中文字幕大全电影3| 亚洲在线观看片| 日日摸夜夜添夜夜添av毛片| 国产伦在线观看视频一区| 国产亚洲精品av在线| 老熟妇乱子伦视频在线观看| 一进一出抽搐gif免费好疼| 男人舔女人下体高潮全视频| 亚洲国产欧美人成| videossex国产| 麻豆乱淫一区二区| 国产在视频线在精品| kizo精华| 亚洲激情五月婷婷啪啪| 精品一区二区免费观看| 亚洲av熟女| 精品人妻熟女av久视频| 欧美变态另类bdsm刘玥| 精品人妻视频免费看| 久久6这里有精品| 搡老妇女老女人老熟妇| 免费大片18禁| 亚洲av第一区精品v没综合| 99riav亚洲国产免费| 亚洲国产色片| 国产中年淑女户外野战色| 久久久久久久久久久丰满| 精品久久久久久久人妻蜜臀av| 亚洲精华国产精华液的使用体验 | 男女啪啪激烈高潮av片| 免费av毛片视频| 永久网站在线| 深夜a级毛片| 久久久久久大精品| 91久久精品国产一区二区成人| 给我免费播放毛片高清在线观看| 能在线免费观看的黄片| 国产乱人视频| 久久精品国产亚洲av香蕉五月| 日韩强制内射视频| 一本一本综合久久| av在线老鸭窝| 久久久久久久久久久免费av| 夜夜看夜夜爽夜夜摸| 久久99精品国语久久久| 97超视频在线观看视频| 欧美bdsm另类| 日韩强制内射视频| 亚洲欧美日韩高清专用| 午夜福利成人在线免费观看| 日韩成人伦理影院| 永久网站在线| 色吧在线观看| 18禁在线播放成人免费| 国产中年淑女户外野战色| 国产 一区 欧美 日韩| av福利片在线观看| 91av网一区二区| 成人漫画全彩无遮挡| 在线免费十八禁| 99久久精品一区二区三区| 九九在线视频观看精品| 久久99热这里只有精品18| 国产人妻一区二区三区在| 麻豆成人av视频| 亚洲精品成人久久久久久| 99riav亚洲国产免费| 97超碰精品成人国产| 91aial.com中文字幕在线观看| 狠狠狠狠99中文字幕| 国产又黄又爽又无遮挡在线| 日韩精品青青久久久久久| 亚洲av一区综合| 日本三级黄在线观看| 婷婷亚洲欧美| 亚洲无线在线观看| 中文字幕免费在线视频6| 成人特级黄色片久久久久久久| 噜噜噜噜噜久久久久久91| 国产久久久一区二区三区| 大型黄色视频在线免费观看| 岛国在线免费视频观看| 精品国内亚洲2022精品成人| 自拍偷自拍亚洲精品老妇| 99久久无色码亚洲精品果冻| 国产又黄又爽又无遮挡在线| 此物有八面人人有两片| 搡老妇女老女人老熟妇| 天堂网av新在线| 免费看a级黄色片| 久久九九热精品免费| 国产伦在线观看视频一区| 九九久久精品国产亚洲av麻豆| 日韩亚洲欧美综合| 国产免费男女视频| 久久久久久久久大av| 精品人妻熟女av久视频| 国产伦在线观看视频一区| 久久中文看片网| 久久精品久久久久久久性| 精品不卡国产一区二区三区| 国产一区二区亚洲精品在线观看| 欧美成人免费av一区二区三区| 国产一级毛片七仙女欲春2| 国产精品精品国产色婷婷| 男女那种视频在线观看| 国产av在哪里看| 国产成人影院久久av| 中文字幕av在线有码专区| 亚洲欧洲国产日韩| 中文字幕精品亚洲无线码一区| 日韩,欧美,国产一区二区三区 | 欧美最新免费一区二区三区| 亚洲国产欧美人成| 日本在线视频免费播放| 国产黄片美女视频| 日韩三级伦理在线观看| 日韩一区二区三区影片| 在线观看66精品国产| 久久人人爽人人爽人人片va| 亚洲精品456在线播放app| 永久网站在线| 国产精品精品国产色婷婷| 九九爱精品视频在线观看| 91久久精品电影网| 欧美zozozo另类| 一级毛片aaaaaa免费看小| 亚洲美女视频黄频| 午夜激情福利司机影院| 成年版毛片免费区| 亚洲七黄色美女视频| 午夜免费男女啪啪视频观看| 99久久中文字幕三级久久日本| 成年免费大片在线观看| 亚洲一区二区三区色噜噜| 亚洲av免费高清在线观看| 人人妻人人澡人人爽人人夜夜 | 欧美3d第一页| 波多野结衣高清无吗| 国产精品一区www在线观看| 人妻夜夜爽99麻豆av| 久久午夜亚洲精品久久| 亚洲第一区二区三区不卡| 在线观看午夜福利视频| 在线观看66精品国产| 欧美zozozo另类| 亚洲国产精品合色在线| 在线观看美女被高潮喷水网站| 精品久久久久久久人妻蜜臀av| 欧美性猛交黑人性爽| 国产伦精品一区二区三区四那| 亚洲欧洲日产国产| 日韩一区二区视频免费看| 国产男人的电影天堂91| 又黄又爽又刺激的免费视频.| 久久99热这里只有精品18| 午夜久久久久精精品| 一本—道久久a久久精品蜜桃钙片 精品乱码久久久久久99久播 | 国产亚洲91精品色在线| 久久久a久久爽久久v久久| 一本—道久久a久久精品蜜桃钙片 精品乱码久久久久久99久播 | 日本三级黄在线观看| 日本色播在线视频| 国产精品久久久久久久久免| 亚洲成人精品中文字幕电影| a级毛色黄片| 亚洲精品自拍成人| 久久精品夜色国产| 大型黄色视频在线免费观看| 日韩 亚洲 欧美在线| 亚洲激情五月婷婷啪啪| 美女 人体艺术 gogo| 国产av在哪里看| 国产单亲对白刺激| 日本色播在线视频| 欧美另类亚洲清纯唯美| 少妇丰满av| 别揉我奶头 嗯啊视频| 久久久久久伊人网av| 直男gayav资源| 免费av毛片视频| 国产 一区 欧美 日韩| 亚洲精品色激情综合| 日韩视频在线欧美| АⅤ资源中文在线天堂| 99热这里只有是精品50| 久久久久久久久久黄片| 亚洲欧美日韩高清在线视频| 国产精品免费一区二区三区在线| 精品久久久噜噜| 少妇的逼好多水| 亚洲欧美成人精品一区二区| 免费观看人在逋| 国产精品.久久久| 男插女下体视频免费在线播放| 免费观看在线日韩| 久久久久网色| 此物有八面人人有两片| 国产单亲对白刺激| 亚洲美女视频黄频| 国产精品麻豆人妻色哟哟久久 |