• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于數(shù)據(jù)增強和多任務(wù)特征學(xué)習(xí)的中文語法錯誤檢測方法

    2022-02-03 13:12:28謝海華陳志優(yōu)呂肖慶
    中文信息學(xué)報 2022年12期
    關(guān)鍵詞:檢測模型

    謝海華,陳志優(yōu),程 靜,呂肖慶,2,湯 幟,2

    (1. 北大方正信息產(chǎn)業(yè)集團(tuán)有限公司 數(shù)字出版技術(shù)國家重點實驗室,北京 100871;2. 北京大學(xué) 王選計算機研究所,北京 100871; 3. 北京雁棲湖應(yīng)用數(shù)學(xué)研究院,北京 101408)

    0 引言

    中文語法錯誤檢測(Chinese Grammatical Error Diagnosis,CGED)的目標(biāo)是自動檢測出中文自然語句中的語法錯誤,如成分缺失或多余,語序不當(dāng)?shù)取GED的檢測任務(wù)一般包含: 是否存在錯誤、錯誤類型及錯誤發(fā)生位置。雖然CGED不能給出糾正錯誤的建議,但對于輔助寫作和文檔審校等場景依然十分有意義。在輔助寫作中,CGED給出語法錯誤類型和位置,讓作者有針對性地修改文章,可以提升寫作的質(zhì)量和效率。另外,在出版行業(yè)的審校環(huán)節(jié),由于正式出版物的格式要求十分嚴(yán)格,CGED可自動檢測出一些基礎(chǔ)的語法錯誤,可以為審校人員節(jié)省大量的時間,而直接糾正語法錯誤則可能造成文章的內(nèi)容和邏輯發(fā)生變化。

    目前,有關(guān)語法錯誤檢測的研究大多數(shù)是針對英文的。與英文相比,中文的語法更加復(fù)雜和靈活。中文不存在詞語的單復(fù)數(shù)和時態(tài)等明確的語法規(guī)則,其語法錯誤經(jīng)常涉及隱晦的語義解析,不能基于字詞形態(tài)來判斷。[1]因此,現(xiàn)有的英文語法錯誤檢測方法不能很好地適用于CGED。另外,目前研究者傾向于運用生成式的方法直接進(jìn)行語法改錯,跳過了語法錯誤檢測的步驟[2-4],只有少量的研究采用序列標(biāo)注方法進(jìn)行中文語法錯誤檢測。然而,由于缺乏大規(guī)模高質(zhì)量的標(biāo)注語料作為訓(xùn)練集,CGED的準(zhǔn)確率往往不高,達(dá)不到實用水平。如何在訓(xùn)練數(shù)據(jù)有限的情況下提高語法錯誤檢測的效果是該類研究的一個難點。

    針對上述問題,本文提出一種基于數(shù)據(jù)增強和語言學(xué)特征多任務(wù)訓(xùn)練方法來提升中文語法錯誤檢測的效果。針對訓(xùn)練語料不充足的問題,本研究使用大量無標(biāo)簽的正確中文語料,通過詞性規(guī)則、句法規(guī)則以及語言模型概率統(tǒng)計等方法來生成接近真實語法錯誤用例的樣本,以擴充訓(xùn)練語料。此外,本研究采用預(yù)訓(xùn)練語言模型對字詞進(jìn)行表征,以利用大規(guī)模語料蘊含的語義信息,并將詞法學(xué)習(xí)、句法學(xué)習(xí)、語法錯誤檢測等任務(wù)結(jié)合起來進(jìn)行多任務(wù)學(xué)習(xí),進(jìn)一步獲取中文語義和語法信息。本文提出的方法在NLPTEA CGED評測任務(wù)數(shù)據(jù)集上進(jìn)行測試,準(zhǔn)確率和召回率分別為85.16%和72.53%(F1值為0.783),性能優(yōu)于其他對比檢測模型。

    1 相關(guān)工作

    中文語法錯誤自動檢測模型采取的方法從最初的統(tǒng)計學(xué)習(xí)方法[5]和基于規(guī)則的分析[6],到現(xiàn)在主流的深度學(xué)習(xí)算法[1,7],以及多種模型混合的方法[8]。大多數(shù)研究采用序列標(biāo)注模型來進(jìn)行語法錯誤檢測,并使用LSTM和CRF來實現(xiàn)[1,7,9]。使用LSTM模型進(jìn)行語法錯誤檢測時,特征的選擇十分重要,除了通常使用的字向量特征、詞向量特征、詞性POS特征,很多研究提出了許多新的特征[1,8-9]。例如,高斯互信息(ePMI)、向量詞的共現(xiàn)(AWC)、依賴關(guān)系詞語的共現(xiàn)(DWC)、基于語境的詞表達(dá)等。也有一些研究針對LSTM模型結(jié)構(gòu)進(jìn)行改進(jìn),比如在LSTM模型中加入策略梯度[10]。這些研究的重點在于學(xué)習(xí)中文語法規(guī)律,基于無標(biāo)注語料統(tǒng)計詞語規(guī)律和詞語用法,并提出相應(yīng)的特征來提高檢測效果。然而,統(tǒng)計特征不能捕獲深層的語法和語義信息,因此無法發(fā)現(xiàn)一些隱晦的語法錯誤。

    針對訓(xùn)練語料不足的問題,一些研究者使用未標(biāo)注的中文語料來構(gòu)造錯誤用例。例如,通過隨機增加、刪除、替換字詞和打亂字詞順序來生成錯誤樣本[11];統(tǒng)計已有訓(xùn)練語料中語法錯誤分布,并構(gòu)造相應(yīng)的錯誤樣本[12]。前者采用隨機方式構(gòu)造的語法錯誤樣本,往往顯得不夠真實,其語法錯誤分布與正常寫作者所犯錯誤的分布相差較大。而后者構(gòu)造的錯誤數(shù)據(jù)過于擬合已有的訓(xùn)練樣本,不利于模型的泛化。

    近年來,一些學(xué)者利用基于大規(guī)模語料預(yù)訓(xùn)練的語言模型來獲取文本的語言學(xué)特征,以彌補訓(xùn)練語料的不足?;陬A(yù)訓(xùn)練語言模型的語法錯誤檢測模型,其效果優(yōu)于通過融合多種特征構(gòu)建的模型[13-14]。不過這些方法都以英文為研究對象,它們尚未在中文數(shù)據(jù)集上進(jìn)行試驗或者測試性能。

    大多數(shù)情況下,語法錯誤檢測的目的是對語法錯誤進(jìn)行糾正。在檢測出語法錯誤的類型和發(fā)生位置之后,可以根據(jù)錯誤類型,采用相應(yīng)的方法來修改語法錯誤。例如,錯誤提示為“成分冗余”,則直接刪除該成分;錯誤提示為“用詞不當(dāng)”,則基于詞語統(tǒng)計信息(如PMI)推薦候選詞語以替換錯誤詞語[1,12]。不過目前中文語法錯誤糾正的研究大多采用端到端的生成式方法,使用統(tǒng)計翻譯模型[2]、深度學(xué)習(xí)模型[3]、融合規(guī)則和統(tǒng)計的算法[4]等,由錯誤句子直接生成正確的句子。但是生成的句子有時會改變原文的表達(dá)方式甚至語義和邏輯,在很多情況下不能產(chǎn)生令人滿意的結(jié)果。

    2 基于數(shù)據(jù)增強和語言學(xué)特征多任務(wù)學(xué)習(xí)的CGED模型

    這一節(jié)將詳細(xì)介紹本文提出的語法錯誤檢測模型APM-CGED(APM代表data Augnentation,Pre-trained language model and Multi-tasklearning),其系統(tǒng)框架如圖1所示。為了解決訓(xùn)練語料缺乏的問題,本文采用數(shù)據(jù)增強方法來擴充訓(xùn)練數(shù)據(jù)集,使用預(yù)訓(xùn)練語言模型BERT[15]作為基礎(chǔ)的文本表征提取工具,并運用多任務(wù)訓(xùn)練數(shù)據(jù)來調(diào)整BERT參數(shù)以使它學(xué)習(xí)到更多的語言學(xué)特征。

    圖1 APM-CGED系統(tǒng)框架

    本文主要貢獻(xiàn)是提出了基于句法分析與預(yù)訓(xùn)練語言模型采樣的數(shù)據(jù)增強方法和基于語言學(xué)特征多任務(wù)學(xué)習(xí)的模型優(yōu)化方法。以下將對圖1所示流程和上述兩項貢獻(xiàn)進(jìn)行詳細(xì)闡述。

    2.1 基于句法分析與預(yù)訓(xùn)練語言模型采樣的數(shù)據(jù)增強(構(gòu)造訓(xùn)練數(shù)據(jù))

    中文語法錯誤檢測研究的主要問題之一是訓(xùn)練語料的缺乏。我們使用大量未經(jīng)標(biāo)注的正確語句構(gòu)造含有語法錯誤的訓(xùn)練樣例,以彌補訓(xùn)練數(shù)據(jù)不足的問題。中文維基百科覆蓋面廣且表達(dá)方式豐富,人民日報表達(dá)方式規(guī)整規(guī)范,所以我們以維基百科和人民日報中文數(shù)據(jù)集為基礎(chǔ),抽取其中正確的語句,并對數(shù)據(jù)進(jìn)行處理后構(gòu)造訓(xùn)練樣本。主要步驟的介紹如下。

    2.1.1 數(shù)據(jù)集預(yù)處理

    主要的處理手段如下:

    (1) 增加數(shù)據(jù)的一致性和減少噪聲,例如,將中文維基百科的繁體中文轉(zhuǎn)化成簡體中文,把全角字符轉(zhuǎn)化為半角字符。

    (2) 運用中文處理工具對文本進(jìn)行分詞、詞性標(biāo)注、命名實體識別和依存句法分析。

    (3) 選擇質(zhì)量較高的句子,例如,去除過長(詞數(shù)超過100個)和過短(詞數(shù)小于3個)的句子。

    2.1.2 錯誤樣例構(gòu)造

    本步驟將一些正確的語句改造為含有語法錯誤的語句。在語句經(jīng)過分詞、詞性標(biāo)注和依存句法分析之后,我們采用以下措施,構(gòu)建不同類型的語法錯誤的訓(xùn)練樣本。

    (1) 成分冗余構(gòu)造: 在語句的詞語之間隨機插入沒有實際意義的詞語。候選的插入詞語選自停用詞表。

    (2) 成分缺失構(gòu)造: 從主謂結(jié)構(gòu)片段中刪除主語或者謂語,從動賓結(jié)構(gòu)片段中刪除謂語或者賓語,從狀中結(jié)構(gòu)或者定中結(jié)構(gòu)片段中刪除被修飾成分。

    (3) 語序不當(dāng)構(gòu)造: 修改動賓結(jié)構(gòu)、狀中結(jié)構(gòu)、定中結(jié)構(gòu)等結(jié)構(gòu)片段中成分的順序。

    (4) 用詞不當(dāng)構(gòu)造: 隨機選取一個詞語并將其遮蓋(用MASK將其替換),然后用BERT的Masked LM預(yù)測出的候選字替換原來的字符。

    2.1.3 錯誤樣例構(gòu)造規(guī)則

    為了保證改造后的句子在含有語法錯誤的同時,保持語句的基本語義和結(jié)構(gòu),以免發(fā)生意思改變,我們設(shè)計了以下規(guī)則。

    (1) 不對命名實體進(jìn)行修改。命名實體在句子中往往是主體成分,修改命名實體會改變句子的意思。例如,句子“協(xié)和醫(yī)院是中國最好的醫(yī)院之一,專治各種疑難雜癥”,如果對“協(xié)和醫(yī)院”進(jìn)行修改,語句的意思就會發(fā)生變化。

    (2) 對于短句子,我們構(gòu)造的樣例中只含有一個錯誤。對于15個詞語以上的句子,我們會隨機增加錯誤。

    (3) 在成分缺失和語序不當(dāng)構(gòu)造時,避免修改依賴距離很遠(yuǎn)的結(jié)構(gòu)成分,防止破壞語句結(jié)構(gòu)。

    (4) 關(guān)于用詞不當(dāng)構(gòu)造,除了構(gòu)造“的、地、得”之間的誤用情況,不對虛詞、語氣詞之類無意義的詞語進(jìn)行修改以構(gòu)造該類錯誤。實際樣例中,虛詞的使用錯誤主要是成分缺失和冗余。

    以下是兩個構(gòu)造的錯誤樣例示例。

    樣例一: 語序不當(dāng)構(gòu)造

    原句:加速推廣菌草技術(shù),將其列入國家開發(fā)計劃。

    構(gòu)造句:推廣加速菌草技術(shù),將其列入國家開發(fā)計劃。

    樣例二: 用詞不當(dāng)構(gòu)造

    原句: 我跟朋友們經(jīng)常用手機打電話聊天。

    構(gòu)造句: 我跟朋友們經(jīng)常用手機找電話聊天。

    2.2 基于語言學(xué)特征多任務(wù)學(xué)習(xí)的模型優(yōu)化

    在以往的CGED研究中,研究者使用的主流模型是BiLSTM-CRF結(jié)構(gòu)。由于中文語法錯誤的復(fù)雜性和多樣性,語法的正確使用與語言學(xué)特征高度相關(guān),因此使用少量的訓(xùn)練數(shù)據(jù)很難訓(xùn)練出一個魯棒性好的CGED模型,人們會在模型中加入詞性、N-gram、PMI等語言學(xué)特征。但是,大量特征的使用使得模型結(jié)構(gòu)煩瑣,而且提取這些特征信息也大大降低了模型的運行速度。

    本文采用基于BERT的預(yù)訓(xùn)練語言模型作為基礎(chǔ)來構(gòu)建CGED模型,利用它們在預(yù)訓(xùn)練階段學(xué)習(xí)到的深層語義信息。然后,我們采取多任務(wù)學(xué)習(xí)方式對BERT的參數(shù)進(jìn)行調(diào)整,使模型學(xué)習(xí)到各種語言學(xué)知識,并在預(yù)測階段不必進(jìn)行語言學(xué)特征提取,以提高模型的性能和效率。

    多任務(wù)學(xué)習(xí)是指為模型設(shè)置多個訓(xùn)練目標(biāo),這些任務(wù)之間具有一定關(guān)聯(lián),并在訓(xùn)練階段可以互相促進(jìn)以達(dá)到更好的訓(xùn)練效果。多任務(wù)學(xué)習(xí)通過在模型上設(shè)置一些共享參數(shù)來實現(xiàn)。本文提出的方法使用BERT作為模型的共享部分,并使用不同結(jié)構(gòu)來實現(xiàn)詞性標(biāo)注、依存句法分析和語法錯誤檢測三個具體任務(wù)。基于語言學(xué)特征的多任務(wù)學(xué)習(xí)進(jìn)行BERT模型優(yōu)化的結(jié)構(gòu)如圖2所示。

    圖2 基于語言學(xué)特征的多任務(wù)學(xué)習(xí)模型

    在圖2所示的模型的輸出目標(biāo)中,主要包括: 詞性標(biāo)注,依存句法分析和語法錯誤檢測。基于這三項任務(wù)的訓(xùn)練,可以對BERT的參數(shù)進(jìn)行優(yōu)化,以使BERT能學(xué)到更多的語言學(xué)知識。我們認(rèn)為,這三個任務(wù)之間有互相促進(jìn)的作用,詞性和句法分析的結(jié)果能輔助判斷語句是否有語法錯誤。例如圖2中的例句“愛我北京天安門”是一個語法錯誤句,它的詞性標(biāo)注結(jié)果是: 動詞-代詞-名詞,這個詞性序列在中文語句中不常見,因此該句很可能含有語法錯誤。同樣地,判斷出語句含有語法錯誤,也有益于更準(zhǔn)確地分析語句的詞性和句法。這三個任務(wù)的詳細(xì)描述如下。

    2.2.1 詞性標(biāo)注

    我們采用序列標(biāo)注方法來實現(xiàn)詞性標(biāo)注任務(wù),在BERT之后增加一個全連接層直接輸出詞性結(jié)果。由于BERT采用字符嵌入方式,對于多字符詞語,我們采用“BI”的標(biāo)注方式(‘B’表示詞語開始位置,‘I’表示詞語中間或結(jié)束位置)進(jìn)行詞性標(biāo)注。在準(zhǔn)備訓(xùn)練數(shù)據(jù)時,詞性標(biāo)注的標(biāo)簽可以由中文處理工具(例如pyltp[16])直接生成,標(biāo)注示例如表1所示。

    表1 詞性標(biāo)注示例

    2.2.2 依存句法分析

    依存句法分析的目的是確定語句的句法結(jié)構(gòu),通常以句法樹的形式,用有向弧表示詞語之間的修飾及指向關(guān)系(即依存關(guān)系)。在本文中,我們將句法結(jié)構(gòu)(或詞語之間的依存關(guān)系)用矩陣形式來表示。對于一個含有n個字的句子,用一個n×n的矩陣表達(dá)詞語之間的依存關(guān)系。為了避免關(guān)系矩陣(記為M)過于稀疏,我們將依存關(guān)系進(jìn)行簡化,取消修飾詞和被修飾詞之間的指向關(guān)系,所以M是一個對稱矩陣。假設(shè)語句的第i個詞(含有一個字符,在句子中的序號設(shè)為wi)與第j個詞(含有三個字符,在句子中的序號分別為wj1,wj2,wj3)之間的關(guān)系為動賓關(guān)系(VOB),則有Mwiwj1=Mwiwj2=Mwiwj3=VOB,而且Mwj1wi=Mwj2wi=Mwj3wi=VOB。我們將語句的主干詞對應(yīng)的對角線位置的值設(shè)置為Head,而對角線上其他位置的值設(shè)為0。以矩陣表示的句法結(jié)構(gòu)示例如圖3所示。

    圖3 依存句法結(jié)構(gòu)矩陣示例

    在準(zhǔn)備訓(xùn)練數(shù)據(jù)時,語句的句法結(jié)構(gòu)矩陣可以由中文處理工具生成的句法樹修改而成。在參數(shù)優(yōu)化階段,假設(shè)輸入語句為S,其文本序列長度為t,經(jīng)過BERT之后的語義表征為SBERT,它的維度為t×768。然后采用式(1)產(chǎn)生兩個中間變量H1和H2。

    f表示對矩陣進(jìn)行形變操作的函數(shù),Wi和bi是隨機初始化并在訓(xùn)練中更新的參數(shù)。產(chǎn)生的H1和H2的維度都是64 ×t×12。然后基于式(2)產(chǎn)生句法結(jié)構(gòu)分析結(jié)果。

    M的維度64 ×t×t,對應(yīng)t×t矩陣的每個元素的數(shù)值(維度是1 ×64),即句法結(jié)構(gòu)矩陣的結(jié)果。

    2.2.3 語法錯誤檢測

    我們采用多標(biāo)簽分類的方法完成語法錯誤檢測任務(wù),在BERT之后增加一個全連接層直接輸出分類結(jié)果。分類的結(jié)果是句子含有的語法錯誤的類型。如果語句不含語法錯誤則輸出“沒有錯誤”,如果它含有多個語法錯誤則輸出多個語法錯誤標(biāo)簽。語法錯誤檢測的訓(xùn)練數(shù)據(jù)是由前文所述方法構(gòu)造出來的或者是在實際寫作中產(chǎn)生的。

    上述三個任務(wù)模型的損失函數(shù)都用交叉熵來計算。多任務(wù)學(xué)習(xí)模型的損失函數(shù)是這三個模型的損失函數(shù)之和,模型訓(xùn)練的目標(biāo)是最小化該損失函數(shù)。

    2.3 基于序列標(biāo)注的CGED模型訓(xùn)練和應(yīng)用

    圖4 中文語法錯誤檢測模型

    我們把CGED視為序列標(biāo)注問題,并選用BERT-CRF結(jié)構(gòu)作為模型的基本架構(gòu),其中BERT的參數(shù)經(jīng)過2.2節(jié)所述方法進(jìn)行調(diào)整,見圖4。由于我們處理的對象是中文數(shù)據(jù),我們使用中文BERT模型,它是基于大量中文維基百科語料預(yù)訓(xùn)練而成。在BERT之后使用CRF模型[17],一種經(jīng)典的序列標(biāo)注方法,直接生成語法錯誤檢測的結(jié)果。語法錯誤標(biāo)簽使用“BIO”方式編碼,“B”代表錯誤的開始位置,“I”表示中間或者結(jié)束位置,“O”表示當(dāng)前字符沒有語法問題。例如對于錯誤X,“B-X”代表“X”錯誤的第一個位置,“I-X”表示其他位置。

    在訓(xùn)練階段,訓(xùn)練數(shù)據(jù)集的部分?jǐn)?shù)據(jù)來自人們在實際寫作中出現(xiàn)的語法錯誤,而另一部分則來自前文所述方法構(gòu)造出的數(shù)據(jù)。訓(xùn)練模型和預(yù)測模型的結(jié)構(gòu)是一樣的,輸出的結(jié)果包含是否存在錯誤、錯誤類型以及錯誤發(fā)生的位置。

    3 中文語法錯誤檢測實驗

    我們采用NLPTEA中文語法錯誤檢測評測數(shù)據(jù)集[18]試驗了我們的方法。NLPTEA提供一份標(biāo)注過的語法錯誤數(shù)據(jù)集,語料來源是漢語非母語的漢語學(xué)習(xí)者在中文寫作中產(chǎn)生的錯誤樣例。該數(shù)據(jù)集將語法錯誤分為四種類型: redundant errors(記為‘R’,即成分冗余),missing words(記為‘M’,即成分缺失), word selection errors(記為‘S’,即用詞不當(dāng))和word ordering errors(記為‘W’,即詞序不當(dāng))。數(shù)據(jù)集里的語句可能沒有語法錯誤,也可能含有一個或多個語法錯誤。語法錯誤檢測系統(tǒng)需要從以下三個方面對語句進(jìn)行檢測:

    (1) Detection-level: 檢測語句是否含有語法錯誤。

    (2) Identification-level: 語句含有的語法錯誤的類型。

    (3) Position-level: 語句含有的語法錯誤的位置。

    3.1 數(shù)據(jù)收集和處理

    我們使用pyltp中文處理工具對語句進(jìn)行分詞、詞性標(biāo)注和依存句法分析,同時采用pyltp的標(biāo)注體系。在多任務(wù)學(xué)習(xí)優(yōu)化BERT時,我們使用了一些公開數(shù)據(jù)集來提升分詞的準(zhǔn)確性,以提高詞性標(biāo)注和依存句法分析的準(zhǔn)確度。

    我們收集了NLPTEA 2016,IJCNLP 2017和NLPTEA 2018的CGED任務(wù)的評測數(shù)據(jù)集,有語句數(shù)量為20 451,按照句號、問號和感嘆號拆分之后的語句數(shù)量為104 141。選擇其中80%的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),其余數(shù)據(jù)為校驗數(shù)據(jù)。同時,我們收集和整理了中文維基百科數(shù)據(jù)集和人民日報數(shù)據(jù)集,使用2.1節(jié)介紹的數(shù)據(jù)構(gòu)造方法生成訓(xùn)練數(shù)據(jù)(語句總數(shù)為138 825)并加入到訓(xùn)練集。為了維持正確語句和錯誤語句的比例,我們在數(shù)據(jù)集中加入了同等數(shù)量的不含語法錯誤的語句。

    3.2 實驗結(jié)果

    我們按照2.2節(jié)介紹的方法,運用訓(xùn)練數(shù)據(jù)對BERT的參數(shù)進(jìn)行調(diào)整。然后使用訓(xùn)練數(shù)據(jù)對語法錯誤檢測的BERT+CRF模型進(jìn)行訓(xùn)練,使用校驗數(shù)據(jù)進(jìn)行測試。我們同時使用不同的模型進(jìn)行了對比實驗,表2顯示了對比實驗的結(jié)果。其中,B0表示未經(jīng)過優(yōu)化的BERT模型,MTL表示多任務(wù)學(xué)習(xí)方法,DA表示數(shù)據(jù)增強,B0+MTL+DA則表示文本采用的方法。不同的模型分別在NLPTEA 2018 CGED任務(wù)的HSK測試集(NLPTEA-18-HSK)、NLPTEA 2016 CGED任務(wù)的HSK測試集(NLPTEA-16-HSK)和TOCFL(NLPTEA-16-TOCFL)測試集上進(jìn)行了實驗。

    對比實驗結(jié)果表明,使用語言學(xué)特征對BERT進(jìn)行優(yōu)化之后,語法錯誤檢測的效果在各方面都有明顯的提升,特別是檢測的召回率得到很大提高。但是隨著召回率的上升,檢測精確率有一定程度的下降,不過數(shù)據(jù)增強的使用很好地彌補了這個問題,使得模型能夠同時提高檢測的召回率和精確率,并使F1指標(biāo)提升。

    表2 中文語法錯誤檢測模型的對比實驗結(jié)果

    我們與NLPTEA 2018 CGED評測結(jié)果進(jìn)行了橫向?qū)Ρ?。我們沒有采用模型融合以進(jìn)一步提高檢測效果,只用單一模型來與NLPTEA 2018評測效果較好的模型進(jìn)行對比,結(jié)果見表3。HFL、CMMC-BDRC和NCYU是NLPTEA 2018評測結(jié)果里面準(zhǔn)確率、召回率或者F1值較高的模型。在Detection Level和Identification Level這兩個測試指標(biāo)上,我們的單模型都取得了最優(yōu)的F1值。但是在Position Level指標(biāo)上,我們方法的效果不如HFL。經(jīng)過分析,我們認(rèn)為這可能是因為構(gòu)造的錯誤案例與實際測試的錯誤案例錯誤分布不一致而造成的。

    表3 BERT+MTL+DA與NLPTEA 2018 CGED評測模型的對比

    續(xù)表

    4 結(jié)論

    本文針對中文語法錯誤檢測研究存在的主要問題之一是訓(xùn)練語料的缺乏,采用數(shù)據(jù)增強、預(yù)訓(xùn)練語言模型和語言學(xué)特征多任務(wù)學(xué)習(xí)的方式,有效地提高了語法錯誤檢測的效果。使用語言學(xué)特征對語言模型進(jìn)行優(yōu)化能夠使它學(xué)習(xí)到顯式的語言學(xué)特征以及隱藏的語義信息,而語言學(xué)特征和語法使用是十分相關(guān)的,所以它對語法錯誤檢測效果有明顯的改善作用。

    由于中文語法的復(fù)雜性,我們目前的工作依然存在很多不足,錯誤類型和位置的檢測效果不好。在下一步的工作中,我們將進(jìn)一步提高數(shù)據(jù)構(gòu)造的合理性,使構(gòu)造的錯誤樣本更符合人們實際所犯的語法錯誤。另外,我們會對語言學(xué)特征的多任務(wù)學(xué)習(xí)的結(jié)構(gòu)進(jìn)行改善,以進(jìn)一步提高CGED任務(wù)的檢測效果。

    猜你喜歡
    檢測模型
    一半模型
    “不等式”檢測題
    “一元一次不等式”檢測題
    “一元一次不等式組”檢測題
    “幾何圖形”檢測題
    “角”檢測題
    重要模型『一線三等角』
    重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
    3D打印中的模型分割與打包
    小波變換在PCB缺陷檢測中的應(yīng)用
    十八禁网站免费在线| 中文字幕av在线有码专区| 日本一二三区视频观看| 一区二区三区四区激情视频 | 美女免费视频网站| 免费高清视频大片| 亚洲国产色片| 欧美最黄视频在线播放免费| 欧美一区二区精品小视频在线| 午夜a级毛片| 综合色丁香网| 国产精品久久久久久久久免| 尾随美女入室| av在线观看视频网站免费| 亚洲内射少妇av| 一区二区三区免费毛片| 乱码一卡2卡4卡精品| 精品福利观看| 国产成人91sexporn| 成人午夜高清在线视频| 成年女人毛片免费观看观看9| a级一级毛片免费在线观看| 国产免费一级a男人的天堂| av免费在线看不卡| 亚洲va在线va天堂va国产| 免费黄网站久久成人精品| 搞女人的毛片| 寂寞人妻少妇视频99o| 国产亚洲欧美98| 欧美xxxx黑人xx丫x性爽| 国产高清激情床上av| 久久精品国产亚洲av香蕉五月| 深夜a级毛片| 97人妻精品一区二区三区麻豆| 日韩精品有码人妻一区| www.色视频.com| 国产精品免费一区二区三区在线| 99久久中文字幕三级久久日本| 国产高清视频在线观看网站| 淫秽高清视频在线观看| 免费大片18禁| 国产高清视频在线观看网站| 亚洲一级一片aⅴ在线观看| 天天躁夜夜躁狠狠久久av| av天堂中文字幕网| 色综合色国产| 国产精品亚洲一级av第二区| av.在线天堂| 男女啪啪激烈高潮av片| 自拍偷自拍亚洲精品老妇| 男人舔女人下体高潮全视频| 日韩欧美三级三区| 亚洲性夜色夜夜综合| 最近中文字幕高清免费大全6| 99riav亚洲国产免费| 成年av动漫网址| 黄色一级大片看看| 久久精品国产清高在天天线| 好男人在线观看高清免费视频| 丝袜喷水一区| 国内少妇人妻偷人精品xxx网站| 欧美精品国产亚洲| 精品欧美国产一区二区三| 亚洲国产精品国产精品| 人妻久久中文字幕网| 一a级毛片在线观看| 国产高清视频在线播放一区| 插逼视频在线观看| 亚洲欧美精品自产自拍| 一级a爱片免费观看的视频| 国产一区二区三区在线臀色熟女| 色播亚洲综合网| 午夜免费激情av| 国产真实乱freesex| 亚洲国产精品成人久久小说 | 国产片特级美女逼逼视频| 欧美色欧美亚洲另类二区| 日韩强制内射视频| 丰满乱子伦码专区| 久久久精品欧美日韩精品| 精品久久久久久久末码| 亚洲在线观看片| 色哟哟哟哟哟哟| 天堂√8在线中文| 国产欧美日韩一区二区精品| 亚洲丝袜综合中文字幕| 91av网一区二区| 狠狠狠狠99中文字幕| 老司机福利观看| 又黄又爽又免费观看的视频| 国产精品,欧美在线| 插阴视频在线观看视频| 国产伦精品一区二区三区四那| 欧美一区二区精品小视频在线| 九九热线精品视视频播放| 在线免费观看不下载黄p国产| 中国美白少妇内射xxxbb| 国产精品无大码| 成人午夜高清在线视频| 精品一区二区三区av网在线观看| 午夜福利在线在线| 免费人成视频x8x8入口观看| 国产精品电影一区二区三区| 18禁黄网站禁片免费观看直播| 99久久无色码亚洲精品果冻| 成人欧美大片| 日本五十路高清| 一级毛片久久久久久久久女| 99久久成人亚洲精品观看| 中文亚洲av片在线观看爽| 国产一区亚洲一区在线观看| 午夜爱爱视频在线播放| 不卡视频在线观看欧美| 99久久中文字幕三级久久日本| 亚洲欧美日韩高清专用| 精品国内亚洲2022精品成人| 全区人妻精品视频| 国产精品一二三区在线看| 国产亚洲av嫩草精品影院| 久久久国产成人免费| 精品久久久久久成人av| 一本一本综合久久| 日韩在线高清观看一区二区三区| 色吧在线观看| 亚洲四区av| 欧美性猛交╳xxx乱大交人| 天堂动漫精品| 久久婷婷人人爽人人干人人爱| 大型黄色视频在线免费观看| 亚洲专区国产一区二区| 欧美最新免费一区二区三区| 小蜜桃在线观看免费完整版高清| 欧美日本视频| 淫妇啪啪啪对白视频| 午夜视频国产福利| 天堂av国产一区二区熟女人妻| 国产又黄又爽又无遮挡在线| 精品久久久久久久久久免费视频| 国内精品久久久久精免费| 真人做人爱边吃奶动态| 国产av麻豆久久久久久久| 国产激情偷乱视频一区二区| 精品久久久久久久人妻蜜臀av| 午夜免费男女啪啪视频观看 | 久久综合国产亚洲精品| 国产精品久久久久久av不卡| 亚洲欧美清纯卡通| 美女 人体艺术 gogo| 蜜桃亚洲精品一区二区三区| 尤物成人国产欧美一区二区三区| 久久久久久久久久久丰满| 精品久久久噜噜| 久久久久免费精品人妻一区二区| 在线天堂最新版资源| 亚洲真实伦在线观看| av国产免费在线观看| 日韩欧美三级三区| 色综合站精品国产| 我要看日韩黄色一级片| 欧美在线一区亚洲| 午夜精品在线福利| 国产69精品久久久久777片| 色尼玛亚洲综合影院| 赤兔流量卡办理| 国产成人freesex在线 | 久久综合国产亚洲精品| 亚洲精品久久国产高清桃花| 午夜激情福利司机影院| 人妻久久中文字幕网| 亚洲在线观看片| 在线国产一区二区在线| 国产精品亚洲美女久久久| 小说图片视频综合网站| 久久精品人妻少妇| 精品久久久久久久久亚洲| 国产男人的电影天堂91| 搡老妇女老女人老熟妇| 18禁在线无遮挡免费观看视频 | 一个人看视频在线观看www免费| 久久久久久大精品| 国产精品精品国产色婷婷| 免费搜索国产男女视频| 国产淫片久久久久久久久| 色视频www国产| 午夜精品国产一区二区电影 | av在线观看视频网站免费| 最新中文字幕久久久久| 少妇的逼好多水| 天美传媒精品一区二区| 欧美xxxx黑人xx丫x性爽| 麻豆精品久久久久久蜜桃| 如何舔出高潮| 亚洲三级黄色毛片| 伊人久久精品亚洲午夜| 欧美最新免费一区二区三区| 我的老师免费观看完整版| 欧美日韩在线观看h| 免费电影在线观看免费观看| 久久精品综合一区二区三区| 日本a在线网址| 男人和女人高潮做爰伦理| 免费看av在线观看网站| 联通29元200g的流量卡| 国产白丝娇喘喷水9色精品| 国产老妇女一区| 色在线成人网| 高清日韩中文字幕在线| 成年女人永久免费观看视频| 国产成人a∨麻豆精品| 久久99热6这里只有精品| 久久精品国产亚洲av天美| 国产亚洲精品av在线| 国产熟女欧美一区二区| 亚洲成人精品中文字幕电影| 亚洲精品粉嫩美女一区| 91久久精品国产一区二区成人| 国产日本99.免费观看| 精品人妻一区二区三区麻豆 | 色综合色国产| 久久精品国产亚洲av涩爱 | 国产av一区在线观看免费| 在线播放无遮挡| 免费在线观看影片大全网站| 久久精品国产自在天天线| 免费看美女性在线毛片视频| 久久久久九九精品影院| 欧美3d第一页| 亚洲av中文字字幕乱码综合| 国语自产精品视频在线第100页| 国产午夜精品久久久久久一区二区三区 | 国产精品野战在线观看| 一个人看的www免费观看视频| 日韩欧美 国产精品| 亚洲欧美成人综合另类久久久 | 国内精品久久久久精免费| 一级黄色大片毛片| 97人妻精品一区二区三区麻豆| 国产成人福利小说| 一边摸一边抽搐一进一小说| 免费看日本二区| 久久久久久久久中文| 精品一区二区三区视频在线观看免费| 草草在线视频免费看| 舔av片在线| 好男人在线观看高清免费视频| 直男gayav资源| 在线国产一区二区在线| 国产成人精品久久久久久| www.色视频.com| 搡老妇女老女人老熟妇| 一级黄片播放器| 精品一区二区三区av网在线观看| 婷婷精品国产亚洲av| 久久人人精品亚洲av| 欧美性猛交黑人性爽| 欧美成人一区二区免费高清观看| 日本黄色片子视频| 真人做人爱边吃奶动态| av在线蜜桃| av国产免费在线观看| 少妇裸体淫交视频免费看高清| 最近在线观看免费完整版| 黄色欧美视频在线观看| 国产精品久久久久久久电影| 丰满的人妻完整版| 亚洲精品久久国产高清桃花| 国产久久久一区二区三区| 天天一区二区日本电影三级| 亚洲精品日韩在线中文字幕 | 菩萨蛮人人尽说江南好唐韦庄 | 免费一级毛片在线播放高清视频| 日韩av不卡免费在线播放| 九九热线精品视视频播放| 欧美丝袜亚洲另类| 亚洲在线观看片| 小说图片视频综合网站| 变态另类丝袜制服| 午夜精品在线福利| 国产单亲对白刺激| 成人综合一区亚洲| 在线观看66精品国产| 午夜福利18| 床上黄色一级片| 插阴视频在线观看视频| 久久99热6这里只有精品| 国产中年淑女户外野战色| 午夜久久久久精精品| 国产精品乱码一区二三区的特点| 亚洲欧美精品自产自拍| 最新中文字幕久久久久| 久久久精品欧美日韩精品| 好男人在线观看高清免费视频| 国产精品久久电影中文字幕| 国产精品不卡视频一区二区| 身体一侧抽搐| avwww免费| 我要看日韩黄色一级片| 老司机影院成人| 久久草成人影院| 欧美日本视频| av中文乱码字幕在线| 国产国拍精品亚洲av在线观看| 亚洲最大成人手机在线| 老女人水多毛片| 成年女人看的毛片在线观看| 亚洲精品色激情综合| 日韩亚洲欧美综合| av专区在线播放| 一区二区三区高清视频在线| 久久中文看片网| 精品久久久久久久末码| 亚洲美女搞黄在线观看 | 精品久久久久久久久av| 麻豆精品久久久久久蜜桃| 久久久精品大字幕| 欧美最新免费一区二区三区| 97人妻精品一区二区三区麻豆| 哪里可以看免费的av片| 亚洲四区av| 精品久久久久久久久久久久久| 白带黄色成豆腐渣| 久久精品久久久久久噜噜老黄 | 国产精品不卡视频一区二区| 国产三级在线视频| 超碰av人人做人人爽久久| 熟女人妻精品中文字幕| 国产色爽女视频免费观看| 亚洲一区二区三区色噜噜| 国产精品日韩av在线免费观看| 秋霞在线观看毛片| 赤兔流量卡办理| 日韩精品中文字幕看吧| 亚洲国产精品sss在线观看| 91麻豆精品激情在线观看国产| 免费看美女性在线毛片视频| 老司机午夜福利在线观看视频| 亚洲国产日韩欧美精品在线观看| 无遮挡黄片免费观看| 久久久精品94久久精品| 麻豆国产av国片精品| 又黄又爽又刺激的免费视频.| av在线蜜桃| 99在线人妻在线中文字幕| 久久久国产成人免费| 可以在线观看毛片的网站| 日本-黄色视频高清免费观看| 国产精品人妻久久久影院| 给我免费播放毛片高清在线观看| 精品久久久噜噜| 99久久久亚洲精品蜜臀av| 国产国拍精品亚洲av在线观看| 亚洲国产精品成人久久小说 | 国产大屁股一区二区在线视频| 夜夜看夜夜爽夜夜摸| 国产精品,欧美在线| 高清毛片免费观看视频网站| 老女人水多毛片| 身体一侧抽搐| 麻豆国产97在线/欧美| 日韩 亚洲 欧美在线| 99久久精品一区二区三区| 天天躁夜夜躁狠狠久久av| 我要看日韩黄色一级片| 免费看日本二区| 99久久九九国产精品国产免费| 国产精品av视频在线免费观看| 97热精品久久久久久| 国产在线精品亚洲第一网站| 久久久久久九九精品二区国产| 成人漫画全彩无遮挡| 干丝袜人妻中文字幕| 精品福利观看| 美女黄网站色视频| 麻豆成人午夜福利视频| 国产精品不卡视频一区二区| 一级a爱片免费观看的视频| 卡戴珊不雅视频在线播放| 久久精品国产鲁丝片午夜精品| 国产黄片美女视频| av免费在线看不卡| 99久国产av精品国产电影| 啦啦啦观看免费观看视频高清| 日韩欧美 国产精品| 中国国产av一级| 国产精品久久久久久久久免| 国产老妇女一区| 色哟哟·www| 桃色一区二区三区在线观看| 日本熟妇午夜| 免费av毛片视频| 男人的好看免费观看在线视频| 亚洲av成人精品一区久久| 少妇人妻一区二区三区视频| 99在线视频只有这里精品首页| 欧美日本视频| 久久精品国产亚洲av香蕉五月| 亚洲四区av| 国产免费男女视频| 欧美精品国产亚洲| 中出人妻视频一区二区| 午夜福利高清视频| 久久综合国产亚洲精品| 99热这里只有是精品50| 男人舔奶头视频| 嫩草影院入口| 黄色欧美视频在线观看| 国产真实伦视频高清在线观看| 嫩草影院入口| 淫妇啪啪啪对白视频| 亚洲精品日韩在线中文字幕 | 国产av不卡久久| 97超级碰碰碰精品色视频在线观看| 精品少妇黑人巨大在线播放 | 久久精品影院6| 国产精品伦人一区二区| 女同久久另类99精品国产91| a级毛片免费高清观看在线播放| 在线免费观看不下载黄p国产| 成年版毛片免费区| 哪里可以看免费的av片| 成熟少妇高潮喷水视频| 成人av一区二区三区在线看| av视频在线观看入口| 久久人妻av系列| 99国产极品粉嫩在线观看| 日本a在线网址| 国产高清三级在线| 搡老岳熟女国产| 久久久色成人| 久久精品国产亚洲av涩爱 | 免费高清视频大片| 少妇熟女欧美另类| av福利片在线观看| 国产一区二区激情短视频| 极品教师在线视频| 我的老师免费观看完整版| 精品免费久久久久久久清纯| 久久人妻av系列| 午夜影院日韩av| 亚洲最大成人手机在线| 精品少妇黑人巨大在线播放 | 亚洲丝袜综合中文字幕| av在线观看视频网站免费| 亚洲精品影视一区二区三区av| 99精品在免费线老司机午夜| 国产男靠女视频免费网站| 男女视频在线观看网站免费| 麻豆乱淫一区二区| 国产精品99久久久久久久久| 久久热精品热| 国国产精品蜜臀av免费| 国产69精品久久久久777片| 日日摸夜夜添夜夜添小说| 国产三级中文精品| 亚洲av熟女| 国产探花在线观看一区二区| 国产一区二区在线观看日韩| 亚洲最大成人手机在线| 国产免费男女视频| 国产精品人妻久久久影院| 国产av一区在线观看免费| 2021天堂中文幕一二区在线观| 国产亚洲精品久久久com| 国产精品乱码一区二三区的特点| 床上黄色一级片| 久久精品国产鲁丝片午夜精品| 婷婷精品国产亚洲av在线| 一区二区三区免费毛片| 国产精品野战在线观看| 亚洲成人精品中文字幕电影| 国产精品嫩草影院av在线观看| 欧美最新免费一区二区三区| 深爱激情五月婷婷| 亚洲在线自拍视频| 日本色播在线视频| 午夜爱爱视频在线播放| 欧美最新免费一区二区三区| 中国国产av一级| 国产高清三级在线| 亚洲精品成人久久久久久| 亚洲欧美日韩高清专用| 国产成人一区二区在线| 国产精品人妻久久久影院| 性欧美人与动物交配| ponron亚洲| 久久天躁狠狠躁夜夜2o2o| 欧美+日韩+精品| 色哟哟·www| 中文字幕人妻熟人妻熟丝袜美| 免费看a级黄色片| 精品欧美国产一区二区三| 国内精品一区二区在线观看| 久久久久久久午夜电影| 亚洲第一电影网av| 久久人人精品亚洲av| 久99久视频精品免费| 欧美区成人在线视频| 搡老妇女老女人老熟妇| av专区在线播放| 国产精品,欧美在线| 校园春色视频在线观看| 国产 一区精品| 麻豆av噜噜一区二区三区| 在线观看av片永久免费下载| 男人的好看免费观看在线视频| 少妇高潮的动态图| 欧美一区二区亚洲| 日韩一区二区视频免费看| 国产蜜桃级精品一区二区三区| 晚上一个人看的免费电影| 2021天堂中文幕一二区在线观| 欧美xxxx性猛交bbbb| 日本黄色视频三级网站网址| 日日干狠狠操夜夜爽| 精品久久久久久久人妻蜜臀av| 亚洲综合色惰| 色尼玛亚洲综合影院| 亚洲自拍偷在线| 三级毛片av免费| 两个人的视频大全免费| 18禁裸乳无遮挡免费网站照片| 国产探花极品一区二区| 欧美一区二区国产精品久久精品| 成人美女网站在线观看视频| 免费电影在线观看免费观看| 亚洲图色成人| 黄片wwwwww| 麻豆av噜噜一区二区三区| 12—13女人毛片做爰片一| 亚洲最大成人手机在线| 欧美日韩综合久久久久久| 女人十人毛片免费观看3o分钟| 亚洲三级黄色毛片| 麻豆国产97在线/欧美| 免费人成在线观看视频色| 色吧在线观看| 天堂影院成人在线观看| 97人妻精品一区二区三区麻豆| 久久久国产成人免费| 在线观看免费视频日本深夜| 亚洲欧美日韩卡通动漫| 亚洲无线观看免费| 国产一区二区激情短视频| 国产在线精品亚洲第一网站| 久久99热这里只有精品18| 精品99又大又爽又粗少妇毛片| 国产午夜精品久久久久久一区二区三区 | 国产一区二区在线av高清观看| 久久久精品大字幕| 天堂动漫精品| 亚洲欧美日韩高清在线视频| 久久精品国产清高在天天线| 秋霞在线观看毛片| 人人妻,人人澡人人爽秒播| 最近2019中文字幕mv第一页| 久久久久久九九精品二区国产| 老司机影院成人| 亚洲欧美精品自产自拍| 禁无遮挡网站| 亚洲中文字幕日韩| 国产精华一区二区三区| 人妻夜夜爽99麻豆av| 1024手机看黄色片| 不卡一级毛片| 在现免费观看毛片| av在线蜜桃| 亚洲四区av| 两个人的视频大全免费| 别揉我奶头~嗯~啊~动态视频| av在线蜜桃| 亚洲欧美中文字幕日韩二区| 久久久久久九九精品二区国产| 成人av在线播放网站| 麻豆久久精品国产亚洲av| av女优亚洲男人天堂| 一区二区三区高清视频在线| 乱系列少妇在线播放| 国内少妇人妻偷人精品xxx网站| 国产精品一区www在线观看| 22中文网久久字幕| 国产黄色视频一区二区在线观看 | 国产成人影院久久av| 欧美区成人在线视频| 一本久久中文字幕| .国产精品久久| 美女内射精品一级片tv| 国语自产精品视频在线第100页| 国产精品久久久久久av不卡| 老熟妇乱子伦视频在线观看| 国产成人a∨麻豆精品| 一个人看的www免费观看视频| 天天躁日日操中文字幕| 女同久久另类99精品国产91| 日本一二三区视频观看| 亚洲中文字幕一区二区三区有码在线看| 久久午夜亚洲精品久久| 91久久精品电影网| 麻豆精品久久久久久蜜桃| 91av网一区二区| 亚洲人成网站在线播| 色综合亚洲欧美另类图片| 最近最新中文字幕大全电影3| 亚洲精品色激情综合| 青春草视频在线免费观看| 欧美一区二区国产精品久久精品| 亚洲成av人片在线播放无| 国产黄色小视频在线观看| 亚洲色图av天堂| 午夜福利视频1000在线观看| 99久久久亚洲精品蜜臀av| 亚洲人与动物交配视频| 免费看a级黄色片| 精品日产1卡2卡| 久久久久久久久大av| 淫妇啪啪啪对白视频|