• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于LSTM和N-gram的ESL文章的語法錯誤自動糾正方法

    2018-07-18 03:02:40譚詠梅楊一梟劉姝雯
    中文信息學(xué)報 2018年6期
    關(guān)鍵詞:單復(fù)數(shù)冠詞介詞

    譚詠梅,楊一梟,楊 林,劉姝雯

    (北京郵電大學(xué) 計算機學(xué)院,北京 100876)

    0 引言

    英語是當(dāng)今世界上最主要的國際通用語言,全球有超過10億人將英語作為第二語言使用。語法(syntactic)錯誤是ESL(English as Second Language)學(xué)習(xí)者最常犯的一種錯誤[1]。語法錯誤自動糾正(Grammatical Error Correction,GEC)指利用計算機對文章進行自動語法錯誤糾正。

    冠詞錯誤、介詞錯誤、名詞單復(fù)數(shù)錯誤、動詞形式錯誤和主謂不一致錯誤是ESL學(xué)習(xí)者常犯的五類語法錯誤[2]。它們對文章智能評改系統(tǒng)的性能影響最大,因此本文重點關(guān)注并解決這五類錯誤。

    這五類錯誤中,冠詞和介詞錯誤的變化形式有限,可將其看作序列標(biāo)注問題,且長短時記憶(Long Short-Term Memory,LSTM)對于序列標(biāo)注問題效果較好,因此,本文提出了一種基于LSTM的序列標(biāo)注GEC方法。名詞單復(fù)數(shù)錯誤、動詞形式錯誤和主謂不一致錯誤變化形式多樣,所對應(yīng)的混淆集為開放集合。本文提出一種基于ESL和新聞?wù)Z料的N-gram投票策略GEC方法。

    1 相關(guān)工作

    GEC開始于20世紀80年代,Writer’s Workbench主要使用規(guī)則進行語法錯誤糾正,隨后出現(xiàn)了基于句法分析的Epistle系統(tǒng),1993年微軟的Word基于拓展短語結(jié)構(gòu)語法(Augmented Phrase Structure Grammar)對文本進行語法錯誤糾正。

    LSTM由Sepp Hochreiter和Jurgen Schmid-huber于1997年提出[3],通過設(shè)置輸入門、輸出門、遺忘門等,解決了循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network)的梯度消失和信息的長期依賴問題,在處理序列問題中,效果較為突出。

    隨著各種規(guī)模語料庫的出現(xiàn),基于語料庫的統(tǒng)計方法成為有效的GEC方法。HOO在2011年、2012年連續(xù)舉辦了兩年相關(guān)評測任務(wù)[4-5],CoNLL在2013年、2014年繼續(xù)舉辦了相關(guān)評測任務(wù)[2,6]。

    GEC方法主要可以分為基于規(guī)則和基于統(tǒng)計兩類。基于規(guī)則的方法主要依賴語言學(xué)家編寫的語法規(guī)則,可分為以下兩類:

    (1) 基于上下文無關(guān)規(guī)則驅(qū)動的方法。其主要依賴語言學(xué)家編寫的語法規(guī)則進行錯誤檢查[7],少量規(guī)則對系統(tǒng)不夠?qū)嵱茫罅恳?guī)則則會出現(xiàn)互相矛盾的問題。該方法局限性太大,錯誤檢查范圍有限。

    (2) 基于簡單統(tǒng)計的規(guī)則驅(qū)動的方法在提取規(guī)則的時候考慮了上下文[8],可以有效避免規(guī)則的錯誤使用,但錯誤糾正范圍仍然有限。

    基于統(tǒng)計的GEC方法[9-12],即使用機器學(xué)習(xí)的方法對英文寫作中的錯誤進行糾正時,糾正的性能依賴于語料庫的構(gòu)建。本文在進行識別和糾正時,將新聞?wù)Z料、ESL語料和糾正后的中國學(xué)生寫的英文文章語料(PIGAI語料*www.pigai.org)混合使用。

    在本文的N-gram方法中,使用大量的新聞?wù)Z料進行N-gram的頻次統(tǒng)計,以用于對名詞、動詞、主謂錯誤等的識別和糾正;在神經(jīng)網(wǎng)絡(luò)模型中,對不存在語法錯誤的語料進行人工錯誤生成,以平衡語料之間的差異并補充用于模型訓(xùn)練的語料。

    對于冠詞和介詞的糾正,傳統(tǒng)的GEC方法使用N-gram或者基于規(guī)則的方法對語法錯誤進行糾正。單純的使用固定窗口大小的上下文信息進行糾正,信息使用并不充分,且當(dāng)窗口大小變大時,難以對模型進行訓(xùn)練。LSTM網(wǎng)絡(luò)模型可以學(xué)習(xí)到?jīng)Q定介詞或者冠詞使用的長期依賴信息,并且可以避免傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡(luò)中可能發(fā)生的梯度消失等問題。

    因此,本文將冠詞和介詞錯誤看作一項特殊的序列標(biāo)注任務(wù),提出一種基于LSTM的序列標(biāo)注GEC方法。在訓(xùn)練時,使用ESL語料和補充語料,對特定冠詞或介詞進行標(biāo)注。針對名詞單復(fù)數(shù)錯誤、動詞形式錯誤和主謂不一致錯誤,其混淆集為開放集合。提出一種基于ESL和新聞?wù)Z料的N-gram投票策略的GEC方法。

    2 基于LSTM和N-gram 的ESL文章的GEC方法

    基于LSTM和N-gram的ESL文章的GEC方法系統(tǒng)架構(gòu)如圖1所示。

    針對冠詞和介詞錯誤,將其看作一項特殊的序列標(biāo)注任務(wù),該文提出一種基于LSTM的序列標(biāo)注GEC方法。首先,對于已有詞性標(biāo)注的訓(xùn)練語料進行預(yù)處理,將冠詞詞性用一個特殊標(biāo)記“ART”代替,將介詞詞性用一個特殊標(biāo)記“TO”代替,把上述標(biāo)記與冠詞或介詞的位置進行對換。然后,使用LSTM進行模型訓(xùn)練。最后,將訓(xùn)練得到的模型用于測試數(shù)據(jù)。

    針對名詞單復(fù)數(shù)錯誤、動詞形式錯誤和主謂不一致錯誤,混淆集為開放集合,提出基于ESL和新聞?wù)Z料的N-gram投票策略的GEC方法。

    2.1 N-gram搜索服務(wù)及知識庫

    2.1.1N-gram搜索服務(wù)

    語法錯誤的糾正策略基于N-gram的頻次統(tǒng)計,因此需首先建立N-gram搜索服務(wù)。使用的N-gram*http://webscope.sandbox.yahoo.com/catalog.php?datatype=l來源為約12 000個新聞網(wǎng)站2006年的所有新聞,統(tǒng)計信息如表1所示。

    表1 N-gram詳細信息

    為了提高其查詢效率,使用開源搜索引擎solr*https://lucene.apache.org/solr/對其建立倒排索引,提供搜索服務(wù)。

    2.1.2知識庫

    冠詞和介詞的變化形式有限,都處于封閉集合內(nèi)。針對冠詞和介詞建立有限混淆集。

    圖1 系統(tǒng)架構(gòu)圖

    名詞及動詞不像冠詞和介詞那樣變化形式有限,其變化形式是開放集合。因此針對名詞錯誤、動詞形式、主謂不一致錯誤分別建立變化表。

    冠詞混淆集冠詞混淆集包含三種情況: the,a/an,null。null代表不使用冠詞。

    介詞混淆集介詞混淆集包含常見的17個介詞: on,about,into,with,as,at,by,or,from,in,of,over,to,among,between,under,within。

    名詞單復(fù)數(shù)變化表名詞單復(fù)數(shù)變化表包括: 名詞單數(shù)、名詞復(fù)數(shù),如表2所示。

    表2 名詞單復(fù)數(shù)變化表

    動詞形式變化表動詞形式變化表主要包括: 動詞原形、過去式、過去分詞、現(xiàn)在分詞,如表3所示。

    表3 動詞形式變化表

    動詞單復(fù)數(shù)變化表動詞單復(fù)數(shù)變化取決于其主語單復(fù)數(shù)形式。動詞單復(fù)數(shù)變化表主要包括: 動詞單數(shù),動詞復(fù)數(shù),如表4所示。

    表4 動詞單復(fù)數(shù)變化表

    2.2 移動窗口及N-gram投票策略

    對混淆集為開放集的GEC方法,基于移動窗口[10]及N-gram投票策略。

    2.2.1移動窗口

    移動窗口(Moving Window)定義如式(1)所示。

    MWi,k(w)={wi -j,…,wi -j+(k -1),j=0,k-1}

    (1)

    wi為句中第i個單詞,k代表窗口大小,j為窗口內(nèi)第一個單詞與wi的距離。如表5所示。

    表5 移動窗口

    窗口大小k的選擇和j的取值范圍直接影響著GEC的效果,針對不同的錯誤類型,選擇不同的k,j值。

    2.2.2N-gram投票策略

    本策略模擬現(xiàn)實生活中的投票表決機制,含語法錯誤候選的N-gram片段代表一個可能具有投票權(quán)利的候選人。由于語料庫有限,N-gram片段的頻次可能出現(xiàn)非常稀疏的情況。本策略設(shè)置一個最小有效頻次,只有當(dāng)查詢到的頻次高于最小有效頻次時,此N-gram片段才具有投票權(quán)利。

    在現(xiàn)實生活中,不同的人針對不同領(lǐng)域所投的票的重要性是不一樣的,例如: 領(lǐng)域?qū)<业耐镀敝匾愿哂谄胀ㄈ?。本策略使用N-gram片段長度模擬領(lǐng)域?qū)<业膶I(yè)程度,N-gram越長所投票的重要性越高。

    最后,針對投票結(jié)果,得到糾正后的結(jié)果。具體算法如圖2所示。

    圖2 N-gram投票策略

    Fset和Wset為參數(shù)。Fset為最小有效頻次,只有當(dāng)查詢到的頻次大于Fset時才可參加投票。Wset用于調(diào)整不同長度N-gram片段投票的權(quán)重,N-gram片段長度越長其權(quán)重越大。

    此算法基于語料庫,由于一方面語料庫規(guī)模有限不可能包含所有的片段,另一方面語料庫中存在噪音數(shù)據(jù)。所以,設(shè)置最小有效頻次Fset,只有當(dāng)查詢出的N-gram片段頻次大于此頻次,才能說明語料庫中包含相關(guān)語料,此N-gram片段具有投票權(quán)利。依據(jù)實驗對比,將Fset設(shè)置為100。

    具有投票權(quán)利的N-gram片段的頻次代表改為相應(yīng)結(jié)果的概率。假設(shè)修改冠詞錯誤時,“have an apple”的頻次為2,“have the apple”的頻次為1,“have apple”的頻次為1。那么,根據(jù)語料庫改為“have an apple”的概率將大于“have the apple”及“have apple”。而投票策略是要在“have an apple”、 “have the apple”及“have apple”中選出一個作為投票對象,本策略選擇概率大的作為投票對象。

    2.3 基于LSTM的標(biāo)注糾正策略

    該文對混淆集為固定集合的語法錯誤使用基于LSTM的標(biāo)注糾正策略。

    2.3.1LSTM模型原理

    在進行序列數(shù)據(jù)的標(biāo)注時,當(dāng)前單詞的標(biāo)注信息一般依賴于上下文信息。傳統(tǒng)的序列標(biāo)注方法依賴統(tǒng)計或者融合的方法[13-14],而循環(huán)神經(jīng)網(wǎng)絡(luò)通過建立隱藏層的序列關(guān)系,可以很好的提取序列信息[3]。其中,LSTM通過設(shè)置門限單元和Cell,可以有效避免傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡(luò)在訓(xùn)練時可能會出現(xiàn)的梯度消失和梯度爆炸等問題[15]。

    相比單向的LSTM模型僅僅累積當(dāng)前時刻之前的信息,雙向的LSTM可以累積當(dāng)前時刻的上下文信息,使得模型可以綜合上下文信息進行序列的標(biāo)注。

    2.3.2基于LSTM的標(biāo)注糾正策略

    基于LSTM的標(biāo)注模型如圖3所示。模型首先將單詞轉(zhuǎn)換成單詞向量作為模型的輸入,每個時刻輸入序列中相應(yīng)位置的單詞向量。在訓(xùn)練的過程中,詞向量作為參數(shù)進行更新。模型使用詞向量作為LSTM單元的輸入,并在每個時刻,輸出相應(yīng)的標(biāo)注向量。其中,標(biāo)注集合為所有的詞性集合和所有介詞或者冠詞的混淆集的并集。該標(biāo)注向量的維度和標(biāo)注集合總數(shù)一致,并通過softmax選擇概率最大的標(biāo)注進行標(biāo)記。

    標(biāo)注模型依賴BPTT(back propagation through time)算法[3],使用隨機梯度下降的方式進行監(jiān)督訓(xùn)練。

    本文針對混淆集固定的語法錯誤,即冠詞和介詞進行標(biāo)注糾正。在標(biāo)注之前,將序列中的冠詞或者介詞使用統(tǒng)一的標(biāo)識進行表示。在標(biāo)注時,統(tǒng)一的標(biāo)識被標(biāo)注成具體的介詞或者冠詞,實現(xiàn)語法中冠詞或介詞錯誤的糾正。

    例如,在進行冠詞糾錯時:

    原句:

    “Debateonthelegislation,whichfacesavetothreatfrompresidentBush,istocontinuetoday.”

    首先,將其處理為:

    “DebateonARTlegislation,whichfacesARTvetothreatfrompresidentBush,istocontinuetoday.”

    即,使用統(tǒng)一的符號”ART”進行代替句子中所有的冠詞作為輸入。

    標(biāo)注模型輸出為:

    “NNINtheNN,WDTVBZaNNNNINNNPNNP.VBZTOVBNN.”即,冠詞部分標(biāo)注為具體的冠詞。其余部位輸出相應(yīng)的詞性標(biāo)注。

    2.3.3人工錯誤生成

    因新聞?wù)Z料和ESL語料之間存在差異,故模型在訓(xùn)練時,對新聞?wù)Z料進行人工錯誤補充,以減小語料之間的差異。根據(jù)語法錯誤的類型,隨機選擇句子中的動詞或者名詞進行形式的變化。例如,隨機地將名詞的單復(fù)數(shù)形式進行修改,將動詞的時態(tài)進行修改等。

    2.4 冠詞錯誤識別與糾正

    冠詞錯誤主要包括: 冠詞誤用,冠詞冗余,冠詞缺失。錯誤類型舉例如下。

    1) 冠詞誤用:

    例“It is alsotheadvance of surveillance technology.”

    將“theadvance”改為“anadvance”。

    2) 冠詞冗余:

    例“It givesthepolice a better control of the criminal.”

    將“thepolice”改為“police”。

    3) 冠詞缺失:

    例“Government had to uninstall all the devices in the end.”

    將“Government”改為“Thegovernment”。

    本文將冠詞錯誤糾正看作一項特殊的序列標(biāo)注任務(wù),涉及三個子模塊: 冠詞錯誤預(yù)處理模塊、冠詞錯誤識別與糾正模塊和冠詞錯誤后處理模塊。

    因冠詞缺失在冠詞錯誤中的占比較小[2],本文主要處理前面兩種錯誤類型。

    2.4.1冠詞錯誤預(yù)處理模塊

    將冠詞詞性用一個特殊標(biāo)記“ART”代替,把詞性與冠詞的位置進行對換。這樣,句子中所有出現(xiàn)冠詞的地方都被替換為“ART”,而其對應(yīng)的詞性則被修改為此處應(yīng)該出現(xiàn)的冠詞。如“A_DTrecord_NN date_NN has_VBZ n’t_RB been_VBN set_VBN ._.”處理為“ART_Arecord_NN date_NN has_VBZ n’t_RB been_VBN set_VBN ._.”。

    2.4.2冠詞錯誤識別與糾正模塊

    根據(jù)給定句子,判斷句子中可能存在冠詞使用錯誤的位置,對句子進行詞性標(biāo)注,然后識別出所有詞性被標(biāo)注為冠詞(a,an,the)的地方。使用基于LSTM的序列標(biāo)注方法進行冠詞錯誤識別與糾正。

    基于LSTM的序列標(biāo)注GEC方法,系統(tǒng)架構(gòu)如圖3所示。其中,wn為輸入的待糾正句子的第n個單詞,tn為輸出的糾正后句子的第n個單詞。首先,將輸入句子中的每個單詞轉(zhuǎn)換為詞向量表示;然后,經(jīng)過兩層LSTM模型,得到標(biāo)注結(jié)果。

    圖3 基于LSTM的冠詞、介詞錯誤識別與糾正方法

    2.4.3冠詞錯誤后處理模塊

    將上一步驟的結(jié)果中為特殊標(biāo)記“ART”的單詞與詞性標(biāo)記進行對換,再將詞性標(biāo)記刪除,得到最終輸出結(jié)果。

    2.5 介詞錯誤識別與糾正

    介詞錯誤主要包括: 介詞誤用、介詞冗余、介詞缺失。錯誤類型舉例如下。

    1) 介詞誤用:

    例“Pets are supposed to be chained when they are outonthe streets.”

    將“onthe streets”改為“inthe streets”。

    2) 介詞冗余:

    例“In that case,they would have no choice but to seekforthe power of loyal police.”

    將“seekfor”改為“seek”。

    3) 介詞缺失:

    例“Although we are not implantedwithchips we are exposed under CCTV.”

    將“implanted”改為“implanted (with)”。

    將介詞錯誤糾正看作一項特殊的序列標(biāo)注任務(wù),涉及三個子模塊: 介詞錯誤預(yù)處理模塊、介詞錯誤識別與糾正模塊和介詞錯誤后處理模塊。

    因介詞缺失在介詞錯誤中的占比較小[2],本文主要處理前面兩種錯誤類型。

    2.5.1介詞錯誤預(yù)處理模塊

    將介詞詞性用一個特殊標(biāo)記“TO”代替,把詞性與介詞的位置進行對換。這樣,句子中所有出現(xiàn)介詞的地方都被替換為“TO”,而其對應(yīng)的詞性則被修改為此處應(yīng)該出現(xiàn)的介詞。如“Some_DT 0_CD institutions_NNS are_VBP part_NNof_INthe_DT pension_NN fund_NN ._.”處理為“Some_DT 0_CD institutions_NNS are_VBP part_NNTO_ofthe_DT pension_NN fund_NN ._.”。

    2.5.2介詞錯誤識別與糾正模塊

    根據(jù)給定句子,判斷句子中可能存在介詞使用錯誤的位置,對句子進行詞性標(biāo)注,然后識別出所有詞性被標(biāo)注為介詞的地方。

    使用基于LSTM的序列標(biāo)注方法進行介詞錯誤糾正,系統(tǒng)架構(gòu)如圖3所示。

    2.5.3介詞錯誤后處理模塊

    將上一步驟的結(jié)果中為特殊標(biāo)記“TO”的單詞與詞性標(biāo)記進行對換,再將詞性標(biāo)記刪除,得到最終輸出結(jié)果。

    2.6 名詞單復(fù)數(shù)錯誤糾正

    名詞單復(fù)數(shù)錯誤糾正模塊基于名詞單復(fù)數(shù)變化表及N-gram投票策略,主要針對名詞單復(fù)數(shù)誤用情況進行糾正。此模塊具體糾正過程舉例說明如下:

    例“This will,if not already,caused problems as there are very limitedspacesfor us .”

    將“spaces”改為“space”。

    1) 對例句詞性標(biāo)注得到其詞性序列,并提取詞性標(biāo)注為NN和NNS的單詞得到錯誤候選集合E={problems,spaces};

    2) 使用名詞單復(fù)數(shù)變化表得到相應(yīng)的糾正候選集合。如: spaces的糾正候選集合C={space,spaces};

    3) 基于糾正候選集合,使用大小為3—5的移動窗口獲取N-grams片段集合。使用N-gram投票策略得到得票最高的糾正候選,在原句中進行替換。如果“space”為得票最高糾正候選,則糾正后的句子為“This will,if not already,caused problems as there are very limitedspacefor us .”

    2.7 動詞及主謂不一致錯誤糾正

    動詞錯誤糾正模塊主要針對動詞形式誤用情況及主謂不一致情況進行糾正。此模塊依賴于動詞形式變化表、動詞單復(fù)數(shù)變化表及N-gram投票策略,具體糾正過程舉例如下:

    動詞形式錯誤:

    例“The more peopleusingit over us,the more power they will have on us.”

    將“using”改為“use”。

    主謂不一致:

    例“Every move of usareeasily tracked.”

    將“are”改為“is”。

    1) 對句子詞性標(biāo)注得到其詞性序列。針對動詞形式錯誤,提取詞性標(biāo)注為VB、VBD、VBG、VBN的單詞作為其錯誤候選。針對主謂不一致錯誤,提取詞性標(biāo)注為VBP、VBZ的單詞作為其錯誤候選。

    2) 根據(jù)錯誤候選及動詞形式變化表/動詞單復(fù)數(shù)變化表得到錯誤候選的糾正候選集合。

    3) 針對糾正候選,使用大小為3—5的移動窗口獲取N-grams片段集合。使用N-gram投票策略得到得票最高的糾正候選,并在原句中進行替換。

    3 實驗

    3.1 實驗數(shù)據(jù)

    實驗數(shù)據(jù)來源于CoNLL2013的GEC評測任務(wù),統(tǒng)計結(jié)果如表6所示。由于CoNLL2013語料沒有正確的詞性標(biāo)注,且CoNLL2013訓(xùn)練語料較PIGAI詞性標(biāo)注語料[13]和Brown語料*http://www.nltk.org/nltk_data/規(guī)模較小。因此,使用PIGAI詞性標(biāo)注語料、Brown語料和標(biāo)注后的CoNLL語料等擴充LSTM訓(xùn)練語料標(biāo)注時,用Stanford 標(biāo)注工具對其進行詞性標(biāo)注。其中,CoNLL2013語料和PIGAI語料作為ESL語料,Brown語料作為補充的新聞?wù)Z料參與模型的訓(xùn)練。

    表6 CoNLL2013的GEC評測任務(wù)數(shù)據(jù)統(tǒng)計

    CoNLL2013的GEC評測任務(wù)數(shù)據(jù)里標(biāo)注了多種錯誤類型,但評測任務(wù)主要是針對冠詞錯誤、介詞錯誤、名詞錯誤、主謂一致和動詞形式錯誤這五種占比較高[2]的錯誤類型。

    3.2 評價方法

    CoNLL2013評價標(biāo)準(zhǔn)為F1[2],定義如式(2)所示。

    (2)

    其中P與R分別表示準(zhǔn)確率和召回率,定義如式(3)、式(4)所示。

    Ncorrect指系統(tǒng)修改正確的錯誤的數(shù)目,Npredicted指系統(tǒng)修改的錯誤的數(shù)目,Ntarget指語料本身存在的錯誤的數(shù)目。

    3.3 實驗結(jié)果及分析

    基于LSTM和N-gram的ESL文章的GEC方法在CoNLL2013的GEC評測數(shù)據(jù)上的實驗結(jié)果如表7到表9,并與基于語料庫的英語文章語法錯誤檢查及糾正方法[16]和2013年評測第一名UIUC[12]進行比較。

    如表7所示,針對冠詞錯誤的糾正,本文的方法的F1值比UIUC方法高5%,比Corpus GEC方法高5%。針對介詞錯誤的糾正,本文方法的F1值比UIUC方法高21%,比Corpus GEC方法高13%。表明基于LSTM的序列標(biāo)注GEC方法對冠詞和介詞語法錯誤糾正任務(wù)有效。這是由于詞向量包含豐富的上下文信息,而使用LSTM更好地學(xué)習(xí)到了決定冠詞或者介詞使用的長期的依賴信息,所以結(jié)果較好。

    表7 冠詞及介詞錯誤糾正結(jié)果

    如表8所示在僅使用N-gram+vote投票策略對名詞及動詞錯誤糾正時,F(xiàn)1值與UIUC方法都還存在一定的差距。這是由于N-gram + vote策略基于的新聞?wù)Z料與所需糾正的ESL文章具有差異性,會將大量正確句子改為錯誤句子。名詞及動詞變化表不能涵蓋所有的名詞及動詞的變化形式,導(dǎo)致糾正名詞及動詞時還具有一定的局限性。

    表8 名詞及動詞錯誤糾正結(jié)果

    如表9所示,對于全部五種類型錯誤的糾正,本文方法均優(yōu)于UIUC方法,在2013年CoNLL的GEC數(shù)據(jù)上總的F1值為33.87%,超過第一名UIUC總的F1值31.20%??偟膶嶒灲Y(jié)果表明基于LSTM和N-gram 的ESL文章的語法錯誤自動糾正方法是有效的。

    表9 所有類型錯誤糾正結(jié)果

    4 結(jié)束語

    針對冠詞和介詞錯誤,本文提出一種基于LSTM的序列標(biāo)注GEC方法。針對名詞單復(fù)數(shù)錯誤、動詞形式錯誤和主謂不一致錯誤,本文提出一種基于N-gram投票策略的GEC方法。在2013年CoNLL的GEC評測數(shù)據(jù)上,針對冠詞錯誤糾正F1為38.05%,介詞錯誤的糾正F1為28.89%,所有五種類型錯誤的總F1為33.87%,均高于評測第一名UIUC。實驗結(jié)果表明,本文方法對冠詞及介詞錯誤的糾正是有效的,但仍有一些問題存在。例如,在介詞缺失和冠詞缺失時如何進行糾正;在糾正名詞單復(fù)數(shù)錯誤及動詞錯誤時,如何避免將正確句子改為錯誤句子;及動詞形式中如果出現(xiàn)被動語態(tài)錯誤時該怎么糾正等。這些問題仍需進一步研究解決。

    猜你喜歡
    單復(fù)數(shù)冠詞介詞
    冠詞(一)
    介詞和介詞短語
    有無冠詞 意義大不同
    冠詞講與練
    介詞不能這樣用
    主謂一致考點探究
    淺論綁架罪行為單復(fù)數(shù)問題
    名詞易錯點透視
    冠詞缺失與中介語句法損傷研究
    Unit?。闭Z法加油站
    欧美丝袜亚洲另类| 嫩草影院精品99| 高清av免费在线| a级毛片免费高清观看在线播放| 狂野欧美激情性xxxx在线观看| 国产高清有码在线观看视频| 18禁在线无遮挡免费观看视频| 1024手机看黄色片| 国产黄色视频一区二区在线观看 | 老女人水多毛片| 超碰97精品在线观看| 欧美成人午夜免费资源| 国产成人精品一,二区| 亚洲成av人片在线播放无| 少妇高潮的动态图| 久久精品人妻少妇| 国产三级在线视频| 久久人人爽人人爽人人片va| 久久6这里有精品| 在线免费观看不下载黄p国产| 亚洲人成网站在线播| 99久久精品一区二区三区| 午夜精品一区二区三区免费看| 少妇的逼水好多| 成人欧美大片| 特级一级黄色大片| 波野结衣二区三区在线| 亚洲av日韩在线播放| 日产精品乱码卡一卡2卡三| 精品人妻视频免费看| 免费av毛片视频| 国产国拍精品亚洲av在线观看| 一级毛片久久久久久久久女| 美女内射精品一级片tv| 亚洲国产精品成人久久小说| 极品教师在线视频| 国产精品国产高清国产av| av播播在线观看一区| 国产一区二区三区av在线| 别揉我奶头 嗯啊视频| 日本黄色片子视频| 韩国高清视频一区二区三区| 最近的中文字幕免费完整| 国产美女午夜福利| 免费黄色在线免费观看| 如何舔出高潮| 亚洲av成人精品一区久久| 国产探花在线观看一区二区| 精品久久久久久久人妻蜜臀av| 欧美日韩国产亚洲二区| 精品国产露脸久久av麻豆 | 大香蕉97超碰在线| 日韩一区二区三区影片| 天堂影院成人在线观看| 一级毛片aaaaaa免费看小| 国产色爽女视频免费观看| 中文字幕久久专区| 国产午夜精品一二区理论片| 亚洲,欧美,日韩| 国产午夜福利久久久久久| 午夜日本视频在线| 久久久久精品久久久久真实原创| 亚州av有码| 美女xxoo啪啪120秒动态图| 午夜福利在线观看吧| 国产人妻一区二区三区在| 久久99热6这里只有精品| 老师上课跳d突然被开到最大视频| 91狼人影院| 国产真实伦视频高清在线观看| 久久久精品欧美日韩精品| 人妻系列 视频| 日韩在线高清观看一区二区三区| 亚洲av中文av极速乱| 中文字幕熟女人妻在线| 午夜精品国产一区二区电影 | 欧美3d第一页| 黄色日韩在线| 国产精品人妻久久久影院| 春色校园在线视频观看| 少妇的逼水好多| 午夜福利高清视频| 亚洲欧美日韩无卡精品| 欧美潮喷喷水| 不卡视频在线观看欧美| 国产在线男女| 国产高清不卡午夜福利| 久久久午夜欧美精品| 亚洲怡红院男人天堂| 一级毛片电影观看 | 国产成人a∨麻豆精品| av女优亚洲男人天堂| 成人鲁丝片一二三区免费| 国产日韩欧美在线精品| 熟妇人妻久久中文字幕3abv| 国产午夜福利久久久久久| 国产真实伦视频高清在线观看| av又黄又爽大尺度在线免费看 | 国产精品久久电影中文字幕| av专区在线播放| 国产高清不卡午夜福利| 亚洲成人中文字幕在线播放| 床上黄色一级片| 欧美激情久久久久久爽电影| 免费不卡的大黄色大毛片视频在线观看 | 一个人免费在线观看电影| 成人亚洲精品av一区二区| 欧美最新免费一区二区三区| 亚洲国产欧美人成| 超碰97精品在线观看| 伦理电影大哥的女人| 亚洲综合色惰| 99热全是精品| 成人亚洲欧美一区二区av| 亚洲av福利一区| 欧美xxxx性猛交bbbb| 国产又色又爽无遮挡免| 男女下面进入的视频免费午夜| av视频在线观看入口| 亚洲人成网站在线播| 国语自产精品视频在线第100页| 菩萨蛮人人尽说江南好唐韦庄 | 国产免费又黄又爽又色| 大话2 男鬼变身卡| 丰满乱子伦码专区| 婷婷色av中文字幕| 成人高潮视频无遮挡免费网站| 日本色播在线视频| 亚洲欧美清纯卡通| 午夜精品一区二区三区免费看| 成人毛片60女人毛片免费| 国产av不卡久久| 亚洲国产色片| 特级一级黄色大片| 久久亚洲精品不卡| 亚洲av一区综合| 麻豆乱淫一区二区| 亚洲在线观看片| 黄色一级大片看看| 日韩欧美三级三区| 最近2019中文字幕mv第一页| 欧美人与善性xxx| www日本黄色视频网| 99国产精品一区二区蜜桃av| 国产一区有黄有色的免费视频 | 看免费成人av毛片| 日韩大片免费观看网站 | a级一级毛片免费在线观看| 国产爱豆传媒在线观看| 最近中文字幕高清免费大全6| 国产精品久久久久久久久免| 99视频精品全部免费 在线| 亚洲精品色激情综合| 简卡轻食公司| 日韩国内少妇激情av| 亚洲成人中文字幕在线播放| 免费观看的影片在线观看| 欧美一级a爱片免费观看看| 欧美一区二区精品小视频在线| 久久久精品94久久精品| 特大巨黑吊av在线直播| 国产毛片a区久久久久| 日日撸夜夜添| 久久精品国产亚洲网站| 成年版毛片免费区| 国产国拍精品亚洲av在线观看| 亚洲欧美一区二区三区国产| 日韩,欧美,国产一区二区三区 | 国产大屁股一区二区在线视频| 精品不卡国产一区二区三区| 一级毛片电影观看 | 黄色日韩在线| 五月玫瑰六月丁香| 99热全是精品| 国产高清不卡午夜福利| 综合色av麻豆| 日本三级黄在线观看| 国产一级毛片七仙女欲春2| 舔av片在线| av线在线观看网站| 国产乱人视频| 一本久久精品| 日本熟妇午夜| 精品久久国产蜜桃| 老师上课跳d突然被开到最大视频| 日韩一本色道免费dvd| 一二三四中文在线观看免费高清| 小蜜桃在线观看免费完整版高清| 日日撸夜夜添| 老司机福利观看| 日本-黄色视频高清免费观看| 青春草亚洲视频在线观看| 老司机福利观看| 麻豆久久精品国产亚洲av| 少妇裸体淫交视频免费看高清| 国产亚洲av片在线观看秒播厂 | 成人国产麻豆网| 午夜爱爱视频在线播放| 美女脱内裤让男人舔精品视频| 国产亚洲最大av| 亚洲不卡免费看| 日韩一本色道免费dvd| 久久韩国三级中文字幕| 国产伦理片在线播放av一区| 国产成人精品婷婷| 亚洲美女搞黄在线观看| 中文欧美无线码| 毛片女人毛片| 精品酒店卫生间| 色哟哟·www| 欧美极品一区二区三区四区| 久久欧美精品欧美久久欧美| 老司机影院成人| 亚洲性久久影院| 国产极品天堂在线| 久久人人爽人人爽人人片va| 日韩欧美精品免费久久| 特大巨黑吊av在线直播| 久久久久久久久久成人| 国产av在哪里看| 久久久精品欧美日韩精品| 在线免费十八禁| 精品久久久噜噜| 寂寞人妻少妇视频99o| 99热网站在线观看| 最后的刺客免费高清国语| 直男gayav资源| 在线观看66精品国产| 美女国产视频在线观看| 午夜老司机福利剧场| 丝袜喷水一区| 亚洲国产高清在线一区二区三| 黑人高潮一二区| 中文乱码字字幕精品一区二区三区 | 国产亚洲一区二区精品| 日本黄大片高清| 免费观看性生交大片5| 日韩视频在线欧美| 国产不卡一卡二| 国产精品一区www在线观看| 欧美激情久久久久久爽电影| 久久久久久久久久黄片| 直男gayav资源| 国产三级在线视频| 热99re8久久精品国产| h日本视频在线播放| 九九热线精品视视频播放| av黄色大香蕉| 久久久久精品久久久久真实原创| 一级av片app| 日韩欧美 国产精品| 精品久久久久久久末码| 国产毛片a区久久久久| 国产亚洲最大av| 日本一本二区三区精品| 日本wwww免费看| 最近的中文字幕免费完整| 高清午夜精品一区二区三区| 精品久久久久久久久av| 亚洲精品456在线播放app| 日本黄色片子视频| 欧美日韩国产亚洲二区| 欧美又色又爽又黄视频| or卡值多少钱| 久久草成人影院| 国内精品一区二区在线观看| 国产精品av视频在线免费观看| 97热精品久久久久久| 精品久久久久久成人av| 网址你懂的国产日韩在线| 国产一区二区在线观看日韩| 91精品伊人久久大香线蕉| 99久国产av精品| 日韩,欧美,国产一区二区三区 | 欧美性猛交╳xxx乱大交人| 一区二区三区免费毛片| 看免费成人av毛片| 国产精品一区二区三区四区久久| 免费看av在线观看网站| 欧美又色又爽又黄视频| 在线免费观看不下载黄p国产| 日本黄色视频三级网站网址| 亚洲av熟女| 欧美高清成人免费视频www| 亚洲精品色激情综合| 亚洲美女搞黄在线观看| 免费播放大片免费观看视频在线观看 | 国产色婷婷99| 日韩欧美三级三区| 观看免费一级毛片| 美女国产视频在线观看| 99久久成人亚洲精品观看| av国产免费在线观看| 在线免费观看不下载黄p国产| 国产极品精品免费视频能看的| 天天躁日日操中文字幕| 亚洲国产精品合色在线| 免费观看性生交大片5| 97超碰精品成人国产| 国产成人精品婷婷| 中文字幕久久专区| 亚洲av成人av| 亚洲人成网站高清观看| 日韩三级伦理在线观看| 真实男女啪啪啪动态图| 国产精品,欧美在线| 亚洲欧美精品综合久久99| 日本五十路高清| 成人av在线播放网站| 高清午夜精品一区二区三区| 一本久久精品| av.在线天堂| 国产成人a∨麻豆精品| 国产成人freesex在线| or卡值多少钱| 欧美变态另类bdsm刘玥| 九九热线精品视视频播放| 色噜噜av男人的天堂激情| 免费在线观看成人毛片| 亚洲精品日韩在线中文字幕| 热99re8久久精品国产| 欧美精品一区二区大全| 大香蕉97超碰在线| 在线天堂最新版资源| 欧美成人a在线观看| 日韩国内少妇激情av| 18禁在线播放成人免费| 国产午夜精品论理片| 欧美性猛交黑人性爽| 夜夜爽夜夜爽视频| 国产av不卡久久| 99热这里只有是精品50| 国产精品人妻久久久影院| videos熟女内射| 久久久成人免费电影| 亚洲美女搞黄在线观看| 国产精品久久久久久精品电影| 亚洲欧美精品综合久久99| 国产真实伦视频高清在线观看| 国产乱来视频区| 午夜日本视频在线| 国产中年淑女户外野战色| 亚洲精品aⅴ在线观看| 亚洲av免费高清在线观看| 你懂的网址亚洲精品在线观看 | 国产爱豆传媒在线观看| 国产人妻一区二区三区在| 成人毛片60女人毛片免费| 亚洲四区av| 欧美三级亚洲精品| 久久久久网色| 精品人妻偷拍中文字幕| 51国产日韩欧美| 22中文网久久字幕| 亚洲欧美一区二区三区国产| 日韩av不卡免费在线播放| 亚洲成人久久爱视频| 国产精品综合久久久久久久免费| 日韩 亚洲 欧美在线| 在线观看av片永久免费下载| 久久精品夜色国产| 免费看a级黄色片| 麻豆乱淫一区二区| 亚洲欧美日韩无卡精品| 午夜精品国产一区二区电影 | 在线观看66精品国产| 亚洲婷婷狠狠爱综合网| 九九在线视频观看精品| 男人和女人高潮做爰伦理| 大话2 男鬼变身卡| 午夜爱爱视频在线播放| 国产亚洲5aaaaa淫片| 麻豆成人午夜福利视频| 九草在线视频观看| 内射极品少妇av片p| 亚洲中文字幕日韩| 国产精品一及| 免费黄色在线免费观看| av福利片在线观看| 中国国产av一级| 色尼玛亚洲综合影院| 国产爱豆传媒在线观看| 毛片一级片免费看久久久久| 久久久欧美国产精品| 久久久成人免费电影| 亚洲欧美一区二区三区国产| 老司机影院毛片| 1000部很黄的大片| 一夜夜www| 国产免费又黄又爽又色| 婷婷色综合大香蕉| 日韩亚洲欧美综合| 亚洲最大成人中文| 精品久久国产蜜桃| 日本三级黄在线观看| 国产午夜精品久久久久久一区二区三区| 一边摸一边抽搐一进一小说| h日本视频在线播放| 视频中文字幕在线观看| 男女那种视频在线观看| 久久久久久久久久黄片| 看片在线看免费视频| 舔av片在线| 搞女人的毛片| 日本午夜av视频| 精品99又大又爽又粗少妇毛片| 久久这里只有精品中国| 成人美女网站在线观看视频| 91久久精品国产一区二区三区| 在线播放无遮挡| 天美传媒精品一区二区| h日本视频在线播放| 一区二区三区乱码不卡18| 插逼视频在线观看| 好男人在线观看高清免费视频| 久久热精品热| 超碰97精品在线观看| 色噜噜av男人的天堂激情| 久久精品国产鲁丝片午夜精品| 日韩大片免费观看网站 | 午夜福利高清视频| 美女高潮的动态| 日韩中字成人| 久久久久久久国产电影| 亚洲av男天堂| 国产淫语在线视频| av在线天堂中文字幕| 日韩,欧美,国产一区二区三区 | ponron亚洲| 精品无人区乱码1区二区| 精品人妻视频免费看| 国产精品久久久久久久久免| 搡女人真爽免费视频火全软件| 中文字幕人妻熟人妻熟丝袜美| 亚洲18禁久久av| 国产精品野战在线观看| 亚洲av一区综合| 亚洲,欧美,日韩| 99久久无色码亚洲精品果冻| 永久网站在线| a级毛色黄片| 26uuu在线亚洲综合色| av线在线观看网站| 一边亲一边摸免费视频| 国产亚洲精品av在线| 欧美激情在线99| 高清午夜精品一区二区三区| 三级毛片av免费| 91av网一区二区| 精品久久久久久久久久久久久| 亚洲自偷自拍三级| 尾随美女入室| 国产成人a∨麻豆精品| 国产午夜福利久久久久久| 欧美xxxx性猛交bbbb| 美女大奶头视频| av黄色大香蕉| 成人特级av手机在线观看| 91狼人影院| 性插视频无遮挡在线免费观看| 午夜福利在线观看免费完整高清在| 最近2019中文字幕mv第一页| 日韩中字成人| 欧美一级a爱片免费观看看| 亚洲最大成人av| 国产毛片a区久久久久| 午夜福利视频1000在线观看| 2022亚洲国产成人精品| 午夜精品国产一区二区电影 | 成人毛片a级毛片在线播放| 久久精品国产亚洲网站| 国产伦精品一区二区三区视频9| 国产综合懂色| 少妇的逼好多水| 欧美+日韩+精品| 久久午夜福利片| 国产高潮美女av| 好男人在线观看高清免费视频| 大话2 男鬼变身卡| 国产精品女同一区二区软件| 春色校园在线视频观看| av黄色大香蕉| 国产欧美日韩精品一区二区| 亚洲国产欧美在线一区| 国产在视频线在精品| 高清日韩中文字幕在线| 在线播放国产精品三级| 国产精品久久久久久精品电影| 亚洲图色成人| 精品一区二区免费观看| 高清在线视频一区二区三区 | 菩萨蛮人人尽说江南好唐韦庄 | 看十八女毛片水多多多| 91久久精品国产一区二区成人| 日韩国内少妇激情av| 我要搜黄色片| 麻豆成人av视频| 美女xxoo啪啪120秒动态图| 免费av观看视频| 亚洲精品国产成人久久av| 亚洲av中文字字幕乱码综合| 亚洲国产欧美人成| 国产欧美日韩精品一区二区| 日本猛色少妇xxxxx猛交久久| 亚洲三级黄色毛片| 一边亲一边摸免费视频| 青春草视频在线免费观看| 五月玫瑰六月丁香| 精品久久久噜噜| 欧美精品国产亚洲| 久久久精品大字幕| 久久人人爽人人爽人人片va| 联通29元200g的流量卡| 国产精品三级大全| 少妇的逼水好多| 最近视频中文字幕2019在线8| 亚洲人成网站在线观看播放| 欧美精品国产亚洲| 亚洲在久久综合| 插阴视频在线观看视频| 国产亚洲5aaaaa淫片| 天堂影院成人在线观看| 亚洲av电影在线观看一区二区三区 | 色视频www国产| 国产私拍福利视频在线观看| av在线亚洲专区| 久久久久九九精品影院| 日本五十路高清| 天堂影院成人在线观看| 99九九线精品视频在线观看视频| 中文亚洲av片在线观看爽| 麻豆乱淫一区二区| 我的女老师完整版在线观看| 欧美日韩国产亚洲二区| 大香蕉97超碰在线| 免费观看a级毛片全部| 久久久精品大字幕| av视频在线观看入口| 日韩欧美 国产精品| 国产91av在线免费观看| 色综合站精品国产| 成人亚洲欧美一区二区av| 日韩一区二区三区影片| 国产精品国产三级国产av玫瑰| 久久久久免费精品人妻一区二区| 一区二区三区乱码不卡18| 国产三级在线视频| 国产成人a区在线观看| 久久99热这里只频精品6学生 | 综合色丁香网| 精品酒店卫生间| 免费观看人在逋| 国产黄色视频一区二区在线观看 | 偷拍熟女少妇极品色| 中国美白少妇内射xxxbb| 免费观看人在逋| 久久鲁丝午夜福利片| 欧美xxxx黑人xx丫x性爽| 中文亚洲av片在线观看爽| 午夜精品在线福利| 22中文网久久字幕| 桃色一区二区三区在线观看| eeuss影院久久| 精品人妻一区二区三区麻豆| 又粗又硬又长又爽又黄的视频| 午夜视频国产福利| 亚洲最大成人av| 久久久久国产网址| videossex国产| 国产精品一区二区性色av| 国产中年淑女户外野战色| 亚洲国产精品sss在线观看| 中文字幕免费在线视频6| 色吧在线观看| 精品国内亚洲2022精品成人| 久久久精品欧美日韩精品| 亚洲欧美日韩东京热| 欧美成人一区二区免费高清观看| 日本黄色视频三级网站网址| 久99久视频精品免费| 国产av在哪里看| 一卡2卡三卡四卡精品乱码亚洲| 亚洲av.av天堂| 国产 一区 欧美 日韩| 免费看美女性在线毛片视频| 永久免费av网站大全| 色尼玛亚洲综合影院| 青青草视频在线视频观看| 1000部很黄的大片| 久久久久久久久久久丰满| 一级毛片久久久久久久久女| 人妻夜夜爽99麻豆av| 直男gayav资源| 日本免费a在线| 国产精品综合久久久久久久免费| 99久久成人亚洲精品观看| 赤兔流量卡办理| 18禁裸乳无遮挡免费网站照片| 日本色播在线视频| 赤兔流量卡办理| 2021少妇久久久久久久久久久| 久久久久精品久久久久真实原创| 国产亚洲精品av在线| 久久久久网色| 国产精品久久久久久精品电影| 精品少妇黑人巨大在线播放 | 欧美日韩精品成人综合77777| 少妇的逼水好多| 亚洲av免费高清在线观看| 搡女人真爽免费视频火全软件| 国产午夜精品论理片| 国产人妻一区二区三区在| 国产精品一及| 黄色一级大片看看| 韩国高清视频一区二区三区|