• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于指針網(wǎng)絡(luò)融入混淆集知識(shí)的中文語(yǔ)法糾錯(cuò)

    2022-06-18 01:58:54李嘉誠(chéng)沈嘉鈺李正華
    中文信息學(xué)報(bào) 2022年4期
    關(guān)鍵詞:指針字符基準(zhǔn)

    李嘉誠(chéng),沈嘉鈺,龔 晨,李正華,張 民

    (蘇州大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,江蘇 蘇州 215006)

    0 引言

    中文文本糾錯(cuò)任務(wù)可分為兩類: 拼寫(xiě)糾錯(cuò)和語(yǔ)法糾錯(cuò)。對(duì)于拼寫(xiě)糾錯(cuò),錯(cuò)誤句子只存在替換類錯(cuò)誤;而對(duì)于語(yǔ)法糾錯(cuò),除了替換類錯(cuò)誤,錯(cuò)誤句子還存在冗余、缺失以及亂序等錯(cuò)誤類型。本文聚焦于中文語(yǔ)法糾錯(cuò)(Chinese Grammatical Error Correction,CGEC)任務(wù),該任務(wù)旨在通過(guò)自然語(yǔ)言處理技術(shù),自動(dòng)糾正包含語(yǔ)法錯(cuò)誤的中文句子。中文語(yǔ)法糾錯(cuò)任務(wù)的示例如表1所示,其中,X是一個(gè)可能包含語(yǔ)法錯(cuò)誤的句子,Y是糾正錯(cuò)誤后的句子。

    表1 中文語(yǔ)法糾錯(cuò)任務(wù)的示例

    不像之前的很多研究[1-2]把語(yǔ)法糾錯(cuò)看作自回歸的翻譯任務(wù),本文以Seq2Eidt語(yǔ)法糾錯(cuò)模型[3-4]為基準(zhǔn)模型,該模型把語(yǔ)法糾錯(cuò)看作非自回歸的序列標(biāo)注任務(wù),從而大幅提升了解碼速度。Seq2Edit語(yǔ)法糾錯(cuò)模型以BERT[5]為上下文特征提取器,糾錯(cuò)過(guò)程如表1所示。首先,它為輸入句子X(jué)預(yù)測(cè)一組字級(jí)別的編輯序列Z;進(jìn)而把編輯序列Z作用于輸入句子得到目標(biāo)句子Y。在訓(xùn)練前,該模型需要把訓(xùn)練集中平行句對(duì)的正確句子預(yù)處理成一組與錯(cuò)誤句子對(duì)應(yīng)的編輯序列。

    如表2所示,本文列出了不同錯(cuò)誤類型在NLPCC 2018 GEC任務(wù)測(cè)試集中的數(shù)量[6],可以看出替換類錯(cuò)誤在所有錯(cuò)誤類型中的占比最多,大約占了50%。同時(shí),Liu等[7]的工作表明,中文中超過(guò)90%的替換類錯(cuò)誤由音近或形近字之間的誤用導(dǎo)致。因此,字符之間的音近、形近知識(shí)對(duì)解決替換類錯(cuò)誤非常重要。

    表2 不同錯(cuò)誤類型在NLPCC 2018 GEC任務(wù)測(cè)試集中的數(shù)量

    在中文拼寫(xiě)糾錯(cuò)研究中,很多研究者嘗試以混淆集(Confusion set)的形式,將字符之間的音近、形近知識(shí)融入到模型中[8-9],取得了不錯(cuò)的效果?;煜梢恍h字以及每個(gè)漢字對(duì)應(yīng)的一組音近和形近字組成。例如,“乞”對(duì)應(yīng)的音近字混淆集為“起杞啟豈稽……”;“乞”對(duì)應(yīng)的形近字混淆集為“疙吃屹迄乙……”。而對(duì)于中文語(yǔ)法糾錯(cuò),雖然替換類錯(cuò)誤在中文語(yǔ)法糾錯(cuò)數(shù)據(jù)集中占比最多,但還沒(méi)有研究者嘗試過(guò)將混淆集知識(shí)融入基于神經(jīng)網(wǎng)絡(luò)的語(yǔ)法糾錯(cuò)模型中。

    為了更好地解決語(yǔ)法糾錯(cuò)中的替換類錯(cuò)誤,本文嘗試在模型和預(yù)處理兩部分融入混淆集知識(shí)。在模型部分,本文提出一個(gè)基于指針網(wǎng)絡(luò)融入混淆集知識(shí)的語(yǔ)法糾錯(cuò)模型。該模型在Seq2Eidt語(yǔ)法糾錯(cuò)模型基礎(chǔ)上,利用指針網(wǎng)絡(luò)[10]融入漢字之間的音近和形近知識(shí)。具體來(lái)說(shuō),模型分別計(jì)算兩部分的概率分布,第一部分是Seq2Edit語(yǔ)法糾錯(cuò)模型輸出當(dāng)前字符在固定的編輯操作表中生成編輯的概率分布,第二部分是通過(guò)指針網(wǎng)絡(luò)去計(jì)算當(dāng)前字符替換為它對(duì)應(yīng)混淆集中字符的替換編輯的概率分布,然后通過(guò)一個(gè)可學(xué)習(xí)的門(mén)控機(jī)制加權(quán)求和兩部分的概率分布得到最終的概率分布。通過(guò)這種方法,模型可以充分考慮符號(hào)空間(混淆集中音近和形近知識(shí))和語(yǔ)義空間(BERT的語(yǔ)義知識(shí)),從而更好地糾正替換類錯(cuò)誤。

    在預(yù)處理部分,即從錯(cuò)誤-正確句對(duì)抽取編輯序列的過(guò)程中,本文發(fā)現(xiàn)普通的編輯距離算法不能很好地對(duì)齊中文語(yǔ)法糾錯(cuò)數(shù)據(jù)集中平行句對(duì)出現(xiàn)連續(xù)錯(cuò)誤時(shí)的音近和形近字。因此,本文也提出了一種混淆集的編輯距離算法。利用該算法在預(yù)處理階段抽取編輯,可以使得模型在訓(xùn)練過(guò)程中增加更多音近和形近字的替換類編輯,從而更好地糾正替換類錯(cuò)誤。

    實(shí)驗(yàn)結(jié)果表明,本文的基準(zhǔn)Seq2Edit語(yǔ)法糾錯(cuò)模型已經(jīng)在NLPCC 2018評(píng)測(cè)數(shù)據(jù)集上達(dá)到了目前最優(yōu)性能。而本文提出的兩點(diǎn)改進(jìn)均能在此基礎(chǔ)上提高性能,且作用互補(bǔ)。最終,本文所提出的模型在NLPCC 2018評(píng)測(cè)數(shù)據(jù)集上的F0.5值比之前的最優(yōu)性能提高了2.1。本文用中文ERRANT[11]工具對(duì)提出的模型和基準(zhǔn)模型不同錯(cuò)誤類型的得分進(jìn)行了分析,證明了本文模型的性能提升大部分來(lái)自于替換類錯(cuò)誤的糾正。

    本文主要的貢獻(xiàn)總結(jié)如下:

    (1) 本文提出一個(gè)基于指針網(wǎng)絡(luò)融入混淆集知識(shí)的語(yǔ)法糾錯(cuò)模型,該模型可以有效融入音近、形近信息,更好地解決語(yǔ)法糾錯(cuò)中的替換類錯(cuò)誤。據(jù)我們所知,這是首次將混淆集知識(shí)融入基于神經(jīng)網(wǎng)絡(luò)的語(yǔ)法糾錯(cuò)模型中的工作。

    (2) 本文提出一種混淆集指導(dǎo)的編輯距離算法,該算法可以融入音近、形近知識(shí)去更好地對(duì)齊訓(xùn)練集中音近、形近字的替換類編輯,從而幫助模型更好地糾正替換類錯(cuò)誤。

    (3) 實(shí)驗(yàn)結(jié)果表明,本文提出的模型在NLPCC 2018評(píng)測(cè)數(shù)據(jù)集上達(dá)到目前最優(yōu)性能。實(shí)驗(yàn)分析表明,和基準(zhǔn)Seq2Edit語(yǔ)法糾錯(cuò)模型相比,本文模型的性能提升大部分來(lái)自于替換類錯(cuò)誤的糾正。

    1 相關(guān)工作

    1.1 中文語(yǔ)法糾錯(cuò)

    2018年,CCF國(guó)際自然語(yǔ)言處理與中文計(jì)算會(huì)議(NLPCC)舉辦了中文語(yǔ)法糾錯(cuò)競(jìng)賽[12]。該競(jìng)賽發(fā)布了一個(gè)中文語(yǔ)法糾錯(cuò)任務(wù)的標(biāo)準(zhǔn)數(shù)據(jù)集。下面介紹研究者們?cè)谠摂?shù)據(jù)集上的最新工作,王等[1]采用基于多頭注意力機(jī)制的Transformer模型作為基準(zhǔn)模型,提出一種動(dòng)態(tài)殘差結(jié)構(gòu)來(lái)增強(qiáng)Transformer挖掘文本語(yǔ)義信息的能力,從而更好地糾正中文語(yǔ)法錯(cuò)誤。Zhao和Wang[2]在訓(xùn)練過(guò)程中采用動(dòng)態(tài)的詞頻、同音等替換策略作用于錯(cuò)誤句子,從而得到更多的錯(cuò)誤-正確句對(duì)來(lái)提高模型的泛化能力,該方法在NLPCC 2018評(píng)測(cè)數(shù)據(jù)集上達(dá)到了目前的最優(yōu)性能。Hinson等[13]結(jié)合了三個(gè)模型循環(huán)糾正包含語(yǔ)法錯(cuò)誤的句子,三個(gè)模型分別為: 基于Transformer的Seq2Seq模型,基于LaserTagger[14]的Seq2Edit模型和拼寫(xiě)糾正模型。同時(shí),他們還開(kāi)發(fā)出中文的ERRANT[11]工具,該工具可以給出模型在不同錯(cuò)誤類型的得分。在后續(xù)的實(shí)驗(yàn)部分,把本文提出的模型與上述工作進(jìn)行了性能上的對(duì)比。

    在中文語(yǔ)法糾錯(cuò)研究中,語(yǔ)法糾錯(cuò)模型主要分為兩種,序列到序列(Seq2Seq)模型和序列到編輯(Seq2Edit)模型。由于Seq2Seq模型存在解碼速度慢、需要大量的訓(xùn)練數(shù)據(jù)等問(wèn)題,本文采用Seq2Edit模型來(lái)完成中文語(yǔ)法糾錯(cuò)任務(wù)。最近,研究者們嘗試引入英文中的Seq2Edit模型到中文語(yǔ)法糾錯(cuò)任務(wù)中。例如,Hinson等[13]將英文中的Seq2Edit模型LaserTagger[14]引入中文,該模型結(jié)合BERT編碼器與一個(gè)自回歸的Transformer解碼器來(lái)預(yù)測(cè)編輯。Liang等[4]在中文語(yǔ)法錯(cuò)誤診斷(Chinese Grammatical Error Diagnosis, CGED)[15]競(jìng)賽中首次將英文中的Seq2Edit模型GECToR[3]引入到中文。該模型結(jié)合BERT編碼器與非自回歸的線性變化層去預(yù)測(cè)編輯。因?yàn)镚ECToR模型簡(jiǎn)單并且效果好,本文采用它作為本文的基準(zhǔn)模型。

    1.2 文本糾錯(cuò)中使用混淆集的方法

    在中文拼寫(xiě)糾錯(cuò)研究中,為了解決音近和形近字的誤用,很多研究者嘗試去融入混淆集知識(shí)到模型中。Wang等[8]提出一個(gè)帶有指針網(wǎng)絡(luò)的Seq2Seq模型來(lái)解決拼寫(xiě)糾錯(cuò)問(wèn)題,該模型要么通過(guò)指針網(wǎng)絡(luò)從輸入句子中復(fù)制一個(gè)字,要么從當(dāng)前字符對(duì)應(yīng)的混淆集中選擇一個(gè)字,這種方法是利用混淆集去限制解碼空間。Cheng等[9]提出了SpellGCN模型,利用圖卷積神經(jīng)網(wǎng)絡(luò)(GCN)去注入字符之間的音近和形近知識(shí)到語(yǔ)言模型(BERT)中進(jìn)行拼寫(xiě)糾錯(cuò)任務(wù)。

    在語(yǔ)法糾錯(cuò)研究中,研究者們也探索了將混淆集融入基于統(tǒng)計(jì)機(jī)器學(xué)習(xí)的語(yǔ)法糾錯(cuò)模型的方法。在基于語(yǔ)言模型的語(yǔ)法糾錯(cuò)模型中,Bryant和Briscoe[16]在生成候選答案時(shí),針對(duì)時(shí)態(tài)、冠詞、介詞等錯(cuò)誤,使用混淆集來(lái)生成候選答案。再用統(tǒng)計(jì)語(yǔ)言模型來(lái)評(píng)估糾正是否合理。在基于分類的語(yǔ)法糾錯(cuò)模型[17]中,給定一個(gè)存在語(yǔ)法錯(cuò)誤的句子,對(duì)于句子中每一個(gè)存在于混淆集中的詞,分類器根據(jù)當(dāng)前位置的上下文特征,選擇在混淆集中且概率最大的候選單詞。以上將混淆集融入語(yǔ)法糾錯(cuò)模型的方法,都只針對(duì)特定的錯(cuò)誤類型,并且采用的都是基于統(tǒng)計(jì)機(jī)器學(xué)習(xí)的模型。

    目前還沒(méi)有研究者嘗試過(guò)融入混淆集知識(shí)到基于神經(jīng)網(wǎng)絡(luò)的語(yǔ)法糾錯(cuò)模型中來(lái)解決語(yǔ)法糾錯(cuò)數(shù)據(jù)集中占比最多的替換類錯(cuò)誤。因此,本文提出一個(gè)基于指針網(wǎng)絡(luò)融入混淆集知識(shí)的語(yǔ)法糾錯(cuò)模型。該模型在Seq2Eidt語(yǔ)法糾錯(cuò)模型基礎(chǔ)上,利用指針網(wǎng)絡(luò)融入漢字之間的音近和形近知識(shí)。

    1.3 指針網(wǎng)絡(luò)

    指針網(wǎng)絡(luò)[10]被廣泛應(yīng)用在采用Seq2Seq模型的文本摘要任務(wù)[18]中。因?yàn)檎Z(yǔ)法糾錯(cuò)任務(wù)中大部分的字符都是正確的,Zhao等[19]首次將指針網(wǎng)絡(luò)應(yīng)用到基于Seq2Seq的語(yǔ)法糾錯(cuò)中,使得模型可以直接從輸入的句子中復(fù)制正確的字到輸出,取得了不錯(cuò)的效果。本文將指針網(wǎng)絡(luò)引入到Seq2Edit語(yǔ)法糾錯(cuò)模型中,利用指針網(wǎng)絡(luò)從當(dāng)前字符的混淆集中選擇字來(lái)進(jìn)行替換,使得模型可以更好地糾正替換類錯(cuò)誤。

    2 方法

    2.1 問(wèn)題定義

    中文語(yǔ)法糾錯(cuò)的目的是糾正中文句子中存在的語(yǔ)法錯(cuò)誤。給定一個(gè)可能包含語(yǔ)法錯(cuò)誤的中文句子X(jué)=(x1,x2,…,xm),xi指句子X(jué)的第i個(gè)字,語(yǔ)法糾錯(cuò)模型輸出一個(gè)句子Y=(y1,y2,…,yn),yi指句子Y中的第i個(gè)字。X和Y的長(zhǎng)度可以相等,也可以不相等。本文采用非自回歸的Seq2Edit語(yǔ)法糾錯(cuò)模型來(lái)解決中文語(yǔ)法糾錯(cuò)問(wèn)題。

    2.2 基準(zhǔn)Seq2Edit語(yǔ)法糾錯(cuò)模型

    在Seq2Edit語(yǔ)法糾錯(cuò)模型中,輸入句子X(jué)=(x1,x2,…,xm),模型輸出一組與X對(duì)應(yīng)的編輯Z=(z1,z2,…,zm),zi∈Φ,是xi對(duì)應(yīng)的編輯。Φ是編輯操作表,所有編輯操作表的統(tǒng)計(jì)信息如表3所示。

    表3 Seq2Edit語(yǔ)法糾錯(cuò)模型編輯操作表

    該模型采用BERT作為上下文特征提取器,輸入是可能包含語(yǔ)法錯(cuò)誤的句子X(jué)=(x1,x2,…,xm),用BERT編碼句子X(jué)后,把BERT最后一層的輸出作為整個(gè)句子上下文相關(guān)的字表示向量H={h1,h2,…,hm},再把xi對(duì)應(yīng)的字表示向量hi經(jīng)過(guò)一個(gè)線性變換層和softmax操作去預(yù)測(cè)當(dāng)前第i個(gè)字的編輯為z的概率p(z|X,i),如式(1)、式(2)所示。

    其中,hi∈db。Ws∈db×|Φ|,bs∈|Φ|分別是線性變化層的權(quán)重矩陣和偏置向量。si,z是第i個(gè)字的編輯預(yù)測(cè)為z的得分。Φ是所有可能的編輯操作集合,z′是Φ中的編輯。db是BERT的隱藏層維度。如式(3)所示,損失函數(shù)選擇交叉熵,是正確編輯序列中的第i個(gè)編輯。

    (3)

    如圖1所示,該模型解碼時(shí)采用迭代式糾正[20]: 把模型預(yù)測(cè)的編輯序列Z作用于輸入句子X(jué)得到輸出句子Y,再把Y當(dāng)作輸入重新送入模型,重復(fù)這個(gè)過(guò)程直到達(dá)到最大迭代次數(shù)或者模型輸出的句子與輸入句子一致時(shí)。

    圖1 基準(zhǔn)Seq2Edit語(yǔ)法糾錯(cuò)模型

    2.3 基于指針網(wǎng)絡(luò)融入混淆集知識(shí)的語(yǔ)法糾錯(cuò)模型

    混淆集由一些漢字以及每個(gè)漢字對(duì)應(yīng)的一組音近和形近字組成。本文定義C(xi)是xi對(duì)應(yīng)的一組混淆集字符。

    指針網(wǎng)絡(luò)被廣泛應(yīng)用在采用Seq2Seq模型的文本摘要任務(wù)和語(yǔ)法糾錯(cuò)任務(wù)中。因?yàn)槠淠軓目勺冮L(zhǎng)度的候選集合中去選擇一個(gè)候選項(xiàng),本文通過(guò)指針網(wǎng)絡(luò)去計(jì)算當(dāng)前字符替換為它對(duì)應(yīng)混淆集中字符的替換編輯的概率分布。

    如圖2所示,基于指針網(wǎng)絡(luò)融入混淆集知識(shí)的語(yǔ)法糾錯(cuò)模型在基準(zhǔn)Seq2Eidt語(yǔ)法糾錯(cuò)模型基礎(chǔ)上,利用指針網(wǎng)絡(luò)融入漢字之間的音近和形近知識(shí)。該模型除了從固定的編輯操作表中生成編輯外,還允許指針網(wǎng)絡(luò)從當(dāng)前字符的混淆集中選擇字進(jìn)行替換。如式(4)所示,最終編輯的概率分布p(z|X,i)是生成編輯的概率分布pgen(z|X,i) 和當(dāng)前字符替換為它對(duì)應(yīng)混淆集中字符的替換編輯的概率分布pcon(z|X,i)的加權(quán)求和,平衡因子αi∈[0,1]由一個(gè)可學(xué)習(xí)的門(mén)控機(jī)制來(lái)得到。

    (4)

    從固定編輯操作表中生成編輯的概率分布pgen(z|X,i)的計(jì)算公式和2.2節(jié)基準(zhǔn)Seq2Edit語(yǔ)法糾錯(cuò)模型相同。本文通過(guò)指針網(wǎng)絡(luò)來(lái)計(jì)算當(dāng)前字符替換為它對(duì)應(yīng)混淆集中的字符的替換編輯的概率分布pcon(z|X,i)。首先,如式(5)所示,將C(xi)中的字符通過(guò)字嵌入層得到向量表示Ei,Ei中的每一行是C(xi)中一個(gè)字符的字向量表示。其次,通過(guò)式(6)~式(8)來(lái)計(jì)算pcon(z|X,i)。

    圖2 基于指針網(wǎng)絡(luò)融入混淆集知識(shí)的語(yǔ)法糾錯(cuò)模型

    其中,hi∈db,是BERT編碼X得到的第i個(gè)字的上下文相關(guān)的字表示向量。Ei∈dl×dc,是第i個(gè)字的混淆集中字符的字向量表示。dl是當(dāng)前字符對(duì)應(yīng)混淆集中字符C(xi)的個(gè)數(shù),dc是字嵌入層的維度。qi是hi經(jīng)過(guò)線性變化層得到的查詢向量(Query),Ki和Vi是Ei經(jīng)過(guò)不同的線性變化層得到的鍵值向量(Key)和實(shí)值向量(Value)。qi和Ki點(diǎn)乘得到注意力分值si∈dl,再通過(guò)一個(gè)Softmax操作得到歸一化后的概率pcon(z|X,i),這里的z∈Φc(xi),Φc(xi)是將字符xi替換為xi的混淆集C(xi)中的字符的替換編輯集合,z′是Φc(xi)中的編輯。Wq∈db×dc,Wk、Wv∈dc×dc是線性變化層的權(quán)重矩陣。平衡因子αi的計(jì)算如式(9)所示。

    αi=sigmoid(softmax(si)Viwα+bα)

    (9)

    其中,wα∈dc,bα∈1分別是線性變化層的權(quán)重矩陣和偏置向量。損失函數(shù)選擇交叉熵,其公式與式(3)相同,不過(guò)式(3)中的概率需要替換為式(4)得到的最終編輯概率。

    2.4 混淆集指導(dǎo)的編輯距離算法

    本文使用訓(xùn)練集中的一個(gè)真實(shí)例子來(lái)描述混淆集指導(dǎo)的編輯距離算法抽取的編輯與普通的編輯距離算法抽取的編輯的差異,如表4所示。

    例1X: 每天漫漫得進(jìn)步。

    Y: 每天都在慢慢地進(jìn)步。

    表4展示了兩者抽取編輯的不同,其中如果一個(gè)字對(duì)應(yīng)多個(gè)編輯操作,則用“&”連接。對(duì)照X和Y,可以看出X存在兩個(gè)語(yǔ)法錯(cuò)誤,一個(gè)是缺失類錯(cuò)誤,缺少了“都在”,一個(gè)是音近導(dǎo)致的替換類錯(cuò)誤,“漫漫得”應(yīng)該被替換為“慢慢地”。自然而然我們希望編輯距離算法抽取的編輯可以很好地對(duì)齊兩類錯(cuò)誤。然而如表4上半部分所示,普通的編輯距離算法從X和Y抽取的編輯并沒(méi)有得到理想的對(duì)齊效果,究其原因,這是由于普通的對(duì)齊算法把“漫”和“慢”看作是兩個(gè)完全不一樣的字,導(dǎo)致“漫”和“都”與“漫”和“慢”在編輯距離算法中替換操作的代價(jià)一樣。

    表4 不同編輯距離算法抽取編輯的差異

    本文利用混淆集知識(shí)來(lái)指導(dǎo)編輯距離算法的抽取編輯過(guò)程,本文把混淆集中音近和形近字之間的替換操作代價(jià)設(shè)為0.5。(在普通的編輯距離算法中,兩個(gè)一樣的字的替換操作代價(jià)為0,而兩個(gè)不一樣的字的替換操作代價(jià)為1)。在混淆集指導(dǎo)的編輯距離算法下,表4上半部分的對(duì)齊方式X和Y的編輯距離為5,而表4下半部分的對(duì)齊方式X和Y的編輯距離為3.5,因此,混淆集指導(dǎo)的編輯距離算法選擇了下面更好的對(duì)齊方式。下面詳細(xì)描述抽取編輯的過(guò)程。

    Step1: 首先,本文使用混淆集指導(dǎo)的編輯距離算法來(lái)對(duì)齊源句子與目標(biāo)句子,為源句子的每個(gè)字找到目標(biāo)句子中的一個(gè)子序列與其對(duì)應(yīng)。[每→每],[天→天],[漫→都,在,慢],[漫→慢],[得→地],[進(jìn)→進(jìn)],[步→步]。

    Step2: 從源句子中的每個(gè)字對(duì)應(yīng)目標(biāo)句子的子序列中得到編輯。如果一個(gè)字對(duì)應(yīng)目標(biāo)句子的子序列有多個(gè)字,那么也會(huì)考慮源句子中的字與目標(biāo)句子的子序列每個(gè)字的編輯距離。[每→每]: KEEP,[天→天]: KEEP、A_都、A_在,[漫→都,在,慢]: R_慢,[漫→ 慢]: R_慢,[得→地]: R_地,[進(jìn)→進(jìn)]: KEEP,[步→步]: KEEP。

    Step3: 在訓(xùn)練時(shí),本文為源句子中的每個(gè)字只留下一個(gè)編輯,有多個(gè)編輯的,本文只留第一個(gè)非KEEP類的編輯,這樣本文得到每個(gè)字對(duì)應(yīng)的唯一的編輯操作。每: KEEP,天: A_都,漫: R_慢,漫: R_慢,得: R_地,進(jìn): KEEP,步: KEEP。

    3 實(shí)驗(yàn)

    3.1 數(shù)據(jù)集

    所有數(shù)據(jù)的統(tǒng)計(jì)信息如表5所示。

    表5 數(shù)據(jù)集統(tǒng)計(jì)信息

    3.1.1 訓(xùn)練集

    本文使用的訓(xùn)練集包括NLPCC 2018 GEC任務(wù)官方提供的Lang-8數(shù)據(jù)集以及HSK數(shù)據(jù)集,其中Lang-8數(shù)據(jù)集采集自Lang-8網(wǎng)站。Lang-8網(wǎng)站是一個(gè)多語(yǔ)言學(xué)習(xí)者平臺(tái),不同國(guó)家的學(xué)習(xí)者在該平臺(tái)練習(xí)寫(xiě)作,然后由母語(yǔ)者對(duì)他們的寫(xiě)作進(jìn)行修改。因?yàn)橐粋€(gè)句子可以由多個(gè)人修改,所以錯(cuò)誤句子可能對(duì)應(yīng)多個(gè)糾正答案。HSK數(shù)據(jù)集收集自北京語(yǔ)言大學(xué)構(gòu)建的動(dòng)態(tài)作文語(yǔ)料庫(kù)[21]。兩個(gè)數(shù)據(jù)集的平行語(yǔ)料共有1 377 776對(duì),本文去除數(shù)據(jù)集中錯(cuò)誤和正確句子一樣的句對(duì),剩余數(shù)據(jù)集包含1 186 934對(duì)。其中包括Lang-8數(shù)據(jù)1 095 835對(duì),HSK數(shù)據(jù)91 099對(duì)。本文從剩余語(yǔ)料中隨機(jī)選擇百分之一的數(shù)據(jù)共11 869對(duì)作為開(kāi)發(fā)集,其余的數(shù)據(jù)共1 175 065對(duì)作為本文的訓(xùn)練集。

    3.1.2 測(cè)試集

    本文選用NLPCC 2018 GEC任務(wù)的評(píng)測(cè)數(shù)據(jù)集來(lái)評(píng)測(cè)本文的模型,該數(shù)據(jù)集收集自PKU中文學(xué)習(xí)者語(yǔ)料庫(kù)。兩個(gè)標(biāo)注者遵循最小編輯距離的修改原則對(duì)其進(jìn)行了標(biāo)注,官方數(shù)據(jù)集包含錯(cuò)誤句子和M2格式的官方參考(Gold)編輯。

    3.1.3 混淆集

    本文采用SIGHAN 2013年比賽[22]提供的混淆集。主要有兩類: 音近字混淆集和形近字混淆集。本文將兩類混淆集合并、去重后作為一個(gè)混淆集來(lái)使用。

    3.2 評(píng)價(jià)指標(biāo)

    本文使用官方的MaxMatch[23]工具包去評(píng)測(cè)不同模型的性能,給出精確率、召回率和F0.5指標(biāo)。

    3.3 模型訓(xùn)練細(xì)節(jié)

    本文使用中文預(yù)訓(xùn)練模型BERT-wwm-ext[24]來(lái)初始化本文的編碼器,使用Adam優(yōu)化器來(lái)訓(xùn)練模型,共訓(xùn)練12個(gè)輪次,并應(yīng)用早停機(jī)制,當(dāng)開(kāi)發(fā)集的編輯預(yù)測(cè)精確率兩輪沒(méi)有提升就結(jié)束訓(xùn)練。在前兩輪,本文設(shè)置學(xué)習(xí)率為1e-3,并凍結(jié)BERT的參數(shù),只訓(xùn)練其余模塊的參數(shù)。在后面的輪次,本文設(shè)置學(xué)習(xí)率為1e-5,訓(xùn)練整個(gè)模型的參數(shù)。Batch size設(shè)置為128。對(duì)于所有的實(shí)驗(yàn),本文都更換隨機(jī)數(shù)種子進(jìn)行了4次實(shí)驗(yàn),并匯報(bào)平均結(jié)果。本文從訓(xùn)練集中統(tǒng)計(jì)出現(xiàn)頻率大于10次的編輯作為編輯操作表,共包含5 498個(gè)編輯。在預(yù)測(cè)時(shí),默認(rèn)的迭代次數(shù)為5。

    對(duì)于基于指針網(wǎng)絡(luò)融入混淆集的語(yǔ)法糾錯(cuò)模型,本文使用隨機(jī)初始化參數(shù)的200維字嵌入層作為混淆集中字符的字向量表示,并在訓(xùn)練過(guò)程進(jìn)行更新。其他訓(xùn)練細(xì)節(jié)和基準(zhǔn)Seq2Edit模型一致。

    3.4 基準(zhǔn)模型

    MaskGEC[2]: 該方法在訓(xùn)練過(guò)程中采用動(dòng)態(tài)的詞頻、同音等替換策略作用于錯(cuò)誤的句子上,從而得到更多的錯(cuò)誤-正確句對(duì)來(lái)訓(xùn)練模型。

    異構(gòu)循環(huán)預(yù)測(cè)模型[13]: 該方法使用基于Transformer的Seq2Seq模型,基于LaserTagger[14]的Seq2Edit模型和拼寫(xiě)糾正模型循環(huán)糾正錯(cuò)誤句子。

    Transformer增強(qiáng)架構(gòu)[1]: 該方法通過(guò)動(dòng)態(tài)殘差結(jié)構(gòu)來(lái)增強(qiáng)Transformer挖掘文本語(yǔ)義信息的能力。

    Seq2Edit模型[3]: 該方法采用非自回歸的Seq2Edit模型GECToR[3]來(lái)解決中文語(yǔ)法糾錯(cuò)任務(wù)。

    3.5 實(shí)驗(yàn)結(jié)果

    表6展示了本文提出的模型與其他先進(jìn)的模型在NLPCC 2018評(píng)測(cè)數(shù)據(jù)集上的得分。與其他模型相比,本文的基準(zhǔn)Seq2Edit模型已經(jīng)優(yōu)于上述所有工作,達(dá)到了目前的最優(yōu)性能。而本文的應(yīng)用了混淆集指導(dǎo)的編輯距離算法和基于指針網(wǎng)絡(luò)融入混淆集知識(shí)的模型的F0.5值比基準(zhǔn)Seq2Edit模型又高了0.73。MaskGEC[2]利用了Lang-8訓(xùn)練集,但在訓(xùn)練過(guò)程中動(dòng)態(tài)地采用詞頻、同音等替換策略應(yīng)用到錯(cuò)誤的句子上產(chǎn)生新的錯(cuò)誤-正確句對(duì)來(lái)訓(xùn)練模型,可以看作一種數(shù)據(jù)增強(qiáng)的手段。異構(gòu)循環(huán)預(yù)測(cè)模型[13]利用了Lang-8訓(xùn)練集,采用了基于Transformer的Seq2Seq模型,基于LaserTagger[14]的Seq2Edit模型和拼寫(xiě)糾正模型來(lái)循環(huán)糾正錯(cuò)誤句子。Transformer增強(qiáng)架構(gòu)[1]通過(guò)動(dòng)態(tài)殘差結(jié)構(gòu)來(lái)增強(qiáng)Transformer挖掘文本語(yǔ)義信息的能力,它們除了使用Lang-8和HSK的數(shù)據(jù),還使用了742萬(wàn)人造數(shù)據(jù),F(xiàn)0.5值達(dá)到了34.41,而本文沒(méi)有使用任何的人造數(shù)據(jù),性能就優(yōu)于它們。

    表6 不同糾錯(cuò)模型在NLPCC 2018 評(píng)測(cè)數(shù)據(jù)集上的結(jié)果比較

    3.6 不同改進(jìn)對(duì)模型性能的影響

    我們做了四組實(shí)驗(yàn)來(lái)驗(yàn)證本文方法的有效性。表7展示了不同改進(jìn)在NLPCC 2018評(píng)測(cè)數(shù)據(jù)集上的結(jié)果??梢钥闯龌鶞?zhǔn)Seq2Edit模型的F0.5值已經(jīng)達(dá)到了38.33,而本文提出的兩種改進(jìn)在此基礎(chǔ)上又有了一定的提升。

    第1組和第2組實(shí)驗(yàn)比較預(yù)處理階段采用普通的編輯距離算法和混淆集指導(dǎo)的編輯距離算法抽取編輯對(duì)性能的影響。使用不同的編輯距離算法抽取編輯,訓(xùn)練集中有39 003個(gè)句子抽取的編輯發(fā)生了改變,開(kāi)發(fā)集中有400個(gè)句子抽取的編輯發(fā)生了改變,大約占總數(shù)據(jù)的3.6%。如表7所示,相比采用普通的編輯距離算法抽取編輯的基準(zhǔn)Seq2Edit模型,本文使用混淆集指導(dǎo)的編輯距離算法預(yù)處理數(shù)據(jù)集后,基準(zhǔn)Seq2Edit模型的F0.5值有0.21的提升。

    表7 不同改進(jìn)對(duì)模型性能的影響

    第1組和第3組實(shí)驗(yàn)比較基準(zhǔn)Seq2Edit模型和基于指針網(wǎng)絡(luò)融入混淆集知識(shí)的模型對(duì)性能的影響。由表7可以看出,基于指針網(wǎng)絡(luò)融入混淆集知識(shí)的模型比基準(zhǔn)Seq2Edit模型的F0.5值提高了0.44。

    最后,第4組實(shí)驗(yàn)在預(yù)處理階段采用混淆集指導(dǎo)的編輯距離算法抽取編輯,模型采用基于指針網(wǎng)絡(luò)融入混淆集知識(shí)的模型。其F0.5值達(dá)到了39.06,比基準(zhǔn)Seq2Edit模型提高了0.73。混淆集指導(dǎo)的編輯距離算法更好地對(duì)齊了音近和形近字的替換類編輯,使得基于指針網(wǎng)絡(luò)融入混淆集知識(shí)的模型得到了更充分的訓(xùn)練,從而超過(guò)了兩者單獨(dú)相加提高的性能。

    3.7 對(duì)不同錯(cuò)誤類型的影響

    為了證明本文提出的模型可以比基準(zhǔn)Seq2Edit模型更好地解決語(yǔ)法糾錯(cuò)任務(wù)中的替換類錯(cuò)誤。本文采用Hinson等[13]開(kāi)發(fā)的中文ERRANT工具對(duì)本文提出的模型和基準(zhǔn)Seq2Edit模型不同錯(cuò)誤類型的糾錯(cuò)能力進(jìn)行了分析。圖3展示了本文的模型和基準(zhǔn)Seq2Edit模型在不同錯(cuò)誤類型的TP和FP值,其中TP表示模型預(yù)測(cè)正確的編輯數(shù)量,F(xiàn)P表示模型預(yù)測(cè)錯(cuò)誤的編輯數(shù)量。從圖3(a)可以看出,整體來(lái)看,本文的模型比基準(zhǔn)Seq2Edit模型多了32個(gè)預(yù)測(cè)正確的編輯。具體到替換類錯(cuò)誤,本文的模型比基準(zhǔn)Seq2Edit模型多了26個(gè)預(yù)測(cè)正確的編輯,占了整體的81.25%。從圖3(b)可以看出,整體來(lái)看,本文的模型比基準(zhǔn)Seq2Edit模型少了62個(gè)預(yù)測(cè)錯(cuò)誤的編輯。具體到替換類錯(cuò)誤,本文的模型比基準(zhǔn)Seq2Edit模型少了29個(gè)預(yù)測(cè)錯(cuò)誤的編輯,占了整體的46.77%。因此,本文模型的性能提升大部分都來(lái)自于替換類錯(cuò)誤的糾正。

    圖3 本文的模型與基準(zhǔn)Seq2Edit模型在不同錯(cuò)誤類型的TP和FP值

    4 總結(jié)

    為了更好地解決語(yǔ)法糾錯(cuò)中占比最多的替換類錯(cuò)誤,本文嘗試在模型和預(yù)處理兩部分融入混淆集知識(shí)。在模型部分,本文提出了基于指針網(wǎng)絡(luò)融入混淆集知識(shí)的語(yǔ)法糾錯(cuò)模型。在預(yù)處理部分,本文提出了混淆集指導(dǎo)的編輯距離算法來(lái)更好地抽取音近和形近字的替換類編輯。實(shí)驗(yàn)證明,本文的模型在NLPCC 2018評(píng)測(cè)數(shù)據(jù)集上達(dá)到了目前最優(yōu)性能。進(jìn)一步的分析證明了本文的性能提升主要來(lái)自于替換類錯(cuò)誤的糾正。在未來(lái),本文計(jì)劃將基于指針網(wǎng)絡(luò)融入混淆集知識(shí)的模型遷移到拼寫(xiě)糾錯(cuò)任務(wù)。

    猜你喜歡
    指針字符基準(zhǔn)
    尋找更強(qiáng)的字符映射管理器
    字符代表幾
    一種USB接口字符液晶控制器設(shè)計(jì)
    電子制作(2019年19期)2019-11-23 08:41:50
    偷指針的人
    消失的殖民村莊和神秘字符
    為什么表的指針都按照順時(shí)針?lè)较蜣D(zhuǎn)動(dòng)
    明基準(zhǔn)講方法保看齊
    滑落還是攀爬
    基于改進(jìn)Hough變換和BP網(wǎng)絡(luò)的指針儀表識(shí)別
    ARM Cortex—MO/MO+單片機(jī)的指針變量替換方法
    18禁裸乳无遮挡动漫免费视频| 国产熟女欧美一区二区| 国产精品.久久久| 久久人妻熟女aⅴ| 国产成人精品无人区| 丝袜人妻中文字幕| 一区在线观看完整版| 少妇人妻 视频| 亚洲精品乱久久久久久| 黄色怎么调成土黄色| 美女大奶头黄色视频| 男女午夜视频在线观看| 国产淫语在线视频| 亚洲,欧美,日韩| 大陆偷拍与自拍| 久久久久久久久久久免费av| 精品国产乱码久久久久久男人| 国产有黄有色有爽视频| 亚洲国产精品一区二区三区在线| 不卡视频在线观看欧美| 国产一卡二卡三卡精品 | 涩涩av久久男人的天堂| 国产精品国产三级国产专区5o| av线在线观看网站| avwww免费| 精品一品国产午夜福利视频| 另类亚洲欧美激情| 国产av精品麻豆| 国产精品国产三级专区第一集| 制服诱惑二区| 大码成人一级视频| 综合色丁香网| bbb黄色大片| 亚洲综合色网址| 色视频在线一区二区三区| 2021少妇久久久久久久久久久| 飞空精品影院首页| 日本欧美视频一区| 亚洲成人国产一区在线观看 | 伊人久久大香线蕉亚洲五| 精品少妇一区二区三区视频日本电影 | 日韩成人av中文字幕在线观看| 国语对白做爰xxxⅹ性视频网站| 日韩中文字幕欧美一区二区 | 建设人人有责人人尽责人人享有的| 一级黄片播放器| 亚洲成人一二三区av| 嫩草影视91久久| 欧美黑人精品巨大| 成人亚洲精品一区在线观看| 久久国产精品大桥未久av| 国产男女超爽视频在线观看| 亚洲欧美一区二区三区黑人| 国产福利在线免费观看视频| 欧美亚洲 丝袜 人妻 在线| 久久精品久久久久久噜噜老黄| 一本色道久久久久久精品综合| 搡老乐熟女国产| 男男h啪啪无遮挡| 精品国产国语对白av| 下体分泌物呈黄色| 国产亚洲精品第一综合不卡| 亚洲第一青青草原| 欧美最新免费一区二区三区| 精品福利永久在线观看| 深夜精品福利| 性高湖久久久久久久久免费观看| 黄色视频不卡| 免费高清在线观看日韩| 欧美精品一区二区免费开放| 成年女人毛片免费观看观看9 | 久久久国产精品麻豆| 亚洲国产欧美一区二区综合| 大码成人一级视频| 婷婷色综合www| 亚洲美女搞黄在线观看| 深夜精品福利| 视频在线观看一区二区三区| 国产97色在线日韩免费| 国产99久久九九免费精品| 九色亚洲精品在线播放| 亚洲精品一区蜜桃| 少妇被粗大的猛进出69影院| 久久精品国产亚洲av高清一级| 亚洲国产av影院在线观看| 中文字幕最新亚洲高清| 毛片一级片免费看久久久久| 亚洲精品成人av观看孕妇| 国产av一区二区精品久久| 丝袜美腿诱惑在线| 亚洲熟女精品中文字幕| 欧美中文综合在线视频| 99久久综合免费| 建设人人有责人人尽责人人享有的| 男女无遮挡免费网站观看| 啦啦啦 在线观看视频| 中文天堂在线官网| 亚洲美女视频黄频| 成人18禁高潮啪啪吃奶动态图| 男人爽女人下面视频在线观看| 亚洲美女搞黄在线观看| a级片在线免费高清观看视频| 大话2 男鬼变身卡| 国产成人免费观看mmmm| 综合色丁香网| 黄网站色视频无遮挡免费观看| 国产又爽黄色视频| 午夜福利免费观看在线| 亚洲人成电影观看| 高清av免费在线| 亚洲精品国产av成人精品| 中文字幕亚洲精品专区| 国产成人一区二区在线| 国产精品 国内视频| 国产成人精品久久久久久| 亚洲七黄色美女视频| 精品国产乱码久久久久久小说| 国产精品欧美亚洲77777| 青春草亚洲视频在线观看| 超碰成人久久| 女的被弄到高潮叫床怎么办| 黄片小视频在线播放| 亚洲欧美一区二区三区黑人| 99热网站在线观看| 久久 成人 亚洲| 少妇 在线观看| 巨乳人妻的诱惑在线观看| 久久国产精品大桥未久av| 日本午夜av视频| 9色porny在线观看| 一级毛片我不卡| 国产精品久久久久久久久免| 国产午夜精品一二区理论片| 丝袜美腿诱惑在线| 性少妇av在线| 大片免费播放器 马上看| 久久久久国产精品人妻一区二区| 亚洲少妇的诱惑av| 欧美激情极品国产一区二区三区| 欧美亚洲 丝袜 人妻 在线| 久久久国产一区二区| 啦啦啦视频在线资源免费观看| 亚洲五月色婷婷综合| 在线观看一区二区三区激情| 岛国毛片在线播放| 亚洲av国产av综合av卡| 18禁裸乳无遮挡动漫免费视频| 午夜福利影视在线免费观看| 老司机影院成人| 嫩草影视91久久| 久久久国产欧美日韩av| 岛国毛片在线播放| 久久99一区二区三区| 日韩一卡2卡3卡4卡2021年| av国产精品久久久久影院| 国产精品一区二区精品视频观看| 无遮挡黄片免费观看| 欧美日韩综合久久久久久| 看非洲黑人一级黄片| av一本久久久久| 麻豆乱淫一区二区| 男人添女人高潮全过程视频| 成人亚洲欧美一区二区av| 欧美日韩一级在线毛片| 免费av中文字幕在线| 午夜91福利影院| 久久久久久人人人人人| 欧美人与善性xxx| 日韩av在线免费看完整版不卡| 2018国产大陆天天弄谢| 久久久久精品性色| 亚洲少妇的诱惑av| 午夜福利免费观看在线| 久久久精品国产亚洲av高清涩受| 久久99热这里只频精品6学生| 久热爱精品视频在线9| 男女无遮挡免费网站观看| 伊人亚洲综合成人网| 精品国产一区二区久久| av在线播放精品| 久久人人爽人人片av| 国产xxxxx性猛交| 高清黄色对白视频在线免费看| 色吧在线观看| 中文字幕精品免费在线观看视频| 嫩草影视91久久| 国产一区二区三区综合在线观看| 亚洲美女黄色视频免费看| 日韩成人av中文字幕在线观看| 国产精品国产三级国产专区5o| 久久国产精品男人的天堂亚洲| 国产成人精品福利久久| 又大又黄又爽视频免费| 精品一区在线观看国产| 亚洲自偷自拍图片 自拍| 欧美成人精品欧美一级黄| 亚洲精品一二三| a级毛片在线看网站| 国产精品 欧美亚洲| 97精品久久久久久久久久精品| kizo精华| 在线观看免费日韩欧美大片| av一本久久久久| 欧美精品亚洲一区二区| 巨乳人妻的诱惑在线观看| 亚洲七黄色美女视频| 亚洲综合色网址| 免费在线观看视频国产中文字幕亚洲 | 国产欧美亚洲国产| 18在线观看网站| 久久ye,这里只有精品| 在线免费观看不下载黄p国产| 午夜福利一区二区在线看| 国产精品久久久久久人妻精品电影 | 极品人妻少妇av视频| 好男人视频免费观看在线| 久久精品国产a三级三级三级| 大陆偷拍与自拍| 成年女人毛片免费观看观看9 | 看非洲黑人一级黄片| 午夜日韩欧美国产| 极品少妇高潮喷水抽搐| 欧美激情高清一区二区三区 | av在线app专区| 久久国产精品大桥未久av| 各种免费的搞黄视频| 女性被躁到高潮视频| 久久精品aⅴ一区二区三区四区| 天天躁夜夜躁狠狠久久av| 国产一区亚洲一区在线观看| 热99国产精品久久久久久7| 高清视频免费观看一区二区| 国产男女超爽视频在线观看| 十八禁人妻一区二区| 亚洲av成人精品一二三区| 亚洲,一卡二卡三卡| 国产亚洲av高清不卡| 国产午夜精品一二区理论片| 母亲3免费完整高清在线观看| 国产成人欧美在线观看 | 免费av中文字幕在线| 亚洲一区中文字幕在线| h视频一区二区三区| 亚洲精品久久久久久婷婷小说| 久久久久久久精品精品| 国产精品蜜桃在线观看| av有码第一页| 99热国产这里只有精品6| 天天躁日日躁夜夜躁夜夜| 国产野战对白在线观看| 国产免费福利视频在线观看| 熟女少妇亚洲综合色aaa.| 中文乱码字字幕精品一区二区三区| 日韩一区二区视频免费看| 最新的欧美精品一区二区| 两个人看的免费小视频| 18禁动态无遮挡网站| 在线天堂最新版资源| 高清av免费在线| 黄网站色视频无遮挡免费观看| 国产精品.久久久| 爱豆传媒免费全集在线观看| 在线 av 中文字幕| 久久精品熟女亚洲av麻豆精品| 午夜福利网站1000一区二区三区| 精品一区二区三区av网在线观看 | 国产日韩欧美亚洲二区| 国产女主播在线喷水免费视频网站| 美女扒开内裤让男人捅视频| 免费看av在线观看网站| 男女床上黄色一级片免费看| 别揉我奶头~嗯~啊~动态视频 | 久久99精品国语久久久| 亚洲情色 制服丝袜| 嫩草影视91久久| 香蕉丝袜av| 欧美精品av麻豆av| 成年av动漫网址| 精品国产露脸久久av麻豆| 熟女少妇亚洲综合色aaa.| 一二三四在线观看免费中文在| 亚洲精品久久成人aⅴ小说| 91精品三级在线观看| 亚洲av成人精品一二三区| 久久久久精品国产欧美久久久 | 国产成人精品在线电影| 熟女少妇亚洲综合色aaa.| 超碰97精品在线观看| 国产高清不卡午夜福利| 久久久久国产一级毛片高清牌| 国产精品一二三区在线看| 性高湖久久久久久久久免费观看| 精品午夜福利在线看| 日韩中文字幕欧美一区二区 | 伊人亚洲综合成人网| 久久久久久久精品精品| 在线观看人妻少妇| 母亲3免费完整高清在线观看| 人人澡人人妻人| 国产亚洲av片在线观看秒播厂| 亚洲一区二区三区欧美精品| 久久精品久久精品一区二区三区| 国产日韩欧美在线精品| 香蕉国产在线看| netflix在线观看网站| 久久精品熟女亚洲av麻豆精品| 亚洲美女黄色视频免费看| 亚洲欧美清纯卡通| 亚洲,欧美精品.| 一区二区av电影网| 亚洲一区中文字幕在线| 欧美黑人欧美精品刺激| 视频区图区小说| 日韩欧美精品免费久久| 欧美变态另类bdsm刘玥| 亚洲欧洲国产日韩| 我要看黄色一级片免费的| 黄片小视频在线播放| 操美女的视频在线观看| 秋霞在线观看毛片| 叶爱在线成人免费视频播放| 搡老乐熟女国产| 亚洲伊人色综图| 日韩av在线免费看完整版不卡| 少妇猛男粗大的猛烈进出视频| 日韩视频在线欧美| 国产 一区精品| 最近手机中文字幕大全| 国产伦理片在线播放av一区| 国产精品秋霞免费鲁丝片| 国产精品熟女久久久久浪| 91精品三级在线观看| 中文精品一卡2卡3卡4更新| 国产日韩欧美视频二区| 国产av码专区亚洲av| 伦理电影免费视频| 中文字幕亚洲精品专区| 免费女性裸体啪啪无遮挡网站| 两个人看的免费小视频| 自线自在国产av| 国产成人精品无人区| 我的亚洲天堂| 精品一区二区三卡| 两性夫妻黄色片| 免费日韩欧美在线观看| 在线精品无人区一区二区三| 操美女的视频在线观看| 水蜜桃什么品种好| 国产免费现黄频在线看| svipshipincom国产片| videos熟女内射| 一级片免费观看大全| 日本爱情动作片www.在线观看| 精品亚洲成a人片在线观看| 青草久久国产| 咕卡用的链子| 一区二区日韩欧美中文字幕| av免费观看日本| 一本久久精品| 另类亚洲欧美激情| 69精品国产乱码久久久| 老司机深夜福利视频在线观看 | 卡戴珊不雅视频在线播放| 叶爱在线成人免费视频播放| 高清av免费在线| 亚洲精品在线美女| 人人妻人人澡人人爽人人夜夜| 日韩大片免费观看网站| 一二三四在线观看免费中文在| 九草在线视频观看| 国产男女内射视频| 青春草国产在线视频| 高清视频免费观看一区二区| 国产麻豆69| 狂野欧美激情性bbbbbb| 女人久久www免费人成看片| 可以免费在线观看a视频的电影网站 | 国产乱人偷精品视频| 视频在线观看一区二区三区| 日韩欧美精品免费久久| 久久久久精品人妻al黑| av网站在线播放免费| 黄网站色视频无遮挡免费观看| 久久国产精品大桥未久av| 亚洲精品国产色婷婷电影| 亚洲图色成人| 男女边摸边吃奶| 精品少妇内射三级| 久久天堂一区二区三区四区| 极品人妻少妇av视频| 一级黄片播放器| 欧美日韩综合久久久久久| 国产人伦9x9x在线观看| 国产乱人偷精品视频| 亚洲精品久久久久久婷婷小说| 国产免费一区二区三区四区乱码| 欧美变态另类bdsm刘玥| 国产一区二区在线观看av| 亚洲欧美日韩另类电影网站| 免费高清在线观看日韩| 久久久久人妻精品一区果冻| 男女午夜视频在线观看| 久久精品亚洲av国产电影网| 一本大道久久a久久精品| 亚洲成人国产一区在线观看 | 午夜老司机福利片| 国产精品一区二区精品视频观看| 黄色一级大片看看| 国产精品 欧美亚洲| 国产爽快片一区二区三区| 亚洲精品aⅴ在线观看| 丁香六月欧美| 国产精品国产av在线观看| 色吧在线观看| 亚洲精品中文字幕在线视频| 永久免费av网站大全| 国产av国产精品国产| 国产色婷婷99| 成人国产麻豆网| 亚洲熟女毛片儿| 大话2 男鬼变身卡| 人人妻人人添人人爽欧美一区卜| avwww免费| 精品一区二区免费观看| 激情视频va一区二区三区| 大话2 男鬼变身卡| 少妇猛男粗大的猛烈进出视频| 热99久久久久精品小说推荐| av片东京热男人的天堂| 超碰97精品在线观看| 精品福利永久在线观看| 王馨瑶露胸无遮挡在线观看| 国产精品二区激情视频| 国产精品 欧美亚洲| 一级爰片在线观看| 精品国产一区二区久久| 蜜桃国产av成人99| 亚洲av欧美aⅴ国产| 欧美乱码精品一区二区三区| 欧美激情 高清一区二区三区| 精品午夜福利在线看| 18禁观看日本| 亚洲精品日韩在线中文字幕| 欧美 亚洲 国产 日韩一| 国产在线免费精品| 国产高清国产精品国产三级| 国产日韩欧美亚洲二区| 日本av免费视频播放| 亚洲自偷自拍图片 自拍| 亚洲,欧美精品.| 久久久久人妻精品一区果冻| 另类亚洲欧美激情| 9色porny在线观看| 欧美黄色片欧美黄色片| 亚洲国产欧美网| 久久99一区二区三区| 99热全是精品| 日韩不卡一区二区三区视频在线| 美女午夜性视频免费| 久久午夜综合久久蜜桃| 成人亚洲精品一区在线观看| 一本大道久久a久久精品| av网站免费在线观看视频| 国产日韩欧美视频二区| 久久久精品国产亚洲av高清涩受| 国产淫语在线视频| 午夜免费鲁丝| 中文字幕另类日韩欧美亚洲嫩草| 侵犯人妻中文字幕一二三四区| 91aial.com中文字幕在线观看| 国产精品久久久久久精品古装| 菩萨蛮人人尽说江南好唐韦庄| 亚洲国产毛片av蜜桃av| 男女国产视频网站| 日韩熟女老妇一区二区性免费视频| 超碰成人久久| 在线观看免费日韩欧美大片| 精品亚洲乱码少妇综合久久| 欧美国产精品一级二级三级| 国产成人精品福利久久| 五月天丁香电影| 91国产中文字幕| 亚洲伊人色综图| 亚洲国产中文字幕在线视频| 久久精品国产亚洲av涩爱| 一级毛片我不卡| 日韩av不卡免费在线播放| 晚上一个人看的免费电影| 免费不卡黄色视频| 久久久欧美国产精品| 久久 成人 亚洲| 亚洲七黄色美女视频| 一区二区三区激情视频| 99热网站在线观看| 国产不卡av网站在线观看| 91精品国产国语对白视频| 亚洲国产精品一区二区三区在线| 亚洲欧美激情在线| 国产欧美日韩综合在线一区二区| 极品少妇高潮喷水抽搐| 国产人伦9x9x在线观看| 免费高清在线观看日韩| 免费黄色在线免费观看| 亚洲国产av影院在线观看| 午夜福利乱码中文字幕| 国产成人免费无遮挡视频| 黄频高清免费视频| 亚洲三区欧美一区| 七月丁香在线播放| 久久亚洲国产成人精品v| 国产免费一区二区三区四区乱码| 久久天躁狠狠躁夜夜2o2o | 日本黄色日本黄色录像| 日本欧美国产在线视频| 久久性视频一级片| 波多野结衣av一区二区av| 国产日韩一区二区三区精品不卡| 99国产综合亚洲精品| 99热全是精品| 桃花免费在线播放| 久久av网站| 一级毛片我不卡| 国产精品国产三级专区第一集| 99久久人妻综合| www.精华液| 五月开心婷婷网| 欧美日韩精品网址| 看非洲黑人一级黄片| 亚洲国产看品久久| 我的亚洲天堂| 最近最新中文字幕大全免费视频 | 欧美激情极品国产一区二区三区| a级毛片黄视频| 亚洲天堂av无毛| 精品一区二区三卡| 黄色毛片三级朝国网站| 母亲3免费完整高清在线观看| 国产在线视频一区二区| 久久久久网色| 国产极品粉嫩免费观看在线| 人妻 亚洲 视频| 日日摸夜夜添夜夜爱| 欧美精品人与动牲交sv欧美| 在线亚洲精品国产二区图片欧美| 午夜久久久在线观看| 九草在线视频观看| 水蜜桃什么品种好| 亚洲国产av影院在线观看| 久久天堂一区二区三区四区| 女人爽到高潮嗷嗷叫在线视频| 免费人妻精品一区二区三区视频| av在线老鸭窝| 久久久久久久久免费视频了| 51午夜福利影视在线观看| 丝袜在线中文字幕| 成人国语在线视频| 国产不卡av网站在线观看| 精品久久久精品久久久| 中文欧美无线码| 久久国产精品男人的天堂亚洲| 久久97久久精品| 永久免费av网站大全| 伊人久久大香线蕉亚洲五| 亚洲欧洲日产国产| 亚洲av日韩精品久久久久久密 | 欧美国产精品va在线观看不卡| 国产精品无大码| 亚洲国产毛片av蜜桃av| 黑人欧美特级aaaaaa片| 国产免费福利视频在线观看| 黄色 视频免费看| 午夜久久久在线观看| 午夜福利,免费看| 一区二区三区乱码不卡18| 国产一区二区三区av在线| 亚洲国产看品久久| 久久 成人 亚洲| 最新的欧美精品一区二区| 少妇精品久久久久久久| 国产av国产精品国产| 色精品久久人妻99蜜桃| 国产野战对白在线观看| 校园人妻丝袜中文字幕| 美女大奶头黄色视频| 伊人久久国产一区二区| 我的亚洲天堂| 美女大奶头黄色视频| 十八禁高潮呻吟视频| 天堂8中文在线网| 交换朋友夫妻互换小说| 国产爽快片一区二区三区| 中文字幕最新亚洲高清| 亚洲欧美精品自产自拍| 成年av动漫网址| 青春草亚洲视频在线观看| 亚洲av日韩在线播放| 黑人巨大精品欧美一区二区蜜桃| 国产高清国产精品国产三级| 亚洲欧美一区二区三区黑人| 久久人人97超碰香蕉20202| 成人漫画全彩无遮挡| 午夜福利网站1000一区二区三区| 国产在线一区二区三区精| 久久久久人妻精品一区果冻| 男女免费视频国产| av线在线观看网站| 人人澡人人妻人| 老鸭窝网址在线观看| 人人妻,人人澡人人爽秒播 | 欧美乱码精品一区二区三区| 国产 一区精品| 国产av一区二区精品久久| 老司机深夜福利视频在线观看 | 制服诱惑二区| 成人午夜精彩视频在线观看|