• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    中文開放域問答系統(tǒng)數(shù)據(jù)增廣研究

    2023-01-18 03:38:10杜家駒葉德銘孫茂松
    中文信息學(xué)報(bào) 2022年11期
    關(guān)鍵詞:段落檢索文章

    杜家駒,葉德銘,孫茂松

    (1. 清華大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)系,北京100084;2. 清華大學(xué) 人工智能研究院,北京100084;3. 清華大學(xué) 智能技術(shù)與系統(tǒng)國(guó)家重點(diǎn)實(shí)驗(yàn)室,北京100084)

    0 引言

    智能問答是自然語(yǔ)言處理中的重要任務(wù),其目標(biāo)是回答人類用自然語(yǔ)言形式提出的各種問題,涉及檢索、語(yǔ)義匹配、推理等自然語(yǔ)言處理中的重要技術(shù)。與搜索引擎不同,它能夠?yàn)橛脩糁苯犹峁┐鸢?,省去用戶閱讀文檔的時(shí)間,擁有重要的實(shí)際價(jià)值。

    開放域問答是智能問答的主要研究領(lǐng)域之一。它的目標(biāo)是回答任意領(lǐng)域的問題,而不是把問題限定在某個(gè)領(lǐng)域內(nèi)。給定一個(gè)問題Q以及許多文檔(如維基百科的全部?jī)?nèi)容,或互聯(lián)網(wǎng)上的所有網(wǎng)頁(yè)),模型需要根據(jù)這些文檔回答問題。開放域問答模型的一種常見實(shí)現(xiàn)方式由檢索器和閱讀器兩部分構(gòu)成。檢索器需要從給定的文檔集合中檢索出可能相關(guān)的一些文檔,之后閱讀器需要閱讀并綜合處理這些文檔,得出問題的答案。這兩部分通常是分離的,檢索器通常使用傳統(tǒng)方法進(jìn)行檢索,如TF-IDF或BM25,或者使用搜索引擎(如Bing),閱讀器一般使用標(biāo)注好的閱讀理解數(shù)據(jù)集訓(xùn)練,其文檔通常來自于維基百科。閱讀理解是智能問答的另一重要研究領(lǐng)域。目前,閱讀理解模型通常在大規(guī)模預(yù)訓(xùn)練語(yǔ)言模型上微調(diào)(Fine-tune),在各類數(shù)據(jù)集上能夠接近甚至超出人類水平。

    但是,閱讀理解和開放域問答是不同的場(chǎng)景,所以用閱讀理解數(shù)據(jù)集訓(xùn)練得到的模型直接遷移到開放域問答往往會(huì)遇到很多問題。我們使用目前通行的方法訓(xùn)練了一個(gè)閱讀理解模型,并在真實(shí)場(chǎng)景下進(jìn)行了評(píng)測(cè),發(fā)現(xiàn)了一些問題,如圖1所示。在示例1中,檢索器抽取網(wǎng)頁(yè)的主要內(nèi)容并進(jìn)行分段處理,會(huì)出現(xiàn)形如“喬戈里峰”這樣僅含一個(gè)實(shí)體的較短的段落。此時(shí)閱讀器看到了問題要求回答某一座山峰,且段落中包含一座山峰后就直接輸出了“喬戈里峰”。在示例2中,問題和文章中涉及的地點(diǎn)限定詞是不同的,但模型仍然輸出了屬于“山峰”這一類型的一個(gè)實(shí)體。這兩個(gè)例子說明目前的閱讀理解模型沒有真正地理解問題和文章之間的關(guān)系,只是學(xué)習(xí)到了淺層的文本匹配。

    圖1 閱讀理解模型錯(cuò)誤輸出示例

    上述問題出現(xiàn)的原因本質(zhì)上是因?yàn)槟壳伴_放域問答系統(tǒng)的閱讀器使用閱讀理解數(shù)據(jù)集訓(xùn)練。在開放域問答中,人們通常是先想到問題再去找相關(guān)文章。而在標(biāo)注閱讀理解數(shù)據(jù)集時(shí),標(biāo)注者在閱讀文章后提出若干問題,文章內(nèi)容的先入為主導(dǎo)致他們提出的問題通常與文章的句子比較相近。所以較短的段落以及與問題中不同的限定詞這樣的情況并不會(huì)在閱讀理解數(shù)據(jù)中出現(xiàn),進(jìn)而使開放域問答模型在這幾種情況下出錯(cuò)。為了解決這些問題,我們提出了幾種能在現(xiàn)實(shí)場(chǎng)景下增強(qiáng)問答系統(tǒng)魯棒性的數(shù)據(jù)增廣方法。其中包括針對(duì)無(wú)上下文的答案,提出使用類似答案的文章;針對(duì)問題文章中限定詞不匹配的問題,提出條件刪除,構(gòu)造不含問題中條件的文章;針對(duì)模型會(huì)受到與問題高度相似的句子影響,提出句子替換,用高度相關(guān)的句子替換含有答案的句子。這些數(shù)據(jù)增廣方法能夠幫助閱讀器獲得辨別這幾種情況的能力,進(jìn)而提升開放域問答系統(tǒng)的魯棒性。

    考慮到閱讀理解數(shù)據(jù)集和實(shí)際場(chǎng)景的巨大差異,我們構(gòu)造了一個(gè)開放域問答數(shù)據(jù)集OpenCQA用于評(píng)測(cè)。與以往閱讀理解數(shù)據(jù)集的區(qū)別是: OpenCQA給出的文章是從網(wǎng)頁(yè)中提取出來的,且沒有做相關(guān)的過濾處理,更接近人類閱讀網(wǎng)頁(yè)時(shí)的情景,具有更強(qiáng)的干擾性。實(shí)驗(yàn)結(jié)果表明本文提出的幾種數(shù)據(jù)增廣方法都在這個(gè)數(shù)據(jù)集上取得了一定的效果提升。

    本文的貢獻(xiàn)主要包含:

    (1) 發(fā)現(xiàn)目前的閱讀理解模型不能夠處理真實(shí)場(chǎng)景下的文章,提出了幾種能夠增強(qiáng)魯棒性的數(shù)據(jù)增廣方法,并在真實(shí)場(chǎng)景下獲得了性能提升。

    (2) 為了修正目前閱讀理解數(shù)據(jù)集不能有效評(píng)估實(shí)際場(chǎng)景下模型效果的問題,構(gòu)造并發(fā)布一個(gè)開放域問答數(shù)據(jù)集。

    1 相關(guān)工作

    智能問答近年來已經(jīng)有了許多進(jìn)展,性能有了很大的提升。這些進(jìn)展得益于許多數(shù)據(jù)集的出現(xiàn)。在中文領(lǐng)域,閱讀理解數(shù)據(jù)集有以下幾種形式: 完型填空形式,給出的文本有若干個(gè)詞被刪除,需要根據(jù)上下文恢復(fù)這些詞,如CMRC 2017[1];抽取式,答案是給出的文本中的一個(gè)區(qū)間,如CMRC 2018[2],DRCD[3],WebQA[4],XQA[5];生成式,需要根據(jù)問題和文章生成一段文本作為答案,如DuReader[6],Gaokao History[7];以及多項(xiàng)選擇形式,從四個(gè)答案中選出最合適的一項(xiàng),如Gaokao Challenge[8-9],MCQA 2017[10],ChID[11],C3[12]??傮w上來說,上述中文的數(shù)據(jù)集的規(guī)模遠(yuǎn)遠(yuǎn)小于英文數(shù)據(jù)集,如SQuAD[13],TriviaQA[14],Natural Questions[15]等。

    當(dāng)前問答模型遇到的一個(gè)重要問題是模型總是傾向于做簡(jiǎn)單的文本匹配。為了解決這一問題,Jia和Liang[16]通過對(duì)文章進(jìn)行一定的修改,可以誤導(dǎo)模型輸出錯(cuò)誤的答案,并通過加入對(duì)抗樣本訓(xùn)練緩解這一問題。Zhu[17]等人提出通過神經(jīng)網(wǎng)絡(luò)模型生成若干不可回答的問題來幫助訓(xùn)練問答模型。Welbl[18]等人發(fā)現(xiàn)了問答系統(tǒng)的不敏感性(Undersensitivity),即對(duì)文章做出一定的更改后,模型仍然會(huì)輸出原有的答案,然后用了對(duì)抗訓(xùn)練的方法降低不敏感性。Back[19]等人提出了NeurQuRI,能夠檢測(cè)出問題中的一些條件能否被答案所滿足,但這一模型僅使用答案的表示作為輸入,沒有顯式地對(duì)文章中的片段和問題中的條件進(jìn)行匹配。

    除閱讀理解外,近年來開放域問答也有了許多進(jìn)展。Chen[20]等人提出了兩階段的“檢索+閱讀”框架,在此基礎(chǔ)上,有一些研究專注于提升這一類模型在某方面的效果,如多文章訓(xùn)練[21]、文章排序[22]等。這類方法在檢索階段需要使用一個(gè)傳統(tǒng)的檢索器,因此有一些工作嘗試使用神經(jīng)網(wǎng)絡(luò)模型來做檢索。Lee[23]等人提出用問題和文章編碼后的向量做檢索,同時(shí)優(yōu)化檢索任務(wù)和閱讀任務(wù),形成一個(gè)端到端的模型。在此基礎(chǔ)上,Guu[24]等人為這種端到端的模型提出了一種預(yù)訓(xùn)練方法,提升了其性能。

    此外,還有一些特殊技巧被應(yīng)用于開放域問答中。如Seo[25]等人提出了PIQA,把維基百科中所有區(qū)間都編碼為向量,用向量相似度直接從這些區(qū)間中檢索出答案,避免了閱讀大量文本帶來的性能開銷。還有一些工作把知識(shí)圖譜融入檢索和閱讀中[26-27]。

    2 模型

    在本節(jié),我們首先介紹作為基準(zhǔn)模型的開放域問答系統(tǒng),包含目前抽取式閱讀理解的常見做法和對(duì)某些特殊情況的處理,然后介紹幾種能夠改善系統(tǒng)魯棒性的數(shù)據(jù)增廣方法。

    2.1 基準(zhǔn)模型

    基準(zhǔn)模型采用檢索+閱讀的流水線形式,其中檢索器使用搜索引擎返回的結(jié)果,閱讀器在抽取式閱讀理解數(shù)據(jù)集上訓(xùn)練。抽取式閱讀理解是閱讀理解的一種特殊形式,可以形式化為如下問題: 給定一個(gè)問題Q,以及若干篇文章D1,D2,…,Dn,從這些文章中選擇一個(gè)片段a作為答案輸出,或者輸出“無(wú)答案”。目前,抽取式閱讀理解問題最好的解決方法是利用大規(guī)模的預(yù)訓(xùn)練模型。

    以BERT[28]為例,如圖2所示,對(duì)于問題Q和文章Di,我們使用WordPiece[29]切分它們,得到符號(hào)序列Q=q1,q2,…,qm,Di=d1,d2,…,dl。把問題和文章拼起來,得到輸入序列[CLS]q1q2…qm[SEP]d1d2…dl[SEP],其中[CLS]和[SEP]是兩個(gè)特殊符號(hào),分別用于輸入的開頭和分隔問題與文章。然后,BERT模型將會(huì)處理這個(gè)序列,經(jīng)過embedding層和若干self-attention及全連接層后,輸出一組向量h0,h1,…,hn∈RH,與輸入序列中的符號(hào)一一對(duì)應(yīng)。之后,這些向量會(huì)分別通過兩個(gè)線性層及softmax層,得到每個(gè)符號(hào)是答案的開始位置或結(jié)束位置的概率:

    這里假定答案的開始位置和結(jié)束位置的概率分布是相互獨(dú)立的。我們把Wstarthi+bstart,Wendhi+bend稱為i位置作為初始位置和結(jié)束位置的分?jǐn)?shù),記為si和ei。答案是某一區(qū)間[a,b]的概率為:

    P([a,b])=Pstart(a)Pend(b)∝exp(sa+eb)

    (3)

    可以認(rèn)為文章中每個(gè)答案區(qū)間的分?jǐn)?shù)為開始位置和結(jié)束位置分?jǐn)?shù)之和。

    由于輸入序列包含問題和文章,所以只需要考慮起始位置和結(jié)束位置都在文章對(duì)應(yīng)位置的區(qū)間。一般來說,答案通常不會(huì)太長(zhǎng),所以在進(jìn)行預(yù)測(cè)時(shí),還會(huì)剔除掉那些太長(zhǎng)的區(qū)間。另外,文章中不一定含有回答問題所必要的信息,所以模型需要針對(duì)這種情況給出“無(wú)答案”的預(yù)測(cè)。我們把包含[CLS]這個(gè)符號(hào)的區(qū)間作為一個(gè)特殊的“答案”。如果這個(gè)答案的概率是最高的,就認(rèn)為模型輸出了“無(wú)答案”。

    在實(shí)際情況中,有的文章的長(zhǎng)度會(huì)超出預(yù)訓(xùn)練模型能處理的長(zhǎng)度上限(如512個(gè)符號(hào))。在這種情況下,需要采用滑動(dòng)窗口的形式把文章劃分為有重疊的若干段,如圖3所示。其中會(huì)有一些段落不含有答案,在訓(xùn)練時(shí)需要讓這些段落預(yù)測(cè)“無(wú)答案”。在閱讀完所有的文章后,需要把所有文章或段落預(yù)測(cè)出的答案合并起來,每個(gè)答案的分?jǐn)?shù)是它在所有文章段落中被預(yù)測(cè)的分?jǐn)?shù)的最大值。在下文中,本小節(jié)提到的模型記為Baseline。

    圖3 文章長(zhǎng)度超過預(yù)訓(xùn)練模型能處理的上限時(shí)的滑動(dòng)窗口機(jī)制僅第2個(gè)窗口含有答案,用其他窗口訓(xùn)練時(shí)訓(xùn)練目標(biāo)是輸出“無(wú)答案”。

    2.2 提升魯棒性的數(shù)據(jù)增廣

    為了緩解上文提到的問答模型的問題,我們提出了若干種數(shù)據(jù)增廣的方法,期望模型在學(xué)習(xí)過這些增廣數(shù)據(jù)之后能夠避免上述的問題。

    2.2.1 針對(duì)無(wú)上下文的答案的增廣

    在實(shí)際場(chǎng)景中,如果某一個(gè)段落僅包含一個(gè)實(shí)體,且這個(gè)實(shí)體的類型和問題詢問的類型是匹配的,那么模型有很大的可能性會(huì)直接把這個(gè)實(shí)體預(yù)測(cè)為答案。但是這種情況是不合理的,因?yàn)槲恼聸]有提供任何與問題有關(guān)的信息。

    為了避免這種情況,可以手工構(gòu)造出這樣的情況,并要求模型不預(yù)測(cè)這個(gè)實(shí)體。假定有一個(gè)實(shí)例,包含問題Q,一些文章D1,…,Dn,以及一些答案a1,…,am。我們構(gòu)造了這樣的實(shí)例,它的問題是Q,文章是a1,…,am,每篇文章都是一個(gè)原有的答案,答案為空。圖4(1)展示了一個(gè)替換的例子。對(duì)已有的所有數(shù)據(jù)做這樣的處理后,把所有新實(shí)例加入到原有的數(shù)據(jù)集中。這種數(shù)據(jù)增廣方法記為類似答案的文章(Answer-like Context,AC)。

    2.2.2 針對(duì)缺少條件的文章的增廣

    人類在閱讀文章并回答問題時(shí)通常會(huì)快速找到問題所隱含的條件,然后在文章中尋找能夠匹配上所有隱含條件的地方。如果缺少一個(gè)條件或條件錯(cuò)誤,一般會(huì)認(rèn)為無(wú)法回答此問題。例如,在問題“云南最高的山峰是什么?”中,“云南”“最高”“山峰”可以認(rèn)為是隱藏的條件,如果“云南”或其近義詞沒有在文章中出現(xiàn),就無(wú)法回答問題。目前的模型無(wú)法滿足這種需求,所以我們針對(duì)這種情況提出了一種增廣數(shù)據(jù)的方法。

    假定一個(gè)實(shí)例含有問題Q,文章D1,…,Dn,以及答案a1,…,am。首先使用Stanford CoreNLP[30]對(duì)Q進(jìn)行分詞、命名實(shí)體識(shí)別和依存語(yǔ)法分析。然后,抽取出問題中所有的命名實(shí)體、名詞和所有形如“第……”“最……”的詞,這些詞被視為回答問題必需的條件,構(gòu)成條件集合P={p1,…,pl}。一般來說,一個(gè)問題通??梢猿槿〕?~4個(gè)條件,如果一篇文章中不含有任意一個(gè)條件,那么它幾乎不可能含有回答問題所需要的信息。把文章中每個(gè)條件都刪除掉,得到一個(gè)新的實(shí)例,包含問題Q,文章D1-P,…,Dn-P,以及空答案。然后新實(shí)例加入到已有的數(shù)據(jù)集中,記為條件刪除(Condition Deletion,CD)。圖4(2)給出了條件刪除的一個(gè)數(shù)據(jù)增廣示例。

    圖4 類似答案的文章示例

    2.2.3 針對(duì)與問題高度相關(guān)的句子的增廣

    如果文章中含有與問題高度相似的句子但此句子又不含有真正的答案,那么這個(gè)句子中的一些區(qū)間(或詞語(yǔ))就很容易被預(yù)測(cè)為答案。為了解決這一問題,我們提出一種利用句子替換增廣數(shù)據(jù)的方法。

    (4)

    訓(xùn)練完成后,就可以檢索出與問題相似的所有句子。我們用Faiss[31],一個(gè)十分高效的開源向量相似度檢索與聚類庫(kù),進(jìn)行基于向量?jī)?nèi)積的檢索,為每個(gè)問題找到相似度最高的100個(gè)句子。

    只要把文章中含有答案的句子替換成與問題高度相似且不含答案的句子,就可以認(rèn)為得到的新文章不足以回答問題。模型在用這樣的(問題,文章)訓(xùn)練之后就應(yīng)當(dāng)能夠避免直接用問題匹配與問題高度相關(guān)的句子。這種處理方式記為句子替換(Sentence Replacement,SR)。圖4(3)給出了句子替換的一個(gè)數(shù)據(jù)增廣示例。

    但是,上述處理方法可能存在以下問題: 如果一個(gè)句子含有與答案重合度較高的一些片段,如答案為“古埃及人”,但原文章中有一個(gè)句子含有“古代埃及人”,這個(gè)句子就不會(huì)作為無(wú)答案的句子被替換掉,導(dǎo)致構(gòu)造的文章仍然能夠回答問題。為了處理這種情況,我們引入一種啟發(fā)式的匹配方法。假設(shè)答案長(zhǎng)度為n,統(tǒng)計(jì)它的n(n+1)/2個(gè)子串有哪些在句子中出現(xiàn)。如果在句子中出現(xiàn)的子串?dāng)?shù)量不少于2n-1,就認(rèn)為句子和答案是匹配的,應(yīng)當(dāng)被替換掉。這種處理方式記為近似句子替換(Approximate Sentence Replacement,ASR)。

    最后,以上幾種數(shù)據(jù)增廣方法分別針對(duì)了幾種不同的問題,在實(shí)際場(chǎng)景中可以混用這幾種增廣方法,記為集成(Ensemble)。

    3 實(shí)驗(yàn)

    3.1 數(shù)據(jù)集

    本文主要專注于抽取式的閱讀理解和開放域問答,相關(guān)的數(shù)據(jù)集主要有:

    (1) CMRC2017[1]是一個(gè)填空式的中文閱讀理解數(shù)據(jù)集,但人工標(biāo)注了少量抽取式的問題。其語(yǔ)料主要來源于《人民日?qǐng)?bào)》和《格林童話》。

    (2) CMRC2018[2]是第一個(gè)標(biāo)準(zhǔn)的抽取式閱讀理解數(shù)據(jù)集,其文章來源于中文維基百科。

    (3) DRCD[3]同樣是一個(gè)抽取式數(shù)據(jù)集,所有問題和答案都是繁體中文,文章取自繁體中文維基百科。我們使用OpenCC(1)https://github.com/BYVoid/OpenCC進(jìn)行繁簡(jiǎn)轉(zhuǎn)換。

    (4) WebQA[4]是一個(gè)大規(guī)模的真實(shí)場(chǎng)景下的問答數(shù)據(jù)集,其問題主要來源于百度知道中的事實(shí)性的問題,都是在非受限的場(chǎng)景下提出的。用搜索引擎檢索問題,得到若干文章,并人工標(biāo)注了答案。

    (5) DuReader[6]包含了許多從搜索引擎日志中獲得的高頻問題,包括事實(shí)型問題、觀念型問題和是否型問題。在百度搜索和百度知道中檢索這些問題,得到一些文章,并人工標(biāo)注答案。與其他數(shù)據(jù)集不同的是DuReader給出是的完整的文章,而不是單個(gè)段落。

    為了能夠充分利用各個(gè)數(shù)據(jù)集,本文把這些數(shù)據(jù)集轉(zhuǎn)化為了統(tǒng)一的格式。同時(shí),為了與抽取式的問答模型兼容,我們刪除了答案沒有在給出的文章中出現(xiàn)的問答對(duì)。由于部分?jǐn)?shù)據(jù)集沒有提供測(cè)試集,因此在實(shí)驗(yàn)中統(tǒng)一把驗(yàn)證集和測(cè)試集合并為驗(yàn)證集。最終得到的數(shù)據(jù)集規(guī)模統(tǒng)計(jì)如表1所示。

    表1 數(shù)據(jù)集規(guī)模統(tǒng)計(jì)信息

    此外,為了評(píng)估模型在實(shí)際場(chǎng)景中的性能,我們利用這些數(shù)據(jù)集提供的問答對(duì)構(gòu)造了一個(gè)開放域問答的數(shù)據(jù)集OpenCQA,類似于Chen[20]等人提出的做法。首先忽略數(shù)據(jù)集給出的所有文章,對(duì)于數(shù)據(jù)集中的所有問題答案對(duì)(Q,a),在Bing(2)https://www.bing.com/搜索引擎中用Q檢索并抓取前十位的網(wǎng)頁(yè),抽取出其主要內(nèi)容作為文章D,與原有的問題Q和答案a合并構(gòu)造一個(gè)新的(Q,D,a)三元組。如果原有的答案a沒有在這些文章D中出現(xiàn),則把a(bǔ)替換為“無(wú)答案”。問題Q無(wú)法檢索出相關(guān)結(jié)果時(shí)直接丟棄此問答對(duì)。文章如果存在大量不可讀字符或中文字符占比小于一半,也會(huì)直接丟棄。為促進(jìn)中文問答系統(tǒng)的研究,我們公開發(fā)布了OpenCQA(3)https://github.com/jiajudu/openCQA數(shù)據(jù)集,包含約20萬(wàn)問題、答案,以及每個(gè)問題的參考文章。此外,為方便其他研究者,還把所有的閱讀理解數(shù)據(jù)集整合在了一起,并統(tǒng)一成相同的格式,也同時(shí)公開發(fā)布。

    3.2 評(píng)測(cè)指標(biāo)

    封閉域閱讀理解和開放域問答都使用EM和F1兩種指標(biāo)評(píng)測(cè)。假設(shè)問題有若干個(gè)可能的答案a1,…,an,模型給出的預(yù)測(cè)為a。EM和F1的計(jì)算方法如式(5)、式(6)所示。

    其中,lcs為兩個(gè)字符串的最長(zhǎng)公共子串。計(jì)算前需要先去除這些答案中的標(biāo)點(diǎn)符號(hào)。

    3.3 實(shí)驗(yàn)設(shè)置

    我們使用閱讀理解數(shù)據(jù)集訓(xùn)練了若干模型,分別使用了不同的數(shù)據(jù)增廣策略。然后,分別在閱讀理解驗(yàn)證集和OpenCQA驗(yàn)證集上評(píng)測(cè)了性能。所有的實(shí)驗(yàn)都借助Transformers庫(kù)[32]完成,預(yù)訓(xùn)練語(yǔ)言模型(4)https://huggingface.co/hfl/chinese-roberta-wwm-ext使用中文維基百科、新聞、問答等數(shù)據(jù)訓(xùn)練,利用了全詞Mask(Whole Word Masking)技術(shù),區(qū)分大小寫。微調(diào)時(shí)使用的學(xué)習(xí)率為3e-5,其中前10%的時(shí)間學(xué)習(xí)率由0線性上升至最大值,隨后線性下降至0。使用的優(yōu)化器為Adam,共訓(xùn)練2輪。模型使用了8張RTX 2080 Ti顯卡,batch size設(shè)置為48。其余參數(shù)均采用常見的默認(rèn)值。

    此外,為了讓模型能夠處理是否型問題,我們?cè)诿總€(gè)段落前都添加兩個(gè)特別的符號(hào)“Yes”和“No”。如果應(yīng)該輸出是/否,就要求模型預(yù)測(cè)含有這兩個(gè)符號(hào)的區(qū)間。在訓(xùn)練句子和問題的相似度模型時(shí),每個(gè)問題都隨機(jī)采樣5個(gè)負(fù)例。在評(píng)估集成增廣方法時(shí),使用三種增廣方法分別構(gòu)造了三組額外的數(shù)據(jù),每組數(shù)據(jù)都隨機(jī)采樣出1/3的數(shù)據(jù),加入原有的訓(xùn)練集。表2給出了各種增廣策略對(duì)應(yīng)的數(shù)據(jù)規(guī)模以及在原數(shù)據(jù)集的基礎(chǔ)上增加的比例。

    表2 數(shù)據(jù)增廣規(guī)模

    3.4 開放域問答實(shí)驗(yàn)結(jié)果

    在進(jìn)行開放域問答的評(píng)測(cè)時(shí),一個(gè)問題會(huì)對(duì)應(yīng)十篇文章,但是這些文章中可能會(huì)存在特別長(zhǎng)的段落。如果直接閱讀這些段落,就會(huì)消耗大量的計(jì)算資源。由于計(jì)算資源有限,我們把所有的段落用滑動(dòng)窗口切分為片段,僅取出512個(gè)片段閱讀。片段數(shù)量超過512時(shí),優(yōu)先選取每個(gè)段落靠前的片段,丟棄長(zhǎng)段落靠后的內(nèi)容。這樣模型閱讀的內(nèi)容會(huì)覆蓋所有段落,而又不在極長(zhǎng)段落上花費(fèi)過多資源。

    與閱讀理解不同,OpenCQA中有許多無(wú)答案的例子。但是在使用不同的數(shù)據(jù)訓(xùn)練之后,不同的模型輸出“無(wú)答案”的概率是不同的。為了保證比較的公平性,我們引入了“分?jǐn)?shù)差”(5)https://github.com/huggingface/transformers/blob/v3.4.0/examples/question-answering/run_squad.py#L542這一概念。假設(shè)已經(jīng)獲得了文章中所有區(qū)間的最高得分sm和“無(wú)答案”的分?jǐn)?shù)snull,可以僅在sm>snull-τ時(shí)輸出一個(gè)非空的答案。這里τ是一個(gè)可以任意調(diào)整的變量。顯然τ減小時(shí),輸出“無(wú)答案”的概率Pnull增大。我們可以適當(dāng)?shù)厝∫恍│又?,得到EM-Pnull曲線(見圖5)和F1-Pnull曲線(見圖6)。曲線的最高點(diǎn)代表每個(gè)模型在調(diào)整τ后能達(dá)到的最優(yōu)性能,如表3左側(cè)兩列所示。曲線的最左側(cè)代表Pnull=0(即模型必須輸出一個(gè)非空答案)時(shí)的性能,如表3右側(cè)兩列所示。

    表3 開放域問答性能比較 (單位: %)

    從表3、圖5和圖6可以觀察到:

    圖5 開放域問答各模型曲線

    圖6 開放域問答各模型曲線

    (1)Pnull=1時(shí),所有模型的EM和F1都相同,這是因?yàn)閿?shù)據(jù)集中無(wú)答案數(shù)據(jù)的比例是固定的。

    (2)Pnull=0,即模型必須給出非空答案時(shí),我們提出的各種方法都能帶來一些提升,在EM上的提升更明顯(+1.2~2.2,集成方法+2.4),只有句子替換(SR/ASR)在F1指標(biāo)上提升較小,可能是因?yàn)榻x詞沒有被替換時(shí)問題仍然是可回答的。

    (3)Pnull: 0→1時(shí),EM和F1都先上升后下降??梢钥吹絇null處于(0,1)之間時(shí),各個(gè)模型相比于基準(zhǔn)模型的提升更大(+3.0~5.3,集成方法+6.9~7.9,見表3左側(cè)兩列)。這說明數(shù)據(jù)增廣不僅能夠提升在可回答問題上的效果,還可以提高模型判斷問題是否可回答的能力。

    (4) AC的EM/F1相比于基線模型增長(zhǎng)了4.69/4.75,我們對(duì)性能的增長(zhǎng)做了來源分析。性能的增長(zhǎng)來源于三方面: ①問題有答案且AC和基線模型均預(yù)測(cè)出了答案的情況下,AC貢獻(xiàn)了1.14/1.23的性能增長(zhǎng)。②在11.45%的問題上,AC把基線模型預(yù)測(cè)出的有答案改成了無(wú)答案,其中有5.22%的問題AC是正確的,貢獻(xiàn)了2.92/1.91的性能提升。盡管正確率不到一半,但由于發(fā)生錯(cuò)誤的那部分問題基線模型也沒有完全回答正確,所以總體貢獻(xiàn)仍然是正的。③在8.16%的問題上,AC把基線模型預(yù)測(cè)出的無(wú)答案改成了有答案,其中有6.08%的問題AC是正確的,貢獻(xiàn)了0.63/1.61的提升。因此我們同樣可以得到AC不僅提高了預(yù)測(cè)“無(wú)答案”的比例,在其他方面也有所貢獻(xiàn)。其他策略也有相似的貢獻(xiàn)分布,在此不再列出。

    (5) 綜合EM和F1指標(biāo),集成三種方法的數(shù)據(jù)增廣能夠取得最好的效果,條件刪除(CD)是最好的單一數(shù)據(jù)增廣方法。

    我們還分析了各種數(shù)據(jù)增廣方法在OpenCQA各個(gè)子數(shù)據(jù)集上的效果,如表4所示。實(shí)驗(yàn)結(jié)果表明,無(wú)論在哪個(gè)子數(shù)據(jù)集上,模型在可回答的問題上的EM和F1都有所提升,其中條件刪除(CD)仍然是最好的方法。在除WebQA外的數(shù)據(jù)集中,模型識(shí)別問題是否可回答的成功率也都有所提升。在WebQA上數(shù)據(jù)增廣會(huì)導(dǎo)致識(shí)別成功率下降,其原因主要是WebQA中幾乎的所有問題都有答案,數(shù)據(jù)增廣導(dǎo)致模型把部分問題預(yù)測(cè)為了“無(wú)答案”。

    表4 各種數(shù)據(jù)增廣方法在OpenCQA的子數(shù)據(jù)集上的表現(xiàn) (單位: %)

    最后,我們?nèi)斯ぴu(píng)測(cè)了本文提到的三種錯(cuò)誤情況(無(wú)上下文的答案;問題文章中限定詞不匹配;與問題高度相似的句子)的出現(xiàn)頻率。從基線模型判斷出錯(cuò)的例子中隨機(jī)選取了100個(gè),手工標(biāo)注了每個(gè)錯(cuò)誤例子是否與三種錯(cuò)誤情況相關(guān)。三種錯(cuò)誤情況分別對(duì)應(yīng)了其中17%、23%、9%的例子,總計(jì)占所有錯(cuò)誤例子的一半左右。

    3.5 閱讀理解實(shí)驗(yàn)結(jié)果

    表5展示了各種模型在3.1節(jié)中構(gòu)造的閱讀理解數(shù)據(jù)集上的結(jié)果。模型有可能對(duì)于某些問題輸出“無(wú)答案”,但由于此數(shù)據(jù)集中所有問題都有答案,所以我們強(qiáng)制所有模型忽略“無(wú)答案”,必須輸出一個(gè)答案。從表5可見,各種數(shù)據(jù)增廣方法在閱讀理解這一任務(wù)上對(duì)性能影響不大,或者會(huì)使性能略微下降。這說明閱讀理解和開放域問答是兩個(gè)差別較大的任務(wù),OpenCQA將有助于更準(zhǔn)確地評(píng)估未來模型的效果。

    表5 閱讀理解性能比較 (單位: %)

    3.6 案例分析

    在這一部分,我們首先給出從驗(yàn)證集中選出的若干例子,證明數(shù)據(jù)增廣能夠有效地解決上述幾種問題。圖7列出了這些例子以及模型給出的答案和得分。在示例1中,與基線模型相比,加入由答案作為文章的實(shí)例(AC)后,模型不再把“喬戈里峰”預(yù)測(cè)為答案,原有的一些高分答案的分?jǐn)?shù)也大大下降。在示例2中,條件刪除(CD)模型能夠識(shí)別出“云南”和“東北”是不同的條件,降低了“白云峰”的得分。在示例3中,句子替換(SR)模型降低了作為干擾項(xiàng)的某抑制劑的得分??傊?,對(duì)模型輸出的答案分?jǐn)?shù)的觀察說明數(shù)據(jù)增廣達(dá)到了目的。

    圖7 案例分析括號(hào)內(nèi)是答案的分?jǐn)?shù)

    4 結(jié)論

    本文針對(duì)閱讀理解模型在實(shí)際場(chǎng)景中出現(xiàn)的幾種問題,提出了能夠增強(qiáng)中文開放域問答魯棒性的數(shù)據(jù)增廣方法。實(shí)驗(yàn)結(jié)果表明這幾種方法能夠提升模型在實(shí)際場(chǎng)景中的性能。本文還發(fā)布了一個(gè)開放域問答的數(shù)據(jù)集,用于評(píng)估中文問答系統(tǒng)的性能。

    雖然在使用本文提出的幾種方法后,模型能夠避免犯某些錯(cuò)誤,但距離人類閱讀理解水平還有一定距離,仍然有很多錯(cuò)誤情況沒有解決。所以我們下一步將會(huì)進(jìn)一步地分析目前問答系統(tǒng)的弱點(diǎn),并針對(duì)問題進(jìn)行改進(jìn)。

    猜你喜歡
    段落檢索文章
    【短文篇】
    心理小測(cè)試
    細(xì)致入微的描寫讓文章熠熠生輝
    2019年第4-6期便捷檢索目錄
    放屁文章
    小處著眼,寫大文章
    夏天,愛情的第四段落
    專利檢索中“語(yǔ)義”的表現(xiàn)
    專利代理(2016年1期)2016-05-17 06:14:36
    弄清段落關(guān)系 按圖索驥讀文
    讀寫算(下)(2016年11期)2016-05-04 03:44:07
    做好深化國(guó)企改革大文章
    久久久久精品人妻al黑| 国产成人精品一,二区| 日韩在线高清观看一区二区三区| 国产黄色免费在线视频| 可以免费在线观看a视频的电影网站 | 精品人妻偷拍中文字幕| 亚洲国产av影院在线观看| 看免费av毛片| 女的被弄到高潮叫床怎么办| 18+在线观看网站| 久久人妻熟女aⅴ| 街头女战士在线观看网站| 欧美国产精品一级二级三级| 国产精品免费视频内射| 在线观看免费视频网站a站| 精品国产乱码久久久久久男人| 亚洲精品日韩在线中文字幕| 搡女人真爽免费视频火全软件| 女人精品久久久久毛片| 亚洲精品国产一区二区精华液| 久久ye,这里只有精品| 久久97久久精品| 三级国产精品片| 天天影视国产精品| 久久女婷五月综合色啪小说| 黄片无遮挡物在线观看| 中文精品一卡2卡3卡4更新| 午夜福利视频精品| 韩国高清视频一区二区三区| 日本91视频免费播放| 黄片小视频在线播放| 欧美最新免费一区二区三区| 91aial.com中文字幕在线观看| av又黄又爽大尺度在线免费看| 亚洲色图综合在线观看| 一边摸一边做爽爽视频免费| 国产色婷婷99| 99精国产麻豆久久婷婷| 国产 一区精品| 日韩三级伦理在线观看| 啦啦啦视频在线资源免费观看| 成年人午夜在线观看视频| 黑人巨大精品欧美一区二区蜜桃| 久久久久久久亚洲中文字幕| 国产毛片在线视频| 两个人免费观看高清视频| 波野结衣二区三区在线| 欧美精品一区二区大全| 美女大奶头黄色视频| av免费在线看不卡| 在线观看美女被高潮喷水网站| 国产片特级美女逼逼视频| 国产无遮挡羞羞视频在线观看| 精品一区二区三卡| 老司机影院毛片| 日本色播在线视频| 亚洲国产欧美在线一区| 亚洲成人手机| 久久久久久人人人人人| 两个人免费观看高清视频| 最近中文字幕2019免费版| 欧美亚洲 丝袜 人妻 在线| 又大又黄又爽视频免费| 免费久久久久久久精品成人欧美视频| 一边摸一边做爽爽视频免费| 熟妇人妻不卡中文字幕| 亚洲国产日韩一区二区| 日本-黄色视频高清免费观看| 美女主播在线视频| 亚洲精品国产一区二区精华液| av网站在线播放免费| 亚洲国产毛片av蜜桃av| 亚洲精品一二三| 久久国产精品大桥未久av| 大香蕉久久成人网| 国产精品一国产av| 国产男人的电影天堂91| 啦啦啦视频在线资源免费观看| 久久国内精品自在自线图片| 韩国av在线不卡| 精品99又大又爽又粗少妇毛片| 激情视频va一区二区三区| 亚洲国产欧美日韩在线播放| 狠狠精品人妻久久久久久综合| 久久狼人影院| 伦精品一区二区三区| 成年美女黄网站色视频大全免费| av福利片在线| 国产片内射在线| 男人爽女人下面视频在线观看| 亚洲少妇的诱惑av| 亚洲欧美成人精品一区二区| 亚洲欧美成人精品一区二区| 亚洲国产精品999| 亚洲成色77777| 汤姆久久久久久久影院中文字幕| 在线观看免费日韩欧美大片| 日韩制服骚丝袜av| 国产一区二区 视频在线| 狂野欧美激情性bbbbbb| 91精品三级在线观看| av免费观看日本| 亚洲成人手机| 两个人免费观看高清视频| 18在线观看网站| 国产一区二区 视频在线| 国产成人欧美| 精品国产一区二区三区久久久樱花| 日韩大片免费观看网站| 一边摸一边做爽爽视频免费| 成人免费观看视频高清| 亚洲精品国产一区二区精华液| 秋霞在线观看毛片| 国产高清不卡午夜福利| av网站在线播放免费| 国产成人aa在线观看| 1024香蕉在线观看| 国产一区二区在线观看av| 最近手机中文字幕大全| 国产不卡av网站在线观看| 91aial.com中文字幕在线观看| 久久 成人 亚洲| 97在线人人人人妻| 亚洲精品aⅴ在线观看| 国产激情久久老熟女| 中文乱码字字幕精品一区二区三区| 美女视频免费永久观看网站| 亚洲国产精品999| 欧美日韩视频精品一区| 日韩一卡2卡3卡4卡2021年| 黄色毛片三级朝国网站| 精品国产超薄肉色丝袜足j| 80岁老熟妇乱子伦牲交| 欧美激情高清一区二区三区 | 丝袜美腿诱惑在线| 大香蕉久久成人网| 精品国产乱码久久久久久小说| 久久这里只有精品19| 亚洲欧洲日产国产| 久久国产亚洲av麻豆专区| 一级a爱视频在线免费观看| 一个人免费看片子| 电影成人av| 亚洲av电影在线观看一区二区三区| 亚洲国产欧美日韩在线播放| 亚洲国产精品一区二区三区在线| 亚洲av电影在线观看一区二区三区| 纯流量卡能插随身wifi吗| 精品国产一区二区三区久久久樱花| 777米奇影视久久| 人妻系列 视频| 国产成人精品福利久久| 国产熟女午夜一区二区三区| 又粗又硬又长又爽又黄的视频| 王馨瑶露胸无遮挡在线观看| 亚洲成人一二三区av| 亚洲,欧美精品.| 一级片免费观看大全| av片东京热男人的天堂| 国产成人av激情在线播放| 在线 av 中文字幕| 午夜激情av网站| 伊人久久国产一区二区| 欧美老熟妇乱子伦牲交| 1024视频免费在线观看| 黑人猛操日本美女一级片| 老汉色∧v一级毛片| 老司机影院毛片| 男女边吃奶边做爰视频| 精品亚洲乱码少妇综合久久| freevideosex欧美| 婷婷色综合www| 丝袜喷水一区| 老司机影院毛片| 国产一区二区三区av在线| 国产精品一区二区在线不卡| 可以免费在线观看a视频的电影网站 | 亚洲精品av麻豆狂野| 亚洲精品在线美女| 欧美日本中文国产一区发布| 日韩精品有码人妻一区| videossex国产| 久久国产精品男人的天堂亚洲| 国产有黄有色有爽视频| 国产亚洲欧美精品永久| 欧美 亚洲 国产 日韩一| 9热在线视频观看99| 亚洲欧洲精品一区二区精品久久久 | 久久久精品免费免费高清| 人人妻人人爽人人添夜夜欢视频| 亚洲av日韩在线播放| 精品国产一区二区久久| 在线 av 中文字幕| 久久精品人人爽人人爽视色| 男女高潮啪啪啪动态图| videos熟女内射| 男的添女的下面高潮视频| 青青草视频在线视频观看| 极品少妇高潮喷水抽搐| 日本av免费视频播放| 99久久精品国产国产毛片| 亚洲视频免费观看视频| 久久久久国产一级毛片高清牌| 国产无遮挡羞羞视频在线观看| 欧美激情高清一区二区三区 | 亚洲精品中文字幕在线视频| 中文字幕人妻丝袜制服| 啦啦啦中文免费视频观看日本| 日本欧美视频一区| 亚洲国产av新网站| 超碰97精品在线观看| videosex国产| 精品一区二区三区四区五区乱码 | 十八禁高潮呻吟视频| 精品少妇黑人巨大在线播放| 亚洲欧美精品自产自拍| 免费观看a级毛片全部| av天堂久久9| 亚洲av综合色区一区| 免费看不卡的av| 国产一区二区在线观看av| 99热全是精品| 美女脱内裤让男人舔精品视频| 久久影院123| 精品亚洲成国产av| 久久久久精品久久久久真实原创| 日韩一区二区三区影片| 欧美精品人与动牲交sv欧美| 一区二区三区乱码不卡18| 宅男免费午夜| 高清av免费在线| 18禁观看日本| 国产一区二区三区av在线| 国产精品嫩草影院av在线观看| 国产一区二区三区综合在线观看| 久久ye,这里只有精品| 国产亚洲精品第一综合不卡| 26uuu在线亚洲综合色| 亚洲精品日本国产第一区| 在线天堂中文资源库| 国产亚洲午夜精品一区二区久久| 欧美成人午夜免费资源| 观看av在线不卡| 国产成人aa在线观看| 黑丝袜美女国产一区| 9色porny在线观看| 少妇的逼水好多| 美女国产视频在线观看| 午夜精品国产一区二区电影| 国产精品国产三级专区第一集| 99久久精品国产国产毛片| 日韩,欧美,国产一区二区三区| 日本vs欧美在线观看视频| 人妻少妇偷人精品九色| 国产毛片在线视频| 国产成人91sexporn| 亚洲四区av| 欧美人与善性xxx| 久久精品久久久久久噜噜老黄| 人妻人人澡人人爽人人| 亚洲第一av免费看| 母亲3免费完整高清在线观看 | 成人影院久久| 中文字幕人妻熟女乱码| 校园人妻丝袜中文字幕| 黑人巨大精品欧美一区二区蜜桃| 亚洲成色77777| 日韩一卡2卡3卡4卡2021年| 美女国产高潮福利片在线看| 深夜精品福利| 婷婷色综合大香蕉| 美国免费a级毛片| 国产一级毛片在线| 色网站视频免费| 久久久久久伊人网av| www.熟女人妻精品国产| 久久精品久久久久久久性| 久久精品熟女亚洲av麻豆精品| 精品国产露脸久久av麻豆| 精品国产一区二区久久| 丰满少妇做爰视频| 免费少妇av软件| 久久免费观看电影| 黄片播放在线免费| 97在线人人人人妻| 国产成人精品久久二区二区91 | 国产av国产精品国产| 赤兔流量卡办理| 久久久久国产一级毛片高清牌| 伊人久久大香线蕉亚洲五| 成人手机av| 午夜激情av网站| 美女脱内裤让男人舔精品视频| 一区二区三区四区激情视频| 在线精品无人区一区二区三| 丰满乱子伦码专区| 午夜影院在线不卡| 国产精品一国产av| 亚洲综合精品二区| 国产伦理片在线播放av一区| 美女国产视频在线观看| 久久久久精品性色| 国产成人欧美| 亚洲精品美女久久av网站| 精品国产一区二区久久| 丝袜脚勾引网站| 90打野战视频偷拍视频| 国产国语露脸激情在线看| 人人澡人人妻人| 丝袜脚勾引网站| 国产乱人偷精品视频| av.在线天堂| 丰满迷人的少妇在线观看| 亚洲美女搞黄在线观看| 成人毛片60女人毛片免费| 久久人人爽av亚洲精品天堂| 久久狼人影院| 欧美精品国产亚洲| 精品国产一区二区三区四区第35| 亚洲av男天堂| 91成人精品电影| 久久久精品国产亚洲av高清涩受| 伊人久久大香线蕉亚洲五| 成人黄色视频免费在线看| 国产精品国产三级国产专区5o| 电影成人av| 五月天丁香电影| 日本黄色日本黄色录像| 国产精品一区二区在线不卡| 18禁国产床啪视频网站| 亚洲国产精品一区三区| 国产伦理片在线播放av一区| 青青草视频在线视频观看| 蜜桃在线观看..| 国产亚洲午夜精品一区二区久久| 久久精品aⅴ一区二区三区四区 | 老汉色∧v一级毛片| 欧美精品一区二区大全| xxx大片免费视频| 伊人亚洲综合成人网| 又粗又硬又长又爽又黄的视频| 激情五月婷婷亚洲| 一区二区三区乱码不卡18| 亚洲精品国产av蜜桃| 免费高清在线观看日韩| 国产国语露脸激情在线看| 亚洲一区中文字幕在线| 亚洲精品中文字幕在线视频| 满18在线观看网站| 亚洲av.av天堂| 人人妻人人添人人爽欧美一区卜| 精品国产超薄肉色丝袜足j| 久久久a久久爽久久v久久| 天天躁夜夜躁狠狠久久av| 精品少妇久久久久久888优播| www.自偷自拍.com| 在线看a的网站| 可以免费在线观看a视频的电影网站 | 国产精品av久久久久免费| 少妇的丰满在线观看| 亚洲精品av麻豆狂野| 熟妇人妻不卡中文字幕| 亚洲精品美女久久av网站| 免费观看a级毛片全部| 91在线精品国自产拍蜜月| 久久久久久免费高清国产稀缺| 久久久久国产网址| 制服诱惑二区| 日韩欧美精品免费久久| 日日啪夜夜爽| 亚洲精品aⅴ在线观看| 王馨瑶露胸无遮挡在线观看| 欧美老熟妇乱子伦牲交| 最新中文字幕久久久久| 亚洲精品成人av观看孕妇| 精品国产一区二区三区久久久樱花| 国产日韩一区二区三区精品不卡| 精品亚洲成a人片在线观看| 丝袜人妻中文字幕| 青春草亚洲视频在线观看| 熟妇人妻不卡中文字幕| 成人毛片a级毛片在线播放| 亚洲欧洲精品一区二区精品久久久 | 亚洲成色77777| 久久久久久伊人网av| 国产精品嫩草影院av在线观看| 国产毛片在线视频| 一区二区av电影网| 一二三四中文在线观看免费高清| 国产又爽黄色视频| 两性夫妻黄色片| av国产精品久久久久影院| 日韩制服丝袜自拍偷拍| 在线天堂最新版资源| 欧美中文综合在线视频| 建设人人有责人人尽责人人享有的| 欧美最新免费一区二区三区| 中文精品一卡2卡3卡4更新| 青春草国产在线视频| 亚洲精品美女久久久久99蜜臀 | 男女无遮挡免费网站观看| 亚洲国产av影院在线观看| 一边摸一边做爽爽视频免费| 日本免费在线观看一区| 午夜免费鲁丝| 久久狼人影院| 久久精品国产亚洲av高清一级| 久久狼人影院| 香蕉国产在线看| 丝袜脚勾引网站| 最近中文字幕2019免费版| 国产综合精华液| 1024香蕉在线观看| 久久久精品94久久精品| av在线app专区| 香蕉国产在线看| 春色校园在线视频观看| 国产成人一区二区在线| 美女国产视频在线观看| 成年av动漫网址| 午夜av观看不卡| 欧美成人午夜精品| 亚洲一区二区三区欧美精品| 亚洲精品日本国产第一区| 久久人妻熟女aⅴ| 亚洲综合精品二区| 欧美日韩综合久久久久久| 啦啦啦视频在线资源免费观看| 中文字幕人妻丝袜一区二区 | 又粗又硬又长又爽又黄的视频| 国产亚洲av片在线观看秒播厂| 最新中文字幕久久久久| 亚洲三区欧美一区| 男女下面插进去视频免费观看| 美女福利国产在线| 亚洲男人天堂网一区| 国产激情久久老熟女| 99久久人妻综合| 国产精品一国产av| 欧美日韩精品网址| 成人亚洲精品一区在线观看| 久久人人爽av亚洲精品天堂| 久久精品aⅴ一区二区三区四区 | 性色avwww在线观看| 不卡视频在线观看欧美| 国产激情久久老熟女| 国产精品无大码| 99久国产av精品国产电影| 久久久久精品人妻al黑| 国产成人av激情在线播放| 18+在线观看网站| 欧美少妇被猛烈插入视频| 久久人人97超碰香蕉20202| 亚洲欧洲国产日韩| 99久久人妻综合| 久久久久精品久久久久真实原创| 一边摸一边做爽爽视频免费| 亚洲av日韩在线播放| 欧美日韩国产mv在线观看视频| 欧美激情 高清一区二区三区| 亚洲av福利一区| 丁香六月天网| 少妇人妻 视频| 一区二区三区激情视频| 久久久久久久久久久久大奶| 日韩免费高清中文字幕av| 色94色欧美一区二区| 久久 成人 亚洲| 久久亚洲国产成人精品v| 男女边吃奶边做爰视频| 国产又爽黄色视频| 国产精品人妻久久久影院| 狠狠精品人妻久久久久久综合| 国产 一区精品| 三上悠亚av全集在线观看| 亚洲成国产人片在线观看| 少妇被粗大的猛进出69影院| 啦啦啦视频在线资源免费观看| 狠狠婷婷综合久久久久久88av| 九色亚洲精品在线播放| 欧美日韩一级在线毛片| 亚洲第一av免费看| 欧美日韩视频高清一区二区三区二| 亚洲经典国产精华液单| 欧美日韩精品网址| 少妇被粗大猛烈的视频| 久久久久久久亚洲中文字幕| 9色porny在线观看| 国产精品av久久久久免费| 欧美精品亚洲一区二区| 久久精品国产自在天天线| 久久精品国产亚洲av天美| 国产精品人妻久久久影院| a级片在线免费高清观看视频| 免费观看无遮挡的男女| 国产成人精品无人区| 国产精品国产三级国产专区5o| 亚洲欧美成人综合另类久久久| 精品国产一区二区三区四区第35| 午夜免费鲁丝| 午夜福利在线观看免费完整高清在| 国产精品国产三级国产专区5o| 一区二区av电影网| 国产av一区二区精品久久| 亚洲 欧美一区二区三区| 天堂中文最新版在线下载| 青春草国产在线视频| 精品一区二区免费观看| 成年女人在线观看亚洲视频| 国产av国产精品国产| 亚洲国产精品一区二区三区在线| 婷婷成人精品国产| 日韩中文字幕视频在线看片| 熟女av电影| 咕卡用的链子| 2022亚洲国产成人精品| 久久精品国产亚洲av天美| 亚洲欧洲日产国产| 日韩熟女老妇一区二区性免费视频| 国产片特级美女逼逼视频| 哪个播放器可以免费观看大片| 欧美精品高潮呻吟av久久| 国产日韩一区二区三区精品不卡| 人体艺术视频欧美日本| 日韩一区二区三区影片| 一级毛片 在线播放| 亚洲第一青青草原| 婷婷色综合www| 大香蕉久久成人网| 天天躁狠狠躁夜夜躁狠狠躁| 黑人欧美特级aaaaaa片| 免费女性裸体啪啪无遮挡网站| 性色av一级| 免费不卡的大黄色大毛片视频在线观看| 午夜免费男女啪啪视频观看| 久久精品国产综合久久久| a级毛片在线看网站| 亚洲美女搞黄在线观看| 国产片内射在线| 久久久久久久久久人人人人人人| 一级黄片播放器| 国产一区二区在线观看av| 久久久欧美国产精品| videossex国产| 免费高清在线观看视频在线观看| videos熟女内射| 亚洲情色 制服丝袜| 精品国产乱码久久久久久男人| 激情视频va一区二区三区| 免费不卡的大黄色大毛片视频在线观看| 伦精品一区二区三区| 丝袜美足系列| 肉色欧美久久久久久久蜜桃| 国产精品嫩草影院av在线观看| 成人毛片60女人毛片免费| 丝袜脚勾引网站| 日韩一本色道免费dvd| 侵犯人妻中文字幕一二三四区| 精品人妻熟女毛片av久久网站| 欧美激情高清一区二区三区 | 国产精品一区二区在线不卡| www.av在线官网国产| 9191精品国产免费久久| 欧美最新免费一区二区三区| 午夜91福利影院| 亚洲精品美女久久av网站| 午夜老司机福利剧场| 美女大奶头黄色视频| 婷婷成人精品国产| 极品人妻少妇av视频| 一级爰片在线观看| 日韩av免费高清视频| 日韩精品免费视频一区二区三区| 搡老乐熟女国产| 国产白丝娇喘喷水9色精品| 超碰成人久久| 久久久亚洲精品成人影院| 国产一级毛片在线| 亚洲伊人久久精品综合| 丝袜喷水一区| 欧美国产精品一级二级三级| 亚洲人成网站在线观看播放| 久久热在线av| 不卡视频在线观看欧美| 美女福利国产在线| 精品国产乱码久久久久久男人| www日本在线高清视频| 丝袜人妻中文字幕| 女的被弄到高潮叫床怎么办| 亚洲综合色惰| 一区福利在线观看| 久久综合国产亚洲精品| 女性生殖器流出的白浆| 性色avwww在线观看| 1024视频免费在线观看| 一个人免费看片子| 免费观看无遮挡的男女| 2022亚洲国产成人精品| 日本欧美视频一区| 嫩草影院入口| 国产一区二区三区av在线| 在线观看免费视频网站a站| 午夜91福利影院| 男人操女人黄网站| 成人午夜精彩视频在线观看| 亚洲精品国产av成人精品| 欧美日韩一级在线毛片| 日韩在线高清观看一区二区三区| 不卡av一区二区三区| 成人国产麻豆网| 18+在线观看网站| 老司机影院成人| 日本vs欧美在线观看视频| 国产在线视频一区二区| 97精品久久久久久久久久精品|