• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于多任務學習的生成式閱讀理解

    2022-01-20 12:48:32黃榮濤鄒博偉
    中文信息學報 2021年12期
    關鍵詞:多任務集上段落

    錢 錦,黃榮濤,鄒博偉,2,洪 宇

    (1. 蘇州大學 計算機科學與技術學院,江蘇 蘇州 215006;2. 新加坡資訊通信研究院,新加坡 138632)

    0 引言

    機器閱讀理解是在閱讀和理解自然語言的基礎上,根據(jù)文本內容回答用戶提出的問題,是當前自動問答領域的研究熱點之一。

    近年來,隨著大規(guī)模閱讀理解數(shù)據(jù)集的構建,如SQuAD[1]、HotpotQA[2]、CoQA[3]等,以及預訓練模型的提出,如BERT[4]、UniLM[5]、ENRIE-GEN等[6],機器閱讀理解技術取得了巨大發(fā)展。目前主流的機器閱讀理解模型通常將答案設定為段落中的一個連續(xù)片段,這種抽取式閱讀理解模型存在一定的局限性,僅能直接以段落中的片段作為答案,導致在針對某些問題時,無法給出自然流暢的答案,例如,表1段落(a)中的True/False問題。此外,如果將問題與答案分離,僅根據(jù)答案無法獲得完整清晰的信息。表1中段落(b)中例子所示,嚴格意義上說,抽取式模型給出的答案“Season 5(第5季)”并不通順,在某些應用場景(如聊天機器人)中,會對用戶體驗造成影響。

    表1 抽取式與生成式機器閱讀理解

    與抽取式閱讀理解相比,生成式閱讀理解不再局限于直接從段落片段中抽取答案,而是參考段落、問題,甚至詞表,生成更為自然和完整的表述作為答案。例如,表1段落(a)中,生成式閱讀理解模型給出的答案能夠與問題更自然地銜接;而表1段落(b)中的生成式答案與抽取式答案相比更完整,確保了答案在獨立于問題和段落時仍能夠保持完整的信息。而現(xiàn)有的生成式閱讀理解模型通常基于整個段落生成答案,缺乏對答案邊界和問題類型信息的理解,生成答案有時未參考段落中用于生成答案的片段以及問題的具體類型,導致生成的答案和真實答案之間存在一定差距。

    為解決上述問題,本文提出一種基于多任務學習的生成式閱讀理解框架。多任務學習能夠學到多個關聯(lián)任務的共享表示,并適應這些不同但相關的任務目標,使主任務獲得更強的泛化性能?;诖?,本文將答案生成任務作為主任務,將答案抽取和問題分類任務作為輔助任務,在訓練階段,通過多任務學習的參數(shù)共享機制,讓模型在生成答案的同時加強對答案邊界和問題類型的理解,從而讓答案抽取和問題分類任務輔助答案生成任務,最終提升生成式閱讀理解模型的泛化性能。

    針對答案生成任務,本文提出的生成式閱讀理解模型由編碼層和任務層組成。其中,編碼層基于深度雙向Transformer[7]編碼器,并借鑒UniLMV2[8]模型中特殊設計的自注意力掩碼機制控制答案生成過程中的可見信息;任務層分為答案生成模型、答案抽取模型和問題分類模型,答案生成模型在訓練階段通過預測被遮蔽答案單詞的原始信息,增強模型的生成能力,在測試階段直接采用訓練好的編碼層,以及束搜索(Beam Search)[9]對問題和段落進行解碼,生成答案;答案抽取模型采用指針網(wǎng)絡[10]識別答案在段落中的起始位置和結束位置;問題分類模型采用線性層判斷問題的具體類型。

    本文實驗采用CoQA[3]、MS MARCO[11]和NarrativeQA[12]三個閱讀理解數(shù)據(jù)集驗證模型性能。實驗結果表明,本文模型在CoQA語料上取得了86.7%的F1值,比目前最好的生成模型提升了2.20%;在MS MARCO和NarrativeQA語料上的BLEU-1值分別為80.53%和57.94%,分別比目前最好的系統(tǒng)提升了2.39%和3.81%(絕對性能提升)。

    本文的主要貢獻如下:

    (1) 提出基于多任務學習的生成式閱讀理解模型,通過答案抽取模型和問題分類模型優(yōu)化生成式閱讀理解模型的性能。

    (2) 本文在三個閱讀理解數(shù)據(jù)集上進行詳細實驗,均取得了目前生成式模型的最佳性能。

    1 相關工作

    1.1 生成式機器閱讀理解

    近年來,隨著如SQuAD[1]、TriviaQA[13]、SearchQA[14]、HotpotQA[2]和QuAC[15]等大規(guī)模閱讀理解數(shù)據(jù)集的構建,以及在以神經(jīng)網(wǎng)絡為代表的深度學習技術和計算資源的推動下,機器閱讀理解領域獲得了巨大發(fā)展。目前,MS MARCO[11]、NarrativeQA[12]和CoQA[3]等數(shù)據(jù)集提供人工編輯生成的答案,要求機器能夠理解問題和段落中相關句子的潛在聯(lián)系,依賴一定的推理能力生成正確的答案,而非簡單的文本匹配。隨著生成式閱讀理解數(shù)據(jù)集的發(fā)布以及自然語言生成技術的發(fā)展,研究者開始關注使用生成模型來解決閱讀理解問題。McCann等人[16]和Bauer等人[17]采用基于RNN的指針生成機制進行單文檔閱讀理解答案的生成,Tan等人[18]在多文檔閱讀理解中采用管道(Pipeline)的方法,先從多篇文檔中抽取出最有可能成為答案的片段,然后將該片段作為答案合成模塊(Seq2Seq生成模型)的一個特征,最后綜合問題、文檔和抽取特征合成答案。而本文所提出的是端到端的生成式閱讀理解模型,旨在讓答案生成、答案抽取以及問題分類共享模型編碼層參數(shù)并進行優(yōu)化,最終達到提升生成模型性能的目的。

    目前,預訓練模型如Mass[19]、UniLM[5]、BART[20]以及ERNIE-GEN[6]等在各個自然語言生成任務中相繼取得最佳性能,這些模型只需在特定任務(如閱讀理解、文本摘要以及機器翻譯等)進行微調就能取得令人滿意的成績。其中,Bao等人[8]提出UniLMV2模型,其使用一種新穎的偽遮蔽語言模型(pseudo-masked language model, PMLM)將自編碼模型和部分自回歸模型統(tǒng)一起來訓練,在問題生成、自動摘要等多個領域取得當前的最佳性能。本文將UniLMV2模型作為基線模型,并在此基礎上進行多任務學習的實驗。

    1.2 多任務學習

    多任務學習是一種提高泛化性能的遷移機制,現(xiàn)有研究表明它在提高模型泛化能力上十分有效。該機制同時學習多個相關任務,讓這些任務同時共享知識,利用任務之間的相關性,提升每個任務的泛化性能。多任務學習的一般做法是,在所有任務上共享模型編碼層,而針對特定的任務層有所區(qū)別。例如,Wang等人[21]證明通過共享文檔排序任務和多文檔閱讀理解任務的編碼層能夠提升整體的性能。Nishida等人[22]在閱讀理解、文檔排序和問題分類三種任務上共享問題和文章閱讀模塊,有效提升了模型的整體性能。Liu等人[23]提出的MT-DNN模型在BERT的基礎上對4種下游任務單句分類、成對文本分類、文本相似度打分和相關性排序進行聯(lián)合微調,在性能上較BERT有了極大提升,證明了多任務學習能有效提升模型的泛化性能。此外,與MT-DNN模型在下游任務上進行多任務學習不同,ERNIE 2.0[24]在模型預訓練階段引入多任務學習,通過和多個先驗知識庫進行交互并采用增量學習的方式,使得模型能夠學會多樣化的語言知識,最終在各種下游任務上性能得到提升。

    受到上述工作的啟發(fā),為了解決現(xiàn)有的生成式閱讀理解模型缺乏對答案邊界信息和問題類別信息的理解的問題,本文提出基于多任務學習的生成式閱讀理解模型,通過答案抽取模型和問題分類模型優(yōu)化生成式閱讀理解模型性能。

    2 基于多任務學習的生成式閱讀理解模型

    本節(jié)首先給出生成式閱讀理解問題的形式化定義;然后介紹模型的編碼層;最后介紹模型的任務層,其具體由答案生成模型、答案抽取模型和問題分類模型三部分組成?;诙嗳蝿諏W習的生成式閱讀理解模型框架如圖1所示。

    圖1 基于多任務學習的生成式閱讀理解框架

    2.1 問題定義

    (1)

    其中,P(a|Q,P)表示在給定Q和P的條件下,生成答案的對數(shù)條件概率。

    2.2 編碼層

    本文基于預訓練模型UniLMv2(1)https://github.com/microsoft/unilm構建編碼層,采用預訓練的BERT進行問題和段落的交互,得到其表示,并在BERT的基礎上改進注意力遮蔽矩陣,采用偽遮蔽語言模型,使得模型能在閱讀理解任務上根據(jù)問題和段落逐字或逐片段預測被遮蔽的答案。以下介紹編碼層的具體工作原理和過程。

    預處理階段,采用WordPiece分詞工具,將問題、段落和答案分詞,得到子詞(sub-word)級別的若干詞項,其中對答案中的部分詞項以一定概率進行遮蔽,并將其拼接后作為模型輸入。每個詞項表示為詞向量WE(wi)、段向量SE(wi)和位置向量PE(wi)的和,維度均為dw,其中詞向量用于表示不同詞項,段向量用于區(qū)分詞來自源序列還是目標序列,位置向量用于表示詞在輸入序列中的絕對位置。詞向量Xi表示如式(2)所示。

    Xi=WE(wi)+SE(wi)+PE(wi)

    (2)

    其中,wi為第i個位置的詞項。

    (3)

    Tranformer網(wǎng)絡由多頭自注意力機制和前向神經(jīng)網(wǎng)絡兩個子層組成,每個子層均使用殘差連接和層正則化,因此每個子層的輸出可表示如式(4)所示。

    LayerNorm(x+SubLayer(x))

    (4)

    第l層Transformer網(wǎng)絡的自注意力頭Al計算如式(5)~式(7)所示。

    圖2 注意力遮蔽矩陣

    通過上述詞嵌入層和Tranformer網(wǎng)絡,得到輸入序列的上下文表示H1,H2,…,H12。本文使用最后一層輸出H12作為整個序列的表示。H12中包含問題、段落和答案表示,其中,段落表示部分記作Hp,答案表示部分記作Ha,問題類別表示記作Hcls。根據(jù)圖2所示的注意力遮蔽矩陣可知,問題和段落不會和答案進行交互,保證了訓練和測試階段Hp和Hcls所含信息的一致性。

    2.3 任務層

    作為基于多任務學習框架的核心部分,任務層由答案生成模型、答案抽取模型和問題分類模型三部分構成。

    2.3.1 答案生成模型

    訓練階段,真實答案會以一定概率被隨機遮蔽,并且同時保留其原始位置信息來實現(xiàn)部分自回歸(隨機預測答案被遮蔽的片段),答案中被遮蔽的詞項在經(jīng)過編碼后得到答案表示Ha。答案生成模塊通過解碼層對原始答案中被遮蔽的詞項進行預測來生成答案。具體來說,Ha首先經(jīng)過線性層并用Gelu函數(shù)激活后進行層正則化,如式(8)所示。

    Ha=LayerNorm(Gelu(Linear(Ha)))

    (8)

    然后通過線性層將每個被遮蔽的詞項映射到模型詞表空間,獲得預測分數(shù)。最后,使用Softmax函數(shù)計算詞的概率向量α,如式(9)所示。

    α=Softmax(Linear(Ha))

    (9)

    本文采用有標簽平滑優(yōu)化的交叉熵損失函數(shù)計算答案生成模型的目標函數(shù),如式(10)所示。

    (10)

    測試階段,模型對輸入的問題和段落,每個時間步經(jīng)解碼層預測當前詞的生成概率,同時使用束搜索每次保留生成概率最大的前k個序列,直至模型預測出[EOS]終止符結束解碼。最后,模型將束搜索結果中生成概率最大的序列解碼輸出,其概率計算,如式(11)所示。

    (11)

    2.3.2 答案抽取模型

    經(jīng)過編碼層后,段落被表示為矩陣Hp,答案抽取模型通過指針網(wǎng)絡對答案的起始和終止位置進行識別。具體地,Hp分別經(jīng)過線性層得到對應起始位置分數(shù)和終止位置分數(shù),并通過Softmax函數(shù)對分數(shù)進行歸一化,得到相應的概率向量,如式(12)所示。

    s,e=Softmax(Linear(Hp))

    (12)

    其中,s為預測答案的起始位置概率向量,e為答案終止位置概率向量,s和e由不同參數(shù)的線性層計算得到。

    本文采用交叉熵損失函數(shù)計算答案抽取模型的目標函數(shù),如式(13)所示。

    Lextract=ys·logs+ye·loge

    (13)

    其中,ys表示真實答案的起始位置概率向量,ye表示真實答案的終止位置概率向量。

    2.3.3 問題分類模型

    由于CoQA數(shù)據(jù)集中存在多種問題類型,包括事實型問題(Factoid question)、是非類問題(True/False question)和不可回答問題(Unanswerable question)。針對不同類型的問題,答案的模式通常差別較大,例如是非類問題,答案通常以“Yes/No”頭。本文采用4種問題類型標簽{0: yes;1: no;2: unanswerable;3: factoid},以上四種問題類型(其中是非類問題被分為兩種不同類型)。如圖1所示,輸入經(jīng)過編碼后,取出[CLS]表示用于獲得問題類型表示,即Hcls,并經(jīng)過線性層為問題類型打分,最后將分數(shù)進行歸一化后形成分類概率,如式(14)所示。

    c=Softmax(Linear(Hcls))

    (14)

    其中,c代表問題類型的分數(shù)向量。

    本文采用交叉熵損失函數(shù)計算問題分類模型的目標函數(shù),如式(15)所示。

    (15)

    其中,K=4表示問題類別數(shù),yck表示真實類別標簽,ck表示預測類別標簽。

    2.3.4 多任務學習

    本文采用多任務學習的方法,在訓練階段同時學習和更新答案生成、答案抽取和問題分類模塊共享的編碼層參數(shù),讓答案抽取和問題分類任務輔助答案生成任務提升閱讀理解模型的性能。模型的損失由生成損失、抽取損失和分類損失三部分共同組成,整個模型的目標函數(shù)為,如式(16)所示。

    LOSS=Lgenerate+λ1Lextract+λ2Lcls

    (16)

    其中,λ1和λ2為調和系數(shù),用于調節(jié)輔助任務權重。

    3 實驗

    本節(jié)首先介紹生成式閱讀理解任務數(shù)據(jù)集和實驗設置,然后報告本文提出的基于多任務的生成式閱讀理解模型性能,并針對實驗結果進行分析。

    3.1 生成式閱讀理解任務數(shù)據(jù)集

    現(xiàn)有閱讀理解數(shù)據(jù)集大多針對抽取式模型,即答案為篇章中的一個片段,如SQuAD[1]、HotpotQA[2]等。采用這些數(shù)據(jù)集無法全面評價生成式閱讀理解模型。與抽取式模型相比,其在答案的可讀性、表述的完整性及應對多段答案的問題上,均有較大區(qū)別(詳見本文第一節(jié))。基于上述原因,本文實驗中采用以下三個數(shù)據(jù)集。

    CoQA(2)https://stanfordnlp.github.io/coqa/(Conversational Question Answering): CoQA基于多個領域的多輪對話進行構建,并保持了人類對話簡短的特征,存在大量指代和省略現(xiàn)象,問題和答案普遍偏短[3]。值得注意的是,為了保證該數(shù)據(jù)集盡可能貼近自然對話,其中78%的答案經(jīng)過人工編輯;此外,該數(shù)據(jù)集中存在較多的是非類問題(19.8%)和不可回答問題(1.3%),部分問題無法僅采用抽取式閱讀理解模型回答。盡管如此,目前在CoQA評測榜單上排名較高的均為抽取式模型,而生成式模型,如UniLM和ERNIE-GEN,僅報告了在驗證集上的性能,因此,本文將CoQA的驗證集作為測試集評價系統(tǒng)性能,調參使用的驗證集從CoQA訓練集中劃分。

    MSMARCO(3)https://microsoft.github.io/msmarco/(Microsoft Machine Reading Comprehension): MS MARCO是一個多文檔問答數(shù)據(jù)集,其中特別提供了一個自然語言生成(NLG)子數(shù)據(jù)集[11],該數(shù)據(jù)集由人工編輯答案,其答案并非嚴格匹配文檔中的片段,因此,本文采用MS MARCO(NLG)作為評價生成式閱讀理解模型的數(shù)據(jù)集。注意,由于該數(shù)據(jù)集還包含了文檔檢索任務,而本文研究重點僅在于機器閱讀理解,因此僅采用人工編輯答案時依據(jù)的文檔,即最佳文檔(golden passage)。此外,由于在MS MARCO評測榜單上NLG數(shù)據(jù)集同樣包含了文檔檢索任務,因此本文僅報告模型在MS MARCO(NLG)驗證集上的結果。

    NarrativeQA(4)https://github.com/deepmind/narrativeqa: NarrativeQA是一個生成式閱讀理解數(shù)據(jù)集,該數(shù)據(jù)集基于書本故事和電影腳本構建,答案由人工編輯[12]。本文基于數(shù)據(jù)集的摘要子集進行閱讀理解,并在其測試集上進行測試。

    表2列出了本文所采用三個數(shù)據(jù)集的統(tǒng)計數(shù)據(jù)。CoQA中存在28.7%的命名實體類問題、19.6%的名詞短語類問題和9.8%的數(shù)字類問題;NarrativeQA中存在30.54%的人名類問題、9.73%的地點類問題和約10%左右的事件、實體、數(shù)字類問題,且CoQA和NarrativeQA明確允許簡短、自然的答案,因此CoQA和NarrativeQA的答案普遍較短。 MS MARCO(NLG)中存在53.12%的描述型問題,且答案會融入問題信息形成完整的表述,答案普遍較長。

    表2 CoQA、MS MARCO和NarrativeQA數(shù)據(jù)集

    3.2 實驗設置

    本文使用的模型為微軟開源的unilm1.2-base-uncased(5)https://github.com/microsoft/unilm,該模型在大多數(shù)自然語言生成任務上取得了最佳性能。針對不同數(shù)據(jù)集,表3列出了模型使用的超參數(shù)設置。

    表3 參數(shù)設置

    在CoQA多輪對話數(shù)據(jù)集中,當前問題可能存在指代或省略現(xiàn)象,因此本文選取當前問題之前的至多兩輪問答對作為對話歷史,并與當前問題進行拼接,當作完整的問題Q,同時使用上一輪答案和當前問題的詞在段落中出現(xiàn)的頻率選取文章中最佳的段落作為段落P。訓練時,根據(jù)答案A計算出其在段落P中的起始位置和終止位置(答案不在段落中時,起始位置和終止位置均設為0)。實驗中,問題最大長度為60,問題和段落(源序列)的最大長度為470,答案(目標序列)的最大長度為42,該數(shù)據(jù)處理與Dong等人[5]論文里的方法保持一致。模型的優(yōu)化器為AdamW。

    在MS MARCO多文檔閱讀理解數(shù)據(jù)集中,每個問題Q會給定10個參考段落,本文直接選取最佳的段落進行拼接作為段落P。訓練時,根據(jù)答案A計算出其在段落P中的起始位置和終止位置(答案不在段落中時,起始位置和終止位置均設為0)。實驗中,問題和段落(源序列)的最大長度為176,答案(目標序列)的最大長度為40。模型的優(yōu)化器為AdamW。

    在NarrativeQA數(shù)據(jù)集中,本文使用問題Q的詞在段落中出現(xiàn)的頻率選取摘要中最佳的段落作為段落P。訓練時,使用F1值選取段落P中與答案A最為接近的片段作為抽取答案,并根據(jù)抽取答案計算出答案A在段落P中的起始位置和終止位置。實驗中,問題和段落(源序列)的最大長度為470,答案(目標序列)的最大長度為42。模型的優(yōu)化器為AdamW。

    本文在CoQA數(shù)據(jù)集上使用F1值[1]來評價模型的性能,在MS MARCO和NarrativeQA數(shù)據(jù)集上使用BLEU[25]和ROUGE-L[26]來評價模型的性能。

    3.3 實驗結果與分析

    為了驗證本文基于多任務的生成式閱讀理解方法的有效性,本文與以下閱讀理解模型進行了比較:

    UniLM[5]: 由Dong等人提出,是第一個在CoQA數(shù)據(jù)集上報告實驗性能的預訓練生成模型,本文在實驗設置上和它保持一致。

    ERNIE-GEN[6]: 由Xiao等人提出的基于多流(multi-flow)機制生成完整語義片段的預訓練生成模型,在CoQA生成式閱讀理解中達到了目前最好的性能。

    Masque[22]: 由Nishida等人提出的多風格生成式閱讀理解模型,在MS MARCO(NLG)和NarrativeQA數(shù)據(jù)集的相關指標上達到了目前的最好性能。

    UniLMv2[8]: 由Bao等人提出,采用偽遮蔽語言模型的預訓練生成模型,是UniLM的改進版本。本文使用UniLMv2分別在三個數(shù)據(jù)集上進行實現(xiàn)作為我們的基線模型,并簡單修復了wordpiece分詞在解碼時出現(xiàn)的分詞錯誤。

    MLT-Model: 本文提出的基于多任務學習的生成式閱讀理解模型,由答案抽取和問題分類任務輔助生成式閱讀理解模型。

    表4為本文提出的模型在CoQA驗證集上的性能,我們的模型在F1指標上比當前性能最好的生成式模型ERNIE-GEN提升了2.2%,同時較基線模型UniLMv2提升了0.6%。本文針對預訓練生成模型在答案解碼時出現(xiàn)的子詞結合不準確問題加以修復,實現(xiàn)的基線模型UniLMv2高于原始版本的性能,較ERNIE-GEN提升1.6%的F1值。

    表4 模型在CoQA驗證集上的性能

    表5列出了本文模型在CoQA上的消融實驗性能,在去除答案抽取任務和問題分類任務之后,性能較MLT-Model分別下降0.5%和0.7%的F1值。這是由于CoQA中存在20%左右的是非類問題和不可回答問題,這兩類問題在訓練階段答案的起始和終止位置均設為0,因此僅用答案抽取任務輔助生成模型,會弱化模型對這兩類問題的生成能力;而僅用問題分類任務來輔助生成模型,模型會缺少對答案在段落中邊界信息的理解,所以只有將答案抽取和問題分類任務一起和答案生成任務進行多任務學習,才能從整體上提升生成模型的性能。

    表5 模型在CoQA驗證集上的消融實驗

    表6為本文提出的模型在MS MARCO(NLG)驗證集上選取最佳文檔的性能表現(xiàn)。本文模型較基線模型UniLMv2在BLEU-1指標上提升0.77%,在BLEU-4指標上提升0.95%,在ROUGE-L指標上提升0.55%。這是由于MS MARCO(NLG)數(shù)據(jù)集中答案和選定段落中的部分片段相似度較高,答案抽取任務能夠輔助模型關注答案在段落中的邊界信息,并增強生成模型對問題和段落中答案片段之間關系的理解,最終提升生成模型的性能。我們在同樣設置下和Masque模型進行了對比,本文所提模型在BLEU-1指標上提升了2.39%,ROUGE-L指標上提升了1.84%。這主要是由于Masque模型僅使用靜態(tài)的預訓練詞向量并基于Transformer網(wǎng)絡進行答案生成,而本文模型基于網(wǎng)絡更加復雜的預訓練模型UniLMv2生成答案,因此在實驗性能上取得較大提升。

    表6 模型在MS MARCO(NLG)驗證集的消融實驗

    表7為本文模型在NarrativeQA(summary)測試集上的性能表現(xiàn)。本文模型較基線模型UniLMv2在BLEU-1指標上提升0.39%,BLEU-4指標上提升0.61%,ROUGE-L指標上提升0.1%。NarrativeQA數(shù)據(jù)集的答案長度普遍偏短,因此我們的模型并未在ROUGE-L指標上有明顯性能提升,但是BLEU指標證明了答案抽取任務有助于生成模型生成更準確的答案。此外本文模型較目前性能最好的Masque模型在BLUE-1指標上提升了3.81%,在BLEU-4指標上提升了1.24%,但在ROUGE-L指標上下降了0.53%??赡艿脑蚴荕asque模型基于整個摘要生成答案,而本文的模型是基于規(guī)則選取的滑窗作為段落來進行生成式閱讀理解,在選取滑窗時丟失了部分性能;Masque模型在該數(shù)據(jù)集上使用MS MARCO數(shù)據(jù)進行多風格學習,而本文模型并未采用增加額外訓練數(shù)據(jù)的方法訓練模型。我們還比較了在相同訓練數(shù)據(jù)的情況下,本文模型較Masque模型在BLEU-1指標上提升了8.83%,在BLEU-4指標上提升了10.69%,在ROUGE-L指標上提升了4.6%。該提升較在MS MARCO(NLG)數(shù)據(jù)集上更為顯著,主要原因為NarrativeQA的答案更偏向于推理性質的概括總結,而MS MARCO(NLG)的答案則更偏向于基于段落中的答案片段進行完整的表述,這也表明了MS MARCO(NLG)的任務難度比NarrativeQA小,預訓練模型在推理方法中更占優(yōu)勢。

    表7 模型在NarrativeQA(summary)測試集上的性能

    4 結語

    本文針對生成式閱讀理解模型缺乏答案邊界和問題分類信息理解的問題,提出一種基于多任務學習的生成式閱讀理解模型,通過答案抽取模型和問題分類模型優(yōu)化生成式閱讀理解模型。在三個閱讀理解數(shù)據(jù)集上的實驗結果表明,本文提出的基于多任務的生成式閱讀理解模型能夠有效地學習答案的邊界信息和問題分類信息,在三個數(shù)據(jù)集上均取得了目前生成式模型的最好性能。

    在未來的工作中,我們將研究如何將該模型遷移至面向長文本的機器閱讀理解任務上,使得該模型能夠學習整個長文本的同時確定答案的邊界信息,并以此生成答案。

    猜你喜歡
    多任務集上段落
    【短文篇】
    Cookie-Cutter集上的Gibbs測度
    鏈完備偏序集上廣義向量均衡問題解映射的保序性
    心理小測試
    基于中心化自動加權多任務學習的早期輕度認知障礙診斷
    夏天,愛情的第四段落
    散文詩(2017年17期)2018-01-31 02:34:11
    復扇形指標集上的分布混沌
    基于判別性局部聯(lián)合稀疏模型的多任務跟蹤
    自動化學報(2016年3期)2016-08-23 12:02:56
    弄清段落關系 按圖索驥讀文
    讀寫算(下)(2016年11期)2016-05-04 03:44:07
    基于多任務異步處理的電力系統(tǒng)序網(wǎng)絡拓撲分析
    電測與儀表(2016年5期)2016-04-22 01:13:46
    欧美黑人欧美精品刺激| 国产精品一区二区三区四区免费观看 | 久久久色成人| 美女cb高潮喷水在线观看| 高清毛片免费观看视频网站| 亚洲av熟女| 少妇的逼好多水| 亚洲五月天丁香| 熟女人妻精品中文字幕| 九九爱精品视频在线观看| 极品教师在线视频| 国产精品美女特级片免费视频播放器| 亚洲va在线va天堂va国产| 国产精品美女特级片免费视频播放器| 国产精品伦人一区二区| 乱码一卡2卡4卡精品| 亚洲欧美日韩高清在线视频| 欧美高清成人免费视频www| 国内精品一区二区在线观看| 在线天堂最新版资源| 国产精品综合久久久久久久免费| 人人妻人人澡欧美一区二区| 国产伦精品一区二区三区视频9| 欧美bdsm另类| 国产高清视频在线观看网站| 亚洲av一区综合| 欧美黑人巨大hd| 国产精品一区www在线观看 | 精品人妻1区二区| 久久亚洲精品不卡| 亚洲自偷自拍三级| 日韩强制内射视频| 一进一出抽搐动态| 国产精品电影一区二区三区| 亚洲国产日韩欧美精品在线观看| 日韩欧美在线二视频| 香蕉av资源在线| 欧美精品啪啪一区二区三区| 免费观看在线日韩| 午夜福利18| 国产蜜桃级精品一区二区三区| 欧美黑人欧美精品刺激| 99热只有精品国产| 91在线精品国自产拍蜜月| 国产精品一区www在线观看 | 国产白丝娇喘喷水9色精品| 99国产极品粉嫩在线观看| 十八禁网站免费在线| 女人十人毛片免费观看3o分钟| 欧美xxxx黑人xx丫x性爽| 可以在线观看的亚洲视频| 国内精品久久久久久久电影| 国内精品久久久久久久电影| 国产精品久久电影中文字幕| 99热精品在线国产| 国产探花极品一区二区| 国产精品综合久久久久久久免费| 3wmmmm亚洲av在线观看| 最新中文字幕久久久久| 亚洲精品色激情综合| 美女xxoo啪啪120秒动态图| 久久久久国内视频| 久久99热6这里只有精品| 老司机福利观看| 精品久久久噜噜| 在线观看免费视频日本深夜| 日韩欧美三级三区| 国产成人av教育| 中文字幕高清在线视频| 成人三级黄色视频| 午夜老司机福利剧场| 日本在线视频免费播放| 在线天堂最新版资源| 欧美日韩精品成人综合77777| 色吧在线观看| 国产精品嫩草影院av在线观看 | 看十八女毛片水多多多| 丰满人妻一区二区三区视频av| 午夜老司机福利剧场| 国产色爽女视频免费观看| 全区人妻精品视频| 88av欧美| 最新在线观看一区二区三区| 婷婷精品国产亚洲av| 日本 av在线| 中亚洲国语对白在线视频| 中文字幕人妻熟人妻熟丝袜美| 欧美日韩综合久久久久久 | 免费看日本二区| 亚洲va日本ⅴa欧美va伊人久久| 亚洲精品成人久久久久久| 亚洲av第一区精品v没综合| 国产v大片淫在线免费观看| 免费看光身美女| 日本色播在线视频| 18禁裸乳无遮挡免费网站照片| 又黄又爽又刺激的免费视频.| 永久网站在线| 欧美性猛交╳xxx乱大交人| 啦啦啦啦在线视频资源| 99久久九九国产精品国产免费| 国产蜜桃级精品一区二区三区| 午夜免费激情av| 欧美一级a爱片免费观看看| 91久久精品电影网| 亚洲欧美日韩卡通动漫| 精品久久久久久久久久免费视频| av在线观看视频网站免费| 免费观看人在逋| 99久国产av精品| 欧美激情久久久久久爽电影| 精品一区二区免费观看| av女优亚洲男人天堂| 日日摸夜夜添夜夜添小说| 欧美又色又爽又黄视频| 啪啪无遮挡十八禁网站| 窝窝影院91人妻| 神马国产精品三级电影在线观看| 少妇猛男粗大的猛烈进出视频 | 欧美日韩亚洲国产一区二区在线观看| 日本-黄色视频高清免费观看| 天堂√8在线中文| 午夜激情欧美在线| 免费无遮挡裸体视频| 免费av毛片视频| 99在线视频只有这里精品首页| 亚洲中文日韩欧美视频| 国产免费av片在线观看野外av| 免费观看的影片在线观看| 精品国内亚洲2022精品成人| av国产免费在线观看| 成人无遮挡网站| 国产精品一区二区免费欧美| 欧美又色又爽又黄视频| www.www免费av| 欧美最黄视频在线播放免费| av国产免费在线观看| 亚洲精品久久国产高清桃花| 天堂av国产一区二区熟女人妻| 亚洲真实伦在线观看| 国产高清有码在线观看视频| 国产探花在线观看一区二区| 97人妻精品一区二区三区麻豆| 欧美成人a在线观看| 级片在线观看| 人人妻,人人澡人人爽秒播| 两个人视频免费观看高清| 黄色丝袜av网址大全| 一区二区三区高清视频在线| 亚洲av一区综合| 中出人妻视频一区二区| 看免费成人av毛片| 91久久精品电影网| 欧美高清性xxxxhd video| 俄罗斯特黄特色一大片| 噜噜噜噜噜久久久久久91| 91在线精品国自产拍蜜月| 亚洲成人久久爱视频| 校园春色视频在线观看| 精品久久久久久久人妻蜜臀av| .国产精品久久| 日本色播在线视频| 18禁在线播放成人免费| 亚洲四区av| 中文字幕人妻熟人妻熟丝袜美| 99久久九九国产精品国产免费| 精品久久久久久,| 俄罗斯特黄特色一大片| 51国产日韩欧美| 可以在线观看毛片的网站| 国内精品美女久久久久久| 欧美精品国产亚洲| 日本一二三区视频观看| 久久久久精品国产欧美久久久| 亚洲最大成人中文| 2021天堂中文幕一二区在线观| 亚洲国产精品成人综合色| 国产色婷婷99| 最新中文字幕久久久久| 很黄的视频免费| 亚洲av二区三区四区| 亚洲av成人av| 国产69精品久久久久777片| .国产精品久久| 国产精品日韩av在线免费观看| 亚洲av不卡在线观看| av.在线天堂| 又紧又爽又黄一区二区| 舔av片在线| 亚洲国产精品久久男人天堂| 成人av一区二区三区在线看| 国产黄色小视频在线观看| 老女人水多毛片| 国产男靠女视频免费网站| 国模一区二区三区四区视频| 欧美人与善性xxx| 99热只有精品国产| 亚洲男人的天堂狠狠| 亚洲成人久久性| 岛国在线免费视频观看| 国产精品野战在线观看| 香蕉av资源在线| 国内精品久久久久久久电影| 全区人妻精品视频| 少妇猛男粗大的猛烈进出视频 | 精品无人区乱码1区二区| 国产精品98久久久久久宅男小说| 我要看日韩黄色一级片| 淫妇啪啪啪对白视频| 精品人妻视频免费看| 在现免费观看毛片| 又紧又爽又黄一区二区| 99国产精品一区二区蜜桃av| 国产亚洲精品综合一区在线观看| 99热网站在线观看| 日本撒尿小便嘘嘘汇集6| 亚洲人成网站在线播放欧美日韩| 一级毛片久久久久久久久女| 国产成人a区在线观看| 91av网一区二区| 最近在线观看免费完整版| 欧美日韩瑟瑟在线播放| 亚洲性夜色夜夜综合| 中文字幕人妻熟人妻熟丝袜美| 国产男靠女视频免费网站| 桃红色精品国产亚洲av| 国产黄片美女视频| 天美传媒精品一区二区| 少妇的逼水好多| 国产蜜桃级精品一区二区三区| 国产日本99.免费观看| 欧美区成人在线视频| 一级毛片久久久久久久久女| 中文字幕高清在线视频| 哪里可以看免费的av片| 天堂影院成人在线观看| 最新中文字幕久久久久| 老司机午夜福利在线观看视频| 免费在线观看影片大全网站| 久久久久国内视频| 国产精品国产高清国产av| 女生性感内裤真人,穿戴方法视频| 精品久久久久久成人av| av天堂在线播放| 在现免费观看毛片| 熟妇人妻久久中文字幕3abv| 一级a爱片免费观看的视频| 97碰自拍视频| 搡老岳熟女国产| 欧美黑人巨大hd| 日韩大尺度精品在线看网址| 午夜福利在线在线| 一级毛片久久久久久久久女| 一级av片app| 亚洲精品一卡2卡三卡4卡5卡| 亚洲av免费在线观看| 日韩av在线大香蕉| 欧美国产日韩亚洲一区| 国产精品98久久久久久宅男小说| 日韩欧美三级三区| 夜夜夜夜夜久久久久| 亚洲av二区三区四区| 久久中文看片网| 国产人妻一区二区三区在| 久久人妻av系列| 国产免费一级a男人的天堂| 国产高清激情床上av| 在线免费十八禁| 特级一级黄色大片| 久久欧美精品欧美久久欧美| 日本爱情动作片www.在线观看 | 1024手机看黄色片| 18+在线观看网站| 黄色女人牲交| 非洲黑人性xxxx精品又粗又长| 搞女人的毛片| 亚洲一级一片aⅴ在线观看| 美女高潮的动态| 在线观看66精品国产| 国产免费av片在线观看野外av| 欧美激情在线99| 中出人妻视频一区二区| 国产毛片a区久久久久| 国产高清激情床上av| 97热精品久久久久久| av专区在线播放| 亚洲国产精品sss在线观看| 亚洲精品久久国产高清桃花| 啦啦啦韩国在线观看视频| 亚洲精品一区av在线观看| av视频在线观看入口| 亚洲第一电影网av| 亚洲中文字幕一区二区三区有码在线看| 精品久久国产蜜桃| 欧美中文日本在线观看视频| 婷婷精品国产亚洲av| 国产一区二区在线av高清观看| 免费看av在线观看网站| av天堂中文字幕网| 国产一区二区激情短视频| 99久国产av精品| 免费观看在线日韩| or卡值多少钱| 别揉我奶头 嗯啊视频| 国产精品久久久久久久电影| 国产精品三级大全| 亚洲在线自拍视频| 久久中文看片网| 亚洲图色成人| 久久精品国产自在天天线| 欧美3d第一页| 村上凉子中文字幕在线| 美女高潮的动态| 男女啪啪激烈高潮av片| av女优亚洲男人天堂| 亚洲国产高清在线一区二区三| 一个人观看的视频www高清免费观看| 欧美绝顶高潮抽搐喷水| 国产一区二区三区在线臀色熟女| 免费观看精品视频网站| 少妇的逼好多水| 淫妇啪啪啪对白视频| 91麻豆精品激情在线观看国产| 亚洲人成网站在线播| 深夜a级毛片| 成年免费大片在线观看| 午夜影院日韩av| 国产成人av教育| 人妻夜夜爽99麻豆av| 午夜福利视频1000在线观看| 999久久久精品免费观看国产| 99riav亚洲国产免费| 欧美最新免费一区二区三区| 嫩草影院入口| 九九在线视频观看精品| 色精品久久人妻99蜜桃| av天堂中文字幕网| 色精品久久人妻99蜜桃| 欧美区成人在线视频| 精品久久久久久久末码| 又紧又爽又黄一区二区| 一个人免费在线观看电影| 男女那种视频在线观看| 亚洲国产欧洲综合997久久,| 国内精品久久久久精免费| 亚洲av免费在线观看| 国产又黄又爽又无遮挡在线| 精品午夜福利在线看| 老师上课跳d突然被开到最大视频| 精品一区二区免费观看| 久久人妻av系列| 久久精品国产清高在天天线| 色尼玛亚洲综合影院| 国产伦精品一区二区三区视频9| 老司机福利观看| 日韩中字成人| 99热这里只有精品一区| 国产主播在线观看一区二区| 亚洲久久久久久中文字幕| 国产不卡一卡二| 婷婷丁香在线五月| 亚洲成人中文字幕在线播放| 精品人妻熟女av久视频| 日本-黄色视频高清免费观看| 国产精华一区二区三区| 亚洲性久久影院| 亚州av有码| 久久人妻av系列| 精品乱码久久久久久99久播| 黄色欧美视频在线观看| 99在线人妻在线中文字幕| 窝窝影院91人妻| 国产精品三级大全| 中文资源天堂在线| 免费看美女性在线毛片视频| 亚洲国产精品合色在线| 精品久久久久久久末码| 免费观看在线日韩| 久久久色成人| 国产三级中文精品| 美女高潮的动态| 深夜a级毛片| 亚洲精品456在线播放app | 欧洲精品卡2卡3卡4卡5卡区| 国产伦精品一区二区三区视频9| 99热这里只有精品一区| 99久久中文字幕三级久久日本| 老女人水多毛片| 国产精品人妻久久久影院| 精品久久久久久久久久免费视频| 十八禁网站免费在线| 黄色欧美视频在线观看| 淫秽高清视频在线观看| 91狼人影院| 偷拍熟女少妇极品色| 久久精品国产亚洲av涩爱 | 少妇的逼好多水| 99热精品在线国产| 91久久精品国产一区二区三区| 亚洲精华国产精华液的使用体验 | 亚洲av成人av| 人人妻人人看人人澡| 舔av片在线| 欧美人与善性xxx| 欧美成人性av电影在线观看| 一个人看的www免费观看视频| 亚洲精品久久国产高清桃花| 1000部很黄的大片| 97超级碰碰碰精品色视频在线观看| 最好的美女福利视频网| 亚洲成a人片在线一区二区| 欧美日本亚洲视频在线播放| 精品久久久久久成人av| 久久久久久久久久黄片| 欧美潮喷喷水| 欧美性猛交黑人性爽| 在线观看舔阴道视频| 超碰av人人做人人爽久久| 免费看光身美女| 欧美成人a在线观看| 国产精品久久久久久久电影| 国产精品美女特级片免费视频播放器| 自拍偷自拍亚洲精品老妇| 极品教师在线视频| 我的女老师完整版在线观看| 亚洲在线自拍视频| 噜噜噜噜噜久久久久久91| 搞女人的毛片| 午夜老司机福利剧场| 欧美激情国产日韩精品一区| a级毛片a级免费在线| 中文字幕av在线有码专区| 听说在线观看完整版免费高清| 国产伦在线观看视频一区| а√天堂www在线а√下载| 国产黄片美女视频| 亚洲欧美日韩高清专用| 亚洲精品亚洲一区二区| 精品日产1卡2卡| 一进一出好大好爽视频| 国产精品电影一区二区三区| 国产精品日韩av在线免费观看| 国产午夜精品论理片| 亚洲aⅴ乱码一区二区在线播放| 国语自产精品视频在线第100页| 午夜福利视频1000在线观看| 男人舔奶头视频| 国产v大片淫在线免费观看| 色综合亚洲欧美另类图片| 亚洲欧美日韩高清在线视频| 久久久久久久久久成人| 制服丝袜大香蕉在线| 白带黄色成豆腐渣| 久久九九热精品免费| 97碰自拍视频| 精品99又大又爽又粗少妇毛片 | 亚洲av中文字字幕乱码综合| 69人妻影院| 小说图片视频综合网站| 一进一出抽搐动态| 五月伊人婷婷丁香| 99热这里只有是精品50| 嫩草影院精品99| 国产精品99久久久久久久久| 精品久久久久久久末码| 国产免费一级a男人的天堂| 国产视频内射| 久久这里只有精品中国| 亚洲三级黄色毛片| 琪琪午夜伦伦电影理论片6080| 搞女人的毛片| 日本一二三区视频观看| av在线观看视频网站免费| 国产精品久久电影中文字幕| 哪里可以看免费的av片| 内射极品少妇av片p| 午夜老司机福利剧场| 亚洲专区中文字幕在线| 亚洲av电影不卡..在线观看| 天堂动漫精品| 老司机深夜福利视频在线观看| 嫩草影院入口| 大型黄色视频在线免费观看| 色av中文字幕| 久久久久久久久久黄片| 亚洲无线观看免费| 亚洲精品久久国产高清桃花| 亚洲av中文av极速乱 | 天堂动漫精品| 国产精品不卡视频一区二区| 一区二区三区免费毛片| 一区二区三区激情视频| 在线看三级毛片| 18禁黄网站禁片免费观看直播| 午夜久久久久精精品| 淫秽高清视频在线观看| 亚洲av五月六月丁香网| 国产精品一区www在线观看 | 国产在线精品亚洲第一网站| 美女xxoo啪啪120秒动态图| 一级黄色大片毛片| x7x7x7水蜜桃| 国产蜜桃级精品一区二区三区| 美女被艹到高潮喷水动态| а√天堂www在线а√下载| 免费观看在线日韩| 成人鲁丝片一二三区免费| 搡女人真爽免费视频火全软件 | 欧美日本视频| 成人无遮挡网站| 日韩欧美国产一区二区入口| 内地一区二区视频在线| 国产精品三级大全| 亚洲国产精品合色在线| 亚洲国产色片| 黄片wwwwww| 欧美一级a爱片免费观看看| 亚洲性夜色夜夜综合| 精品福利观看| 日韩亚洲欧美综合| 91午夜精品亚洲一区二区三区 | 国产精品国产三级国产av玫瑰| 国产aⅴ精品一区二区三区波| 国产精品人妻久久久影院| 欧美激情国产日韩精品一区| 亚洲av免费高清在线观看| 在线观看一区二区三区| 日日摸夜夜添夜夜添小说| 欧美在线一区亚洲| 99久久久亚洲精品蜜臀av| 男人狂女人下面高潮的视频| 国产精品国产三级国产av玫瑰| 在线观看舔阴道视频| 日韩高清综合在线| 在线a可以看的网站| 欧美激情在线99| 女同久久另类99精品国产91| 国产欧美日韩一区二区精品| 婷婷精品国产亚洲av在线| 国产精品一区二区性色av| av在线天堂中文字幕| 日韩国内少妇激情av| 久久精品影院6| netflix在线观看网站| 最近中文字幕高清免费大全6 | 日日摸夜夜添夜夜添小说| 黄色视频,在线免费观看| 国产探花极品一区二区| 欧美黑人巨大hd| 动漫黄色视频在线观看| 99热6这里只有精品| 成人三级黄色视频| 国产久久久一区二区三区| 日韩欧美一区二区三区在线观看| 亚洲三级黄色毛片| 制服丝袜大香蕉在线| av天堂中文字幕网| 久久天躁狠狠躁夜夜2o2o| 亚洲第一区二区三区不卡| 少妇人妻精品综合一区二区 | 老司机午夜福利在线观看视频| 久久精品久久久久久噜噜老黄 | 九九在线视频观看精品| 午夜福利视频1000在线观看| 91久久精品电影网| 免费在线观看成人毛片| 美女大奶头视频| 乱码一卡2卡4卡精品| 亚洲无线在线观看| 成人国产综合亚洲| 桃红色精品国产亚洲av| 成人毛片a级毛片在线播放| 国产日本99.免费观看| 日韩中字成人| 国产 一区 欧美 日韩| 久久精品影院6| 日日摸夜夜添夜夜添av毛片 | h日本视频在线播放| 成年人黄色毛片网站| 日日啪夜夜撸| 女的被弄到高潮叫床怎么办 | 观看免费一级毛片| 久久久久久大精品| 亚洲va日本ⅴa欧美va伊人久久| 最近最新免费中文字幕在线| 欧美日韩黄片免| 很黄的视频免费| 亚洲美女视频黄频| 人妻丰满熟妇av一区二区三区| av在线天堂中文字幕| 精品福利观看| 最近在线观看免费完整版| 国产一区二区三区av在线 | 国产高清有码在线观看视频| 国产熟女欧美一区二区| 一级黄片播放器| 精品国产三级普通话版| 日韩大尺度精品在线看网址| 欧美性感艳星| 黄色日韩在线| 熟女人妻精品中文字幕| 色在线成人网| 午夜精品一区二区三区免费看| 夜夜爽天天搞| 国产精品无大码| 国产av麻豆久久久久久久| 欧美xxxx黑人xx丫x性爽| 国产精品无大码| 麻豆一二三区av精品| 给我免费播放毛片高清在线观看| 日本 av在线| 欧美日韩国产亚洲二区| 久久久国产成人免费| 91麻豆精品激情在线观看国产| 国内精品一区二区在线观看|