• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    預(yù)訓(xùn)練文本摘要研究綜述

    2022-04-16 08:47:58張紫蕓王文發(fā)馬樂榮丁蒼峰
    關(guān)鍵詞:文檔單詞文本

    張紫蕓,王文發(fā),馬樂榮*,丁蒼峰

    (1.延安大學(xué)數(shù)學(xué)與計算機(jī)科學(xué)學(xué)院;2.延安市紅色文化大數(shù)據(jù)智能信息處理重點(diǎn)實(shí)驗室,陜西延安 716000)

    文本摘要是對文本或者文本集合在保留其原文主旨大意的基礎(chǔ)上進(jìn)行抽取、壓縮和總結(jié),形成文摘。文摘是全面準(zhǔn)確地反映某一文獻(xiàn)中心內(nèi)容的簡單連貫的短文,常用方法是摘要將文本作為句子的線性序列,將句子視為詞的線性序列。文本摘要按照輸入類型分為單文檔摘要和多文檔摘要,單文檔摘要就是對單個文檔進(jìn)行總結(jié),多文檔摘要就是對一組文檔進(jìn)行摘要;按照有無監(jiān)督數(shù)據(jù)分為有監(jiān)督摘要和無監(jiān)督摘要;按照摘要的生成方式分為抽取式、生成式以及將兩者結(jié)合的抽取生成式,抽取式就是抽取原單文檔或者多文檔中的重要句子和詞匯進(jìn)行摘要生成,生成式就是通過釋義和重組句子來構(gòu)成摘要,允許生成新的詞匯或者句子。

    隨著自然語言處理任務(wù)的發(fā)展,現(xiàn)在文本摘要的研究工作主要圍繞神經(jīng)體系結(jié)構(gòu)的探索和訓(xùn)練約束的設(shè)計,此外,還有一些工作試圖整合文檔特征以增強(qiáng)模型性能[1]。隨著預(yù)訓(xùn)練模型在自然語言處理相關(guān)任務(wù)上取得巨大的進(jìn)步,本文將聚焦摘要生成任務(wù),梳理預(yù)訓(xùn)練模型在文本摘要方面的研究進(jìn)展。

    1 預(yù)訓(xùn)練語言模型的文本摘要方法

    預(yù)訓(xùn)練語言模型是在給定的語料庫上,通過自監(jiān)督的方式從語料庫上訓(xùn)練出符合給定性能指標(biāo)的語言模型,為下游任務(wù)提供語言表示服務(wù)。近年來,圍繞預(yù)訓(xùn)練語言模型,文本摘要涌現(xiàn)出一系列重要的方法,本部分從經(jīng)典的預(yù)訓(xùn)練模型出發(fā),梳理了幾類典型的摘要生成方法。

    1.1 預(yù)訓(xùn)練語言模型

    預(yù)訓(xùn)練模型包括ELMo[2]、GPT[3]和BERT[4]等。ELMo學(xué)習(xí)2種單向LM:前向LM從左向右編碼文本,后向LM從右向左編碼文本;GPT使用從左到右的Transformer逐字預(yù)測文本序列;BERT基于雙向Transformer編碼器融合左右上下文來預(yù)測屏蔽單詞。在文本摘要任務(wù)中的預(yù)訓(xùn)練語言模型大多都采用BERT,下面對幾個模型進(jìn)行一個簡單介紹。

    a)ELMo:ELMo解決了現(xiàn)有的詞向量表示存在的兩大挑戰(zhàn):1)單詞使用的復(fù)雜性,如句法和語法;2)單詞在不同上下文中的一詞多義性。ELMo是雙向基于特征的語言模型,使用獨(dú)立訓(xùn)練的從左到右(前向)和從右到左(后向)的LSTM串聯(lián)為下游任務(wù)生成特征,是一種新的深度語境化單詞表示。

    前向LSTM模型:給定N個token的序列(t1,t2,…,t N),前向語言模型通過對給定(t1,…,t k-1)預(yù)測下一個詞語t k的概率,公式如下:

    后向LSTM模型:后向LM類似于前向LM,除非它在反向序列上運(yùn)行,根據(jù)第k個詞后面的詞去預(yù)測第k個詞的概率,公式如下:

    biLM結(jié)合了前向和后向LM,最大化前向和后向的聯(lián)合似然概率為

    其中,Θx為輸入的初始詞向量參數(shù),Θs為輸出的softmax層參數(shù),和是雙向語言模型的參數(shù)。

    b)GPT:針對以前的預(yù)訓(xùn)練語言模型與下游任務(wù)的語言模型不一致而造成的遷移困難,以及用于學(xué)習(xí)的標(biāo)記數(shù)據(jù)較少這2個問題,RADFORD等[3]提出了一種半監(jiān)督的模型GPT,模型分為兩部分:采用無監(jiān)督學(xué)習(xí)的預(yù)訓(xùn)練充分利用大量未標(biāo)注的文本數(shù)據(jù),然后利用監(jiān)督學(xué)習(xí)的微調(diào)來適配具體的NLP任務(wù)。

    c)BERT:DEVLIN等[4]認(rèn)為當(dāng)前的技術(shù)限制了預(yù)訓(xùn)練表示的能力,尤其是對微調(diào)方法而言,因此提出BERT,其采用Transformer的雙向編碼器表示,通過在所有層中聯(lián)合調(diào)節(jié)左右上下文來預(yù)處理來自未標(biāo)記文本的深層雙向表示。因此,只需一個額外的輸出層,就可以對預(yù)先訓(xùn)練好的BERT模型進(jìn)行微調(diào),為各種任務(wù)創(chuàng)建最先進(jìn)的模型,模型框架與GPT一樣都是采用預(yù)訓(xùn)練和微調(diào),也都是基于微調(diào)的語言模型。

    此外,不同于傳統(tǒng)的從左到右或者從右到左的語言模型,使用2個無監(jiān)督的任務(wù)對BERT進(jìn)行預(yù)訓(xùn)練:Masked LM和Next Sentence Prediction。

    1.2 基于預(yù)訓(xùn)練的生成式摘要

    自然語言處理中的大多數(shù)模型預(yù)處理方法都利用了文本的自然排序。例如,Word2vec[5]使用固定大小窗口內(nèi)的周圍單詞,用對數(shù)雙線性模型預(yù)測中間的單詞生成的單詞嵌入表示可用于其他下游任務(wù)。還有其他使用類似技術(shù)的單詞嵌入預(yù)訓(xùn)練方法[6-7]。PETERS等[2]和RADFORD等[3]發(fā)現(xiàn),即使句子編碼器(不僅僅是單詞嵌入)也可以用語言模型目標(biāo)進(jìn)行預(yù)訓(xùn)練(即預(yù)測下一個或前一個單詞)。語言模型的目標(biāo)是單向的,而許多任務(wù)可以雙向利用上下文。因此,DEVLIN等[4]提出了自然雙向掩碼語言模型目標(biāo)(即在一個句子中用特殊標(biāo)記掩蔽幾個單詞,然后預(yù)測它們)。上述方法都旨在預(yù)訓(xùn)練單詞嵌入或句子編碼器,因此ZHANG等[8]提出使用HIBERT進(jìn)行文檔編碼和一種未標(biāo)記數(shù)據(jù)對其進(jìn)行預(yù)訓(xùn)練的方法,將預(yù)先訓(xùn)練的HIBERT應(yīng)用到摘要模型中。

    LIU等[9]提出了一個對抗框架來聯(lián)合訓(xùn)練生成模型G和區(qū)分模型D。生成器G將原始文本作為輸入并生成摘要,使用強(qiáng)化學(xué)習(xí)(即策略梯度)來優(yōu)化G,以獲得高質(zhì)量的總結(jié)。BAE等[10]改進(jìn)了抽象摘要的句子重寫方法,提出了一種利用BERT的新提取器結(jié)構(gòu)和一種全局優(yōu)化摘要級ROUGE度量的新訓(xùn)練過程。SHARMA等[11]提出了一個實(shí)體驅(qū)動的摘要框架SENECA,來生成信息豐富且連貫的抽象摘要。實(shí)體感知內(nèi)容選擇模塊首先從輸入中識別顯著的句子,然后摘要生成模塊進(jìn)行跨句子信息壓縮和抽象以生成最終的摘要。ZHANG等[12]提出了一種新的基于預(yù)訓(xùn)練的編解碼框架,該框架可以根據(jù)輸入序列分兩階段生成輸出序列。編碼器,使用BERT將輸入序列編碼成上下文表示;解碼器,在第一階段,使用基于Transformer的解碼器來生成草稿輸出序列,在第二階段,屏蔽草稿序列的每個單詞并將其饋送給BERT,然后通過組合輸入序列和BERT生成的草稿表示,使用基于Transformer的解碼器來預(yù)測每個屏蔽位置的精煉單詞,此外在學(xué)習(xí)過程中還引入了強(qiáng)化學(xué)習(xí)目標(biāo)。SONG等[13]期望通過改進(jìn)通用單文檔摘要的框架來實(shí)現(xiàn)生成不同文本重用比例的摘要,提出了一個基于Transformer,僅包含解碼器的模型來控制生成摘要的復(fù)制率,在訓(xùn)練和解碼階段采取了多種策略生成從完全抽取到高生成度的不同摘要。

    目前尚未有針對生成式文本摘要定制預(yù)訓(xùn)練目標(biāo),此外,生成式文本摘要任務(wù)也缺乏跨領(lǐng)域的系統(tǒng)評價。ZHANG等[14]提出了PEGASUS,一個序列到序列的模型,以間隙句生成為預(yù)處理目標(biāo),為生成式文本摘要定制。研究了幾種間隔句選擇方法,確定原則句選擇為最優(yōu)策略,展示了預(yù)訓(xùn)練語料庫、差距句比率、詞匯大小的效果,并擴(kuò)大了最佳配置,以在所有12個不同的下游數(shù)據(jù)集上獲得最先進(jìn)的結(jié)果。

    1.3 基于預(yù)訓(xùn)練的抽取式摘要

    受BERT成功的啟發(fā),SONG等[15]提出了基于編碼器-解碼器的語言生成的掩碼序列到序列預(yù)訓(xùn)練模型MASS。采用編碼器-解碼器框架,在給定句子剩余部分的情況下,重構(gòu)一個句子片段:它的編碼器取一個帶有隨機(jī)屏蔽片段(幾個連續(xù)標(biāo)記)的句子作為輸入,它的解碼器試圖預(yù)測這個屏蔽片段。從而,MASS可以聯(lián)合訓(xùn)練編碼器和解碼器來開發(fā)表示提取和語言建模的能力,通過進(jìn)一步微調(diào)各種低資源語言生成任務(wù)。LIU[16]提出了BERT的簡單變體BERTSUM,選擇性抽取文本中的句子作為最后的摘要,工作的重點(diǎn)在于獲得每個句子向量,然后對句子向量進(jìn)行一個二分類,判斷是否成為摘要。由于大規(guī)模、高質(zhì)量的標(biāo)注數(shù)據(jù)集不易獲取,ZHENG等[17]開發(fā)了一個基于圖的排序算法的無監(jiān)督摘要模型,并改進(jìn)了如何計算節(jié)點(diǎn)(也就是句子)的中心性。WANG等[1]分析了摘要任務(wù)中當(dāng)前域定義的局限性,并將其擴(kuò)展到文章出版物中,將域的常規(guī)定義從類別擴(kuò)展到文本摘要任務(wù)的數(shù)據(jù)源,然后重新調(diào)整多域匯總數(shù)據(jù)集的用途,并驗證不同域之間的差距如何影響神經(jīng)總結(jié)模型的性能。決定性點(diǎn)過程是抽取摘要的最佳技術(shù)之一,CHO等[18]采用決定性點(diǎn)過程提取多文檔摘要。DPP+BERT模型利用深度上下文化表示和優(yōu)化的力量,在多文檔摘要基準(zhǔn)上實(shí)現(xiàn)出色的性能。

    1.4 基于預(yù)訓(xùn)練的生成抽取式摘要

    LIU等[19]提出了如何將BERT有效地應(yīng)用于文本摘要,強(qiáng)調(diào)了文檔編碼對于摘要任務(wù)的重要性,為抽取和生成模型提出了一個通用框架。抽取式模型是通過堆疊幾個內(nèi)容轉(zhuǎn)換器層建立在這個編碼器之上。針對生成式模型提出了一種新的微調(diào)調(diào)度,它對編碼器和解碼器采用不同的優(yōu)化器,作為緩解兩者之間不匹配的手段(前者是預(yù)訓(xùn)練的,而后者不是)。

    1.5 其他

    語言模型(Language Model,LM)的預(yù)訓(xùn)練已在各種語言理解任務(wù)上產(chǎn)生了令人印象深刻的性能和樣本效率。但是,仍不清楚如何最好地將經(jīng)過預(yù)訓(xùn)練的LM用于生成任務(wù),計算科學(xué)[20]等機(jī)構(gòu)使用經(jīng)過預(yù)訓(xùn)練的解碼器網(wǎng)絡(luò),網(wǎng)絡(luò)中相同的Transformer LM既對源進(jìn)行編碼,又生成摘要,這確保了網(wǎng)絡(luò)中的所有參數(shù),包括那些控制對源狀態(tài)關(guān)注的參數(shù)都已在微調(diào)步驟之前進(jìn)行了預(yù)訓(xùn)練。DONG等[21]提出一個能夠同時處理自然語言理解和生成任務(wù)UNILM模型。UNILM模型的預(yù)訓(xùn)練是基于3個目標(biāo):單向LM(包括從左到右和從右到左)、雙向LM和序列LM。模型采用一個共享參數(shù)的Transformer網(wǎng)絡(luò)的同時還使用了特定的self-attention masks用以控制預(yù)測時候所用到的上下文信息。在下游任務(wù)微調(diào)時候,可以將UNILM模型視為單向的編碼、雙向的編碼或者序列模型,以適應(yīng)不同的下游任務(wù)(自然語言理解和生成任務(wù))。

    LEWIS等[22]提出了BART,一種用于預(yù)訓(xùn)練序列到序列模型的去噪自編碼器,通過使用任意噪聲函數(shù)來對文本進(jìn)行加噪,并學(xué)習(xí)模型以重建原始文本來訓(xùn)練BART。BELTAGY等[23]提出了SciBERT,一種基于BERT的預(yù)訓(xùn)練語言模型,以解決缺乏高質(zhì)量、大規(guī)模標(biāo)簽的科學(xué)數(shù)據(jù)的問題。此外廣泛使用的ROUGE的摘要自動評估依賴于參考和系統(tǒng)摘要之間的重疊。SUN等[24]從評價方法角度出發(fā),在文章語義相似度的計算中徹底拋棄了ROUGE和ngram共現(xiàn),系統(tǒng)地研究了嵌入余弦相似度,以衡量3個數(shù)據(jù)集上摘要的質(zhì)量。

    基于預(yù)訓(xùn)練的摘要生成任務(wù)模型在高質(zhì)量大規(guī)模的數(shù)據(jù)集上進(jìn)行訓(xùn)練時,性能優(yōu)越,生成的摘要和人工生成的相似度很高,但當(dāng)數(shù)據(jù)質(zhì)量和效果都一般的情況下,模型效果就不是很優(yōu)異。

    2 數(shù)據(jù)集

    數(shù)據(jù)集的發(fā)展對模型的好壞有直接影響,起初摘要數(shù)據(jù)集大都來自新聞領(lǐng)域類數(shù)據(jù),很大程度上限制了摘要發(fā)展,但現(xiàn)在摘要數(shù)據(jù)集正在多元化發(fā)展。下面對幾種常用的英文數(shù)據(jù)集和中文摘要數(shù)據(jù)集進(jìn)行梳理。

    2.1 英文數(shù)據(jù)集

    2.1.1 Gigaword

    英文Gigaword[25]最初于2003年由語言數(shù)據(jù)聯(lián)盟(LDC)制作,來自4個不同的國際英語新聞專線,包含了來自國內(nèi)和國際新聞服務(wù)的大約950萬篇各種新聞文章,其中包含3.8 M訓(xùn)練樣本,190 K驗證樣本和1 951個測試樣本。之后約翰霍普金斯大學(xué)人類語言技術(shù)卓越中心開發(fā)Annotated English Gigaword(2012年),為 英 語Gigaword第 五 版(LDC2011T07)添加了自動生成的句法和語篇結(jié)構(gòu)注釋。RUSH等[26]將神經(jīng)語言模型和基于注意機(jī)制的上下文編碼結(jié)合起來做摘要,使用帶注釋的Gigaword和DUC數(shù)據(jù)集,由標(biāo)準(zhǔn)的Gigaword組成,由于包含許多虛假的標(biāo)題文章對,基于啟發(fā)式過濾器后,訓(xùn)練集大約由400萬個標(biāo)題-文章對組成。

    2.1.2 CNN/Daily Mail

    CNN/Daily Mail數(shù)據(jù)集是HERMANN等[27]從美國有線新聞網(wǎng)(CNN)和每日郵報網(wǎng)(Daily Mail)中收集的大約100萬條新聞數(shù)據(jù)作為機(jī)器閱讀理解語料庫。語料庫的統(tǒng)計信息如表1所示。

    表1 CNN&Dailymail語料庫的統(tǒng)計信息

    SEE等[28]對原始數(shù)據(jù)或數(shù)據(jù)的非匿名版本進(jìn)行去標(biāo)簽等預(yù)處理后得到非匿名版數(shù)據(jù),包含287 226個訓(xùn)練對、13 368個驗證對和114 490個測試對。數(shù)據(jù)集更適用于抽取式摘要。

    2.2 中文數(shù)據(jù)集

    2.2.1 LCSTS

    LCSTS數(shù)據(jù)集[29]是由哈爾濱工業(yè)大學(xué)的智能計算研究中心發(fā)布的一份基于中文微博網(wǎng)站新浪微博構(gòu)建的大規(guī)模中文短文本摘要數(shù)據(jù)集。該數(shù)據(jù)集由200多萬篇真實(shí)的中文短文組成,每篇短文的作者給出簡短的摘要,手動標(biāo)記了10 666個簡短摘要與其對應(yīng)的簡短文本的相關(guān)性。數(shù)據(jù)集由三部分組成,第一部分包含大規(guī)模(短文,總結(jié))對;第二部分包含10 666個人標(biāo)記(短文本,摘要)對;第三部分包含1 106對,由3個人同時打分。對第二部分和第三部分的短文本和相應(yīng)摘要之間的相關(guān)性進(jìn)行打分,分?jǐn)?shù)范圍從1到5,“1”表示“最不相關(guān)”,而“5”表示“最相關(guān)”,使用第三部分的3、4和5評分的對作為短文本摘要生成任務(wù)的測試集。第二部分和第三部分也可以用作訓(xùn)練集和測試集,該數(shù)據(jù)集是針對單文本的生成式摘要。

    2.2.2 NLPCC

    自然語言處理與中文計算會議(NLPCC)是由中國計算機(jī)學(xué)會(CCF)主辦的CCF中文信息技術(shù)專業(yè)委員會從2012年開始組織的年度學(xué)術(shù)會議。每年一屆至今已舉辦9次,NLPCC2015中包含一項面向微博的中文新聞?wù)蝿?wù),該數(shù)據(jù)集包括250篇來自新浪的新聞文本,包括原始文本和已經(jīng)分句的文本,NLPCC2017,NLPCC2018中包含一項單文檔摘要任務(wù),會議提供了數(shù)據(jù)集NLPCC。NLPCC2017,NLPCC2018中提供的訓(xùn)練集是相同的,該數(shù)據(jù)集由大量帶有參考摘要的中文新聞文章以及大量沒有參考摘要的新聞文章組成(對于半監(jiān)督方法),兩部分都包含5 000篇新聞文檔,提供不同的測試集來評估和比較不同的文檔摘要技術(shù)。數(shù)據(jù)集適用于單文本的生成式摘要。

    2.3 其他

    SHARMA等[30]介紹了一個新的數(shù)據(jù)集,包括130萬份美國專利文獻(xiàn)記錄以及人類書面抽象摘要。特點(diǎn):摘要包含更豐富的話語結(jié)構(gòu)和更多的常用實(shí)體,更長的輸入序列(CNN/Daily Mail的平均3 572.8 VS 789.9個字),關(guān)鍵內(nèi)容在輸入中均勻分布,而在流行的基于新聞的數(shù)據(jù)集中,它通常集中在前幾句中,摘要中存在更少和更短的提取片段。

    FABBRI等[31]提出了第一個新聞多文檔摘要數(shù)據(jù)集,它包含來自1 500多個不同網(wǎng)站的輸入文章以及從網(wǎng)站newser.com獲得的56 216篇文章的專業(yè)摘要。此外,作者提出了一種端到端模型,該模型在各種多文檔數(shù)據(jù)集(包括Multi-News)的自動和人工評估下實(shí)現(xiàn)了較好的結(jié)果。

    通常大規(guī)模、高質(zhì)量的數(shù)據(jù)集可以極大的推進(jìn)一個研究方向的發(fā)展,目前很多摘要任務(wù)的模型都取得了優(yōu)異的結(jié)果,這離不開高質(zhì)量的數(shù)據(jù)集,因此采集多元化、高質(zhì)量的數(shù)據(jù)集以推動摘要的發(fā)展是未來的發(fā)展趨勢之一。

    3 評價方法

    文本摘要的評估方法分為兩部分:自動評價方法和人工評價方法。自動評價方法就是比較模型生成的摘要和參考摘要之間的相似度;人工評價就是由專家對候選摘要進(jìn)行評價。

    3.1 自動評價方法

    3.1.1 ROUGE

    ROUGE(Recall-Oriented Understudy for Gisting Evaluation)由LIN[32]于2003年提出,是目前評估文本摘要和機(jī)器翻譯的一組指標(biāo)。其基本思想是通過將由一系列算法或技術(shù)自動生成的摘要或翻譯與一組通常由人工生成的理想摘要或翻譯進(jìn)行比對,通過對兩者之間的重疊單元(n元語法,單詞序列和單詞對)進(jìn)行計數(shù),從而得出分值,以衡量自動生成的摘要或翻譯與參考文本之間的相似性,來評價算法有效性。下面對ROUGE-N進(jìn)行介紹:

    ROUGE-N:基于N-gram共現(xiàn)性進(jìn)行統(tǒng)計;ROUGE-L:基于最長共有字句的共現(xiàn)性精確度和召回率Fmeasure進(jìn)行統(tǒng)計;ROUGE-S:基于不連續(xù)二元組共現(xiàn)性精確度和召回率進(jìn)行統(tǒng)計;ROUGE-W基于帶權(quán)重的最長公有子句共現(xiàn)性精確度和召回率進(jìn)行統(tǒng)計。常用的評價指標(biāo)為ROUGE-N。

    式中,n代表n-gram的長度,n-gram就是一個語句中連續(xù)的n個詞組成的詞組,其中Countmatch(gramn)代表同時出現(xiàn)在參考摘要和候選摘要中的n-gram數(shù),Count(gramn)代表出現(xiàn)在參考摘要中的n-gram的個數(shù)。

    3.1.2 BLEU

    BLEU由PAPINENI[33]于2002年被提出,最開始開發(fā)被應(yīng)用于機(jī)器翻譯評估中,其計算方式與ROUGE相似,區(qū)別是BLEU基于精確率,而ROUGE基于召回率。由于機(jī)器翻譯和自動文摘都可以被看作是從文本環(huán)境中產(chǎn)生的自然語言,因此作者認(rèn)為BLEU可以用來評估自動文摘或類似的NLG任務(wù)。在文本摘要任務(wù)中就是評價候選摘要和參考摘要的相似成度,和機(jī)器翻譯度量參考翻譯和機(jī)器翻譯的形式一致。其度量公式為:

    式中,wn表示n-gram的權(quán)重。

    式中,BP表示懲罰因子,c表示譯文的句子長度,r表示有效參考譯文的句子長度,公式表示若候選譯文長度小于參考譯文,會得到一個BP值,即短句懲罰因子,pn表示n-gram的精確度。

    式中,Countclip是截斷計數(shù),Count是n-gram在候選翻譯中出現(xiàn)的次數(shù),max_ref_Count就是n-gram在參考翻譯中出現(xiàn)次數(shù)最大的值,兩者比較取最小。其優(yōu)點(diǎn)是計算簡單且迅速,它通過在測試語料庫上平均出單個句子的判斷錯誤,而不是試圖預(yù)測每個句子的準(zhǔn)確的人類判斷,從而與人類的判斷高度相關(guān);缺點(diǎn)是只考慮了參考譯文與候選譯文的n-gram的重合度,對源文的本質(zhì)意思欠缺考慮,不能很好地反映語義問題。

    3.2 人工評價

    自動評價方法的關(guān)注點(diǎn)通常在候選摘要與文本的相似度,而忽略摘要的語義問題。人工評價方法一般從摘要內(nèi)容的可讀性、與原文檔的相關(guān)性、信息性、簡潔性方面、語義連貫性方面綜合考慮參考摘要,人工評價摘要相比自動評價較為精確,但是消耗人力時間,而且人工的主觀性方面容易收到外在因素的干擾。

    4 研究展望

    互聯(lián)網(wǎng)時代,從1958年文本摘要任務(wù)提出至今,其經(jīng)歷了從緩慢到飛速發(fā)展的階段,目前文本摘要任務(wù)的模型性能表現(xiàn)優(yōu)異,但仍存在許多巨大的挑戰(zhàn)。

    評價指標(biāo):ROUGE是目前被大家最廣泛使用的評價指標(biāo),但其偏向于考察摘要的重要性、流暢性等,通常無法反映一段摘要是否包含了事實(shí)性錯誤。因此,對ROUGE進(jìn)一步改進(jìn)或者提出一個能夠捕捉摘要的事實(shí)一致性的摘要評價指標(biāo)是未來研究者們所面臨的一個挑戰(zhàn)及發(fā)展趨勢。

    數(shù)據(jù)集:目前文本摘要任務(wù)的模型在中文中可以熟練生成類似于文章標(biāo)題的短摘要,但在生成長摘要方面效果欠佳,現(xiàn)有高質(zhì)量的中文長文本數(shù)據(jù)集較少,中文數(shù)據(jù)集摘要的長度基本是一個文檔標(biāo)題的長度,長度較短,所以在互聯(lián)網(wǎng)的助力下,采集高質(zhì)量長文本數(shù)據(jù)集以及文本對應(yīng)的長摘要的數(shù)據(jù)集或其他高質(zhì)量語言數(shù)據(jù)集的產(chǎn)生對于摘要的發(fā)展也是一種推動。

    模型適應(yīng)性:由于目前數(shù)據(jù)集的缺乏,領(lǐng)域涉及較少,且大多屬于新聞領(lǐng)域的,從而現(xiàn)有文本摘要模型大多集中在新聞領(lǐng)域,對其他領(lǐng)域適應(yīng)性較差,因此研究更加普適性的模型以適應(yīng)其他數(shù)據(jù)集是很有必要的。

    模型結(jié)構(gòu):在目前摘要的預(yù)訓(xùn)練模型中,模型是從龐大的數(shù)據(jù)集中學(xué)習(xí),算法模型以及數(shù)據(jù)集愈發(fā)變大,進(jìn)行一次實(shí)驗所耗費(fèi)的人力、物力、財力都消耗巨大。故很有必要對預(yù)訓(xùn)練模型提出改進(jìn)。例如,改進(jìn)模型,使其具有歸納能力,從而可采用小數(shù)據(jù)集以及模型層數(shù)、數(shù)據(jù)集大小參數(shù)調(diào)整等都可以對模型性能產(chǎn)生影響。

    猜你喜歡
    文檔單詞文本
    有人一聲不吭向你扔了個文檔
    單詞連一連
    在808DA上文本顯示的改善
    基于doc2vec和TF-IDF的相似文本識別
    電子制作(2018年18期)2018-11-14 01:48:06
    看圖填單詞
    看完這些單詞的翻譯,整個人都不好了
    基于RI碼計算的Word復(fù)制文檔鑒別
    文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
    Persistence of the reproductive toxicity of chlorpiryphos-ethyl in male Wistar rat
    如何快速走進(jìn)文本
    語文知識(2014年1期)2014-02-28 21:59:13
    91老司机精品| 日本91视频免费播放| 国产午夜精品一二区理论片| 天堂中文最新版在线下载| 久久性视频一级片| 亚洲精品国产一区二区精华液| 久久精品国产综合久久久| 亚洲五月色婷婷综合| tube8黄色片| 久久鲁丝午夜福利片| 国产精品 国内视频| 国产成人欧美在线观看 | av天堂久久9| 我要看黄色一级片免费的| 久久久久久人人人人人| 久久鲁丝午夜福利片| 最新的欧美精品一区二区| 七月丁香在线播放| 中文字幕高清在线视频| 婷婷色av中文字幕| 热99久久久久精品小说推荐| 亚洲精品日韩在线中文字幕| 亚洲精品国产色婷婷电影| 欧美乱码精品一区二区三区| 女人高潮潮喷娇喘18禁视频| 午夜福利免费观看在线| 99热国产这里只有精品6| 制服人妻中文乱码| 秋霞在线观看毛片| 日韩一区二区视频免费看| 中文字幕另类日韩欧美亚洲嫩草| 十分钟在线观看高清视频www| 最近中文字幕高清免费大全6| 秋霞在线观看毛片| 欧美激情 高清一区二区三区| 欧美在线一区亚洲| www.精华液| 国产精品熟女久久久久浪| 亚洲伊人色综图| 岛国毛片在线播放| 亚洲伊人久久精品综合| 人妻人人澡人人爽人人| av在线老鸭窝| 男女免费视频国产| 国产激情久久老熟女| 中文字幕精品免费在线观看视频| 91成人精品电影| 欧美最新免费一区二区三区| av片东京热男人的天堂| 国产免费视频播放在线视频| av线在线观看网站| 国产有黄有色有爽视频| 亚洲国产欧美在线一区| 曰老女人黄片| 国产不卡av网站在线观看| 一级片免费观看大全| 自拍欧美九色日韩亚洲蝌蚪91| 亚洲精品国产av成人精品| 伊人久久国产一区二区| 国产成人精品无人区| 一本—道久久a久久精品蜜桃钙片| 精品国产国语对白av| 国产深夜福利视频在线观看| 免费女性裸体啪啪无遮挡网站| 国产成人免费观看mmmm| 国产精品久久久久久精品电影小说| 美女午夜性视频免费| 国产免费福利视频在线观看| √禁漫天堂资源中文www| 下体分泌物呈黄色| 国产毛片在线视频| 精品国产一区二区久久| av不卡在线播放| tube8黄色片| 男女之事视频高清在线观看 | 午夜激情久久久久久久| 精品少妇一区二区三区视频日本电影 | tube8黄色片| 国产伦人伦偷精品视频| 可以免费在线观看a视频的电影网站 | 免费高清在线观看日韩| 中文字幕色久视频| 我要看黄色一级片免费的| 免费少妇av软件| 久久99一区二区三区| 亚洲av福利一区| 五月天丁香电影| 午夜福利乱码中文字幕| 久久久亚洲精品成人影院| 亚洲精品国产色婷婷电影| 国产精品国产三级国产专区5o| 欧美黄色片欧美黄色片| 日韩伦理黄色片| 啦啦啦视频在线资源免费观看| 亚洲精品国产av蜜桃| 亚洲中文av在线| 一区二区av电影网| 日韩免费高清中文字幕av| 黑人巨大精品欧美一区二区蜜桃| 精品免费久久久久久久清纯 | 免费在线观看视频国产中文字幕亚洲 | 9191精品国产免费久久| 日韩精品免费视频一区二区三区| av在线观看视频网站免费| 天美传媒精品一区二区| 999久久久国产精品视频| 亚洲av日韩精品久久久久久密 | 啦啦啦在线观看免费高清www| 亚洲自偷自拍图片 自拍| 国产精品麻豆人妻色哟哟久久| 亚洲第一区二区三区不卡| 亚洲综合色网址| 欧美日韩av久久| 午夜免费男女啪啪视频观看| 国产精品久久久久久精品古装| 久久av网站| 青草久久国产| 欧美乱码精品一区二区三区| 亚洲精品久久成人aⅴ小说| 日韩人妻精品一区2区三区| av天堂久久9| 久久久久久免费高清国产稀缺| 岛国毛片在线播放| 大片电影免费在线观看免费| 婷婷色av中文字幕| 黄频高清免费视频| 丰满乱子伦码专区| 亚洲美女搞黄在线观看| 成人亚洲欧美一区二区av| 99久久精品国产亚洲精品| 欧美国产精品va在线观看不卡| 免费少妇av软件| 老鸭窝网址在线观看| av天堂久久9| 国产成人欧美| 丝袜美腿诱惑在线| 激情五月婷婷亚洲| 日韩制服丝袜自拍偷拍| 亚洲av欧美aⅴ国产| 国产视频首页在线观看| 亚洲国产精品国产精品| 丝袜人妻中文字幕| 王馨瑶露胸无遮挡在线观看| 亚洲人成网站在线观看播放| bbb黄色大片| 精品久久久精品久久久| 亚洲,欧美精品.| 中文字幕人妻熟女乱码| 777久久人妻少妇嫩草av网站| 亚洲欧美成人精品一区二区| 国产成人91sexporn| 曰老女人黄片| 国产一区二区三区综合在线观看| 国产成人免费观看mmmm| 黄网站色视频无遮挡免费观看| 精品酒店卫生间| 国产成人91sexporn| 女性被躁到高潮视频| 国产av一区二区精品久久| 十八禁人妻一区二区| 中文字幕av电影在线播放| 精品人妻一区二区三区麻豆| 国产极品天堂在线| 天天躁日日躁夜夜躁夜夜| 日韩一区二区视频免费看| 亚洲熟女精品中文字幕| 亚洲精品日本国产第一区| 欧美黄色片欧美黄色片| 亚洲国产欧美在线一区| 国产精品蜜桃在线观看| 欧美日韩亚洲综合一区二区三区_| 大码成人一级视频| 亚洲欧美日韩另类电影网站| videosex国产| 男女边吃奶边做爰视频| 国产深夜福利视频在线观看| 又大又爽又粗| 超碰成人久久| 日本黄色日本黄色录像| 啦啦啦在线观看免费高清www| 麻豆乱淫一区二区| 叶爱在线成人免费视频播放| 黑人猛操日本美女一级片| 妹子高潮喷水视频| 男女之事视频高清在线观看 | 亚洲色图综合在线观看| 成人午夜精彩视频在线观看| 亚洲欧洲国产日韩| 午夜激情av网站| 亚洲在久久综合| 国产一区亚洲一区在线观看| 婷婷色av中文字幕| 国产成人精品无人区| 人人妻人人添人人爽欧美一区卜| 国产精品久久久av美女十八| 日本午夜av视频| 女人爽到高潮嗷嗷叫在线视频| 久久狼人影院| 午夜老司机福利片| 侵犯人妻中文字幕一二三四区| 十八禁网站网址无遮挡| 日本猛色少妇xxxxx猛交久久| 亚洲三区欧美一区| 黄频高清免费视频| 日本爱情动作片www.在线观看| 精品亚洲成国产av| 91国产中文字幕| 丝袜美足系列| 在线观看免费视频网站a站| 街头女战士在线观看网站| 亚洲成人手机| 久热这里只有精品99| 最黄视频免费看| 久久久久网色| 午夜福利免费观看在线| 亚洲国产精品一区三区| 国产成人系列免费观看| 欧美日韩福利视频一区二区| 在线免费观看不下载黄p国产| 女性生殖器流出的白浆| 中国国产av一级| 日本91视频免费播放| 大香蕉久久成人网| 人妻人人澡人人爽人人| av有码第一页| 两个人看的免费小视频| 久热这里只有精品99| 亚洲欧美成人综合另类久久久| 国产精品99久久99久久久不卡 | 曰老女人黄片| 精品国产乱码久久久久久男人| 天堂8中文在线网| 国产精品久久久av美女十八| 精品一区二区免费观看| 国产亚洲一区二区精品| 欧美日韩一区二区视频在线观看视频在线| 国产1区2区3区精品| 亚洲国产看品久久| 少妇人妻久久综合中文| 黄色 视频免费看| 在线看a的网站| 国产成人免费无遮挡视频| 国产精品久久久人人做人人爽| 亚洲欧美成人综合另类久久久| 少妇 在线观看| 久久国产精品大桥未久av| 丰满迷人的少妇在线观看| av在线app专区| av在线观看视频网站免费| 一本大道久久a久久精品| 老汉色av国产亚洲站长工具| 久久久久精品国产欧美久久久 | 9191精品国产免费久久| 国产在线免费精品| 精品一区二区三区av网在线观看 | 别揉我奶头~嗯~啊~动态视频 | 好男人视频免费观看在线| 亚洲精品一二三| 一本—道久久a久久精品蜜桃钙片| 999精品在线视频| 纵有疾风起免费观看全集完整版| 丰满少妇做爰视频| 美女高潮到喷水免费观看| 日韩av不卡免费在线播放| 亚洲av电影在线观看一区二区三区| 国产野战对白在线观看| 视频区图区小说| 久热爱精品视频在线9| 国产av码专区亚洲av| 黑人欧美特级aaaaaa片| 国产av一区二区精品久久| 亚洲免费av在线视频| 国产精品久久久久久精品古装| 欧美精品一区二区大全| 国产免费一区二区三区四区乱码| 欧美激情 高清一区二区三区| 亚洲综合色网址| 人人妻,人人澡人人爽秒播 | 少妇的丰满在线观看| 如何舔出高潮| 制服诱惑二区| 少妇 在线观看| 你懂的网址亚洲精品在线观看| 久久97久久精品| 午夜福利一区二区在线看| 精品一区二区三区四区五区乱码 | 高清在线视频一区二区三区| 欧美日韩福利视频一区二区| 飞空精品影院首页| 国产精品成人在线| 侵犯人妻中文字幕一二三四区| 欧美xxⅹ黑人| av电影中文网址| 五月开心婷婷网| 久久人人爽av亚洲精品天堂| 尾随美女入室| 亚洲av电影在线观看一区二区三区| 青春草视频在线免费观看| 国产成人免费观看mmmm| 亚洲少妇的诱惑av| 视频区图区小说| 免费看av在线观看网站| 最新的欧美精品一区二区| 美女国产高潮福利片在线看| 精品免费久久久久久久清纯 | 亚洲精品久久成人aⅴ小说| 亚洲一卡2卡3卡4卡5卡精品中文| 99久国产av精品国产电影| bbb黄色大片| 久久久久久久久久久久大奶| 亚洲免费av在线视频| 一二三四中文在线观看免费高清| 日本午夜av视频| 亚洲精品日韩在线中文字幕| 国产欧美亚洲国产| 日韩电影二区| 涩涩av久久男人的天堂| 国产精品蜜桃在线观看| 97精品久久久久久久久久精品| 亚洲精品国产av成人精品| 亚洲成人手机| 日日爽夜夜爽网站| 亚洲,一卡二卡三卡| 中文字幕最新亚洲高清| av又黄又爽大尺度在线免费看| 亚洲国产av影院在线观看| 99香蕉大伊视频| 亚洲熟女精品中文字幕| 国产黄色免费在线视频| 日韩人妻精品一区2区三区| 最近最新中文字幕大全免费视频 | 欧美日韩视频高清一区二区三区二| 国产精品 欧美亚洲| 国产激情久久老熟女| 久久久国产一区二区| 亚洲国产欧美在线一区| 国产成人欧美在线观看 | 亚洲精品久久午夜乱码| 精品一区在线观看国产| 免费av中文字幕在线| 美女扒开内裤让男人捅视频| 精品午夜福利在线看| 中文字幕色久视频| 可以免费在线观看a视频的电影网站 | 国产极品天堂在线| 国产精品人妻久久久影院| 伦理电影免费视频| 亚洲,一卡二卡三卡| 婷婷色综合www| 久久精品久久久久久久性| h视频一区二区三区| 天天添夜夜摸| 亚洲欧美精品自产自拍| 伊人亚洲综合成人网| 这个男人来自地球电影免费观看 | 中文字幕高清在线视频| 好男人视频免费观看在线| 人妻人人澡人人爽人人| 在线 av 中文字幕| 一级a爱视频在线免费观看| 亚洲精品成人av观看孕妇| 国产亚洲一区二区精品| 飞空精品影院首页| 亚洲欧美中文字幕日韩二区| 美女福利国产在线| 五月天丁香电影| 亚洲精品国产av蜜桃| h视频一区二区三区| 99国产综合亚洲精品| 国产精品无大码| 久久久久国产一级毛片高清牌| 久久精品国产综合久久久| 九九爱精品视频在线观看| 一级毛片黄色毛片免费观看视频| av网站免费在线观看视频| 亚洲色图 男人天堂 中文字幕| 精品久久久久久电影网| 欧美中文综合在线视频| 综合色丁香网| 老司机深夜福利视频在线观看 | 亚洲精华国产精华液的使用体验| 深夜精品福利| 成人亚洲欧美一区二区av| 纵有疾风起免费观看全集完整版| av在线观看视频网站免费| 国产国语露脸激情在线看| 自拍欧美九色日韩亚洲蝌蚪91| 国产亚洲最大av| 国产成人a∨麻豆精品| 男人爽女人下面视频在线观看| 国产精品一二三区在线看| 亚洲图色成人| 精品人妻在线不人妻| 国产在线免费精品| 中文天堂在线官网| 男人操女人黄网站| 可以免费在线观看a视频的电影网站 | 搡老乐熟女国产| 在线观看免费高清a一片| 日本欧美国产在线视频| 国产成人欧美| 午夜福利乱码中文字幕| 国产在线免费精品| 色精品久久人妻99蜜桃| 国产精品秋霞免费鲁丝片| 午夜老司机福利片| 精品久久蜜臀av无| 人人妻人人添人人爽欧美一区卜| 国产免费一区二区三区四区乱码| 九色亚洲精品在线播放| 免费黄网站久久成人精品| 日本91视频免费播放| 午夜福利,免费看| 欧美xxⅹ黑人| 婷婷色综合大香蕉| 国产亚洲欧美精品永久| 一二三四中文在线观看免费高清| 日韩 亚洲 欧美在线| 亚洲精品一区蜜桃| 熟女av电影| av.在线天堂| 日韩精品有码人妻一区| 夫妻午夜视频| 热re99久久国产66热| 亚洲精品成人av观看孕妇| 欧美av亚洲av综合av国产av | 最新在线观看一区二区三区 | 久久女婷五月综合色啪小说| 又大又爽又粗| 国产成人欧美在线观看 | 啦啦啦啦在线视频资源| 国产又爽黄色视频| 看十八女毛片水多多多| 十八禁人妻一区二区| 国产精品人妻久久久影院| 在线观看免费高清a一片| 国产精品一二三区在线看| 国产淫语在线视频| 亚洲人成77777在线视频| 亚洲色图 男人天堂 中文字幕| svipshipincom国产片| 夜夜骑夜夜射夜夜干| 久久久久久久国产电影| 亚洲欧美成人精品一区二区| 交换朋友夫妻互换小说| 桃花免费在线播放| av卡一久久| 999精品在线视频| 国产精品国产av在线观看| 男女免费视频国产| 18禁裸乳无遮挡动漫免费视频| 啦啦啦在线免费观看视频4| 国产日韩欧美视频二区| 男女无遮挡免费网站观看| 成人国产av品久久久| 国产精品国产av在线观看| 狠狠婷婷综合久久久久久88av| 久久久久精品久久久久真实原创| 欧美日韩视频高清一区二区三区二| 97精品久久久久久久久久精品| 国产精品香港三级国产av潘金莲 | 在线观看免费视频网站a站| 成年美女黄网站色视频大全免费| 日本wwww免费看| 亚洲 欧美一区二区三区| 亚洲欧美激情在线| 午夜福利一区二区在线看| 老鸭窝网址在线观看| 欧美日韩亚洲国产一区二区在线观看 | 久久ye,这里只有精品| 亚洲精品国产av蜜桃| 欧美在线一区亚洲| 亚洲 欧美一区二区三区| 国产又爽黄色视频| 哪个播放器可以免费观看大片| 国语对白做爰xxxⅹ性视频网站| 精品亚洲乱码少妇综合久久| 天天添夜夜摸| 少妇的丰满在线观看| 免费日韩欧美在线观看| 国产淫语在线视频| 久久久亚洲精品成人影院| 男女边吃奶边做爰视频| 黄色视频在线播放观看不卡| 青春草视频在线免费观看| 满18在线观看网站| 欧美国产精品一级二级三级| 亚洲精品成人av观看孕妇| 亚洲男人天堂网一区| 精品欧美国产一区二区三| 国产99久久九九免费精品| 黄色 视频免费看| 90打野战视频偷拍视频| aaaaa片日本免费| 国产精品99久久99久久久不卡| or卡值多少钱| 人人澡人人妻人| 美女午夜性视频免费| 99久久国产精品久久久| 99久久精品国产亚洲精品| av免费在线观看网站| 嫩草影院精品99| www.熟女人妻精品国产| 亚洲精品在线观看二区| 精品欧美国产一区二区三| 国产免费男女视频| 久热这里只有精品99| 久久久久九九精品影院| 一级毛片女人18水好多| 嫩草影视91久久| 国产伦人伦偷精品视频| 午夜成年电影在线免费观看| 在线观看免费视频日本深夜| 国产欧美日韩精品亚洲av| 久久这里只有精品19| 搞女人的毛片| 少妇被粗大的猛进出69影院| 嫁个100分男人电影在线观看| 亚洲 欧美一区二区三区| 国产三级在线视频| 亚洲国产精品成人综合色| 最新美女视频免费是黄的| 免费在线观看影片大全网站| 国产成人精品在线电影| 色av中文字幕| 亚洲中文字幕一区二区三区有码在线看 | 欧洲精品卡2卡3卡4卡5卡区| 亚洲中文字幕日韩| 国产精品九九99| 99久久综合精品五月天人人| 欧美成人午夜精品| 91成年电影在线观看| 精品久久久久久成人av| 妹子高潮喷水视频| or卡值多少钱| 国内久久婷婷六月综合欲色啪| 不卡一级毛片| 一夜夜www| 黄片播放在线免费| 人人妻,人人澡人人爽秒播| 高清黄色对白视频在线免费看| 两个人看的免费小视频| 黑人巨大精品欧美一区二区蜜桃| 高清黄色对白视频在线免费看| 欧美一级a爱片免费观看看 | 久久久久久久精品吃奶| 黑人欧美特级aaaaaa片| 欧美日本亚洲视频在线播放| 中国美女看黄片| 国产99久久九九免费精品| 丁香欧美五月| 成年人黄色毛片网站| 欧美绝顶高潮抽搐喷水| 久久天堂一区二区三区四区| 精品熟女少妇八av免费久了| 亚洲va日本ⅴa欧美va伊人久久| 欧美黄色片欧美黄色片| 国产精品亚洲av一区麻豆| 在线观看www视频免费| 黄色视频,在线免费观看| 国产av一区在线观看免费| 午夜福利高清视频| 母亲3免费完整高清在线观看| 一级毛片高清免费大全| 在线永久观看黄色视频| 免费不卡黄色视频| 亚洲精品在线美女| 精品免费久久久久久久清纯| 国产精品电影一区二区三区| 国产主播在线观看一区二区| 无人区码免费观看不卡| 国产视频一区二区在线看| 黄色视频,在线免费观看| 久久久久久久久免费视频了| 啦啦啦免费观看视频1| 可以在线观看的亚洲视频| 欧美日韩精品网址| 国产一区二区三区在线臀色熟女| 精品第一国产精品| 日本欧美视频一区| 18禁黄网站禁片午夜丰满| 国产亚洲av高清不卡| 亚洲七黄色美女视频| 国产精品野战在线观看| 黄片小视频在线播放| 老司机午夜福利在线观看视频| 午夜福利高清视频| 久久久久九九精品影院| 美女国产高潮福利片在线看| 亚洲av电影在线进入| 欧美一级a爱片免费观看看 | 两性夫妻黄色片| 免费无遮挡裸体视频| 国内毛片毛片毛片毛片毛片| 高潮久久久久久久久久久不卡| 国产不卡一卡二| aaaaa片日本免费| 丝袜在线中文字幕| www.www免费av| 女性被躁到高潮视频| 99国产综合亚洲精品| 91精品国产国语对白视频| 亚洲激情在线av| 色av中文字幕| 成人三级黄色视频| 日本vs欧美在线观看视频| 一区二区三区高清视频在线| 十八禁人妻一区二区| 欧美不卡视频在线免费观看 | 精品国产国语对白av| 啦啦啦 在线观看视频| 我的亚洲天堂| 欧美黑人欧美精品刺激| av天堂久久9| 精品一品国产午夜福利视频|