• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于Transformer和重要詞識別的句子融合方法

    2023-08-10 07:03:52譚紅葉李飛艷
    關(guān)鍵詞:原句先驗(yàn)文本

    譚紅葉 李飛艷

    1(山西大學(xué)計(jì)算機(jī)與信息技術(shù)學(xué)院 山西 太原 030006)2(山西大學(xué)計(jì)算智能與中文信息處理教育部重點(diǎn)實(shí)驗(yàn)室 山西 太原 030006)

    0 引 言

    文本生成是指給定文本或非文本輸入,輸出流暢、連貫且符合要求的文本。句子融合是一種典型的文本到文本的生成任務(wù),旨在為給定的一組相關(guān)句子(或一個比較長的句子)生成一個較短的概括性句子,且保留其中的重要信息。句子融合與文本摘要有類似之處,但也有區(qū)別。主要區(qū)別包括:(1) 輸入不同,句子融合的輸入為一個或多個句子,而文本摘要的輸入為單文檔或多文檔。一般來說后者輸入句子數(shù)多于前者,因此后者壓縮率大于前者。(2) 目標(biāo)不同,句子融合側(cè)重于去除相關(guān)句子的冗余信息,生成簡短的句子,而文本摘要旨在獲得概括篇章內(nèi)容的多個句子。(3) 句子融合可以作為文本摘要的一個中間技術(shù)。如:在抽取式摘要中,句子融合可以將其結(jié)果作為輸入,進(jìn)一步融合后,得到更為靈活緊湊的摘要。

    句子融合的具體示例如圖1所示??梢钥闯?融合句不僅剔除了冗余和不重要的信息,而且生成了原句中未出現(xiàn)過的詞。如:示例1中的融合句剔除了原句中“中新網(wǎng)7月21日電”“妻子王洪濤反映”等不重要的短語,同時生成了“網(wǎng)曝”“綏化”和“檢方”等新詞。從示例2可以看出融合句結(jié)構(gòu)與原句也有不同。

    原句1:“中新網(wǎng)7月21日電 據(jù)安縣人民政府網(wǎng)站消息,2015年7月21日上午,新浪微博出現(xiàn)一則慶安縣公安局經(jīng)刑偵大隊(duì)副大隊(duì)長姚永軍的妻子王洪濤反映其利用職務(wù)之便,貪污受賄、實(shí)施家暴的視頻。目前已被停職,慶安縣人民檢察院已介入調(diào)查?!睒?biāo)準(zhǔn)融合句:“網(wǎng)曝綏化慶安刑偵大隊(duì)副大隊(duì)長利用職務(wù)之便,貪污受賄、實(shí)施家暴,目前已被停職,檢方介入調(diào)查?!痹?:“人民網(wǎng):北京11月29日電 今天,記者從中國鐵路總公司獲悉,自11月30日起,中國鐵路客戶服務(wù)中心12306網(wǎng)站支付寶賬戶支付服務(wù)功能上線試運(yùn)行,旅客網(wǎng)購火車票新增一種支付方式?!睒?biāo)準(zhǔn)融合句:“人民網(wǎng):12306網(wǎng)站明日起新增支付寶支付服務(wù)功能?!?/p>

    目前,由于句子融合相關(guān)的數(shù)據(jù)集規(guī)模小,句子融合方法主要為基于無監(jiān)督的方法。如,文獻(xiàn)[1]中使用了詞圖方法,從原句復(fù)制重要信息片段到融合句。Clarke等[2]提出了一種基于句法樹的方法,通過使用整數(shù)線性規(guī)劃將句子壓縮任務(wù)視為優(yōu)化問題。但由于上述方法未考慮上下文信息和句子結(jié)構(gòu),生成的融合句缺乏重要信息或有語法錯誤。

    有監(jiān)督的文本生成的主流方法是基于神經(jīng)網(wǎng)絡(luò)的編碼器-解碼器框架。在編碼器-解碼器框架基礎(chǔ)上,文獻(xiàn)[3]提出Structure-infused復(fù)制機(jī)制,將原句的重要詞和關(guān)系復(fù)制到摘要句,以確保生成的結(jié)果包含原句重要信息。文獻(xiàn)[4]提出一種新穎的Focus-attention機(jī)制對句子進(jìn)行編碼,并設(shè)計(jì)了一個獨(dú)立的顯性選擇網(wǎng)絡(luò)管理信息流,來區(qū)分并強(qiáng)調(diào)原句重要信息。然而,這些方法還不能令人滿意,主要表現(xiàn)在生成的文本不包含重要信息,或者用詞偏離原句語義。

    為了解決上述問題,本文采用Transformer架構(gòu),利用多頭注意力機(jī)制學(xué)習(xí)文本的長距離依賴關(guān)系,并結(jié)合重要詞識別模塊進(jìn)行句子融合。該方法主要包括兩個模塊:重要詞識別模塊與句子融合模塊。其中,重要詞識別模塊利用BiLSTM-CRF序列標(biāo)注模型識別原句重要詞;句子融合模塊將重要詞與原句輸入Transformer框架,利用BERT進(jìn)行語義表示,并在全連接層引入基于原句和詞表獲得的向量作為先驗(yàn)知識生成融合句。該模型通過重要詞識別模塊加強(qiáng)了模型對重要詞的理解與關(guān)注,并且通過引入先驗(yàn)知識,確保融合過程中包含更多原句中的詞,使得結(jié)果與原句語義一致。此外,本文還基于NLPCC2017會議上的單文檔摘要評測數(shù)據(jù)集,利用相似度計(jì)算方法獲得了一定規(guī)模的漢語句子融合數(shù)據(jù)集(大約包含35 000多個樣例)來訓(xùn)練模型。相關(guān)實(shí)驗(yàn)表明,本文所提模型性能明顯優(yōu)于基線系統(tǒng)。

    1 相關(guān)工作

    關(guān)于句子融合。由于可獲得的句子融合數(shù)據(jù)集規(guī)模較小,因此大多數(shù)研究都使用無監(jiān)督的方法。如:文獻(xiàn)[7]提出了簡單的詞圖方法,從不同的輸入語句中復(fù)制片段并將它們連接起來形成最終句子。在此基礎(chǔ)上,研究者嘗試使用多種策略(如關(guān)鍵短語重新排名)改善詞圖方法[5-7]。為了改善融合后句子的語法合理性及新詞包含率,文獻(xiàn)[11]通過無監(jiān)督手段引入語義一致的句子對來訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型,具體思想為:首先利用詞圖方法產(chǎn)生粗粒度壓縮文本B,然后用較短的同義詞替換壓縮文本中的詞產(chǎn)生新句子C,最后利用所獲得的語義一致的句子對(B,C)訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型。

    關(guān)于文本生成?,F(xiàn)有的主流文本生成方法主要采用基于序列到序列(Seq2seq)的基本框架。在此基礎(chǔ)上,一些研究者通過使用注意力機(jī)制來選擇重要詞,如:文獻(xiàn)[15]在基于Attention的Seq2seq生成模型中引入VAE結(jié)構(gòu),將句子固定結(jié)構(gòu)特征作為潛在向量并采用VAE作為生成框架來解決推理生成問題。也有研究者引入復(fù)制機(jī)制來獲取句子重要信息,如:Song等[3]采用結(jié)構(gòu)注入復(fù)制機(jī)制將原句重要詞和依賴關(guān)系復(fù)制到目標(biāo)句子。隨著BERT的出現(xiàn),研究者嘗試在Seq2seq框架上引入BERT獲得了更好的系統(tǒng)性能。如:Liu等[10]在目標(biāo)數(shù)據(jù)集上調(diào)整預(yù)訓(xùn)練的BERT獲得文檔的輸入表示,并與Transformer解碼器相結(jié)合完成生成任務(wù),獲得了比之前模型更好的性能。然而,基于Transformer的方法仍存在一些局限,如:生成的融合句未包括原句重要信息,或者偏離原句內(nèi)容。

    關(guān)于相關(guān)數(shù)據(jù)集。目前關(guān)于句子融合的大規(guī)模數(shù)據(jù)集較少,且多為英文數(shù)據(jù)集。較早的句子融合數(shù)據(jù)集來自于Newsblaster摘要系統(tǒng)的新聞報(bào)道并由人標(biāo)注產(chǎn)生,共包含3 000個樣例[11]。文獻(xiàn)[12]從Thomson-Reuters新聞專線中使用基于Bigram計(jì)數(shù)重疊的簡單貪婪方法來對齊句子,構(gòu)建了融合句-摘要句對形式數(shù)據(jù)集(約300個樣例)。文獻(xiàn)[13]為了探索有監(jiān)督的句子融合方法,通過制定一些規(guī)則從摘要任務(wù)數(shù)據(jù)集構(gòu)造了1 858個樣例。James等[2]在大規(guī)模新聞?wù)Z料Gigaword上,通過提取每篇文章的第一句和標(biāo)題并經(jīng)過數(shù)據(jù)清理,來獲得句子和標(biāo)題對作為句子融合的訓(xùn)練語料。

    2 方 法

    2.1 任務(wù)定義

    本文提出了一種基于Transformer和重要詞識別的句子融合方法。該方法的模型總體架構(gòu)如圖2所示,主要包括句子重要詞識別和句子融合兩個模塊。其中,重要詞識別模塊利用BiLSTM-CRF序列標(biāo)注模型識別原句重要詞;句子融合模塊將重要詞與原句作為Transformer框架的輸入,利用BERT進(jìn)行語義表示,并在全連接層引入基于原句和詞表獲得的向量作為先驗(yàn)知識生成融合句。

    圖2 本文的句子融合模型框架

    2.2 句子重要詞識別

    為了使模型更好地捕捉原句重要信息,本文引入句子重要詞的相關(guān)概念,并基于BiLSTM-CRF模型進(jìn)行句子重要詞的識別。

    句子重要詞是反映句子重要語義信息的詞,具體識別時以同時出現(xiàn)在原句與融合句中的實(shí)詞(主要指:名詞、動詞和形容詞)為判別依據(jù)。

    本文將句子重要詞識別任務(wù)看作序列標(biāo)注問題,并通過式(2)來刻畫。

    式中:W={w1,w2,…,wm}為輸入句子的詞序列,T*={t1,t2,…,tm}為輸出的最優(yōu)標(biāo)注序列。其中的標(biāo)記為1、0。1代表該詞為重要詞,反之則為0。

    具體采用BiLSTM-CRF模型來識別,具體如圖2左部的模塊。該模型包括表示層、BiLSTM層和CRF層。其中,表示層將句子中的每個詞表示為詞向量;BiLSTM層負(fù)責(zé)將詞向量作為輸入對句子建模,同時更好地捕捉長距離依賴關(guān)系;CRF層為標(biāo)簽預(yù)測添加一些約束來保證預(yù)測標(biāo)簽的準(zhǔn)確性,并輸出句子中每個詞的標(biāo)簽得分以獲得最優(yōu)標(biāo)簽序列的概率。

    2.3 句子融合

    句子融合模塊采用Transformer框架(Dong等[14])實(shí)現(xiàn)編碼與解碼。該模塊首先對輸入句子集利用BERT獲得字的上下文語義表示H0={xw1,xw2,…,xwn}(n為輸入字序列的長度)。具體操作時,在輸入序列的首部添加[CLS]標(biāo)記,在每個句子末尾添加[SEP]標(biāo)記。然后,將BERT語義表示(Token Embedding)與位置嵌入(Position Embedding)、段嵌入(Segment Embedding)拼接形成輸入的向量表示。其中,段嵌入用來標(biāo)識原句和融合句,0對應(yīng)原句,1對應(yīng)融合句。

    需要注意的是,本文使用的掩碼矩陣允許原句的字從前后兩個方向計(jì)算注意力值,而融合句的字只能對([MASK])及之前的字,以及原句的字計(jì)算注意力值。

    式中:s和t為訓(xùn)練參數(shù)。

    2.4 損失函數(shù)

    對于重要詞識別任務(wù)和句子融合任務(wù),使用交叉熵函數(shù)作為句子融合模型訓(xùn)練的損失函數(shù),其計(jì)算式為:

    式中:y表示真實(shí)結(jié)果;y′表示模型預(yù)測結(jié)果。

    3 實(shí)驗(yàn)與結(jié)果分析

    3.1 數(shù)據(jù)集

    如本文第1節(jié)所述,目前已公開的句子融合數(shù)據(jù)集主要為英文數(shù)據(jù)集,但規(guī)模都較小。對于中文來說,幾乎沒有公開的句子融合數(shù)據(jù)集。

    本文基于NLPCC2017會議的中文單文檔摘要評測任務(wù)數(shù)據(jù)集構(gòu)建了句子融合數(shù)據(jù)集。該評測數(shù)據(jù)集共包含52 000個篇章-摘要形式的樣例,且摘要中包含一些原文沒有出現(xiàn)的詞。其中的篇章為今日頭條中文新聞文本,涉及的主題有體育、食品、娛樂、政治、科技、金融等。在該數(shù)據(jù)集的基礎(chǔ)上,我們按照如下方法構(gòu)建了句子融合數(shù)據(jù)集和句子重要詞識別的數(shù)據(jù)集。

    句子融合數(shù)據(jù)集。對于每個篇章-摘要樣例,首先按標(biāo)點(diǎn)符號將摘要句切分為短句,然后用兩個句子中的共現(xiàn)詞數(shù)與句子長度之和的比值來度量其相似度,其計(jì)算式為:

    式中:WSi表示第i個句子的詞集合;wk表示詞;|Si|表示第i個句子的長度。

    然后,選擇原文最相似的句子構(gòu)成該摘要句的待融合句子集,從而形成原句-融合句(摘要句)形式的樣例。通過去重、剔除詞重疊率小于0.45的樣例,最終得到35 488條數(shù)據(jù)。其中,訓(xùn)練集31 488條,驗(yàn)證集2 000條,測試集2 000條。

    本文從新詞率、原詞率和壓縮率等方面對句子融合測試集進(jìn)行了分析。其中,新詞率指融合句中新詞(未出現(xiàn)在原句的詞)在原句的占比;原詞率指融合句中的原詞(出現(xiàn)在原句的詞)在原句的占比;壓縮率指融合句長度與原句長度之比。具體結(jié)果如表1所示,從原詞率、新詞率、壓縮率可以看出融合過程中,部分原詞被保留,大部分冗余信息被刪除,同時包含未在原句出現(xiàn)的詞,表明句子融合任務(wù)不是簡單地去除冗余信息,還需要生成一些新的詞語。

    表1 句子融合測試集相關(guān)分析

    句子重要詞識別數(shù)據(jù)集。在句子融合數(shù)據(jù)集上,通過對比原句與融合句中重疊的實(shí)詞自動標(biāo)注獲得重要詞數(shù)據(jù)集。具體過程為:如果原句中的實(shí)詞出現(xiàn)在融合句中,則標(biāo)注為1,否則為0。訓(xùn)練集、驗(yàn)證集和測試集的比例與句子融合數(shù)據(jù)集相同。

    3.2 實(shí)驗(yàn)設(shè)置與評價指標(biāo)

    對于句子重要詞識別,模型參數(shù)設(shè)置為:詞向量維度為300,隱藏層數(shù)為3,隱藏層單元個數(shù)為200,詞的最大長度為4,批次大小為32,學(xué)習(xí)率為0.015,訓(xùn)練1 000輪,優(yōu)化函數(shù)為Adam。

    對于句子融合,為了節(jié)省計(jì)算量,對詞表進(jìn)行精簡,詞表規(guī)模|V|=13 584。模型其他參數(shù)設(shè)置為:字向量維度為768,隱藏狀態(tài)大小為768,具有12個注意力頭。根據(jù)對數(shù)據(jù)集的分析,句子長度都比較短,故將文本輸入的最大長設(shè)為256,輸出的最大長度設(shè)為110。批處理大小為16,學(xué)習(xí)率設(shè)為1e-5,訓(xùn)練100輪,優(yōu)化函數(shù)為Adam。

    重要詞識別評價指標(biāo)。利用精確率、召回率和F1值來評價重要詞識別情況。

    句子融合評價指標(biāo)。對模型生成的融合句,使用ROUGE-L、ROUGE-2、ROUGE-1和BLEU指標(biāo)進(jìn)行自動評估。ROUGRE-L是通過計(jì)算標(biāo)準(zhǔn)融合句和生成的融合句之間的最大公共子序列的統(tǒng)計(jì)量,來評價生成的融合句所含的信息量。BLEU通過統(tǒng)計(jì)生成的融合句與標(biāo)準(zhǔn)的融合句之間的匹配片段的個數(shù),來評價生成的融合句的合理性與流暢性。

    3.3 句子融合的基線系統(tǒng)

    由于句子融合是很多生成式摘要系統(tǒng)的重要子任務(wù),所以本文采用性能比較好的摘要生成系統(tǒng)作為對比基線系統(tǒng)。

    (1) DRGD模型[9]。該模型面向摘要生成基于深度GRU遞歸模型學(xué)習(xí)目標(biāo)摘要中隱含的結(jié)構(gòu)信息,同時采用VAE作為生成框架來解決推理生成問題,以提高摘要質(zhì)量。

    (2) Struct+2Way+Relation模型[3]。該模型在基于BiLSTM框架的摘要系統(tǒng)中引入Structure-Infused復(fù)制機(jī)制,將重要詞和句法依賴關(guān)系從原句復(fù)制到摘要句,提升了系統(tǒng)性能。

    (3) UNILM模型[14]。該模型是融合了自然語言理解和自然語言生成能力的Transformer統(tǒng)一框架,其核心是通過特殊的Attention Mask來實(shí)現(xiàn)不同的語言模型。

    本文沒有專門與文獻(xiàn)[10]中所提基于Transformer架構(gòu)的模型進(jìn)行對比是因?yàn)楸疚膶?shí)驗(yàn)是在基于Transformer框架的UNILM上進(jìn)行改進(jìn),已包含該框架的對比結(jié)果。

    根據(jù)相應(yīng)文獻(xiàn)來源找到對應(yīng)模型代碼,將實(shí)驗(yàn)數(shù)據(jù)換為本文實(shí)驗(yàn)所用數(shù)據(jù),實(shí)驗(yàn)其他設(shè)置與原論文保持一致。

    本文系統(tǒng)基于UNILM模型結(jié)合任務(wù)特點(diǎn)進(jìn)行了改進(jìn),實(shí)現(xiàn)了較好的實(shí)驗(yàn)結(jié)果。

    3.4 結(jié)果分析

    3.4.1句子融合結(jié)果分析

    句子融合的具體實(shí)驗(yàn)結(jié)果如表2所示。

    表2 句子融合結(jié)果(%)

    從表2可以看出,本文所提方法同其他方法相比獲得了最好性能。當(dāng)“UNILM”模型中同時加入先驗(yàn)知識以及句子重要詞時,BLEU-4值提升了約2%,ROUGE-L值提升了約5%,ROUGE-2、ROUGE-1也有明顯提升,而且加入句子重要詞提升效果比加入先驗(yàn)知識更明顯,表明如果模型可以正確識別句子的重要信息,就可以得到更準(zhǔn)確、流暢的結(jié)果。當(dāng)模型中僅加入先驗(yàn)知識時,BLEU-4、ROUGE-L、ROUGE-2和ROUGE-1也有改進(jìn),表明先驗(yàn)知識的引入在一定程度上可以提升句子融合的質(zhì)量。此外,還發(fā)現(xiàn)“UNILM”模型比“DRGD”模型、“Struct+2Way+Relation”模型的效果要好,表明“UNILM”模型擁有更強(qiáng)大的學(xué)習(xí)能力。

    本文從實(shí)驗(yàn)結(jié)果中隨機(jī)抽取了100條數(shù)據(jù)進(jìn)行分析,部分?jǐn)?shù)據(jù)如圖3所示。

    原句1:“中新網(wǎng)7月21日電據(jù)安縣人民政府網(wǎng)站消息,2015年7月21日上午,新浪微博出現(xiàn)一則慶安縣公安局經(jīng)刑偵大隊(duì)副大隊(duì)長姚永軍的妻子王洪濤反映其利用職務(wù)之便,貪污受賄、實(shí)施家暴的視頻。目前已被停職,慶安縣人民檢察院已介入調(diào)查。”標(biāo)準(zhǔn)融合句:“網(wǎng)曝綏化慶安刑偵大隊(duì)副大隊(duì)長利用職務(wù)之便,貪污受賄、實(shí)施家暴,目前已被停職,檢方介入調(diào)查?!盪NILM:“安慶慶安縣公安局經(jīng)刑偵大隊(duì)副大隊(duì)長姚永軍妻子王洪濤被舉報(bào),其妻子王洪濤已被刑拘,檢方已介入調(diào)查?!盪NILM+先驗(yàn)知識:“慶安縣公安局經(jīng)刑偵大隊(duì)長妻子王洪濤貪污受賄、實(shí)施家暴,目前,慶安縣檢察院已介入調(diào)查。”UNILM+先驗(yàn)知識+句子重要詞:“慶安刑偵大隊(duì)副大隊(duì)長利用職務(wù)之便,貪污受賄、實(shí)施家暴,目前已被介入調(diào)查?!痹?:“人民網(wǎng):北京11月29日電(記者孝金波)今天,記者從中國鐵路總公司獲悉,自11月30日起,中國鐵路客戶服務(wù)中心12306網(wǎng)站支付寶賬戶支付服務(wù)功能上線試運(yùn)行,旅客網(wǎng)購火車票新增一種支付方式?!睒?biāo)準(zhǔn)融合句:“人民網(wǎng):12306網(wǎng)站明日起新增支付寶支付服務(wù)功能。”UNILM:“鐵路客戶服務(wù)中心12306網(wǎng)站支付寶賬戶支付服務(wù)功能上線試運(yùn)行,旅客網(wǎng)購火車票新增一種支付方式?!盪NILM+先驗(yàn)知識:“自11月30日起,中國鐵路客戶服務(wù)中心12306網(wǎng)站支付寶賬戶支付功能上線試運(yùn)行,新增一種支付方式?!盪NILM+先驗(yàn)知識+句子重要詞:“12306網(wǎng)站新增支付寶支付服務(wù)功能?!痹?:“中新網(wǎng)4月27日電:據(jù)外媒報(bào)道,《星期日泰晤士報(bào)》27日發(fā)布年度富豪榜,出生在烏克蘭的布拉瓦特尼克成為英國首富。伊麗莎白女王的財(cái)富增長1 000萬英鎊至3.4億英鎊,但卻首次跌出了該國的富豪前300強(qiáng)?!睒?biāo)準(zhǔn)融合句:“英國公布年度富豪榜:烏克蘭裔商人131億英鎊居首,女王3.4億英鎊,首次跌出前300?!盪NILM:“英國發(fā)布年度富豪榜,出生在烏克蘭的布拉瓦特尼克成為英國首富,但首次跌出該國富豪前300強(qiáng)?!盪NILM+先驗(yàn)知識:“英國首富布拉瓦特尼克成英國首富,伊麗莎白女王財(cái)富增長1000萬英鎊至3.4億英鎊,但首次跌出該國富豪前300強(qiáng)?!盪NILM+先驗(yàn)知識+句子重要詞:“英國富豪榜:烏克蘭女王成英國首富,女王財(cái)富3.4億英鎊,但首次跌出前300強(qiáng)?!?/p>

    從結(jié)果的整體上看,加入先驗(yàn)知識和句子重要詞識別兩個模塊后,在一定程度上改善了融合句子的準(zhǔn)確性和流暢性。例如,在示例1中,“UNILM+先驗(yàn)知識”模型輸出句子中有更多的詞來源于原句;“UNILM+句子重要詞+先驗(yàn)知識”模型比“UNILM+先驗(yàn)知識”模型更準(zhǔn)確地識別到了原句重要信息,輸出的句子更接近于標(biāo)準(zhǔn)融合句。

    然而,模型的輸出還存一些局限。如示例3中,由于句子中出現(xiàn)多個實(shí)體詞:“出生在烏克蘭的布拉瓦特尼克”和“伊麗莎白女王”,本文模型輸出了錯誤的實(shí)體匹配結(jié)構(gòu),導(dǎo)致融合的句子質(zhì)量變差。所以,對于出現(xiàn)多個同類實(shí)體的情況,還需要進(jìn)一步進(jìn)行研究和改進(jìn)。

    3.4.2句子重要詞識別

    原句重要詞識別實(shí)驗(yàn)結(jié)果如表3所示。

    表3 句子重要詞識別結(jié)果(%)

    實(shí)驗(yàn)結(jié)果顯示BiLSTM-CRF模型識別的精確度更高。本文在采用TextRank算法時,在句子中過濾掉停用詞,只保留指定詞性的詞,迭代得到每個詞的權(quán)重,根據(jù)原句子和融合句子的原詞率(見表1),本文選取前N(N=m×2/5,其中m為句子的長度)個權(quán)重較大的句子重要詞。在此過程中,并未考慮句子結(jié)構(gòu)信息,導(dǎo)致標(biāo)注了部分不重要的詞。對于BiLSTM-CRF模型,其考慮了句法信息,以及融合句與原句子的交互信息。從結(jié)果數(shù)據(jù)看,該模型結(jié)果雖有提升,但還不理想。所以,提升句子重要詞的預(yù)測能力將是下一步研究重點(diǎn)。

    4 結(jié) 語

    為了解決句子融合后存在重要信息缺失、語義偏離原句等問題,本文提出了一種基于Transformer和重要詞識別的句子融合方法。該方法主要分為兩個模塊:句子重要詞識別模塊負(fù)責(zé)識別原句的重要信息;句子融合模塊基于原句重要信息和先驗(yàn)知識生成融合句。實(shí)驗(yàn)結(jié)果表明,模型取得了較好效果。

    然而模型還存在一些局限,如:未能準(zhǔn)確獲取句子中的實(shí)體匹配關(guān)系導(dǎo)致融合結(jié)果不夠好;詞語特征構(gòu)建不充分引起句子重要詞識別還不夠理想。未來,我們將加強(qiáng)句子重要信息的識別與句子語義關(guān)系分析,進(jìn)一步提升句子融合效果。

    猜你喜歡
    原句先驗(yàn)文本
    在808DA上文本顯示的改善
    基于無噪圖像塊先驗(yàn)的MRI低秩分解去噪算法研究
    基于doc2vec和TF-IDF的相似文本識別
    電子制作(2018年18期)2018-11-14 01:48:06
    基于自適應(yīng)塊組割先驗(yàn)的噪聲圖像超分辨率重建
    仿寫句子
    文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
    基于平滑先驗(yàn)法的被動聲信號趨勢項(xiàng)消除
    先驗(yàn)的廢話與功能的進(jìn)路
    托福閱讀句子簡化題解題策略
    新東方英語(2014年4期)2014-04-09 11:15:56
    如何快速走進(jìn)文本
    語文知識(2014年1期)2014-02-28 21:59:13
    久久人人爽av亚洲精品天堂| 午夜精品在线福利| 一夜夜www| 欧美乱妇无乱码| 69精品国产乱码久久久| 在线天堂中文资源库| 亚洲va日本ⅴa欧美va伊人久久| 日韩欧美免费精品| 十八禁高潮呻吟视频| 黄色 视频免费看| 欧美在线黄色| 亚洲av熟女| 性少妇av在线| 久久 成人 亚洲| 国产成人免费无遮挡视频| 国产精华一区二区三区| 久久精品国产a三级三级三级| svipshipincom国产片| 国产黄色免费在线视频| 777米奇影视久久| 丝袜美足系列| 欧美日韩瑟瑟在线播放| 性少妇av在线| 国产精品久久久av美女十八| 丝袜美足系列| 成人国语在线视频| 我的亚洲天堂| 国产99久久九九免费精品| 日韩大码丰满熟妇| 欧美乱色亚洲激情| 欧美成狂野欧美在线观看| 久久人妻福利社区极品人妻图片| 久久香蕉激情| x7x7x7水蜜桃| 中文字幕人妻丝袜一区二区| 熟女少妇亚洲综合色aaa.| 久久精品成人免费网站| 满18在线观看网站| 日本vs欧美在线观看视频| 国产成人欧美在线观看 | 飞空精品影院首页| 两个人看的免费小视频| 欧美另类亚洲清纯唯美| 高潮久久久久久久久久久不卡| 97人妻天天添夜夜摸| 久久草成人影院| 极品人妻少妇av视频| 高潮久久久久久久久久久不卡| 欧美日韩黄片免| 欧美黑人欧美精品刺激| 欧美精品人与动牲交sv欧美| 又大又爽又粗| 夜夜爽天天搞| 国产伦人伦偷精品视频| 亚洲成av片中文字幕在线观看| av欧美777| 国产淫语在线视频| 亚洲成av片中文字幕在线观看| 捣出白浆h1v1| 精品国产美女av久久久久小说| 伊人久久大香线蕉亚洲五| 久久久精品区二区三区| 亚洲五月色婷婷综合| 少妇粗大呻吟视频| 日韩 欧美 亚洲 中文字幕| 十八禁高潮呻吟视频| 老司机深夜福利视频在线观看| 夜夜躁狠狠躁天天躁| 成人18禁高潮啪啪吃奶动态图| 午夜久久久在线观看| 午夜免费鲁丝| 99久久人妻综合| 午夜福利,免费看| 亚洲性夜色夜夜综合| 亚洲七黄色美女视频| 满18在线观看网站| 日韩视频一区二区在线观看| 国产麻豆69| 成人国语在线视频| 久99久视频精品免费| 日韩一卡2卡3卡4卡2021年| 亚洲免费av在线视频| 国产97色在线日韩免费| 国产高清videossex| 一边摸一边做爽爽视频免费| 亚洲av日韩精品久久久久久密| 亚洲一码二码三码区别大吗| av超薄肉色丝袜交足视频| 久久精品91无色码中文字幕| 日韩熟女老妇一区二区性免费视频| avwww免费| 欧美av亚洲av综合av国产av| 日韩欧美一区视频在线观看| 国产欧美日韩精品亚洲av| 亚洲精品美女久久久久99蜜臀| 婷婷成人精品国产| 天天躁日日躁夜夜躁夜夜| 亚洲午夜理论影院| 搡老乐熟女国产| 在线观看免费高清a一片| 国产成+人综合+亚洲专区| 12—13女人毛片做爰片一| 他把我摸到了高潮在线观看| 国产真人三级小视频在线观看| 亚洲专区国产一区二区| 在线观看66精品国产| 999精品在线视频| 在线天堂中文资源库| 美女 人体艺术 gogo| 黄色怎么调成土黄色| 一本大道久久a久久精品| 美女国产高潮福利片在线看| 成人精品一区二区免费| av电影中文网址| 欧美日韩精品网址| 欧美精品亚洲一区二区| tube8黄色片| 五月开心婷婷网| 国产精品一区二区在线观看99| a级片在线免费高清观看视频| 丁香欧美五月| videos熟女内射| 久久精品aⅴ一区二区三区四区| 亚洲熟妇中文字幕五十中出 | 国产一卡二卡三卡精品| 国产不卡av网站在线观看| 国产主播在线观看一区二区| 国产精品久久久av美女十八| 99re在线观看精品视频| 18禁国产床啪视频网站| 香蕉丝袜av| 高清毛片免费观看视频网站 | 怎么达到女性高潮| 老司机福利观看| 十分钟在线观看高清视频www| 国精品久久久久久国模美| 老司机深夜福利视频在线观看| 午夜福利影视在线免费观看| 看免费av毛片| 啦啦啦在线免费观看视频4| 久久国产亚洲av麻豆专区| a级毛片黄视频| 国产不卡一卡二| 国产精品一区二区在线观看99| 少妇被粗大的猛进出69影院| 中文字幕制服av| 国产精品综合久久久久久久免费 | 91av网站免费观看| 久久天躁狠狠躁夜夜2o2o| 亚洲一码二码三码区别大吗| 国产精品.久久久| 99在线人妻在线中文字幕 | 成人三级做爰电影| 精品高清国产在线一区| 欧美精品亚洲一区二区| 成人av一区二区三区在线看| 亚洲熟女毛片儿| 一级黄色大片毛片| 中文字幕制服av| 纯流量卡能插随身wifi吗| 国产一区有黄有色的免费视频| 国产午夜精品久久久久久| 久久人妻福利社区极品人妻图片| 露出奶头的视频| 久久久水蜜桃国产精品网| 极品教师在线免费播放| 国产一区二区三区在线臀色熟女 | 久久精品91无色码中文字幕| 久久这里只有精品19| 大片电影免费在线观看免费| 精品久久久久久久久久免费视频 | 黄色毛片三级朝国网站| xxx96com| 国产男女内射视频| 免费一级毛片在线播放高清视频 | 亚洲精品国产精品久久久不卡| 男女下面插进去视频免费观看| 国产区一区二久久| 黄色毛片三级朝国网站| 一级毛片精品| 精品卡一卡二卡四卡免费| 老司机深夜福利视频在线观看| 亚洲精品国产区一区二| 一进一出抽搐gif免费好疼 | 精品人妻1区二区| 亚洲成av片中文字幕在线观看| videosex国产| 人人妻人人澡人人看| www.熟女人妻精品国产| 国产人伦9x9x在线观看| 欧美中文综合在线视频| 国精品久久久久久国模美| 老熟妇乱子伦视频在线观看| 久久久精品区二区三区| 国产野战对白在线观看| 亚洲aⅴ乱码一区二区在线播放 | 中文字幕最新亚洲高清| 欧美大码av| 中文字幕高清在线视频| 99精品在免费线老司机午夜| www.自偷自拍.com| 又大又爽又粗| 99国产精品99久久久久| 嫩草影视91久久| 老熟女久久久| 飞空精品影院首页| 免费看a级黄色片| 亚洲,欧美精品.| 久久精品国产亚洲av高清一级| 成人手机av| 大码成人一级视频| 欧美日韩精品网址| 巨乳人妻的诱惑在线观看| 国产野战对白在线观看| 女人被躁到高潮嗷嗷叫费观| 国产99白浆流出| 国产亚洲精品第一综合不卡| 日本精品一区二区三区蜜桃| 午夜福利在线观看吧| 黄色丝袜av网址大全| 在线观看免费高清a一片| 人人妻人人添人人爽欧美一区卜| 久久人人爽av亚洲精品天堂| 亚洲av片天天在线观看| 人人澡人人妻人| 18禁观看日本| 国产欧美日韩精品亚洲av| 又大又爽又粗| 国产亚洲欧美精品永久| av国产精品久久久久影院| 亚洲五月色婷婷综合| 欧美日韩亚洲高清精品| 一a级毛片在线观看| 欧美黄色片欧美黄色片| 男女下面插进去视频免费观看| 十分钟在线观看高清视频www| 精品一区二区三区av网在线观看| 精品国产乱子伦一区二区三区| 日日摸夜夜添夜夜添小说| 女人爽到高潮嗷嗷叫在线视频| 美女视频免费永久观看网站| 国产又爽黄色视频| av网站免费在线观看视频| 中文字幕av电影在线播放| 一级a爱片免费观看的视频| 精品免费久久久久久久清纯 | 亚洲欧美日韩高清在线视频| 亚洲成人手机| 国产精品免费视频内射| 久久国产乱子伦精品免费另类| 午夜福利一区二区在线看| 久久人妻福利社区极品人妻图片| 最新美女视频免费是黄的| 久久婷婷成人综合色麻豆| 欧美激情 高清一区二区三区| 亚洲精品美女久久av网站| 精品国产一区二区三区久久久樱花| 国产精品 国内视频| 欧美黄色淫秽网站| 久久人人爽av亚洲精品天堂| 精品少妇一区二区三区视频日本电影| 91麻豆精品激情在线观看国产 | 久久人人97超碰香蕉20202| 日韩制服丝袜自拍偷拍| 国产一区在线观看成人免费| 亚洲熟妇熟女久久| 欧美精品一区二区免费开放| 亚洲情色 制服丝袜| 国产成+人综合+亚洲专区| 成人精品一区二区免费| 老熟妇乱子伦视频在线观看| 国产一区有黄有色的免费视频| 久久精品人人爽人人爽视色| 人人妻人人澡人人看| 搡老熟女国产l中国老女人| 亚洲专区中文字幕在线| 91麻豆精品激情在线观看国产 | 国产一区在线观看成人免费| 女警被强在线播放| 人成视频在线观看免费观看| 国产av又大| 人人妻人人添人人爽欧美一区卜| 国产亚洲av高清不卡| 亚洲av成人av| 性少妇av在线| 久久精品亚洲精品国产色婷小说| 国产99白浆流出| 国产日韩欧美亚洲二区| 国产一卡二卡三卡精品| 免费高清在线观看日韩| 久久久久视频综合| 一本综合久久免费| 婷婷精品国产亚洲av在线 | 一本大道久久a久久精品| 亚洲第一青青草原| 久久九九热精品免费| 国产高清国产精品国产三级| 99国产精品一区二区三区| 嫩草影视91久久| 久久香蕉国产精品| 一级作爱视频免费观看| 黄片播放在线免费| 女性被躁到高潮视频| tube8黄色片| 夜夜爽天天搞| av国产精品久久久久影院| 男女午夜视频在线观看| 99国产精品免费福利视频| 国产伦人伦偷精品视频| 久久这里只有精品19| 看免费av毛片| 亚洲精品国产区一区二| 80岁老熟妇乱子伦牲交| 嫁个100分男人电影在线观看| 一级毛片精品| 啦啦啦免费观看视频1| 免费女性裸体啪啪无遮挡网站| cao死你这个sao货| 国产单亲对白刺激| 免费在线观看视频国产中文字幕亚洲| 一区二区日韩欧美中文字幕| 性色av乱码一区二区三区2| 少妇的丰满在线观看| 欧美精品啪啪一区二区三区| 亚洲av第一区精品v没综合| 9191精品国产免费久久| 国产免费av片在线观看野外av| 69精品国产乱码久久久| 男男h啪啪无遮挡| 热re99久久精品国产66热6| 99re在线观看精品视频| 天堂中文最新版在线下载| 大片电影免费在线观看免费| 国产视频一区二区在线看| 国产精品国产av在线观看| 高清毛片免费观看视频网站 | tocl精华| 色综合欧美亚洲国产小说| 成人三级做爰电影| 欧美国产精品一级二级三级| 一边摸一边做爽爽视频免费| 亚洲男人天堂网一区| 一进一出抽搐动态| 99国产精品一区二区三区| 人人妻人人爽人人添夜夜欢视频| 久久天躁狠狠躁夜夜2o2o| 极品人妻少妇av视频| 一级毛片高清免费大全| 亚洲全国av大片| 99精国产麻豆久久婷婷| 精品国产一区二区久久| 咕卡用的链子| 香蕉丝袜av| 美女福利国产在线| 欧美在线黄色| 亚洲五月婷婷丁香| 国产成人啪精品午夜网站| 99国产精品99久久久久| 日韩中文字幕欧美一区二区| 天堂动漫精品| 久久草成人影院| 韩国av一区二区三区四区| 丝瓜视频免费看黄片| 在线观看免费日韩欧美大片| 精品国产超薄肉色丝袜足j| 久久久久久久久久久久大奶| 91老司机精品| 亚洲av成人不卡在线观看播放网| 日本黄色日本黄色录像| 国产精品成人在线| 久久影院123| 久热爱精品视频在线9| 国产午夜精品久久久久久| 欧美日韩一级在线毛片| 高清欧美精品videossex| 亚洲精品美女久久久久99蜜臀| 国产成人av激情在线播放| 高清视频免费观看一区二区| 精品国产乱子伦一区二区三区| www.999成人在线观看| 50天的宝宝边吃奶边哭怎么回事| 在线天堂中文资源库| 一级毛片精品| 大陆偷拍与自拍| 亚洲一区二区三区不卡视频| 亚洲欧美一区二区三区黑人| 老司机在亚洲福利影院| 亚洲国产精品一区二区三区在线| 怎么达到女性高潮| 精品亚洲成国产av| 叶爱在线成人免费视频播放| 麻豆国产av国片精品| 午夜免费鲁丝| 美女视频免费永久观看网站| 天天添夜夜摸| 亚洲精品国产一区二区精华液| 亚洲欧美精品综合一区二区三区| 热99久久久久精品小说推荐| xxx96com| 国产精品九九99| 人人澡人人妻人| 国产成人系列免费观看| 欧美日韩福利视频一区二区| 女性被躁到高潮视频| 久久狼人影院| 精品福利永久在线观看| 亚洲综合色网址| 12—13女人毛片做爰片一| 90打野战视频偷拍视频| 久久精品国产99精品国产亚洲性色 | 欧美人与性动交α欧美精品济南到| 中文字幕高清在线视频| avwww免费| av超薄肉色丝袜交足视频| 最近最新中文字幕大全电影3 | 亚洲欧美激情综合另类| 一级毛片精品| 欧美av亚洲av综合av国产av| 欧美日韩福利视频一区二区| 女人高潮潮喷娇喘18禁视频| 高清av免费在线| 精品人妻在线不人妻| 中文字幕最新亚洲高清| 国产免费av片在线观看野外av| 少妇的丰满在线观看| 免费在线观看影片大全网站| 亚洲精品中文字幕一二三四区| 丰满人妻熟妇乱又伦精品不卡| 亚洲熟女毛片儿| 色94色欧美一区二区| 婷婷丁香在线五月| 天天躁夜夜躁狠狠躁躁| 亚洲黑人精品在线| 在线观看免费高清a一片| 久热这里只有精品99| 日韩欧美在线二视频 | 精品国产乱子伦一区二区三区| 日韩欧美一区视频在线观看| 亚洲第一欧美日韩一区二区三区| 飞空精品影院首页| 精品福利永久在线观看| 国产日韩一区二区三区精品不卡| 天天躁夜夜躁狠狠躁躁| 国产伦人伦偷精品视频| 人人妻人人添人人爽欧美一区卜| 日本欧美视频一区| 18禁黄网站禁片午夜丰满| 一本大道久久a久久精品| 美女高潮喷水抽搐中文字幕| 国产高清国产精品国产三级| 侵犯人妻中文字幕一二三四区| 国内毛片毛片毛片毛片毛片| 91大片在线观看| 国产精品久久久av美女十八| 日韩有码中文字幕| 国产精品98久久久久久宅男小说| 午夜福利在线免费观看网站| 99精品在免费线老司机午夜| 成年人免费黄色播放视频| 黑人操中国人逼视频| 狠狠狠狠99中文字幕| 又紧又爽又黄一区二区| 69精品国产乱码久久久| 成人av一区二区三区在线看| 两性夫妻黄色片| 欧美激情久久久久久爽电影 | 18禁裸乳无遮挡动漫免费视频| 侵犯人妻中文字幕一二三四区| 女性生殖器流出的白浆| 搡老乐熟女国产| videos熟女内射| 亚洲一卡2卡3卡4卡5卡精品中文| 亚洲午夜精品一区,二区,三区| 亚洲国产精品一区二区三区在线| 丰满饥渴人妻一区二区三| 美女 人体艺术 gogo| 国产一区在线观看成人免费| 国产精品一区二区免费欧美| av有码第一页| 亚洲午夜理论影院| 国内毛片毛片毛片毛片毛片| netflix在线观看网站| 黄色视频不卡| 欧美大码av| 亚洲国产毛片av蜜桃av| 国产熟女午夜一区二区三区| 男男h啪啪无遮挡| 国产野战对白在线观看| 热99re8久久精品国产| 欧美+亚洲+日韩+国产| 99久久综合精品五月天人人| 黄色女人牲交| 悠悠久久av| 嫁个100分男人电影在线观看| 一本综合久久免费| 久久香蕉国产精品| 久久人妻av系列| 欧美av亚洲av综合av国产av| 三级毛片av免费| 超碰97精品在线观看| 亚洲国产欧美一区二区综合| 欧美精品亚洲一区二区| 精品熟女少妇八av免费久了| 国产一区有黄有色的免费视频| 久久久国产成人精品二区 | 国产精品1区2区在线观看. | 如日韩欧美国产精品一区二区三区| 欧美 亚洲 国产 日韩一| 国产欧美日韩精品亚洲av| 高清在线国产一区| 亚洲第一av免费看| 国产欧美日韩综合在线一区二区| 亚洲国产毛片av蜜桃av| 91老司机精品| 国产免费现黄频在线看| 国产激情欧美一区二区| 岛国毛片在线播放| 国产在线精品亚洲第一网站| 精品人妻在线不人妻| 十分钟在线观看高清视频www| 一进一出抽搐gif免费好疼 | 成人免费观看视频高清| 两个人看的免费小视频| 黄色女人牲交| av天堂久久9| 日韩熟女老妇一区二区性免费视频| a级毛片黄视频| 中国美女看黄片| 侵犯人妻中文字幕一二三四区| av网站免费在线观看视频| 欧美性长视频在线观看| 女人久久www免费人成看片| 我的亚洲天堂| 午夜免费观看网址| 校园春色视频在线观看| 无遮挡黄片免费观看| 精品久久久久久电影网| 国产精品综合久久久久久久免费 | 亚洲欧美一区二区三区久久| 大香蕉久久网| 亚洲在线自拍视频| 国产免费av片在线观看野外av| 国产成人欧美在线观看 | 1024视频免费在线观看| 成年版毛片免费区| 极品教师在线免费播放| 日日爽夜夜爽网站| 国产一区二区激情短视频| 老熟妇乱子伦视频在线观看| 黄色片一级片一级黄色片| 村上凉子中文字幕在线| 久久草成人影院| 一a级毛片在线观看| 国产精品免费大片| 日本欧美视频一区| 国产极品粉嫩免费观看在线| 超碰97精品在线观看| 欧美亚洲 丝袜 人妻 在线| 精品少妇一区二区三区视频日本电影| 国产黄色免费在线视频| 亚洲欧美日韩另类电影网站| 久久久久久久精品吃奶| 757午夜福利合集在线观看| 亚洲性夜色夜夜综合| 亚洲中文日韩欧美视频| 99国产精品免费福利视频| 国产99久久九九免费精品| 啦啦啦 在线观看视频| 人人妻人人添人人爽欧美一区卜| 日韩欧美三级三区| 成人18禁高潮啪啪吃奶动态图| 国产精品一区二区在线观看99| 一边摸一边抽搐一进一出视频| av网站免费在线观看视频| 国产精品亚洲一级av第二区| 国产精华一区二区三区| 国产亚洲精品久久久久久毛片 | 在线国产一区二区在线| 国产av精品麻豆| 中文字幕精品免费在线观看视频| 性色av乱码一区二区三区2| 亚洲va日本ⅴa欧美va伊人久久| 天天操日日干夜夜撸| 欧美成人午夜精品| 成年人黄色毛片网站| 一进一出抽搐gif免费好疼 | 美女扒开内裤让男人捅视频| 成人亚洲精品一区在线观看| 建设人人有责人人尽责人人享有的| 日本vs欧美在线观看视频| 美女午夜性视频免费| av一本久久久久| 亚洲av美国av| 精品国内亚洲2022精品成人 | 中文欧美无线码| 飞空精品影院首页| 女警被强在线播放| 人人妻,人人澡人人爽秒播| 在线av久久热| 国产高清激情床上av| 欧美精品av麻豆av| 热99久久久久精品小说推荐| 国产日韩一区二区三区精品不卡| 国产欧美日韩精品亚洲av| 高清欧美精品videossex| 精品熟女少妇八av免费久了| 他把我摸到了高潮在线观看| 亚洲自偷自拍图片 自拍| 一区在线观看完整版| 日韩欧美一区视频在线观看| 好看av亚洲va欧美ⅴa在| 一区在线观看完整版| 每晚都被弄得嗷嗷叫到高潮| 成人手机av| 自线自在国产av|