• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于多重相關(guān)信息交互的文本相似度計(jì)算方法*

    2022-08-11 08:41:12野,廖
    關(guān)鍵詞:語(yǔ)義特征文本

    袁 野,廖 薇

    (上海工程技術(shù)大學(xué)電子電氣工程學(xué)院,上海 201620)

    1 引言

    隨著互聯(lián)網(wǎng)的發(fā)展,用戶對(duì)信息的獲取效率和質(zhì)量有了更高的要求。如何在充斥著海量文本數(shù)據(jù)的互聯(lián)網(wǎng)中迅速且精準(zhǔn)地獲取目標(biāo)信息是自然語(yǔ)言處理領(lǐng)域的研究熱點(diǎn)。文本相似度計(jì)算[1]是一種解決上述問(wèn)題的關(guān)鍵技術(shù),旨在判斷和分析文本之間的語(yǔ)義相關(guān)性,在文本分類、問(wèn)答系統(tǒng)和信息檢索等任務(wù)中有著重要的作用。

    傳統(tǒng)文本相似度計(jì)算方法是基于統(tǒng)計(jì)機(jī)器學(xué)習(xí)的方法,首先獲取詞語(yǔ)和文檔的統(tǒng)計(jì)特征,然后進(jìn)行語(yǔ)義相似度分析和語(yǔ)義搜索。文獻(xiàn)[2]使用加權(quán)融合共現(xiàn)詞相關(guān)度與區(qū)分度的方法進(jìn)行語(yǔ)義相似度分析;詞頻-逆文本頻率TF-IDF(Term Frequency-Inverse Document Frequency)利用詞語(yǔ)在文檔和語(yǔ)料中的頻率特征,計(jì)算詞語(yǔ)在文檔中的重要程度[3]。LDA(Latend Dirichlet Allocation)可以對(duì)文檔隱含主題進(jìn)行建模,文獻(xiàn)[4]將LDA模型與基于詞匯特征的文本相似度模型相結(jié)合,引入了主題特征對(duì)語(yǔ)義相似度計(jì)算的貢獻(xiàn),取得了更好的性能?;诮y(tǒng)計(jì)機(jī)器學(xué)習(xí)的方法需要投入大量的人力和物力獲取特征統(tǒng)計(jì)信息,且難以提取文本深層的信息,限制了模型的性能與泛化能力。

    隨著深度學(xué)習(xí)在計(jì)算機(jī)視覺和語(yǔ)音識(shí)別領(lǐng)域取得突破性進(jìn)展,更多的研究人員將深度學(xué)習(xí)用于文本相似度計(jì)算。從模型的結(jié)構(gòu)和切入角度分析,基于深度學(xué)習(xí)的文本相似度計(jì)算模型可分為面向單語(yǔ)義、多語(yǔ)義和交互語(yǔ)義的模型。無(wú)論是哪種方法,都需要首先獲得文本的向量表示。2013年,Mikolov等[5,6]提出的word2vec詞向量模型利用神經(jīng)網(wǎng)絡(luò)將詞語(yǔ)映射到低維度的向量空間中,有良好的語(yǔ)義表達(dá)性能[7],使得該詞向量成為現(xiàn)在常用的文本嵌入方法之一。

    單語(yǔ)義模型使用簡(jiǎn)單的神經(jīng)網(wǎng)絡(luò)編碼文本,然后計(jì)算文本的相似度。Yin等[8]使用卷積神經(jīng)網(wǎng)絡(luò)CNN(Convolutional Neural Network)提取句子局部特征進(jìn)行句子語(yǔ)義相似度計(jì)算;文獻(xiàn)[9]基于長(zhǎng)短時(shí)記憶LSTM(Long and Short-Term Memory)網(wǎng)絡(luò)的孿生網(wǎng)絡(luò)結(jié)構(gòu)來(lái)學(xué)習(xí)文本相似性,通過(guò)LSTM對(duì)文本進(jìn)行語(yǔ)義特征提取和表達(dá),充分考慮到了文本的上下文信息和序列特征。

    單語(yǔ)義模型通??紤]文本的單一特征,語(yǔ)義信息不夠豐富。因此,對(duì)文本多粒度特征信息進(jìn)行融合的基于多語(yǔ)義的相似度分析方法應(yīng)運(yùn)而生。文獻(xiàn)[10]提出將CNN與LSTM相結(jié)合的文本匹配模型,CNN捕捉句子片段向量特征,再輸入LSTM編碼得到句向量,最后計(jì)算句向量間的曼哈頓距離作為句子的相似度量。文獻(xiàn)[11]從文本的不同角度進(jìn)行分析,融合多種詞向量模型構(gòu)建初始文本語(yǔ)義模型,編碼器使用基于注意力的雙向長(zhǎng)短時(shí)記憶BiLSTM(Bi-directional Long and Short-Term Memory)網(wǎng)絡(luò),最后增加特征提取器提取文本的類別特征。

    多語(yǔ)義的相似度計(jì)算模型雖然考慮了不同的分析角度,但文本的不同編碼或特征提取過(guò)程相互獨(dú)立。交互語(yǔ)義模型實(shí)現(xiàn)了文本深層信息的交互與表達(dá)。Chen等[12]提出的ESIM(Enhanced Sequential Inference Model)將注意力機(jī)制與BiLSTM結(jié)合后用于文本推理,其中BiLSTM用于提取特征,協(xié)同注意力機(jī)制用于對(duì)文本進(jìn)行組合推理,最后判斷句子的相關(guān)性。文獻(xiàn)[13]提出一種強(qiáng)調(diào)文本序列之間特征對(duì)齊的匹配模型,在保持性能的同時(shí)減少了參數(shù)規(guī)模,優(yōu)化了任務(wù)速度。

    交互語(yǔ)義模型能夠得到信息較豐富的文本表征,上述模型在許多非中文公開數(shù)據(jù)集上表現(xiàn)出良好的性能,表明了多角度交互模型在文本相似度任務(wù)上的有效性。但是,基于中文數(shù)據(jù)集的文本相似度研究,可能受限于數(shù)據(jù)集大小、數(shù)據(jù)集語(yǔ)言差異或特征的提取角度,仍有進(jìn)一步提升的空間。

    為了解決上述問(wèn)題,本文提出一種基于多重相關(guān)信息交互的文本相似度計(jì)算方法MRIIM(Multiple Related Information Interaction Method)。該方法使用一種多粒度交互的語(yǔ)義相似度模型,首先,采用預(yù)訓(xùn)練詞向量和詞語(yǔ)余弦相似度拼接作為文本的向量表達(dá);然后,使用BiLSTM對(duì)輸入文本向量進(jìn)行特征編碼,通過(guò)自注意力機(jī)制和交替協(xié)同注意力機(jī)制進(jìn)行多粒度語(yǔ)義匹配;最后,分別拼接文本的各粒度注意力特征,使用最大池化提取最顯著的特征,通過(guò)全連接層和Softmax分類器預(yù)測(cè)語(yǔ)義相似性標(biāo)簽。實(shí)驗(yàn)表明,多語(yǔ)義角度交互有助于模型獲得文本的深層隱含信息,從而提升相似度計(jì)算性能。

    2 MRIIM模型

    本文提出的MRIIM模型整體框架如圖1所示,主要包含嵌入層、編碼層、多重注意力交替交互層、特征提取層和輸出層,具體設(shè)計(jì)如下所示:

    (1)嵌入層用于將文本轉(zhuǎn)換為向量形式,使用包含語(yǔ)義的分布式向量表示文本的每個(gè)詞語(yǔ),同時(shí)與附加特征進(jìn)行拼接作為最終的文本向量表示。此處選擇的附加特征為文本余弦相似度值。該層的輸入是文本對(duì),輸出是文本向量矩陣。

    Figure 1 Framework of MRIIM圖1 MRIIM框架

    (2)編碼層用于學(xué)習(xí)文本的上下文信息,采用雙向長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)對(duì)文本進(jìn)行前向和后向的雙向?qū)W習(xí)。該層的輸入是文本向量矩陣,輸出是隱層狀態(tài)編碼對(duì)。

    (3)在多重注意力交替交互層中,分別對(duì)2個(gè)文本自身進(jìn)行基于詞的細(xì)粒度自注意力計(jì)算,以及文本之間的交替協(xié)同注意力計(jì)算,最后得到文本對(duì)的交替向量表達(dá)。該層的輸入是隱藏狀態(tài)編碼對(duì),輸出分別是文本對(duì)基于自注意力權(quán)重和文本間交替協(xié)同注意力權(quán)重的向量表達(dá)。

    (4)特征提取層將上一步驟的輸出進(jìn)行拼接,使用最大池化進(jìn)行特征提取,輸出是一維特征向量。

    (5)輸出層通過(guò)一個(gè)全連接層和Softmax函數(shù)判斷文本對(duì)的含義是否相同。該層的輸入是特征提取層生成的一維長(zhǎng)向量,輸出是一個(gè)二進(jìn)制值,0表示文本對(duì)含義不同,1表示文本對(duì)含義相同。

    2.1 任務(wù)定義

    對(duì)于給定長(zhǎng)度為m的文本v1,v2,…,vm和長(zhǎng)度為n的文本u1,u2,…,un,判斷其語(yǔ)義相似度結(jié)果y∈{0,1}。y=0表示2個(gè)文本語(yǔ)義不相似,y=1表示2個(gè)文本語(yǔ)義相似。

    2.2 包含附加特征的文本嵌入層

    在文本嵌入層,使用預(yù)訓(xùn)練的word2vec將每個(gè)詞語(yǔ)映射為密集向量表示,同時(shí),本文在每個(gè)詞向量最后增加一維附加特征值:文本對(duì)詞語(yǔ)之間的最大余弦相似度值,其計(jì)算如式(1)所示:

    f=max cos(ai,bj),?i∈[1,m],?j∈[1,n]

    (1)

    其中,ai和bj分別為2個(gè)文本中詞語(yǔ)的向量表示,f(·)表示附加特征。則詞語(yǔ)的最終向量表示形式如式(2)所示:

    (2)

    其中,E為word2vec詞嵌入矩陣,⊕為向量拼接操作,fai表示詞語(yǔ)ai的附加特征,fbj表示詞語(yǔ)bj的附加特征。假設(shè)e為詞向量維度,則該層2個(gè)文本向量表示分別為A∈Rm×(e+1),B∈Rn×(e+1)。附加特征可以為模型提供額外的語(yǔ)義信息。

    2.3 基于BiLSTM的文本信息編碼層

    編碼層對(duì)文本的上下文信息進(jìn)行編碼,MRIIM使用BiLSTM作為編碼器。

    LSTM通過(guò)增加輸入門、遺忘門、輸出門和記憶狀態(tài)細(xì)胞來(lái)解決循環(huán)神經(jīng)網(wǎng)絡(luò)存在的長(zhǎng)依賴和梯度爆炸問(wèn)題,使用門機(jī)制控制信息的保留、遺忘和狀態(tài)更新。

    LSTM只能學(xué)習(xí)文本的上文信息,而不能學(xué)習(xí)文本的下文信息。而在實(shí)際中,詞語(yǔ)的語(yǔ)義可能同時(shí)受到上下文詞語(yǔ)的影響,因此本文通過(guò)BiLSTM結(jié)構(gòu)使用2個(gè)方向相反的LSTM來(lái)捕捉文本的上下文序列特征,具體過(guò)程如式(3)~式(5)所示:

    (3)

    (4)

    (5)

    該層的文本語(yǔ)義表示如式(6)所示:

    (6)

    其中h為L(zhǎng)STM的隱層維度。

    2.4 多重注意力交替交互層

    注意力機(jī)制[14]源于對(duì)人類視覺的研究,目的是從眾多信息中學(xué)習(xí)對(duì)當(dāng)前任務(wù)貢獻(xiàn)更大的那部分信息。為了讓文本信息有效融合,本文提出一種基于多重注意力交替交互的文本表征方法,首先,對(duì)文本自身進(jìn)行詞語(yǔ)粒度的自注意力計(jì)算,得到含有權(quán)重的特征表示;然后,對(duì)其進(jìn)行交替協(xié)同注意力計(jì)算。這種表征方法能表達(dá)更多的文本相關(guān)性,提供更豐富的交互語(yǔ)義信息,從而更好地表征文本信息。

    2.4.1 自注意力模塊

    自注意力機(jī)制能夠?qū)W習(xí)到序列的長(zhǎng)期依賴關(guān)系,捕獲全局特征信息,通過(guò)權(quán)重來(lái)區(qū)分特征的重要程度。自注意力模塊如圖2所示。

    Figure 2 Self-attention module圖2 自注意力模塊

    (7)

    其中,WQ,WK和WV分別為Q、K和V的權(quán)重矩陣。

    (2)對(duì)Q與KT進(jìn)行點(diǎn)積運(yùn)算,打分函數(shù)S采用縮放點(diǎn)積函數(shù),經(jīng)過(guò)Softmax歸一化為概率分布,輸出自注意力權(quán)重向量Att,如式(8)所示。

    (8)

    (9)

    該模塊蘊(yùn)含注意力的文本語(yǔ)義表示,如式(10)所示:

    (10)

    自注意力機(jī)制的增加改變了BiLSTM輸出的隱藏狀態(tài),在編碼結(jié)果中加入了權(quán)重的影響,能夠更加突出關(guān)鍵信息和重要特征。

    2.4.2 交替協(xié)同注意力模塊

    通常,自注意力機(jī)制用來(lái)計(jì)算文本自身各詞語(yǔ)的重要程度,而協(xié)同注意力(co-attention)用來(lái)計(jì)算文本之間的相關(guān)程度。

    本文采用交替協(xié)同注意力對(duì)文本序列進(jìn)行交互分析,使用交替結(jié)構(gòu)有順序地計(jì)算協(xié)同注意力,即對(duì)特征序列As和Bs進(jìn)行協(xié)同注意力計(jì)算,結(jié)合協(xié)同注意力矩陣與Bs中每一個(gè)詞語(yǔ)的加權(quán)求和來(lái)表達(dá)As,得到新的特征序列Ac;基于Ac與Bs再次進(jìn)行協(xié)同注意力計(jì)算,以同樣的方式交替地表達(dá)特征序列Bs,具體過(guò)程如下所示:

    (11)

    (12)

    (13)

    (14)

    (15)

    2.5 特征提取層

    該層將文本在多重注意力交替交互層中的自注意力特征和交替協(xié)同注意力特征進(jìn)行拼接,共同考慮不同層次的注意力輸出,具體如式(16)所示:

    (16)

    經(jīng)過(guò)最大池化提取最相關(guān)的特征,拼接2個(gè)文本序列作為文本特征的向量表示O∈R8h,如式(17)所示:

    O=[Maxpooling(Aatt)⊕Maxpooling(Batt)]

    (17)

    2.6 輸出層與模型優(yōu)化

    輸出層中,文本最終的交互語(yǔ)義表示O輸入至全連接層,全連接層的輸出作為Softmax分類器的輸入,得到文本對(duì)相似度標(biāo)簽的預(yù)測(cè)概率,計(jì)算公式如式(18)所示:

    (18)

    最后,通過(guò)最小化交叉熵來(lái)優(yōu)化模型,如式(19)所示:

    (19)

    其中,T表示訓(xùn)練數(shù)據(jù)集大小,C為相似度標(biāo)簽類別數(shù),yt為文本對(duì)實(shí)際標(biāo)簽概率,λ為正則化參數(shù),θ表示整個(gè)模型的訓(xùn)練參數(shù)。

    3 實(shí)驗(yàn)與分析

    3.1 數(shù)據(jù)集

    數(shù)據(jù)集1:CCKS 2018微眾銀行智能客服問(wèn)句匹配大賽數(shù)據(jù)集[15]。

    數(shù)據(jù)集2:平安醫(yī)療科技智能患者健康咨詢問(wèn)句匹配大賽數(shù)據(jù)集[16]。

    上述數(shù)據(jù)集相關(guān)信息如表1所示,語(yǔ)義相似的文本對(duì)標(biāo)簽為1,否則為0,2個(gè)數(shù)據(jù)集的正負(fù)樣本數(shù)量比例都接近1∶1。

    Table 1 Information about the experimental datasets表1 實(shí)驗(yàn)數(shù)據(jù)集相關(guān)信息

    3.2 評(píng)價(jià)指標(biāo)

    本文評(píng)估指標(biāo)采用準(zhǔn)確率Acc(Accuracy)、精確率P(Precision)、召回率R(Recall)、F1值(F-score)以及ROC曲線下的面積AUC(Area Under Curve)。精確率P用于檢驗(yàn)結(jié)果的有效性,召回率R用于檢驗(yàn)結(jié)果的完整性,F(xiàn)1用于調(diào)和精確率P與召回率R。ROC曲線的橫縱坐標(biāo)分別為特異性(FPR)和敏感度(TPR),曲線下的面積AUC反映了模型的分類性能,其值越接近于1,模型分類性能越好。Acc、P、R和F1的計(jì)算分別如式(20)~式(23)所示:

    (20)

    (21)

    (22)

    (23)

    其中,TP表示文本對(duì)實(shí)際結(jié)果和預(yù)測(cè)結(jié)果都為語(yǔ)義相似的樣本數(shù)量;FN表示文本對(duì)實(shí)際結(jié)果為語(yǔ)義相似,但預(yù)測(cè)結(jié)果為不相似的樣本數(shù)量;FP表示文本對(duì)實(shí)際結(jié)果為語(yǔ)義不相似,但預(yù)測(cè)結(jié)果為相似的樣本數(shù)量;TN表示文本對(duì)實(shí)際結(jié)果和預(yù)測(cè)結(jié)果都為語(yǔ)義不相似的樣本數(shù)量。

    3.3 參數(shù)設(shè)置

    訓(xùn)練word2vec詞向量模型,設(shè)置詞向量維度e為300,采用Skip-gram模型訓(xùn)練,訓(xùn)練窗口大小為5,未登錄詞進(jìn)行隨機(jī)初始化詞向量,附加特征后的詞嵌入維度為301。同時(shí)構(gòu)建領(lǐng)域常用術(shù)語(yǔ)詞典,使用jieba分詞處理時(shí)引入詞典,避免專有名詞劃分不正確或者缺失。設(shè)置文本長(zhǎng)度為20,超出部分進(jìn)行截?cái)啵蛔悴糠钟?補(bǔ)齊。LSTM網(wǎng)絡(luò)的單元個(gè)數(shù)為150,則BiLSTM網(wǎng)絡(luò)的輸出向量維度為300。訓(xùn)練模型時(shí),采用大小為128的批處理,學(xué)習(xí)率設(shè)置為0.005,優(yōu)化器使用Adam,迭代訓(xùn)練次數(shù)epoch為20。為了防止模型過(guò)擬合,設(shè)置dropout為0.5隨機(jī)丟棄神經(jīng)元。

    3.4 基準(zhǔn)方法

    本文為了評(píng)估所提方法的有效性,還實(shí)現(xiàn)了以下幾種基準(zhǔn)方法進(jìn)行對(duì)比:

    (1)BiLSTM:采用BiLSTM分別從文本前后2個(gè)方向?qū)ξ谋具M(jìn)行向量表示,通過(guò)最大池化和全連接網(wǎng)絡(luò)得到最后的預(yù)測(cè)標(biāo)簽。

    (2)BiGRU:與(1)類似,不同之處是將雙向LSTM替換為雙向門控循環(huán)神經(jīng)網(wǎng)絡(luò)。

    (3)ABCNN[17]:一種結(jié)合注意力機(jī)制和CNN的方法。該方法使用word2vec表示文本嵌入向量,然后計(jì)算文本注意力權(quán)重,采用寬卷積提取文本特征,最后進(jìn)行平均池化和預(yù)測(cè)。

    (4)BiMPM[18]:一種使用多視角匹配模型的方法,采用BiLSTM對(duì)文本進(jìn)行編碼,然后從文本轉(zhuǎn)換的角度進(jìn)行2個(gè)方向的文本匹配,最后聚合特征并預(yù)測(cè)結(jié)果。

    (5)ESIM:一種基于BiLSTM和協(xié)同注意力機(jī)制的推理方法,采用BiLSTM對(duì)詞語(yǔ)進(jìn)行編碼,采用co-attention捕捉句子之間的交互信息,最后使用另一個(gè)BiLSTM提取句子的局部和全局信息并輸出預(yù)測(cè)。

    3.5 實(shí)驗(yàn)結(jié)果及分析

    3.5.1 性能評(píng)估

    本文方法與基準(zhǔn)方法在2個(gè)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果如表2所示。從表2可以看出,本文方法在文本相似度計(jì)算上的性能良好。單一的BiLSTM和BiGRU方法提取到的特征少于其他混合方法,所以各項(xiàng)指標(biāo)均低于其他方法的。ABCNN通過(guò)引入注意力賦予文本不同的權(quán)重信息,并使用CNN提取局部特征,性能較前2個(gè)方法有一定提升。這說(shuō)明在不使用循環(huán)神經(jīng)網(wǎng)絡(luò)捕捉文本序列的情況下,使用注意力機(jī)制同樣能增強(qiáng)模型對(duì)重要信息的捕獲能力。與ABCNN的F1值相比,BiMPM在2個(gè)數(shù)據(jù)集上的F1值都有較大的提升,分別提高了3.82個(gè)百分點(diǎn)和2.04個(gè)百分點(diǎn),說(shuō)明從文本交互表達(dá)的角度有助于分析文本相關(guān)性。ESIM不僅使用協(xié)同注意力提取文本交互信息,還使用不同的BiLSTM進(jìn)行文本編碼和特征提取,故性能較上述所有基準(zhǔn)方法又有提升。

    本文方法在嵌入層增加文本間余弦值相關(guān)特征,使用BiLSTM提取序列特征,使用自注意力機(jī)制解決注意力分散問(wèn)題,通過(guò)交替結(jié)構(gòu)的協(xié)同注意力對(duì)文本構(gòu)建新的相關(guān)交互表征,因此具有更好的理解能力,整體表現(xiàn)最佳,在2個(gè)數(shù)據(jù)集上的性能指標(biāo)達(dá)到最高,其F1值分別達(dá)到了0.916 1和0.769 5。

    圖3和圖4直觀地展現(xiàn)了不同方法在2個(gè)數(shù)據(jù)集上準(zhǔn)確率的變化趨勢(shì),本文方法在迭代訓(xùn)練次數(shù)達(dá)到20附近時(shí)趨于穩(wěn)定,且穩(wěn)定時(shí)的準(zhǔn)確率相比于基準(zhǔn)方法都有不同程度的提高。

    Figure 3 Acc comparison on dataset1圖3 數(shù)據(jù)集1上的Acc對(duì)比圖

    3.5.2 消融實(shí)驗(yàn)

    Figure 4 Acc comparison on dataset2圖4 數(shù)據(jù)集2上的Acc對(duì)比圖

    為了驗(yàn)證MRIIM中注意力特征模塊對(duì)于文本相似度任務(wù)的有效性,本文在2個(gè)數(shù)據(jù)集上進(jìn)行了消融實(shí)驗(yàn)。本文的消融實(shí)驗(yàn)是指在其他模塊和參數(shù)不變的情況下,通過(guò)減少不同模塊進(jìn)行性能分析,實(shí)驗(yàn)結(jié)果如表3所示。其中,“MRIIM”表示本文提出的方法;“-SelfAttention”表示去除文本對(duì)的自注意力機(jī)制后的方法;“-Al_Structure”表示去除交替協(xié)同注意力模塊,將其替換為并行協(xié)同注意力模塊后的方法;“-Both”表示去除自注意力機(jī)制及交替協(xié)同注意力2個(gè)模塊,僅使用并行協(xié)同注意力的方法。

    Table 2 Experimental results of different methods表2 不同方法的實(shí)驗(yàn)結(jié)果

    Table 3 Ablation experiment表3 消融實(shí)驗(yàn)

    從表3可以看出,減少任意一個(gè)相關(guān)性特征模塊都會(huì)降低方法的性能。這說(shuō)明本文提出的最相關(guān)特征對(duì)文本學(xué)習(xí)和表征都具有重要的作用。其中,在2個(gè)數(shù)據(jù)集上,“-SelfAttention”和“-Al_Structure”的性能指標(biāo)都有不同程度的降低,相比較而言,前者整體優(yōu)于后者,說(shuō)明交替協(xié)同注意力模塊對(duì)文本相似度計(jì)算有正面影響?!?Both”性能有明顯的下降,F(xiàn)1指標(biāo)分別下降了3.46個(gè)百分點(diǎn)和3.97個(gè)百分點(diǎn),由此說(shuō)明2個(gè)注意力模塊對(duì)文本語(yǔ)義相似度計(jì)算有顯著的貢獻(xiàn),有助于發(fā)現(xiàn)文本之間的隱藏相關(guān)性。

    3.5.3 注意力可視化

    對(duì)注意力權(quán)重分布進(jìn)行可視化能夠更好地理解模型當(dāng)前關(guān)注的重點(diǎn)。圖5為測(cè)試集中一組文本對(duì)的熱力圖展示,顏色表示注意力權(quán)重值的大小,顏色越深表示重要程度越高。由圖5可知,注意力機(jī)制能夠計(jì)算文本對(duì)中每個(gè)詞之間的相關(guān)性,從而更好地學(xué)習(xí)文本關(guān)聯(lián)特征。

    Figure 5 Visualization of attention weight distribution圖5 注意力權(quán)重分布可視化

    4 結(jié)束語(yǔ)

    本文針對(duì)文本相似度計(jì)算任務(wù)提出了一個(gè)基于多重相關(guān)信息交互的文本相似度計(jì)算方法。包含附加相似度特征的詞嵌入層能夠?qū)⑾蛄靠臻g中詞語(yǔ)的相關(guān)性信息輸入網(wǎng)絡(luò)進(jìn)行編碼和學(xué)習(xí);多重注意力交替交互層不僅在詞語(yǔ)粒度使用自注意力機(jī)制獲取文本自身的注意力分布,還從文本粒度使用交替協(xié)同注意力有順序地捕捉文本之間的注意力分布情況,從而有效提取局部和全局交互的最明顯特征;最后對(duì)文本對(duì)進(jìn)行相似度分析,判斷語(yǔ)義是否相似。實(shí)驗(yàn)表明,所提方法的各項(xiàng)性能都有所提升。下一步的工作重點(diǎn)是在長(zhǎng)文本數(shù)據(jù)集上評(píng)估本文方法,以及挖掘?qū)哟胃迂S富的文本相關(guān)特征,比如不同的預(yù)訓(xùn)練詞向量模型對(duì)該方法性能的影響。

    猜你喜歡
    語(yǔ)義特征文本
    語(yǔ)言與語(yǔ)義
    如何表達(dá)“特征”
    在808DA上文本顯示的改善
    不忠誠(chéng)的四個(gè)特征
    基于doc2vec和TF-IDF的相似文本識(shí)別
    電子制作(2018年18期)2018-11-14 01:48:06
    抓住特征巧觀察
    “上”與“下”語(yǔ)義的不對(duì)稱性及其認(rèn)知闡釋
    文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
    認(rèn)知范疇模糊與語(yǔ)義模糊
    如何快速走進(jìn)文本
    最近2019中文字幕mv第一页| 国产一区二区在线观看av| 亚洲欧美精品自产自拍| 精品国产乱码久久久久久男人| www.av在线官网国产| 午夜免费男女啪啪视频观看| 亚洲国产欧美日韩在线播放| 黄色一级大片看看| 一区福利在线观看| 一区二区三区激情视频| 精品国产一区二区三区四区第35| 免费在线观看完整版高清| 男女免费视频国产| 亚洲美女黄色视频免费看| 国产精品秋霞免费鲁丝片| 亚洲欧美成人综合另类久久久| 中文字幕人妻熟女乱码| 在线看a的网站| h视频一区二区三区| 悠悠久久av| 秋霞在线观看毛片| 丰满饥渴人妻一区二区三| 亚洲欧美一区二区三区国产| 嫩草影院入口| 一区在线观看完整版| 久久久久久久久免费视频了| 一边亲一边摸免费视频| 国产极品粉嫩免费观看在线| 亚洲一卡2卡3卡4卡5卡精品中文| 国产欧美日韩综合在线一区二区| 91aial.com中文字幕在线观看| 免费高清在线观看视频在线观看| 成人黄色视频免费在线看| 天堂中文最新版在线下载| videosex国产| 日日摸夜夜添夜夜爱| 久久久久久久久免费视频了| 亚洲国产欧美在线一区| 丰满乱子伦码专区| 人人澡人人妻人| 日韩制服骚丝袜av| 色婷婷av一区二区三区视频| 丰满乱子伦码专区| 99久久综合免费| 久久青草综合色| 美国免费a级毛片| 国产精品一区二区精品视频观看| 狂野欧美激情性bbbbbb| 久久人人97超碰香蕉20202| 搡老乐熟女国产| 激情五月婷婷亚洲| 亚洲av男天堂| 亚洲色图 男人天堂 中文字幕| 欧美xxⅹ黑人| 久久免费观看电影| 电影成人av| 日本午夜av视频| 哪个播放器可以免费观看大片| 交换朋友夫妻互换小说| 日本欧美视频一区| 菩萨蛮人人尽说江南好唐韦庄| 建设人人有责人人尽责人人享有的| 欧美日韩亚洲高清精品| 亚洲欧美色中文字幕在线| 亚洲精品一二三| 欧美老熟妇乱子伦牲交| av有码第一页| 午夜福利免费观看在线| 尾随美女入室| 国产一区二区三区综合在线观看| 久久久久精品人妻al黑| 国产伦理片在线播放av一区| 欧美激情极品国产一区二区三区| 看免费成人av毛片| 黑丝袜美女国产一区| 亚洲第一av免费看| 亚洲精品日韩在线中文字幕| 亚洲精品美女久久久久99蜜臀 | 桃花免费在线播放| 亚洲av中文av极速乱| 国产成人精品无人区| 97人妻天天添夜夜摸| 菩萨蛮人人尽说江南好唐韦庄| 青草久久国产| 国产一区二区三区av在线| 可以免费在线观看a视频的电影网站 | 成人亚洲精品一区在线观看| 国产精品 国内视频| 日韩精品有码人妻一区| 男女高潮啪啪啪动态图| 精品少妇内射三级| 最近的中文字幕免费完整| av女优亚洲男人天堂| 97人妻天天添夜夜摸| 亚洲欧美一区二区三区国产| 天天躁日日躁夜夜躁夜夜| 九草在线视频观看| 国产日韩欧美在线精品| 国产精品麻豆人妻色哟哟久久| 亚洲成色77777| 国产欧美日韩综合在线一区二区| 久久久久精品国产欧美久久久 | svipshipincom国产片| 国产男女内射视频| 午夜91福利影院| 免费黄网站久久成人精品| 国产午夜精品一二区理论片| 一级毛片黄色毛片免费观看视频| 亚洲国产av新网站| 国产成人欧美在线观看 | 18禁动态无遮挡网站| 日韩av免费高清视频| 大片电影免费在线观看免费| 大片电影免费在线观看免费| 丝袜人妻中文字幕| 狠狠婷婷综合久久久久久88av| 天天躁夜夜躁狠狠久久av| 在线观看免费日韩欧美大片| 最近最新中文字幕免费大全7| 亚洲精品国产一区二区精华液| 亚洲精品久久午夜乱码| 日本爱情动作片www.在线观看| 久久 成人 亚洲| 97精品久久久久久久久久精品| av在线app专区| 欧美在线黄色| 制服丝袜香蕉在线| 免费在线观看黄色视频的| 久久人人爽av亚洲精品天堂| 我的亚洲天堂| 一边摸一边抽搐一进一出视频| 水蜜桃什么品种好| 国产精品国产三级专区第一集| 曰老女人黄片| 午夜福利视频精品| 亚洲欧美清纯卡通| 女性被躁到高潮视频| 日日爽夜夜爽网站| 777久久人妻少妇嫩草av网站| 欧美日韩av久久| 国产乱来视频区| 免费黄色在线免费观看| 少妇精品久久久久久久| 久久天堂一区二区三区四区| 久久久久久久久久久免费av| 亚洲精品自拍成人| 视频区图区小说| 亚洲欧洲国产日韩| 少妇被粗大的猛进出69影院| 国产一区二区三区综合在线观看| 天天操日日干夜夜撸| 中文欧美无线码| 精品一区在线观看国产| 精品国产国语对白av| 九色亚洲精品在线播放| 老司机靠b影院| 久久久久久久久免费视频了| 伊人亚洲综合成人网| 欧美激情高清一区二区三区 | 精品国产一区二区久久| 国产麻豆69| 最新在线观看一区二区三区 | 男女免费视频国产| 免费高清在线观看视频在线观看| 欧美日韩视频精品一区| 女人精品久久久久毛片| 丰满乱子伦码专区| 一本大道久久a久久精品| 不卡av一区二区三区| 熟女少妇亚洲综合色aaa.| 在线天堂中文资源库| 亚洲激情五月婷婷啪啪| av片东京热男人的天堂| 亚洲国产中文字幕在线视频| 日韩免费高清中文字幕av| 伊人久久大香线蕉亚洲五| 99国产精品免费福利视频| 亚洲第一区二区三区不卡| 日本午夜av视频| 成人18禁高潮啪啪吃奶动态图| 色婷婷久久久亚洲欧美| 久久人人爽人人片av| 精品第一国产精品| 一级毛片黄色毛片免费观看视频| 满18在线观看网站| 一区在线观看完整版| av片东京热男人的天堂| xxx大片免费视频| 国产高清国产精品国产三级| 中文字幕最新亚洲高清| 成年女人毛片免费观看观看9 | 亚洲美女黄色视频免费看| 丝袜人妻中文字幕| 99热网站在线观看| 人人妻人人添人人爽欧美一区卜| 天天躁日日躁夜夜躁夜夜| 咕卡用的链子| 国产免费一区二区三区四区乱码| 看免费成人av毛片| 欧美激情极品国产一区二区三区| 国产熟女欧美一区二区| 国产女主播在线喷水免费视频网站| 大香蕉久久成人网| 激情五月婷婷亚洲| 欧美日韩国产mv在线观看视频| 一区二区三区乱码不卡18| 亚洲欧美精品综合一区二区三区| 少妇 在线观看| 咕卡用的链子| 日本午夜av视频| 国产97色在线日韩免费| 久久久久人妻精品一区果冻| 热re99久久国产66热| 女人被躁到高潮嗷嗷叫费观| 蜜桃在线观看..| 中文字幕另类日韩欧美亚洲嫩草| 看非洲黑人一级黄片| 久久午夜综合久久蜜桃| 一区二区三区乱码不卡18| a 毛片基地| 99热全是精品| 成人午夜精彩视频在线观看| 制服丝袜香蕉在线| 国产精品一国产av| 亚洲欧洲日产国产| 亚洲综合精品二区| 亚洲精品国产av成人精品| 丝袜人妻中文字幕| 男女边吃奶边做爰视频| 欧美人与性动交α欧美软件| 如何舔出高潮| 欧美日韩av久久| 亚洲少妇的诱惑av| 欧美黑人欧美精品刺激| 日韩大码丰满熟妇| 国产高清国产精品国产三级| 欧美 亚洲 国产 日韩一| 国产无遮挡羞羞视频在线观看| 国产成人啪精品午夜网站| 91国产中文字幕| 亚洲欧美成人综合另类久久久| 黑人猛操日本美女一级片| 国产精品一区二区精品视频观看| 久久久久久久大尺度免费视频| 国产又色又爽无遮挡免| 午夜福利免费观看在线| 夫妻性生交免费视频一级片| 亚洲中文av在线| 国产精品国产三级专区第一集| 熟女少妇亚洲综合色aaa.| 超碰成人久久| 欧美黑人精品巨大| 天天躁夜夜躁狠狠久久av| 精品一区在线观看国产| 日韩免费高清中文字幕av| videos熟女内射| 欧美黄色片欧美黄色片| 老司机在亚洲福利影院| 青春草国产在线视频| 另类亚洲欧美激情| 黄色视频不卡| 国产精品亚洲av一区麻豆 | 亚洲精品美女久久久久99蜜臀 | 男人操女人黄网站| 国产97色在线日韩免费| 大片免费播放器 马上看| 18禁观看日本| 亚洲在久久综合| 日韩伦理黄色片| 超碰成人久久| 国产精品国产av在线观看| 一级,二级,三级黄色视频| 9色porny在线观看| 蜜桃国产av成人99| 人人妻人人澡人人爽人人夜夜| 亚洲美女视频黄频| 久久人人爽av亚洲精品天堂| 韩国av在线不卡| 老汉色∧v一级毛片| 观看av在线不卡| 国产激情久久老熟女| 丝袜美足系列| 丝袜在线中文字幕| 欧美人与善性xxx| 精品国产乱码久久久久久男人| 国产极品粉嫩免费观看在线| 自拍欧美九色日韩亚洲蝌蚪91| 亚洲精品美女久久av网站| 国产精品 国内视频| 国产精品 欧美亚洲| 女人爽到高潮嗷嗷叫在线视频| 在线观看一区二区三区激情| 国产av码专区亚洲av| 又粗又硬又长又爽又黄的视频| 麻豆精品久久久久久蜜桃| 精品酒店卫生间| 又粗又硬又长又爽又黄的视频| 亚洲欧美中文字幕日韩二区| 国产xxxxx性猛交| 亚洲一区二区三区欧美精品| 免费观看性生交大片5| 高清在线视频一区二区三区| 国产男女超爽视频在线观看| 日韩制服骚丝袜av| 久久久久网色| 免费黄网站久久成人精品| 看免费av毛片| 99久国产av精品国产电影| 国产深夜福利视频在线观看| 国产男女超爽视频在线观看| 十分钟在线观看高清视频www| 一级黄片播放器| 午夜福利免费观看在线| svipshipincom国产片| 欧美 日韩 精品 国产| 精品国产乱码久久久久久男人| 日韩伦理黄色片| 国产免费视频播放在线视频| 国产又爽黄色视频| 别揉我奶头~嗯~啊~动态视频 | 欧美av亚洲av综合av国产av | 久久人人爽av亚洲精品天堂| 黄网站色视频无遮挡免费观看| 一本一本久久a久久精品综合妖精| 国产一区二区在线观看av| 日韩 亚洲 欧美在线| 99re6热这里在线精品视频| 99精品久久久久人妻精品| 精品第一国产精品| 国产黄色视频一区二区在线观看| 搡老乐熟女国产| 欧美日韩精品网址| 日本欧美视频一区| 欧美亚洲 丝袜 人妻 在线| 人人澡人人妻人| videos熟女内射| 国产免费福利视频在线观看| 国产激情久久老熟女| 国产精品久久久久久精品电影小说| 在线观看人妻少妇| 久久久久久久久久久免费av| 亚洲欧洲国产日韩| 欧美日韩国产mv在线观看视频| 日韩电影二区| 如日韩欧美国产精品一区二区三区| 一区二区三区四区激情视频| 亚洲少妇的诱惑av| 精品免费久久久久久久清纯 | 久热这里只有精品99| 亚洲成av片中文字幕在线观看| 波多野结衣一区麻豆| 欧美 亚洲 国产 日韩一| 午夜免费观看网址| 91国产中文字幕| 老司机深夜福利视频在线观看| 国产黄a三级三级三级人| 欧美国产日韩亚洲一区| 亚洲国产欧美日韩在线播放| 电影成人av| 国产亚洲精品一区二区www| 18禁国产床啪视频网站| 欧美色视频一区免费| 亚洲国产欧美网| 午夜福利18| 91国产中文字幕| 欧美性长视频在线观看| 亚洲中文av在线| 欧美大码av| 精品久久久久久,| 在线观看日韩欧美| 韩国av一区二区三区四区| 中文字幕人成人乱码亚洲影| 日韩大码丰满熟妇| 9191精品国产免费久久| 精品久久久久久,| 亚洲电影在线观看av| 丝袜美腿诱惑在线| 欧美另类亚洲清纯唯美| 久久久久久免费高清国产稀缺| 国产成人精品在线电影| 国产亚洲欧美精品永久| 亚洲成人久久性| 九色亚洲精品在线播放| 中文字幕人成人乱码亚洲影| 丝袜人妻中文字幕| 黄色毛片三级朝国网站| 自线自在国产av| 亚洲九九香蕉| 国产精品一区二区免费欧美| 欧美一区二区精品小视频在线| 久久中文字幕一级| 午夜福利成人在线免费观看| 久久香蕉精品热| www.999成人在线观看| 给我免费播放毛片高清在线观看| 91麻豆精品激情在线观看国产| 亚洲国产精品成人综合色| 亚洲国产中文字幕在线视频| 老司机在亚洲福利影院| 90打野战视频偷拍视频| 色尼玛亚洲综合影院| 久久久久久免费高清国产稀缺| 国产高清有码在线观看视频 | 一区二区三区激情视频| 免费观看人在逋| 看免费av毛片| 美女午夜性视频免费| 真人一进一出gif抽搐免费| 久久精品亚洲精品国产色婷小说| 日韩欧美一区视频在线观看| 亚洲一卡2卡3卡4卡5卡精品中文| 窝窝影院91人妻| 女人高潮潮喷娇喘18禁视频| 99国产综合亚洲精品| 亚洲国产中文字幕在线视频| 日本黄色视频三级网站网址| 国产精品自产拍在线观看55亚洲| 国产高清videossex| 人人妻,人人澡人人爽秒播| 亚洲av熟女| 国产成人啪精品午夜网站| 婷婷精品国产亚洲av在线| 在线观看午夜福利视频| 亚洲自偷自拍图片 自拍| 在线免费观看的www视频| 亚洲人成电影免费在线| www日本在线高清视频| 黄色视频不卡| 日韩欧美在线二视频| www.自偷自拍.com| 夜夜爽天天搞| 可以在线观看毛片的网站| 亚洲专区中文字幕在线| 丁香六月欧美| 村上凉子中文字幕在线| av超薄肉色丝袜交足视频| 久久午夜综合久久蜜桃| 欧美亚洲日本最大视频资源| 欧美在线一区亚洲| 亚洲专区字幕在线| 国产欧美日韩一区二区三| 免费不卡黄色视频| 国产亚洲av高清不卡| 日韩视频一区二区在线观看| 亚洲成a人片在线一区二区| 欧美日韩瑟瑟在线播放| avwww免费| 日韩有码中文字幕| 国产精品一区二区精品视频观看| 亚洲av日韩精品久久久久久密| 日本三级黄在线观看| 日韩成人在线观看一区二区三区| 午夜福利在线观看吧| 欧美绝顶高潮抽搐喷水| 色综合站精品国产| 中文字幕最新亚洲高清| 亚洲国产精品999在线| 最好的美女福利视频网| 亚洲av成人一区二区三| 精品国产美女av久久久久小说| 桃色一区二区三区在线观看| 999精品在线视频| 日韩av在线大香蕉| 亚洲最大成人中文| 香蕉丝袜av| 亚洲中文日韩欧美视频| 久久精品国产清高在天天线| 精品无人区乱码1区二区| 夜夜看夜夜爽夜夜摸| 亚洲精华国产精华精| av电影中文网址| av视频免费观看在线观看| 欧美日韩福利视频一区二区| 精品国内亚洲2022精品成人| 村上凉子中文字幕在线| 国产亚洲av嫩草精品影院| 欧美日韩精品网址| 国产亚洲欧美在线一区二区| 国产片内射在线| 天天躁狠狠躁夜夜躁狠狠躁| 国产av又大| 亚洲全国av大片| 桃红色精品国产亚洲av| 亚洲专区国产一区二区| 亚洲av熟女| 一本综合久久免费| 亚洲精品粉嫩美女一区| 国产aⅴ精品一区二区三区波| 丁香欧美五月| bbb黄色大片| 国产午夜福利久久久久久| 亚洲精华国产精华精| 亚洲自偷自拍图片 自拍| 久久久水蜜桃国产精品网| 欧美久久黑人一区二区| 亚洲视频免费观看视频| 老司机午夜福利在线观看视频| 国产精品影院久久| 美女 人体艺术 gogo| 12—13女人毛片做爰片一| 午夜福利在线观看吧| 欧美久久黑人一区二区| 国产aⅴ精品一区二区三区波| 村上凉子中文字幕在线| 国产国语露脸激情在线看| 午夜激情av网站| 国产三级黄色录像| 啦啦啦观看免费观看视频高清 | 桃色一区二区三区在线观看| 日韩精品青青久久久久久| 别揉我奶头~嗯~啊~动态视频| 一区二区三区高清视频在线| 国产av又大| 亚洲成人免费电影在线观看| 亚洲aⅴ乱码一区二区在线播放 | 午夜精品在线福利| 国产精品亚洲一级av第二区| av网站免费在线观看视频| 91九色精品人成在线观看| 90打野战视频偷拍视频| 国产成人免费无遮挡视频| 午夜福利,免费看| 久久人妻av系列| 男人舔女人下体高潮全视频| e午夜精品久久久久久久| 日本免费一区二区三区高清不卡 | 亚洲精品中文字幕在线视频| 一区二区三区精品91| 国产精品亚洲一级av第二区| 麻豆av在线久日| 岛国在线观看网站| 亚洲欧美一区二区三区黑人| 成人永久免费在线观看视频| 亚洲精品国产精品久久久不卡| 黄色a级毛片大全视频| 日本精品一区二区三区蜜桃| 精品一区二区三区av网在线观看| 国产一卡二卡三卡精品| 日韩欧美国产在线观看| 精品国产美女av久久久久小说| √禁漫天堂资源中文www| 一区福利在线观看| 中出人妻视频一区二区| 欧美老熟妇乱子伦牲交| 又黄又粗又硬又大视频| 欧美乱妇无乱码| 波多野结衣av一区二区av| 天堂影院成人在线观看| 黑丝袜美女国产一区| 久热爱精品视频在线9| 午夜老司机福利片| 久久天堂一区二区三区四区| 9191精品国产免费久久| 日韩高清综合在线| 午夜影院日韩av| 久久人妻av系列| 丝袜美腿诱惑在线| 亚洲一区二区三区色噜噜| www国产在线视频色| 亚洲成av片中文字幕在线观看| 一本大道久久a久久精品| 亚洲色图 男人天堂 中文字幕| 国产在线观看jvid| 免费观看精品视频网站| 夜夜爽天天搞| 此物有八面人人有两片| 国产高清videossex| 国产午夜精品久久久久久| 国产精品一区二区精品视频观看| 热99re8久久精品国产| 男女做爰动态图高潮gif福利片 | 国产黄a三级三级三级人| 国产精品国产高清国产av| 99精品久久久久人妻精品| 久热这里只有精品99| 久久久久久久久中文| 久久精品成人免费网站| 亚洲伊人色综图| 国产aⅴ精品一区二区三区波| 欧美日韩亚洲综合一区二区三区_| 亚洲 欧美 日韩 在线 免费| 99久久精品国产亚洲精品| 国产私拍福利视频在线观看| 99久久99久久久精品蜜桃| 日韩av在线大香蕉| 侵犯人妻中文字幕一二三四区| 亚洲人成电影观看| 色哟哟哟哟哟哟| 99精品久久久久人妻精品| 欧美一区二区精品小视频在线| 一级作爱视频免费观看| 国产激情久久老熟女| 手机成人av网站| 免费搜索国产男女视频| 老熟妇乱子伦视频在线观看| av网站免费在线观看视频| 女同久久另类99精品国产91| tocl精华| 99久久久亚洲精品蜜臀av| 很黄的视频免费| 久久人人精品亚洲av| 亚洲欧美激情综合另类| 国产男靠女视频免费网站| 婷婷丁香在线五月| 亚洲国产看品久久| 国产激情久久老熟女| 日韩欧美一区二区三区在线观看| 国产片内射在线| 亚洲精品美女久久久久99蜜臀| 真人做人爱边吃奶动态| 大陆偷拍与自拍| 色老头精品视频在线观看| 免费看十八禁软件| 麻豆久久精品国产亚洲av| 亚洲人成伊人成综合网2020|