• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于Transformer編碼器的語(yǔ)義相似度算法研究

    2021-07-28 13:08:12喬偉濤黃海燕
    關(guān)鍵詞:注意力語(yǔ)義編碼

    喬偉濤,黃海燕,王 珊

    華東理工大學(xué) 信息科學(xué)與工程學(xué)院,上海200237

    隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,每時(shí)每刻有大量的信息以文本的形式產(chǎn)生。如何對(duì)文本信息進(jìn)行分析處理是NLP(自然語(yǔ)言處理)研究的主要內(nèi)容。其中的語(yǔ)義相似度計(jì)算是NLP領(lǐng)域中非常重要的研究方向,該技術(shù)可廣泛應(yīng)用于搜索引擎、問(wèn)答系統(tǒng)中,為系統(tǒng)篩選出更為準(zhǔn)確的答案,也可應(yīng)用在內(nèi)容去重中,例如對(duì)門(mén)戶網(wǎng)站的標(biāo)題進(jìn)行語(yǔ)義相似度計(jì)算實(shí)現(xiàn)去除重復(fù)新聞。

    目前,語(yǔ)義相似度的主流計(jì)算方法主要分為四類:第一類是傳統(tǒng)的基于稀疏特征的統(tǒng)計(jì)學(xué)方法,第二類是基于語(yǔ)義詞典的計(jì)算方法,第三類是基于向量空間模型的方法,第四類是基于深度神經(jīng)網(wǎng)絡(luò)的方法。傳統(tǒng)的統(tǒng)計(jì)學(xué)的方法是利用句子中的共現(xiàn)詞、統(tǒng)計(jì)詞頻等特征來(lái)計(jì)算相似度。張培穎[1]通過(guò)統(tǒng)計(jì)句子間的詞語(yǔ)距離、結(jié)構(gòu)以及長(zhǎng)度差異等特征,通過(guò)對(duì)不同的特征賦予不同的權(quán)重來(lái)調(diào)節(jié)各個(gè)特征對(duì)于句子相似度的貢獻(xiàn)來(lái)計(jì)算句子間的相似度?;谡Z(yǔ)義詞典的方法是利用外部詞匯資源來(lái)提取句子文本中的特征,例如中文語(yǔ)義詞典HowNet 和英文語(yǔ)義詞典的WordNet,F(xiàn)ernando 等人[2]基于WordNet 提取出句子相似關(guān)系矩陣相結(jié)合來(lái)計(jì)算句子之間的相似度。朱新華等人[3]在HowNet和同義詞詞林的相似度檢測(cè)上重新設(shè)計(jì)權(quán)重計(jì)算方法取得較好的結(jié)果。在向量空間模型中,用關(guān)鍵詞組成的集合來(lái)表示文本,關(guān)鍵詞在文本中權(quán)值可以通過(guò)詞頻-逆文檔概率(TF-IDF)方法計(jì)算出,將關(guān)鍵詞的權(quán)值映射為向量中各個(gè)元素,則文本可以通過(guò)向量的形式來(lái)表示,然后再利用向量的余弦相似度來(lái)表示句子的語(yǔ)義相似度[4]。句子由詞組成,詞的不同詞性及其在句子中的位置對(duì)句子的語(yǔ)義有著重要的影響,以上介紹的傳統(tǒng)方法都圍繞句子中出現(xiàn)的詞語(yǔ)特征進(jìn)行建模計(jì)算,而忽略了句子中詞語(yǔ)的順序和句子的深層語(yǔ)義,容易造成對(duì)句子語(yǔ)義的曲解,在具體任務(wù)的表現(xiàn)上來(lái)看,都不能達(dá)到令人滿意的效果,例如對(duì)“我乘坐北京到上海的高鐵”和“我乘坐上海到北京的高鐵”兩句話容易造成誤判斷。

    基于神經(jīng)網(wǎng)絡(luò)模型的方法是利用word2vec[5]等詞向量方法將詞語(yǔ)轉(zhuǎn)換為詞向量,然后輸入神經(jīng)網(wǎng)絡(luò)語(yǔ)言模型中,得出句子的語(yǔ)義特征表示,然后送入全連接層或使用距離公式進(jìn)行語(yǔ)義相似度計(jì)算。Hu 等人[6]首次使用卷積神經(jīng)網(wǎng)絡(luò)(CNN)模型分別對(duì)兩個(gè)句子進(jìn)行建模,通過(guò)抽取出的語(yǔ)義向量計(jì)算相似度。Mueller 等人[7]也提出一種基于孿生長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)模型的網(wǎng)絡(luò)結(jié)構(gòu)并結(jié)合曼哈頓距離用于計(jì)算句子對(duì)之間的語(yǔ)義相似度,并取得了較好的效果。紀(jì)明宇等人[8]將門(mén)控循環(huán)網(wǎng)絡(luò)(GRU)應(yīng)用在智能客服數(shù)據(jù)的相似度計(jì)算上取得不錯(cuò)的效果。

    綜上所述,神經(jīng)網(wǎng)絡(luò)語(yǔ)言模型在處理語(yǔ)義相似度問(wèn)題上是較好的解決思路,但是使用LSTM模型存在速度較慢的問(wèn)題,并且不能充分提取句子間的相似信息。CNN模型由于其池化機(jī)制會(huì)過(guò)濾掉大量和句子底層信息,不能充分地對(duì)語(yǔ)義進(jìn)行編碼。因此,針對(duì)以上問(wèn)題,本文在文獻(xiàn)[7]研究的基礎(chǔ)上,對(duì)模型進(jìn)行改進(jìn),首先使用Transformer-encoder 網(wǎng)絡(luò)取代原來(lái)的單向LSTM 網(wǎng)絡(luò),使模型能夠捕捉語(yǔ)義中的上下文信息,Transformer網(wǎng)絡(luò)的并行結(jié)構(gòu)可以加快模型計(jì)算速度,然后利用交互注意力機(jī)制[9],使得模型可以自動(dòng)地集中注意力在兩個(gè)句子中相似的語(yǔ)義信息,并且不需要任何額外的知識(shí),增強(qiáng)模型魯棒性,更好地計(jì)算語(yǔ)義相似度,實(shí)驗(yàn)表明該模型在語(yǔ)義相似度計(jì)算數(shù)據(jù)集上準(zhǔn)確率提升了5%。

    1 基于Transformer編碼器的語(yǔ)義相似度模型

    基于Transformer 編碼器的語(yǔ)義相似度模型TEAM主要包括以下五部分:詞向量嵌入表示,Transformer 編碼層,交互注意力層,特征融合層,輸出層。圖1是本文提出的TEAM 模型框架圖,輸入句子1 和輸入句子2 首先通過(guò)預(yù)處理層,進(jìn)行文本清洗、去除停用詞和數(shù)字化等操作,接著經(jīng)過(guò)詞嵌入層將句子中的詞映射為對(duì)應(yīng)的詞向量,轉(zhuǎn)化后分別得到S1=(a1,a2,…,al),S2=(b1,b2,…,bl),其中ai表示句子1 中第i個(gè)詞的詞向量,bi表示句子2 中第i個(gè)詞的詞向量,然后經(jīng)過(guò)Transformer編碼層得到句子的全局語(yǔ)義特征,同時(shí)將重新編碼的詞向量經(jīng)過(guò)交互注意力層,得到兩個(gè)句子的局部相似特征,最終將以上的特征通過(guò)拼接融合并輸入到全連接層進(jìn)行語(yǔ)義相似度計(jì)算。

    圖1 TEAM模型框架

    TEAM 模型充分利用Transformer 模型的上下文語(yǔ)義編碼能力提取句子內(nèi)的語(yǔ)義信息,對(duì)句子進(jìn)行深層語(yǔ)義編碼,并通過(guò)引入交互注意力機(jī)制,在編碼兩個(gè)句子時(shí)利用交互注意力機(jī)制提取兩個(gè)句子之間關(guān)聯(lián)的相似特征,使模型更擅長(zhǎng)捕捉句子內(nèi)部重要的語(yǔ)義信息,本章接下來(lái)將會(huì)對(duì)模型各個(gè)部分進(jìn)行詳細(xì)介紹。

    1.1 詞嵌入技術(shù)

    詞是構(gòu)成句子的最小單位,要使計(jì)算機(jī)能處理自然語(yǔ)言,將詞轉(zhuǎn)化為數(shù)字是必不可少的第一步。傳統(tǒng)的表示方法是采用One-hot表示法,這種表示方法存在“維度災(zāi)難”的問(wèn)題,也無(wú)法表示詞與詞之間的語(yǔ)義關(guān)系。Bengio等[10]最先提出神經(jīng)網(wǎng)絡(luò)語(yǔ)言模型,使用這種模型可以實(shí)現(xiàn)詞的分布式表示,將單詞轉(zhuǎn)化為低維的稠密向量。

    Mikolov 等[5]提出了被廣泛使用的word2vec 模型,它包括CBOW(Continues Bag-of-Words)和Skip-gram兩種不同的結(jié)構(gòu),可以在大量的無(wú)監(jiān)督文本集上進(jìn)行訓(xùn)練,使用該模型訓(xùn)練出來(lái)的詞向量可以讓相似的詞語(yǔ)在向量空間內(nèi)具有相似的位置,斯坦福NLP團(tuán)隊(duì)在2014年提出了基于詞共現(xiàn)矩陣的Glove 模型[11],在一些任務(wù)上的表現(xiàn)超過(guò)word2vec 模型,可見(jiàn)詞向量的好壞對(duì)實(shí)驗(yàn)結(jié)果會(huì)產(chǎn)生直接的影響。根據(jù)Lai等[12]在詞向量訓(xùn)練實(shí)驗(yàn)結(jié)果可知,好的詞向量與訓(xùn)練語(yǔ)料的大小緊密相關(guān),因此本文采用由騰訊在海量數(shù)據(jù)上訓(xùn)練的800 萬(wàn)詞向量[13],該詞向量具有語(yǔ)料大、覆蓋范圍廣等特點(diǎn)。

    1.2 Transformer編碼器模型

    傳統(tǒng)的循環(huán)神經(jīng)網(wǎng)絡(luò)如LSTM、GRU在編碼句子時(shí)無(wú)法進(jìn)行并行計(jì)算,尤其在層數(shù)深時(shí)模型計(jì)算速度嚴(yán)重下降。2017年Vaswani等[14]提出一種基于自注意力機(jī)制的序列編碼模型Transformer,該模型包括編碼器和解碼器兩個(gè)部分。本文使用的是其中的編碼器部分,編碼器包含6 層疊加的Transformer-block,每個(gè)Transformerblock 的結(jié)構(gòu)如圖2 所示,主要包含多頭注意力機(jī)制、殘差連接、層歸一化、全連接網(wǎng)絡(luò)四個(gè)部分,輸入為句子詞匯的詞向量編碼和位置編碼之和,位置編碼的目的是區(qū)分句子中詞的位置關(guān)系,計(jì)算公式如下:

    圖2 Transformerblock結(jié)構(gòu)圖

    其中,pos表示詞語(yǔ)在句子中的位置,i表示詞向量的位置,dmodel表示詞向量的維度。多頭注意力的計(jì)算公式如下:

    其中,xi表示輸入矩陣x的第i維,m和σ分別表示輸入x的均值和方差,α、β是引入的待學(xué)習(xí)的參數(shù),彌補(bǔ)歸一化的過(guò)程中損失掉的信息,? 是防止除數(shù)等于0設(shè)置的無(wú)窮小的數(shù)。層歸一化的作用在于加快模型的收斂速度,提高訓(xùn)練效率。全連接層計(jì)算公式如下:

    其中,W1、W2為全連接層的權(quán)重矩陣,b1,b2為全連接層的偏置。

    1.3 交互注意力機(jī)制

    注意力機(jī)制最近取得了廣泛的應(yīng)用在深度學(xué)習(xí)領(lǐng)域,例如常見(jiàn)的問(wèn)答系統(tǒng)、機(jī)器翻譯、語(yǔ)音識(shí)別和圖像識(shí)別等任務(wù)[15-16]。注意力機(jī)制最早出現(xiàn)在圖像領(lǐng)域,例如對(duì)于一張圖片,人們會(huì)選擇性地關(guān)注所有信息的一部分,同時(shí)忽略其他部分信息。在自然語(yǔ)言處理領(lǐng)域,例如機(jī)器翻譯中的Encoder-Decoder框架[17],注意力機(jī)制可以使模型翻譯當(dāng)前詞的時(shí)候重點(diǎn)關(guān)注與當(dāng)前詞語(yǔ)境相關(guān)的詞匯,顯著地提高了機(jī)器翻譯的性能。

    對(duì)于語(yǔ)義相似度計(jì)算問(wèn)題,兩個(gè)句子間的關(guān)聯(lián)相似特征是重要的判斷標(biāo)準(zhǔn)之一,而不是單純地將兩個(gè)句子表示為獨(dú)立的向量,然后計(jì)算匹配值。例如對(duì)于下面的句子對(duì):

    句子a:下周有哪些好產(chǎn)品?

    句子b:元月份有什么理財(cái)產(chǎn)品?

    從語(yǔ)義層面看這兩句話,可以看出兩句話的語(yǔ)義有明顯的差別,但是通過(guò)結(jié)構(gòu)對(duì)比發(fā)現(xiàn)在句子a 和句子b中有較多相似的成分,例如“下周”和“元月份”都表示時(shí)間狀語(yǔ),“有哪些”和“有什么”是相似的疑問(wèn)詞,“產(chǎn)品”和“理財(cái)產(chǎn)品”在語(yǔ)義中同屬于詢問(wèn)對(duì)象,這些語(yǔ)義相似的句子成分對(duì)于語(yǔ)義的相似程度具有重要影響,并且只有通過(guò)聯(lián)系另一句話的語(yǔ)義,才能提取出兩個(gè)句子中相似的語(yǔ)義單元。因此,本文提出使用交互注意力來(lái)提取句子間的相似特征。

    本文的交互注意力機(jī)制設(shè)計(jì)思路為,首先計(jì)算相似度矩陣得到兩個(gè)句子中詞匯之間的相似度,然后利用注意力機(jī)制分別對(duì)每個(gè)句子的詞匯進(jìn)行重新編碼,具體計(jì)算公式如下:

    其中,E為兩個(gè)句子的相似度矩陣,為句子1 經(jīng)過(guò)Transformer編碼后的全局語(yǔ)義特征的轉(zhuǎn)置,T2為句子2的語(yǔ)義特征,eij是矩陣E中第i行第j列的元素,表示句子1 中第i個(gè)詞和句子2 中第j個(gè)詞的相似度,s1是利用注意力機(jī)制提取句子2 中與句子1 的相似信息,s2是利用注意力機(jī)制提取句子1 中與句子2 的相似信息,s1和s2是模型用于預(yù)測(cè)的重要特征。

    1.4 特征融合及輸出

    Transformer 層編碼了輸入句子全局的語(yǔ)義特征t1、t2,其中t1表示句子1的語(yǔ)義特征,t2表示句子2的語(yǔ)義特征,交互注意力層提取了每個(gè)句子中的局部相似特征s1、s2,其中s1表示句子1 的相似特征,s2表示句子2 的相似特征,特征融合層根據(jù)公式(14)將兩部分特征進(jìn)行融合:

    其中,t1-t2、s1-s2是向量的相減操作,目的是為了獲取差異特征,最后通過(guò)向量拼接的方式,得到最終的特征融合向量m。輸出層采用全連接網(wǎng)絡(luò)對(duì)特征進(jìn)行權(quán)重調(diào)整及softmax 函數(shù)進(jìn)行預(yù)測(cè)分類結(jié)果y,輸入為融合的特征融合向量m,計(jì)算過(guò)程如公式(15)、(16)所示,經(jīng)過(guò)實(shí)驗(yàn)證明采用全連接層作為輸出效果好于使用歐式距離或余弦相似度作為輸出:

    模型的損失函數(shù)采用交叉熵?fù)p失函數(shù)如下:

    其中ri∈?m是以one-hot 編碼的標(biāo)簽真實(shí)值,yi∈?m是由softmax 函數(shù)預(yù)測(cè)的每個(gè)類別的概率,k是類別的個(gè)數(shù),λ是L2 正則的超參數(shù),本文同時(shí)使用L2 正則和dropout[18]來(lái)防止模型過(guò)擬合,模型的詳細(xì)參數(shù)將會(huì)在2.3節(jié)介紹。

    2 實(shí)驗(yàn)分析

    2.1 實(shí)驗(yàn)數(shù)據(jù)

    為了驗(yàn)證模型的有效性,本文采用兩個(gè)公開(kāi)數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),中文數(shù)據(jù)集采用智能客服數(shù)據(jù)(2018 全國(guó)知識(shí)圖譜與語(yǔ)義計(jì)算大會(huì)智能客服問(wèn)句匹配大賽),英文數(shù)據(jù)集采用SICK(Sentences Involving Compositional Knowledge)數(shù)據(jù)集[19],其中智能客服數(shù)據(jù)為分類任務(wù),判斷兩個(gè)句子語(yǔ)義相似或不相似,SICK 數(shù)據(jù)集的標(biāo)簽為兩個(gè)句子的相似度分?jǐn)?shù),分?jǐn)?shù)區(qū)間為1~5,5分表示完全相似,1 分表示完全不相似。表1 列出了兩個(gè)數(shù)據(jù)集的統(tǒng)計(jì)信息,表2列出了數(shù)據(jù)集樣例。

    表1 實(shí)驗(yàn)數(shù)據(jù)集統(tǒng)計(jì)信息

    表2 數(shù)據(jù)集樣例

    2.2 實(shí)驗(yàn)評(píng)價(jià)指標(biāo)

    對(duì)于智能客服數(shù)據(jù),本實(shí)驗(yàn)采用準(zhǔn)確率(accuracy)和F1 值(F1-score)指標(biāo)作為評(píng)價(jià)指標(biāo),對(duì)于SICK數(shù)據(jù)集,采用皮爾遜系數(shù)作為評(píng)價(jià)指標(biāo)。具體計(jì)算公式如下:

    其中,TP表示正例預(yù)測(cè)為正例的個(gè)數(shù),F(xiàn)P表示負(fù)例預(yù)測(cè)為正例的個(gè)數(shù),F(xiàn)N表示正例預(yù)測(cè)為負(fù)例的個(gè)數(shù),TN表示負(fù)例預(yù)測(cè)為負(fù)例的個(gè)數(shù),X為實(shí)際值,Y為預(yù)測(cè)值。

    2.3 實(shí)驗(yàn)設(shè)置

    本文實(shí)驗(yàn)基于Google 開(kāi)源的TensorFlow 1.14.0 深度學(xué)習(xí)框架實(shí)現(xiàn),中文的詞向量采用的是騰訊開(kāi)源的800 萬(wàn)詞向量[13],并且使用哈工大分詞工具包pyltp0.2.0進(jìn)行中文分詞,英文詞向量的采用的是由斯坦福大學(xué)預(yù)訓(xùn)練的glove[11]詞向量,未登陸詞通過(guò)高斯分布隨機(jī)初始化,所有的參數(shù)包括詞向量都隨訓(xùn)練過(guò)程更新,序列的最大長(zhǎng)度根據(jù)實(shí)驗(yàn)語(yǔ)料長(zhǎng)度覆蓋率95%以上進(jìn)行選取,為防止訓(xùn)練過(guò)程抖動(dòng),優(yōu)化方法采用Adam算法[20],實(shí)驗(yàn)采用earlystopping 防止過(guò)模型擬合,表3 列出了實(shí)驗(yàn)具體的超參數(shù)。

    表3 實(shí)驗(yàn)超參數(shù)設(shè)置

    2.4 實(shí)驗(yàn)結(jié)果及分析

    為了驗(yàn)證本文方法的有效性,同時(shí)為了比較不同的深度學(xué)習(xí)模型的效果,本文加入了Siamese-CNN、Siamese-LSTM 以及Siamese-LSTM-Att 模型進(jìn)行對(duì)比,另外也加入了傳統(tǒng)TF-IDF 方法進(jìn)行對(duì)比,本文提出的模型為T(mén)EAM,實(shí)驗(yàn)采用五折交叉驗(yàn)證的方式選取評(píng)價(jià)指標(biāo)的平均值作為結(jié)果。

    2.4.1 智能客服數(shù)據(jù)實(shí)驗(yàn)分析

    智能客服數(shù)據(jù)上的實(shí)驗(yàn)結(jié)果如表4所示。

    通過(guò)實(shí)驗(yàn)結(jié)果可以看出傳統(tǒng)的TF-IDF方法通過(guò)淺層詞匯匹配只能達(dá)到70.2%的準(zhǔn)確率,本文提出的TEAM 模型比傳統(tǒng)模型在準(zhǔn)確率上提升了24.5 個(gè)百分點(diǎn),比其他深度學(xué)習(xí)模型平均提升了15 個(gè)百分點(diǎn)。通過(guò)表4 可以看出深度學(xué)習(xí)模型較傳統(tǒng)模型性能提升很多。基于卷積神經(jīng)網(wǎng)絡(luò)編碼的Siamese-CNN 只能達(dá)到74.4%的準(zhǔn)確率,這是由于卷積神經(jīng)網(wǎng)絡(luò)只能提取每個(gè)句子的局部特征,不能獲得全局的語(yǔ)義編碼。Siamese-LSTM 模型的準(zhǔn)確率比Siamese-CNN 提升了15 個(gè)百分點(diǎn),證明循環(huán)神經(jīng)網(wǎng)絡(luò)對(duì)語(yǔ)義的編碼能力比卷積神經(jīng)網(wǎng)絡(luò)表現(xiàn)得更好,加入了注意力機(jī)制的Siamese-LSTM-Att模型相比Siamese-LSTM 模型準(zhǔn)確率只提升了0.9 個(gè)百分點(diǎn),F(xiàn)1 值提升了0.5個(gè)百分點(diǎn),可以看出局部注意力并沒(méi)有對(duì)模型表現(xiàn)帶來(lái)很大的提升。此外,TEAM模型相比Siamese-LSTM模型提升了5.1個(gè)百分點(diǎn),較Siamese-CNN 模型提升了20.3 個(gè)百分點(diǎn),可以看出基于Transformer 的模型比傳統(tǒng)的CNN,LSTM 模型性能提升很多,證明Transformer網(wǎng)絡(luò)的語(yǔ)義編碼能力更強(qiáng)。

    表4 智能客服測(cè)試數(shù)據(jù)集結(jié)果 %

    實(shí)驗(yàn)過(guò)程對(duì)比曲線如圖3所示。

    圖3 智能客服數(shù)據(jù)準(zhǔn)確率變化曲線

    由圖3 可知,TEAM 模型只用了2 個(gè)epoch 達(dá)到了90%的準(zhǔn)確率,并在第8個(gè)epoch開(kāi)始提升緩慢,模型接近收斂點(diǎn),證明TEAM 模型的收斂速度明顯快于其他模型。

    2.4.2 SICK數(shù)據(jù)實(shí)驗(yàn)分析

    不同模型在SICK 數(shù)據(jù)集上的表現(xiàn)如表5 所示,由實(shí)驗(yàn)結(jié)果可以看出,TEAM 模型的表現(xiàn)好于其他模型,比其他模型皮爾遜相關(guān)系數(shù)平均提升了0.3,證明TEAM模型在英文數(shù)據(jù)集上的有效性,但相比Siamese-LSTMAtt模型皮爾遜相關(guān)系數(shù)僅提升了0.052,效果提升不明顯。由圖4可知,由于SICK數(shù)據(jù)集數(shù)據(jù)較小,TEAM模型在訓(xùn)練過(guò)程中出現(xiàn)了過(guò)擬合的現(xiàn)象,證明基于Transformer的模型在數(shù)據(jù)集較小的數(shù)據(jù)上性能還有待提升。

    表5 SICK測(cè)試數(shù)據(jù)集結(jié)果

    圖4 SICK數(shù)據(jù)皮爾遜系數(shù)變化曲線

    2.4.3 交互注意力機(jī)制的有效性分析

    為了進(jìn)步一驗(yàn)證模型有效性,引入將TEAM模型去除交互注意力機(jī)制的模型TEM,分別在兩個(gè)數(shù)據(jù)集上進(jìn)行對(duì)比實(shí)驗(yàn),驗(yàn)證加入句子間交互注意力對(duì)模型的影響。表6 為實(shí)驗(yàn)的結(jié)果,圖5 是模型在兩個(gè)實(shí)驗(yàn)數(shù)據(jù)上的訓(xùn)練過(guò)程,由表6 實(shí)驗(yàn)結(jié)果可知,交互注意力對(duì)模型提升效果明顯,在智能客服數(shù)據(jù)上TEAM 比TEM 準(zhǔn)確率提升2.7個(gè)百分點(diǎn),在SICK數(shù)據(jù)上皮爾遜相關(guān)系數(shù)提升0.05,證明交互注意力使模型充分學(xué)習(xí)到句子間的相似特征,進(jìn)而對(duì)相似度進(jìn)行更準(zhǔn)確的預(yù)測(cè)。其次,實(shí)驗(yàn)結(jié)果同時(shí)證明句子間的交互信息對(duì)于相似度計(jì)算問(wèn)題具有重要作用。由訓(xùn)練對(duì)比曲線可知,TEAM模型由于可以捕捉到句子的交互特征,使得模型的收斂更快。

    表6 TEAM和TEM結(jié)果對(duì)比

    圖5 TEAM和TEM訓(xùn)練曲線

    3 結(jié)束語(yǔ)

    本文提出了一種基于Transformer 編碼器的語(yǔ)義相似度計(jì)算模型,并引入了交互注意力機(jī)制提取句子間的相似特征,綜合考慮了相似度計(jì)算問(wèn)題中的全局語(yǔ)義編碼和局部相似特征編碼,在不同數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果證明本文模型在中文英文數(shù)據(jù)上比基準(zhǔn)模型有顯著的改善,并且證明了交互注意力機(jī)制的有效性。目前的實(shí)驗(yàn)數(shù)據(jù)及模型對(duì)象都是針對(duì)短文本語(yǔ)料,且數(shù)據(jù)分布均衡,長(zhǎng)文本面臨著計(jì)算時(shí)間長(zhǎng)以及注意力分散的問(wèn)題,在后序的工作中,將開(kāi)展長(zhǎng)文本相似度計(jì)算方法的研究和優(yōu)化,增強(qiáng)模型的泛化能力。

    猜你喜歡
    注意力語(yǔ)義編碼
    讓注意力“飛”回來(lái)
    基于SAR-SIFT和快速稀疏編碼的合成孔徑雷達(dá)圖像配準(zhǔn)
    《全元詩(shī)》未編碼疑難字考辨十五則
    語(yǔ)言與語(yǔ)義
    子帶編碼在圖像壓縮編碼中的應(yīng)用
    電子制作(2019年22期)2020-01-14 03:16:24
    Genome and healthcare
    “揚(yáng)眼”APP:讓注意力“變現(xiàn)”
    A Beautiful Way Of Looking At Things
    “上”與“下”語(yǔ)義的不對(duì)稱性及其認(rèn)知闡釋
    認(rèn)知范疇模糊與語(yǔ)義模糊
    18+在线观看网站| 日日摸夜夜添夜夜添av毛片| 嫩草影院新地址| 亚洲伊人久久精品综合 | 久久鲁丝午夜福利片| 真实男女啪啪啪动态图| 最后的刺客免费高清国语| 日韩三级伦理在线观看| 男女啪啪激烈高潮av片| 久久精品国产鲁丝片午夜精品| 性插视频无遮挡在线免费观看| 天堂√8在线中文| 亚洲成人中文字幕在线播放| 日韩人妻高清精品专区| 国产精品久久久久久久电影| 久久精品熟女亚洲av麻豆精品 | 插逼视频在线观看| videos熟女内射| 好男人在线观看高清免费视频| 久久久久久国产a免费观看| 婷婷色麻豆天堂久久 | 国内揄拍国产精品人妻在线| 女人久久www免费人成看片 | 精品人妻偷拍中文字幕| 国产大屁股一区二区在线视频| 禁无遮挡网站| 国产欧美另类精品又又久久亚洲欧美| 国产高潮美女av| 亚洲欧美成人精品一区二区| 亚洲图色成人| 51国产日韩欧美| 国模一区二区三区四区视频| 91久久精品国产一区二区三区| 免费看a级黄色片| 欧美三级亚洲精品| 亚洲国产日韩欧美精品在线观看| 啦啦啦啦在线视频资源| 六月丁香七月| 久久久精品欧美日韩精品| 久久久成人免费电影| 精品一区二区三区人妻视频| 91狼人影院| 国产在线一区二区三区精 | 国产美女午夜福利| 舔av片在线| 国产伦精品一区二区三区视频9| 内射极品少妇av片p| 大又大粗又爽又黄少妇毛片口| 欧美成人午夜免费资源| 国产人妻一区二区三区在| 久久久精品欧美日韩精品| 亚洲自偷自拍三级| 久久亚洲精品不卡| 老司机影院毛片| 欧美高清成人免费视频www| 欧美3d第一页| 国产精品美女特级片免费视频播放器| 日本爱情动作片www.在线观看| 亚洲av男天堂| 日本与韩国留学比较| 全区人妻精品视频| 亚洲性久久影院| 免费av观看视频| 中文字幕人妻熟人妻熟丝袜美| 蜜桃亚洲精品一区二区三区| 熟女人妻精品中文字幕| av视频在线观看入口| 欧美性猛交╳xxx乱大交人| 亚洲av成人精品一二三区| 日产精品乱码卡一卡2卡三| 午夜精品一区二区三区免费看| 男女国产视频网站| 日本色播在线视频| 你懂的网址亚洲精品在线观看 | 搡女人真爽免费视频火全软件| 国产乱人视频| 亚洲经典国产精华液单| 成人午夜精彩视频在线观看| 丝袜喷水一区| 女人十人毛片免费观看3o分钟| 色吧在线观看| 男人舔女人下体高潮全视频| 日本黄大片高清| 国产精品一区二区三区四区免费观看| 久久久精品大字幕| 国产69精品久久久久777片| 国产淫片久久久久久久久| 国模一区二区三区四区视频| 日韩av在线大香蕉| 美女xxoo啪啪120秒动态图| 国产成人精品婷婷| 亚洲一级一片aⅴ在线观看| av播播在线观看一区| 久久热精品热| 国产三级在线视频| 在线天堂最新版资源| 白带黄色成豆腐渣| 黄色一级大片看看| 免费av不卡在线播放| 成人高潮视频无遮挡免费网站| 特级一级黄色大片| 欧美日韩国产亚洲二区| 免费av观看视频| 人人妻人人看人人澡| 美女被艹到高潮喷水动态| 国产色婷婷99| 精品国内亚洲2022精品成人| 老师上课跳d突然被开到最大视频| 亚洲精品一区蜜桃| 99热这里只有精品一区| 久久久久久久国产电影| 中文字幕制服av| 免费看av在线观看网站| 韩国高清视频一区二区三区| 免费黄色在线免费观看| 青春草国产在线视频| 国产精品一二三区在线看| 一级av片app| 久热久热在线精品观看| 国产精品久久久久久久久免| 成人亚洲精品av一区二区| 欧美高清性xxxxhd video| 国产v大片淫在线免费观看| 麻豆av噜噜一区二区三区| 青春草国产在线视频| 久久精品久久久久久久性| 男人狂女人下面高潮的视频| 欧美另类亚洲清纯唯美| 国产精品永久免费网站| 国产 一区 欧美 日韩| 夜夜爽夜夜爽视频| 欧美日本视频| 99热精品在线国产| 免费搜索国产男女视频| 免费大片18禁| 国产高清有码在线观看视频| 久久久国产成人精品二区| 搡老妇女老女人老熟妇| 青青草视频在线视频观看| 卡戴珊不雅视频在线播放| 久久国内精品自在自线图片| 中文字幕精品亚洲无线码一区| 人妻系列 视频| 国产一级毛片在线| 亚洲美女搞黄在线观看| 丝袜喷水一区| 看片在线看免费视频| 欧美变态另类bdsm刘玥| 伦精品一区二区三区| 少妇熟女aⅴ在线视频| 伦精品一区二区三区| 搞女人的毛片| 少妇熟女aⅴ在线视频| 国语自产精品视频在线第100页| 国产老妇女一区| 身体一侧抽搐| 国产av在哪里看| www日本黄色视频网| 日日撸夜夜添| 男女边吃奶边做爰视频| 久久综合国产亚洲精品| 两个人视频免费观看高清| 好男人视频免费观看在线| 亚洲va在线va天堂va国产| 亚洲欧美中文字幕日韩二区| 午夜激情福利司机影院| 水蜜桃什么品种好| 亚洲欧美精品综合久久99| 极品教师在线视频| 老师上课跳d突然被开到最大视频| a级一级毛片免费在线观看| 久久亚洲国产成人精品v| 不卡视频在线观看欧美| 国产午夜福利久久久久久| 亚洲自拍偷在线| 免费不卡的大黄色大毛片视频在线观看 | 国产精品日韩av在线免费观看| 美女xxoo啪啪120秒动态图| 一区二区三区四区激情视频| 亚洲欧美清纯卡通| 久久精品久久久久久久性| 中文字幕人妻熟人妻熟丝袜美| 亚洲欧美成人精品一区二区| 色网站视频免费| 日韩精品青青久久久久久| 国产伦精品一区二区三区视频9| 国产一区二区亚洲精品在线观看| 69人妻影院| 亚洲国产精品成人久久小说| 午夜精品国产一区二区电影 | 日本免费一区二区三区高清不卡| 亚洲国产高清在线一区二区三| 中文欧美无线码| 日韩大片免费观看网站 | 久久久久九九精品影院| 麻豆av噜噜一区二区三区| 久久久久久久亚洲中文字幕| 国产精品国产高清国产av| 大话2 男鬼变身卡| 久久精品夜夜夜夜夜久久蜜豆| 亚洲国产欧洲综合997久久,| av在线播放精品| 国产精品久久久久久精品电影小说 | 国产成年人精品一区二区| 校园人妻丝袜中文字幕| 久久久国产成人免费| 亚洲av电影不卡..在线观看| 国产午夜精品一二区理论片| 国产探花极品一区二区| 亚洲第一区二区三区不卡| 亚洲成人精品中文字幕电影| 日韩大片免费观看网站 | 国产亚洲av嫩草精品影院| 午夜激情欧美在线| 亚洲人成网站在线播| 午夜精品一区二区三区免费看| 高清视频免费观看一区二区 | 国内精品一区二区在线观看| 天堂中文最新版在线下载 | 国产黄a三级三级三级人| 午夜亚洲福利在线播放| 亚洲高清免费不卡视频| 亚洲国产色片| 特大巨黑吊av在线直播| 又黄又爽又刺激的免费视频.| 国产又色又爽无遮挡免| 日日摸夜夜添夜夜添av毛片| 国产精品一区二区在线观看99 | 色尼玛亚洲综合影院| 成人综合一区亚洲| 国产精品乱码一区二三区的特点| 国产成人精品久久久久久| 欧美日韩在线观看h| av又黄又爽大尺度在线免费看 | 在线免费十八禁| 国产91av在线免费观看| 国产免费又黄又爽又色| 久久精品国产亚洲av涩爱| 在线a可以看的网站| 亚洲精品久久久久久婷婷小说 | 国产精品精品国产色婷婷| 成人无遮挡网站| 最近2019中文字幕mv第一页| 久久久久久久国产电影| 国产午夜精品论理片| 夜夜看夜夜爽夜夜摸| 成人毛片a级毛片在线播放| 久久99精品国语久久久| 日日撸夜夜添| 欧美性感艳星| 一区二区三区免费毛片| 啦啦啦啦在线视频资源| 国产高清三级在线| 成人高潮视频无遮挡免费网站| 欧美精品一区二区大全| 日韩精品有码人妻一区| 国产成人福利小说| 好男人视频免费观看在线| 99热6这里只有精品| 国产色爽女视频免费观看| 精品少妇黑人巨大在线播放 | 久久精品久久精品一区二区三区| 国产精品一区www在线观看| 高清在线视频一区二区三区 | 少妇熟女aⅴ在线视频| 大话2 男鬼变身卡| 97人妻精品一区二区三区麻豆| 国产精品国产三级国产av玫瑰| 99九九线精品视频在线观看视频| 国产在视频线精品| 热99re8久久精品国产| 久久精品国产鲁丝片午夜精品| 一本—道久久a久久精品蜜桃钙片 精品乱码久久久久久99久播 | 精品久久久久久电影网 | 久久人妻av系列| 成人高潮视频无遮挡免费网站| 久久久久久九九精品二区国产| 国产精品av视频在线免费观看| 最近视频中文字幕2019在线8| 亚洲av免费高清在线观看| 内地一区二区视频在线| 国产精品人妻久久久久久| 在线天堂最新版资源| 午夜a级毛片| 舔av片在线| 成人性生交大片免费视频hd| 又爽又黄a免费视频| 国产伦一二天堂av在线观看| 亚洲成人精品中文字幕电影| 日日摸夜夜添夜夜爱| 免费黄网站久久成人精品| 亚洲无线观看免费| 人妻夜夜爽99麻豆av| 黄片wwwwww| 一边亲一边摸免费视频| 国产成人a∨麻豆精品| 久久99热6这里只有精品| 成人综合一区亚洲| 熟女电影av网| 26uuu在线亚洲综合色| 国产精品精品国产色婷婷| 国产老妇伦熟女老妇高清| 天堂影院成人在线观看| 精品酒店卫生间| 只有这里有精品99| 国产黄a三级三级三级人| 精品欧美国产一区二区三| 老师上课跳d突然被开到最大视频| 三级男女做爰猛烈吃奶摸视频| 26uuu在线亚洲综合色| 18禁在线播放成人免费| 1024手机看黄色片| 国产久久久一区二区三区| www.av在线官网国产| 久久99蜜桃精品久久| 国产高清国产精品国产三级 | 中国国产av一级| 能在线免费看毛片的网站| 国产91av在线免费观看| 九草在线视频观看| 婷婷色综合大香蕉| 久久99热这里只频精品6学生 | 久久久久久久亚洲中文字幕| 99久久九九国产精品国产免费| 久久国产乱子免费精品| 青青草视频在线视频观看| 色视频www国产| 中国美白少妇内射xxxbb| 久久精品人妻少妇| 亚洲国产欧美人成| 简卡轻食公司| 黄色欧美视频在线观看| av在线蜜桃| 中文精品一卡2卡3卡4更新| 毛片女人毛片| 亚洲在线自拍视频| 免费观看在线日韩| 亚洲精品乱久久久久久| 久久久色成人| 啦啦啦观看免费观看视频高清| 国产熟女欧美一区二区| 久久久成人免费电影| 久久韩国三级中文字幕| 国产精品伦人一区二区| 久久鲁丝午夜福利片| 搡女人真爽免费视频火全软件| 一区二区三区四区激情视频| 蜜桃亚洲精品一区二区三区| 国产免费男女视频| 免费观看a级毛片全部| 卡戴珊不雅视频在线播放| 精品久久久久久成人av| 一个人看的www免费观看视频| 国产真实伦视频高清在线观看| 听说在线观看完整版免费高清| 国产中年淑女户外野战色| 久久久久免费精品人妻一区二区| 国产av在哪里看| 欧美zozozo另类| 亚洲图色成人| av天堂中文字幕网| 日日撸夜夜添| 国产亚洲精品久久久com| 亚洲三级黄色毛片| 成人毛片a级毛片在线播放| 国产黄a三级三级三级人| 人妻系列 视频| 亚洲最大成人中文| 男女下面进入的视频免费午夜| 成人午夜高清在线视频| 国产精品久久电影中文字幕| 老司机影院毛片| 亚洲国产精品专区欧美| 2021少妇久久久久久久久久久| 一级毛片aaaaaa免费看小| 精品熟女少妇av免费看| 亚洲18禁久久av| 日韩 亚洲 欧美在线| 91精品一卡2卡3卡4卡| 国产乱人视频| 成年女人永久免费观看视频| 久久精品久久久久久久性| 欧美日本视频| 久久国产乱子免费精品| 嫩草影院入口| 天堂影院成人在线观看| 寂寞人妻少妇视频99o| a级毛片免费高清观看在线播放| 久久精品久久久久久久性| 色综合色国产| 国产精品人妻久久久影院| 久久久色成人| 97超碰精品成人国产| 97人妻精品一区二区三区麻豆| 91精品伊人久久大香线蕉| 99久久成人亚洲精品观看| 看十八女毛片水多多多| av免费在线看不卡| 欧美xxxx性猛交bbbb| 欧美人与善性xxx| 亚洲美女视频黄频| 亚洲av免费高清在线观看| 欧美潮喷喷水| 97人妻精品一区二区三区麻豆| 日韩欧美精品免费久久| 又黄又爽又刺激的免费视频.| 在线观看av片永久免费下载| av在线天堂中文字幕| 国产久久久一区二区三区| 国产午夜福利久久久久久| 精品久久国产蜜桃| 国产精品伦人一区二区| 一级黄色大片毛片| 国产一区二区亚洲精品在线观看| 成人二区视频| av福利片在线观看| 国产av不卡久久| 午夜激情欧美在线| 91狼人影院| 色综合亚洲欧美另类图片| 久久精品久久久久久久性| 欧美不卡视频在线免费观看| 亚洲国产欧洲综合997久久,| 成人性生交大片免费视频hd| 一级毛片aaaaaa免费看小| 波多野结衣高清无吗| 欧美一区二区亚洲| 亚洲人成网站在线播| 三级男女做爰猛烈吃奶摸视频| 五月玫瑰六月丁香| 国产亚洲一区二区精品| 99久久九九国产精品国产免费| 国产精品一及| 成人性生交大片免费视频hd| 亚洲av中文字字幕乱码综合| 国产 一区精品| 免费搜索国产男女视频| 免费观看精品视频网站| 亚洲av中文av极速乱| 天天躁日日操中文字幕| 欧美97在线视频| 国产精品无大码| 成人无遮挡网站| 麻豆一二三区av精品| 中文欧美无线码| av在线播放精品| 久久久精品大字幕| 日本五十路高清| 男女视频在线观看网站免费| 国产免费又黄又爽又色| 久久99蜜桃精品久久| videossex国产| 国产成人a区在线观看| 欧美又色又爽又黄视频| 亚洲欧美日韩卡通动漫| 日本一本二区三区精品| 亚洲在久久综合| 国产91av在线免费观看| 国产精品一区二区在线观看99 | 久久鲁丝午夜福利片| 亚州av有码| 女人被狂操c到高潮| 最近中文字幕2019免费版| 精品久久久久久久久av| 晚上一个人看的免费电影| 三级国产精品欧美在线观看| or卡值多少钱| 男女那种视频在线观看| 国产真实伦视频高清在线观看| 免费观看的影片在线观看| 国产成人freesex在线| 99在线人妻在线中文字幕| 欧美成人免费av一区二区三区| 国产女主播在线喷水免费视频网站 | 天堂中文最新版在线下载 | 国产91av在线免费观看| 男女啪啪激烈高潮av片| 久久久久九九精品影院| 国产探花极品一区二区| 国产一区二区在线av高清观看| 亚洲久久久久久中文字幕| 久久久午夜欧美精品| 日本一二三区视频观看| www.av在线官网国产| 久久久久久国产a免费观看| 亚洲国产精品国产精品| 亚洲成人精品中文字幕电影| 麻豆成人午夜福利视频| 国语自产精品视频在线第100页| 偷拍熟女少妇极品色| 欧美97在线视频| 午夜a级毛片| 麻豆乱淫一区二区| 欧美三级亚洲精品| 男女视频在线观看网站免费| 久久这里有精品视频免费| 黑人高潮一二区| 亚洲久久久久久中文字幕| 人人妻人人澡欧美一区二区| 国产片特级美女逼逼视频| 国产老妇女一区| 丝袜美腿在线中文| 亚洲性久久影院| 一级毛片电影观看 | 99视频精品全部免费 在线| 搡老妇女老女人老熟妇| 看黄色毛片网站| 日本猛色少妇xxxxx猛交久久| 中文字幕人妻熟人妻熟丝袜美| 看非洲黑人一级黄片| 又爽又黄无遮挡网站| 91午夜精品亚洲一区二区三区| 1024手机看黄色片| 国产熟女欧美一区二区| 午夜福利视频1000在线观看| 女人久久www免费人成看片 | 成人午夜精彩视频在线观看| 亚洲精品乱久久久久久| 亚洲国产精品久久男人天堂| 中文欧美无线码| 国产黄色视频一区二区在线观看 | 男女视频在线观看网站免费| 国产亚洲精品av在线| 变态另类丝袜制服| 男女那种视频在线观看| 久久久成人免费电影| 老司机福利观看| 国产精品福利在线免费观看| 国产成人aa在线观看| 大话2 男鬼变身卡| 美女cb高潮喷水在线观看| 亚洲成色77777| 日日摸夜夜添夜夜爱| 欧美激情国产日韩精品一区| 国产高清国产精品国产三级 | 成人美女网站在线观看视频| 亚洲av男天堂| 内地一区二区视频在线| 欧美bdsm另类| 国产精品久久电影中文字幕| 久久精品夜夜夜夜夜久久蜜豆| 女人被狂操c到高潮| 久久久亚洲精品成人影院| 成人性生交大片免费视频hd| 三级国产精品欧美在线观看| 春色校园在线视频观看| 国产老妇女一区| 性色avwww在线观看| 成年版毛片免费区| 亚洲欧美日韩卡通动漫| 亚洲欧美日韩东京热| 视频中文字幕在线观看| 看黄色毛片网站| 精品久久国产蜜桃| 久久久精品大字幕| 亚洲自偷自拍三级| 男女那种视频在线观看| 免费电影在线观看免费观看| 国产乱人偷精品视频| 搡女人真爽免费视频火全软件| 18禁动态无遮挡网站| 欧美日韩精品成人综合77777| 成人鲁丝片一二三区免费| 国产三级在线视频| 日韩一区二区三区影片| 日本与韩国留学比较| 韩国高清视频一区二区三区| 亚洲精品久久久久久婷婷小说 | 啦啦啦观看免费观看视频高清| 国产高清视频在线观看网站| 日本一本二区三区精品| 97超视频在线观看视频| 欧美一级a爱片免费观看看| 欧美精品国产亚洲| 国产淫语在线视频| 成年女人永久免费观看视频| 国产日韩欧美在线精品| 亚洲av福利一区| 欧美潮喷喷水| 国产成年人精品一区二区| 乱码一卡2卡4卡精品| 久久久久久久久大av| 乱码一卡2卡4卡精品| 一本—道久久a久久精品蜜桃钙片 精品乱码久久久久久99久播 | 国产一区有黄有色的免费视频 | 国产精品久久久久久久电影| 日韩欧美精品免费久久| av天堂中文字幕网| 亚洲五月天丁香| 高清午夜精品一区二区三区| 午夜免费激情av| 免费观看在线日韩| 亚洲欧美日韩高清专用| 国产一级毛片七仙女欲春2| 欧美色视频一区免费| 国内精品美女久久久久久| 大香蕉97超碰在线| av在线蜜桃| 熟女人妻精品中文字幕| 久久精品人妻少妇| 在线免费观看不下载黄p国产| 国产三级中文精品| 简卡轻食公司| 日韩av不卡免费在线播放| 日韩一区二区三区影片| 人人妻人人澡欧美一区二区| 超碰97精品在线观看| 美女大奶头视频| 一卡2卡三卡四卡精品乱码亚洲| 草草在线视频免费看| 国产大屁股一区二区在线视频| 精品久久久久久电影网 | 你懂的网址亚洲精品在线观看 | 内射极品少妇av片p| 卡戴珊不雅视频在线播放|