• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    多模型加權(quán)融合的文本相似度計算

    2021-11-20 03:23:30田紅鵬
    計算機工程與設(shè)計 2021年11期
    關(guān)鍵詞:特征詞語義權(quán)重

    田紅鵬,馬 博,馮 健

    (西安科技大學(xué) 計算機科學(xué)與技術(shù)學(xué)院,陜西 西安 710600)

    0 引 言

    在文本相似度計算領(lǐng)域中,其主要是扮演著自然語言處理的一種基礎(chǔ)性工具的角色。目前,這種計算方式在很多領(lǐng)域中都能夠看到其身影,比如在處理對話以及數(shù)據(jù)采集問題上均會使用[1]。Islam等[2]提出了一種基于語料庫的語義相似度測量和最長序列匹配算法來測量文本的語義相似度,可以在文本表示等領(lǐng)域?qū)W⒂谟嬎銉蓚€句子或兩個短段落之間的相似度。李曉等基于Word2Vec模型的基礎(chǔ)上,把句子進行了簡化處理,并形成向量空間中的向量運算,然后根據(jù)矩陣之間的關(guān)聯(lián)度對句子語義中的相似度進行了檢驗和論證[3]。其所使用的設(shè)置方式,對于強化相似度結(jié)構(gòu)的精準性起到了顯著作用。Magooda等[4]提出了一個基于TF-IDF和語言模型相結(jié)合的方式將計算出的相似度根據(jù)新的加權(quán)總和對檢索到的文檔進行重新排序。有效克服了模糊理解文章的語義和上下文的問題。Kusne等[5]提出文本距離算法,將文本距離分解為詞間的稀疏矩陣,基于文本向量空間距離進行求解。Tashu等[6]為了解決語義和上下文的問題,提出了使用詞移距離算法的成對語義相似性評估。該方法依靠神經(jīng)詞嵌入來衡量詞之間的相似度。Pontes等[7]證明了局部上下文對于獲取句子中單詞的信息和改進句子分析效果顯著。其系統(tǒng)地分析、識別并保存了句子各部分和整個句子中的相關(guān)信息,通過局部上下文降低均方誤差并增加相關(guān)性分析來改進句子相似性的預(yù)測,同時也提出了語料庫的重要性。Yang等[8]基于淺層句法結(jié)構(gòu)化特征的基礎(chǔ)之上進行求解,雖然依賴樹能有效解釋關(guān)聯(lián)關(guān)系,但無法適用于句子深層語義的解釋。Ozbal等[9]使用樹核函數(shù)根據(jù)輸入數(shù)據(jù)的結(jié)構(gòu)化表示生成不同維度的特征信息,對多種富含語義特征的句法信息進行求解,實驗發(fā)現(xiàn)淺層語義特征與語義特征可以很好結(jié)合。

    現(xiàn)存大多數(shù)研究僅考慮單一的文本特征或僅針對語義特征進行模型融合,本文不僅考慮文本語義、詞序、主題關(guān)聯(lián)性等相關(guān)語義問題,同時還結(jié)合了文本結(jié)構(gòu)信息等表現(xiàn)形式展開分析。在此前提下,結(jié)合基于分層池化句向量的方法計算文本相似度,進而實現(xiàn)了不同形式在求解方面的融合,綜合考慮句子語義和文本結(jié)構(gòu)信息并使計算結(jié)果更優(yōu)且合理。

    1 相關(guān)工作

    1.1 TF-IDF權(quán)重(TIi)

    此權(quán)重通過兩部分實現(xiàn),其一是TF詞頻,特征詞在特定一段范圍之內(nèi)出現(xiàn)的次數(shù)出現(xiàn)次數(shù)越多,詞頻量化值越大,出現(xiàn)次數(shù)越少值越小。通過這一數(shù)值的計算,能夠進一步得出與總長度的整體比值。特征詞總量共計為N,其中某詞條的浮現(xiàn)次數(shù)為n,詞頻TFik即

    (1)

    其二逆文檔頻率即包含特征詞條的文檔數(shù),如式(2)所示。M為全量文本,包含詞條的文本置為m,包含特征詞的文檔越少IDF最終越大

    (2)

    其中,α為經(jīng)驗系數(shù),通常情況下,該數(shù)值等于0.01。TF-IDF權(quán)重表示為

    TIik=TFik*IDFik

    (3)

    1.2 詞句位置權(quán)重(Pi)

    美國P.E.Baxendale的調(diào)查結(jié)果顯示:在文本中的重點思想實際上大部分是出現(xiàn)在第一句當(dāng)中,而這種現(xiàn)象占了整體的85%,另外7%是出現(xiàn)在段落末尾。因此在對其比例進行計算的時候,還需要對其位置因素多加考量,要根據(jù)其不同位置來對關(guān)鍵詞分析權(quán)重。當(dāng)關(guān)鍵詞或者核心內(nèi)容都聚集在第一句或者最后一句的時候,其關(guān)鍵詞會比其它位置的權(quán)重占比高很多。接下來對其加權(quán)函數(shù)進一步展示

    (4)

    其中,e1和e2為支持個性化設(shè)置,其中將e1值調(diào)整為0.2,e2值調(diào)整成0.1。x代表的時不同位置下的具體比例,且按照0-1的順序自然排序。其中一個i的詞句位置權(quán)重為Pi。

    1.3 詞性權(quán)重(Si)

    此處對我們當(dāng)前使用的漢語言詞義與特征展開研究[10],需要根據(jù)關(guān)鍵詞的含義、句法關(guān)系等來對其權(quán)重展開針對性計算[11]。對所有詞語的詞性特征進行歸納[12],并總結(jié)為7種,每一種詞性分別所占的比例體現(xiàn)在表1中。

    表1 中文文本詞性分布占比

    通過梳理表1數(shù)據(jù)我們不難發(fā)現(xiàn),在這些不同性質(zhì)的代表詞性當(dāng)中,在解釋詞匯內(nèi)容方面,最具解釋能力的詞性就是動詞、名詞、形容詞和副詞。剩余3種詞性的詞語幾乎不具備完整的詞匯信息,因此會被看作數(shù)據(jù)噪音被處理掉。通過前4類詞語的運用,一方面,能讓其解釋能力更佳,另一方面,還能進一步簡化不必要的計算流程,進而使計算結(jié)果更為精準與快速。同理,得出了表2中不同詞性下所對應(yīng)的占比。

    表2 詞性權(quán)重系數(shù)

    在表2所示的數(shù)據(jù)當(dāng)中,Si代表的是不同詞性i下的不同占比,可以發(fā)現(xiàn),除了一類與二類詞性之外,其它詞性權(quán)重都置為零。

    2 多模型加權(quán)融合算法設(shè)計

    在此研究的過程中,首先充分考慮了詞語出現(xiàn)頻率的問題,構(gòu)建多特征權(quán)重的量化信息,兼容TF-IDF、語句、詞性。在多特征融合的前提下,對不同特征詞進行了再次計算,基于其自然降序排序原則下,對特征詞進行排序,其中選取前n個作為文本關(guān)鍵特征詞。最終,在Word2Vec詞向量模型中,通過計算特征詞數(shù)值,得出了最終的向量形式,進而計算出比較精確的相似度數(shù)值。

    通過結(jié)合實現(xiàn)的池化操作使用SIF模型,將不同詞序和結(jié)構(gòu)信息的表達類型分層分組,去除向量之間的空間距離后,可以計算出單位向量模型與分層求和的相似度結(jié)果。

    為了更好強化算法的特征,并保證最終數(shù)值的準確性,將上述兩種單模型線性加權(quán)計算,得到融合的計算算法(algorithm for calculating the similarity of multi-model fusion,MuMoSim)。計算如下

    MuMoSim=x×MuSim+y×IIGSim

    (5)

    其中,MuSim為前者多特征融合度量計算結(jié)果,IIGSim為后者分層池化度量計算結(jié)果。該計算方法的流程如圖1所示。

    圖1 多模型融合文本相似度計算算法

    2.1 基于多特征融合的詞移距離算法

    大多數(shù)基于關(guān)鍵詞的相似度計算方法單一統(tǒng)計句子的關(guān)鍵詞,為綜合考慮關(guān)鍵特征對文本相似度結(jié)果的影響,本文采取將詞頻TF-IDF權(quán)重(TIi)、詞性(Si)、詞句位置(Pi)3個特征相結(jié)合,共同計算句子相似度。詞語i在文本D中的多特征融合權(quán)重計算公式如式(6)所示

    MFWi=α×TIi+β×Si+γ×Pi

    (6)

    式中:α、β、γ分別代表的是詞頻、詞性和詞句位置3個不同要素的相似度權(quán)重系數(shù),0≤α≤1,0≤β≤1,0≤γ≤1,同時要滿足α+β+γ=1。

    本文采用層次分析法計算各特征項α、β、γ的權(quán)重,針對不同數(shù)據(jù)集設(shè)計不同權(quán)重系數(shù)取值。層次分析法針對本文特征元素進行定性和定量分析。具體步驟如下:

    (1)建立層次結(jié)構(gòu)模型

    特征融合后的結(jié)果作為目標層,詞頻、詞性、詞句位置相似度作為準則層。

    (2)構(gòu)造判斷(成對比較)矩陣

    根據(jù)重要程度對比,得出準則層各個準則的比重。標度量化值1-9代表重要程度由低到高,兩兩比較減少干擾因素,最終生成判斷矩陣。

    判斷矩陣元素標度方法

    (7)

    (3)層次排序及其一致性檢驗

    計算一致性指標CI

    (8)

    式中:λmax為從判斷矩陣得出最大特征值,n為特征向量的維度。

    平均隨機一致性指標RI標準值見表3,本文為三階矩陣,RI對應(yīng)表格中為0.52。計算一致性比例CR

    表3 隨機一致性指標

    (9)

    通常情況下,若CR<0.1,假設(shè)判斷矩陣已通過最一致性測試,否則不符合一致性。對函數(shù)向量進行歸一化后,將生成權(quán)重向量為α、β、γ的取值。

    根據(jù)組建的多特征融合權(quán)重,可以得出富含信息的特征,其中包含大量的文本信息。在多特征融合的詞移距離算法中,使用內(nèi)置多特征權(quán)重之間轉(zhuǎn)移詞的代價計算來代替算法中對兩個文本中兩個詞轉(zhuǎn)移代價的計算。假定ki和kj分別為兩篇數(shù)據(jù)文本囊括的關(guān)鍵詞。計算轉(zhuǎn)移代價

    (10)

    構(gòu)建轉(zhuǎn)移矩陣Tki,kj以保證文本D中所有關(guān)鍵詞ki完全轉(zhuǎn)移到文本D′中,結(jié)合原始算法的矩陣定義,需要添加以下約束

    ∑kjTki,kj=MFWki|D

    (11)

    ∑kiTki,kj=MFWkj|D′

    (12)

    式(11)定義的約束指定從關(guān)鍵項ki轉(zhuǎn)移的總成本必須等于關(guān)鍵特征的權(quán)重系數(shù),式(12)定義的約束規(guī)定轉(zhuǎn)移到關(guān)鍵項kj的總成本必須等于此特征項的組合權(quán)重因子。因此計算文本轉(zhuǎn)移的總代價公式如下

    (13)

    本小節(jié)提出的距離優(yōu)化目標,就是使上述總代價Ic最小。因此文檔D與文本D′之間的歐氏距離如式(14)所示

    (14)

    為了確保最終相似度計算結(jié)果加權(quán)過程不受其它因素干擾,此處本文將計算出來的相似度進行處理,使結(jié)果位于0~1范圍內(nèi)。經(jīng)過運算,我們可以得到文檔之間的相似度如式(15)所示

    (15)

    2.2 分層池化IIG-SIF句向量的相似度計算

    (1)改進信息增益計算方法

    對于平滑逆頻句向量模型只考慮通用數(shù)據(jù)集上的詞頻信息來計算詞權(quán)重,為了使特征詞能夠在更大程度上影響計算任務(wù),必須要綜合性的考慮增強各種因素,其中包括考慮特征詞對不同文本的影響。所以此處添加了類內(nèi)詞頻因子β和類內(nèi)、類間判別因子δ。將兩個影響因子看作新的元素進行數(shù)據(jù)篩選,計算公式如下所示

    IIG(T)=IG(T)×β×δ

    (16)

    此處假設(shè)語料中各類型文本集合為Ci,i∈[2,n]。β表示語料集合中某特征詞在集合中出現(xiàn)次數(shù)與語料當(dāng)中詞總量的比值,這樣能夠更大程度客觀表述特征詞和類別之間的相關(guān)性。類別Ci中單詞w的類內(nèi)詞頻公式如下

    (17)

    其中,m表示集合中詞總量,Nij表示某特征詞匯在集合中出現(xiàn)次數(shù)。類內(nèi)詞頻因子越大,說明特征詞匯與本類的相關(guān)程度越高,此詞語對于這個集合的語料更具有代表性。

    δ刻畫的是對于不同的語料集合進行篩選。如果一個詞只在一個類別中頻繁出現(xiàn),而在其它類別中不太可能出現(xiàn),則說明該詞在類別之間具有較高的區(qū)分度和較高的屬性對比度。此處區(qū)分度計算如下

    (18)

    (19)

    簡言之,類別之間的分離程度越大,類別內(nèi)部的劃分程度越小,文本的區(qū)分程度就越大,特征詞w對類別Ci的貢獻就越大,并且能夠更好地表示類別中包含的信息。特征詞區(qū)分度定義如下

    (20)

    (2)基于特征貢獻度因子的選詞方法

    原SIF模型具有領(lǐng)域自適應(yīng)的優(yōu)勢,在不同語料庫中使用仍然能保證優(yōu)秀的性能,但當(dāng)具體到各語料庫中的集合時,不同詞對任務(wù)的貢獻不同及其權(quán)重的問題不考慮修正。此處在第一小節(jié)的基礎(chǔ)上,增加針對文本任務(wù)的特征貢獻度因子,其表示如式(21)所示

    TCF(w)=IIG(T)Weight(w)

    (21)

    其中,Weight(w) 表示原模型中對特征詞的設(shè)定。

    生成句向量需要根據(jù)數(shù)據(jù)集中不同類別特征詞的分布,采用改進的信息增益特征選擇方法提取出任務(wù)貢獻因子。需要將任務(wù)貢獻度低的數(shù)據(jù)項剔除,需要將任務(wù)貢獻度低的數(shù)據(jù)項剔除后再展開計算,這是實現(xiàn)運算結(jié)果準確性的基礎(chǔ)。模型算法過程如下算法1。首先對各個特征詞的出現(xiàn)頻率進行了求解,其次對增益算法進一步升級增強后,對任務(wù)貢獻因子求解,隨后根據(jù)任務(wù)貢獻度因子值大小進行降序排序,修正特征詞表,最終將詞向量加權(quán)平均得到句向量。

    算法1: 分層池化的IIG-SIF句向量模型

    輸入: 詞向量集合vw; 句子集合S; 語料庫p(w); 分類訓(xùn)練集Ci

    輸出: 句向量集合vs

    (1)forallsentencesinSdo

    (3)endfor

    (4) Create matrix X whose columns arevs

    (5) Create first singular vectoruby X

    (6) Create word order vectordby X

    (7)forallsentencesinSdo

    (8)vs←vs-uuTvs

    (9)vs.append(d)

    (10)endfor

    分層池化的IIG-SIF計算相似度過程如下:

    (1)數(shù)據(jù)預(yù)處理。將標準化、去停篩選后的文本數(shù)據(jù)集合定義為S′1、S′2。

    (2)句向量生成。采用改進的特征貢獻度因子生成模型句向量Sv1和Sv2。

    (3)相似度計算。利用向量Sv1和Sv2之間的余弦距離計算文本之間的相似度,即

    (22)

    3 實驗設(shè)計與分析

    3.1 實驗環(huán)境及數(shù)據(jù)

    具體實驗環(huán)境見表4。

    表4 實驗環(huán)境

    為了凸顯本文方法的有效性,實驗在數(shù)據(jù)集選取時引入中文和英文的句子對、短文本集合等4種數(shù)據(jù)集,以驗證在不同語言、不同粒度下的實際表現(xiàn)情況。具體的數(shù)據(jù)體現(xiàn)見表5。

    表5 Quora數(shù)據(jù)集示例

    數(shù)據(jù)集Ⅰ如表5所示,其源自Quora數(shù)據(jù)集。其中囊括了39萬余英文句子,由Question1、Question2及Is_duplicate 這3部分組成,在此數(shù)據(jù)集中語義標注為人工標注,若語境結(jié)果表述的含義相同或相似則Is_duplicate置為1,反之為0。

    數(shù)據(jù)集Ⅱ選擇了20余類英文的熱點話題,其中包括財經(jīng)、歷史、體育、科技等。將話題文本總量較少的文本類型剔除后,剩余6組共計3000條數(shù)據(jù)以供使用,其中3組文本類別相似,其余3組不相似以供對比。

    數(shù)據(jù)集Ⅲ選擇STS中文文本語義相似度語料庫,見表6。數(shù)據(jù)集的評分區(qū)間為[0,5],即0為語義相反或毫不相關(guān),5為相似度極高。該數(shù)據(jù)集分為兩組數(shù)據(jù),其中包含27 490個句子對,其各個相似度評分的數(shù)據(jù)量分布不均,大部分為相似度極高數(shù)據(jù)集,因此,需要篩選數(shù)據(jù),最終本文剩余8000個句子對展開實驗分析,盡量保證各個相似度評分下的數(shù)據(jù)量大小一致。

    表6 ChineseSTS數(shù)據(jù)集示例

    數(shù)據(jù)集Ⅳ選取自復(fù)旦大學(xué)的中文文本分類數(shù)據(jù)集。下載的原始數(shù)據(jù)編碼格式是gb18030,因此需要將數(shù)據(jù)格式轉(zhuǎn)為utf-8編碼格式后使用。train.zip訓(xùn)練集共9804篇文檔,test.zip測試集共9832篇文檔,都分為20個類別。其中無用數(shù)據(jù)需篩選,部分類別的文檔數(shù)量較少,無法使用。本文選擇計算機、環(huán)境等7類數(shù)據(jù)量充足的數(shù)據(jù)以供使用。

    3.2 實驗設(shè)計

    在實驗過程中首先做預(yù)處理,對數(shù)據(jù)進行刪除和過濾等處理。與此同時,本文使用了相同的區(qū)間值,即[0,1],在對相關(guān)數(shù)據(jù)進行觀察和研究之后,對評分較低的語句進行了二次標注,即統(tǒng)一標上1,而評分結(jié)果為2或0時置為0。

    接下來,本文使用jieba工具包對采集到的數(shù)據(jù)進行分詞,并對特征詞的TF-IDF系數(shù)予以求解,然后對所有詞匯按照其不同特征值進行細分,最終歸結(jié)為4類,并分別進行標注。而在此之前,要先對短文本數(shù)據(jù)進行篩選,并對其中不同詞語的位置予以定位,進而得出不同詞性的權(quán)重。另外,對于句子對比而言,應(yīng)將初始權(quán)重均勻設(shè)置為1。這種做法,一方面能夠降低文本長度對結(jié)算結(jié)果造成的影響,另一方面也能夠最大限度提升計算過程的便利性。至此將數(shù)據(jù)代入式(6)計算出融合后的權(quán)重系數(shù)大小。

    第三步結(jié)合現(xiàn)有資料,利用已有流行庫來對Word2Vec詞向量進行數(shù)據(jù)集訓(xùn)練。其中選用模型Skip-gram模型(sg=1)。設(shè)定其基本參數(shù),結(jié)合實際情況將窗口大小設(shè)為5,向量維度300,初始默認學(xué)習(xí)率設(shè)置為0.001。并且使用一些初始化后隨機的向量來表示不在語料庫中的詞語。

    最后進行分層池化相關(guān)操作。先對各個特征詞的出現(xiàn)頻率進行了求解,再將增益算法增強后對任務(wù)貢獻因子求解。模型依然按照原始模型當(dāng)中參數(shù)進行設(shè)置。模型系數(shù)a設(shè)置為0.0001。

    3.3 實驗結(jié)果與分析

    (1)實驗1:選取特征詞最佳占比

    在實驗過程中,選擇使用多特征融合模式下適用的詞移距離算法時,在選取詞語這一過程中,不同選取比例會影響文本相似度計算的結(jié)果。選取的比例過小,就會導(dǎo)致模型可能會忽視一些文本信息,影響算法的計算結(jié)果;但如果選取的比例過大,而這些信息中包含了一些與模型不兼容的信息,模型涉及的冗余信息過多,這導(dǎo)致算法效果不佳、精準度無法得到保證。

    聚類被廣泛應(yīng)用在信息挖掘模型中,因為這種模式不僅不需要事先訓(xùn)練,同時還能夠免去標注、分類等復(fù)雜環(huán)節(jié)。所以在從此實驗過程中,本文重點采用了當(dāng)下聚類效果出眾的K-means、DBSCAN算法中來確定特征詞占比。鑒于數(shù)據(jù)集Ⅱ在聚類算法中也經(jīng)常使用,也得到了大部分研究者的認可。基于此,本文將在這一數(shù)據(jù)集的前提下,選擇歸一化互信息指標(normalized mutual information,NMI)來評測聚類結(jié)果好壞。當(dāng)NMI值越大,說明聚類的效果越好,即說明該算法包含的文本信息越多。在圖2中,不同比例特征項對聚類結(jié)果的差異十分明顯。

    圖2 文本特征詞對聚類的影響

    由圖2可知,如果選取60%的文本特征詞,聚類的效果是最好的。若是選取的比例小于60%,就會出現(xiàn)模型包含的文本信息量不足,造成算法的效果不理想,若是選取的比例大于60%,就會造成文本的冗余,削弱文本與文本之間的獨立性,造成算法的效果不準確。

    (2)實驗2:針對加權(quán)因子進行取值。

    該實驗的數(shù)據(jù)集選自數(shù)據(jù)集Ⅳ中的部分內(nèi)容,結(jié)果見表7。

    表7 不同x和y取值下的實驗結(jié)果

    由表7可知,通過增加多特征融合和詞移距離算法的權(quán)重,就能夠進一步提升召回率,因此這種做法能夠最大限度保證數(shù)據(jù)運算的準確性和文本特征的多元性。通過實驗結(jié)果可知,當(dāng)x選取0.6,y選取0.4的時候,召回率最高,最終本文確定x和y的取值分別為0.6和0.4。

    (3)實驗3:融合方法的對照實驗

    為了驗證本文算法的有效性,選擇了準確率、召回率和F1值作為評價指標,通過將本文算法(MuMoSim)與未融合多特征的詞移距離算法(MuSim)、基于分層池化IIG-SIF句向量算法(IIGSim)、傳統(tǒng)的詞移距離算法(WMDSim)和基于SIF句向量算法(SIFSim)進行對比來進行驗證。實驗結(jié)果見表8。

    表8 融合方法對照實驗結(jié)果數(shù)據(jù)

    由表8可以看出,在這4種數(shù)據(jù)集下,本文算法(MuMoSim)在3個評價指標上都獲得了比較高的數(shù)值,評價指標取得的值越高,說明算法的效果越好。這是因為本文算法能夠?qū)崿F(xiàn)詞義、語義等多種信息的有效采集和處理。而在這一前提下提出的多特征融合權(quán)重,結(jié)合數(shù)據(jù)特征能夠更為精準解釋詞語轉(zhuǎn)移距離。結(jié)合分層池化相關(guān)內(nèi)容,根據(jù)數(shù)據(jù)集中不同類別特征詞的分布,采用改進的信息增益特征選擇方法提出任務(wù)貢獻因子,計算出句向量大小。由于本文算法還提前設(shè)置了最佳的文本特征詞的占比,這從一定程度上提高了算法運行的效率。

    (4)實驗4:不同文本相似度算法的對比實驗。

    將本文算法與文獻[13,14]相關(guān)融合算法做對照實驗,以F1值為評價標準,實驗結(jié)果見表9。

    表9 4種數(shù)據(jù)集下3類相似度算法F1值/%

    由表9可知,文獻[13]的算法雖結(jié)合反義與否定兩種信息,但其語義詞典不完善,明顯在不同的數(shù)據(jù)集有不同的影響,在英文新聞數(shù)據(jù)處理方面效果起伏較大。文獻[14]的相似度計算算法雖然獲取了句子的詞形特征、詞序特征、句長特征,但在語義相似度處理方面存在不足,影響相似度結(jié)果。而本文在此次研究中,提出MuMoSim的算法,既考慮了最佳的文本特征占比,還設(shè)置了最佳權(quán)重,讓最終結(jié)論更為精準。由實驗結(jié)果可知,本文算法在4種數(shù)據(jù)集中在F1值下的表現(xiàn)都要優(yōu)于其它兩種方法,更具有競爭性。

    4 結(jié)束語

    首先,本文在傳統(tǒng)詞移距離算法的基礎(chǔ)上加入了特征融合機制,融合多特征來解決權(quán)重單一對詞移距離算法的影響。其次,引入分層池化IIG-SIF句向量模型,在一定程度上增強文本結(jié)構(gòu)信息和詞匯排序問題。最后,通過對前兩種方法進行加權(quán)融合,得到最終算方法。實驗結(jié)果表明,本文的算法與之前基線模型進行相比,在評價指標F1值上有了明顯的提升,得到了較好的文本相似度計算結(jié)果。

    在后續(xù)的研究過程中將繼續(xù)對本文的方法加以改進,例如引入外部知識來彌補中文數(shù)據(jù)庫效果差的弊端,增強中文的語義信息,提高文本相似度的計算結(jié)果。

    猜你喜歡
    特征詞語義權(quán)重
    權(quán)重常思“浮名輕”
    語言與語義
    基于改進TFIDF算法的郵件分類技術(shù)
    為黨督政勤履職 代民行權(quán)重擔(dān)當(dāng)
    產(chǎn)品評論文本中特征詞提取及其關(guān)聯(lián)模型構(gòu)建與應(yīng)用
    基于公約式權(quán)重的截短線性分組碼盲識別方法
    “上”與“下”語義的不對稱性及其認知闡釋
    面向文本分類的特征詞選取方法研究與改進
    認知范疇模糊與語義模糊
    層次分析法權(quán)重的計算:基于Lingo的數(shù)學(xué)模型
    河南科技(2014年15期)2014-02-27 14:12:51
    午夜久久久久精精品| 久久久国产欧美日韩av| 真人做人爱边吃奶动态| 中出人妻视频一区二区| 一边摸一边抽搐一进一小说| or卡值多少钱| 国产成人系列免费观看| 夜夜看夜夜爽夜夜摸| 搞女人的毛片| 别揉我奶头~嗯~啊~动态视频| 九色成人免费人妻av| 人人妻人人澡欧美一区二区| 亚洲国产精品合色在线| 国产在线精品亚洲第一网站| 18禁黄网站禁片午夜丰满| 大型av网站在线播放| 88av欧美| 精华霜和精华液先用哪个| 村上凉子中文字幕在线| 国产精品综合久久久久久久免费| 中文在线观看免费www的网站 | 97超级碰碰碰精品色视频在线观看| 一个人免费在线观看的高清视频| 免费高清视频大片| 琪琪午夜伦伦电影理论片6080| 琪琪午夜伦伦电影理论片6080| 神马国产精品三级电影在线观看 | 国产精品爽爽va在线观看网站| 哪里可以看免费的av片| 日韩三级视频一区二区三区| 神马国产精品三级电影在线观看 | 成人国产一区最新在线观看| 成人18禁高潮啪啪吃奶动态图| 日韩有码中文字幕| 国产成人影院久久av| 黄频高清免费视频| 国产亚洲av高清不卡| 精品久久久久久久久久久久久| 国产av一区在线观看免费| 99国产精品一区二区蜜桃av| 极品教师在线免费播放| 久久中文字幕人妻熟女| 午夜亚洲福利在线播放| 欧美日韩中文字幕国产精品一区二区三区| 成人av一区二区三区在线看| 国产乱人伦免费视频| 99热这里只有精品一区 | 中文字幕人成人乱码亚洲影| av中文乱码字幕在线| 夜夜躁狠狠躁天天躁| 精品久久久久久久毛片微露脸| 久久精品国产清高在天天线| 国产精品久久久久久精品电影| 亚洲激情在线av| 亚洲最大成人中文| 亚洲第一欧美日韩一区二区三区| 午夜福利视频1000在线观看| 91av网站免费观看| 中文字幕人妻丝袜一区二区| www日本黄色视频网| 男人舔奶头视频| 午夜激情av网站| 婷婷精品国产亚洲av| 99国产精品99久久久久| x7x7x7水蜜桃| 又大又爽又粗| 露出奶头的视频| 中文字幕人成人乱码亚洲影| 成人av一区二区三区在线看| 曰老女人黄片| 国产探花在线观看一区二区| 色综合欧美亚洲国产小说| av福利片在线| 久久天躁狠狠躁夜夜2o2o| 床上黄色一级片| 婷婷六月久久综合丁香| 一进一出抽搐gif免费好疼| 成年版毛片免费区| 9191精品国产免费久久| 久久热在线av| 国产97色在线日韩免费| 一本一本综合久久| 亚洲片人在线观看| 韩国av一区二区三区四区| 蜜桃久久精品国产亚洲av| 最近最新免费中文字幕在线| 91av网站免费观看| 亚洲激情在线av| 精品电影一区二区在线| 国产精品99久久99久久久不卡| 日日夜夜操网爽| 啦啦啦观看免费观看视频高清| 中文资源天堂在线| 欧美中文日本在线观看视频| tocl精华| 欧美色欧美亚洲另类二区| 特大巨黑吊av在线直播| 成人18禁高潮啪啪吃奶动态图| 一级毛片高清免费大全| 国产亚洲精品综合一区在线观看 | 两个人看的免费小视频| 夜夜爽天天搞| 日韩欧美三级三区| 天堂√8在线中文| 久久精品国产亚洲av香蕉五月| 无遮挡黄片免费观看| 精品电影一区二区在线| 国产精品 欧美亚洲| 老司机午夜十八禁免费视频| 亚洲欧美日韩高清专用| 亚洲精品久久国产高清桃花| a级毛片在线看网站| 在线观看午夜福利视频| a级毛片在线看网站| 在线观看免费午夜福利视频| 亚洲五月婷婷丁香| 久久精品成人免费网站| 在线观看日韩欧美| 亚洲五月婷婷丁香| 18禁裸乳无遮挡免费网站照片| 亚洲狠狠婷婷综合久久图片| 国产精品日韩av在线免费观看| 日韩欧美免费精品| 丰满人妻一区二区三区视频av | 久久精品国产清高在天天线| 一a级毛片在线观看| 国产私拍福利视频在线观看| 身体一侧抽搐| 婷婷亚洲欧美| 国产探花在线观看一区二区| svipshipincom国产片| 法律面前人人平等表现在哪些方面| 成人亚洲精品av一区二区| 精品欧美一区二区三区在线| 99热6这里只有精品| 亚洲五月天丁香| 国产成人影院久久av| 亚洲九九香蕉| 国产黄a三级三级三级人| 国产成年人精品一区二区| 在线观看一区二区三区| 国产精品久久久av美女十八| 人人妻人人澡欧美一区二区| 伊人久久大香线蕉亚洲五| 亚洲真实伦在线观看| 国产亚洲精品久久久久久毛片| 又紧又爽又黄一区二区| 一进一出抽搐gif免费好疼| 在线视频色国产色| 老熟妇仑乱视频hdxx| 精品不卡国产一区二区三区| 搞女人的毛片| 国产视频一区二区在线看| 亚洲专区中文字幕在线| 国产精品久久久av美女十八| 色噜噜av男人的天堂激情| 国产又色又爽无遮挡免费看| 亚洲美女视频黄频| 90打野战视频偷拍视频| 十八禁人妻一区二区| 少妇的丰满在线观看| 蜜桃久久精品国产亚洲av| 午夜激情福利司机影院| 老鸭窝网址在线观看| 日本a在线网址| 叶爱在线成人免费视频播放| 欧美成人一区二区免费高清观看 | 亚洲18禁久久av| 午夜福利在线在线| 免费看a级黄色片| 啦啦啦免费观看视频1| 亚洲精品久久成人aⅴ小说| 久久中文看片网| 精品国产乱码久久久久久男人| 大型av网站在线播放| 性色av乱码一区二区三区2| 国产精品爽爽va在线观看网站| or卡值多少钱| 国产私拍福利视频在线观看| 国产精品久久久久久精品电影| 老司机靠b影院| 在线视频色国产色| 久久人妻福利社区极品人妻图片| 亚洲欧美日韩高清专用| 午夜福利成人在线免费观看| 99精品在免费线老司机午夜| 国产麻豆成人av免费视频| 在线看三级毛片| 久久久久国内视频| 麻豆av在线久日| 别揉我奶头~嗯~啊~动态视频| 校园春色视频在线观看| 中文字幕av在线有码专区| 不卡av一区二区三区| 国产探花在线观看一区二区| 一级毛片女人18水好多| 天堂av国产一区二区熟女人妻 | 老司机在亚洲福利影院| 一区二区三区激情视频| avwww免费| 在线永久观看黄色视频| 99久久精品热视频| 在线免费观看的www视频| 久久天躁狠狠躁夜夜2o2o| 亚洲欧美精品综合久久99| 国产在线精品亚洲第一网站| 最近最新中文字幕大全电影3| 一本精品99久久精品77| 怎么达到女性高潮| 亚洲av中文字字幕乱码综合| 欧美乱码精品一区二区三区| 国产成+人综合+亚洲专区| 搡老熟女国产l中国老女人| 亚洲va日本ⅴa欧美va伊人久久| 亚洲va日本ⅴa欧美va伊人久久| 老熟妇乱子伦视频在线观看| 国产黄片美女视频| 国产精品亚洲一级av第二区| 精品国产超薄肉色丝袜足j| 久久久久久九九精品二区国产 | 69av精品久久久久久| 欧美乱妇无乱码| 两性夫妻黄色片| 日韩有码中文字幕| 亚洲第一欧美日韩一区二区三区| 精品久久久久久久人妻蜜臀av| 国产亚洲av高清不卡| 在线观看免费视频日本深夜| 日韩免费av在线播放| 搡老岳熟女国产| 国产欧美日韩一区二区三| 18禁美女被吸乳视频| 美女 人体艺术 gogo| 男女那种视频在线观看| 国产在线精品亚洲第一网站| 中文资源天堂在线| 国产精品久久久久久久电影 | 成年人黄色毛片网站| 麻豆av在线久日| 黄频高清免费视频| 我要搜黄色片| 夜夜爽天天搞| 欧美中文日本在线观看视频| 精品久久久久久久人妻蜜臀av| 国产一级毛片七仙女欲春2| 国产真人三级小视频在线观看| 亚洲精品在线美女| 亚洲精品在线观看二区| 无遮挡黄片免费观看| 成在线人永久免费视频| 一个人免费在线观看的高清视频| 国产真实乱freesex| 观看免费一级毛片| 两个人的视频大全免费| 国产成年人精品一区二区| 日韩高清综合在线| svipshipincom国产片| 精品高清国产在线一区| 亚洲成av人片在线播放无| 国语自产精品视频在线第100页| 亚洲真实伦在线观看| 黄片小视频在线播放| 欧美日韩亚洲综合一区二区三区_| 国产成人aa在线观看| 高潮久久久久久久久久久不卡| 亚洲电影在线观看av| 免费电影在线观看免费观看| 两性夫妻黄色片| 中文字幕最新亚洲高清| 日本一区二区免费在线视频| 国产高清有码在线观看视频 | 99热6这里只有精品| 日韩欧美国产在线观看| 欧美精品亚洲一区二区| 日韩欧美国产一区二区入口| 久久久水蜜桃国产精品网| av在线天堂中文字幕| 男人的好看免费观看在线视频 | 在线观看免费视频日本深夜| 男女午夜视频在线观看| 国产成年人精品一区二区| 69av精品久久久久久| 非洲黑人性xxxx精品又粗又长| 蜜桃久久精品国产亚洲av| 成人一区二区视频在线观看| 岛国在线观看网站| 亚洲专区中文字幕在线| 国产主播在线观看一区二区| 波多野结衣高清作品| 国产成人精品无人区| 一进一出抽搐动态| 黄色丝袜av网址大全| 91在线观看av| 国产视频一区二区在线看| 亚洲专区中文字幕在线| 国产精品久久久久久精品电影| 天天添夜夜摸| 青草久久国产| 91麻豆av在线| 窝窝影院91人妻| 老司机在亚洲福利影院| 午夜福利在线在线| 免费电影在线观看免费观看| 久久人妻福利社区极品人妻图片| 国产av又大| 国产精品 欧美亚洲| 女人爽到高潮嗷嗷叫在线视频| 午夜两性在线视频| 色综合亚洲欧美另类图片| 18禁裸乳无遮挡免费网站照片| 免费看日本二区| 国产片内射在线| 日日夜夜操网爽| 三级男女做爰猛烈吃奶摸视频| 亚洲成人精品中文字幕电影| 在线观看美女被高潮喷水网站 | 久久久久久免费高清国产稀缺| 国产真人三级小视频在线观看| 久久精品综合一区二区三区| 免费在线观看成人毛片| 9191精品国产免费久久| 中文字幕人成人乱码亚洲影| a级毛片在线看网站| 最新在线观看一区二区三区| 精品午夜福利视频在线观看一区| 亚洲 欧美一区二区三区| 老汉色∧v一级毛片| 亚洲国产欧洲综合997久久,| 日韩有码中文字幕| 国产99久久九九免费精品| 熟妇人妻久久中文字幕3abv| 老司机在亚洲福利影院| 97碰自拍视频| 99久久精品热视频| 国产成人精品久久二区二区91| 高清在线国产一区| 日本黄大片高清| 国产一区二区激情短视频| 日本撒尿小便嘘嘘汇集6| 黄色毛片三级朝国网站| 9191精品国产免费久久| 18禁观看日本| 亚洲精品粉嫩美女一区| 久久久国产成人免费| 久久久久久久久免费视频了| 日本熟妇午夜| 久久99热这里只有精品18| 成年人黄色毛片网站| 看片在线看免费视频| 最好的美女福利视频网| 一个人免费在线观看的高清视频| 国产精品久久视频播放| 亚洲国产中文字幕在线视频| 午夜两性在线视频| 一区福利在线观看| 国产伦人伦偷精品视频| 久久这里只有精品19| 亚洲国产精品合色在线| 他把我摸到了高潮在线观看| 国产亚洲av嫩草精品影院| 国产激情偷乱视频一区二区| 午夜两性在线视频| 亚洲男人天堂网一区| 亚洲欧美日韩高清专用| 成年女人毛片免费观看观看9| 国产又黄又爽又无遮挡在线| 亚洲精品在线美女| 久久精品综合一区二区三区| 免费看日本二区| 成人特级黄色片久久久久久久| or卡值多少钱| 色av中文字幕| 亚洲午夜精品一区,二区,三区| 久久久久久九九精品二区国产 | 嫁个100分男人电影在线观看| 国产片内射在线| 小说图片视频综合网站| 午夜免费观看网址| 两性夫妻黄色片| 精品国内亚洲2022精品成人| 我的老师免费观看完整版| 19禁男女啪啪无遮挡网站| 真人一进一出gif抽搐免费| 91大片在线观看| 欧美又色又爽又黄视频| 18美女黄网站色大片免费观看| 国产激情欧美一区二区| 丰满的人妻完整版| 国产精品亚洲av一区麻豆| 熟女电影av网| 丝袜美腿诱惑在线| 久久久久久亚洲精品国产蜜桃av| 国产激情欧美一区二区| 亚洲精品在线美女| 免费高清视频大片| 可以在线观看的亚洲视频| 99国产精品99久久久久| 国产精品久久久久久亚洲av鲁大| 亚洲人成77777在线视频| 三级毛片av免费| 亚洲午夜理论影院| 亚洲美女黄片视频| 欧美性猛交╳xxx乱大交人| 亚洲一区高清亚洲精品| 超碰成人久久| 身体一侧抽搐| 黄色女人牲交| 久久性视频一级片| 欧美久久黑人一区二区| 国产精品免费视频内射| 久久久久久人人人人人| 亚洲熟妇熟女久久| 欧美zozozo另类| 免费在线观看成人毛片| 久久精品亚洲精品国产色婷小说| 91字幕亚洲| 九色成人免费人妻av| 国产成人aa在线观看| 757午夜福利合集在线观看| 国语自产精品视频在线第100页| 美女高潮喷水抽搐中文字幕| 亚洲成a人片在线一区二区| 亚洲中文字幕日韩| 免费看美女性在线毛片视频| 国内久久婷婷六月综合欲色啪| 一级黄色大片毛片| 久久精品aⅴ一区二区三区四区| 91国产中文字幕| 日本三级黄在线观看| 好男人电影高清在线观看| 人成视频在线观看免费观看| 50天的宝宝边吃奶边哭怎么回事| 午夜福利18| 毛片女人毛片| 色尼玛亚洲综合影院| 精品国产亚洲在线| 亚洲无线在线观看| 天天躁狠狠躁夜夜躁狠狠躁| 好看av亚洲va欧美ⅴa在| 免费在线观看完整版高清| 免费看日本二区| 午夜视频精品福利| 欧美黑人巨大hd| 欧美日本视频| 亚洲精品色激情综合| 色av中文字幕| 日本五十路高清| 亚洲成av人片免费观看| 国产免费男女视频| 深夜精品福利| 国产区一区二久久| 亚洲熟女毛片儿| 嫩草影院精品99| 久久久久精品国产欧美久久久| 久久欧美精品欧美久久欧美| 亚洲五月天丁香| 亚洲av成人一区二区三| 在线免费观看的www视频| 亚洲第一欧美日韩一区二区三区| 亚洲成人久久性| 一个人观看的视频www高清免费观看 | 国产成人精品久久二区二区免费| 亚洲美女视频黄频| 亚洲人与动物交配视频| 一边摸一边做爽爽视频免费| 免费看美女性在线毛片视频| 人妻丰满熟妇av一区二区三区| 国产野战对白在线观看| 最近最新免费中文字幕在线| 99国产精品99久久久久| 国产精品,欧美在线| 校园春色视频在线观看| 婷婷精品国产亚洲av在线| 好男人在线观看高清免费视频| 三级男女做爰猛烈吃奶摸视频| 51午夜福利影视在线观看| 亚洲av成人一区二区三| 久久久久久久午夜电影| 脱女人内裤的视频| 国产精品,欧美在线| 法律面前人人平等表现在哪些方面| 人妻夜夜爽99麻豆av| 男女视频在线观看网站免费 | 人人妻人人澡欧美一区二区| 高清毛片免费观看视频网站| 99国产精品一区二区三区| 麻豆国产97在线/欧美 | 757午夜福利合集在线观看| 在线观看美女被高潮喷水网站 | 香蕉丝袜av| 精品久久久久久久久久免费视频| 天天躁狠狠躁夜夜躁狠狠躁| 午夜精品在线福利| www日本在线高清视频| 黄色视频不卡| 日本在线视频免费播放| 久久欧美精品欧美久久欧美| 色精品久久人妻99蜜桃| 99久久99久久久精品蜜桃| 日本精品一区二区三区蜜桃| 亚洲avbb在线观看| 无遮挡黄片免费观看| 国产av又大| 色老头精品视频在线观看| 麻豆国产97在线/欧美 | 亚洲av中文字字幕乱码综合| 国内揄拍国产精品人妻在线| 欧美日韩福利视频一区二区| 亚洲欧美精品综合一区二区三区| 成在线人永久免费视频| 91老司机精品| 少妇被粗大的猛进出69影院| 婷婷丁香在线五月| 亚洲精品在线观看二区| 久9热在线精品视频| 不卡一级毛片| 日韩大码丰满熟妇| 亚洲专区字幕在线| 十八禁网站免费在线| 亚洲国产中文字幕在线视频| 此物有八面人人有两片| 国产av又大| 国产亚洲精品久久久久久毛片| 亚洲av熟女| www日本在线高清视频| 日韩欧美免费精品| 91在线观看av| 久久中文字幕一级| 亚洲午夜理论影院| 嫩草影院精品99| 亚洲成av人片在线播放无| 天天添夜夜摸| 亚洲国产欧美网| 麻豆国产97在线/欧美 | 91九色精品人成在线观看| videosex国产| 国产1区2区3区精品| 日本精品一区二区三区蜜桃| www.熟女人妻精品国产| 国产精品香港三级国产av潘金莲| 狂野欧美激情性xxxx| 国产av在哪里看| 精品熟女少妇八av免费久了| 全区人妻精品视频| 夜夜爽天天搞| 国产免费男女视频| 欧美日韩中文字幕国产精品一区二区三区| 午夜成年电影在线免费观看| 国产亚洲精品第一综合不卡| 久久这里只有精品19| 成人国产一区最新在线观看| 日本一区二区免费在线视频| 神马国产精品三级电影在线观看 | 夜夜看夜夜爽夜夜摸| 18禁裸乳无遮挡免费网站照片| 久热爱精品视频在线9| 日韩av在线大香蕉| 少妇熟女aⅴ在线视频| 丝袜美腿诱惑在线| 午夜a级毛片| 成熟少妇高潮喷水视频| 国产成人系列免费观看| 亚洲免费av在线视频| 精品电影一区二区在线| 一进一出抽搐动态| 午夜福利高清视频| 给我免费播放毛片高清在线观看| 中文亚洲av片在线观看爽| 久久久久国内视频| 日本成人三级电影网站| 国模一区二区三区四区视频 | 国内精品一区二区在线观看| 我要搜黄色片| 国产伦一二天堂av在线观看| 露出奶头的视频| 韩国av一区二区三区四区| 香蕉丝袜av| 搞女人的毛片| 两个人视频免费观看高清| 欧美乱色亚洲激情| 听说在线观看完整版免费高清| 9191精品国产免费久久| 欧美日韩乱码在线| 老司机深夜福利视频在线观看| 亚洲欧美一区二区三区黑人| 两性午夜刺激爽爽歪歪视频在线观看 | 人成视频在线观看免费观看| 免费无遮挡裸体视频| 亚洲国产欧美一区二区综合| 国产精品免费视频内射| 1024视频免费在线观看| 欧美精品亚洲一区二区| 日韩av在线大香蕉| 亚洲午夜精品一区,二区,三区| 69av精品久久久久久| 亚洲va日本ⅴa欧美va伊人久久| 丝袜美腿诱惑在线| 亚洲最大成人中文| 亚洲国产欧美一区二区综合| 变态另类成人亚洲欧美熟女| 亚洲五月婷婷丁香| 每晚都被弄得嗷嗷叫到高潮| av福利片在线| 神马国产精品三级电影在线观看 | 全区人妻精品视频| 日韩高清综合在线| 亚洲熟女毛片儿| 在线观看免费日韩欧美大片| 在线永久观看黄色视频| 深夜精品福利| 亚洲在线自拍视频| 麻豆国产97在线/欧美 | 一区二区三区国产精品乱码| 久久久国产精品麻豆| 亚洲成av人片在线播放无|