• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    一種實(shí)體描述短文本相似度計(jì)算方法

    2015-04-29 00:39:04秦添軼林蟬宋博宇關(guān)毅
    關(guān)鍵詞:知網(wǎng)文本分類

    秦添軼 林蟬 宋博宇 關(guān)毅

    摘 要:中文實(shí)體描述短文本具有詞語(yǔ)稀疏、語(yǔ)義離散、用詞等特點(diǎn)。本文分析《知網(wǎng)》義原網(wǎng)絡(luò)和詞語(yǔ)相似度的關(guān)系,提出了短文本間語(yǔ)義相似度部分和短文本分類部分相結(jié)合的實(shí)體描述短文本間相似度計(jì)算方法。語(yǔ)義相似度部分分析《知網(wǎng)》義原網(wǎng)絡(luò)和詞語(yǔ)間相似度的關(guān)系,在計(jì)算詞語(yǔ)間相似度和短文本間相似度的過(guò)程中弱化了淺層《知網(wǎng)》義原影響并均衡了義原權(quán)重,使義原相似度計(jì)算結(jié)果更加合理。短文本分類部分將短文本分解為義原向量,根據(jù)特定領(lǐng)域短文本的義原分布情況進(jìn)行短文本分類。兩部分結(jié)合得到實(shí)體描述短文本間相似度。本文方法的有效性在百度知識(shí)圖譜數(shù)據(jù)分析競(jìng)賽任務(wù)1的測(cè)試結(jié)果中得到了證明。

    關(guān)鍵詞:實(shí)體描述短文本;文本分類;文本相似度;《知網(wǎng)》

    中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2095-2163(2015-)02-

    A Short Text Description Similarity Computation Method for Chinese Entities

    QIN Tian-yi1, LIN Chan2, SONG Bo-yu2, GUAN Yi1

    (1. School of Computer Science and Technology Harbin Institute of Technology, Harbin, Heilongjiang, 150001, China ;

    2. School of Software Harbin Institute of Technology, Harbin, Heilongjiang, 150001, China ; )

    Abstract: Short text description for Chinese entities has features of statistical sparsity, semantic discretization and irregular vocabulary. This research analyses the relationship between sememe network and word similarity in Hownet and presents a short text description similarity computation method that is consist of semantic similarity part and short text classification part. In the semantic similarity part, the method weakens the influence of Hownets shallow sememes and balances weights of sememes. In the short text classification part, the method transforms short texts into sememe vectors and classifies them according to the distribution of sememes in certain fields.Take average results of those two parts to generate short text description similarity. Effectiveness of the method is proved by task 1 of Baidu knowledge map analyzing competition.

    Keywords: Short text description for Chinese entities;Text categorization;Text similarity;Hownet

    0引言

    中文實(shí)體是中文文本中名詞性詞匯或短語(yǔ)的統(tǒng)稱,本文處理的中文實(shí)體,包括電影、電視劇、電視節(jié)目、軟件應(yīng)用、電子游戲和歌曲的名稱,在互聯(lián)網(wǎng)上常用短文本描述。一般認(rèn)為,短文本是長(zhǎng)度不超過(guò)200個(gè)字符的文本[1],具有詞語(yǔ)稀疏、語(yǔ)義離散和用詞隨意等特點(diǎn)[2]。實(shí)體的定義通常由實(shí)體描述短文本給出,實(shí)體描述短文本間的相似度即是對(duì)應(yīng)的實(shí)體間相似度。短文本間相似度計(jì)算是近年來(lái)自然語(yǔ)言處理的研究熱點(diǎn)之一,被廣泛應(yīng)用于信息檢索、反作弊系統(tǒng)、智能問(wèn)答系統(tǒng)、智能推薦系統(tǒng)、文本自動(dòng)分類、機(jī)器翻譯中。

    文本間相似度計(jì)算方法大多通過(guò)統(tǒng)計(jì)分詞后文本的詞頻信息,將文本建模為向量,利用向量間余弦相似度、Jaccard相似度等方法計(jì)算文本相似度。文本間相似度也可以通過(guò)文本分類來(lái)近似。文本間相似度計(jì)算方法通常只考慮文本中單個(gè)詞語(yǔ)的統(tǒng)計(jì)特性而沒(méi)有考慮文本整體的語(yǔ)義特性,并在處理短文本時(shí)會(huì)生成稀疏的高維向量,容易出現(xiàn)語(yǔ)義漂移問(wèn)題。

    本文利用《知網(wǎng)》的語(yǔ)義知識(shí)資源和概念網(wǎng)絡(luò),針對(duì)短文本特點(diǎn),提出了短文本間語(yǔ)義相似度部分和短文本分類部分相結(jié)合的實(shí)體描述短文本間相似度計(jì)算方法。

    1相關(guān)工作

    1.1 《知網(wǎng)》

    《知網(wǎng)》是一個(gè)以漢語(yǔ)和英語(yǔ)的詞語(yǔ)所代表的概念為描述對(duì)象,以揭示概念與概念之間以及概念所具有的屬性之間的關(guān)系為基本內(nèi)容的常識(shí)知識(shí)庫(kù)[3]。詞語(yǔ)的語(yǔ)義在《知網(wǎng)》中通過(guò)一個(gè)或多個(gè)概念來(lái)描述,而每一個(gè)概念由義原來(lái)描述。義原是《知網(wǎng)》中最小的、不可再分割的語(yǔ)義單位,《知網(wǎng)》作者用1 600多個(gè)義原對(duì)8萬(wàn)多個(gè)中文詞匯進(jìn)行描述,義原的上下位關(guān)系為所有義原建立起一個(gè)包含多個(gè)子樹(shù)的多層義原網(wǎng)絡(luò)[4]。

    1.2 基于《知網(wǎng)》的文本間語(yǔ)義相似度計(jì)算

    義原間相似度的計(jì)算方法可以分為兩類:基于節(jié)點(diǎn)之間路徑長(zhǎng)度的方法和基于節(jié)點(diǎn)之間共有信息大小的方法[5]。基于節(jié)點(diǎn)之間路徑長(zhǎng)度的方法需要計(jì)算兩個(gè)節(jié)點(diǎn)在義原網(wǎng)絡(luò)上的最短距離,基于節(jié)點(diǎn)之間共有信息大小的方法需要計(jì)算兩個(gè)節(jié)點(diǎn)最近的共同祖先節(jié)點(diǎn)含有的子節(jié)點(diǎn)個(gè)數(shù)。許多學(xué)者已經(jīng)在義原間相似度的問(wèn)題上做了大量的研究,如劉群[4]、李峰[5]、吳健[6]、Dekang Lin[7]、Resnik[8]、江敏[9]等。詞語(yǔ)間相似度可由義原間相似度合成。

    在文本間相似度計(jì)算方面,文獻(xiàn)[10]通過(guò)統(tǒng)計(jì)出兩個(gè)直接義原集合間的共有信息和差異信息來(lái)計(jì)算集合間的相似度,并把該方法引進(jìn)到詞語(yǔ)間和句子間相似度的計(jì)算中去。文獻(xiàn)[11]基于向量空間模型,計(jì)算關(guān)鍵詞的語(yǔ)義相似度并采用最大權(quán)匹配方法計(jì)算兩個(gè)文本向量間的相似度。文獻(xiàn)[12]強(qiáng)調(diào)了除第一獨(dú)立義原以外其它義原的獨(dú)立性,用兩個(gè)文本中實(shí)詞間的相似度構(gòu)成特征矩陣,遞歸刪除最大元素所在行、得到詞語(yǔ)最大組合序列進(jìn)而計(jì)算句子間相似度和段落間相似度。文獻(xiàn)[13]在詞語(yǔ)間相似度中加入了主要義原對(duì)次要義原的抑制因素。

    1.3 短文本間語(yǔ)義相似度計(jì)算

    由于短文本具有詞語(yǔ)稀疏和語(yǔ)義離散的特點(diǎn),其中包含的信息量有限。通過(guò)文本間相似度計(jì)算方法得到的短文本間相似度偏差較大?,F(xiàn)有的短文本間語(yǔ)義相似度計(jì)算方法大多需要構(gòu)建知識(shí)庫(kù)或利用已有的知識(shí)庫(kù),這些方法的普適性普遍較差。

    2實(shí)體描述短文本語(yǔ)義相似度計(jì)算方法概述

    本文從短文本間語(yǔ)義相似度和短文本分類兩個(gè)部分出發(fā)計(jì)算實(shí)體描述短文本間相似度,并將兩部分相似度的平均值作為實(shí)體描述短文本間相似度計(jì)算的最終結(jié)果。

    短文本間語(yǔ)義相似度部分首先根據(jù)《知網(wǎng)》義原網(wǎng)狀結(jié)構(gòu)中的義原節(jié)點(diǎn)深度、義原子節(jié)點(diǎn)數(shù)量、義原節(jié)點(diǎn)間最短路徑長(zhǎng)度等信息計(jì)算義原間相似度,再通過(guò)較小語(yǔ)義單位間相似度計(jì)算較大語(yǔ)義單位間相似度,逐步計(jì)算義項(xiàng)、詞語(yǔ)和短文本間相似度。

    短文本分類部分將短文本分解為義原向量,再?gòu)姆纸鉃榱x原向量的網(wǎng)絡(luò)語(yǔ)料中抽取特征義原,訓(xùn)練一個(gè)樸素貝葉斯分類器,并通過(guò)兩篇短文本的分類結(jié)果計(jì)算兩者之間的相似度。

    3短文本間相似度計(jì)算方法的語(yǔ)義相似度部分

    3.1 義原間相似度計(jì)算

    本文分別采用基于節(jié)點(diǎn)之間路徑長(zhǎng)度的方法和基于節(jié)點(diǎn)間共有信息大小的方法計(jì)算義原間相似度?;诠?jié)點(diǎn)之間路徑長(zhǎng)度的方法以李峰[5]等人的公式為基礎(chǔ):

    (1)

    其中,S1和S2表示兩個(gè)義原,distance(S1,S2)表示兩個(gè)義原在《知網(wǎng)》義原網(wǎng)狀結(jié)構(gòu)上的最短路徑長(zhǎng)度,depth1和depth2是兩個(gè)義原在義原網(wǎng)狀結(jié)構(gòu)中各自所在的層次,即義原深度,是一個(gè)調(diào)節(jié)參數(shù),代表Sim值為0.5時(shí)兩個(gè)義原的最短路徑長(zhǎng)度。這個(gè)公式利用義原之間的上下位關(guān)系,以兩個(gè)義原在義原網(wǎng)絡(luò)上的路徑長(zhǎng)度作為義原間相似度計(jì)算的基礎(chǔ)。

    本文發(fā)現(xiàn),在利用公式(1)進(jìn)行義原間相似度計(jì)算時(shí),義原深度較淺的葉節(jié)點(diǎn)義原參與的相似度計(jì)算結(jié)果普遍偏低,而義原深度較深的非葉節(jié)點(diǎn)義原參與的相似度計(jì)算結(jié)果普遍偏高。由于《知網(wǎng)》的義原形成的是一個(gè)網(wǎng)狀結(jié)構(gòu)而不只是一顆義原樹(shù),義原的絕對(duì)深度不能直接反應(yīng)其相應(yīng)的具體程度。本文提出”義原相對(duì)深度”的概念來(lái)表達(dá)義原的具體程度,義原相對(duì)深度可以通過(guò)義原深度和義原所在樹(shù)深度計(jì)算:

    (2)

    其中,depth1是義原在義原網(wǎng)狀結(jié)構(gòu)中的深度,length(treeof(S1))是義原S1所在的子樹(shù)中,經(jīng)過(guò)S1的根節(jié)點(diǎn)-葉節(jié)點(diǎn)路徑的最短長(zhǎng)度。

    本文提出基于節(jié)點(diǎn)之間路徑長(zhǎng)度的公式:

    (3)

    這個(gè)公式可以平衡”event|事件”樹(shù)等深度較大的樹(shù)對(duì)相似度計(jì)算的影響,使位于深度較小的樹(shù)深層的義原也可以獲得較大的相似度值。

    本文在Dekang Lin[7]的公式基礎(chǔ)上引入義原相對(duì)深度,得到基于共有信息的義原間相似度計(jì)算公式:

    (4)

    其中,p(S)表示兩個(gè)義原最近公共父節(jié)點(diǎn)的子節(jié)點(diǎn)個(gè)數(shù)與其所在義原樹(shù)中所有節(jié)點(diǎn)個(gè)數(shù)的比,p(S1)和p(S2)是兩個(gè)義原連接的節(jié)點(diǎn)個(gè)數(shù)與其所在義原樹(shù)中所有節(jié)點(diǎn)個(gè)數(shù)的比。deep(S1)和deep(S2)表示兩個(gè)義原用(2)式計(jì)算得到的相對(duì)深度。

    本文將(3)式和(4)式結(jié)果的平均值作為義原間相似度計(jì)算的結(jié)果。

    3.2 義項(xiàng)間相似度計(jì)算和詞語(yǔ)間相似度計(jì)算

    《知網(wǎng)》中用于描述一個(gè)實(shí)詞義項(xiàng)的特征結(jié)構(gòu)可以分為四個(gè)部分[4]:第一獨(dú)立義原描述式、其它獨(dú)立義原描述式、關(guān)系義原描述式和符號(hào)義原描述式。

    兩個(gè)義項(xiàng)間的整體相似度可以表示為:

    (5)

    其中,βi(1≤i≤4)是用于調(diào)節(jié)四個(gè)部分權(quán)重的參數(shù),且β1+β2+β3+β4=1。

    不同義項(xiàng)包含的各類義原對(duì)描述義項(xiàng)起到的貢獻(xiàn)不同?!吨W(wǎng)》中不同詞語(yǔ)所對(duì)應(yīng)的義原數(shù)量差別很大,如果將四個(gè)部分的權(quán)重參數(shù)βi(1≤i≤4)設(shè)置為常數(shù),會(huì)導(dǎo)致一定程度的偏差。

    本文根據(jù)參與義項(xiàng)間相似度計(jì)算的兩個(gè)義項(xiàng)的義原分布情況,為其動(dòng)態(tài)設(shè)置權(quán)重:

    (6)

    其中,ci(1≤i≤4)是兩個(gè)義項(xiàng)中四種義原的合計(jì)數(shù)量。

    計(jì)算兩個(gè)詞語(yǔ)間的相似度時(shí),本文把相應(yīng)的義項(xiàng)兩兩結(jié)合,形成一個(gè)完全二分圖,計(jì)算二分圖每條邊上兩個(gè)頂點(diǎn)間的相似度,取相似度的最大值作為兩個(gè)詞語(yǔ)間的相似度。

    3.3 短文本間相似度計(jì)算

    本文用詞語(yǔ)間相似度計(jì)算短文本間相似度,采用文獻(xiàn)[12]的方法,建立起一個(gè)相似度特征矩陣,并通過(guò)詞語(yǔ)間相似度的最大組合序列計(jì)算文本間相似度。

    在計(jì)算短文本間相似度時(shí),本文統(tǒng)計(jì)《知網(wǎng)》中所有詞語(yǔ)的tf-idf值,利用參數(shù)來(lái)降低與高逆文本頻率詞、單字詞和多義項(xiàng)詞相關(guān)的相似度計(jì)算結(jié)果:

    (7)

    其中,c1、c2、c3分別是用于降低高逆文本頻率詞、單字詞和多義項(xiàng)詞參與的詞語(yǔ)相似度的參數(shù)。整句相似度由各集合加權(quán)平均得到。

    4短文本相似度計(jì)算方法的短文本分類部分

    本文將實(shí)體描述短文本分解為義原向量,根據(jù)短文本的義原分布情況為其分類,再根據(jù)分類結(jié)果計(jì)算實(shí)體描述短文本間相似度。短文本語(yǔ)義相似度方法和短文本分類方法輸出的相似度平均值即是實(shí)體描述短文本間相似度的最終結(jié)果。

    4.1 用義原向量描述短文本

    短文本分類部分用義原向量來(lái)表示短文本。本文采用文獻(xiàn)[14]提出了將文本根據(jù)義原系數(shù)分解為義原向量的方法,并結(jié)合文獻(xiàn)[15]的概念排歧方法。系統(tǒng)設(shè)計(jì)如圖1所示。

    圖1 文本分解為義原向量流程圖

    Fig.1 Flow chart of text transforming into sememe vector

    4.2 特征抽取和模型訓(xùn)練

    為了得到一篇短文本屬于各個(gè)分類的概率并保持較高的計(jì)算效率,本文選擇樸素貝葉斯分類器來(lái)為實(shí)體描述短文本分類。研究將每個(gè)實(shí)體的描述短文本按4.1的方法整理為義原向量??紤]到非葉節(jié)點(diǎn)義原的表意模糊,本文從義原向量中刪除所有非葉節(jié)點(diǎn)義原。

    生成義原向量之后,本文需要在葉節(jié)點(diǎn)義原中抽取出n個(gè)適用于分類的義原作為分類特征。文獻(xiàn)[16]提出了四種特征抽取方法:文檔頻率、信息增益、CHI統(tǒng)計(jì)和互信息。本文選擇信息增益(IG)法、χ2統(tǒng)計(jì)量(CHI)法和互信息(MI)法作為特征選擇的方法。當(dāng)一個(gè)義原的信息增益、CHI值和互信息均大于特定閾值時(shí),這個(gè)義原作為表達(dá)文本的特征。

    本文將每個(gè)文本表示為一個(gè)n維特征向量,X={x1,x2,......xn},其中xi表示文本中對(duì)應(yīng)義原的出現(xiàn)次數(shù),以九類電影簡(jiǎn)介信息生成的特征向量作為訓(xùn)練集,建立樸素貝葉斯分類模型。

    4.3 相似度計(jì)算

    本文通過(guò)樸素貝葉斯分類模型,計(jì)算兩篇短文本屬于每一個(gè)類別ci的后驗(yàn)概率P(ci|X),并將其整理為向量形式:Y1=(c1first,p1first,c1second,p1second)和Y2=(c2first,p2first,c2second,p2second)。

    其中,cfirst為特征向量在樸素貝葉斯分類器中后驗(yàn)概率最高的分類,cfirst為其所對(duì)應(yīng)的后驗(yàn)概率,csecond為特征向量在樸素貝葉斯分類器中后驗(yàn)概率次高的分類,psecond為其所對(duì)應(yīng)的后驗(yàn)概率。通過(guò)向量Y1和Y2計(jì)算短文本間相似度的方法如表1所示。

    表1 通過(guò)短文本向量計(jì)算相似度值

    Tab.1 Calculate similarity value using vectors of short text

    條件

    相似度值

    c1first=c2first

    max(c1first,c2first)

    c1second=c2first

    c1second*c2first

    c1first=c2second

    c1first*c2second

    c1second=c2second

    0.8*c1second*c2second

    其它

    0.1

    5.實(shí)驗(yàn)及結(jié)果分析

    本文的實(shí)驗(yàn)建立在百度知識(shí)圖譜數(shù)據(jù)分析競(jìng)賽任務(wù)一:實(shí)體相似度計(jì)算的基礎(chǔ)之上,并以其評(píng)測(cè)結(jié)果為基準(zhǔn)。百度知識(shí)圖譜數(shù)據(jù)分析競(jìng)賽給出的數(shù)據(jù)集包括11 463組實(shí)體屬性數(shù)據(jù)和8 001組實(shí)體間相似度數(shù)據(jù)。參與實(shí)驗(yàn)的實(shí)體描述文本平均長(zhǎng)度約為159字。

    本文用8 001組實(shí)體間相似度數(shù)據(jù)進(jìn)行訓(xùn)練并通過(guò)機(jī)器學(xué)習(xí)得到相似度計(jì)算模型,再用來(lái)為1 991組測(cè)試數(shù)據(jù)進(jìn)行打分。本文方法給出的相似度評(píng)分Sc將與百度給出的人工標(biāo)注結(jié)果Sm進(jìn)行對(duì)比,計(jì)算相似度評(píng)分向量(Sc1,Sc2,......Sc1991)和標(biāo)注結(jié)果(Sm1,Sm2,......Sm1991)的歐氏距離,最終測(cè)試結(jié)果表示為:

    (8)

    短文本間語(yǔ)義相似度計(jì)算公式(7)的參數(shù)設(shè)置如表2所示。

    表2實(shí)驗(yàn)中公式(7)的參數(shù)設(shè)置情況

    Tab.2 Parameter of Eq.(7) in experiment

    參數(shù)名

    參數(shù)意義

    取值條件

    參數(shù)值

    c1

    降低tf-idf值較低詞語(yǔ)參與的相似度計(jì)算結(jié)果

    tf-idf(w1)>α且tf-idf(w2)>α

    1

    tf-idf(w1)<β且tf-idf(w2)<β

    0.5

    其它

    0.8

    c2

    降低單字詞語(yǔ)參與的相似度計(jì)算結(jié)果

    w1或w2是單字詞

    0.9

    其它

    1

    c3

    降低多義項(xiàng)詞語(yǔ)參與的相似度計(jì)算結(jié)果

    w1和w2都是多義項(xiàng)詞

    0.9

    其它

    1

    為了證明方法的有效性和短文本分類部分的必要性,本文對(duì)短文本間語(yǔ)義相似度的計(jì)算結(jié)果和兩種方法結(jié)合后的計(jì)算結(jié)果分別進(jìn)行測(cè)試,測(cè)試結(jié)果如表3所示。

    表3 語(yǔ)義相似度方法和語(yǔ)義相似度、短文本分類綜合方法的實(shí)驗(yàn)結(jié)果

    Tab.3 Result of semantic similarity method and synthetic method of semantic similarity and short text classification

    方法

    D值

    排名

    語(yǔ)義相似度方法

    26.31

    26

    語(yǔ)義相似度、短文本分類綜合方法

    24.80

    5

    兩種方法的綜合結(jié)果得到了較小的D值,證明短文本分類方法有效地提高了實(shí)體描述短文本相似度計(jì)算的準(zhǔn)確率。

    6結(jié)束語(yǔ)

    本文提出了基于分類和語(yǔ)義網(wǎng)的實(shí)體間相似度計(jì)算方法,利用《知網(wǎng)》的語(yǔ)義網(wǎng)絡(luò)資源,提出了自己的義原間相似度、詞語(yǔ)間相似度、短文本間相似度表達(dá)式;并將短文本分解為義原向量,根據(jù)短文本的義原頻率分布訓(xùn)練文本分類器,并通過(guò)分類結(jié)果計(jì)算兩個(gè)文本間的相似度,最后在實(shí)驗(yàn)中分析驗(yàn)證了模型的有效性。

    參考文獻(xiàn):

    [1] 柴春梅.互聯(lián)網(wǎng)短文本信息分類關(guān)鍵技術(shù)研究[D] 上海,上海交通大學(xué),2009.

    [2] 路榮,項(xiàng)亮,劉明榮,楊青. 基于隱主題分析和文本聚類的微博客中新聞話題的發(fā)現(xiàn)[J]. 模式識(shí)別與人工智能,2012,25(3):382-387.

    [5] 董振東,董強(qiáng).知網(wǎng)[DB/OL].[2011-06-23].http://www.keenage.com.

    [4] 劉群,李素建.基于《知網(wǎng)》的詞匯語(yǔ)義相似度計(jì)算[C]//第三屆漢語(yǔ)詞匯語(yǔ)義學(xué)研討會(huì)論文集.臺(tái)北:[s.n.],2002:59-76.

    [5] 李峰,李芳.中文詞語(yǔ)語(yǔ)義相似度計(jì)算——基于《知網(wǎng)》2000[J].中文信息學(xué)報(bào),2007,21(3):99-105.

    [6] 吳健,吳朝暉,李瑩,等.基于本體論和詞匯語(yǔ)義相似度的Web服務(wù)發(fā)現(xiàn)[J].Chinese Journal of Computers,2005,28(4).

    [7] LIN Dekang. An information-theoretic definition of similarity semantic distance in WordNet[C]//Proceedings of the Fifteenth International Conference on Machine Learning.San Francisco, CA:[s.n.],1998.

    [8] RESNIK P. Using information content to evaluate semantic similarity in a taxonomy[J]. arXiv preprint cmp-lg/9511007, 1995.

    [9] 江敏,肖詩(shī)斌,王弘蔚,施水才.一種改進(jìn)的基于《知網(wǎng)》的詞語(yǔ)語(yǔ)義相似度計(jì)算[J].中文信息學(xué)報(bào),2008,22(5):84-89.

    [10] 劉青磊,顧小豐.基于《知網(wǎng)》的詞語(yǔ)相似度算法研究[J].中文信息學(xué)報(bào),2010,24(5):31-36.

    [11] 朱征宇,苑昆峰,陳杏環(huán).一種基于最大權(quán)匹配計(jì)算的信息檢索方法[J].計(jì)算機(jī)工程與應(yīng)用,2007,43(33):176-179.

    [12] 金博,史彥軍,滕弘飛. 基于語(yǔ)義理解的文本相似度算法[J]. 大連理工大學(xué)學(xué)報(bào),2005,45(2):291-297.

    [13] 李培. 基于《知網(wǎng)》的文本相似度研究[D]. 天津:河北工業(yè)大學(xué),2012.

    [14] 蘇偉峰,李紹滋,李堂秋.一個(gè)基于概念的中文文本分類模型[J].計(jì)算機(jī)工程與應(yīng)用,2002,38(5):193-195.

    [15] 蘇偉峰. 基于概念的文本自動(dòng)分類研究[D].廈門(mén):廈門(mén)大學(xué),2002.

    [16] 代六玲,黃河燕,陳肇雄. 中文文本分類中特征抽取方法的比較研究[J].中文信息學(xué)報(bào),2014,18(1):26-32.

    1 作者簡(jiǎn)介:秦添軼(1993-),男,黑龍江哈爾濱人,主要研究方向:自然語(yǔ)言處理、智能化信息檢索。

    猜你喜歡
    知網(wǎng)文本分類
    著作權(quán)使用聲明
    基于知網(wǎng)的翻譯研究方向畢業(yè)論文寫(xiě)作
    近三年維吾爾語(yǔ)言研究情況綜述
    基于組合分類算法的源代碼注釋質(zhì)量評(píng)估方法
    基于貝葉斯分類器的中文文本分類
    基于蟻群智能算法的研究文本分類
    基于樸素貝葉斯分類的Java課程網(wǎng)絡(luò)答疑反饋系統(tǒng)
    基于K—means算法的文本分類技術(shù)研究
    文本分類算法在山東女子學(xué)院檔案管理的應(yīng)用
    科技視界(2016年24期)2016-10-11 09:36:57
    HowNet在自然語(yǔ)言處理領(lǐng)域的研究現(xiàn)狀與分析
    科技視界(2016年5期)2016-02-22 11:41:39
    岛国在线观看网站| 亚洲一区二区三区欧美精品| 亚洲第一欧美日韩一区二区三区| 脱女人内裤的视频| 亚洲欧美精品综合一区二区三区| 欧美黑人精品巨大| 国产亚洲精品久久久久5区| 波多野结衣一区麻豆| 成人18禁在线播放| 97人妻天天添夜夜摸| 村上凉子中文字幕在线| 在线天堂中文资源库| 国产成人影院久久av| 国产区一区二久久| 成人精品一区二区免费| 妹子高潮喷水视频| www.999成人在线观看| 麻豆av在线久日| 99久久综合精品五月天人人| av不卡在线播放| 丝瓜视频免费看黄片| 天堂动漫精品| bbb黄色大片| 人妻丰满熟妇av一区二区三区 | 高清av免费在线| 一级毛片精品| 18禁观看日本| 国产成人精品在线电影| 一进一出抽搐动态| 一区二区三区国产精品乱码| 亚洲精品在线观看二区| 亚洲av电影在线进入| 欧美日韩福利视频一区二区| 午夜成年电影在线免费观看| 91大片在线观看| 一级片'在线观看视频| 一级片'在线观看视频| 丰满迷人的少妇在线观看| 久久 成人 亚洲| 精品福利观看| 在线观看免费视频日本深夜| 亚洲成人免费av在线播放| 久久中文看片网| 91av网站免费观看| 交换朋友夫妻互换小说| 亚洲精华国产精华精| 老鸭窝网址在线观看| 青草久久国产| 国产精品一区二区免费欧美| 女人被躁到高潮嗷嗷叫费观| 日韩熟女老妇一区二区性免费视频| 精品熟女少妇八av免费久了| 亚洲一区二区三区不卡视频| 伊人久久大香线蕉亚洲五| 国产一区二区三区综合在线观看| 人人妻人人澡人人看| 高潮久久久久久久久久久不卡| 成人特级黄色片久久久久久久| 欧美老熟妇乱子伦牲交| 国产熟女午夜一区二区三区| 美女福利国产在线| 欧美精品高潮呻吟av久久| 香蕉丝袜av| av片东京热男人的天堂| 老司机深夜福利视频在线观看| 欧美av亚洲av综合av国产av| 老鸭窝网址在线观看| 欧美国产精品一级二级三级| 欧美日韩精品网址| 欧美黑人欧美精品刺激| 日本一区二区免费在线视频| 女人爽到高潮嗷嗷叫在线视频| 婷婷精品国产亚洲av在线 | 免费日韩欧美在线观看| 国产av一区二区精品久久| 啪啪无遮挡十八禁网站| 最新美女视频免费是黄的| 午夜两性在线视频| 十八禁网站免费在线| 午夜精品在线福利| av国产精品久久久久影院| 美女视频免费永久观看网站| 国产精品一区二区在线观看99| 无人区码免费观看不卡| 不卡av一区二区三区| 搡老岳熟女国产| 亚洲av第一区精品v没综合| 中文字幕色久视频| 国产精品98久久久久久宅男小说| 人人妻人人爽人人添夜夜欢视频| 欧美日韩视频精品一区| 啦啦啦视频在线资源免费观看| 黄色 视频免费看| 捣出白浆h1v1| 老司机午夜十八禁免费视频| 不卡av一区二区三区| 国产不卡一卡二| 久久天躁狠狠躁夜夜2o2o| 国产日韩一区二区三区精品不卡| 久久人人97超碰香蕉20202| videosex国产| √禁漫天堂资源中文www| 欧美日韩精品网址| 在线天堂中文资源库| 热99re8久久精品国产| 午夜日韩欧美国产| 国产淫语在线视频| 成年人黄色毛片网站| 窝窝影院91人妻| 国产在线一区二区三区精| 少妇裸体淫交视频免费看高清 | 高清av免费在线| av免费在线观看网站| 久久中文看片网| 国产熟女午夜一区二区三区| 热re99久久国产66热| 国产在线一区二区三区精| 免费观看人在逋| 亚洲精品国产一区二区精华液| 一级黄色大片毛片| 亚洲av美国av| 成人国语在线视频| 一级a爱视频在线免费观看| 国产精品久久久人人做人人爽| 成人手机av| 啦啦啦视频在线资源免费观看| 日本五十路高清| 午夜亚洲福利在线播放| 伦理电影免费视频| 伊人久久大香线蕉亚洲五| 少妇裸体淫交视频免费看高清 | 成人18禁高潮啪啪吃奶动态图| 激情视频va一区二区三区| 亚洲av成人av| 亚洲人成伊人成综合网2020| 欧美性长视频在线观看| 老汉色av国产亚洲站长工具| 亚洲精品乱久久久久久| 亚洲中文字幕日韩| 国产午夜精品久久久久久| 日本wwww免费看| 又黄又粗又硬又大视频| 国产免费av片在线观看野外av| 后天国语完整版免费观看| 午夜日韩欧美国产| 热99久久久久精品小说推荐| 黑人欧美特级aaaaaa片| 亚洲欧美色中文字幕在线| 国产精品久久久久久人妻精品电影| 亚洲综合色网址| 亚洲熟女毛片儿| 国产亚洲欧美在线一区二区| 午夜91福利影院| 在线视频色国产色| 国产精品成人在线| 亚洲专区字幕在线| 亚洲精品美女久久久久99蜜臀| 久久香蕉激情| 亚洲色图av天堂| 99re6热这里在线精品视频| 黄色片一级片一级黄色片| 午夜福利影视在线免费观看| 亚洲久久久国产精品| 国产精品美女特级片免费视频播放器 | 91av网站免费观看| 精品国产乱子伦一区二区三区| 久久人人97超碰香蕉20202| 午夜亚洲福利在线播放| 国产激情欧美一区二区| 国产精品香港三级国产av潘金莲| 99久久国产精品久久久| 欧美成人午夜精品| 男女之事视频高清在线观看| 欧美最黄视频在线播放免费 | av欧美777| 91国产中文字幕| 亚洲国产欧美网| 国产主播在线观看一区二区| 久久久精品国产亚洲av高清涩受| 手机成人av网站| 国产欧美日韩精品亚洲av| 亚洲免费av在线视频| 水蜜桃什么品种好| 99精国产麻豆久久婷婷| 国产日韩一区二区三区精品不卡| 国产在线观看jvid| 久久久国产成人免费| 女人爽到高潮嗷嗷叫在线视频| 一区二区日韩欧美中文字幕| 性少妇av在线| 国产无遮挡羞羞视频在线观看| 久久中文字幕人妻熟女| 最近最新中文字幕大全电影3 | 亚洲精品自拍成人| 啦啦啦视频在线资源免费观看| 国产又爽黄色视频| 欧美乱妇无乱码| 亚洲专区字幕在线| 欧美黄色片欧美黄色片| 亚洲精品乱久久久久久| 日韩中文字幕欧美一区二区| 最近最新中文字幕大全免费视频| 99精品在免费线老司机午夜| 亚洲片人在线观看| 女人精品久久久久毛片| 国产无遮挡羞羞视频在线观看| 久久中文字幕一级| 亚洲欧美日韩高清在线视频| 精品视频人人做人人爽| 亚洲成a人片在线一区二区| 亚洲精品成人av观看孕妇| 露出奶头的视频| 午夜久久久在线观看| 国产欧美日韩一区二区三区在线| 最新的欧美精品一区二区| 久久国产亚洲av麻豆专区| 在线观看免费视频网站a站| 欧美日韩一级在线毛片| 国产亚洲精品久久久久久毛片 | 一二三四在线观看免费中文在| 女性生殖器流出的白浆| 丰满迷人的少妇在线观看| 精品亚洲成国产av| 国产欧美日韩综合在线一区二区| 欧美不卡视频在线免费观看 | 又大又爽又粗| 精品久久久精品久久久| 在线天堂中文资源库| 高清av免费在线| 天天躁夜夜躁狠狠躁躁| 又大又爽又粗| 国产精品国产高清国产av | 在线十欧美十亚洲十日本专区| 在线免费观看的www视频| 女人被狂操c到高潮| 欧美日韩黄片免| 亚洲av日韩在线播放| 黄色怎么调成土黄色| 巨乳人妻的诱惑在线观看| 免费观看a级毛片全部| 曰老女人黄片| 久久久久久久午夜电影 | 少妇 在线观看| 人人妻人人爽人人添夜夜欢视频| 后天国语完整版免费观看| 怎么达到女性高潮| 超碰97精品在线观看| 宅男免费午夜| av超薄肉色丝袜交足视频| e午夜精品久久久久久久| av国产精品久久久久影院| 超碰97精品在线观看| 1024香蕉在线观看| a级毛片在线看网站| 国产欧美日韩综合在线一区二区| 午夜免费鲁丝| 国产亚洲一区二区精品| 日韩欧美一区二区三区在线观看 | 制服人妻中文乱码| 久久国产乱子伦精品免费另类| 男人的好看免费观看在线视频 | 亚洲国产毛片av蜜桃av| 国产国语露脸激情在线看| 国产精品1区2区在线观看. | 9191精品国产免费久久| 亚洲精品国产精品久久久不卡| 国产亚洲欧美精品永久| 免费黄频网站在线观看国产| 很黄的视频免费| 热re99久久精品国产66热6| 一夜夜www| 久久青草综合色| 黄色女人牲交| www.精华液| 涩涩av久久男人的天堂| av福利片在线| 女同久久另类99精品国产91| 91精品三级在线观看| 欧美人与性动交α欧美精品济南到| 在线观看免费高清a一片| 亚洲精品在线观看二区| 久久中文字幕一级| 女人被狂操c到高潮| 一本大道久久a久久精品| 欧美+亚洲+日韩+国产| 天堂√8在线中文| 黄色片一级片一级黄色片| 亚洲一区二区三区不卡视频| 精品一品国产午夜福利视频| 欧美亚洲 丝袜 人妻 在线| 一级毛片女人18水好多| 国产91精品成人一区二区三区| 午夜福利在线观看吧| 久久国产精品人妻蜜桃| 色在线成人网| 夜夜夜夜夜久久久久| 身体一侧抽搐| 久久久久国内视频| 水蜜桃什么品种好| av网站免费在线观看视频| 午夜福利影视在线免费观看| 日韩视频一区二区在线观看| 日日爽夜夜爽网站| 国产欧美亚洲国产| 国产精品电影一区二区三区 | 黄片播放在线免费| 欧美激情 高清一区二区三区| 人妻久久中文字幕网| 女人被躁到高潮嗷嗷叫费观| 中文字幕人妻丝袜制服| 国内久久婷婷六月综合欲色啪| 午夜精品国产一区二区电影| 大型av网站在线播放| 亚洲一区二区三区不卡视频| 老司机影院毛片| 高潮久久久久久久久久久不卡| 久久天堂一区二区三区四区| 正在播放国产对白刺激| 久久天堂一区二区三区四区| 国产人伦9x9x在线观看| 国产一卡二卡三卡精品| 91大片在线观看| 一区二区日韩欧美中文字幕| 多毛熟女@视频| 亚洲国产精品sss在线观看 | 正在播放国产对白刺激| 热99久久久久精品小说推荐| 亚洲欧洲精品一区二区精品久久久| 久久精品熟女亚洲av麻豆精品| e午夜精品久久久久久久| 婷婷成人精品国产| 亚洲av第一区精品v没综合| 丰满迷人的少妇在线观看| 国产在线一区二区三区精| 久9热在线精品视频| 精品国产亚洲在线| 亚洲一区二区三区欧美精品| 在线观看免费视频日本深夜| 嫁个100分男人电影在线观看| 亚洲色图av天堂| 狠狠狠狠99中文字幕| 久久精品亚洲精品国产色婷小说| 国产亚洲精品久久久久5区| 欧美日韩国产mv在线观看视频| 久久久国产精品麻豆| xxxhd国产人妻xxx| 欧美激情极品国产一区二区三区| 91精品国产国语对白视频| 99re6热这里在线精品视频| 国产日韩一区二区三区精品不卡| 人妻一区二区av| 高清在线国产一区| 丰满的人妻完整版| 两个人看的免费小视频| 久久中文看片网| 成熟少妇高潮喷水视频| 久久久久久久国产电影| 天堂中文最新版在线下载| 成人18禁高潮啪啪吃奶动态图| 精品亚洲成a人片在线观看| 日韩有码中文字幕| 精品电影一区二区在线| 日本一区二区免费在线视频| 国产在线一区二区三区精| 午夜老司机福利片| 好男人电影高清在线观看| 一进一出抽搐动态| 自线自在国产av| 国产成人av教育| 成人av一区二区三区在线看| av福利片在线| 国产精品影院久久| 18禁裸乳无遮挡动漫免费视频| 午夜福利视频在线观看免费| 女人被狂操c到高潮| 亚洲精品中文字幕在线视频| 91av网站免费观看| 久久久久视频综合| 我的亚洲天堂| 999久久久国产精品视频| 久久精品人人爽人人爽视色| 自拍欧美九色日韩亚洲蝌蚪91| 亚洲自偷自拍图片 自拍| 99精品欧美一区二区三区四区| 国产精品秋霞免费鲁丝片| 一区二区三区国产精品乱码| tube8黄色片| 黄片大片在线免费观看| 香蕉久久夜色| 精品一品国产午夜福利视频| 99久久国产精品久久久| 国产视频一区二区在线看| 久久人妻福利社区极品人妻图片| 黄色a级毛片大全视频| 免费看a级黄色片| 亚洲精品美女久久久久99蜜臀| 中出人妻视频一区二区| 757午夜福利合集在线观看| 黄色视频不卡| 色综合欧美亚洲国产小说| 成人特级黄色片久久久久久久| 国产精品一区二区在线观看99| 国产精品久久电影中文字幕 | 欧美激情极品国产一区二区三区| 人妻久久中文字幕网| 少妇粗大呻吟视频| 丝袜美腿诱惑在线| 免费观看精品视频网站| 久久精品aⅴ一区二区三区四区| 一级片'在线观看视频| 国产亚洲精品第一综合不卡| 制服诱惑二区| 一级a爱视频在线免费观看| 日韩视频一区二区在线观看| 久久久国产一区二区| 精品国产超薄肉色丝袜足j| 日韩熟女老妇一区二区性免费视频| 国产熟女午夜一区二区三区| 一二三四在线观看免费中文在| 亚洲精品自拍成人| 9热在线视频观看99| 成在线人永久免费视频| 我的亚洲天堂| 精品久久久久久,| 中国美女看黄片| 99国产精品99久久久久| 欧美午夜高清在线| 欧美一级毛片孕妇| 午夜视频精品福利| a级毛片在线看网站| 一区二区三区国产精品乱码| 午夜福利,免费看| 老司机福利观看| 国产99白浆流出| 亚洲国产欧美一区二区综合| 国产免费男女视频| 一个人免费在线观看的高清视频| 丁香六月欧美| 99精品欧美一区二区三区四区| 大片电影免费在线观看免费| 国产1区2区3区精品| 国产淫语在线视频| 极品人妻少妇av视频| 国产99白浆流出| 久久亚洲真实| 亚洲色图综合在线观看| 人妻 亚洲 视频| 很黄的视频免费| 婷婷成人精品国产| av网站免费在线观看视频| 老司机午夜福利在线观看视频| 成人国产一区最新在线观看| 两性夫妻黄色片| 亚洲欧美日韩另类电影网站| 国产成人精品在线电影| 精品国内亚洲2022精品成人 | 大陆偷拍与自拍| 淫妇啪啪啪对白视频| 久久国产乱子伦精品免费另类| 嫁个100分男人电影在线观看| 亚洲va日本ⅴa欧美va伊人久久| 色94色欧美一区二区| 多毛熟女@视频| 久久国产精品男人的天堂亚洲| 久久性视频一级片| 九色亚洲精品在线播放| 欧美在线一区亚洲| 黑人操中国人逼视频| 露出奶头的视频| 免费观看精品视频网站| 一本一本久久a久久精品综合妖精| www.熟女人妻精品国产| 一区福利在线观看| 熟女少妇亚洲综合色aaa.| 人人妻,人人澡人人爽秒播| 久久精品亚洲av国产电影网| 欧美日韩av久久| 99精国产麻豆久久婷婷| 中文字幕av电影在线播放| 国产又色又爽无遮挡免费看| 可以免费在线观看a视频的电影网站| 99国产极品粉嫩在线观看| 在线观看日韩欧美| 纯流量卡能插随身wifi吗| 香蕉国产在线看| 身体一侧抽搐| 中文欧美无线码| 精品一区二区三区视频在线观看免费 | av电影中文网址| 99精国产麻豆久久婷婷| 国产成人免费无遮挡视频| 黄色视频不卡| 看免费av毛片| 亚洲第一青青草原| 欧美大码av| 一进一出好大好爽视频| 夜夜夜夜夜久久久久| 韩国精品一区二区三区| 无人区码免费观看不卡| 国产精品影院久久| 99久久国产精品久久久| 老熟妇仑乱视频hdxx| 一级片免费观看大全| 九色亚洲精品在线播放| 久久天躁狠狠躁夜夜2o2o| 亚洲一区中文字幕在线| 亚洲七黄色美女视频| 欧美精品亚洲一区二区| 又大又爽又粗| 麻豆成人av在线观看| 人成视频在线观看免费观看| 免费日韩欧美在线观看| 满18在线观看网站| 不卡av一区二区三区| 最近最新中文字幕大全免费视频| 老司机亚洲免费影院| 亚洲黑人精品在线| 岛国在线观看网站| 69av精品久久久久久| 黑人操中国人逼视频| 精品国产一区二区三区久久久樱花| 91九色精品人成在线观看| 男女免费视频国产| 欧美日韩瑟瑟在线播放| 母亲3免费完整高清在线观看| 欧美国产精品va在线观看不卡| 久久人妻福利社区极品人妻图片| 在线观看舔阴道视频| 18禁美女被吸乳视频| 激情在线观看视频在线高清 | 在线国产一区二区在线| 大陆偷拍与自拍| 亚洲自偷自拍图片 自拍| 国产亚洲精品久久久久5区| 欧美精品啪啪一区二区三区| 国产成人精品无人区| 水蜜桃什么品种好| 男女下面插进去视频免费观看| 又黄又粗又硬又大视频| 高清黄色对白视频在线免费看| 女性被躁到高潮视频| 电影成人av| 亚洲va日本ⅴa欧美va伊人久久| 交换朋友夫妻互换小说| 国产精品98久久久久久宅男小说| 久久精品91无色码中文字幕| 亚洲五月色婷婷综合| 男人的好看免费观看在线视频 | 一级毛片女人18水好多| 亚洲av日韩精品久久久久久密| 色播在线永久视频| 黄频高清免费视频| 热99国产精品久久久久久7| 交换朋友夫妻互换小说| 久久国产精品影院| 后天国语完整版免费观看| 纯流量卡能插随身wifi吗| 国产成人免费观看mmmm| 黄色女人牲交| 人人澡人人妻人| 91精品三级在线观看| 久久 成人 亚洲| 免费高清在线观看日韩| 香蕉久久夜色| 亚洲欧美一区二区三区黑人| 亚洲午夜精品一区,二区,三区| av超薄肉色丝袜交足视频| 亚洲精品中文字幕在线视频| 久久香蕉激情| 国产男靠女视频免费网站| 欧美一级毛片孕妇| 热99久久久久精品小说推荐| 精品第一国产精品| 亚洲熟妇熟女久久| xxx96com| 国产午夜精品久久久久久| 亚洲专区字幕在线| 久久亚洲真实| 久久久久国产精品人妻aⅴ院 | 国产精品99久久99久久久不卡| 成年人黄色毛片网站| 伊人久久大香线蕉亚洲五| 成年女人毛片免费观看观看9 | 夜夜爽天天搞| 超碰97精品在线观看| 人人妻人人澡人人看| videos熟女内射| 亚洲成国产人片在线观看| 国产免费av片在线观看野外av| 久久青草综合色| 午夜福利在线免费观看网站| 搡老熟女国产l中国老女人| 最近最新中文字幕大全免费视频| 午夜激情av网站| 欧美色视频一区免费| 波多野结衣av一区二区av| 国产精品久久电影中文字幕 | 波多野结衣一区麻豆| 精品电影一区二区在线| 自拍欧美九色日韩亚洲蝌蚪91| 亚洲精品久久成人aⅴ小说| 淫妇啪啪啪对白视频| 老司机影院毛片| 欧美不卡视频在线免费观看 | 80岁老熟妇乱子伦牲交| av天堂久久9| 女人久久www免费人成看片| 久久精品亚洲精品国产色婷小说| 电影成人av| 美女视频免费永久观看网站| 性少妇av在线| 在线观看免费视频网站a站| 国产成人av激情在线播放| 老司机影院毛片| 色老头精品视频在线观看|