• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于特征加權(quán)重疊度的中文實(shí)體協(xié)同消歧方法

    2017-06-01 11:29:47線巖團(tuán)余正濤洪旭東郭劍毅
    中文信息學(xué)報(bào) 2017年2期
    關(guān)鍵詞:消歧知識(shí)庫(kù)命名

    線巖團(tuán),余正濤,洪旭東,張 磊,郭劍毅

    (昆明理工大學(xué) 信息工程與自動(dòng)化學(xué)院,云南 昆明 650500)

    基于特征加權(quán)重疊度的中文實(shí)體協(xié)同消歧方法

    線巖團(tuán),余正濤,洪旭東,張 磊,郭劍毅

    (昆明理工大學(xué) 信息工程與自動(dòng)化學(xué)院,云南 昆明 650500)

    該文針對(duì)中文實(shí)體消歧中的特征項(xiàng)部分匹配和協(xié)同消歧問題,提出基于特征加權(quán)重疊度的中文實(shí)體協(xié)同消歧方法。該方法利用實(shí)體指稱上下文中多種特征的加權(quán)重疊度計(jì)算實(shí)體指稱相似度,針對(duì)實(shí)體鏈接與消歧聚類約束,分類定義實(shí)體指稱相似度計(jì)算方法,構(gòu)建待消歧實(shí)體相似度矩陣,采用近鄰傳播聚類算法實(shí)現(xiàn)中文實(shí)體協(xié)同鏈接與消歧。基于CLP-2012評(píng)測(cè)數(shù)據(jù)的實(shí)驗(yàn)表明,提出的方法取得了較好的消歧效果,準(zhǔn)確率、召回率和F值分別達(dá)到了84.01%、87.75%和85.65%。

    實(shí)體消歧;實(shí)體鏈接;加權(quán)重疊度;近鄰傳播聚類

    1 引言

    命名實(shí)體識(shí)別與消歧是自然語言處理的重要研究點(diǎn),其主要任務(wù)是發(fā)現(xiàn)文本中的命名實(shí)體,并將實(shí)體指稱關(guān)聯(lián)到已有真實(shí)實(shí)體。命名實(shí)體識(shí)別與消歧已成為知識(shí)庫(kù)構(gòu)建、信息抽取、機(jī)器翻譯,以及話題發(fā)現(xiàn)與追蹤等研究領(lǐng)域的重要支撐技術(shù)[1]。

    命名實(shí)體普遍存在重名和歧義現(xiàn)象,即同一實(shí)體指稱在不同上下文中可對(duì)應(yīng)不同的實(shí)體,例如,“高峰”一詞可表示普通的名詞,也可能表示不同的人名、機(jī)構(gòu)名,或是地名。針對(duì)命名實(shí)體消歧已有許多相關(guān)的研究,在英文評(píng)測(cè)方面主要有TAC KBP的Entity Linking 評(píng)測(cè)[2-3]和WePS(Web People Search)評(píng)測(cè)[4],以及針對(duì)中文的CLP-2012漢語命名實(shí)體識(shí)別與歧義消解[5]和NLP &CC中文微博實(shí)體鏈接評(píng)測(cè)。

    實(shí)體消歧可利用的知識(shí)主要有兩類,一是實(shí)體指稱的上下文信息,如實(shí)體指稱周圍的詞語、實(shí)體等;二是外部知識(shí)庫(kù),如Wikipedia、百度百科、DBpedia[6]和Freebase[7]等。實(shí)體消歧方法的核心是計(jì)算實(shí)體指稱和目標(biāo)實(shí)體之間的相似度,并根據(jù)實(shí)體相似度實(shí)現(xiàn)消歧和鏈接。主要方法有: 基于文本向量空間的聚類方法、基于分類的方法和基于圖的實(shí)體消歧方法?;谖谋鞠蛄靠臻g的聚類方法通過實(shí)體指稱的上下文信息構(gòu)建文本向量,計(jì)算文本向量間的距離,最后利用該距離進(jìn)行聚類,確定實(shí)體指稱對(duì)應(yīng)的實(shí)體概念[8-11]。該類方法在計(jì)算相似度時(shí),通常不考慮特征項(xiàng)部分匹配的問題,對(duì)相似度計(jì)算造成了不利的影響?;诜诸惖姆椒ɡ蒙舷挛奶卣鳂?gòu)建分類器,將待消歧實(shí)體鏈接到知識(shí)庫(kù)[12-14]。該方法存在的主要問題是分類的確定和待消歧的數(shù)據(jù)緊密相關(guān),難以構(gòu)建通用的分類模型適應(yīng)不同的消歧問題。Peng等人提出了結(jié)合分類和聚類算法的實(shí)體鏈接消歧方法[15]。該方法利用分類算法將待消歧實(shí)體劃分為知識(shí)庫(kù)實(shí)體、未知實(shí)體和普通詞三類,然后,選取命名實(shí)體、職業(yè)和名詞等特征構(gòu)建特征向量,計(jì)算特征向量余弦相似度,采用分類方法完成實(shí)體鏈接,最后,利用合成聚類(Agglomerative Hierarchical Clustering,AHC)方法完成未知實(shí)體消歧,取得了較好的效果?;趫D的實(shí)體消歧方法將實(shí)體指稱看作圖中的節(jié)點(diǎn),利用實(shí)體指稱間的關(guān)聯(lián)關(guān)系(鏈接、實(shí)體共現(xiàn)等)構(gòu)建實(shí)體關(guān)聯(lián)圖,通過圖聚類算法或是閾值過濾得到實(shí)體消歧結(jié)果[16-18]。該類方法對(duì)于具有較多關(guān)聯(lián)關(guān)系的實(shí)體消歧問題有較好的效果,但對(duì)于缺乏關(guān)聯(lián)關(guān)系的實(shí)體消歧問題,難以構(gòu)建有效的實(shí)體關(guān)聯(lián)圖。

    目前,已有的實(shí)體消歧方法通常依據(jù)特征項(xiàng)的共現(xiàn)信息,在計(jì)算實(shí)體相似度時(shí)忽視了特征項(xiàng)部分匹配的問題。針對(duì)這一問題,Hoffart 等人提出了基于關(guān)鍵短語集合重疊度的實(shí)體指稱相似度計(jì)算方法[19]。Ikeda等人提出了利用實(shí)體、組合關(guān)鍵詞、鏈接等特征,通過重疊系數(shù)計(jì)算各類特征的相似度,最后線性加權(quán)方式獲取人名實(shí)體間的關(guān)聯(lián)度[20]。另一方面已有的方法大多將實(shí)體鏈接和未知實(shí)體消歧分作兩個(gè)步驟處理,忽略了多個(gè)實(shí)體指稱之間關(guān)聯(lián)關(guān)系對(duì)實(shí)體消歧的影響。本文針對(duì)以上兩方面的問題,提出基于特征加權(quán)重疊度的中文實(shí)體協(xié)同消歧方法。該方法利用實(shí)體指稱上下文中的多種特征的加權(quán)重疊度計(jì)算實(shí)體相似度,針對(duì)實(shí)體鏈接與消歧聚類約束,分類定義實(shí)體指稱相似度計(jì)算方法,采用近鄰傳播聚類算法實(shí)現(xiàn)中文實(shí)體協(xié)同鏈接與消歧。

    2 基于特征加權(quán)重疊度的中文實(shí)體協(xié)同消歧方法

    2.1 實(shí)體消歧問題定義

    2.2 特征選擇與提取

    命名實(shí)體能夠簡(jiǎn)潔的表示與待消歧實(shí)體關(guān)聯(lián)的真實(shí)概念,Elmacioglu 等人的研究表明上下文中的命名實(shí)體是有效的消歧特征[21]。WePS系列評(píng)測(cè)中大部分排名靠前的系統(tǒng)都采用命名實(shí)作為主要特征,也從另一個(gè)側(cè)面驗(yàn)證了這一點(diǎn)。但是只用命名實(shí)體作為消歧特征是遠(yuǎn)遠(yuǎn)不夠的,主要原因有兩個(gè)方面。一是待消歧實(shí)體上下文中不一定出現(xiàn)命名實(shí)體,二是命名實(shí)體識(shí)別準(zhǔn)確度難以保證。本文在分詞、詞性標(biāo)注和實(shí)體識(shí)別基礎(chǔ)上,結(jié)合職業(yè)和職稱詞典,獲取專有名詞、人名、機(jī)構(gòu)名、地名、作品名稱、職業(yè)和職稱作為主要的消歧特征。此外,上下文中的概念通常以名詞詞組形式出現(xiàn),描述了待消歧實(shí)體的屬性和特點(diǎn),能很好的表征實(shí)體間的語義關(guān)系;所以,本文還選取與前述特征不重疊的名詞詞組作為特征,計(jì)算實(shí)體間的語義關(guān)聯(lián)度。獲取到的特征項(xiàng)集合由{w}表示,特征項(xiàng)w={w1,w2,…,wi,…,wL},其中wi是特征項(xiàng)中的詞語,L是特征項(xiàng)的長(zhǎng)度。

    2.2.1 特征項(xiàng)重疊相似度計(jì)算

    命名實(shí)體和名詞詞組特征通常由多個(gè)詞語構(gòu)成,所以,這些特征項(xiàng)之間的部分匹配就顯得十分重要,例如“退役足球運(yùn)動(dòng)員 ”和“足球運(yùn)動(dòng)員”的相似度應(yīng)高于它和“藍(lán)球運(yùn)動(dòng)員”的相似度。為了解決這一問題,本文借鑒Hoffart等人提出的短語相似度的計(jì)算方法[19]分別計(jì)算命名實(shí)體和名詞詞組之間的重疊相似度。

    設(shè)(e,f)表示待消歧的實(shí)體對(duì),Pe={p1,p2,…},Pf={q1,q2,…}分別表示實(shí)體e和f的特征項(xiàng)集合。特征項(xiàng)由詞語構(gòu)成,即pi={w1,w2,…},wi具有相對(duì)于實(shí)體e的權(quán)重γe(wi)。為了簡(jiǎn)化公式,文本用p和q表示不同實(shí)體的特征項(xiàng),w表示特征項(xiàng)中的詞,則基于加權(quán)Jaccard相似性系數(shù)的特征項(xiàng)重疊相似度如式(1)所示。

    (1)

    特征項(xiàng)詞語權(quán)重γe(w)和γf(w)由實(shí)體上下文中的逆文檔頻率(IDF,Inverse Document Frequency)確定,即γ(w)=log2(Z/df(w)),Z表示待消歧實(shí)體和目標(biāo)實(shí)體的總數(shù),df(w)表示包含w的特征項(xiàng)出現(xiàn)的次數(shù)。

    在特征項(xiàng)重疊相似度po(p,q)基礎(chǔ)上,計(jì)算實(shí)體對(duì)(e,f)的關(guān)聯(lián)度如式(2)所示。

    (2)

    其中φe(p)表示特征項(xiàng)p相對(duì)于實(shí)體e的權(quán)重,由p的TF-IDF值確定。ψ(p)表示不同類型的特征的權(quán)重。式中分子選擇較小的特征項(xiàng)權(quán)重和特征類型權(quán)重,對(duì)po(p,q)再加權(quán)。分母通過實(shí)體特征項(xiàng)權(quán)重之和,對(duì)sim(e,f)進(jìn)行正規(guī)化。在此,分母不采用特征項(xiàng)交集的最大權(quán)值求和,以避免對(duì)特征項(xiàng)的迪卡爾集進(jìn)行計(jì)算,降低計(jì)算復(fù)雜度??紤]到不同類型的特征對(duì)實(shí)體消歧結(jié)果的貢獻(xiàn)存在差異,本文針對(duì)不同類別特征類型定義不同的權(quán)重。權(quán)重值基于少量數(shù)據(jù)采用最小錯(cuò)誤率訓(xùn)練算法[22]得到,得到的具體僅值參見表1,權(quán)重調(diào)優(yōu)公式參見式(3)。

    (3)

    表1 特征類型權(quán)重

    2.3 基于近鄰傳播的協(xié)同實(shí)體鏈接消歧

    本文基于近鄰傳播聚類算法[23](Affinity Propagation cluster algorithm,AP)實(shí)現(xiàn)協(xié)同實(shí)體鏈接與消歧。實(shí)體鏈接與消歧可看作是針對(duì)實(shí)體知識(shí)庫(kù)E和待消歧名字集合N的聚類問題,針對(duì)實(shí)體鏈接與消歧任務(wù)要求,聚類應(yīng)滿足以下的約束條件:

    a. 由于待消歧名字集合對(duì)應(yīng)的真實(shí)概念是不確定的,故聚類數(shù)目k也是不確定;

    b. 實(shí)體知識(shí)庫(kù)E中的實(shí)體表示獨(dú)立的含義,所以它們之間的關(guān)聯(lián)度為零;

    c. 實(shí)體知識(shí)庫(kù)E中的實(shí)體通常包含更準(zhǔn)確、更豐富的上下文信息,應(yīng)具有更大機(jī)會(huì)成為聚類代表結(jié)點(diǎn)(Exemplar);

    d. 聚類過程應(yīng)協(xié)同考慮多個(gè)待消歧實(shí)體間的關(guān)聯(lián)度和相互作用,從而更好地對(duì)多個(gè)實(shí)體進(jìn)行消歧。

    (4)

    3 實(shí)驗(yàn)結(jié)果及分析

    本文采用CLP-2012“漢語命名實(shí)體識(shí)別與歧義消解”評(píng)測(cè)任務(wù)提供的訓(xùn)練數(shù)據(jù)開展實(shí)驗(yàn)。該評(píng)測(cè)任務(wù)提供的數(shù)據(jù)包含16個(gè)實(shí)體指稱,每個(gè)實(shí)體指稱對(duì)應(yīng)50~200篇文本。

    CLP-2012評(píng)測(cè)提供的實(shí)體知識(shí)庫(kù)包含實(shí)體指稱Name的多個(gè)不同定義,每個(gè)定義由一段文字描述。針對(duì)每個(gè)實(shí)體指稱Name,有一個(gè)包含Name的文本集合T。要求判斷T中的實(shí)體指稱Name是實(shí)體名,還是普通詞。如果Name是實(shí)體名,則進(jìn)一步判斷它是否對(duì)應(yīng)于知識(shí)庫(kù)中的定義;如果Name未對(duì)應(yīng)到知識(shí)庫(kù)中的定義,則將按其含義將實(shí)體指進(jìn)行歸類。如Name是普通詞,則將其歸入Other類中。

    為了避免Other類的判別問題,實(shí)驗(yàn)過程中借助于Peng等人提出的方法[15],將Name作為檢索詞,利用互聯(lián)網(wǎng)搜索引擎獲檢索結(jié)果中的前50個(gè)頁面,獲取與Name共現(xiàn)度最高的20個(gè)名詞詞組。利用獲取的詞組在實(shí)體知識(shí)庫(kù)中加入與Other類對(duì)應(yīng)的偽實(shí)體定義,則Other類的判別轉(zhuǎn)化為在實(shí)體知識(shí)庫(kù)尋找對(duì)應(yīng)定義的問題。詞語與Name共現(xiàn)度按式(5)計(jì)算。

    (5)

    式中,d(name,word)表示同時(shí)包含Name和Word的文檔數(shù),d(name)表示包含Name的文檔數(shù)量,d(word)表示包含Word的文檔數(shù)。

    本文將實(shí)體鏈接與消歧看作是以實(shí)體指稱為結(jié)點(diǎn)的聚類問題,聚類結(jié)果中同一個(gè)聚類簇的實(shí)體指稱具有相同含義。實(shí)驗(yàn)過程主要包含以下三個(gè)步驟。首先利用詞法分析工具[24]對(duì)知識(shí)庫(kù)中的實(shí)體定義和文本集合T進(jìn)行分詞、詞性標(biāo)注和命名實(shí)體識(shí)別,并抽取實(shí)體特征和名詞詞組特征。然后,利用特征值計(jì)算結(jié)點(diǎn)似度矩陣。其中,不同實(shí)體指稱間的相似度基于特征加權(quán)重疊度方法計(jì)算,即公式(1)和(2);其它情況按公式(4)進(jìn)行計(jì)算。最后,采用近鄰傳播聚類工具[25]對(duì)實(shí)體指稱進(jìn)行聚類,從而得到實(shí)體鏈接與消歧結(jié)果。

    實(shí)驗(yàn)結(jié)果的準(zhǔn)確率和召回率按CLP-2012評(píng)測(cè)任務(wù)提供的公式計(jì)算,實(shí)驗(yàn)結(jié)果見表2。

    表2 CLP-2012訓(xùn)練數(shù)據(jù)實(shí)驗(yàn)結(jié)果

    續(xù)表

    實(shí)驗(yàn)結(jié)果表明本文提出的方法在準(zhǔn)確率、召回率和F值上取得了較好的效果。實(shí)驗(yàn)結(jié)果與CLP-2012評(píng)測(cè)結(jié)果比較參見表3。實(shí)驗(yàn)結(jié)果與Peng等人提出的兩階段實(shí)體消歧方法[15]結(jié)果相近。該方法首先利用分類算法將待消歧實(shí)體指稱劃分已有實(shí)體、未知實(shí)體和普通詞三類;然后,利用層次聚類算法對(duì)未知實(shí)體進(jìn)行消歧。相比于前述的兩階段實(shí)體消歧方法,本文方法只采用近鄰傳播聚類算法實(shí)現(xiàn)消歧,在簡(jiǎn)化方法的同時(shí)實(shí)現(xiàn)了實(shí)體指稱的協(xié)同消歧。

    表3 實(shí)體消歧方法結(jié)果比較

    注: KMUST-LIIP表示本文提出的方法,UM和UM-1表示來自文獻(xiàn)[12,26]針對(duì)部分訓(xùn)練數(shù)據(jù)得到的結(jié)果,ZZU、HITSZ、BUPT和SIR-NERD結(jié)果分別來自文獻(xiàn)[10-15]。

    通過對(duì)實(shí)驗(yàn)過程分析發(fā)現(xiàn),命名實(shí)體識(shí)別工具針對(duì)CLP-2012評(píng)測(cè)數(shù)據(jù)中的實(shí)體識(shí)別準(zhǔn)確率低是影響實(shí)驗(yàn)結(jié)果的主要因素之一。究其原因是評(píng)測(cè)試數(shù)據(jù)中出現(xiàn)的許多命名實(shí)體和普通詞語重名,導(dǎo)致了較多的識(shí)別錯(cuò)誤,最終影響了實(shí)驗(yàn)結(jié)果的準(zhǔn)確度。另外,職業(yè)、職稱和作品名等特有特征對(duì)人名實(shí)體消歧具有很好的效果,其平均準(zhǔn)確率、召回率和F值高于其它的實(shí)體消歧結(jié)果7.2%,4.0%和5.7%。

    4 結(jié)論

    本文針對(duì)中文實(shí)體消歧中的特征項(xiàng)部分匹配的問題,提出基于特征加權(quán)重疊度的中文實(shí)體協(xié)同消歧方法。實(shí)驗(yàn)結(jié)果表明該方法針對(duì)面向文本中文實(shí)體鏈接與消歧問題具有較好的效果。本文利用實(shí)體指稱上下文中的多種特征的加權(quán)重疊度計(jì)算實(shí)體相似度,能較好具體現(xiàn)實(shí)體間的語義關(guān)聯(lián),但由于待消歧實(shí)指稱上下文信息量有限,而外部知識(shí)庫(kù)(Wikipedia、百度百科和互動(dòng)百科等)含有大量的實(shí)體信息,所以,我們將進(jìn)一步研究融合外部知識(shí)庫(kù)語義相似度計(jì)算方法,提高中文實(shí)體消歧的性能。

    [1] 趙軍. 命名實(shí)體識(shí)別, 排歧和跨語言關(guān)聯(lián)[J]. 中文信息學(xué)報(bào), 2009, 23(2): 3-17.

    [2] Ji H, Grishman R. Knowledge base population: Successful approaches and challenges[C]//Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics: Human Language Technologies-Volume 1. Association for Computational Linguistics, 2011: 1148-1158.

    [3] Ji H, Grishman R, Dang H T, et al. Overview of the TAC 2010 knowledge base population track[C]//Proceedings of Third Text Analysis Conference (TAC 2010). 2010.

    [4] Artiles J, Gonzalo J, Sekine S. The semeval-2007 weps evaluation: Establishing a benchmark for the web people search task[C]//Proceedings of the 4th International Workshop on Semantic Evaluations. Association for Computational Linguistics, 2007: 64-69.

    [5] Wang Z H H, Li S. The Task 2 of CIPS-SIGHAN 2012 Named Entity Recognition and Disambiguation in Chinese Bakeoff[C]//Proceedings of The 2nd CIPS-SIGHAN Joint Conference on Chinese Language Processing (CLP-2012). 2012: 108-114.

    [6] Auer S, Bizer C, Kobilarov G, et al. Dbpedia: A nucleus for a web of open data[M]//The semantic web. Springer Berlin Heidelberg, 2007: 722-735.

    [7] Bollacker K, Evans C, Paritosh P, et al. Freebase: a collaboratively created graph database for structuring human knowledge[C]//Proceedings of the 2008 ACM SIGMOD international conference on Management of data. ACM, 2008: 1247-1250.

    [8] Cucerzan S. Large-Scale Named Entity Disambiguation Based on Wikipedia Data[C]//Proceedings of the EMNLP-CoNLL. 2007, 7: 708-716.

    [9] Milne D, Witten I H. Learning to Link with Wikipedia[C]//Proceedings of the 17th ACM conference on Information and knowledge management. ACM, 2008: 509-518.

    [10] Fan Q, ZAN H, CHAI Y, et al. Chinese personal name disambiguation based on vector space model[C]//Proceedings of The 2nd CIPS-SIGHAN Joint Conference on Chinese Language Processing (CLP-2012). 2012: 152-158.

    [11] Cilibrasi R L, Vitanyi P M B. The google similarity distance[J]. Knowledge and Data Engineering, IEEE Transactions on, 2007, 19(3): 370-383.

    [12] Wang L, Li S, Wong D F, et al. A joint chinese named entity recognition and disambiguation system[C]//Proceedings of The 2nd CIPSSIGHAN Joint Conference on Chinese Language Processing (CLP-2012). 2012: 146-151.

    [13] Liu J, Xu R, Lu Q, et al. Explore chinese encyclopedic knowledge to disambiguate person names[C]//Proceedings of The 2nd CIPS-SIGHAN Joint Conference on Chinese Language Processing (CLP-2012). 2012: 138-145.

    [14] Han W, Liu G, Mao Y, et al. Attribute based Chinese Named Entity Recognition and Disambiguation[C]//Proceedings of The 2nd CIPS-SIGHAN Joint Conference on Chinese Language Processing (CLP-2012) . 2012: 127-131.

    [15] Peng Z, Sun L, Han X. SIR-NERD: A Chinese Named Entity Recognition and Disambiguation System using a Two-Stage Method[C]//Proceedings of The 2nd CIPS-SIGHAN Joint Conference on Chinese Language Processing (CLP-2012). 2012: 114-120.

    [16] Minkov E, Cohen W W, Ng A Y. Contextual search and name disambiguation in email using graphs[C]//Proceedings of the 29th annual international ACM SIGIR conference on Research and development in information retrieval. ACM, 2006: 27-34.

    [17] Bekkerman R, McCallum A. Disambiguating web appearances of people in a social network[C]//Proceedings of the 14th international conference on World Wide Web. ACM, 2005: 463-470.

    [18] 郎君, 秦兵, 宋巍, 等. 基于社會(huì)網(wǎng)絡(luò)的人名檢索結(jié)果重名消解[J]. 計(jì)算機(jī)學(xué)報(bào), 2009, 32(7): 1365-1374.

    [19] Hoffart J, Seufert S, Nguyen D B, et al. Kore: Keyphrase overlap relatedness for entity disambiguation[C] //Proceedings of the 21st ACM international conference on Information and knowledge management. ACM, 2012: 545-554.

    [20] Ikeda M, Ono S, Sato I, et al. Person name disambiguation on the web by two-stage clustering[C]//Proceedings of the 2nd Web People Search Evaluation Workshop (WePS 2009), 18th WWW Conference. 2009.

    [21] E Elmacioglu, Y Tan, S Yan, et al. PSNUS: Web People Name Disambiguation by Simple Clustering with Rich Features[C] //Proceedings of The SemEval-2007, 2007: 268-271.

    [22] Och F J. Minimum error rate training in statistical machine translation[C]//Proceedings of the 41st Annual Meeting on Association for Computational Linguistics-Volume 1. Association for Computational Linguistics, 2003: 160-167.

    [23] Frey B J, Dueck D. Clustering by passing messages between data points[J]. Science, 2007, 315(5814): 972-976.

    [24] 劉挺, 車萬翔, 李正華. 語言技術(shù)平臺(tái)[J]. 中文信息學(xué)報(bào), 2012, 25(6): 53-62.

    [25] http://genes.toronto.edu/index.php?q=affinity%20propagation[OL].

    [26] Hao Zong, Derek F Wong, Lidia S Chao. A template based hybrid model for chinese personal name disambiguation[C]//Proceedings of The 2nd CIPS-SIGHAN Joint Conference on Chinese Language Processing (CLP-2012).2012: 121-126.

    Collaborative Entity Disambiguation Method Based on WeightedFeature Overlap Relatedness for Chinese

    XIAN Yantuan, YU Zhengtao, HONG Xudong, ZHANG Lei, GUO Jianyi

    (Faculty of Information Engineering and Automation,Kunming University of Science andTechnology, Kunming, Yunnan 650500, China)

    A collaborative entity disambiguation method based on weighted feature overlap relatedness is proposed in this paper. This method make use of weighted feature overlap relatedness for computing the similarity between entity names. We define some deferent similarity formulas for computing entity similarity matrix, then the affinity propagation clustering algorithm is used to get the disambiguation results. Evaluation on the CLP-2012 corpus shows that our method can achieve competitive performance, attains 84.01% precision, 87.75% recall and 85.65% F-score.

    entity disambiguation; entity linking; weighted overlap relatedness; affinity propagation clustering

    線巖團(tuán)(1981—),博士研究生,講師,主要研究領(lǐng)域?yàn)樽匀徽Z言處理、信息抽取。E?mail:xianyantuan@qq.com余正濤(1970—),通信作者,博士,教授,博士生導(dǎo)師,主要研究領(lǐng)域?yàn)樽匀徽Z處理、信息檢索、機(jī)器翻譯、機(jī)器學(xué)習(xí)等。E?mail:ztyu@hotmail.com洪旭東(1989—),博士研究生,主要研究領(lǐng)域?yàn)樽匀徽Z言處理、信息檢索。E?mail:459102534@qq.com

    2015-03-10 定稿日期: 2015-09-10

    國(guó)家自然科學(xué)基金(61363044, 61175068, 61365010, 61462054, 61462055)

    1003-0077(2017)02-0036-06

    TP391

    A

    猜你喜歡
    消歧知識(shí)庫(kù)命名
    基于關(guān)聯(lián)圖和文本相似度的實(shí)體消歧技術(shù)研究*
    命名——助力有機(jī)化學(xué)的學(xué)習(xí)
    基于半監(jiān)督集成學(xué)習(xí)的詞義消歧
    基于TRIZ與知識(shí)庫(kù)的創(chuàng)新模型構(gòu)建及在注塑機(jī)設(shè)計(jì)中的應(yīng)用
    有一種男人以“暖”命名
    東方女性(2018年3期)2018-04-16 15:30:02
    藏文歷史文獻(xiàn)識(shí)別過程中藏文自由虛詞的自動(dòng)識(shí)別及消歧算法的研究
    為一條河命名——在白河源
    高速公路信息系統(tǒng)維護(hù)知識(shí)庫(kù)的建立和應(yīng)用
    基于Drupal發(fā)布學(xué)者知識(shí)庫(kù)關(guān)聯(lián)數(shù)據(jù)的研究
    圖書館研究(2015年5期)2015-12-07 04:05:48
    基于《知網(wǎng)》的中文信息結(jié)構(gòu)消歧研究
    欧美人与性动交α欧美软件| 国产不卡av网站在线观看| 中文字幕人妻丝袜制服| 精品久久久久久,| 国产99白浆流出| 久热爱精品视频在线9| 黄色成人免费大全| 久久国产精品影院| 悠悠久久av| 国产野战对白在线观看| 欧美日韩黄片免| 午夜福利乱码中文字幕| 夜夜爽天天搞| 高清在线国产一区| 黑人巨大精品欧美一区二区mp4| 搡老岳熟女国产| 国产成人精品在线电影| 操出白浆在线播放| 在线观看免费高清a一片| 国产精品亚洲一级av第二区| 制服诱惑二区| 久久精品人人爽人人爽视色| 丁香欧美五月| 亚洲伊人色综图| 欧美激情久久久久久爽电影 | 日韩欧美一区二区三区在线观看 | 精品福利永久在线观看| e午夜精品久久久久久久| 啦啦啦视频在线资源免费观看| 日本黄色视频三级网站网址 | 国产精品一区二区免费欧美| 激情视频va一区二区三区| 波多野结衣av一区二区av| 国产成人精品在线电影| 国产精品亚洲av一区麻豆| 丝袜美足系列| 国产野战对白在线观看| а√天堂www在线а√下载 | 99国产精品免费福利视频| 久久久久国内视频| 国产日韩一区二区三区精品不卡| 欧美日韩黄片免| 黄片小视频在线播放| 亚洲五月天丁香| 婷婷丁香在线五月| 岛国在线观看网站| 国产蜜桃级精品一区二区三区 | 妹子高潮喷水视频| 久久久水蜜桃国产精品网| 啦啦啦免费观看视频1| 黄色视频,在线免费观看| 99热国产这里只有精品6| 我的亚洲天堂| 午夜精品国产一区二区电影| 一区福利在线观看| 亚洲精品粉嫩美女一区| 在线观看日韩欧美| 校园春色视频在线观看| 91九色精品人成在线观看| 国产在线一区二区三区精| 亚洲中文av在线| 免费观看a级毛片全部| 91老司机精品| 国产无遮挡羞羞视频在线观看| 精品乱码久久久久久99久播| 国产精品成人在线| 久久人人爽av亚洲精品天堂| 三上悠亚av全集在线观看| 国产欧美日韩精品亚洲av| 丝袜人妻中文字幕| 制服人妻中文乱码| 飞空精品影院首页| 国产精品自产拍在线观看55亚洲 | 日韩成人在线观看一区二区三区| 免费人成视频x8x8入口观看| 老司机午夜福利在线观看视频| 咕卡用的链子| 欧美成人午夜精品| 18在线观看网站| 亚洲精品中文字幕一二三四区| 国产成人精品无人区| 亚洲人成电影观看| 欧美日韩视频精品一区| 69精品国产乱码久久久| 久久久久久亚洲精品国产蜜桃av| 精品国内亚洲2022精品成人 | 少妇粗大呻吟视频| 在线观看免费视频网站a站| 女人久久www免费人成看片| 久久亚洲真实| 很黄的视频免费| 国产日韩一区二区三区精品不卡| 欧美 亚洲 国产 日韩一| 热re99久久精品国产66热6| 在线视频色国产色| 国产不卡一卡二| 免费观看人在逋| 一级片'在线观看视频| 精品福利观看| 亚洲精品美女久久av网站| a在线观看视频网站| 国产精品一区二区在线不卡| 在线观看www视频免费| 天堂动漫精品| 十分钟在线观看高清视频www| 中文字幕精品免费在线观看视频| 国产精品久久久人人做人人爽| 欧美亚洲 丝袜 人妻 在线| 国产精品一区二区免费欧美| 日本五十路高清| 国产有黄有色有爽视频| √禁漫天堂资源中文www| 麻豆成人av在线观看| 欧美老熟妇乱子伦牲交| 别揉我奶头~嗯~啊~动态视频| 一级毛片精品| 美女午夜性视频免费| 欧美精品人与动牲交sv欧美| 亚洲精品av麻豆狂野| 国产精品影院久久| 亚洲精品自拍成人| av天堂久久9| 欧美日韩黄片免| 一二三四社区在线视频社区8| 欧美色视频一区免费| 精品高清国产在线一区| 国产精品香港三级国产av潘金莲| 亚洲熟女精品中文字幕| 一本大道久久a久久精品| 国产又色又爽无遮挡免费看| 制服诱惑二区| 免费日韩欧美在线观看| 亚洲精品美女久久久久99蜜臀| 别揉我奶头~嗯~啊~动态视频| netflix在线观看网站| 欧美精品高潮呻吟av久久| 最近最新免费中文字幕在线| 国产99久久九九免费精品| 日韩制服丝袜自拍偷拍| 亚洲av欧美aⅴ国产| 黄片播放在线免费| 飞空精品影院首页| 人人妻人人爽人人添夜夜欢视频| 91在线观看av| 午夜福利影视在线免费观看| 手机成人av网站| 涩涩av久久男人的天堂| 香蕉丝袜av| 很黄的视频免费| 两个人看的免费小视频| 99国产精品一区二区三区| 久久久国产欧美日韩av| 国内毛片毛片毛片毛片毛片| 91国产中文字幕| 最近最新中文字幕大全电影3 | 一级毛片高清免费大全| 国产亚洲av高清不卡| 丰满的人妻完整版| 高清毛片免费观看视频网站 | 最新的欧美精品一区二区| 欧美中文综合在线视频| 亚洲成人手机| 亚洲欧美激情在线| 国产无遮挡羞羞视频在线观看| 黄片小视频在线播放| 久久久国产精品麻豆| 深夜精品福利| 久久精品成人免费网站| 亚洲国产毛片av蜜桃av| 巨乳人妻的诱惑在线观看| 亚洲人成77777在线视频| 十八禁人妻一区二区| 伦理电影免费视频| 免费在线观看视频国产中文字幕亚洲| 国产又色又爽无遮挡免费看| 色综合婷婷激情| 老司机亚洲免费影院| 欧美色视频一区免费| 欧美日韩视频精品一区| 国产精品免费大片| 亚洲国产中文字幕在线视频| 夜夜躁狠狠躁天天躁| 久久精品亚洲精品国产色婷小说| 人人妻,人人澡人人爽秒播| 老汉色av国产亚洲站长工具| 亚洲成av片中文字幕在线观看| 亚洲五月天丁香| 自拍欧美九色日韩亚洲蝌蚪91| 高清在线国产一区| 欧美性长视频在线观看| 无遮挡黄片免费观看| 黑丝袜美女国产一区| 嫁个100分男人电影在线观看| 免费观看精品视频网站| 国产精品1区2区在线观看. | 日韩 欧美 亚洲 中文字幕| 日韩欧美一区二区三区在线观看 | 黄色视频,在线免费观看| 精品熟女少妇八av免费久了| 黑人欧美特级aaaaaa片| 99国产精品一区二区三区| 啦啦啦免费观看视频1| 一个人免费在线观看的高清视频| 在线观看免费午夜福利视频| 美女福利国产在线| 久久国产精品影院| 亚洲精品一二三| 欧美黑人欧美精品刺激| 欧美在线黄色| 丝袜美腿诱惑在线| 黄片大片在线免费观看| 我的亚洲天堂| 一区二区三区激情视频| 欧美日本中文国产一区发布| 国产精品久久视频播放| 久久午夜综合久久蜜桃| 日日爽夜夜爽网站| 欧美中文综合在线视频| 日韩一卡2卡3卡4卡2021年| 亚洲欧洲精品一区二区精品久久久| 手机成人av网站| 精品一品国产午夜福利视频| 免费人成视频x8x8入口观看| 国产精品永久免费网站| 女同久久另类99精品国产91| 亚洲精品一二三| 国产精品偷伦视频观看了| 50天的宝宝边吃奶边哭怎么回事| 激情视频va一区二区三区| 亚洲男人天堂网一区| 亚洲色图 男人天堂 中文字幕| 亚洲精品av麻豆狂野| 成人国产一区最新在线观看| 久久人妻福利社区极品人妻图片| 国产成人欧美在线观看 | 欧美激情 高清一区二区三区| 欧美日韩视频精品一区| 看黄色毛片网站| tube8黄色片| 亚洲五月婷婷丁香| 我的亚洲天堂| 欧美 日韩 精品 国产| 国产男女超爽视频在线观看| 免费观看精品视频网站| 欧美激情 高清一区二区三区| 成人国语在线视频| 久久精品国产a三级三级三级| 超色免费av| 亚洲专区字幕在线| 人人妻人人澡人人爽人人夜夜| 免费av中文字幕在线| 国产欧美日韩一区二区三区在线| 欧美精品一区二区免费开放| 少妇 在线观看| 精品国产一区二区三区久久久樱花| 成人18禁高潮啪啪吃奶动态图| 国产亚洲精品第一综合不卡| 波多野结衣一区麻豆| 亚洲午夜精品一区,二区,三区| 久久香蕉国产精品| 黄色怎么调成土黄色| 国产主播在线观看一区二区| 亚洲第一欧美日韩一区二区三区| 999久久久国产精品视频| 丝袜人妻中文字幕| 欧美精品亚洲一区二区| 精品久久久久久久毛片微露脸| 国产日韩一区二区三区精品不卡| 黄色女人牲交| 人妻久久中文字幕网| www.自偷自拍.com| 欧美人与性动交α欧美精品济南到| 欧美日韩av久久| 亚洲人成77777在线视频| 久久人人爽av亚洲精品天堂| 国产欧美日韩一区二区三| 少妇的丰满在线观看| 每晚都被弄得嗷嗷叫到高潮| 桃红色精品国产亚洲av| 国产亚洲av高清不卡| 男女免费视频国产| 国产亚洲精品一区二区www | 一边摸一边抽搐一进一出视频| 亚洲av电影在线进入| 精品久久久久久久久久免费视频 | 高清视频免费观看一区二区| 男女高潮啪啪啪动态图| 国产精品香港三级国产av潘金莲| 777米奇影视久久| 国产深夜福利视频在线观看| 久久性视频一级片| 一边摸一边做爽爽视频免费| 国产成人精品无人区| 亚洲欧美一区二区三区久久| 人人妻人人澡人人爽人人夜夜| 50天的宝宝边吃奶边哭怎么回事| 亚洲男人天堂网一区| 久久性视频一级片| 咕卡用的链子| 国产一区二区激情短视频| 国产片内射在线| 在线观看一区二区三区激情| 欧美黄色淫秽网站| 精品福利观看| 国产一区二区三区综合在线观看| 夜夜爽天天搞| 午夜免费观看网址| 国产亚洲精品久久久久5区| 中文字幕色久视频| 在线十欧美十亚洲十日本专区| 一进一出好大好爽视频| 久久久国产成人免费| 王馨瑶露胸无遮挡在线观看| 午夜福利一区二区在线看| 青草久久国产| 国产成+人综合+亚洲专区| 亚洲成av片中文字幕在线观看| 国产亚洲欧美98| av不卡在线播放| 黄片小视频在线播放| 久久这里只有精品19| 亚洲午夜精品一区,二区,三区| 丁香欧美五月| 亚洲熟女精品中文字幕| 免费日韩欧美在线观看| 久久久久精品人妻al黑| 在线av久久热| 在线观看舔阴道视频| 精品久久久久久,| 嫁个100分男人电影在线观看| 精品国产国语对白av| 亚洲第一青青草原| bbb黄色大片| 老司机亚洲免费影院| 欧美黑人欧美精品刺激| 首页视频小说图片口味搜索| 亚洲一区中文字幕在线| 日韩欧美一区视频在线观看| 在线看a的网站| 在线播放国产精品三级| 欧美日韩黄片免| 一二三四社区在线视频社区8| 国产成人一区二区三区免费视频网站| 午夜91福利影院| 在线永久观看黄色视频| 精品国产一区二区久久| 亚洲国产精品合色在线| 亚洲久久久国产精品| 国产精品亚洲av一区麻豆| 亚洲三区欧美一区| 黄色视频,在线免费观看| 中文字幕最新亚洲高清| 人人妻,人人澡人人爽秒播| 一级,二级,三级黄色视频| 日日摸夜夜添夜夜添小说| 免费黄频网站在线观看国产| 青草久久国产| 高清欧美精品videossex| 一进一出好大好爽视频| 两人在一起打扑克的视频| 一级黄色大片毛片| 亚洲av电影在线进入| 91大片在线观看| 久久久国产欧美日韩av| 国产亚洲欧美98| 新久久久久国产一级毛片| 一进一出抽搐动态| 丝瓜视频免费看黄片| 国产欧美日韩综合在线一区二区| 男人舔女人的私密视频| 精品熟女少妇八av免费久了| 久久久精品区二区三区| 男女之事视频高清在线观看| 色婷婷久久久亚洲欧美| 亚洲av熟女| 又黄又爽又免费观看的视频| 老鸭窝网址在线观看| 777久久人妻少妇嫩草av网站| 欧美精品人与动牲交sv欧美| 欧美人与性动交α欧美软件| а√天堂www在线а√下载 | 在线天堂中文资源库| 久久青草综合色| 黄色视频不卡| 黑人操中国人逼视频| 国产一区二区三区在线臀色熟女 | 午夜免费成人在线视频| 女人精品久久久久毛片| 天天躁狠狠躁夜夜躁狠狠躁| 校园春色视频在线观看| 1024香蕉在线观看| 看免费av毛片| 色94色欧美一区二区| 精品国产国语对白av| 亚洲九九香蕉| 亚洲午夜精品一区,二区,三区| 欧美精品人与动牲交sv欧美| 麻豆乱淫一区二区| 久久香蕉激情| 女人高潮潮喷娇喘18禁视频| 91麻豆av在线| 少妇被粗大的猛进出69影院| 制服人妻中文乱码| 啦啦啦 在线观看视频| 在线观看免费高清a一片| 国产精品一区二区在线观看99| 在线观看舔阴道视频| 狠狠婷婷综合久久久久久88av| 国产精品乱码一区二三区的特点 | 国产免费现黄频在线看| 在线播放国产精品三级| 极品少妇高潮喷水抽搐| 99re6热这里在线精品视频| 精品福利永久在线观看| 正在播放国产对白刺激| 变态另类成人亚洲欧美熟女 | 伦理电影免费视频| 久久久久久人人人人人| 中文字幕人妻丝袜制服| 久久国产亚洲av麻豆专区| 国产精品国产av在线观看| 亚洲免费av在线视频| 中文字幕制服av| 十八禁人妻一区二区| 老熟妇乱子伦视频在线观看| 丝袜美腿诱惑在线| 一级毛片精品| 人人妻人人爽人人添夜夜欢视频| 国产精品久久电影中文字幕 | 亚洲av熟女| 午夜福利影视在线免费观看| 国产欧美亚洲国产| 成人18禁高潮啪啪吃奶动态图| 国产淫语在线视频| 99久久精品国产亚洲精品| 12—13女人毛片做爰片一| 18禁裸乳无遮挡免费网站照片 | 搡老岳熟女国产| 成年女人毛片免费观看观看9 | 国产主播在线观看一区二区| 久久ye,这里只有精品| 高清视频免费观看一区二区| 在线国产一区二区在线| 亚洲av熟女| 老司机在亚洲福利影院| 男女之事视频高清在线观看| 欧美乱码精品一区二区三区| 日韩熟女老妇一区二区性免费视频| 亚洲国产中文字幕在线视频| 怎么达到女性高潮| 国产男靠女视频免费网站| 久99久视频精品免费| 激情视频va一区二区三区| 天天操日日干夜夜撸| 免费日韩欧美在线观看| 性色av乱码一区二区三区2| 男男h啪啪无遮挡| 99热只有精品国产| av天堂久久9| 亚洲,欧美精品.| 两个人看的免费小视频| 午夜福利欧美成人| 青草久久国产| 精品国产亚洲在线| av网站免费在线观看视频| 久久精品亚洲熟妇少妇任你| 亚洲性夜色夜夜综合| 在线观看免费高清a一片| 露出奶头的视频| 午夜福利影视在线免费观看| 天堂中文最新版在线下载| 午夜福利影视在线免费观看| 日韩熟女老妇一区二区性免费视频| 在线观看免费高清a一片| av有码第一页| 精品少妇久久久久久888优播| 黄片小视频在线播放| 丰满人妻熟妇乱又伦精品不卡| 国产又色又爽无遮挡免费看| 色综合欧美亚洲国产小说| 欧美在线黄色| 亚洲精品国产一区二区精华液| 国产精品香港三级国产av潘金莲| 婷婷丁香在线五月| 天天躁狠狠躁夜夜躁狠狠躁| 日韩一卡2卡3卡4卡2021年| 久久久国产欧美日韩av| 亚洲一卡2卡3卡4卡5卡精品中文| 亚洲精品国产区一区二| 交换朋友夫妻互换小说| 国产乱人伦免费视频| 丝袜人妻中文字幕| 下体分泌物呈黄色| 交换朋友夫妻互换小说| 国产精品久久久久成人av| 国产av精品麻豆| 国产激情欧美一区二区| 国产欧美日韩精品亚洲av| 久久热在线av| 亚洲视频免费观看视频| 国产精品美女特级片免费视频播放器 | 99久久国产精品久久久| 午夜视频精品福利| 91国产中文字幕| 亚洲国产欧美日韩在线播放| 欧美日韩一级在线毛片| 国产无遮挡羞羞视频在线观看| 久久精品亚洲av国产电影网| av免费在线观看网站| 男女下面插进去视频免费观看| 少妇 在线观看| 夜夜爽天天搞| 午夜激情av网站| 国产精品 国内视频| 不卡av一区二区三区| 亚洲av第一区精品v没综合| 国产在视频线精品| 日韩欧美免费精品| 一本大道久久a久久精品| 99国产综合亚洲精品| 欧美国产精品va在线观看不卡| 中文字幕另类日韩欧美亚洲嫩草| 王馨瑶露胸无遮挡在线观看| 国产成人精品在线电影| 热re99久久国产66热| 亚洲,欧美精品.| 在线播放国产精品三级| 亚洲第一av免费看| 久久久国产成人精品二区 | 午夜影院日韩av| 女人精品久久久久毛片| 亚洲第一av免费看| 日本撒尿小便嘘嘘汇集6| 欧美日韩黄片免| 老鸭窝网址在线观看| 亚洲av成人一区二区三| 亚洲久久久国产精品| √禁漫天堂资源中文www| 亚洲美女黄片视频| 女警被强在线播放| 妹子高潮喷水视频| 夜夜爽天天搞| 两性午夜刺激爽爽歪歪视频在线观看 | 国产亚洲精品久久久久5区| 亚洲一区二区三区不卡视频| 亚洲七黄色美女视频| 亚洲欧美日韩另类电影网站| 欧美日韩成人在线一区二区| 一区二区三区激情视频| 中文字幕人妻熟女乱码| 亚洲少妇的诱惑av| 国产精华一区二区三区| 亚洲自偷自拍图片 自拍| 一本一本久久a久久精品综合妖精| 夜夜夜夜夜久久久久| 日韩中文字幕欧美一区二区| 中文字幕另类日韩欧美亚洲嫩草| 国产在线精品亚洲第一网站| 女人高潮潮喷娇喘18禁视频| 热99re8久久精品国产| 亚洲少妇的诱惑av| 女人被狂操c到高潮| 日韩中文字幕欧美一区二区| 日韩欧美免费精品| 精品少妇久久久久久888优播| 99re在线观看精品视频| 99精品久久久久人妻精品| 国产精品98久久久久久宅男小说| 国产一区二区激情短视频| svipshipincom国产片| 日韩欧美国产一区二区入口| 国产黄色免费在线视频| 亚洲专区字幕在线| 亚洲精品美女久久久久99蜜臀| 成熟少妇高潮喷水视频| 韩国精品一区二区三区| 嫁个100分男人电影在线观看| 欧美乱色亚洲激情| 五月开心婷婷网| 丰满迷人的少妇在线观看| 在线观看一区二区三区激情| 精品熟女少妇八av免费久了| 亚洲专区国产一区二区| 免费观看人在逋| 免费一级毛片在线播放高清视频 | 国产97色在线日韩免费| 丝袜在线中文字幕| 亚洲精华国产精华精| 超碰成人久久| 露出奶头的视频| 人妻丰满熟妇av一区二区三区 | 久久中文字幕一级| 窝窝影院91人妻| 欧美激情 高清一区二区三区| 精品欧美一区二区三区在线| 久久人人97超碰香蕉20202| 男人的好看免费观看在线视频 | 国产亚洲精品久久久久5区| 丁香六月欧美| 国产精品二区激情视频| 多毛熟女@视频| 欧美在线黄色| 色尼玛亚洲综合影院| 男女床上黄色一级片免费看| 男男h啪啪无遮挡| 亚洲精品美女久久久久99蜜臀| 欧美国产精品一级二级三级| 亚洲成人免费av在线播放| bbb黄色大片| 久久久久久人人人人人| 18禁裸乳无遮挡免费网站照片 | 露出奶头的视频| 99精品在免费线老司机午夜| 日本五十路高清| 别揉我奶头~嗯~啊~动态视频|