• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于詞向量的中文微博實體鏈接方法

    2017-04-24 10:24:49毛二松唐永旺
    計算機應(yīng)用與軟件 2017年4期
    關(guān)鍵詞:知識庫實體語義

    毛二松 王 波 唐永旺 梁 丹

    (解放軍信息工程大學(xué) 河南 鄭州 450002)

    基于詞向量的中文微博實體鏈接方法

    毛二松 王 波 唐永旺 梁 丹

    (解放軍信息工程大學(xué) 河南 鄭州 450002)

    實體鏈接是指給定實體指稱項和它所在的文本,將其鏈接到給定知識庫中的目標(biāo)實體上。由于微博內(nèi)容存在特征稀疏、用語不規(guī)范的特點,使用傳統(tǒng)的方法效果較差,為了準(zhǔn)確地對微博中給定的實體進行鏈接,提出一種基于詞向量的中文微博實體鏈接方法。首先,對知識庫進行擴展,并從中文維基百科抽取同義詞構(gòu)建同義詞表;然后,利用詞向量解決錯別字和外來人名音譯的問題;最后,通過詞向量計算實體指稱項和候選實體的語義相似度來進行實體鏈接。實驗結(jié)果表明,該方法在NLP&CC2013評測數(shù)據(jù)上的微平均準(zhǔn)確率達到了91.4%。

    實體鏈接 詞向量 維基百科 同義詞

    0 引 言

    隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,基于互聯(lián)網(wǎng)信息構(gòu)建的知識庫的出現(xiàn)促使自然語言處理中出現(xiàn)了一項新的任務(wù),即實體鏈接[1]。實體鏈接是指給定實體指稱項和它所在的文本,將其鏈接到知識庫中目標(biāo)實體上。然而現(xiàn)實中的實體存在歧義性和多樣性的問題,如何將存在歧義的實體正確地鏈接到知識庫中對應(yīng)的實體上在知識庫的構(gòu)建與擴展、知識圖譜和信息檢索等領(lǐng)域具有重要的理論意義和應(yīng)用前景[2]。

    已有的研究大多專注于英文實體鏈接,對于中文的實體鏈接研究較晚,雖然在TAC2011中引入了中文實體鏈接任務(wù),但它的實質(zhì)是將中文實體指稱鏈接到英文知識庫中,因而屬于跨語言實體鏈接范疇[3]。而一些會議如CLP(Chinese Language Processing)和WePS(Web People Search)只是針對人名進行鏈接。2013年自然語言處理與中文計算會議NLP&CC(Natural Language Processing & Chinese Computing)設(shè)置了中文微博實體鏈接評測任務(wù),旨在將中文微博中的實體(人名、地名、組織機構(gòu)名等)鏈接到知識庫中目標(biāo)實體上。NLP&CC2013會議給出中文微博實體鏈接的定義為給定一條微博,一個待鏈接的實體指稱項,以及該實體指稱項在這條微博中出現(xiàn)的位置。首先判斷該實體指稱項是否指向了知識庫中的某一個實體;若存在這樣的對應(yīng)實體,則將該實體在知識庫中的編號輸出,若不存在,則輸出空置符NIL。

    實體鏈接任務(wù)的主要步驟為先獲取實體指稱項的候選實體,之后計算實體指稱項的上下文和候選實體上下文的語義相似度,選擇相似度最大的候選實體作為鏈接的目標(biāo)實體[4]。實體鏈接的核心是計算實體指稱項和候選實體上下文的語義相似度,傳統(tǒng)的相似度計算采用詞袋模型BOW(Bow Of Words)[5-6]將實體指稱項和候選實體的上下文表示成BOW向量,計算兩者的余弦距離得到相似度。針對文獻[5-6]僅僅考慮實體指稱項與候選實體之間的語義相似度,2011年,Han等[7]提出一種基于圖模型的協(xié)同實體鏈接方法,利用協(xié)同式策略考慮知識庫中實體間的語義關(guān)聯(lián),建立全局語義約束,能夠更準(zhǔn)確地對文本中的實體進行鏈接。其中圖中節(jié)點為所有的實體指稱和知識庫中的目標(biāo)實體,通過使用詞袋模型的方法得到實體指稱和目標(biāo)實體的語義相似度,使用基于維基百科的鏈接關(guān)系得到目標(biāo)實體之間的語義相似度。2013年,Zeng等[8]通過對內(nèi)容過于簡短的微博進行適當(dāng)?shù)臄U充來增加實體的上下文特征,使用漸進式的詞袋模型S-BOW(Stepwise Bag-of-Words)來計算實體指稱項和候選實體之間的語義相似度。2015年,昝紅英等[9]針對微博中的實體具有多樣性的問題,提出了一種基于多源知識的中文微博命名實體鏈接方法,通過將同義詞詞典、百科資源等知識與詞袋模型相結(jié)合的方法來計算實體指稱項和候選實體之間的語義相似度,之后進行實體鏈接,實驗結(jié)果表明該方法能夠有效提高實體鏈接的準(zhǔn)確率。

    然而,基于BOW模型計算相似度的主要缺陷為假設(shè)任意兩個詞之間是相互獨立的,在計算實體指稱項的上下文和候選實體上下文的相似度時無法利用詞語中存在的同義詞、近義詞和相關(guān)詞等語義關(guān)系[10]。此外,微博內(nèi)容具有長度短、語法不規(guī)范的特點,給命名實體鏈接任務(wù)增加了難度。由于微博內(nèi)容長度短,使用基于BOW模型的方法對實體指稱項的上下文進行表示時會造成嚴重的特征稀疏問題;微博內(nèi)容的不規(guī)范性,微博中經(jīng)常出現(xiàn)錯別字和外來人名音譯不統(tǒng)一的問題,如微博中出現(xiàn)的外來人名“薩科齊”與知識庫中的“薩科奇”,其實二者指代的都是同一個人名。

    詞向量最早由Rumelhart等[11]提出的一種詞語表示方式,Mikolov等提出的Skip-gram模型[12]可以快速地完成大規(guī)模數(shù)據(jù)的訓(xùn)練,得到的詞向量在計算詞語之間的語義相似度方面更加準(zhǔn)確。

    綜上所述,為了計算實體指稱項和候選實體上下文的語義相似度更加準(zhǔn)確,提高實體鏈接的準(zhǔn)確率,本文提出一種基于詞向量的中文微博實體鏈接方法,使用詞向量對實體指稱項和候選實體的上下文進行表示,通過詞向量計算兩者之間的語義相似度。另外,無論是錯別字還是外來人名音譯,如“阿里巴巴”和“阿里爸爸”以及外來人名“薩科齊”和“薩科奇”,兩者之間都具有相同的語義信息,本文基于此特點使用詞向量來解決錯別字和外來人名音譯的問題。

    1 中文微博實體鏈接的總體框架

    中文微博實體鏈接任務(wù)可定義為如下的五元組:

    G=(M,C,D,S,θ)

    (1)

    其中,M是實體指稱項集合,C是知識庫候選實體集合,D是實體指稱項的上下文詞語集合,S是候選實體的上下文詞語集合,θ:M×D×S→C是實體鏈接函數(shù),將實體指稱項映射到知識庫目標(biāo)實體上。

    中文微博實體鏈接的總體框架如圖1所示。其中包括知識庫擴展、構(gòu)建同義詞表、錯別字和外來人名音譯的處理、獲取候選實體集和實體鏈接共五個模塊。本文首先對知識庫進行擴展,然后從中文維基百科抽取同義詞構(gòu)建同義詞表,之后利用詞向量解決錯別字和外來人名音譯的問題,在獲取候選實體集后,通過詞向量計算實體指稱項和候選實體的語義相似度來進行實體鏈接。

    圖1 中文微博實體鏈接的總體框架

    2 中文微博實體鏈接的具體流程

    2.1 知識庫擴展

    NLP&CC2013會議中實體鏈接評測使用的是百度百科知識庫,由于部分實體存在噪聲、不準(zhǔn)確以及描述不全的情況,因此本文采用以下方法解決上述問題:

    (1) 本文從實體的百度百科中獲取詞條標(biāo)簽,對知識庫的類標(biāo)進行修正。例如,知識庫中的詞條“倚天屠龍刀”,其在知識庫中的分類標(biāo)簽為“地理地貌大陸”,然而該詞條標(biāo)簽為“電視劇影視作品”[13],如表1所示。另外,從該詞條的字面上也可以看出該詞條屬于影視作品。

    表1 “倚天屠龍刀”詞條標(biāo)簽

    (2) 百度百科知識庫中部分實體具有歧義性,為了更準(zhǔn)確地描述知識庫中的實體,本文從百度百科的消歧頁面獲得每個實體的描述詞語。例如,“霸王別姬”實體總共有19個義項,其中“霸王別姬(國產(chǎn)電視劇)”的頁面表明該實體為電視劇名稱;“霸王別姬(歷史典故)”的頁面表明該實體為歷史典故詞語;“霸王別姬(1993年陳凱歌執(zhí)導(dǎo)電影)”的頁面表明該實體為電影名稱。

    2.2 構(gòu)建同義詞表

    由于微博中經(jīng)常出現(xiàn)實體的簡稱、別稱等,為了準(zhǔn)確地對實體進行鏈接,本文從中文維基百科[14]中共抽取735 053個同義詞形成同義詞表。具體構(gòu)建方法如下:

    (1) 從重定向頁面中抽取同義詞

    當(dāng)兩個不同的詞語所指代的含義完全相同或絕大部分人對這兩個詞語的認知一致時,維基百科不會為這兩個詞語建立兩個頁面,而是添加一個重定向鏈接,將該詞語指向另一個詞語的頁面。

    (2) 從維基百科首段加粗內(nèi)容抽取同義詞

    維基百科的首段內(nèi)容會有很多的加粗字體,該加粗字體都是該實體的簡稱、別稱、統(tǒng)稱等等。

    2.3 錯別字和外來人名音譯的處理

    詞向量的基本思想是將每個詞映射成一個k維實數(shù)向量。Mikolov在文獻[12]中指出相比于傳統(tǒng)的語言模型,基于神經(jīng)網(wǎng)絡(luò)語言模型[15]NNML(Neural Network Language Model)得到的詞向量對詞的表示更加準(zhǔn)確。本文使用Mikolov提出的Skip-gram模型在中文數(shù)據(jù)上進行訓(xùn)練。其中Skip-gram模型可以通過Hierarchical Softmax[16]和Negative Sampling[12]兩種框架構(gòu)造實現(xiàn),本文使用的是基于Hierarchical Softmax構(gòu)造的Skip-gram模型。通過詞向量計算詞與詞之間的余弦距離得到詞與詞之間的語義相似度,計算公式如下所示:

    (2)

    其中,v(w1)表示w1的詞向量,v(w2)表示w2的詞向量,sim(v(w1),v(w2))表示通過詞向量計算w1和w2的余弦距離得到w1和w2的語義相似度。

    表2列舉了一些通過詞向量計算詞與詞之間語義相似度的測試結(jié)果。

    表2 詞與詞之間的相似度

    由表2可以發(fā)現(xiàn)和“薩科齊”相似的詞中包括“薩科奇”這種同音詞,“諾維茨基”的相似詞中也包括相似發(fā)音的詞“諾維斯基”。

    本文使用以下原則來解決錯別字和外來人名音譯的問題:

    (1) 待糾錯的實體指稱項和知識庫中的目標(biāo)實體具有相同的字越多,則待糾錯的實體指稱項和該目標(biāo)實體的匹配度越高。例如,待糾錯的實體指稱項“阿里爸爸”與知識庫中的目標(biāo)實體“阿里巴巴”的匹配度要比“諾維茨基”的匹配度高。

    (2) 待糾錯的實體指稱項和知識庫中的目標(biāo)實體的語義相似度越高,則待糾錯的實體指稱項和該目標(biāo)實體的匹配度越高。根據(jù)表2發(fā)現(xiàn)“諾維茨基”和“諾維斯基”的語義相似度要比“阿里巴巴”的相似度高。

    (3) 待糾錯的實體指稱項和知識庫中的目標(biāo)實體的長度必須相同。這里假設(shè)待糾錯的實體指稱項仍然和自身的長度相同,例如,待糾錯的實體指稱項“阿里爸爸”的真實實體仍然是四個字,不可能是其他長度的實體。

    最后,選擇匹配度越高的目標(biāo)實體作為待糾錯實體指稱項的真實實體。根據(jù)以上原則,計算兩者的匹配度公式如下所示:

    (3)

    其中,mi表示第i個待糾錯的實體指稱項,ej表示知識庫中第j個目標(biāo)實體,l(mi)表示mi的字數(shù),l(ej)表示ej的字數(shù),sl(mi,ej)表示mi和ej相同的字數(shù),sim(v(mi),v(ej))表示mi和ej的語義相似度;若mi和ej的字數(shù)不相等,則match(mi,ej)=0;若sim(v(mi),v(ej))的相似度小于0.5,則match(mi,ej)=0。

    2.4 獲取候選實體

    候選實體的獲取是實體鏈接的關(guān)鍵步驟,只有盡可能多地獲取候選實體,下一步才可能正確地鏈接候選實體。如果候選實體集中不包括目標(biāo)實體,則無論使用何種方法都無法正確實現(xiàn)鏈接。獲取候選實體的具體方法如表3所示。

    表3 獲取候選實體的具體流程

    2.5 實體鏈接

    獲得每個實體指稱項的候選實體之后,通過計算該實體指稱項和候選實體的語義相似度,并選擇相似度最大的候選實體。然而候選實體中最大的相似度有可能太低,相似度最大的候選實體未必是鏈接的目標(biāo)實體,所以實驗中設(shè)置相似度的閾值,只有最大的相似度大于設(shè)定的閾值,則將該候選實體作為鏈接的目標(biāo)實體。例如,實體指稱項“霸王別姬”總共有四個候選實體,分別為“霸王別姬(1993年陳凱歌執(zhí)導(dǎo)電影)”、“霸王別姬(菜肴名稱)”、“霸王別姬(單機RPG游戲)”、“霸王別姬(屠洪剛演唱歌曲)”。實體指稱項“霸王別姬”所在的微博文本為“4月1日,懷念哥哥張國榮!最愛你的《霸王別姬》,美艷動人!”,從微博的上下文內(nèi)容包含“張國榮”一詞可以看出,該實體指稱項“霸王別姬”與“霸王別姬(1993年陳凱歌執(zhí)導(dǎo)電影)”條目的語義相似度最大。

    本文將實體指稱項的上下文和候選實體的上下文表示成詞語的集合。通過對該實體指稱項所在的微博進行分詞,去掉停用詞后,將微博中所有的名詞作為該實體指稱項的上下文。由于實體指稱項所在的微博內(nèi)容有時太過簡短,實體指稱項的上下文信息過于稀疏,而同一個話題實體之間語義相近,因此將該實體指稱項所在話題的所有實體加入到該實體指稱項的上下文中。例如,實體指稱項“霸王別姬”所在的話題所有的實體有“謝婷婷”、“梅艷芳”、“《當(dāng)愛已成往事》”和“林嘉欣”等實體。另外,將候選實體的詞條標(biāo)簽和該候選實體的描述詞語作為該候選實體的上下文,實體指稱項和候選實體的語義相似度計算公式如下所示:

    sim(v(mci),v(ecj))

    (4)

    其中,m表示實體指稱項,e表示候選實體,n表示實體指稱項上下文詞語的個數(shù),l表示候選實體上下文詞語的個數(shù),mci表示實體指稱項上下文中第i個詞語,ecj表示候選實體上下文中第j個詞語,sim(v(m),v(mci))表示通過計算m和mci的語義相似度作為mci詞語的權(quán)重,sim(v(mci),v(ecj))表示mci和ecj的語義相似度。實體鏈接的具體算法流程如表4所示。

    表4 實體鏈接的算法流程

    3 實驗與分析

    3.1 實驗數(shù)據(jù)

    本文采用的實驗數(shù)據(jù)是NLP&CC2013提供的中文微博實體鏈接標(biāo)注的數(shù)據(jù)集,該數(shù)據(jù)集包含560條中文微博,這些微博分布在53個話題中,共有826個待鏈接的實體,其中包括421個能夠鏈接到知識庫 In-KB(In-KnowledgeBase)的實體,405個不能鏈接到知識庫的實體即空鏈接(NIL)的實體。

    實驗中使用的詞向量是使用Skip-gram模型在中文數(shù)據(jù)上訓(xùn)練得到,其中訓(xùn)練數(shù)據(jù)來源于“搜狗實驗室”的“全網(wǎng)新聞數(shù)據(jù)”[17]、中文維基百科語料[14]以及本文的實驗數(shù)據(jù)。

    3.2 評價指標(biāo)

    為了評價本文方法的有效性,采用NLP&CC 2013中文微博實體鏈接任務(wù)的評價標(biāo)準(zhǔn),即微平均準(zhǔn)確率maa(micro-averaged accuracy)作為評價指標(biāo)。其計算式如下:

    (5)

    為了更好地對實驗結(jié)果進行分析,本文對存在鏈接的實體集以及空鏈接的實體集這兩類實體集分別計算準(zhǔn)確率P、召回率R以及F1值。

    (6)

    (7)

    (8)

    其中,TP表示被正確鏈接的實體個數(shù),F(xiàn)P表示被錯誤鏈接的實體個數(shù),F(xiàn)N表示被錯誤鏈接到另一個實體集的實體個數(shù)。

    3.3 實驗結(jié)果

    (1) 相似度閾值θ的影響

    相似度閾值的設(shè)置影響實體的鏈接結(jié)果,通過實驗分析,實體指稱項和候選實體的語義相似度集中在[0,0.2]之間,為了得到合理的閾值,本文對相似度閾值在[0,0.2]范圍內(nèi)以步長為0.01進行遍歷,結(jié)果如圖2所示。

    圖2 參數(shù)θ對微平均準(zhǔn)確率的影響

    從圖2可以看出,微平均準(zhǔn)確率隨著相似度閾值θ的增加呈現(xiàn)出先上升后下降的趨勢,當(dāng)相似度閾值θ為0.04時,微平均準(zhǔn)確率最高,所以相似度閾值θ的大小設(shè)為0.04。

    (2) 錯別字和外來人名音譯對結(jié)果的影響

    為了驗證錯別字和外來人名音譯的問題對實驗結(jié)果的影響,本文設(shè)置兩組實驗,實驗1是沒有對錯別字和外來人名音譯的問題進行處理所得結(jié)果,實驗2則是對該問題處理后所得結(jié)果,實驗結(jié)果如表5所示。

    表5 錯別字和外來人名音譯對結(jié)果的影響 %

    從表5結(jié)果可以看出,實驗2的微平均準(zhǔn)確率高于實驗1的微平均準(zhǔn)確率,而且實驗2中NIL結(jié)果的準(zhǔn)確率比實驗1中NIL結(jié)果的準(zhǔn)確率高出了2.47%。主要是因為一些錯別字和外來人名音譯的實體通過處理得到糾正,例如,實體“阿里爸爸”、“高小松”和“林舒壕”糾正后分別鏈接到知識庫中的實體“阿里巴巴”、“高曉松”和“林書豪”。

    (3) 不同方法的實驗結(jié)果對比

    為了驗證本文方法的有效性,本文選取NLP&CC2013中最好的評測結(jié)果(bestResult)以及Zeng等人[8]使用的S-BOW方法作為baseline進行對比,對實驗結(jié)果取10次求平均作為其最終結(jié)果。

    表6 不同方法的實驗結(jié)果對比 %

    從表6中可以看出,本文方法的微平均準(zhǔn)確率明顯高于S-BOW的微平均準(zhǔn)確率,主要是因為S-BOW方法在計算詞語相似度時無法利用詞語中存在的同義詞、近義詞和相關(guān)詞等語義關(guān)系,另外有些實體所在微博的內(nèi)容太過簡短,實體指稱項的上下文信息過于稀疏,計算實體指稱項的上下文和候選實體的上下文的語義相似度太低,導(dǎo)致實體鏈接錯誤。本文方法的NIL結(jié)果略低于最好的評測結(jié)果,原因在于若實體指稱項有多個候選實體時,這些實體的最佳相似度閾值往往不同,當(dāng)設(shè)置相似度閾值一樣時,會導(dǎo)致部分實體鏈接到NIL中。從整體來看,本文提出的方法是可行并且有效的。

    4 結(jié) 語

    為了準(zhǔn)確地對微博中給定的實體進行鏈接,提出了一種基于詞向量的中文微博實體鏈接方法。首先,對知識庫進行擴展,并從中文維基百科抽取同義詞構(gòu)建同義詞表。然后,利用詞向量解決錯別字和外來人名音譯的問題。最后,通過詞向量計算實體指稱項和候選實體的語義相似度來進行實體鏈接。實驗結(jié)果表明,該方法較傳統(tǒng)的方法的微平均準(zhǔn)確率有了很大的提高。然而,當(dāng)對人名進行鏈接時,其候選實體的職業(yè)相同或相似時,只計算實體指稱項和候選實體的語義相似度來進行實體鏈接容易出現(xiàn)誤判,所以在下一步的研究中,如何解決這種問題將是研究的重點方向。

    [1] 郭宇航, 秦兵, 劉挺, 等. 實體鏈指技術(shù)研究進展[J]. 智能計算機與應(yīng)用, 2014, 4(5): 9-13.

    [2] 陸偉, 武川. 實體鏈接研究綜述[J]. 情報學(xué)報, 2015(1): 105-112.

    [3] 舒佳根, 惠浩添, 錢龍華, 等. 一個中文實體鏈接語料庫的建設(shè)[J]. 北京大學(xué)學(xué)報(自然科學(xué)版), 2015, 51(2): 321-327.

    [4] 趙軍, 劉康, 周光有, 等. 開放式文本信息抽取[J]. 中文信息學(xué)報, 2011, 25(6): 98-110.

    [5]HonnibalM,DaleR.DAMSEL:TheDSTO/MacquarieSystemforEntity-Linking[C]//ProceedingsofTextAnalysisConference2009, 2009.

    [6]BikelD,CastelliV,FlorianR,etal.Entitylinkingandslotfillingthroughstatisticalprocessingandinferencerules[C]//ProceedingsofTextAnalysisConference2009Workshop, 2009.

    [7]HanX,SunL,ZhaoJ.Collectiveentitylinkinginwebtext:agraph-basedmethod[C]//Proceedingsofthe34thInternationalACMSIGIRConferenceonResearchandDevelopmentinInformationRetrieval.ACM, 2011: 765-774.

    [8]ZengY,WangD,ZhangT,etal.LinkingentitiesinshorttextsbasedonaChinesesemanticknowledgebase[C]//TheSecondConferenceonNaturalLanguageProcessingandChineseComputing.Springer, 2013: 266-276.

    [9] 昝紅英, 吳泳鋼, 賈玉祥, 等. 基于多源知識的中文微博命名實體鏈接[J]. 山東大學(xué)學(xué)報(理學(xué)版), 2015, 50(7): 9-16.

    [10]XuanJ,LuJ,ZhangG,etal.ExtensionofsimilaritymeasuresinVSM:Fromorthogonalcoordinatesystemtoaffinecoordinatesystem[C]//NeuralNetworks(IJCNN), 2014InternationalJointConferenceon,IEEE, 2014: 4084-4091.

    [11]RumelhartDE,HintonGE,WilliamsRJ.Learningrepresentationsbyback-propagatingerrors[J].Nature, 1986, 323(6088): 533-536.

    [12]MikolovT,ChenK,CorradoG,etal.Efficientestimationofwordrepresentationsinvectorspace[C]//ProceedingsoftheInternationalConferenceonLearningRepresentations, 2013: 1-12.

    [13] 百度百科. 倚天屠龍記[DB/OL].http://baike.baidu.com/subview/11113/6730113.htm.

    [14] 中文維基百科.zhwikidumpprogress[DB/OL].https://dumps.wikimedia.org/zhwiki/.

    [15]BengioY,DucharmeR,VincentP,etal.Aneuralprobabilisticlanguagemodel[J].TheJournalofMachineLearningResearch, 2003, 3: 1137-1155.

    [16]MorinF,BengioY.Hierarchicalprobabilisticneuralnetworklanguagemodel[C]//Proceedingsofthe10thInternationalWorkshoponArtificialIntelligenceandStatistics, 2005: 246-252.

    [17] 搜狗實驗室. 全網(wǎng)新聞數(shù)據(jù)[DB/OL].http://www.sogou.com/labs/resource/ca.php.

    ENTITY LINKING METHOD OF CHINESE MICRO-BLOG BASED ON WORD VECTOR

    Mao Ersong Wang Bo Tang Yongwang Liang Dan

    (ThePLAInformationEngineeringUniversity,Zhengzhou450002,Henan,China)

    Entity linking refers to a given entity referring to an item and its text, linking it to a target entity in a given knowledge base. Due to the characteristics of micro-blog content sparse, non-standard terms, the use of traditional methods less effective.In order to accurately link to a given entity in microblogging, a method based on word vector for Chinese microblogging entity linking is proposed. First, the knowledge base is extended, and synonyms are extracted from the Chinese Wikipedia to construct the synonym list. Then, using the word vector to solve typos and foreign name transliteration problem. Finally, the entity link is calculated by computing the semantic similarity between the entity and the candidate entity. The experimental results show that the micro-averaged accuracy of the proposed method is 91.4% on the NLP&CC2013 evaluation data.

    Entity linking Word vector Wikipedia Synonyms

    2016-02-13。國家社會科學(xué)基金項目(14BXW028)。毛二松,碩士生,主研領(lǐng)域:社會計算。王波,副教授。唐永旺,講師。梁丹,碩士生。

    TP391

    A

    10.3969/j.issn.1000-386x.2017.04.003

    猜你喜歡
    知識庫實體語義
    語言與語義
    前海自貿(mào)區(qū):金融服務(wù)實體
    中國外匯(2019年18期)2019-11-25 01:41:54
    基于TRIZ與知識庫的創(chuàng)新模型構(gòu)建及在注塑機設(shè)計中的應(yīng)用
    實體的可感部分與實體——兼論亞里士多德分析實體的兩種模式
    兩會進行時:緊扣實體經(jīng)濟“釘釘子”
    振興實體經(jīng)濟地方如何“釘釘子”
    高速公路信息系統(tǒng)維護知識庫的建立和應(yīng)用
    “上”與“下”語義的不對稱性及其認知闡釋
    基于Drupal發(fā)布學(xué)者知識庫關(guān)聯(lián)數(shù)據(jù)的研究
    圖書館研究(2015年5期)2015-12-07 04:05:48
    認知范疇模糊與語義模糊
    麻豆成人午夜福利视频| 有码 亚洲区| 美女xxoo啪啪120秒动态图| 午夜免费激情av| 干丝袜人妻中文字幕| 99热这里只有是精品50| 欧美日韩综合久久久久久| 嫩草影视91久久| 亚洲国产欧洲综合997久久,| 天天躁日日操中文字幕| 亚洲不卡免费看| 久久精品国产亚洲av涩爱 | 精品久久久久久久久亚洲| 嫩草影院精品99| 成人性生交大片免费视频hd| 联通29元200g的流量卡| 色哟哟哟哟哟哟| 男人舔女人下体高潮全视频| 色播亚洲综合网| 啦啦啦啦在线视频资源| 不卡视频在线观看欧美| 国产三级在线视频| 观看美女的网站| 99热6这里只有精品| 国产精品一区二区免费欧美| 免费av不卡在线播放| 少妇被粗大猛烈的视频| 男女视频在线观看网站免费| 九九爱精品视频在线观看| 日本熟妇午夜| 男人舔女人下体高潮全视频| 97热精品久久久久久| 欧美高清性xxxxhd video| 亚洲欧美日韩东京热| 欧美+亚洲+日韩+国产| 国产av不卡久久| 亚洲va在线va天堂va国产| 亚洲不卡免费看| 伦理电影大哥的女人| 搡老岳熟女国产| 免费大片18禁| 欧美极品一区二区三区四区| 日本成人三级电影网站| 97超视频在线观看视频| 最近在线观看免费完整版| 国产aⅴ精品一区二区三区波| 白带黄色成豆腐渣| 国产私拍福利视频在线观看| 国产成人影院久久av| 色尼玛亚洲综合影院| 精品福利观看| 国产精品,欧美在线| 在线观看午夜福利视频| 亚洲在线观看片| 亚洲国产高清在线一区二区三| av免费在线看不卡| 在线免费十八禁| 国产探花在线观看一区二区| 国产一级毛片七仙女欲春2| 美女黄网站色视频| 免费观看的影片在线观看| 国产综合懂色| 国产高清不卡午夜福利| 亚洲av美国av| 国产精品美女特级片免费视频播放器| 亚洲成av人片在线播放无| 男人舔奶头视频| АⅤ资源中文在线天堂| 天天躁日日操中文字幕| 干丝袜人妻中文字幕| 亚洲第一电影网av| 国产乱人偷精品视频| 亚洲欧美精品综合久久99| 乱码一卡2卡4卡精品| 日日摸夜夜添夜夜添小说| 看免费成人av毛片| 成年女人看的毛片在线观看| 成人毛片a级毛片在线播放| 亚洲欧美日韩无卡精品| 亚洲内射少妇av| av视频在线观看入口| 久久午夜亚洲精品久久| 成人二区视频| 男女那种视频在线观看| 国产精品不卡视频一区二区| 精品不卡国产一区二区三区| av在线观看视频网站免费| 日韩欧美三级三区| 狠狠狠狠99中文字幕| 日本一二三区视频观看| 欧美潮喷喷水| 国产三级在线视频| 国产精品久久视频播放| 亚洲人成网站高清观看| 一个人观看的视频www高清免费观看| 亚洲av不卡在线观看| 国产白丝娇喘喷水9色精品| 午夜a级毛片| 国产精品久久久久久av不卡| 国内久久婷婷六月综合欲色啪| 日本成人三级电影网站| 亚洲内射少妇av| 国产中年淑女户外野战色| 国产精品野战在线观看| 美女免费视频网站| 最近手机中文字幕大全| 看黄色毛片网站| 此物有八面人人有两片| 嫩草影院新地址| 成人亚洲精品av一区二区| 亚洲色图av天堂| 国产蜜桃级精品一区二区三区| 最后的刺客免费高清国语| 丝袜喷水一区| 蜜臀久久99精品久久宅男| 99九九线精品视频在线观看视频| 国产精品永久免费网站| 国产一级毛片七仙女欲春2| 精品久久国产蜜桃| 性欧美人与动物交配| 国产精品国产高清国产av| 久久婷婷人人爽人人干人人爱| 日韩欧美精品免费久久| 欧美高清成人免费视频www| 欧美日韩在线观看h| 亚洲欧美日韩卡通动漫| 亚洲欧美日韩高清在线视频| 色在线成人网| 精品久久久久久久末码| 午夜视频国产福利| 亚洲乱码一区二区免费版| 最近中文字幕高清免费大全6| 欧美高清性xxxxhd video| 高清午夜精品一区二区三区 | 午夜老司机福利剧场| 天堂网av新在线| 在线观看av片永久免费下载| 超碰av人人做人人爽久久| 成人二区视频| 免费av不卡在线播放| 天堂动漫精品| 免费看日本二区| 三级经典国产精品| 国国产精品蜜臀av免费| 亚洲不卡免费看| 亚洲欧美精品自产自拍| 日韩强制内射视频| 欧美色欧美亚洲另类二区| 极品教师在线视频| 高清午夜精品一区二区三区 | 久久久国产成人免费| 少妇的逼水好多| 无遮挡黄片免费观看| 免费搜索国产男女视频| 久久久久久久亚洲中文字幕| 色在线成人网| 97热精品久久久久久| 青春草视频在线免费观看| 亚洲真实伦在线观看| 亚洲aⅴ乱码一区二区在线播放| av黄色大香蕉| 蜜臀久久99精品久久宅男| 欧美激情在线99| 久久人妻av系列| 日韩av不卡免费在线播放| 在线观看美女被高潮喷水网站| 亚洲美女搞黄在线观看 | 麻豆精品久久久久久蜜桃| 国产午夜精品论理片| 久久婷婷人人爽人人干人人爱| 国产片特级美女逼逼视频| 欧美日本视频| 99久久精品热视频| 成年免费大片在线观看| 亚洲电影在线观看av| 日韩强制内射视频| 午夜久久久久精精品| 91久久精品电影网| 69av精品久久久久久| 十八禁国产超污无遮挡网站| 18禁黄网站禁片免费观看直播| 国产一区二区三区在线臀色熟女| 真实男女啪啪啪动态图| 精品久久久久久久久亚洲| 亚洲欧美清纯卡通| 一个人看视频在线观看www免费| 99久久精品热视频| 亚洲成a人片在线一区二区| 色综合色国产| АⅤ资源中文在线天堂| 内地一区二区视频在线| 此物有八面人人有两片| 男女视频在线观看网站免费| 国产伦精品一区二区三区四那| 国产真实伦视频高清在线观看| 日韩av在线大香蕉| 亚洲中文日韩欧美视频| 久久99热这里只有精品18| 人妻少妇偷人精品九色| 三级男女做爰猛烈吃奶摸视频| 亚洲国产欧美人成| 免费黄网站久久成人精品| 悠悠久久av| 国产黄色小视频在线观看| 国产综合懂色| eeuss影院久久| 久久午夜亚洲精品久久| 国语自产精品视频在线第100页| АⅤ资源中文在线天堂| 尤物成人国产欧美一区二区三区| 久久精品人妻少妇| 男人的好看免费观看在线视频| 亚洲成av人片在线播放无| 日韩欧美一区二区三区在线观看| 国产精品一二三区在线看| 一级黄色大片毛片| 观看美女的网站| 亚洲av成人精品一区久久| 深夜a级毛片| 一本一本综合久久| 三级男女做爰猛烈吃奶摸视频| 综合色av麻豆| 精品久久久久久久久久免费视频| 男人舔女人下体高潮全视频| 97超级碰碰碰精品色视频在线观看| 亚洲精品一卡2卡三卡4卡5卡| 久久精品综合一区二区三区| 99久久成人亚洲精品观看| 日日啪夜夜撸| 99久国产av精品国产电影| 熟妇人妻久久中文字幕3abv| 久久精品综合一区二区三区| 淫妇啪啪啪对白视频| 久久国产乱子免费精品| 非洲黑人性xxxx精品又粗又长| 亚洲专区国产一区二区| 亚洲av第一区精品v没综合| 精品国内亚洲2022精品成人| 国产高清激情床上av| 午夜激情欧美在线| 免费在线观看影片大全网站| 国产成人影院久久av| 欧美+日韩+精品| 久久6这里有精品| 一级毛片aaaaaa免费看小| 午夜a级毛片| 中文字幕精品亚洲无线码一区| 国产精品1区2区在线观看.| 嫩草影院精品99| av在线老鸭窝| 色综合亚洲欧美另类图片| 非洲黑人性xxxx精品又粗又长| 欧美日韩综合久久久久久| 国产精品女同一区二区软件| 午夜免费男女啪啪视频观看 | 国产精品野战在线观看| 国产成年人精品一区二区| 精品午夜福利视频在线观看一区| 又粗又爽又猛毛片免费看| 性色avwww在线观看| 尾随美女入室| 成年女人永久免费观看视频| 国内精品久久久久精免费| 男人舔女人下体高潮全视频| 男人狂女人下面高潮的视频| 此物有八面人人有两片| 人妻少妇偷人精品九色| 身体一侧抽搐| 毛片一级片免费看久久久久| 搞女人的毛片| 欧美一区二区亚洲| 国产在线男女| 国产一区亚洲一区在线观看| 国产乱人偷精品视频| 亚洲国产精品sss在线观看| 乱系列少妇在线播放| 在线观看66精品国产| 18禁在线播放成人免费| 日韩在线高清观看一区二区三区| 国产精品日韩av在线免费观看| 国产在视频线在精品| 少妇人妻一区二区三区视频| 在线免费十八禁| 精品不卡国产一区二区三区| 一个人观看的视频www高清免费观看| 97超碰精品成人国产| 国产成年人精品一区二区| 蜜桃久久精品国产亚洲av| 日本与韩国留学比较| av女优亚洲男人天堂| 成人亚洲欧美一区二区av| 69人妻影院| 国产在线男女| 国国产精品蜜臀av免费| 可以在线观看毛片的网站| 久久久久久久久大av| 欧美中文日本在线观看视频| 亚洲精品在线观看二区| 国产欧美日韩一区二区精品| 成人特级黄色片久久久久久久| 一个人观看的视频www高清免费观看| 日日摸夜夜添夜夜添av毛片| 国产精品一区二区三区四区久久| 久久久久精品国产欧美久久久| 欧美又色又爽又黄视频| 少妇人妻精品综合一区二区 | 日本五十路高清| 日韩亚洲欧美综合| 你懂的网址亚洲精品在线观看 | 久久精品综合一区二区三区| 日日摸夜夜添夜夜添小说| 亚洲av美国av| 精品久久久久久久久久免费视频| 亚洲一级一片aⅴ在线观看| 高清毛片免费看| 成人三级黄色视频| 国产69精品久久久久777片| 日韩人妻高清精品专区| 亚洲欧美中文字幕日韩二区| 两个人的视频大全免费| 老司机影院成人| 九九在线视频观看精品| 欧美成人a在线观看| 看免费成人av毛片| 亚洲av熟女| 成人永久免费在线观看视频| 免费看美女性在线毛片视频| 国产精品亚洲美女久久久| 久久久精品94久久精品| 午夜免费男女啪啪视频观看 | 天天一区二区日本电影三级| 狠狠狠狠99中文字幕| av在线亚洲专区| 97在线视频观看| 99精品在免费线老司机午夜| 国产精品一区二区三区四区久久| 国产色婷婷99| 亚洲内射少妇av| 精品一区二区三区av网在线观看| 99热只有精品国产| 天堂网av新在线| 99热只有精品国产| 午夜精品一区二区三区免费看| 91麻豆精品激情在线观看国产| 一卡2卡三卡四卡精品乱码亚洲| 国产精品福利在线免费观看| 欧美3d第一页| 亚洲成人中文字幕在线播放| 晚上一个人看的免费电影| 亚洲美女黄片视频| 国产精品伦人一区二区| 99国产极品粉嫩在线观看| 51国产日韩欧美| 悠悠久久av| 男人和女人高潮做爰伦理| 成年版毛片免费区| 99久久无色码亚洲精品果冻| 日韩精品中文字幕看吧| 欧美成人a在线观看| 成年版毛片免费区| 一边摸一边抽搐一进一小说| 插逼视频在线观看| 一本久久中文字幕| av.在线天堂| 男人的好看免费观看在线视频| 精品不卡国产一区二区三区| 禁无遮挡网站| 欧美三级亚洲精品| 精品欧美国产一区二区三| 国产精品久久久久久久电影| 最近手机中文字幕大全| 精品一区二区三区人妻视频| 最近在线观看免费完整版| 人妻夜夜爽99麻豆av| 好男人在线观看高清免费视频| 成人特级黄色片久久久久久久| 18禁裸乳无遮挡免费网站照片| 国产老妇女一区| 97热精品久久久久久| 小说图片视频综合网站| 毛片女人毛片| 身体一侧抽搐| 国产麻豆成人av免费视频| 国产爱豆传媒在线观看| 一级黄片播放器| 蜜臀久久99精品久久宅男| 午夜精品在线福利| 亚洲av二区三区四区| 黄色视频,在线免费观看| 中出人妻视频一区二区| 精品一区二区三区人妻视频| 日韩强制内射视频| 亚洲不卡免费看| 国产精品综合久久久久久久免费| 亚洲av熟女| 真人做人爱边吃奶动态| av国产免费在线观看| 简卡轻食公司| av天堂中文字幕网| 99九九线精品视频在线观看视频| 国产 一区 欧美 日韩| 最好的美女福利视频网| 俺也久久电影网| 国产精品一区二区三区四区免费观看 | 国产精品综合久久久久久久免费| 69av精品久久久久久| 人人妻人人看人人澡| 一进一出好大好爽视频| 欧美3d第一页| 一区二区三区高清视频在线| 欧美激情在线99| 国产精品不卡视频一区二区| 深夜精品福利| 中文字幕久久专区| 久久久精品欧美日韩精品| 欧美日韩国产亚洲二区| 少妇猛男粗大的猛烈进出视频 | 国内揄拍国产精品人妻在线| 中文在线观看免费www的网站| 永久网站在线| 亚洲av免费高清在线观看| 国产女主播在线喷水免费视频网站 | 国产伦一二天堂av在线观看| 日日干狠狠操夜夜爽| 国产精品一区二区三区四区免费观看 | 免费观看精品视频网站| 噜噜噜噜噜久久久久久91| 色5月婷婷丁香| 两个人视频免费观看高清| 亚洲经典国产精华液单| 美女内射精品一级片tv| 亚洲高清免费不卡视频| 国产午夜福利久久久久久| 别揉我奶头~嗯~啊~动态视频| 亚洲激情五月婷婷啪啪| 成人二区视频| 国产伦精品一区二区三区视频9| 国产aⅴ精品一区二区三区波| 免费高清视频大片| 午夜免费男女啪啪视频观看 | 欧美日韩综合久久久久久| 久久国内精品自在自线图片| 午夜福利高清视频| 国产单亲对白刺激| 婷婷六月久久综合丁香| 人妻丰满熟妇av一区二区三区| 麻豆国产97在线/欧美| 欧美高清成人免费视频www| 精品久久久久久久久久久久久| 1000部很黄的大片| 欧美色欧美亚洲另类二区| 97人妻精品一区二区三区麻豆| 午夜福利成人在线免费观看| 91麻豆精品激情在线观看国产| 久久久精品大字幕| 中文字幕熟女人妻在线| 色综合色国产| 男人和女人高潮做爰伦理| 又粗又爽又猛毛片免费看| 成人二区视频| 久久久久久久久大av| 99热精品在线国产| 黄色视频,在线免费观看| 欧美激情久久久久久爽电影| 国产精华一区二区三区| 亚洲av中文av极速乱| 老司机午夜福利在线观看视频| 日韩制服骚丝袜av| 美女被艹到高潮喷水动态| 深爱激情五月婷婷| av天堂中文字幕网| 午夜爱爱视频在线播放| 一级a爱片免费观看的视频| 直男gayav资源| 免费高清视频大片| 伦精品一区二区三区| 亚洲五月天丁香| 精品一区二区三区视频在线观看免费| 美女 人体艺术 gogo| 日韩精品青青久久久久久| 极品教师在线视频| 日韩三级伦理在线观看| 久久亚洲国产成人精品v| 亚洲国产精品成人综合色| 国产视频一区二区在线看| 国产精品一区www在线观看| 无遮挡黄片免费观看| 99久久成人亚洲精品观看| 国产成人福利小说| 欧美激情国产日韩精品一区| 久久久久国内视频| 男女啪啪激烈高潮av片| 亚洲av不卡在线观看| 亚洲av美国av| 中文资源天堂在线| 一区二区三区免费毛片| 男女啪啪激烈高潮av片| 成年av动漫网址| 亚州av有码| 在线播放无遮挡| 毛片一级片免费看久久久久| 国产高清视频在线播放一区| 干丝袜人妻中文字幕| 免费av毛片视频| 国产在线男女| 国产成人a∨麻豆精品| 国产免费一级a男人的天堂| 桃色一区二区三区在线观看| 香蕉av资源在线| 免费一级毛片在线播放高清视频| 日本爱情动作片www.在线观看 | 精品无人区乱码1区二区| 久久精品久久久久久噜噜老黄 | 精品日产1卡2卡| 日韩制服骚丝袜av| 波多野结衣巨乳人妻| 69av精品久久久久久| 两个人的视频大全免费| 中出人妻视频一区二区| 国产高清视频在线观看网站| 欧美绝顶高潮抽搐喷水| 国内精品宾馆在线| 村上凉子中文字幕在线| 国产在视频线在精品| 淫秽高清视频在线观看| .国产精品久久| 亚洲人与动物交配视频| 草草在线视频免费看| 大又大粗又爽又黄少妇毛片口| 午夜亚洲福利在线播放| 亚洲中文字幕一区二区三区有码在线看| 夜夜夜夜夜久久久久| 亚洲综合色惰| 中国美白少妇内射xxxbb| 午夜老司机福利剧场| 亚洲精品在线观看二区| av黄色大香蕉| 欧美性感艳星| 亚洲国产高清在线一区二区三| a级毛色黄片| 色吧在线观看| 国产伦在线观看视频一区| 午夜老司机福利剧场| av天堂在线播放| 亚洲第一电影网av| 我要看日韩黄色一级片| 在线天堂最新版资源| 久久99热6这里只有精品| 免费电影在线观看免费观看| 亚洲性久久影院| 插阴视频在线观看视频| 日本与韩国留学比较| 男女那种视频在线观看| 日韩成人av中文字幕在线观看 | 国产视频内射| 99久久中文字幕三级久久日本| 日日摸夜夜添夜夜添av毛片| 春色校园在线视频观看| 国产一区二区三区av在线 | 一级黄色大片毛片| 亚洲成a人片在线一区二区| 国产精品,欧美在线| 欧美+日韩+精品| 日韩亚洲欧美综合| 一a级毛片在线观看| 免费一级毛片在线播放高清视频| 嫩草影院入口| av天堂在线播放| 男女那种视频在线观看| а√天堂www在线а√下载| 身体一侧抽搐| 午夜精品国产一区二区电影 | 三级国产精品欧美在线观看| 老司机午夜福利在线观看视频| 天堂√8在线中文| 老熟妇乱子伦视频在线观看| 午夜激情欧美在线| av免费在线看不卡| 久久精品国产亚洲av涩爱 | 亚洲丝袜综合中文字幕| 99久久无色码亚洲精品果冻| 日日啪夜夜撸| 国产高清三级在线| 岛国在线免费视频观看| 日韩欧美 国产精品| 亚洲av不卡在线观看| 色综合站精品国产| 亚洲人成网站在线播放欧美日韩| 干丝袜人妻中文字幕| 哪里可以看免费的av片| 人人妻人人澡人人爽人人夜夜 | 国产精品1区2区在线观看.| 在线看三级毛片| 国产成年人精品一区二区| 看黄色毛片网站| 一区二区三区四区激情视频 | 亚洲av美国av| 国产毛片a区久久久久| 99热6这里只有精品| 亚洲av免费在线观看| 日韩,欧美,国产一区二区三区 | 97热精品久久久久久| 日韩欧美精品v在线| 可以在线观看毛片的网站| 在线观看午夜福利视频| 成人三级黄色视频| 真人做人爱边吃奶动态| 最近手机中文字幕大全| 看非洲黑人一级黄片| 日韩在线高清观看一区二区三区| 午夜精品在线福利| 成人国产麻豆网| 国产精品亚洲美女久久久| 亚洲欧美中文字幕日韩二区| 久久久久久伊人网av|