• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    融合句義分析的跨文本人名消歧

    2015-08-10 09:42:26羅森林鄒麗麗石秀民
    浙江大學學報(工學版) 2015年4期
    關鍵詞:消歧實體語義

    張 晗,羅森林,鄒麗麗,石秀民

    (北京理工大學 信息與電子學院,北京100081)

    面對鋪天蓋地的互聯(lián)網(wǎng)信息,搜索引擎的使用逐漸成為大部分網(wǎng)民主要的行為之一.據(jù)Guha等[1]的統(tǒng)計可知,5%~10%使用搜索引擎的用戶搜索請求中包含人名作為查詢詞.然而,現(xiàn)實生活中重名現(xiàn)象十分嚴重,對某一個特定人名的查詢結(jié)果往往是不同現(xiàn)實個體網(wǎng)頁的混合.人名消歧是判斷相同姓名字符串是否指稱現(xiàn)實中相同實體的過程,針對搜索結(jié)果中相同姓名字符串的多文本混合現(xiàn)象,進行文本聚類,即將同名的每一個人的相關文本劃分在一類.人名消歧具有巨大的實際應用價值,是搜索引擎、社交網(wǎng)絡和人名知識庫構(gòu)建等領域的基礎性研究.

    隨著多文本處理的廣泛應用,跨文本人名消歧研究受到越來越多的重視.SemEval-2007評測設立了英文網(wǎng)絡人物搜索任務 Web People Search(WPS)[2].在由ACL SIGHAN 和中文信息學會聯(lián)合組織的CLP 2010(CIPS-SIGHAN Joint Conference on Chinese Language Processing)上首次設置了中文跨文本人名消歧任務,并且在CLP 2012上再次設置了這一評測任務,將WPS 以及Text Analysis Conference(TAC)的KBP 實體鏈接任務進行融合.任務不僅要求判定人名實體是否已在知識庫中定義以及是知識庫中的哪一條定義,而且要求對于不屬于知識庫中定義的文本進行聚類,與2010年相比增加了任務難度.本文針對中文跨文本消歧任務,利用句義分析提取句義特征實現(xiàn)人名消歧.

    1 相關工作

    1998年,Bagga等[3]首次提出跨文本的同指消歧任務.他們對每個文本形成待消歧名字的簡單摘要,并用向量空間模型表示,通過聚類方法將具有人名同指關系的文本聚在一起.他們的方法是較通用的文本消歧技術(shù),沒有考慮到人名消歧的特殊性.2003年,Mann等[4]通過特征模板大大豐富了特征空間中的個人屬性信息,在一定程度上改善了特征提取算法.2005年,Malin[5]提出一種利用社會網(wǎng)絡圖來實現(xiàn)人名消歧的方法,該方法首先構(gòu)造待消歧人名的社會網(wǎng)絡圖,然后采取隨機游走和網(wǎng)絡切割的方法來精確社會網(wǎng)絡進行人名消歧.2010 年在CLP 2010上,Wang等[6]利用啟發(fā)式后處理規(guī)則優(yōu)化命名實體識別效果,然后根據(jù)領域信息將文本分類,針對不同領域的人物文本采用不同的處理方式,他們提交的2個系統(tǒng)都表現(xiàn)良好.Xu等[7]依據(jù)段落與待消歧名字的距離,將不同位置的特征賦予不同權(quán)重進行層次聚類,并對比分析不同鏈接方法應用到人名消歧的效果.2011年,陳峰等[8]運用社會網(wǎng)絡分析法解決中文不同文本同名歧義問題,利用同名的人各自對應不同中心網(wǎng)絡的特點,使用譜聚類將社會網(wǎng)絡圖劃分子圖,通過“集團”劃分來區(qū)分不同實體.Wei等[9]用空間向量模型表示文本,以TFIDF計算特征權(quán)重,采用支持向量機和凝聚層次聚類相結(jié)合的多階段處理策略實現(xiàn)了人名消歧.2012年在CLP 2012上,Peng等[10]在命名實體識別的基礎上,對不同名實體特征、部分詞性以及人物職業(yè)名稱賦予不同參數(shù)值,結(jié)合TF-IDF 構(gòu)成文本表示模型進行聚類,他們提交的SIR-NERD 系統(tǒng)效果良好.

    現(xiàn)有的主要算法大致可以分為以下2類.第一類是對于每一篇文本,用特征向量表示,然后計算向量之間的相似度,采用層次聚類算法將描寫現(xiàn)實中同一人物的文本劃分為一類.第二類是采用圖聚類算法.圖的構(gòu)造方法是利用文本中命名實體的關系建立一個初始社會關系網(wǎng)絡,然后對該網(wǎng)絡釆用圖聚類算法將節(jié)點聚成若干個內(nèi)部節(jié)點緊密連接的“社團”.

    層次聚類算法是目前主流的算法,選取合適的特征表示文本是該方面研究的主要工作.目前,大多數(shù)特征是文本中的淺層次特征(詞法,句法),沒有考慮特征詞在語句中扮演的語義角色及它們之間的依存關系,造成信息丟失.圖聚類的算法只考慮部分命名實體之間的關系,一方面會造成特征稀疏,另一方面這些命名實體不能充分地描述實體特征,效果并不理想.挖掘文本中更深層次的語義信息,利用不同層次的強弱特征,進而發(fā)揮各類特征對人名消歧的作用是有意義的.

    2 句義結(jié)構(gòu)模型及句義分析

    句義結(jié)構(gòu)模型[11]以現(xiàn)代漢語語義學為基礎,從句義角度研究句子的句義成分以及成分之間關系的句義結(jié)構(gòu)化表示模型,將抽象的句義表示成計算機可處理的結(jié)構(gòu)化數(shù)據(jù).模型將句義結(jié)構(gòu)分為句型層、描述層、對象層和細節(jié)層4個層次,包含的句義成分有句義類型、話題、述題、謂詞和項等.句義成分中的項分為基本項與一般項,項的具體功能用語義格表示,對應的語義格分為7個基本格和12個一般格.模型的基本形式[12]如圖1所示.

    句義分析通過句義結(jié)構(gòu)模型分析句子結(jié)構(gòu)信息和語義信息,抽取能夠表述句子語義的特征,這些特征能夠表達人物實體的重要信息是文本強特征.句義分析的具體方法是根據(jù)句義結(jié)構(gòu)模型的基本框架,分別處理不同語義格的對象成分及語義格結(jié)構(gòu)信息,主要的語義格類型說明如表1所示.

    表1 語義格類型說明Tab.1 Description of semantic case

    在句義結(jié)構(gòu)模型自動構(gòu)建的基礎上依次查詢上述語義格對應的項作為特征詞,根據(jù)語義格的依存關系構(gòu)造不同組合方式形成具有更精確語義表達能力的特征詞組.對于基本格,要排除查詢詞字串(待消歧人名),若與其他一般格在語義上存在依存關系,則將它們的對應項合并形成新的特征詞組.對于一般格,只提取修飾基本格的作為句義特征,若與其他一般格在語義上存在依存關系,則將它們的對應詞合并形成新的特征詞組.

    圖2 “自治區(qū)主席高雄實地考察天門山景區(qū)”的句義結(jié)構(gòu)Fig.2 Sentential semantic structure of“chairman of autonomous region, Gaoxiong survey Tianmen mountain scenic spot”

    以下列查詢詞為高雄的句子為例:“自治區(qū)主席高雄實地考察天門山景區(qū)”.句義結(jié)構(gòu)的生成利用了課題組的自動構(gòu)建系統(tǒng)ACSM①http:∥www.isclab.org/csa/bfs-csa.php,是基于融合反饋機制的CRF++模型的句義分析器,不依賴于句法分析僅利用詞法分析結(jié)果即可實現(xiàn),保證了分析的性能,對語義格類型的識別準確率達到94%以上.所得的句義結(jié)構(gòu)實例如圖2所示,體現(xiàn)了句義分析的作用:“景區(qū)”是“考察”動作的承受對象,“主席”與“高雄”在該句同指一個實體對象,具有同位屬性,所以,該句中受事格、同位格所對應的項“景區(qū)”、“主席”兩詞都能夠表達具有區(qū)分能力的信息.然而僅僅這兩個詞的表達是不精確的,帶來一定程度的噪音,根據(jù)上文方法提取具有依存關系的同位格-屬格、受事格-空間格兩種語義形式,將對應項“自治區(qū)主席”、“天門山景區(qū)”作為特征詞組,這兩個詞組的表達更細致,有利于區(qū)分不同實體對象.此外,去除容易形成噪音的謂詞項以及與實體相關性不大的描述謂詞的語義信息,如該句中的“考察”“實地”,保證了句義特征表達的準確性.

    3 算法原理

    針對文本分析只停留在表層的問題,本文利用句義結(jié)構(gòu)模型在語義層分析句子,根據(jù)語義信息和語義格結(jié)構(gòu)信息處理句子中不同的語義成分和不同語義項之間的依存關系,利用句義特征準確表達語句信息.在抽取實體特征時加入了書名、歌名、電影名等特殊專有名詞以及人物職業(yè),豐富了實體特征類型,結(jié)合名詞統(tǒng)計特征進行兩階段層次聚類,利用文本強弱特征實現(xiàn)跨文本人名消歧.

    本文提出的融合句義分析的跨文本人名消歧是在文本預處理的基礎上,首先對查詢詞采用啟發(fā)式規(guī)則的后處理方法進行人名實體識別,將文本集分為人名文本集Nr和非人名文本集Other.然后針對人名文本集Nr根據(jù)模板提取與查詢詞相關的局部名實體特征及職業(yè),采用基于規(guī)則的分類方法匹配知識庫定義的名字并標記其編號Id.最后針對剩余文本集Out以及非人名文本集Other分別通過自動構(gòu)建句義結(jié)構(gòu)模型,提取句義特征,利用詞袋模型統(tǒng)計詞頻,依次表示文本進行兩階段層次聚類.

    系統(tǒng)主要包括:預處理、人名實體識別、文本表示、分類和兩階段聚類4個模塊.算法原理如圖3所示,各模塊的具體內(nèi)容在下文詳細介紹.

    圖3 跨文本人名消歧算法原理圖Fig.3 Cross-document personal name disambiguation algorithm schematic diagram

    3.1 預處理

    對文本集的預處理模塊主要包括數(shù)據(jù)清洗、分句、分詞、詞性標注以及命名實體識別.數(shù)據(jù)清洗階段去除知識庫XML標記以及文本中一些無法正確識別的特殊字符.然后進行分句并依據(jù)文本名、段落、段落中位置對每一句編號,目的是方便抽取查詢詞上下文語句以及構(gòu)建句義結(jié)構(gòu)模型.之后對文本進行分詞、詞性標注,采用中科院計算所的分詞工具ICTCLAS2013.

    3.2 人名實體識別

    由于人名消歧語料的特殊性,例如查詢詞為“高山”“白雪”等字串時,文本集中存在大量查詢詞以普通詞形式存在的情況,針對這些詞的實體識別效果是非常不理想的.導致錯誤的主要原因是沒有充分利用前后文信息,這種情況直接影響之后的句義結(jié)構(gòu)模型構(gòu)建的效果.針對上述情況,在利用ICTCLAS2013命名實體識別功能的基礎上,采用基于啟發(fā)式規(guī)則的后處理方法提升人名的實體識別效果.從文本集中抽取出查詢詞指代人名的文本子集Nr,則剩余文本組成文本集Other,這些文本中的查詢詞以普通詞或者其他命名實體形式出現(xiàn).整體的識別模塊框架如下所示.

    3.2.1 并列詞規(guī)則 并列詞是以并列連詞或符號串聯(lián)在一起的字串集合,并列連詞和符號有:“和”、“或”、“與”、“、”等.由于并列實體詞在文本中的距離相對較遠,在統(tǒng)計系統(tǒng)中識別效果不好.并列詞規(guī)則是若查詢詞的并列詞被識別為人名,則查詢詞也是人名,例如“高山和黃磊都來自云南”中,黃磊作為查詢詞高山的并列詞被識別為人名,而高山被識別為普通名詞,則根據(jù)并列詞規(guī)則將高山識別為人名.

    3.2.2 名稱同指規(guī)則 由于現(xiàn)實中經(jīng)常出現(xiàn)一個人擁有曾用名的情況,甚至擁有筆名、網(wǎng)名等多個名稱,這些名稱在同一個文本中均指代一個人.名稱同指規(guī)則即若查詢詞前綴、后綴或通過“,”連接的字串是“原名”“又名”“筆名”“曾用名”“別名”“網(wǎng)名”等,并且這些詞跟隨人名出現(xiàn)就將查詢詞識別為人名,例如“高山,原名高增昌”這兩句中,高山和高增昌指代現(xiàn)實中的同一個人,高增昌被識別為人名,則根據(jù)規(guī)則查詢詞高山也被識別為人名.

    3.2.3 前、后綴稱謂詞規(guī)則 前、后綴稱謂詞規(guī)則是利用人名稱謂識別人名.前、后綴詞是實體詞前面或后面標示實體類型的部分.若查詢詞本身符合人名的一般原則,而且前、后綴詞是人名稱謂,則查詢詞為人名.例如“(記者高超)”“杜鵑老師”這兩句中,記者及老師都是人名稱謂詞,則查詢詞高超和杜鵑被識別為普通詞,根據(jù)該規(guī)則將它們識別為人名.

    3.3 文本表示

    本文根據(jù)特征模板提取與查詢詞相關的局部名實體特征及職業(yè),通過自動構(gòu)建句義結(jié)構(gòu)模型,提取句義特征,利用詞袋模型統(tǒng)計詞頻,利用上述三層特征分別表示文本并進行聚類.

    由于名實體及職業(yè)信息在人名消歧任務中扮演著重要角色,首先在抽取文本名實體特征及職業(yè)時,先從句子劃分完畢的文本中抽取查詢詞的所在句,然后從這些句子中抽取相關的機構(gòu)名、人名、地名.特別地,通過觀察語料發(fā)現(xiàn),其中出現(xiàn)的人大部分是歌星、演員、作家和學者等知名人士,對于這些特殊人群,一些書名、歌名、電影名等出現(xiàn)在“《”“》”之間的專有名詞可以有效地區(qū)分他們,所以將全文本中出現(xiàn)的這些名詞劃分到名實體特征中構(gòu)成一維獨立特征.最后利用職業(yè)稱謂詞典匹配查詢詞前后綴職業(yè),上述特征由相關的特征詞集合組成,構(gòu)成的第一層特征空間表示文本,標記如表2所示.

    表2 第一層特征類型及標記Tab.2 Types and markers of first layer characteristics

    根據(jù)4章的特征選擇實驗,從8種語義格中選擇施事格、受事格、說明格、范圍格、描寫格、空間格所對應的項.根據(jù)2章介紹的句義特征提取方法從查詢詞上下文信息(一般為查詢詞所在句的上下各一句話)中提取特征詞和詞組構(gòu)成句義特征,利用所選取的特征將文檔形式化表示在n 維空間的向量,構(gòu)成第二層特征空間表示文本,如下所示:

    空間中的每一維wn都是選取的特征詞或詞組.

    利用詞袋模型(BOW)統(tǒng)計所有的名詞詞頻,用空間向量模型表示文本構(gòu)成第三層特征空間,詞袋模型的特點在于該模型忽略掉文本的語法和語序,用一組無序的單詞來表達一段文字或一個文檔.系統(tǒng)采用詞頻矩陣TF 對詞袋特征進行加權(quán),主要表示度量詞t與文檔d 之間的關聯(lián)度:通常,如果文檔不包含該詞,則定義為零;否則定義為非零.對于向量中的非零項,定義詞的權(quán)重方法有多種.系統(tǒng)采用的方法如下:若詞t出現(xiàn)在文檔d 中,則用規(guī)范化詞頻來計算,計算公式為

    式中:freq(d,t)為詞t在文檔d 中出現(xiàn)的次數(shù).

    3.4 分類和兩階段聚類

    利用上述三層特征空間,采用一種融合分類和兩階段聚類的處理策略.首先針對人名文本集,利用知識庫定義及表2所示的第一層特征空間進行基于規(guī)則的分類方法,將知識庫中提及的每一個人的相關文本劃分為一類.規(guī)則為對于每一篇文本和知識庫定義內(nèi)容,若nr或snz特征集交集非空,或者nt或ns特征集交集元素數(shù)不小于2,或者nt或ns特征集交集元素數(shù)等于1并且occupation特征集交集非空,則將該文本標記為知識庫定義編號.

    后兩個階段是針對未被劃分到知識庫定義的剩余文本集Out以及非人名文本集Other分別進行聚類,其中第一階段利用句義特征構(gòu)成的第二層特征空間進行基于凝聚的最小距離法層次聚類,兩文本的相似度用重疊系數(shù)(overlap coefficient)計算.假設文檔dx的特征向量為fx,文檔dy的特征向量為fy,則

    η是為了避免式(3)的分母過小而設定的閾值,一般根據(jù)訓練集確定.

    第二階段聚類是在第一階段聚類結(jié)果映射的基礎上,使用第三層特征空間以及相同的層次聚類算法.兩文本的相似度用空間向量v1、v2之間的余弦夾角表示,如下:

    對于結(jié)果映射過程,首先觀察第一階段的聚類結(jié)果,然后將所有聚類類別中包含文本數(shù)≥2的類別篩選出來,將這些類別中的文本在層次聚類初始化數(shù)據(jù)前聚為一簇,而那些只包含一個文本的離散類別不作任何處理.根據(jù)表3所示的部分文本聚類結(jié)果,第二階段層次聚類輸入數(shù)據(jù)的初始化狀態(tài)如圖4所示.P1、P2、P3、P4、P5依次表示表3中顯示的文本,樹狀圖中的虛線表示沒有進行第二階段層次聚類之前的初始狀態(tài),嵌套簇圖更直觀地顯示了第一階段聚類的映射結(jié)果.

    開展4章所述的參數(shù)選擇實驗得到重疊系數(shù)μ作為第一階段聚類停止時的相似度閾值,夾角余弦值θ作為第二階段聚類停止條件.

    表3 第二階段聚類結(jié)果示例Tab.3 Typical example of second stage clustering result

    圖4 以樹狀圖和嵌套簇圖顯示的聚類初始狀態(tài)Fig.4 Clustering initial state showed by tree diagram and nested cluster diagram

    4 實驗及結(jié)果分析

    4.1 實驗數(shù)據(jù)資源

    實驗數(shù)據(jù)是CLP 2012中文人名消歧評測任務開放的語料,其中包含16個不同的待消歧人名,每個名字包含50~200篇不等的文本,共包含1 634篇文本,并且對每一個人名均包含一個提供少量實體信息的知識庫.其他數(shù)據(jù)資源還包括常用人名稱謂1 510個.

    4.2 評價方法

    采用CLP 2012 使 用 的B_Cubed 指 標 評 價 實驗結(jié)果.

    式中:P 為準確率,Rec為召回率;S 為標準聚類結(jié)果集合,d 表示文檔,Si∈S 表示標準結(jié)果類別集合中的一類;R 為實際聚類結(jié)果集合,Rj∈R 表示實際聚類結(jié)果集合中的其中一類;|Si|和|Ri|分別為集合Si和Ri的 大 小.

    對參與聚類的每個文檔分別求出P 和Rec,再求出平均值作為聚類結(jié)果的P 和Rec.F 采用通常的計算公式計算:

    4.3 實驗結(jié)果及分析

    對融合句義分析的跨文本人名消歧系統(tǒng)進行3組實驗:句義特征選擇實驗、聚類參數(shù)選擇實驗和系統(tǒng)總體效果對比實驗.

    第1組實驗是句義特征選擇實驗,目的是選擇系統(tǒng)所需的最優(yōu)化句義特征組合.首先分析消歧中不同語義格的表達能力,挑選出8種語義格進行實驗,語義格的編號如表4所示.

    表4 句義特征編號Tab.4 Number of semantic features

    對語料進行統(tǒng)計分析發(fā)現(xiàn),大部分文本所提取的句子均含有的基本句義特征是施事格.實驗以施事格作為基線,依次加入其他基本句義特征,觀察它們對層次聚類準確率的影響,均取重疊系數(shù)0.49作為聚類停止條件,保留使準確率上升的句義特征,丟棄使準確率下降的句義特征.

    由圖5可知,選擇施事格、受事格、范圍格、描寫格、說明格、空間格作為最優(yōu)句義特征組合,這種句義特征組合具有較強的表達能力,可以更精確地反映句義信息.

    第2組實驗是兩階段聚類的參數(shù)選擇實驗,選擇最佳的μ 與θ 的組合方式作為兩階段聚類的停止條件.實驗中,μ 以0.02為間隔在0.15~0.35的區(qū)間變動,θ以0.02 為間隔在0.08~0.20的區(qū)間變動,其中θ1=0.08,實驗結(jié)果如圖6所示.由圖6可知,當μ 取0.31,θ取0.12時,聚類效果最好.

    圖5 特征選擇實驗結(jié)果Fig.5 Results of experiments of feature selection

    圖6 兩階段聚類參數(shù)選擇實驗結(jié)果Fig.6 Results of feature selection with two-stage clustering

    第3組實驗是系統(tǒng)總體效果對比實驗.對比系統(tǒng)是2 個 參 與CLP 2012 評 測 的 系 統(tǒng)TBHMERD[13]、SIR-NERD和本文系統(tǒng)去除句義分析模塊的結(jié)果,如表5所示.

    表5 系統(tǒng)總體效果對比實驗結(jié)果Tab.5 Comparison with system overall experimental results

    由表5可見,去除句義分析模塊后僅利用特定屬性和統(tǒng)計特征的處理方法的準確率較低,而加入句義分析模塊的本文系統(tǒng)效果明顯提升,F(xiàn) 優(yōu)于其他兩個評測系統(tǒng),特別是在準確率方面表現(xiàn)良好.原因是句義特征可以精確表達信息,作用于對凝聚層次聚類效果影響較大的底層,優(yōu)先將部分文本劃分為一類;然后結(jié)合統(tǒng)計特征,適應了凝聚層次聚類自底向上的特點,有效地避免了只使用特征融合并賦不同權(quán)重的單層次的聚類方法所帶來的噪音.采用該處理方法不僅增加了句子分析的深度,而且合理地利用了文本強弱特征.召回率相對SIR-NERD 系統(tǒng)下降將近1%,可能的原因如下:1)命名實體識別效果不理想,造成特征數(shù)據(jù)稀疏;2)某些文本中的句子形式不規(guī)范,例如缺少謂詞或其他語義成分、出現(xiàn)某些代詞等,只根據(jù)該句無法正確地提取有效句義特征;3)分類算法所利用的實體屬性特征不夠豐富,且規(guī)則不夠完善,導致知識庫定義人名的相關文本被劃分到Out文本集中.

    5 結(jié) 語

    本文結(jié)合文本強弱特征,合理利用分類聚類算法實現(xiàn)了跨文本人名消歧.特別地,利用句義結(jié)構(gòu)模型分析句子的結(jié)構(gòu)信息和語義信息,通過分析特征詞在語句中的依存關系,深化了句子分析層次,提取的句義特征增強了特征向量的表達能力,有效地避免了信息丟失,更準確地描述語句中實體相關信息.實驗證明,結(jié)合句義特征的層次聚類方法明顯提高了系統(tǒng)的準確率以及綜合性能.綜上所述,句義分析可以應用到跨文本人名消歧的研究中,并能夠取得良好的效果.

    由于利用重疊系數(shù)的相似度計算方法沒有考慮到句義特征在句子中扮演角色的重要程度,下一步工作的重點是句義特征權(quán)重計算方法的研究.同時,利用上下文信息豐富句義特征以解決由于某些句子形式不規(guī)范原因造成的特征稀疏的問題,以期提高算法的召回率.這些研究將提高句義分析能力,進一步提升跨文本人名消歧的效果.

    ):

    [1]GUHA R,GARG A.Disambiguating people in search[C]∥The 13th International World Wide Web Conference.New York:Association for Computing Machinery,2004:102-107.

    [2]ARTILES J,GONZALO J,SEKINE S.The SemEval-2007 WePS evaluation:establishing a benchmark for the web people search task[C]∥Proceedings of the 4th International Workshop on Semantic Evaluations.Prague:Association for Computational Linguistics,2007:64-69.

    [3]BAGGA A,BALDWIN B.Entity-based cross-document conferencing using the vector space model[C]∥Proceedings of the 17th International Conference on Computational Linguistics:Volume 1.Montreal,Ganada:Association for Computational Linguistics,1998:79-85.

    [4]MANN G S,YAROWSKY D.Unsupervised personal name disambiguation[C]∥Proceedings of the 17th Conference on Natural Language Learning at HLT-NAACL 2003:Volume 4.Sofia,Bulgaria:Association for Computational Linguistics,2003:33-40.

    [5]MALIN B.Unsupervised name disambiguation via social network similarity[C]∥ Workshop on Link Analysis,Counterterrorism,and Security.Minneapolis:[s.n.],2005,1401:93-102.

    [6]WANG H,DING H.A multi-stage clustering framework for Chinese personal name disambiguation[C]∥CIPS-SIGHAN Joint Conference on Chinese Language Processing. Tianjin:[s.n.],2010:88-94.

    [7]XU R,XU J.Combine person name and person identity recognition and document clustering for Chinese person name disambiguation[C]∥CIPS-SIGHAN Joint Conference on Chinese Language Processing.Tianjin:[s.n.],2010:95-100.

    [8]陳峰,王厚峰.基于社會網(wǎng)絡的跨文本同名消歧[J].中文信息學報,2011,25(05):76-82.CHEN Feng,WANG Hou-feng.Social network based cross-document personal name disambiguation [J].Journal of Chinese Information Processing.Tijanjin:[s.n.],2011,25(05):76-82.

    [9]WEI H,XU B,ZHAO T.Study on Chinese person name disambiguation based on multi-stage strategy[C]∥2011 8th International Conference on Fuzzy Systems and Knowledge Discovery (FSKD).Chongqing:IEEE,2011:1177-1181.

    [10]PENG Z,SUN L.SIR-NERD:a Chinese named entity recognition and disambiguation system using a twostage method[C]∥CIPS-SIGHAN Joint Conference on Chinese Language Processing.Wuhan:[s.n.],2012:115-120.

    [11]羅森林,韓磊,潘麗敏,等.漢語句義結(jié)構(gòu)模型及其驗證[J].北京理工大學學報:自然科學版,2013,33(2):166-171.LUO Sen-lin,HAN Lei,PAN Li-min,et al.Chinese sentential semantic mode and verification[J].Beijing Institute of Technology:Natural Science,2013,33(2):166-171.

    [12]馮揚.漢語句義模型構(gòu)建及若干關鍵技術(shù)研究[D].北京:北京理工大學,2010.FENG Yang.Research on Chinese sentential semantic mode and some key problems[D].Beijing:Beijing Institute of Technology,2010.

    [13]HAO Z,DEREK F.A template based hybrid model for Chinese personal name disambiguation[C]∥CIPSSIGHAN Joint Conference on Chinese Language Processing.Wuhan:[s.n.],2012:121-126.

    猜你喜歡
    消歧實體語義
    基于關聯(lián)圖和文本相似度的實體消歧技術(shù)研究*
    基于半監(jiān)督集成學習的詞義消歧
    語言與語義
    前海自貿(mào)區(qū):金融服務實體
    中國外匯(2019年18期)2019-11-25 01:41:54
    藏文歷史文獻識別過程中藏文自由虛詞的自動識別及消歧算法的研究
    實體的可感部分與實體——兼論亞里士多德分析實體的兩種模式
    哲學評論(2017年1期)2017-07-31 18:04:00
    兩會進行時:緊扣實體經(jīng)濟“釘釘子”
    振興實體經(jīng)濟地方如何“釘釘子”
    “上”與“下”語義的不對稱性及其認知闡釋
    認知范疇模糊與語義模糊
    丝袜脚勾引网站| 多毛熟女@视频| 欧美亚洲 丝袜 人妻 在线| 人人妻人人爽人人添夜夜欢视频| 久久久久久久大尺度免费视频| 看免费av毛片| 夫妻午夜视频| 一区二区av电影网| 免费人妻精品一区二区三区视频| 夫妻性生交免费视频一级片| 看免费成人av毛片| 高清视频免费观看一区二区| 亚洲精品一区蜜桃| 国产日韩欧美视频二区| 国产免费一区二区三区四区乱码| 国产一区二区 视频在线| 久久久久视频综合| av片东京热男人的天堂| 久久精品久久久久久噜噜老黄| 亚洲一码二码三码区别大吗| 国产精品av久久久久免费| 亚洲精华国产精华液的使用体验| 成年动漫av网址| 97在线人人人人妻| 亚洲国产精品国产精品| 中文字幕亚洲精品专区| 9热在线视频观看99| 久久久久网色| a 毛片基地| av不卡在线播放| 午夜福利影视在线免费观看| 国产成人免费无遮挡视频| √禁漫天堂资源中文www| 在线观看三级黄色| 桃花免费在线播放| 国产国语露脸激情在线看| 一区二区三区精品91| 这个男人来自地球电影免费观看 | 在线观看www视频免费| 亚洲欧美一区二区三区久久| 美女福利国产在线| 美女xxoo啪啪120秒动态图| 大片电影免费在线观看免费| 免费播放大片免费观看视频在线观看| 一区二区三区精品91| 免费高清在线观看日韩| 9热在线视频观看99| 自拍欧美九色日韩亚洲蝌蚪91| 久久狼人影院| 99久久中文字幕三级久久日本| 大香蕉久久网| 18禁动态无遮挡网站| 亚洲精品av麻豆狂野| 69精品国产乱码久久久| 九草在线视频观看| 蜜桃国产av成人99| 大码成人一级视频| 香蕉国产在线看| 亚洲精品久久久久久婷婷小说| 纵有疾风起免费观看全集完整版| 成人毛片a级毛片在线播放| 大话2 男鬼变身卡| 免费观看av网站的网址| 叶爱在线成人免费视频播放| 欧美日韩综合久久久久久| 人体艺术视频欧美日本| 最近中文字幕2019免费版| 女性生殖器流出的白浆| 女性生殖器流出的白浆| 欧美日韩综合久久久久久| 人妻一区二区av| 亚洲视频免费观看视频| 在线观看免费视频网站a站| 秋霞伦理黄片| 日韩一区二区视频免费看| 欧美变态另类bdsm刘玥| 午夜免费观看性视频| 精品一区二区三卡| 久久久精品免费免费高清| 国产av一区二区精品久久| 国产精品不卡视频一区二区| 亚洲,欧美精品.| 国产成人一区二区在线| 国产精品二区激情视频| 熟女av电影| 久久久欧美国产精品| 免费大片黄手机在线观看| 人人妻人人澡人人爽人人夜夜| 国产精品.久久久| 久久久久久久久久人人人人人人| 制服丝袜香蕉在线| 制服丝袜香蕉在线| 成人毛片a级毛片在线播放| 亚洲精品,欧美精品| 观看av在线不卡| 免费在线观看黄色视频的| 亚洲av成人精品一二三区| 极品人妻少妇av视频| 各种免费的搞黄视频| 一边亲一边摸免费视频| 大码成人一级视频| 伦理电影免费视频| 免费久久久久久久精品成人欧美视频| 一级片'在线观看视频| 伦理电影免费视频| 亚洲国产精品一区三区| 精品少妇久久久久久888优播| 日韩成人av中文字幕在线观看| 日韩成人av中文字幕在线观看| 亚洲情色 制服丝袜| 91久久精品国产一区二区三区| 欧美日韩视频高清一区二区三区二| 黄色怎么调成土黄色| 国产成人免费无遮挡视频| 天天躁日日躁夜夜躁夜夜| 久久国产亚洲av麻豆专区| 男男h啪啪无遮挡| av网站在线播放免费| 欧美日韩亚洲国产一区二区在线观看 | 色播在线永久视频| 日韩成人av中文字幕在线观看| 亚洲 欧美一区二区三区| 天天躁日日躁夜夜躁夜夜| 老司机影院成人| 亚洲av综合色区一区| 久久精品国产a三级三级三级| 欧美精品高潮呻吟av久久| 日韩一区二区视频免费看| 91精品三级在线观看| 亚洲国产日韩一区二区| 国产精品av久久久久免费| 亚洲国产精品一区二区三区在线| 两性夫妻黄色片| 国产麻豆69| 男女边吃奶边做爰视频| 丰满乱子伦码专区| 久久99热这里只频精品6学生| 日韩欧美精品免费久久| 欧美日韩av久久| 999精品在线视频| 精品亚洲成国产av| 丝瓜视频免费看黄片| 国产精品99久久99久久久不卡 | 亚洲伊人久久精品综合| 在线观看免费日韩欧美大片| 波多野结衣一区麻豆| 亚洲av.av天堂| 中文字幕色久视频| 在线观看三级黄色| 国产一区二区 视频在线| 热re99久久国产66热| 亚洲av免费高清在线观看| 久久久久国产精品人妻一区二区| 青春草国产在线视频| 国产欧美日韩一区二区三区在线| 在线观看人妻少妇| 午夜福利乱码中文字幕| 亚洲精华国产精华液的使用体验| 亚洲,欧美精品.| 五月开心婷婷网| 亚洲第一区二区三区不卡| 天堂中文最新版在线下载| 麻豆av在线久日| 国产精品无大码| 女人精品久久久久毛片| 国产亚洲欧美精品永久| 午夜日韩欧美国产| 亚洲成人一二三区av| 男人添女人高潮全过程视频| 亚洲欧美成人精品一区二区| 国产午夜精品一二区理论片| 久久鲁丝午夜福利片| 久久女婷五月综合色啪小说| 日本黄色日本黄色录像| 99re6热这里在线精品视频| 国产精品.久久久| 人体艺术视频欧美日本| 老鸭窝网址在线观看| 男女边摸边吃奶| 日韩人妻精品一区2区三区| 这个男人来自地球电影免费观看 | 大陆偷拍与自拍| 成人毛片60女人毛片免费| 汤姆久久久久久久影院中文字幕| 成人黄色视频免费在线看| 久久精品国产自在天天线| 日本午夜av视频| 精品国产一区二区久久| 免费av中文字幕在线| 人人妻人人添人人爽欧美一区卜| 春色校园在线视频观看| 天堂俺去俺来也www色官网| 亚洲精品国产av蜜桃| 日本欧美视频一区| 国产成人一区二区在线| 90打野战视频偷拍视频| 日韩av在线免费看完整版不卡| 国产麻豆69| 亚洲国产精品一区三区| 欧美 亚洲 国产 日韩一| 热re99久久精品国产66热6| 一个人免费看片子| 午夜福利,免费看| 成年美女黄网站色视频大全免费| 久久人妻熟女aⅴ| 哪个播放器可以免费观看大片| 一级片'在线观看视频| 国产免费一区二区三区四区乱码| 久久精品久久久久久久性| 丝袜喷水一区| 看免费成人av毛片| 在线观看免费日韩欧美大片| 成年女人毛片免费观看观看9 | 99国产综合亚洲精品| 欧美日韩一区二区视频在线观看视频在线| 91午夜精品亚洲一区二区三区| 菩萨蛮人人尽说江南好唐韦庄| 中国三级夫妇交换| 校园人妻丝袜中文字幕| 97人妻天天添夜夜摸| 男人舔女人的私密视频| 宅男免费午夜| av.在线天堂| 亚洲综合色惰| 啦啦啦中文免费视频观看日本| 最近的中文字幕免费完整| av在线老鸭窝| 91精品三级在线观看| 制服丝袜香蕉在线| 国产极品粉嫩免费观看在线| 欧美另类一区| av卡一久久| 亚洲精品中文字幕在线视频| 成人午夜精彩视频在线观看| 免费女性裸体啪啪无遮挡网站| 日韩av不卡免费在线播放| 国产 一区精品| 少妇的丰满在线观看| 热re99久久国产66热| 激情视频va一区二区三区| 国产亚洲精品第一综合不卡| 国产毛片在线视频| 亚洲av日韩在线播放| 精品一区二区免费观看| 欧美另类一区| 中文字幕精品免费在线观看视频| 毛片一级片免费看久久久久| 久久人妻熟女aⅴ| 在线观看三级黄色| www.自偷自拍.com| 亚洲三级黄色毛片| 国产野战对白在线观看| 久久精品aⅴ一区二区三区四区 | 一区在线观看完整版| 亚洲国产精品一区三区| 一级a爱视频在线免费观看| 国产亚洲av片在线观看秒播厂| 亚洲人成77777在线视频| 欧美人与性动交α欧美精品济南到 | 最近最新中文字幕免费大全7| 久久精品久久精品一区二区三区| 建设人人有责人人尽责人人享有的| 国产又爽黄色视频| 色网站视频免费| 99热国产这里只有精品6| 国产免费视频播放在线视频| 亚洲五月色婷婷综合| 久久婷婷青草| 久久精品国产亚洲av高清一级| 日韩中文字幕视频在线看片| av卡一久久| 乱人伦中国视频| 国产成人精品在线电影| 久久99蜜桃精品久久| 国产成人av激情在线播放| 婷婷色av中文字幕| kizo精华| 最新的欧美精品一区二区| 大片电影免费在线观看免费| 欧美人与性动交α欧美软件| 女人高潮潮喷娇喘18禁视频| 久久精品国产亚洲av涩爱| 青草久久国产| 中国国产av一级| 少妇 在线观看| 日韩电影二区| 午夜福利在线观看免费完整高清在| 两性夫妻黄色片| √禁漫天堂资源中文www| 亚洲欧美精品综合一区二区三区 | 黄色配什么色好看| 亚洲精品自拍成人| 亚洲内射少妇av| 日本欧美国产在线视频| 亚洲av综合色区一区| 免费在线观看完整版高清| 亚洲精品视频女| 成人影院久久| 一边摸一边做爽爽视频免费| 日韩欧美一区视频在线观看| 免费女性裸体啪啪无遮挡网站| 性少妇av在线| 久久国产亚洲av麻豆专区| 国产精品久久久久久精品古装| 一本大道久久a久久精品| 新久久久久国产一级毛片| 一级毛片黄色毛片免费观看视频| 可以免费在线观看a视频的电影网站 | 熟女电影av网| 超色免费av| 国产人伦9x9x在线观看 | 午夜福利在线免费观看网站| av福利片在线| xxxhd国产人妻xxx| 91精品伊人久久大香线蕉| 亚洲国产色片| 巨乳人妻的诱惑在线观看| 午夜福利在线观看免费完整高清在| 久久人妻熟女aⅴ| 99热网站在线观看| 亚洲综合色网址| 黑人欧美特级aaaaaa片| 黄色视频在线播放观看不卡| 一级爰片在线观看| 黄频高清免费视频| 国产97色在线日韩免费| 亚洲精品av麻豆狂野| 在线亚洲精品国产二区图片欧美| 亚洲成av片中文字幕在线观看 | 精品一区二区免费观看| 欧美日韩视频高清一区二区三区二| 人妻系列 视频| 亚洲第一青青草原| 如日韩欧美国产精品一区二区三区| 中文字幕最新亚洲高清| 亚洲精品日本国产第一区| 亚洲精品一区蜜桃| 免费高清在线观看日韩| 亚洲伊人久久精品综合| 亚洲国产最新在线播放| 高清在线视频一区二区三区| 狠狠婷婷综合久久久久久88av| 色吧在线观看| 午夜福利影视在线免费观看| av线在线观看网站| 亚洲精品美女久久久久99蜜臀 | 亚洲精品中文字幕在线视频| 亚洲,欧美精品.| 成人黄色视频免费在线看| 嫩草影院入口| 午夜福利视频在线观看免费| 香蕉丝袜av| 可以免费在线观看a视频的电影网站 | 老鸭窝网址在线观看| 亚洲第一av免费看| 丝袜美腿诱惑在线| 日韩中文字幕视频在线看片| 人妻少妇偷人精品九色| 久久久精品免费免费高清| 亚洲精品久久久久久婷婷小说| 青青草视频在线视频观看| 久久精品国产亚洲av天美| 黄色配什么色好看| 菩萨蛮人人尽说江南好唐韦庄| 国产在视频线精品| 在线观看免费视频网站a站| 一级,二级,三级黄色视频| 国产激情久久老熟女| 女的被弄到高潮叫床怎么办| 久久国产精品大桥未久av| 欧美日韩亚洲国产一区二区在线观看 | 久久精品国产自在天天线| 好男人视频免费观看在线| 亚洲三级黄色毛片| 成人毛片60女人毛片免费| 一边亲一边摸免费视频| 下体分泌物呈黄色| 18禁国产床啪视频网站| 国产精品av久久久久免费| 男女啪啪激烈高潮av片| 男人操女人黄网站| 国产男女内射视频| 9191精品国产免费久久| 建设人人有责人人尽责人人享有的| 亚洲美女搞黄在线观看| 久久久精品免费免费高清| 99国产精品免费福利视频| 大话2 男鬼变身卡| 最新的欧美精品一区二区| 精品久久久久久电影网| 亚洲精品国产色婷婷电影| 精品久久久精品久久久| 青春草国产在线视频| 国产日韩欧美在线精品| 国产成人精品福利久久| 欧美精品人与动牲交sv欧美| 婷婷色综合大香蕉| 午夜久久久在线观看| 亚洲精品av麻豆狂野| 狂野欧美激情性bbbbbb| 久久久久久人妻| 亚洲第一青青草原| 香蕉丝袜av| 又大又黄又爽视频免费| 美女xxoo啪啪120秒动态图| 婷婷色综合www| 丁香六月天网| 婷婷色麻豆天堂久久| 国产成人a∨麻豆精品| av在线老鸭窝| 欧美日韩视频精品一区| 午夜日韩欧美国产| 欧美精品高潮呻吟av久久| av网站免费在线观看视频| 久久青草综合色| 女人高潮潮喷娇喘18禁视频| 一级,二级,三级黄色视频| 亚洲精品av麻豆狂野| 午夜福利视频在线观看免费| 汤姆久久久久久久影院中文字幕| 人人澡人人妻人| 久久人人97超碰香蕉20202| 亚洲精品aⅴ在线观看| 国产av国产精品国产| 80岁老熟妇乱子伦牲交| 日本午夜av视频| 亚洲四区av| 少妇的逼水好多| 国产精品无大码| 国产在视频线精品| 亚洲,欧美精品.| 亚洲精品乱久久久久久| 啦啦啦啦在线视频资源| 一级毛片黄色毛片免费观看视频| 国产视频首页在线观看| 成年av动漫网址| 久久久久久久久久久久大奶| 精品卡一卡二卡四卡免费| 国产不卡av网站在线观看| 少妇人妻久久综合中文| 一区二区三区激情视频| 丝袜美腿诱惑在线| av天堂久久9| 香蕉精品网在线| 亚洲国产精品一区二区三区在线| 国精品久久久久久国模美| 十八禁高潮呻吟视频| 亚洲av国产av综合av卡| 99久久综合免费| 亚洲精华国产精华液的使用体验| 亚洲国产av新网站| 水蜜桃什么品种好| 国产欧美亚洲国产| 熟女少妇亚洲综合色aaa.| 在线亚洲精品国产二区图片欧美| 伊人亚洲综合成人网| 亚洲欧美一区二区三区久久| 18禁国产床啪视频网站| 免费不卡的大黄色大毛片视频在线观看| 成年女人在线观看亚洲视频| av网站免费在线观看视频| 色播在线永久视频| 人妻一区二区av| 国产精品免费大片| 日日啪夜夜爽| 美女主播在线视频| 免费黄色在线免费观看| 国产精品av久久久久免费| 国产成人av激情在线播放| 成年女人在线观看亚洲视频| 亚洲国产av影院在线观看| 国产无遮挡羞羞视频在线观看| 制服丝袜香蕉在线| 日日爽夜夜爽网站| 国产不卡av网站在线观看| 亚洲美女视频黄频| 性色avwww在线观看| 亚洲第一av免费看| 一级片免费观看大全| 亚洲情色 制服丝袜| 观看av在线不卡| 99久久综合免费| 少妇精品久久久久久久| 国产成人精品久久久久久| 日韩av免费高清视频| 美女国产高潮福利片在线看| 日韩一区二区视频免费看| 久久久亚洲精品成人影院| 黄色怎么调成土黄色| 自线自在国产av| 香蕉丝袜av| 免费av中文字幕在线| 丰满饥渴人妻一区二区三| 久久精品国产亚洲av涩爱| 中文字幕人妻熟女乱码| 美国免费a级毛片| 久久精品aⅴ一区二区三区四区 | 欧美日韩成人在线一区二区| 国语对白做爰xxxⅹ性视频网站| 在线精品无人区一区二区三| av网站在线播放免费| tube8黄色片| 99热网站在线观看| 久久人人97超碰香蕉20202| 如日韩欧美国产精品一区二区三区| 少妇熟女欧美另类| 久久久久久久久久久久大奶| 亚洲欧美一区二区三区久久| 性高湖久久久久久久久免费观看| 久久热在线av| 久热这里只有精品99| 一本色道久久久久久精品综合| 高清在线视频一区二区三区| 亚洲欧美成人综合另类久久久| 香蕉精品网在线| 黄片无遮挡物在线观看| 亚洲精品成人av观看孕妇| 国产精品 国内视频| 亚洲一区中文字幕在线| 国产福利在线免费观看视频| 最近手机中文字幕大全| 国产免费现黄频在线看| 久久精品久久精品一区二区三区| 久久精品国产亚洲av涩爱| 久久综合国产亚洲精品| 少妇被粗大的猛进出69影院| 又粗又硬又长又爽又黄的视频| 乱人伦中国视频| 久久精品国产自在天天线| 欧美 日韩 精品 国产| 国产精品成人在线| 亚洲欧美精品综合一区二区三区 | 色吧在线观看| 国产野战对白在线观看| 亚洲国产av新网站| 自线自在国产av| 日本午夜av视频| 黄色 视频免费看| 69精品国产乱码久久久| 久热久热在线精品观看| 成人黄色视频免费在线看| 国产乱来视频区| 免费高清在线观看视频在线观看| 亚洲精品第二区| 亚洲av国产av综合av卡| 免费黄色在线免费观看| 18在线观看网站| 狂野欧美激情性bbbbbb| 1024视频免费在线观看| 国产日韩欧美视频二区| 亚洲一码二码三码区别大吗| 热99国产精品久久久久久7| 永久免费av网站大全| 女性被躁到高潮视频| 久久99一区二区三区| 9热在线视频观看99| 久久免费观看电影| 久久久久国产精品人妻一区二区| 精品福利永久在线观看| 丝袜脚勾引网站| 婷婷色麻豆天堂久久| 国产精品国产三级国产专区5o| 青草久久国产| 飞空精品影院首页| av福利片在线| 黑人巨大精品欧美一区二区蜜桃| 亚洲国产av影院在线观看| 亚洲图色成人| 极品人妻少妇av视频| 午夜福利视频在线观看免费| 可以免费在线观看a视频的电影网站 | 国产成人免费无遮挡视频| 岛国毛片在线播放| 色播在线永久视频| 大陆偷拍与自拍| 亚洲综合精品二区| 肉色欧美久久久久久久蜜桃| 中文字幕精品免费在线观看视频| 狠狠婷婷综合久久久久久88av| 男人爽女人下面视频在线观看| 男的添女的下面高潮视频| av不卡在线播放| 男女下面插进去视频免费观看| 曰老女人黄片| 1024视频免费在线观看| 日韩一区二区三区影片| 两性夫妻黄色片| 午夜精品国产一区二区电影| 亚洲美女视频黄频| 男女午夜视频在线观看| 可以免费在线观看a视频的电影网站 | 9191精品国产免费久久| 精品国产乱码久久久久久男人| av女优亚洲男人天堂| 91午夜精品亚洲一区二区三区| 国产亚洲一区二区精品| 99香蕉大伊视频| 香蕉精品网在线| 国产精品秋霞免费鲁丝片| 亚洲伊人色综图| 可以免费在线观看a视频的电影网站 | 我要看黄色一级片免费的| av网站免费在线观看视频| 一级黄片播放器| 欧美日韩精品成人综合77777| 中文字幕制服av| 精品久久久久久电影网| 国产在线一区二区三区精| 中国三级夫妇交换| 成年女人在线观看亚洲视频| av网站在线播放免费| 国产精品国产av在线观看| 久久久久久久久免费视频了| 99国产精品免费福利视频| 男男h啪啪无遮挡|