• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    地名知識輔助的中文地名消歧方法

    2016-06-05 14:57:58雷,李偉,連偉,梁鵬,龔
    地理與地理信息科學 2016年4期
    關鍵詞:消歧歧義知識庫

    馬 雷 雷,李 宏 偉,連 世 偉,梁 汝 鵬,龔 競

    (1.信息工程大學地理空間信息學院,河南 鄭州 450052;2.四川省應急測繪與防災減災工程技術研究中心,四川 成都 610041)

    地名知識輔助的中文地名消歧方法

    馬 雷 雷1,2,李 宏 偉1,連 世 偉1,梁 汝 鵬1,龔 競2

    (1.信息工程大學地理空間信息學院,河南 鄭州 450052;2.四川省應急測繪與防災減災工程技術研究中心,四川 成都 610041)

    地理空間中對位置的描述可以基于形式化的地理坐標,也可以利用自然語言文本中的非形式化地名來表達。文本中的同一地名可能指向很多地理位置,這就引起了地名歧義,地名消歧就是消除概念指稱上的認知分歧,為地名分配唯一的地理位置。該文從地名知識的角度出發(fā),首先提出了一種基于地名本體的地名知識統(tǒng)一表達方法,介紹了地名知識來源和地名知識庫建庫流程;然后給出了中文地名消歧原理和算法流程,從語義關系、拓撲關系、距離關系和地名密度4個維度計算地名實體之間的地理關聯(lián)度進行地名消歧;最后通過實驗對消歧方法進行了驗證與評價,結果表明該消歧方法具有較高的準確率、召回率、覆蓋率和F值。

    地名;知識;地名本體;地名消歧;關聯(lián)度

    0 引言

    地理空間無處不在,人類所有的活動、知識和決策都和地理空間中的位置相關,位置參照可以是形式化的地理坐標,也可以是自然語言文本中的非形式化地名。自然語言文本是地理信息的重要數(shù)據(jù)源,據(jù)統(tǒng)計至少70%的文本文檔包含以地名形式表達的地理位置參考信息[1]。形式化表達是所有空間處理的基礎,可以通過空間分析和幾何計算實現(xiàn),但是當前GIS空間處理的過程還無法通過地名實現(xiàn)。中文地名復雜多樣,尤其文本中的地名,歧義現(xiàn)象非常嚴重,消除地名歧義是文本中定性地名信息空間化的必備環(huán)節(jié),是連接自然語言處理和GIS的橋梁[2]。

    地名歧義分為geo/non-geo歧義和 geo/geo歧義[3]。若某一地名具有非地理意義,則稱為geo/non-geo歧義,例如人名或者普通單詞;同一地名對應多個地理位置就產(chǎn)生了geo/geo歧義,例如紅河可能指河流也可能指紅河縣、昌樂縣紅河鎮(zhèn),它們使用同一個地名但指向不同的地理位置。據(jù)統(tǒng)計,全球80%以上的地名是無歧義的,但是自然語言文本中83%以上的地名存在歧義,其中一部分地名存在5個甚至更多的候選地理位置。網(wǎng)頁中的地名37%左右存在歧義,法新社新聞集合中新聞網(wǎng)頁中高達40.1%的地名存在歧義[4]。從自然語言處理的角度看,地名消歧屬于詞義消歧的一種,并著重處理地理領域的geo/geo歧義。Olligschlaeger[5]在開發(fā)數(shù)字視頻圖書館時嘗試將新聞中提到的地名位置在地圖上標出,此后出現(xiàn)了很多地名消歧方法。通常地名消歧分為兩步:1)從本文中識別出所有地名,確定歧義地名對應的所有地理位置,構成候選位置集合;2)基于上下文和知識資源作為證據(jù)源,設計一系列的啟發(fā)式規(guī)則方法,從候選位置集合中選擇唯一的地理位置。

    國外對地名消歧的研究主要分為基于地圖的方法、基于外部資源的方法和數(shù)據(jù)驅動的方法3種類型,前兩者都是基于啟發(fā)式規(guī)則的方法,后者是基于語料庫的方法。 1)基于地圖的方法。源于數(shù)字圖書館中的地名歧義問題,Smith[6]提出了一種基于位置地理坐標的地名消歧方法,將上下文語境中的位置在地圖上表達,計算質心并與歧義地名相關的實際位置比較,與質心最近的位置被選為正確的地名;基于信任的方法[7],綜合地理距離和文本距離進行地名消歧,Zhao提出了一種考慮文本距離和地理距離的GeoRank算法[8]。2)基于外部資源的方法。利用地名庫進行訓練;基于維基百科生成共現(xiàn)模型(co-occurrence)應用于地名消歧[9];SPIRIT系統(tǒng)中基于多種資源(SABE、TGN 和OS)的地理編碼方法[10];基于WordNet、GeoWordNet本體層次樹結構特征解決地名歧義,典型的就是基于整體-部分關系的概念密度算法[11]和基于鄰近關系的地理密度算法[12]。3)數(shù)據(jù)驅動或者是監(jiān)督方法?;跇藴实臋C器學習技術,例如貝葉斯分類[13]、支持向量機[14],監(jiān)督學習方法的缺點是為了達到高精度需要大量的訓練數(shù)據(jù),并且沒有考慮未登錄地名。國內針對中文地名消歧問題的研究也取得了一些成果。張毅等[15]提出了一種基于證據(jù)理論的地名消歧方法,通過計算地名所指地理實體語義關聯(lián)度,利用D-S證據(jù)理論合成排歧證據(jù),最終實現(xiàn)地名消歧;唐旭日[16]提出了一種基于認知顯著度的地理編碼方法,認為地名與實體之間的關聯(lián)程度取決于該實體在上下文中的地名認知顯示度;朱少楠等[17]認為地名數(shù)據(jù)庫中的絕大多數(shù)地名具有行政隸屬關系,通過構建歧義地名關聯(lián)的行政隸屬關系樹狀圖進行地名消歧;杜萍[18]在地名識別的基礎上編寫JAPE規(guī)則用于中國縣級以上行政區(qū)劃地名消歧??梢妵鴥葘Φ孛绲难芯慷际且罁?jù)啟發(fā)式方法,在一定范圍內取得了不錯的消歧效果。

    本文提出了一種基于地名知識的地名消歧方法,并通過實驗進行了測試分析,結果表明該方法具有可行性,能夠達到一定的消歧精度。

    1 經(jīng)典的地名消歧方法

    1.1 基于地圖的地名消歧方法

    基于地圖的方法起源于數(shù)字圖書館中的地名歧義問題[6],此方法中上下文的大小是固定的,質心僅通過非歧義的或者已經(jīng)存在歧義地名質心計算。Buscaldi[19]利用了所有可能的參考,上下文的大小取決于包含在句子、上下文和文檔中的地名數(shù)量。對于歧義地名t和上下文C中的地名,ci∈C,0≤i≤n,n表示上下文的大小。上下文是由出現(xiàn)在同一文檔、段落或者句子中的地名組成。將歧義地名t的候選地理位置表示為t1,t2,…tk。

    1.2 基于概念密度的地名消歧方法

    WordNet的結構化數(shù)據(jù)特征能夠將詞義消歧算法引入到地名消歧領域,其中之一就是概念密度(Conceptual Density,CD)算法,該算法由Agirre提出[20],作為給定詞義和它的上下文之間的相關性度量方法,基于WordNet的子層計算,通過上位關系(is-a)決定概念密度。Buscaldi[11]利用整體-部分關系(part-of/holonymy)代替上位關系,這種方法假設一個歧義地名決定WordNet整體層次的一部分,并且上下文中的地名通常跟相關的正確地理位置分開。

    基于概念密度的地名消歧算法具體步驟為:選擇歧義地名t,列出對應的k個候選地理位置|t|;選擇t所在文本的上下文,由一系列地名組成;構建|t|的子層次結構,每一個對應一個地理位置;對于t的每一個候選地理位置s,計算概念密度CDs;選擇最大的CDs對應的地理位置作為最終的結果。其中,CDs是與s相關的子層的概念密度,改進了原始的概念密度計算公式,如下式:

    (1)

    式中:m是子層次中相關的同義詞集,a是常數(shù)0.1,n是子層次中的同義詞集的總數(shù),f是和子層相關的地理位置的頻率權重(1,2,…)。所有相關的同義詞集都是歧義詞和上下文詞的同義詞集,即候選地理位置與上下文地名之和。

    2 基于地名本體的地名知識表達與建庫

    2.1 地名知識模型與分析

    現(xiàn)有地名庫的空間表達能力有限并且缺乏對時空關系和模糊空間位置的支持,提出一種顧及人類常識空間認知、地名時態(tài)特征和空間關系特征的地名本體模型。在地名本體的基礎上實現(xiàn)地名知識的統(tǒng)一表達,面向地名領域相關標準和地名專家經(jīng)驗知識,涉及陳述型與規(guī)則型地名知識,突出對語義和時空等地名特征的表達,提出一種地名知識統(tǒng)一表達模型(TKURM,ToponymKnowledgeUnifiedRepresentationModel)[21],如圖1所示。

    圖1 地名知識統(tǒng)一表達模型(TKURM)

    該模型包括地名本體、時空規(guī)則庫和空間元知識文檔??臻g元知識是關于地名知識的知識,用來描述和說明地名知識的特征定義,文檔存儲為XML格式。地名本體主要是對地名概念、屬性和關系的描述,主要包括地名要素模型、地名類型模型、時態(tài)模型、幾何形態(tài)模型和空間關系模型。時空規(guī)則庫主要包括地名規(guī)則知識,應用于規(guī)則推理,挖掘隱含的地名知識。文獻[21]對該模型進行了詳細闡述。需要特別指出的是,地名要素類型和空間關系是反映地名實體地理關聯(lián)度的重要因子,其完備性直接影響實名識別和消歧的精度。依據(jù)國家標準《地名分類與類別代碼編制規(guī)則》(GB/T 18521-2001)進行地名分類,結合地名詞典和敘詞表定義地名本體概念語義關系;對于地名本體中地名實體之間的空間關系,分別采用四交模型、圓錐模型表達拓撲關系和方向關系,采用定性與定量距離相結合的方式表達距離關系。地名知識模型不基于某種特定的存儲,并且能夠方便地映射到其他知識模型中,這是地名知識共享和重用的基礎,有利于地理空間知識的共享[22]。

    2.2 地名知識庫構建

    知識獲取是知識庫構建與知識管理必不可少的一部分,處于基礎地位。地名知識的獲取途徑主要通過標準規(guī)范、背景語料庫、數(shù)據(jù)資源和地名專家知識等。其中地名數(shù)據(jù)庫是依據(jù)一定區(qū)域內各類基礎地理要素注記的名稱及其屬性特征而建成的關系數(shù)據(jù)庫,是地名知識的重要數(shù)據(jù)來源,基于逆向工程實現(xiàn)了1∶5萬和1∶25萬地名數(shù)據(jù)庫語義知識獲取。整個逆向過程分為3個步驟:1)逆向工程階段。此階段依據(jù)現(xiàn)有地名數(shù)據(jù)庫的表、表主鍵、表外鍵、屬性和約束等內容,逆向推理出內在的ER模式;2)ER模式向地名知識本體映射階段。此階段通過預處理、模式映射(表關系映射、表屬性映射和約束映射等)和地名專家確認3個步驟實現(xiàn)了ER模式和地名本體之間的轉換;3)地名數(shù)據(jù)記錄向地名知識OWL的映射階段。由步驟2可知完成了地名語義知識結構的轉換,此階段依據(jù)地名本體的語義知識結構重構地名數(shù)據(jù)庫中的數(shù)據(jù)記錄,在ER模式向地名本體映射的驅動下轉換具體地名知識實例展現(xiàn)形式。包括地名數(shù)據(jù)映射、交互補充和地名專家確認3個步驟。

    基于TKURM設計了中文地名知識庫構建流程,如圖2所示。其中地名信息變化發(fā)現(xiàn)模塊是針對當前地名數(shù)據(jù)庫時效性差而設計的,通過網(wǎng)絡爬蟲技術爬取提取地名信息,采用人機交互方式進行地名匹配,將地名信息存儲于地名數(shù)據(jù)庫并實現(xiàn)地名實時更新;專家知識、地名數(shù)據(jù)庫和空間元知識庫作為數(shù)據(jù)源輔助地名知識庫構建。依據(jù)本流程構建了中文地名知識庫,用于中文地名的識別和消歧,其中地名知識庫的質量和完備性直接決定了地名消歧的精度。

    3 地名知識輔助的中文地名消歧方法

    3.1 中文地名消歧原理

    Leidner[2]從語言和知識角度系統(tǒng)地總結了地名消歧中常見的16條啟發(fā)式規(guī)則,這些規(guī)則之間有些是互斥的,怎樣從中選取合適的規(guī)則融入一個統(tǒng)一的模型中進行地名消歧是需要首先解決的問題。首先做出以下兩個限定:同一文本或段落中多次出現(xiàn)的地名均指向同一地理位置[23];同一文本中出現(xiàn)的地名所對應的地理實體之間存在一定的關聯(lián),例如等價關系、包含關系或相離關系[24]。

    圖2 基于TKURM的地名知識庫構建流程

    地名實體之間的關聯(lián)強度對確定歧義地名的準確參照起重要作用[25],關聯(lián)強度越大則關聯(lián)度值越趨向于1,表明兩個地名實體越相似,反之亦然。本文針對中文地名的特點和地名知識庫結構,參照文獻[25]提出的地名消歧方法,通過計算地名實體與上下文中地名實體之間的地理關聯(lián)度進行中文地名消歧,具有最大地理關聯(lián)度的就是該地名所指向的地名實體。地名t指向的地名實體g的計算公式為:

    g=arggi∈StmaxSem(gi,Sc(t))

    (2)

    式中:gi表示第i個候選的地名實體,St表示地名指向的候選地名實體集合,c(t)表示地名t上下文地名集合,Sc(t)表示上下文地名匹配后的地名實體集合,Sem(gi,Sc(t))表示gi和Sc(t)的地理關聯(lián)度,g表示從St中選擇的具有最大地理關聯(lián)度的地名實體。

    計算地理關聯(lián)度的核心是地名實體之間的地理關聯(lián)強度,從語義關系、拓撲關系、距離關系和地名密度四方面進行加權計算。兩個地名實體gi和gj之間的地理關聯(lián)強度可以表示為:

    Sem(gi,gj)=α*Semsac(gi,gj)+β*Semtopo(gi,gj)+

    γ*Semdis(gi,gj)+φ*Semdes(gi,gj)

    (3)

    式中:Semsac(gi,gj)表示語義關系關聯(lián)強度,Semtopo(gi,gj)表示拓撲關系關聯(lián)強度,Semdis(gi,gj)表示距離關系關聯(lián)強度,Semdes(gi,gj)表示地名密度關聯(lián)強度。

    (1)語義關系關聯(lián)強度。語義關系主要是地名類型概念之間的關系,其關聯(lián)強度主要通過地名類型本體樹中概念節(jié)點之間的語義距離來衡量,同時受到概念深度因子的影響,具體計算公式如下:

    Depth(gi)+Depth(gj)|Depth(gi)+Depth(gj)|+2×Depth(O)

    (4)

    式中:Semsac(gi,gj)表示地名實體gi和gj的語義關系關聯(lián)強度;τ為語義距離調節(jié)因子;δ為關聯(lián)強度調節(jié)因子; Distance(gi,gj)表示地名實體gi和gj的地名類型之間的語義距離,即地名類型本體樹中連接兩個概念最短距離的邊數(shù)量;Depth(gi)和Depth(gj)表示地名實體gi和gj的地名類型在本體樹中的層次深度,即地名類型本體樹概念節(jié)點與根節(jié)點的最短路徑包含的邊的數(shù)量;Depth(O)表示整個本體樹的層次深度。

    (2)拓撲關系關聯(lián)強度。主要考慮相等、包含/包含于、相交、鄰接和相離等幾種拓撲關系,參考領域專家意見并通過實驗反復測試,可得地名實體gi和gj之間的拓撲關系關聯(lián)強度取值分別為:

    (5)

    (3)距離關系關聯(lián)強度。主要是指地名實體之間在地圖上的定量距離量度,距離越近關聯(lián)強度越大,反之亦然,關聯(lián)強度如下所示:

    Semdis(gi,gj)=eρ*dis(gi,gj)

    (6)

    (7)

    式中:gi和gj的坐標為(?gi,θgi),(?gj,θgj),r表示地球的半徑,Δθ表示θgj-θgi。

    (4)地名密度關聯(lián)強度。地名密度即候選地名實體在地名知識庫中所處區(qū)域的密度,具體量化為知識庫中兩個地名實例節(jié)點的最近公共祖先所包含的上下文中地名實例直接子節(jié)點數(shù)量,數(shù)量越多密度越大。將地名實體gi和gj之間的地名密度關聯(lián)強度取值分別為:

    (8)

    式中:Des(cgi,gj)表示地名實體gi和gj的地名密度,即最近公共祖先cgi,gj所包含的上下文中地名實例直接子節(jié)點數(shù)量;Des(TO)表示地名知識庫中地名實例節(jié)點的子節(jié)點數(shù)的最大值。

    3.2 中文地名消歧算法流程

    4 實驗測試與分析

    地名消歧方法的評價性能指標與詞義消歧、信息檢索和自然語言處理領域的度量標準類似,主要包括準確率、召回率、覆蓋率和F值。準確率P是正確消歧的地名數(shù)量占算法能夠識別出的歧義地名總數(shù)的比率;召回率R是正確消歧的地名數(shù)量占文檔集合中所有實際歧義地名總數(shù)的比率;覆蓋率C是算法能識別出的歧義地名總數(shù)占文檔集合中實際歧義地名總數(shù)的比率;F值是用來加權準確率和召回率得到的平均指數(shù),計算公式表示為:

    (9)

    實驗數(shù)據(jù)源主要是中文地名知識庫和標注語料庫,標注語料庫是基于地名知識結構進行人工標注的識別與消歧語料庫,該語料庫能夠給地名知識庫中的地名分配一個正確的空間參考。目前該標注語料庫中現(xiàn)有文檔數(shù)量9 400個,其中中文地名總數(shù)84 000個,歧義地名數(shù)量14 700。

    實驗采用3種級別的上下文:句子上下文、段落上下文和文檔上下文進行消歧測試,句子上下文就是在同一個句子中包含的所有地名數(shù),段落上下文就是指在同一個段落中包含的所有地名用于消歧,文檔上下文就是文檔中包含的地名作為消歧上下文。為了便于橫向比較,本文選取經(jīng)典的基于地圖的方法進行地名消歧測試比較,由于基于密度的方法原理是基于WordNet,而WordNet與本文的地名知識本體的結構是完全不同的,故無法采用基于密度的方法進行比較?;谖谋痉椒ê突诘貓D方法的地名消歧結果如表1所示。

    表1 采用不同上下文的地名消歧結果比較

    從結果中可以看出,本文的方法在上下文很小時也能達到很高的精度,基于地圖的方法相比本文的方法,需要更多的上下文信息才能得到同樣的消歧性能。本文的方法在不同上下文下準確率、召回率、覆蓋率和F值都有很好的結果,限于本體結構的影響,覆蓋率目前還不能達到100%。

    5 結語

    目前地名消歧在自然語言處理領域得到了快速發(fā)展,一些新的方法相繼提出,并且與已經(jīng)存在的方法比較,均取得了不錯效果。但是針對中文地名消歧的研究,在GIS和NLP領域都處于探索和實驗階段。本文僅是通過地名知識這一視角,利用定性與定量相結合的方式,提出一種中文地名消歧方法。實驗證明該方法具有一定的精度、覆蓋率和穩(wěn)定性,但依舊需要完善地名知識庫,進一步提高地名識別精度,并采取多種策略解決歧義問題。中文地名消歧未來依舊具有廣泛研究的空間,例如:對于geo/non-geo歧義的研究,基本沒有成熟的研究;利用地名消歧自動標記網(wǎng)絡文本中的歧義地名從而豐富網(wǎng)絡中顯式的空間知識,為決策提供精準定位服務;將地名消歧應用于地理信息檢索、問答系統(tǒng)、基于位置的服務和空間信息挖掘等領域。

    [1] HILL L L.Georeferencing:The Geographic Associations of Information[M].Mit Press,2009.

    [2] LEIDNER J L.Toponym Resolution in Text:Annotation,Evaluation and Applications of Spatial Grounding of Place Names[M].Universal-Publishers,2008.

    [3] AMITAY E,HAR′EL N,SIVAN R,et al.Web-a-where:Geotagging web content[A].Proceedings of the 27th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval[C].2004.273-280.

    [4] GARBIN E,MANI I.Disambiguating toponyms in news[A].Proceedings of the Conference on Human Language Technology and Empirical Methods in Natural Language Processing[C].2005.363-370.

    [5] OLLIGSCHLAEGER A M,HAUPTMANN A G.Multimodal information systems and GIS:The informedia digital video library[A].Proceedings of the 1999 ESRI User Conference[C].1999.102-106.

    [6] SMITH D A,CRANE G.Disambiguating Geographic Names in a Historical Digital Library[M].Springer Berlin Heidelberg,2001.127-136.

    [7] RAUCH E,BUKATIN M,BAKER K.A confidence-based framework for disambiguating geographic terms[A].Proceedings of the HLT-NAACL 2003 Workshop on Analysis of Geographic References-Volume 1[C].2003.50-54.

    [8] ZHAO J,JIN P,ZHANG Q,et al.Exploiting location information for web search[J].Computers in Human Behavior,2014,30:378-388.

    [9] OVERELL S,RüGER S.Using co-occurrence models for placename disambiguation[J].International Journal of Geographical Information Science,2008,22(3):265-287.

    [10] CLOUGH P.Extracting metadata for spatially-aware information retrieval on the internet[A].Proceedings of the 2005 Workshop on Geographic Information Retrieval[C].2005.25-30.

    [11] BUSCALDI D,ROSSO P.A conceptual density-based approach for the disambiguation of toponyms[J].International Journal of Geographical Information Science,2008,22(3):301-313.

    [12] BENSALEM I,KHOLLADI M K.Toponym disambiguation by arborescent relationships[J].Journal of Computer Science,2010,6(6):653.

    [13] SMITH D A,MANN G S.Bootstrapping toponym classifiers[A].Proceedings of the HLT-NAACL 2003 Workshop on Analysis of Geographic References-Volume 1[C].2003.45-49.

    [14] MARTINS B,ANASTCIO I,CALADO P.A Machine Learning Approach for Resolving Place References in Text[M].Springer Berlin Heidelberg,2010.221-236.

    [15] 張毅,王星光,陳敏,等.基于語義的文本地理范圍提取方法[J].高技術通訊,2012,22(2):165-170.

    [16] 唐旭日,陳小荷,張雪英.中文文本的地名解析方法研究[J].武漢大學學報(信息科學版),2010,35(8):930-935.

    [17] 朱少楠,張雪英,李明,等.基于行政隸屬關系樹狀圖的地名消歧方法[J].地理與地理信息科學,2013,29(3):39-42.

    [18] 杜萍,劉勇.中文地名識別與歧義消除——以中國縣級以上行政區(qū)劃地名為例[J].遙感技術與應用,2011,26(6):868-873.

    [19] BUSCALDI D,ROSSO P.Map-based vs knowledge-based toponym disambiguation[A].Proceedings of the 2nd International Workshop on Geographic Information Retrieval[C].2008.19-22.

    [20] AGIRRE E,RIGAU G.Word sense disambiguation using conceptual density[A].Proceedings of the 16th Conference on Computational Linguistics-Volume 1[C].1996.16-22.

    [21] 馬雷雷,李宏偉,梁汝鵬,等.基于地名本體的地名知識表達方法[J].測繪科學技術學報,2015,32(3):305-309.

    [22] 龔健雅,耿晶,吳華意.地理空間知識服務概論[J].武漢大學學報(信息科學版),2014,39(8):883-890.

    [23] GALE W A,CHURCH K W,YAROWSKY D.One sense per discourse[A].Proceedings of the Workshop on Speech and Natural Language[C].1992.233-237.

    [24] MARTINS B,MANGUINHAS H,BORBINHA J,et al.A geo-temporal information extraction service for processing descriptive metadata in digital libraries[J].e-Perimetron,2009,4(1):25-37.

    [25] WANG X,ZHANG Y,CHEN M,et al.An evidence-based approach for toponym disambiguation[C].Geoinformatics,2010 18th International Conference on IEEE[C].2010.1-7.

    A Method to Toponym Disambiguation Aided by Toponym Knowledge

    MA Lei-lei1,2,LI Hong-wei1,LIAN Shi-wei1,LIANG Ru-peng1,GONG Jing2

    (1.InstituteofSurveyingandMapping,InformationEngineeringUniversity,Zhengzhou450052;2.SichuanEngineeringResearchCenterforEmergencyMapping&DisasterReduction,Chengdu610041,China)

    In geographic space,a location can be expressed by either geographic coordinates or natural language texts,corresponding to formalized or non-formalized expressions respectively.A typonym in texts,however,can refer to different locations in geographic space,leading to toponym ambiguity.The toponym disambiguation is therefore to eliminate cognition divergence of concept reference and assign unique geographic coordinate for such ambiguous location.From the perspective of toponym knowledge,this paper proposes a unified expression method based on toponym ontology,and investigates the data source of toponym knowledge,and proposes the framework of constructing a toponym knowledge database.Next,this paper describes the theory of toponym disambiguation,and the corresponding algorithm flow by means of semantic relation,typology relation,distance relation and toponym density to calculate the geographic correlations for toponym disambiguation.Semantic relation mainly refers to the type of relationship between the concepts of toponyms.Typology relation mainly contain equal,contain,intersection,adjacent and disjoint etc.Distance relation refers to quantitative distance between the toponym entities on the map.Toponym density represents the density of toponym entities in regions in toponym knowledge base.The proposed method is evaluated by experiments,where the experimental results show that the proposed method produces a high accuracy in terms of precision,recall rate,coverage rate and F value.

    toponym;knowledge;toponym ontology;toponym disambiguation;correlation

    2015-12-18;

    2016-03-24

    國家自然科學基金項目(40871183、41140012、41271392、41401463、41571394);四川省應急測繪與防災減災工程技術研究中心開放基金項目(K2014B016、K2015B014)

    馬雷雷(1987-),男,博士研究生,主要研究方向為地理本體與地理信息智能處理。E-mail:gisxiaomage@163.com

    10.3969/j.issn.1672-0504.2016.04.002

    P208

    A

    1672-0504(2016)04-0005-06

    猜你喜歡
    消歧歧義知識庫
    基于關聯(lián)圖和文本相似度的實體消歧技術研究*
    基于半監(jiān)督集成學習的詞義消歧
    eUCP條款歧義剖析
    中國外匯(2019年12期)2019-10-10 07:26:58
    基于TRIZ與知識庫的創(chuàng)新模型構建及在注塑機設計中的應用
    藏文歷史文獻識別過程中藏文自由虛詞的自動識別及消歧算法的研究
    English Jokes: Homonyms
    高速公路信息系統(tǒng)維護知識庫的建立和應用
    “那么大”的語義模糊與歧義分析
    基于Drupal發(fā)布學者知識庫關聯(lián)數(shù)據(jù)的研究
    圖書館研究(2015年5期)2015-12-07 04:05:48
    基于《知網(wǎng)》的中文信息結構消歧研究
    精品久久国产蜜桃| 97精品久久久久久久久久精品| 中文字幕另类日韩欧美亚洲嫩草| 在线观看www视频免费| 国产成人91sexporn| 精品少妇黑人巨大在线播放| a级毛片黄视频| 十分钟在线观看高清视频www| 国产毛片在线视频| videos熟女内射| 国产免费又黄又爽又色| 久久女婷五月综合色啪小说| 免费在线观看黄色视频的| 2018国产大陆天天弄谢| 久久 成人 亚洲| 国产69精品久久久久777片| 一个人免费看片子| 欧美最新免费一区二区三区| 99热网站在线观看| 久久 成人 亚洲| 飞空精品影院首页| a级片在线免费高清观看视频| av网站免费在线观看视频| 亚洲av成人精品一二三区| 两个人看的免费小视频| 国产亚洲一区二区精品| 久热这里只有精品99| 午夜福利网站1000一区二区三区| 草草在线视频免费看| 亚洲av日韩在线播放| 日日撸夜夜添| 久久国产亚洲av麻豆专区| av电影中文网址| 999精品在线视频| 久久狼人影院| 国产精品 国内视频| 精品国产乱码久久久久久小说| 亚洲国产欧美在线一区| 美女国产高潮福利片在线看| 精品人妻一区二区三区麻豆| 国产欧美亚洲国产| 久久久久精品久久久久真实原创| 国产亚洲午夜精品一区二区久久| 久久青草综合色| 少妇人妻精品综合一区二区| 久久这里有精品视频免费| 肉色欧美久久久久久久蜜桃| 国产成人91sexporn| 国产亚洲最大av| 国产精品一区www在线观看| 自线自在国产av| 日韩一区二区视频免费看| 国产成人精品久久久久久| 视频区图区小说| 久久综合国产亚洲精品| a级毛色黄片| 国产精品麻豆人妻色哟哟久久| 大陆偷拍与自拍| 日本av免费视频播放| 男女边吃奶边做爰视频| 日日爽夜夜爽网站| 美女内射精品一级片tv| 午夜福利视频在线观看免费| 免费女性裸体啪啪无遮挡网站| 美女主播在线视频| 热re99久久国产66热| 午夜老司机福利剧场| 久久99热6这里只有精品| 国产乱人偷精品视频| 看免费成人av毛片| av在线观看视频网站免费| 国产视频首页在线观看| 韩国av在线不卡| 巨乳人妻的诱惑在线观看| 免费女性裸体啪啪无遮挡网站| 草草在线视频免费看| 国产精品人妻久久久影院| 国产亚洲精品久久久com| 久久久久久人妻| 少妇的逼水好多| a级毛片在线看网站| 国产欧美另类精品又又久久亚洲欧美| 国产精品99久久99久久久不卡 | 精品国产一区二区三区四区第35| 90打野战视频偷拍视频| 爱豆传媒免费全集在线观看| 中文乱码字字幕精品一区二区三区| 人妻系列 视频| 熟女av电影| 亚洲av欧美aⅴ国产| 久久精品久久久久久噜噜老黄| av国产精品久久久久影院| a级毛片黄视频| 久久久精品免费免费高清| 免费观看在线日韩| 亚洲欧洲日产国产| av国产久精品久网站免费入址| 亚洲欧美中文字幕日韩二区| 亚洲国产毛片av蜜桃av| 成年美女黄网站色视频大全免费| 亚洲国产欧美在线一区| 在现免费观看毛片| 久久精品熟女亚洲av麻豆精品| 日韩一本色道免费dvd| 大片电影免费在线观看免费| 亚洲精品久久午夜乱码| 十八禁高潮呻吟视频| 久久久久国产网址| 免费不卡的大黄色大毛片视频在线观看| 卡戴珊不雅视频在线播放| 曰老女人黄片| 久久久久久久久久成人| 国产精品偷伦视频观看了| 国产成人av激情在线播放| 一级黄片播放器| 深夜精品福利| 免费高清在线观看视频在线观看| 美女xxoo啪啪120秒动态图| 啦啦啦啦在线视频资源| 看免费成人av毛片| 国产精品偷伦视频观看了| 久久99热这里只频精品6学生| 人妻系列 视频| 亚洲在久久综合| 只有这里有精品99| 黄色怎么调成土黄色| 狠狠精品人妻久久久久久综合| 高清视频免费观看一区二区| 只有这里有精品99| 亚洲高清免费不卡视频| av在线老鸭窝| 交换朋友夫妻互换小说| 免费久久久久久久精品成人欧美视频 | 最近最新中文字幕免费大全7| 国语对白做爰xxxⅹ性视频网站| 久久久久久久亚洲中文字幕| 伊人亚洲综合成人网| www.熟女人妻精品国产 | 一级片免费观看大全| 又粗又硬又长又爽又黄的视频| 国内精品宾馆在线| 中国美白少妇内射xxxbb| 22中文网久久字幕| 两个人看的免费小视频| 亚洲图色成人| 国产精品一区二区在线观看99| 99热网站在线观看| 国产老妇伦熟女老妇高清| 国产又色又爽无遮挡免| 一区二区三区精品91| 欧美日韩视频高清一区二区三区二| 国产精品久久久久久精品古装| 国产成人一区二区在线| 女人精品久久久久毛片| 国产片特级美女逼逼视频| 女的被弄到高潮叫床怎么办| 亚洲国产精品一区二区三区在线| 欧美国产精品一级二级三级| 久久精品国产a三级三级三级| 国产免费现黄频在线看| 一边亲一边摸免费视频| 激情视频va一区二区三区| 五月开心婷婷网| 最黄视频免费看| 最后的刺客免费高清国语| 新久久久久国产一级毛片| 成人毛片a级毛片在线播放| 亚洲欧洲日产国产| 亚洲国产欧美日韩在线播放| 九九在线视频观看精品| 色哟哟·www| 欧美亚洲日本最大视频资源| 国产精品一区二区在线观看99| 又大又黄又爽视频免费| 国产精品嫩草影院av在线观看| 精品国产一区二区三区四区第35| 成人手机av| 嫩草影院入口| 男女无遮挡免费网站观看| 成人毛片60女人毛片免费| 亚洲av电影在线观看一区二区三区| 免费看av在线观看网站| 成年美女黄网站色视频大全免费| 亚洲国产精品一区三区| 一个人免费看片子| 日韩av不卡免费在线播放| 97在线视频观看| 欧美亚洲日本最大视频资源| 免费女性裸体啪啪无遮挡网站| 久久久久人妻精品一区果冻| 内地一区二区视频在线| 亚洲精品日韩在线中文字幕| 精品少妇内射三级| 国产精品国产av在线观看| 蜜臀久久99精品久久宅男| 91精品伊人久久大香线蕉| 在线观看人妻少妇| 一区在线观看完整版| 卡戴珊不雅视频在线播放| 久久人人97超碰香蕉20202| 熟女电影av网| 多毛熟女@视频| 欧美成人精品欧美一级黄| 少妇高潮的动态图| 免费av中文字幕在线| 秋霞在线观看毛片| 亚洲欧美精品自产自拍| 国产成人av激情在线播放| tube8黄色片| 一级片免费观看大全| 国产1区2区3区精品| 亚洲图色成人| 亚洲精品乱码久久久久久按摩| 男女高潮啪啪啪动态图| 三上悠亚av全集在线观看| 亚洲国产精品一区二区三区在线| 午夜免费鲁丝| 成人国产麻豆网| 国产高清国产精品国产三级| 国产老妇伦熟女老妇高清| 日日啪夜夜爽| 22中文网久久字幕| 美女福利国产在线| 久久精品aⅴ一区二区三区四区 | 免费观看性生交大片5| 91精品国产国语对白视频| 亚洲欧美一区二区三区国产| 乱人伦中国视频| 亚洲丝袜综合中文字幕| 国产探花极品一区二区| 波野结衣二区三区在线| av.在线天堂| 久久精品国产自在天天线| 一级片'在线观看视频| 久久影院123| 国语对白做爰xxxⅹ性视频网站| 国产精品久久久久久精品古装| 伊人久久国产一区二区| 午夜免费观看性视频| 久久久久久久久久久免费av| 交换朋友夫妻互换小说| 一本色道久久久久久精品综合| 国产av国产精品国产| 最近的中文字幕免费完整| 一级爰片在线观看| 亚洲人成77777在线视频| 汤姆久久久久久久影院中文字幕| 日本vs欧美在线观看视频| 黄色毛片三级朝国网站| av在线老鸭窝| 精品一区二区三区四区五区乱码 | 两个人看的免费小视频| 一个人免费看片子| 国产黄频视频在线观看| a 毛片基地| 亚洲,欧美,日韩| 日韩中字成人| 国产成人aa在线观看| 成年人免费黄色播放视频| 一级毛片 在线播放| 97精品久久久久久久久久精品| 高清不卡的av网站| 成年av动漫网址| 免费观看av网站的网址| 天堂8中文在线网| 国产色婷婷99| 视频在线观看一区二区三区| 夫妻午夜视频| 丁香六月天网| 视频在线观看一区二区三区| 热99国产精品久久久久久7| 久久亚洲国产成人精品v| 国产成人91sexporn| 韩国高清视频一区二区三区| 大话2 男鬼变身卡| av国产久精品久网站免费入址| 亚洲人成网站在线观看播放| 亚洲av福利一区| 欧美3d第一页| 满18在线观看网站| 中文字幕精品免费在线观看视频 | 激情五月婷婷亚洲| 日日啪夜夜爽| 欧美人与性动交α欧美精品济南到 | 亚洲内射少妇av| 亚洲精品456在线播放app| 久久久亚洲精品成人影院| 少妇猛男粗大的猛烈进出视频| 亚洲国产欧美日韩在线播放| 国产精品一国产av| 亚洲国产色片| 日本免费在线观看一区| 卡戴珊不雅视频在线播放| 伦精品一区二区三区| 各种免费的搞黄视频| 亚洲精品日本国产第一区| 在线天堂中文资源库| 亚洲一级一片aⅴ在线观看| 九九爱精品视频在线观看| 久久久久久久久久久久大奶| 国产精品久久久久久精品古装| 男女免费视频国产| 精品卡一卡二卡四卡免费| 蜜桃在线观看..| 又粗又硬又长又爽又黄的视频| 欧美日韩亚洲高清精品| 日本午夜av视频| 国产老妇伦熟女老妇高清| 亚洲,欧美,日韩| 国产亚洲最大av| 久久精品国产鲁丝片午夜精品| 男女啪啪激烈高潮av片| 国国产精品蜜臀av免费| av女优亚洲男人天堂| 99精国产麻豆久久婷婷| 国产精品三级大全| 亚洲国产色片| 免费在线观看完整版高清| 美女主播在线视频| 性色avwww在线观看| 中国美白少妇内射xxxbb| 欧美日韩成人在线一区二区| 毛片一级片免费看久久久久| 精品亚洲成a人片在线观看| 全区人妻精品视频| 亚洲精品aⅴ在线观看| 少妇猛男粗大的猛烈进出视频| 天天影视国产精品| 成年人午夜在线观看视频| 国产在线视频一区二区| 多毛熟女@视频| 新久久久久国产一级毛片| av播播在线观看一区| 欧美日韩国产mv在线观看视频| 美女中出高潮动态图| 国产欧美日韩综合在线一区二区| 97人妻天天添夜夜摸| 不卡视频在线观看欧美| 精品午夜福利在线看| 纯流量卡能插随身wifi吗| 日韩人妻精品一区2区三区| 丰满少妇做爰视频| 欧美人与善性xxx| 欧美日韩精品成人综合77777| 久久精品久久精品一区二区三区| 国产在线一区二区三区精| 精品熟女少妇av免费看| 国产欧美另类精品又又久久亚洲欧美| 国产爽快片一区二区三区| 1024视频免费在线观看| 丝袜美足系列| 亚洲丝袜综合中文字幕| 最新中文字幕久久久久| 少妇 在线观看| 天堂中文最新版在线下载| 亚洲精品久久午夜乱码| 青春草视频在线免费观看| 成人黄色视频免费在线看| 国产精品一区www在线观看| 国产精品久久久久久久电影| 亚洲欧洲精品一区二区精品久久久 | 久久久a久久爽久久v久久| 这个男人来自地球电影免费观看 | 视频在线观看一区二区三区| 丰满少妇做爰视频| 国产精品人妻久久久久久| 色婷婷av一区二区三区视频| 美女视频免费永久观看网站| 国产永久视频网站| 精品国产国语对白av| 亚洲精品美女久久av网站| 国产欧美另类精品又又久久亚洲欧美| 97精品久久久久久久久久精品| 在线天堂中文资源库| 午夜福利在线观看免费完整高清在| 我的女老师完整版在线观看| 51国产日韩欧美| 国产探花极品一区二区| av播播在线观看一区| 久久精品久久精品一区二区三区| 狂野欧美激情性bbbbbb| 亚洲第一区二区三区不卡| 免费观看无遮挡的男女| 久久久久久久久久成人| xxxhd国产人妻xxx| 另类亚洲欧美激情| 日韩不卡一区二区三区视频在线| 久久精品国产鲁丝片午夜精品| 欧美人与性动交α欧美精品济南到 | 婷婷色综合大香蕉| 人妻少妇偷人精品九色| 熟女电影av网| 亚洲欧美日韩卡通动漫| 国产成人精品福利久久| 青青草视频在线视频观看| 在线观看免费视频网站a站| 一本色道久久久久久精品综合| 午夜精品国产一区二区电影| 日本与韩国留学比较| 色婷婷久久久亚洲欧美| 最近中文字幕2019免费版| 亚洲精品av麻豆狂野| 另类亚洲欧美激情| 一级毛片 在线播放| 在线观看一区二区三区激情| 国产成人91sexporn| 精品亚洲成a人片在线观看| 26uuu在线亚洲综合色| 免费看av在线观看网站| 26uuu在线亚洲综合色| 亚洲人与动物交配视频| 制服诱惑二区| 久久久久久人人人人人| av福利片在线| 久久精品国产鲁丝片午夜精品| 免费观看a级毛片全部| 中文字幕制服av| 这个男人来自地球电影免费观看 | 精品国产露脸久久av麻豆| 咕卡用的链子| 波野结衣二区三区在线| 女性被躁到高潮视频| 九九在线视频观看精品| 五月天丁香电影| 国产伦理片在线播放av一区| 91在线精品国自产拍蜜月| 成人免费观看视频高清| av卡一久久| 最近中文字幕2019免费版| 啦啦啦视频在线资源免费观看| 免费高清在线观看日韩| 国产男女内射视频| 丝瓜视频免费看黄片| 日韩 亚洲 欧美在线| 伦精品一区二区三区| 国产成人免费观看mmmm| 欧美3d第一页| 天天操日日干夜夜撸| 又黄又粗又硬又大视频| 人人妻人人爽人人添夜夜欢视频| 国产片内射在线| 黑人巨大精品欧美一区二区蜜桃 | 99热国产这里只有精品6| 春色校园在线视频观看| 亚洲国产看品久久| 视频在线观看一区二区三区| 国产片内射在线| 免费黄网站久久成人精品| 在线天堂最新版资源| 夫妻午夜视频| 天堂俺去俺来也www色官网| 91国产中文字幕| 中文乱码字字幕精品一区二区三区| 考比视频在线观看| 七月丁香在线播放| 中文乱码字字幕精品一区二区三区| 免费日韩欧美在线观看| 国产亚洲一区二区精品| 一级片免费观看大全| 最近中文字幕高清免费大全6| 久久av网站| 高清不卡的av网站| 寂寞人妻少妇视频99o| 秋霞在线观看毛片| 亚洲av成人精品一二三区| 欧美精品高潮呻吟av久久| av一本久久久久| 亚洲人成网站在线观看播放| 精品久久国产蜜桃| 免费人成在线观看视频色| 少妇高潮的动态图| 精品久久国产蜜桃| 久久这里有精品视频免费| 精品一区在线观看国产| 天天影视国产精品| 国产国拍精品亚洲av在线观看| 成年动漫av网址| 亚洲精品乱久久久久久| 伊人久久国产一区二区| 久久99精品国语久久久| 亚洲av综合色区一区| 精品人妻偷拍中文字幕| 国产在视频线精品| 精品国产一区二区三区久久久樱花| 日韩成人av中文字幕在线观看| 日韩精品免费视频一区二区三区 | 中文欧美无线码| 亚洲欧美一区二区三区国产| 在线天堂中文资源库| 黑人欧美特级aaaaaa片| 日本欧美视频一区| 亚洲av男天堂| 欧美丝袜亚洲另类| 日韩人妻精品一区2区三区| 久久精品国产综合久久久 | 亚洲av日韩在线播放| 我要看黄色一级片免费的| 18在线观看网站| 人妻少妇偷人精品九色| 69精品国产乱码久久久| 国产欧美日韩一区二区三区在线| 一级毛片 在线播放| 欧美变态另类bdsm刘玥| 搡老乐熟女国产| 波野结衣二区三区在线| av电影中文网址| 国产精品国产三级专区第一集| 天堂俺去俺来也www色官网| 亚洲综合色惰| 最近2019中文字幕mv第一页| 久久99蜜桃精品久久| 婷婷色av中文字幕| 日韩中文字幕视频在线看片| 91成人精品电影| 各种免费的搞黄视频| 国产不卡av网站在线观看| 丝袜美足系列| 99精国产麻豆久久婷婷| 咕卡用的链子| 欧美亚洲 丝袜 人妻 在线| 人妻系列 视频| 超色免费av| 国产在线一区二区三区精| 色吧在线观看| 午夜福利视频在线观看免费| 有码 亚洲区| kizo精华| 黑人高潮一二区| 尾随美女入室| 久久青草综合色| 免费av不卡在线播放| 在线 av 中文字幕| 天堂中文最新版在线下载| 国产老妇伦熟女老妇高清| 69精品国产乱码久久久| 国产日韩欧美视频二区| 人人妻人人澡人人看| 国产乱来视频区| 成人手机av| 亚洲欧美色中文字幕在线| 国产精品免费大片| 一本一本久久a久久精品综合妖精 国产伦在线观看视频一区 | 91精品三级在线观看| 春色校园在线视频观看| 伊人亚洲综合成人网| 亚洲美女搞黄在线观看| 人人妻人人澡人人看| 考比视频在线观看| 久久精品国产综合久久久 | 男人爽女人下面视频在线观看| 免费观看在线日韩| 久热久热在线精品观看| 国产男人的电影天堂91| 免费看不卡的av| 一区二区三区乱码不卡18| 免费高清在线观看视频在线观看| 18禁观看日本| 国产亚洲午夜精品一区二区久久| 免费少妇av软件| 日韩成人av中文字幕在线观看| 免费女性裸体啪啪无遮挡网站| 狂野欧美激情性bbbbbb| 女人精品久久久久毛片| 夜夜爽夜夜爽视频| 国产1区2区3区精品| 伊人亚洲综合成人网| 亚洲成人一二三区av| 久久人人爽人人爽人人片va| 国产不卡av网站在线观看| 欧美日韩国产mv在线观看视频| 成人免费观看视频高清| 在线 av 中文字幕| 成人国产麻豆网| 天天躁夜夜躁狠狠躁躁| 成人影院久久| 国产不卡av网站在线观看| 又黄又粗又硬又大视频| 人成视频在线观看免费观看| 婷婷色av中文字幕| 亚洲精品乱久久久久久| 精品人妻在线不人妻| 一级毛片我不卡| 两性夫妻黄色片 | av有码第一页| 国产精品99久久99久久久不卡 | 丝袜人妻中文字幕| av在线app专区| 欧美性感艳星| 久久女婷五月综合色啪小说| 国产片特级美女逼逼视频| 一级片免费观看大全| 伦理电影免费视频| 国产亚洲精品久久久com| 亚洲av日韩在线播放| 国产精品一二三区在线看| 少妇被粗大猛烈的视频| 精品亚洲成国产av| 欧美精品av麻豆av| 五月开心婷婷网| 久久久久网色| 一级片免费观看大全| 亚洲精品成人av观看孕妇| 看非洲黑人一级黄片| 亚洲国产看品久久| 美女xxoo啪啪120秒动态图| 国产在线视频一区二区| 18禁在线无遮挡免费观看视频| 纵有疾风起免费观看全集完整版| 99热6这里只有精品| 一区二区av电影网| 久久久国产欧美日韩av| 自拍欧美九色日韩亚洲蝌蚪91| 80岁老熟妇乱子伦牲交| 啦啦啦中文免费视频观看日本| 最后的刺客免费高清国语|