• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于網(wǎng)絡(luò)的地理目標(biāo)數(shù)據(jù)獲取與處理方法研究

    2019-10-30 08:28:02戰(zhàn)略支援部隊(duì)信息工程大學(xué)葛磊劉海硯楊瑞杰
    網(wǎng)信軍民融合 2019年10期
    關(guān)鍵詞:屬性數(shù)據(jù)結(jié)構(gòu)化坐標(biāo)系

    ◎ 戰(zhàn)略支援部隊(duì)信息工程大學(xué) 葛磊 劉海硯 楊瑞杰

    隨著網(wǎng)絡(luò)信息資源的不斷豐富,基于網(wǎng)絡(luò)實(shí)現(xiàn)對地理實(shí)體目標(biāo)信息的快速采集和更新成為可能。本文根據(jù)地理實(shí)體相關(guān)信息的分布和結(jié)構(gòu)特點(diǎn),對現(xiàn)有地理目標(biāo)位置數(shù)據(jù)的獲取方法進(jìn)行了分析,提出了通過屬性歸一化、基于規(guī)則匹配抽取半結(jié)構(gòu)化地理目標(biāo)屬性和基于弱監(jiān)督的條件隨機(jī)場模型抽取非結(jié)構(gòu)化文本中地理目標(biāo)屬性的方法,并針對多源地理目標(biāo)數(shù)據(jù)的不一致問題提出了數(shù)據(jù)融合處理的一般方法。

    隨著“互聯(lián)網(wǎng)+”概念的提出,網(wǎng)絡(luò)已經(jīng)作為社會的基礎(chǔ)設(shè)施成為人類生活中不可分割的一部分。隨著各種傳統(tǒng)行業(yè)、服務(wù)行業(yè)與互聯(lián)網(wǎng)的深度結(jié)合,互聯(lián)網(wǎng)集聚了各行各業(yè)的信息資源,已成為人類各種信息的主要來源。然而,互聯(lián)網(wǎng)上的原始數(shù)據(jù)都是非結(jié)構(gòu)化或者半結(jié)構(gòu)化的,不能直接作為地理信息產(chǎn)品使用,如何快速準(zhǔn)確獲取結(jié)構(gòu)化的地理實(shí)體目標(biāo)數(shù)據(jù)仍面臨著許多挑戰(zhàn)。

    一、地理空間數(shù)據(jù)網(wǎng)絡(luò)獲取現(xiàn)狀分析

    地理空間數(shù)據(jù)獲取的主要手段是Web爬蟲技術(shù),即根據(jù)給定的一個(gè)網(wǎng)頁,通過對網(wǎng)頁中的鏈接進(jìn)行解析發(fā)現(xiàn)其他網(wǎng)頁,然后不斷進(jìn)行迭代爬取,直到完成對所有相關(guān)網(wǎng)頁的爬取。另一類信息獲取技術(shù)是利用一些專業(yè)網(wǎng)站提供的Web開發(fā)接口或者服務(wù)接口獲取特定類型的數(shù)據(jù),這類數(shù)據(jù)通常質(zhì)量較高,數(shù)據(jù)結(jié)構(gòu)良好,比較適合專業(yè)數(shù)據(jù)的獲取。地理空間數(shù)據(jù)獲取主要包括位置數(shù)據(jù)和屬性數(shù)據(jù)的獲取。

    位置數(shù)據(jù)獲取方面,目前基于Web的地理信息獲取研究較多,大多集中在對地理實(shí)體位置數(shù)據(jù)的獲取,還存在數(shù)據(jù)獲取不完整、數(shù)據(jù)損失和數(shù)據(jù)冗余等問題,數(shù)據(jù)的準(zhǔn)確度和數(shù)據(jù)結(jié)構(gòu)的完整性不能保證,同時(shí)對多源數(shù)據(jù)的融合和統(tǒng)一轉(zhuǎn)換問題的研究仍相對較少。

    屬性數(shù)據(jù)獲取方面,MUC(消息理解會議,Message Understanding Conference)系列會議通過具體的任務(wù)進(jìn)行信息抽取并建立了嚴(yán)格的評價(jià)體系對各個(gè)抽取系統(tǒng)進(jìn)行評測,逐漸完善了基于模板和規(guī)則的信息抽取方案,形成了一套面向領(lǐng)域、基于規(guī)則的信息抽取體系,同時(shí)形成了一套完善的信息抽取結(jié)果評價(jià)指標(biāo)體系。中文信息抽取的研究開始較晚,另外由于中文和英語在母單詞、語法和語義基本單元差別,使很多英文信息抽取方法不能直接應(yīng)用于中文信息抽取。當(dāng)前中文信息抽取在命名實(shí)體識別的基礎(chǔ)上向關(guān)系抽取、關(guān)聯(lián)抽取、屬性抽取等更深層次發(fā)展。中文信息抽取系統(tǒng)目前仍集中在簡單任務(wù)方面,國內(nèi)學(xué)者采用規(guī)則匹配、機(jī)器學(xué)習(xí)等方法對文本信息的抽取進(jìn)行了研究,其中,中科院的ICTCLAS和北大的會議新聞抽取系統(tǒng)實(shí)現(xiàn)了對簡單文本信息的準(zhǔn)確抽取,但完善的中文信息抽取系統(tǒng)尚未成型。

    二、地理目標(biāo)位置數(shù)據(jù)的獲取

    POI(Point of Interest,興趣點(diǎn))是空間信息數(shù)據(jù)最鮮活的“血液”,它通常代表的是一類真實(shí)的地理實(shí)體。互聯(lián)網(wǎng)信息冗雜,高質(zhì)量的地理信息網(wǎng)站是獲取高質(zhì)量數(shù)據(jù)的最佳來源。百度地圖和高德地圖擁有豐富的國內(nèi)POI資源,并且提供了較為完善的開發(fā)接口,國外開源地圖OSM(Open Street Map)數(shù)據(jù)完全開放,歐洲、北美等地區(qū)的數(shù)據(jù)較為豐富。因此,位置數(shù)據(jù)獲取中國內(nèi)數(shù)據(jù)主要基于百度地圖和高德地圖數(shù)據(jù)進(jìn)行抽取,境外數(shù)據(jù)的獲取將OSM作為數(shù)據(jù)源。

    (一)國內(nèi)POI數(shù)據(jù)獲取

    抽取百度地圖POI信息可利用百度地圖JavaScript API的服務(wù)類接口。百度地圖提供的開放接口是有限制的,通過檢索半徑和檢索關(guān)鍵詞限制單次大規(guī)模下載POI數(shù)據(jù)。針對檢索半徑的限制問題,采用多線程思想對任務(wù)區(qū)域進(jìn)行分割,逐塊對每個(gè)任務(wù)區(qū)域進(jìn)行處理,最后將各任務(wù)區(qū)域獲取的數(shù)據(jù)合并,在避免檢索半徑限制的同時(shí)能夠提高任務(wù)處理效率。檢索關(guān)鍵詞限制主要包括單次檢索關(guān)鍵詞數(shù)量的限制和所選關(guān)鍵詞檢索數(shù)據(jù)的完整性限制。單次檢索關(guān)鍵詞數(shù)量限制可通過多次構(gòu)建任務(wù)分批進(jìn)行檢索。針對所選關(guān)鍵詞檢索的數(shù)據(jù)完整性限制,可采用兩種解決方法。一種是使用其提供的GeocoderResult.surroundingPois接口直接獲取數(shù)據(jù),該接口不需要提供關(guān)鍵詞,但獲取數(shù)據(jù)的屬性信息缺失較多;第二種是利用LocalSearch接口提供關(guān)鍵詞檢索。采用“美食”“酒店”“購物”等17個(gè)關(guān)鍵詞對鄭州地區(qū)某一區(qū)域進(jìn)行了數(shù)據(jù)抽取實(shí)驗(yàn),得到POI數(shù)量707個(gè),爬全率為96.717%,數(shù)據(jù)的完整性較好。百度地圖POI的獲取流程如圖1所示。

    與百度地圖POI數(shù)據(jù)抽取相比,高德地圖提供的POI數(shù)據(jù)接口只有基于關(guān)鍵詞的周邊搜索方法AMap.PlaceSearch。高德地圖數(shù)據(jù)接口對單次檢索所選關(guān)鍵詞的數(shù)量沒有限制,主要在于單次檢索半徑的限制和檢索關(guān)鍵詞所獲取POI數(shù)據(jù)完整性限制。單次檢索半徑的限制同樣可利用百度POI獲取中的多線程方法進(jìn)行處理。檢索關(guān)鍵詞的選取可參照高德地圖POI分類標(biāo)準(zhǔn),選擇“汽車服務(wù)”“餐飲服務(wù)”“購物服務(wù)”“生活服務(wù)”等23個(gè)關(guān)鍵詞分別進(jìn)行數(shù)據(jù)檢索。經(jīng)對比自動(dòng)檢索與人工檢索、實(shí)地驗(yàn)證相結(jié)合,對鄭州某一區(qū)域POI數(shù)據(jù)檢索的結(jié)果如圖2所示,POI總數(shù)744個(gè),綜合爬全率96.373%,抽取數(shù)據(jù)的完整程度較為可靠。

    (二)境外POI數(shù)據(jù)獲取

    OSM旨在建立一個(gè)任何人都可以編輯的全球地理數(shù)據(jù)庫,該數(shù)據(jù)庫由Steve Coast在2004年7月建立。近年來,OSM數(shù)據(jù)量增長迅速,截至2014年3月1日,OSM數(shù)據(jù)量的總體情況為:GPS數(shù)據(jù)點(diǎn)總共3,829,201,844個(gè),節(jié)點(diǎn)數(shù)量2,223,977,668個(gè),路徑數(shù)量219,537,496個(gè),關(guān)系數(shù)量2,406,517條,參與編輯的總用戶數(shù)量1,528,868個(gè)。OSM將地理實(shí)體分為30個(gè)要素類,每個(gè)類根據(jù)標(biāo)簽的key和value分為若干小類。

    從OSM中抽取POI要素的常用方法是直接將OSM數(shù)據(jù)轉(zhuǎn)換為常用的SHP格式,然后將SHP格式中的點(diǎn)要素作為POI要素。這種方法主要依賴第三方工具,實(shí)現(xiàn)較為簡單,但由于不同數(shù)據(jù)在地理位置和屬性定義等方面的差異,往往會造成POI數(shù)據(jù)缺失,另外該方法存在大量冗余操作,不利于海量數(shù)據(jù)的處理。

    圖1 百度地圖POI獲取流程

    圖2 高德地圖獲取POI信息

    圖3 對OSM中Albania地區(qū)POI數(shù)據(jù)抽取結(jié)果

    圖4 基于半結(jié)構(gòu)文本的屬性匹配抽取流程

    根據(jù)OSM數(shù)據(jù)的存儲特征,可通過OSM標(biāo)簽中的key和value值直接提取符合要求的信息。首先,建立一個(gè)不同key和value對應(yīng)的POI分類模板,確定需要提取的要素與類別,遍歷數(shù)據(jù)中所有要素標(biāo)簽中的key和value,并與模板進(jìn)行匹配,滿足匹配條件則保存該要素的所有值和坐標(biāo),從而實(shí)現(xiàn)POI信息的提取。采用該方法對Albania 地區(qū)的POI信息進(jìn)行了提取,數(shù)據(jù)為PBF格式,數(shù)據(jù)大小15.24MB。共抽取POI數(shù)據(jù)5252條,用時(shí)3850ms,分別為POI的名稱、OSMID、坐標(biāo)、類別等屬性信息,如圖3所示。該方法效率較高(相同硬件環(huán)境下,利用ArcGIS_Editor_OSM插件對上述數(shù)據(jù)進(jìn)行轉(zhuǎn)換耗時(shí)30秒以上)。

    三、基于文本信息的地理目標(biāo)屬性數(shù)據(jù)獲取

    地理目標(biāo)的屬性信息主要包含在網(wǎng)絡(luò)文本數(shù)據(jù)中。網(wǎng)絡(luò)上的文本數(shù)據(jù)按照其結(jié)構(gòu)化程度可分為半結(jié)構(gòu)化文本和非結(jié)構(gòu)化文本兩類。半結(jié)構(gòu)化文本是介于結(jié)構(gòu)化文本與非結(jié)構(gòu)化文本之間的一種文本形式,通常比較簡短,結(jié)構(gòu)特征比較明顯,如百度百科的信息框;非結(jié)構(gòu)化文本中的文字完全是按照自然語言規(guī)則,即按人類的理解方式產(chǎn)生的文本,通常有新聞報(bào)道、文獻(xiàn)資料等,如百度百科的正文部分。網(wǎng)絡(luò)文本數(shù)據(jù)通常以非結(jié)構(gòu)化數(shù)據(jù)為主,半結(jié)構(gòu)化數(shù)據(jù)為輔。百科網(wǎng)站中關(guān)于地理空間目標(biāo)的信息通常比其他網(wǎng)站更為詳細(xì)可靠,且同時(shí)包含半結(jié)構(gòu)化文本和非結(jié)構(gòu)化文本,因此將其作為屬性數(shù)據(jù)獲取研究的基礎(chǔ)。

    (一)基于半結(jié)構(gòu)化文本的目標(biāo)屬性數(shù)據(jù)獲取

    半結(jié)構(gòu)化文本的屬性數(shù)據(jù)抽取中,首先根據(jù)地理實(shí)體名字獲取所在百科頁面信息框信息,統(tǒng)計(jì)信息框的所有屬性,計(jì)算其與預(yù)定義屬性的相似度,得到同義屬性,進(jìn)而抽取對應(yīng)屬性值,建立地理實(shí)體、屬性、屬性值之間的對應(yīng)關(guān)系,具體流程如下圖4所示。

    由于文本語義表達(dá)的多樣化,不同文本在表達(dá)地理實(shí)體的同一個(gè)屬性時(shí)可能采用不同關(guān)鍵詞,稱為同義屬性詞。屬性數(shù)據(jù)獲取中需要對關(guān)鍵詞進(jìn)行識別,將表達(dá)地理實(shí)體同義屬性詞識別出來并合并為同一屬性,建立每個(gè)屬性項(xiàng)對應(yīng)的關(guān)鍵詞集合,這一過程稱為屬性項(xiàng)歸一化。地理實(shí)體屬性項(xiàng)歸一化是實(shí)現(xiàn)半結(jié)構(gòu)化文本屬性數(shù)據(jù)獲取的關(guān)鍵。

    屬性項(xiàng)歸一化的實(shí)質(zhì)是判斷屬性項(xiàng)詞之間的同義性,因此需要對屬性項(xiàng)的相似度進(jìn)行度量,可采用字面相似度、語義相似度等指標(biāo)度量屬性項(xiàng)相似度。字面相似度的計(jì)算簡單方便,不需要依賴大量的訓(xùn)練庫和字典,適合計(jì)算簡單、字面相似詞的相似度;采用基于Word2vec的訓(xùn)練模型訓(xùn)練得到的詞向量度量語義相似度,具有維度低、快速、準(zhǔn)確等優(yōu)點(diǎn);基于同義詞的語義距離度量詞語相似度在計(jì)算較短詞語的很有效,但處理長詞語時(shí)會有偏差??蓪⑷哌M(jìn)行結(jié)合,采用三個(gè)相似度中的最大值作為最終屬性項(xiàng)相似度。

    (二)基于非結(jié)構(gòu)化文本的目標(biāo)屬性數(shù)據(jù)獲取

    非結(jié)構(gòu)化文本中目標(biāo)屬性數(shù)據(jù)的獲取通常采用基于統(tǒng)計(jì)的機(jī)器學(xué)習(xí)方法。傳統(tǒng)的有監(jiān)督學(xué)習(xí)需要大量的人工標(biāo)注語料進(jìn)行模型訓(xùn)練,海量的文本數(shù)據(jù)所需的人工標(biāo)注工作量巨大。基于弱監(jiān)督學(xué)習(xí)可以利用一些已有知識庫的實(shí)體關(guān)系生成訓(xùn)練數(shù)據(jù),減少人工標(biāo)注量。在半結(jié)構(gòu)化文本屬性抽取的基礎(chǔ)上,采用基于弱監(jiān)督的條件隨機(jī)場抽取地理目標(biāo)屬性,利用實(shí)體屬性關(guān)系對非結(jié)構(gòu)化文本進(jìn)行自動(dòng)標(biāo)注產(chǎn)生訓(xùn)練語料,基于條件隨機(jī)場模型對訓(xùn)練語料進(jìn)行學(xué)習(xí)生成地理目標(biāo)屬性模型,根據(jù)訓(xùn)練語料訓(xùn)練的地理實(shí)體屬性模型可實(shí)現(xiàn)對非結(jié)構(gòu)化文本中的地理實(shí)體屬性的抽取?;谌醣O(jiān)督條件隨機(jī)場的屬性數(shù)據(jù)提取流程如圖5所示。

    語料預(yù)處理是保證文本信息抽取準(zhǔn)確性的基礎(chǔ),尤其是中文文本,其基本的語義單元可能是一個(gè)或者多個(gè)字,直接抽取根本得不到預(yù)期結(jié)果。語料預(yù)處理時(shí),首先剔除百科文檔中包含的圖片標(biāo)簽和廣告標(biāo)簽,按照結(jié)構(gòu)化的信息框和非結(jié)構(gòu)化文本分割存儲;采用3.1的方法將結(jié)構(gòu)化信息框中相關(guān)的地理目標(biāo)屬性提取出來;而后將非結(jié)構(gòu)化文檔中的HTML標(biāo)簽去除得到純文本內(nèi)容,根據(jù)標(biāo)點(diǎn)符號將非結(jié)構(gòu)化文本拆分成單個(gè)句子,依據(jù)開放分類對提取的信息進(jìn)行分類,為基于地理實(shí)體類別訓(xùn)練模型抽取屬性數(shù)據(jù)提供基礎(chǔ)。

    圖5 基于弱監(jiān)督的條件隨機(jī)場地理目標(biāo)屬性提取流程

    基于條件隨機(jī)場模型抽取地理目標(biāo)屬性實(shí)質(zhì)是利用統(tǒng)計(jì)學(xué)模型學(xué)習(xí)自由文本中某個(gè)實(shí)體屬性的觸發(fā)詞特征、屬性值特征和分布特征,根據(jù)這些特征去預(yù)測并抽取輸入文本中包含的地理實(shí)體屬性信息。特征選擇的好壞直接影響條件隨機(jī)場模型的識別準(zhǔn)確度,可采用屬性特征標(biāo)注、字特征、詞特征和詞性特征對文本信息進(jìn)行訓(xùn)練,根據(jù)抽取任務(wù)的差異選擇合適的特征以提高信息提取的準(zhǔn)確率和效率。

    四、多源地理目標(biāo)數(shù)據(jù)處理

    基于網(wǎng)絡(luò)獲取的地理目標(biāo)數(shù)據(jù)由于來源不同,其坐標(biāo)系統(tǒng)和數(shù)據(jù)表達(dá)方式均有所差別,需對其進(jìn)行轉(zhuǎn)換和融合處理,使數(shù)據(jù)能夠滿足不同應(yīng)用的需求。

    (一)多源地理數(shù)據(jù)空間坐標(biāo)系統(tǒng)統(tǒng)一

    坐標(biāo)是空間信息的核心數(shù)據(jù),是POI數(shù)據(jù)準(zhǔn)確性的重要體現(xiàn),是數(shù)據(jù)融合的重要依據(jù)。由于數(shù)據(jù)的采集來源、應(yīng)用需求的不同和數(shù)據(jù)安全原因,通常不同來源POI數(shù)據(jù)的坐標(biāo)系統(tǒng)也是有差異的。其中OSM數(shù)據(jù)使用的坐標(biāo)系是WGS-84地心坐標(biāo)系;高德地圖采用的是中國國家測繪局制定的GCJ-02坐標(biāo)系,該坐標(biāo)系對原始坐標(biāo)加入隨機(jī)偏差,對地理位置信息進(jìn)行加密;百度地圖采用的是自定義的BD-09坐標(biāo)系,該坐標(biāo)系在國家測繪局GCJ-02坐標(biāo)系的基礎(chǔ)上進(jìn)行了二次坐標(biāo)加密。

    WGS-84坐標(biāo)系是國外地圖服務(wù)商和數(shù)據(jù)供應(yīng)商常用的地理坐標(biāo)系,GCJ-02是所有國內(nèi)公開發(fā)布的地理信息數(shù)據(jù)必須使用的坐標(biāo)系。WGS-84坐標(biāo)系和GCJ-02坐標(biāo)系兩個(gè)坐標(biāo)系的轉(zhuǎn)換是不可逆的,即WGS-84坐標(biāo)系下的坐標(biāo)可以精確轉(zhuǎn)換至GCJ-02坐標(biāo)系而不發(fā)生隨機(jī)位置偏移;但是GCJ-02坐標(biāo)系下的坐標(biāo)轉(zhuǎn)換至WGS-84坐標(biāo)系下會產(chǎn)生較大的隨機(jī)位置偏移。BD-09和GCJ-02坐標(biāo)系則可以互相進(jìn)行精確轉(zhuǎn)換。

    根據(jù)三種坐標(biāo)系的特點(diǎn),從數(shù)據(jù)獲取和應(yīng)用兩方面綜合考慮,對多源POI數(shù)據(jù)的坐標(biāo)系統(tǒng)進(jìn)行統(tǒng)一,境外數(shù)據(jù)采用WGS-84坐標(biāo)系進(jìn)行組織管理,后期應(yīng)用中可根據(jù)需求自由轉(zhuǎn)換;國內(nèi)數(shù)據(jù)統(tǒng)一采用GCJ-02坐標(biāo)系,需將百度地圖數(shù)據(jù)轉(zhuǎn)換為GCJ-02坐標(biāo)與高德地圖數(shù)據(jù)統(tǒng)一進(jìn)行管理。坐標(biāo)轉(zhuǎn)換可以通過百度和高德地圖提供的接口實(shí)現(xiàn),轉(zhuǎn)換精度較高。

    (二)多源POI數(shù)據(jù)融合方法

    多源POI數(shù)據(jù)融合主要有基于空間位置和基于非空間屬性的融合方法。POI數(shù)據(jù)分布密集,空間位置相近,數(shù)據(jù)屬性項(xiàng)較少,可采用空間位置和非空間屬性相結(jié)合的方法進(jìn)行數(shù)據(jù)融合。POI數(shù)據(jù)融合主要包括同名實(shí)體的匹配和屬性字段的融合兩個(gè)方面。

    1、同名實(shí)體匹配

    同名地理實(shí)體通常具有相同或者相似的名字、地址和相近的地理坐標(biāo),在空間位置和非空間屬性上具有較高的相似度,因此同名實(shí)體的識別主要基于POI名字和地址屬性的相似性和地理位置信息的相似性實(shí)現(xiàn)。

    基于非空間屬性的相似度匹配以語義相似度和字符相似度為基礎(chǔ),首先將文本信息劃分為基本語義單元,如“哈爾濱餃子館”劃分為“哈爾濱”和“餃子館”兩個(gè)語義單元,再根據(jù)字符相似度匹配算法對基本語義單元進(jìn)行匹配。該方法既考慮了POI名字和地址中的語義信息,又避免了因過度利用語義信息而可能產(chǎn)生的POI名字誤匹配。

    基于空間位置的相似度匹配主要有基于拓?fù)潢P(guān)系和基于度量關(guān)系的匹配方法。本文采用的數(shù)據(jù)源POI為點(diǎn)狀地理實(shí)體,其空間關(guān)系主要為度量關(guān)系,因此采用基于度量關(guān)系進(jìn)行相似度匹配。地理實(shí)體度量關(guān)系的相似性實(shí)際就是兩個(gè)POI點(diǎn)之間的空間距離,當(dāng)該距離小于某一閾值時(shí),可將二者作為匹配對象。

    2、屬性字段融合

    同名實(shí)體匹配后需將POI屬性字段合并以獲取更加完整的數(shù)據(jù)集。POI屬性字段融合主要包括對多源POI唯一屬性項(xiàng)和共有屬性項(xiàng)的處理。唯一屬性項(xiàng)通常直接加入合并的融合數(shù)據(jù)集中,豐富數(shù)據(jù)集的屬性信息。共有屬性項(xiàng)的處理中通常只保留單一來源數(shù)據(jù)或合并所有來源的數(shù)據(jù)。

    百度地圖和高德地圖POI的共有屬性項(xiàng)包括名字、地址、電話、類別等。其中,名字是匹配相似度計(jì)算的重要參考,通常同名實(shí)體的名字和地址相同或者相似,名字相同的可直接合并,名字相似的則要綜合考慮名字的準(zhǔn)確度和描述詳細(xì)程度,可采用式(1)對目標(biāo)的準(zhǔn)確度和詳細(xì)程度進(jìn)行綜合描述,對于同名實(shí)體保留重要性高的名字。POI地址的數(shù)據(jù)特征與名字相似,可采用相同方法進(jìn)行融合。

    五、結(jié)論

    本文以豐富的網(wǎng)絡(luò)信息為基礎(chǔ),對地理目標(biāo)的獲取與處理方法進(jìn)行了研究,綜合高德地圖、百度地圖和OSM開源數(shù)據(jù)等數(shù)據(jù)源實(shí)現(xiàn)了對地理目標(biāo)位置數(shù)據(jù)的批量式、高爬全率獲取,為全球區(qū)域的地理實(shí)體位置數(shù)據(jù)的快速在線獲取提供了支持;采用屬性歸一化、基于規(guī)則匹配等方法實(shí)現(xiàn)了半結(jié)構(gòu)化地理目標(biāo)屬性數(shù)據(jù)的抽取,基于弱監(jiān)督的條件隨機(jī)場實(shí)現(xiàn)了非結(jié)構(gòu)化地理目標(biāo)屬性數(shù)據(jù)的抽取,完善了地理目標(biāo)的屬性數(shù)據(jù);通過同名實(shí)體匹配和屬性字段融合相結(jié)合的方法實(shí)現(xiàn)了多源數(shù)據(jù)的自動(dòng)融合處理,提高了獲取的地理目標(biāo)數(shù)據(jù)的質(zhì)量。

    由于網(wǎng)絡(luò)信息資源過于龐大,本文僅針對部分互聯(lián)網(wǎng)資源和部分關(guān)鍵點(diǎn)對地理目標(biāo)信息的獲取與處理方法進(jìn)行了研究,后續(xù)研究中,如何從更多包含地理空間信息的網(wǎng)站中獲取地理目標(biāo)位置數(shù)據(jù)、基于半結(jié)構(gòu)文本獲取更大規(guī)模的語料、提升非結(jié)構(gòu)文本標(biāo)注的準(zhǔn)確率和召回率、對獲取數(shù)據(jù)質(zhì)量進(jìn)行更為全面準(zhǔn)確的評價(jià)等方面是研究的重點(diǎn)。

    猜你喜歡
    屬性數(shù)據(jù)結(jié)構(gòu)化坐標(biāo)系
    促進(jìn)知識結(jié)構(gòu)化的主題式復(fù)習(xí)初探
    結(jié)構(gòu)化面試方法在研究生復(fù)試中的應(yīng)用
    基于GIS的房產(chǎn)測繪管理信息系統(tǒng)架構(gòu)研究
    科技資訊(2019年18期)2019-09-17 11:03:28
    無源多傳感器綜合數(shù)據(jù)關(guān)聯(lián)算法研究
    屬性數(shù)據(jù)分析教學(xué)改革初探
    解密坐標(biāo)系中的平移變換
    坐標(biāo)系背后的故事
    基于重心坐標(biāo)系的平面幾何證明的探討
    基于圖模型的通用半結(jié)構(gòu)化數(shù)據(jù)檢索
    極坐標(biāo)系下移動(dòng)機(jī)器人的點(diǎn)鎮(zhèn)定
    97在线视频观看| 国产亚洲精品久久久com| 少妇的逼好多水| 99热只有精品国产| 久久精品国产亚洲av香蕉五月| 日韩精品有码人妻一区| 亚洲成人精品中文字幕电影| 一区二区三区高清视频在线| 亚洲精品亚洲一区二区| 你懂的网址亚洲精品在线观看 | 人妻制服诱惑在线中文字幕| 白带黄色成豆腐渣| av在线蜜桃| www.色视频.com| 99久久精品热视频| 国产成人精品婷婷| 色吧在线观看| av专区在线播放| 亚洲av免费在线观看| 午夜福利在线在线| 国产高潮美女av| 日本黄大片高清| 欧美激情国产日韩精品一区| 国产私拍福利视频在线观看| 亚洲欧洲国产日韩| 国产亚洲5aaaaa淫片| 国内少妇人妻偷人精品xxx网站| 全区人妻精品视频| 国产免费一级a男人的天堂| 自拍偷自拍亚洲精品老妇| 日韩欧美一区二区三区在线观看| 欧美性猛交黑人性爽| 欧美激情在线99| 能在线免费观看的黄片| 国产精品蜜桃在线观看 | 日韩大尺度精品在线看网址| 久久久欧美国产精品| 一个人看的www免费观看视频| 国产伦在线观看视频一区| 熟妇人妻久久中文字幕3abv| 全区人妻精品视频| 亚洲精品亚洲一区二区| 久久这里只有精品中国| 国产精品三级大全| 一级二级三级毛片免费看| 一本久久精品| 亚洲成人久久爱视频| 成人二区视频| 国产综合懂色| 国产午夜精品论理片| 插逼视频在线观看| 99视频精品全部免费 在线| 国内精品美女久久久久久| 18+在线观看网站| 欧美极品一区二区三区四区| 欧美xxxx性猛交bbbb| 99热这里只有精品一区| 嘟嘟电影网在线观看| 久久这里有精品视频免费| 你懂的网址亚洲精品在线观看 | 精品人妻视频免费看| 黄片wwwwww| 激情 狠狠 欧美| 春色校园在线视频观看| 成人鲁丝片一二三区免费| 国产亚洲av片在线观看秒播厂 | 成人特级av手机在线观看| 久久草成人影院| 女人被狂操c到高潮| 色尼玛亚洲综合影院| 日韩成人伦理影院| 亚洲欧美精品自产自拍| 黄片wwwwww| 狂野欧美激情性xxxx在线观看| 日本一二三区视频观看| 久久久国产成人精品二区| 国产午夜精品一二区理论片| .国产精品久久| 18禁黄网站禁片免费观看直播| 我要搜黄色片| 国产麻豆成人av免费视频| 午夜精品一区二区三区免费看| 亚洲人成网站在线观看播放| 三级男女做爰猛烈吃奶摸视频| av国产免费在线观看| 少妇丰满av| 日韩欧美三级三区| 免费人成视频x8x8入口观看| 成人av在线播放网站| 蜜桃久久精品国产亚洲av| 色5月婷婷丁香| 日韩av不卡免费在线播放| eeuss影院久久| 国产伦精品一区二区三区视频9| 99在线人妻在线中文字幕| 一区二区三区四区激情视频 | 国产高清三级在线| 又黄又爽又刺激的免费视频.| 精品99又大又爽又粗少妇毛片| 天堂网av新在线| 色5月婷婷丁香| 白带黄色成豆腐渣| 亚洲一区二区三区色噜噜| 此物有八面人人有两片| 久久婷婷人人爽人人干人人爱| 在线免费观看的www视频| 国产一区二区三区在线臀色熟女| 少妇猛男粗大的猛烈进出视频 | 国产91av在线免费观看| 欧美日韩国产亚洲二区| 亚洲成人久久性| 精品一区二区免费观看| 99久国产av精品国产电影| 国产探花在线观看一区二区| 欧美区成人在线视频| 精品熟女少妇av免费看| 久久午夜亚洲精品久久| 午夜激情欧美在线| 久久草成人影院| 99久久成人亚洲精品观看| 国产高清三级在线| 欧美日韩国产亚洲二区| 不卡一级毛片| 久久精品久久久久久噜噜老黄 | 18禁黄网站禁片免费观看直播| 91麻豆精品激情在线观看国产| 淫秽高清视频在线观看| 国模一区二区三区四区视频| 国产中年淑女户外野战色| 亚洲国产精品久久男人天堂| 国产av麻豆久久久久久久| 国产黄片美女视频| 91aial.com中文字幕在线观看| 免费大片18禁| 成人亚洲精品av一区二区| av天堂中文字幕网| 噜噜噜噜噜久久久久久91| 特大巨黑吊av在线直播| 亚洲成人av在线免费| 五月玫瑰六月丁香| 国产69精品久久久久777片| 亚洲国产精品合色在线| АⅤ资源中文在线天堂| 日韩一区二区三区影片| 黄色一级大片看看| 亚洲国产欧美人成| 亚洲国产精品久久男人天堂| 欧美又色又爽又黄视频| 欧美成人a在线观看| 又黄又爽又刺激的免费视频.| 日韩一本色道免费dvd| 欧美日韩乱码在线| 亚洲欧美日韩高清在线视频| 人人妻人人澡欧美一区二区| 男插女下体视频免费在线播放| 免费一级毛片在线播放高清视频| 一区福利在线观看| 午夜精品在线福利| 国产午夜精品一二区理论片| 久久精品国产清高在天天线| 国产69精品久久久久777片| 一个人看的www免费观看视频| 欧美精品国产亚洲| 特大巨黑吊av在线直播| 天堂中文最新版在线下载 | 日韩大尺度精品在线看网址| 自拍偷自拍亚洲精品老妇| 天天躁日日操中文字幕| 小蜜桃在线观看免费完整版高清| 亚洲欧洲国产日韩| 久久人人爽人人片av| 久久鲁丝午夜福利片| 亚洲av.av天堂| 亚洲欧美日韩高清专用| 看免费成人av毛片| 深夜精品福利| 国产91av在线免费观看| 国产极品天堂在线| 日本一二三区视频观看| 欧美+日韩+精品| av免费在线看不卡| 夜夜夜夜夜久久久久| av天堂中文字幕网| 午夜亚洲福利在线播放| 在线播放国产精品三级| 日韩欧美精品v在线| 高清毛片免费观看视频网站| 熟妇人妻久久中文字幕3abv| 亚洲欧洲日产国产| 午夜久久久久精精品| 亚洲美女视频黄频| 精品久久久久久久末码| 国产伦精品一区二区三区四那| 亚洲精品成人久久久久久| 亚洲精品影视一区二区三区av| 大又大粗又爽又黄少妇毛片口| 日韩欧美精品v在线| 美女cb高潮喷水在线观看| 在线播放无遮挡| 婷婷六月久久综合丁香| 性欧美人与动物交配| 全区人妻精品视频| 欧美zozozo另类| 精品国内亚洲2022精品成人| 九九久久精品国产亚洲av麻豆| 久99久视频精品免费| 欧美激情久久久久久爽电影| 噜噜噜噜噜久久久久久91| 在线播放国产精品三级| 亚洲成人中文字幕在线播放| 三级毛片av免费| 国产白丝娇喘喷水9色精品| 麻豆国产97在线/欧美| 校园春色视频在线观看| 自拍偷自拍亚洲精品老妇| 一级毛片久久久久久久久女| 性欧美人与动物交配| 一级毛片久久久久久久久女| 99riav亚洲国产免费| 中出人妻视频一区二区| 免费av观看视频| 我的老师免费观看完整版| 五月伊人婷婷丁香| 黄色视频,在线免费观看| av女优亚洲男人天堂| 十八禁国产超污无遮挡网站| 黄色一级大片看看| 成人三级黄色视频| 久久久精品欧美日韩精品| 日本欧美国产在线视频| 别揉我奶头 嗯啊视频| 白带黄色成豆腐渣| 26uuu在线亚洲综合色| 亚洲欧美日韩卡通动漫| 欧洲精品卡2卡3卡4卡5卡区| 日韩一本色道免费dvd| 好男人视频免费观看在线| 在线国产一区二区在线| 精品午夜福利在线看| 特大巨黑吊av在线直播| 2021天堂中文幕一二区在线观| 毛片女人毛片| 国产精品一区二区在线观看99 | 国产精品一区二区在线观看99 | av在线观看视频网站免费| 国产成人影院久久av| 特级一级黄色大片| or卡值多少钱| a级一级毛片免费在线观看| 亚洲美女视频黄频| 亚洲av不卡在线观看| 在线观看av片永久免费下载| 18禁在线无遮挡免费观看视频| 国产成人午夜福利电影在线观看| 亚洲熟妇中文字幕五十中出| 国产 一区 欧美 日韩| 久久99蜜桃精品久久| 久久久色成人| 欧美区成人在线视频| 搡老妇女老女人老熟妇| 久久这里有精品视频免费| 精品一区二区免费观看| 国产91av在线免费观看| 日本色播在线视频| 国产日本99.免费观看| 在线天堂最新版资源| 亚洲av第一区精品v没综合| av专区在线播放| 久久精品国产清高在天天线| 国产久久久一区二区三区| 日本与韩国留学比较| 国产老妇伦熟女老妇高清| 国语自产精品视频在线第100页| 国产视频首页在线观看| 亚洲在线观看片| 国内揄拍国产精品人妻在线| 91精品国产九色| 国产三级中文精品| 亚洲国产精品成人久久小说 | 国产成人aa在线观看| 成人亚洲欧美一区二区av| 精品免费久久久久久久清纯| 91狼人影院| 又粗又硬又长又爽又黄的视频 | 最好的美女福利视频网| 美女 人体艺术 gogo| 成人特级黄色片久久久久久久| 亚洲欧美日韩卡通动漫| 亚洲最大成人中文| 免费观看人在逋| 看片在线看免费视频| 自拍偷自拍亚洲精品老妇| 一区二区三区免费毛片| 国产白丝娇喘喷水9色精品| 免费看美女性在线毛片视频| 日韩欧美在线乱码| 成年女人永久免费观看视频| 免费观看精品视频网站| 亚洲av成人av| 亚洲三级黄色毛片| 免费电影在线观看免费观看| 国产乱人偷精品视频| 3wmmmm亚洲av在线观看| 99久国产av精品| 国产精品久久久久久亚洲av鲁大| 国产麻豆成人av免费视频| 寂寞人妻少妇视频99o| 午夜福利在线观看吧| 天天一区二区日本电影三级| 国产黄片视频在线免费观看| 国产午夜精品论理片| 欧美性猛交黑人性爽| 日韩大尺度精品在线看网址| 久久精品影院6| 久久久久久久久久久丰满| 日本色播在线视频| 99久国产av精品| 欧美日本亚洲视频在线播放| 成年免费大片在线观看| 2021天堂中文幕一二区在线观| 国产精品美女特级片免费视频播放器| 国产精品一区二区性色av| 在线观看午夜福利视频| 小说图片视频综合网站| 亚洲高清免费不卡视频| 欧美最新免费一区二区三区| 一区二区三区免费毛片| 欧美日韩综合久久久久久| 国产成人a∨麻豆精品| 特级一级黄色大片| 一夜夜www| 成人永久免费在线观看视频| 综合色丁香网| 久久精品国产亚洲av涩爱 | 一个人看的www免费观看视频| 日日干狠狠操夜夜爽| 国产伦在线观看视频一区| 国产一区二区三区在线臀色熟女| 国产精品野战在线观看| 亚洲熟妇中文字幕五十中出| 欧美最黄视频在线播放免费| 变态另类丝袜制服| 亚洲丝袜综合中文字幕| 久久久精品94久久精品| 日韩在线高清观看一区二区三区| 一级二级三级毛片免费看| 在线国产一区二区在线| 青春草亚洲视频在线观看| 国产人妻一区二区三区在| 99视频精品全部免费 在线| videossex国产| 国产精品1区2区在线观看.| 色播亚洲综合网| 日本熟妇午夜| 噜噜噜噜噜久久久久久91| 国产午夜精品一二区理论片| 中国国产av一级| 中文字幕av在线有码专区| 97在线视频观看| 免费一级毛片在线播放高清视频| 精品久久久久久久久av| 啦啦啦韩国在线观看视频| 亚洲18禁久久av| 成人美女网站在线观看视频| 九色成人免费人妻av| 亚洲欧美日韩高清在线视频| 亚洲欧洲日产国产| 亚洲欧美成人精品一区二区| 日韩成人av中文字幕在线观看| 日韩欧美在线乱码| 91久久精品国产一区二区三区| 中文字幕久久专区| 精品午夜福利在线看| 日韩大尺度精品在线看网址| 久久久久久久午夜电影| 日韩在线高清观看一区二区三区| 观看美女的网站| 日本熟妇午夜| 六月丁香七月| 插逼视频在线观看| 亚洲四区av| 亚洲欧美日韩东京热| 少妇的逼好多水| 国产av一区在线观看免费| 日日啪夜夜撸| 男女视频在线观看网站免费| 波多野结衣巨乳人妻| 精品久久久久久久久亚洲| 久久久色成人| 日韩,欧美,国产一区二区三区 | 色哟哟·www| 亚洲不卡免费看| 2021天堂中文幕一二区在线观| 午夜精品在线福利| 伦理电影大哥的女人| 亚洲无线在线观看| 国产高清三级在线| 欧美日韩精品成人综合77777| 国产真实乱freesex| 在线观看66精品国产| 美女xxoo啪啪120秒动态图| 国产精品麻豆人妻色哟哟久久 | 国产探花在线观看一区二区| 亚洲欧美成人综合另类久久久 | 午夜久久久久精精品| 久久久久久伊人网av| 高清毛片免费看| av在线观看视频网站免费| 国产精品久久久久久精品电影小说 | 亚洲人与动物交配视频| 亚洲精品粉嫩美女一区| 欧美极品一区二区三区四区| 人妻夜夜爽99麻豆av| 亚洲国产精品成人综合色| 国产伦理片在线播放av一区 | 亚洲av免费高清在线观看| 亚洲国产精品合色在线| 狂野欧美激情性xxxx在线观看| 久久人人爽人人爽人人片va| 99久久人妻综合| 亚洲成人中文字幕在线播放| 99热6这里只有精品| 亚洲一区二区三区色噜噜| 嫩草影院入口| 亚洲欧美日韩东京热| 九九热线精品视视频播放| 一级av片app| 极品教师在线视频| 国产午夜福利久久久久久| 偷拍熟女少妇极品色| 国产一级毛片在线| 亚洲成人久久性| 亚洲精品影视一区二区三区av| 不卡视频在线观看欧美| 亚洲欧洲日产国产| 国产乱人偷精品视频| 3wmmmm亚洲av在线观看| 免费在线观看成人毛片| 日本-黄色视频高清免费观看| 国产成人a∨麻豆精品| 内射极品少妇av片p| 欧美一区二区国产精品久久精品| 啦啦啦观看免费观看视频高清| 99久久中文字幕三级久久日本| 亚洲av电影不卡..在线观看| 最好的美女福利视频网| 最近2019中文字幕mv第一页| 色哟哟哟哟哟哟| 插阴视频在线观看视频| 国语自产精品视频在线第100页| 国产毛片a区久久久久| 99在线人妻在线中文字幕| 国产亚洲av片在线观看秒播厂 | 小蜜桃在线观看免费完整版高清| 日韩强制内射视频| 成人高潮视频无遮挡免费网站| 97热精品久久久久久| 国产熟女欧美一区二区| 成人性生交大片免费视频hd| 日韩欧美精品v在线| 色尼玛亚洲综合影院| 又粗又硬又长又爽又黄的视频 | 床上黄色一级片| 午夜免费男女啪啪视频观看| 久久6这里有精品| 熟女电影av网| 最近的中文字幕免费完整| 免费观看a级毛片全部| 蜜桃亚洲精品一区二区三区| 中文欧美无线码| 久久久久九九精品影院| 少妇人妻精品综合一区二区 | 夫妻性生交免费视频一级片| 一个人免费在线观看电影| 赤兔流量卡办理| 日日撸夜夜添| 一卡2卡三卡四卡精品乱码亚洲| 在线观看av片永久免费下载| 在现免费观看毛片| 在线观看免费视频日本深夜| av卡一久久| 伦理电影大哥的女人| 亚洲欧美日韩卡通动漫| 国产探花极品一区二区| 听说在线观看完整版免费高清| 国产午夜精品一二区理论片| 亚洲国产欧美人成| 久久这里有精品视频免费| 国产成人精品婷婷| 欧美一级a爱片免费观看看| 亚州av有码| 麻豆久久精品国产亚洲av| 亚洲四区av| 日本-黄色视频高清免费观看| 免费观看的影片在线观看| 在线观看免费视频日本深夜| 美女内射精品一级片tv| 一个人看的www免费观看视频| 日本爱情动作片www.在线观看| kizo精华| 国产精品一区二区三区四区久久| 高清毛片免费看| 91aial.com中文字幕在线观看| 亚洲成人久久爱视频| 日本熟妇午夜| 日韩成人av中文字幕在线观看| 熟妇人妻久久中文字幕3abv| 日本免费a在线| 国产成人一区二区在线| 偷拍熟女少妇极品色| 亚洲无线观看免费| 国产一区二区三区在线臀色熟女| 久久久欧美国产精品| 久久久精品欧美日韩精品| 国产精品不卡视频一区二区| 青春草亚洲视频在线观看| 日韩成人伦理影院| 欧美性猛交╳xxx乱大交人| 在线国产一区二区在线| 噜噜噜噜噜久久久久久91| 中国美白少妇内射xxxbb| 非洲黑人性xxxx精品又粗又长| 熟妇人妻久久中文字幕3abv| 亚洲18禁久久av| 尤物成人国产欧美一区二区三区| av国产免费在线观看| 美女高潮的动态| 黄片无遮挡物在线观看| 又爽又黄无遮挡网站| 少妇人妻一区二区三区视频| 国产69精品久久久久777片| 国产一区二区三区av在线 | 亚洲激情五月婷婷啪啪| 午夜激情欧美在线| 日本五十路高清| 欧美3d第一页| 18禁黄网站禁片免费观看直播| 校园春色视频在线观看| 婷婷六月久久综合丁香| 精品人妻一区二区三区麻豆| 国产精品,欧美在线| 精品久久久久久久久久免费视频| 欧美精品国产亚洲| 国产午夜精品一二区理论片| 国产视频首页在线观看| 免费观看精品视频网站| 久久久久久久久久黄片| 观看免费一级毛片| 精品一区二区免费观看| 亚洲不卡免费看| 免费av毛片视频| 老女人水多毛片| 国产成人精品婷婷| 美女被艹到高潮喷水动态| 亚洲国产欧美人成| 日韩欧美在线乱码| 淫秽高清视频在线观看| kizo精华| 69人妻影院| 波野结衣二区三区在线| 美女cb高潮喷水在线观看| 成人毛片60女人毛片免费| 一本一本综合久久| 麻豆久久精品国产亚洲av| 美女cb高潮喷水在线观看| 男的添女的下面高潮视频| 亚洲四区av| 午夜福利高清视频| 夜夜夜夜夜久久久久| 男人舔女人下体高潮全视频| 中文字幕人妻熟人妻熟丝袜美| 亚洲av成人av| 91精品一卡2卡3卡4卡| 欧美一区二区亚洲| 国产精品.久久久| 插阴视频在线观看视频| 国内精品美女久久久久久| 亚洲国产色片| 久久久久久九九精品二区国产| 最近2019中文字幕mv第一页| 亚洲精品自拍成人| 色视频www国产| www日本黄色视频网| 国产乱人偷精品视频| 亚洲国产欧洲综合997久久,| 国产成人午夜福利电影在线观看| 欧美日韩乱码在线| 欧美最新免费一区二区三区| 欧美色视频一区免费| 久久久午夜欧美精品| 久久99热6这里只有精品| 亚洲欧洲国产日韩| 亚洲av成人精品一区久久| 国产一区二区亚洲精品在线观看| 欧美+日韩+精品| 一区二区三区免费毛片| 亚洲成人久久性| 麻豆av噜噜一区二区三区| 久久精品国产自在天天线| av在线老鸭窝| or卡值多少钱| 大香蕉久久网| 男女视频在线观看网站免费| 不卡一级毛片| 日本撒尿小便嘘嘘汇集6| 久久精品久久久久久噜噜老黄 | 丝袜喷水一区| 亚洲av成人av| 日韩欧美在线乱码| 超碰av人人做人人爽久久| 国产精品一区二区三区四区免费观看| 成人午夜高清在线视频| 男的添女的下面高潮视频| 一本精品99久久精品77| 亚洲av熟女|