• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于相似度模型的可融合興趣點(diǎn)分類研究

    2014-10-16 07:22:22李瑞姍高新院
    關(guān)鍵詞:經(jīng)緯度字符串字段

    張 巍,李瑞姍,高新院

    (中國(guó)海洋大學(xué)信息科學(xué)與工程學(xué)院,山東 青島266100)

    POI(Point of Interest)即興趣點(diǎn),泛指一切可以抽象為點(diǎn)的地理對(duì)象,尤其是與人們生活緊密相關(guān)的地理實(shí)體,如政府部門、景點(diǎn)、學(xué)校、醫(yī)院、銀行、商業(yè)區(qū)、標(biāo)志性建筑等。每個(gè)POI包含這個(gè)實(shí)體4個(gè)方面的信息:名稱、地址、類型、經(jīng)緯度,同時(shí)還可能有電話、評(píng)價(jià)等信息[1]。最近幾年,由于基于位置的服務(wù)快速發(fā)展,尤其是對(duì)網(wǎng)絡(luò)電子地圖、移動(dòng)位置服務(wù)(LBS)、便攜式自動(dòng)導(dǎo)航(PND)的使用,使得原有的POI很難繼續(xù)支撐這類服務(wù)。能否獲取高質(zhì)量的POI信息,成為提高此類服務(wù)質(zhì)量的關(guān)鍵所在。

    然而多數(shù)基于位置服務(wù)的提供商并沒有自己完整、有效的數(shù)據(jù)采集和維護(hù)機(jī)制,他們的數(shù)據(jù)仍然是由專門的數(shù)據(jù)提供商供給。大多數(shù)POI信息數(shù)據(jù)生產(chǎn)廠家的數(shù)據(jù)采集方式主要依靠人海戰(zhàn)術(shù),雇用大量的調(diào)繪、調(diào)查人員,對(duì)城市進(jìn)行地毯式作業(yè)[2]。這樣的作業(yè)方式效率低,成本高,并且無法及時(shí)更新,因此部分廠家根據(jù)自己的經(jīng)驗(yàn),創(chuàng)造性地將數(shù)據(jù)采集工作轉(zhuǎn)移到了室內(nèi)。文獻(xiàn)[2]運(yùn)用基于GPS技術(shù)與實(shí)景影像相結(jié)合開發(fā)建立POI快速采集系統(tǒng)平臺(tái),可實(shí)現(xiàn)POI的快速采集和更新;專業(yè)POI生產(chǎn)廠商卡貝斯對(duì)互聯(lián)網(wǎng)數(shù)據(jù)做了實(shí)時(shí)監(jiān)測(cè),分類抓取互聯(lián)網(wǎng)上同POI相關(guān)的信息。大多遠(yuǎn)程采集機(jī)制可以充分把握住新出現(xiàn)的POI信息,但忽略了那些原有POI信息變化,使得數(shù)據(jù)的準(zhǔn)確度降低。以餐飲業(yè)為例,餐館的節(jié)假日活動(dòng)可能會(huì)頻繁的變化,按照卡貝斯的機(jī)制這部分信息就不能在POI中被更新,甚至當(dāng)餐館因?yàn)檫w址導(dǎo)致地址這一關(guān)鍵字段發(fā)生的變化時(shí),POI也不會(huì)被更新,造成這個(gè)POI價(jià)值驟減。還有些餐館因經(jīng)營(yíng)不善而關(guān)門倒閉,但是它的POI信息仍然出現(xiàn)在數(shù)據(jù)庫(kù)里,成為無用的“死點(diǎn)”,久而久之便會(huì)出現(xiàn)大量的冗余。

    本文使用機(jī)器學(xué)習(xí)領(lǐng)域中的分類方法[3-4]初步解決了以上POI數(shù)據(jù)冗余、精確度低的問題。在互聯(lián)網(wǎng)上抽取數(shù)據(jù),篩選出POI中字段的信息,根據(jù)這些信息與原有POI的關(guān)系進(jìn)行分類處理。

    本文通過分析POI中各特征字段的形式、特點(diǎn),提出了POI特征相似度[5]用以表示一個(gè)POI與原有POI集的關(guān)系,利用這種形式化的關(guān)系在機(jī)器學(xué)習(xí)方法中分類,最終區(qū)分出可融合與不可融合的POI。相似度的形式化表示主要由名稱、地理信息相似度兩部分組成,其中的地理信息包括POI中的地址和經(jīng)緯度。名稱部分是指2個(gè)不同POI名稱字段間的相似度,通過幾種經(jīng)典字符串匹配方法[6]計(jì)算得出,過程中考慮到因?yàn)樵~語的存在使得不同漢字具有不同的關(guān)聯(lián)性,本文假設(shè)中文字符串匹配的最小單位是詞,打破了傳統(tǒng)中最小單位是單個(gè)漢字的假設(shè)。美國(guó)是地理編碼[7]應(yīng)用最早、最廣泛的國(guó)家,早在1970年代就建立了全國(guó)的地理編碼標(biāo)準(zhǔn),根據(jù)經(jīng)緯度便可確定出一個(gè)唯一的英文地址,其地址匹配可達(dá)到較好的效果,因此很容易就可以得到地理位置信息相似程度的準(zhǔn)確的結(jié)果。但是我國(guó)尚且沒有成熟的地理編碼,既不完整也不精確,利用經(jīng)緯度并不能確定2個(gè)地址匹配、相似與否。對(duì)于地理位置信息的相似程度,國(guó)內(nèi)主要根據(jù)地址信息計(jì)算[8],過程中對(duì)地址中各特征字段進(jìn)行匹配,綜合各字段的情況得出地址相似度。本文在考慮地址相似度的同時(shí),還結(jié)合了根據(jù)地理空間信息得出的不同POI之間的距離,彌補(bǔ)了同一POI具有多種中文地址描述所導(dǎo)致的問題。

    1 字符串匹配方法

    POI中名稱字段大多比較精短、無明顯規(guī)則,同時(shí)也缺乏語義上的特征,是一類普通的中文字符串。目前這種中文字符串相似度[9]的計(jì)算在中文信息檢索、中文文本校對(duì)等領(lǐng)域中已有廣泛的應(yīng)用。衡量2個(gè)字符串的相似度,常用的方法有3種,即萊文史特距離算法、Jaccard相似方法和Jaro距離算法。

    根據(jù)已有資料的分析,現(xiàn)有的這些計(jì)算字符串相似度的算法大多基于一個(gè)假設(shè):中文字符串匹配的最小單位是單個(gè)漢字,這樣并沒有考慮到漢字中詞語對(duì)相似度的影響,所以將匹配的最小單位假設(shè)為詞。

    1.1 萊文史特距離算法

    萊文史特距離算法(Levenstein edit distance algorithm)是一種字符串編輯距離算法,指一個(gè)字符串通過多少次操作(增、刪、改)得到另外一個(gè)字符串。例如,字符串S1為“aaabc”,S2為“aabb”,S1通過‘a(chǎn)’變?yōu)椤産’,刪除‘c’兩步可以得到S2,所以編輯距離等于2。在這里,定義字符串相似度為:

    其中:distance是S1、S2的編輯距離,maxLen是S1、S2字符串長(zhǎng)度中較大的那個(gè)值。edit值越大說明相似度越大,0表示沒有任何相似度,1則代表完全匹配。

    1.2 Jaccard相似方法

    這個(gè)相似度等于兩個(gè)字符串中相同詞(無重復(fù))的個(gè)數(shù)與所有詞(無重復(fù))個(gè)數(shù)的比值。也就是說,2個(gè)字符串S1、S2的Jaccard相似度可定義為:

    和edit一樣,jacc越大說明相似度越大。

    1.3 Jaro距離

    與上邊2種算法相比,Jaro distance算法的優(yōu)點(diǎn)在于其考慮到字符不同位置的問題,如“粥全粥到臺(tái)東三路店”和“粥全粥到三店”,其中的“三”根據(jù)位置的不同可判斷為不匹配。首先定義一匹配窗口:

    其中:S1、S2是待匹配字符串。S1、S2匹配過程中,若兩者中同有字符x,并且這2個(gè)x的距離不大于MW ,此時(shí)可以認(rèn)為這2個(gè)x是匹配字符。

    Jaro相似度定義如下:

    其中:S1、S2是待匹配的2個(gè)字符串;m是匹配的字符數(shù);t是換位的數(shù)目,其值等于不同順序的匹配字符數(shù)目的一半。比如:2個(gè)字符串“ABCDE”和“EBCDA”做匹配操作,字符串中僅有B、C、D3個(gè)字符是匹配的,即m=3。雖然A、E都出現(xiàn)在2個(gè)字符串中,但是通過公式得出匹配窗口MW 為。而2個(gè)字符串中A、E字符的距離均大于1.5,所以不算作匹配。在另一組字符串AxByCDz與AzBDC。匹配的字符為A~B~C~D,但在2個(gè)字符串中C~D 2個(gè)字符順序不同,因此t=1,m=4。

    2 地理信息的相似度

    地理信息主要包括2部分,即空間地理信息和非空間地理信息。POI中的經(jīng)緯度就是一種典型的空間地理信息,而POI中的中文地址則屬于地理信息系統(tǒng)中的非空間信息。我國(guó)地理信息的相似度主要是根據(jù)中文地址的匹配程度得出,但是對(duì)于那些具有多種描述情況的地理實(shí)體,比如有別名的實(shí)體、處于2條路交叉口的實(shí)體,這種地址匹配方法就不能得出其真實(shí)的相似程度。為解決這個(gè)問題,本文借助空間地理信息對(duì)這個(gè)相似度進(jìn)行了補(bǔ)充。

    2.1 中文地址的相似度

    地址是各類服務(wù)系統(tǒng)中運(yùn)用自然語言描述空間位置的最常用手段。中文地址是一種具有一定格式的中文字符串,但又不是標(biāo)準(zhǔn)統(tǒng)一格式,對(duì)于其相似度的計(jì)算,單靠本文提到的中文字符串匹配方法并不能達(dá)到很好的效果。目前我國(guó)主流的地址匹配方法就是對(duì)地址分詞,利用各個(gè)地址要素進(jìn)行匹配。本文基于小詞典和特證詞對(duì)中文地址進(jìn)行分詞,成功分開了中文地址中的各個(gè)要素,然后根據(jù)設(shè)置好的規(guī)則,綜合所有要素給出其相似程度。

    分詞過程中用到的小詞典是根據(jù)行政區(qū)劃表構(gòu)造出來的,主要目的是規(guī)范地址中省、地、縣、鄉(xiāng)級(jí)行政區(qū)名稱,如“嶗山區(qū)松嶺路238號(hào)”,分詞結(jié)果為“山東(省)青島(市)嶗山(區(qū))松嶺(路)238(號(hào))”,不僅劃分出字符串中各個(gè)部分,其省略部分也會(huì)補(bǔ)充完整。地址字符串中除省、地、縣、鄉(xiāng)級(jí)行政區(qū)以外的其它部分,因?yàn)樾帕刻?,?yán)重影響分詞速度,況且現(xiàn)在沒有合適完整資料來源,所以只對(duì)其進(jìn)行特征字分詞。得到最終分詞結(jié)果格式為“X(省)X(地)X(縣)X(鄉(xiāng))X(路)X(號(hào))X(建筑)X(號(hào)碼)X(其它)”,括號(hào)內(nèi)是其對(duì)應(yīng)地址要素的特征詞。

    對(duì)待匹配的2個(gè)中文地址,分詞處理后對(duì)其進(jìn)行相似度計(jì)算,因?yàn)榉衷~過程中對(duì)鄉(xiāng)級(jí)及以上行政區(qū)字段進(jìn)行了規(guī)范和補(bǔ)充,所以該4級(jí)字段中低級(jí)字段若相等,較高級(jí)字段也一定匹配。對(duì)于其它5個(gè)字段,先分別計(jì)算出相似度,再根據(jù)不同權(quán)值合算出總的相似度。如果2個(gè)中文地址中對(duì)應(yīng)字段不同時(shí)存在,就無法進(jìn)行相似度計(jì)算,對(duì)于這種情況把相似度計(jì)為-1,表示不考慮該字段。若SIM1、SIM2、SIM 分別表示中地址前4個(gè)字段、后5個(gè)字段以及整體的相似度,計(jì)算的具體流程如下:

    Step1 初始化SIM1、SIM2、SIM 都為-1。

    Step2 若鄉(xiāng)級(jí)字段匹配,對(duì)SIM1賦值為1,轉(zhuǎn)向Step3;若不匹配,則匹配縣級(jí)字段,縣級(jí)若相等SIM1為0.8,轉(zhuǎn)向Step3;以同樣方法處理地級(jí)、省級(jí)字段,SIM1分別為0.4、0.3;省級(jí)字段也不匹配,SIM1仍為-1。

    Step3 若路級(jí)字段對(duì)應(yīng)可比,且2個(gè)字段字符串相似度t大于0.8,則將路級(jí)、號(hào)級(jí)字符串的相似度記為s1,t小于0.8時(shí)s1等于t的一半;路級(jí)字段不可比時(shí),s1等于-1。

    Step4 和路級(jí)、號(hào)級(jí)字段一樣,計(jì)算出建筑級(jí)、號(hào)碼級(jí)字段相似度記為s2。

    Step5 根據(jù)2.2.1中提到的一般字符串相似度算法,計(jì)算其它字段的相似度記為s3。

    Step6 設(shè)置決定SIM2各字段的權(quán)值,s1、s2、s3分別對(duì)應(yīng)a1、a2、a3,其值分別為4、3、3;若s1、s2、s3值為-1,表示對(duì)應(yīng)字段不可比,則使這個(gè)權(quán)值為0。后5個(gè)字段的相似度為:

    其中:s1、s2、s3都等于-1時(shí),SIM2為-1;

    Step7 設(shè)置SIM1、SIM2字段的權(quán)值b1、b2分別為1、3;若SIM1、SIM2值為-1,則使其對(duì)應(yīng)的權(quán)值置0。待匹配2個(gè)中文地址的相似度為:

    如果SIM1、SIM2值都為-1,SIM 的值定為0。

    2.2 空間地理信息相似度

    經(jīng)緯度被定義在三度空間的球面上,用來標(biāo)示地球上的任何一個(gè)位置,是一種典型的空間地理信息。POI中的經(jīng)緯度作用和地址字段相同,都是用來描述一個(gè)位置,只是形式不同。通過經(jīng)緯度來衡量2個(gè)POI是否匹配相似,最簡(jiǎn)單有效的方法就是計(jì)算這2點(diǎn)之間的球面距離。該地理坐標(biāo)相似度[10]定義為:

    其中:distance(p1,p2)是匹配的2個(gè)POI點(diǎn)p1、p2的球面距離。當(dāng)LLsim這個(gè)相似度大于閥值時(shí),就認(rèn)為這2個(gè)POI相似匹配。

    3 POI相似度及機(jī)器學(xué)習(xí)分類模型

    3.1 POI相似度

    在互聯(lián)網(wǎng)上抓取感興趣的網(wǎng)頁,篩選出其中與POI相關(guān)的字段信息,之后對(duì)其進(jìn)行分類處理,本文將POI分為可融合和不可融合兩類。分類的依據(jù)則是這個(gè)POI信息與數(shù)據(jù)庫(kù)中現(xiàn)有POI集的關(guān)系這個(gè)現(xiàn)有POI集并不是數(shù)據(jù)庫(kù)中所有的數(shù)據(jù),這個(gè)集合是通過在互聯(lián)網(wǎng)上抽取的POI的名稱字段在數(shù)據(jù)庫(kù)中模糊搜索的結(jié)果。

    為了方便構(gòu)建模型,本文將之前提到的待分類POI與現(xiàn)有POI集的關(guān)系轉(zhuǎn)換成為1個(gè)向量,該向量中包括這個(gè)待分類POI和現(xiàn)有POI集中的各特征字段相似度的最大值,即

    其中:p是待分類POI;px是現(xiàn)有POI集合中的某個(gè)可以不同,但必須使得其所在的函數(shù)值在組內(nèi)最大分 別表示公式(1)、(2)、(4)提到的2個(gè)POI名稱字段 Levenstein相似度、Jaccard相似度、Jaro相似度,表示的2個(gè)POI的非空間地理信息相似度表示的2個(gè)POI的空間地理信息相似度。

    圖1 機(jī)器學(xué)習(xí)分類模型的訓(xùn)練、分類過程Fig.1 Training and classifying process of machine learning model

    3.2 機(jī)器學(xué)習(xí)分類模型

    通過大量數(shù)據(jù)轉(zhuǎn)換得到的向量集,進(jìn)行特征提取后將作為訓(xùn)練集,依據(jù)機(jī)器學(xué)習(xí)的方法構(gòu)建出分類模型,將待分類的POI實(shí)例分為可融合和不可融合兩類。具體過程如圖1所示??扇诤鲜侵冈揚(yáng)OI信息已經(jīng)存在,只需對(duì)這些信息進(jìn)行融合,對(duì)部分字段進(jìn)行更新處理;不可融合則是指該P(yáng)OI信息不在現(xiàn)有數(shù)據(jù)集中,可能是新出現(xiàn)的POI信息,也可能是錯(cuò)誤不真實(shí)的POI。對(duì)這些不可融合信息真?zhèn)涡缘尿?yàn)證,可以像卡貝斯那樣通過電話情景腳本的方式實(shí)現(xiàn),也可以運(yùn)用自然語言處理相關(guān)技術(shù)實(shí)現(xiàn)。對(duì)于驗(yàn)證為正確、真實(shí)存在的POI,對(duì)其進(jìn)行融合后便可做為一有效信息添加到數(shù)據(jù)集中。而對(duì)那些驗(yàn)證為錯(cuò)誤、甚至不存在的POI不作任何處理,是對(duì)原有數(shù)據(jù)集中那些與之相似的POI要經(jīng)過驗(yàn)證,最終去除其中的“死點(diǎn)”。

    在實(shí)驗(yàn)中,運(yùn)用了幾個(gè)不同的分類器,其中包括貝葉斯分類器、C4.5分類器、Adaboost提升分類器。每個(gè)分類器都有各式各樣、復(fù)雜的標(biāo)準(zhǔn),利用這些標(biāo)準(zhǔn)構(gòu)造不同的模型。比如,C4.5采用信息增益比作為選擇測(cè)試屬性的標(biāo)準(zhǔn),從根節(jié)點(diǎn)開始,賦予最好的屬性,在將該屬性各種取值都生成相應(yīng)的分支,在每個(gè)分支上又生成新的節(jié)點(diǎn),加之一些剪枝方法構(gòu)造出決策樹,使其最大程度地?cái)M合訓(xùn)練集。C4.5產(chǎn)生的分類規(guī)則易于理解,準(zhǔn)確率較高,但是在構(gòu)造樹的過程中,需要對(duì)數(shù)據(jù)集進(jìn)行多次的順序掃描和排序,因而導(dǎo)致算法的低效。此外,C4.5只適合于能夠駐留于內(nèi)存的數(shù)據(jù)集,當(dāng)訓(xùn)練集大得無法在內(nèi)存容納時(shí)程序就無法運(yùn)行了。

    4 實(shí)驗(yàn)數(shù)據(jù)及結(jié)果

    4.1 數(shù)據(jù)集

    實(shí)驗(yàn)中,本文從美團(tuán)團(tuán)購(gòu)網(wǎng)上抽取了1 095個(gè)頁面,每個(gè)頁面上有1個(gè)POI信息,即之前提到的待分類POI,隨后在google地圖、mapabc、baidu地圖上按照待分類POI中的名稱字段進(jìn)行模糊搜索,將搜索結(jié)果集作為現(xiàn)有POI集合。本文對(duì)于這些數(shù)據(jù)進(jìn)行了人工標(biāo)注,根據(jù)現(xiàn)有POI集合判斷其對(duì)應(yīng)的待分類POI是否可被融合,標(biāo)注結(jié)果中744個(gè)POI是可融合的,238個(gè)是不可融合,其余113個(gè)POI模糊搜索沒有結(jié)果,本文不予以考慮。將以上可融合的和不可融合的(共982個(gè))POI轉(zhuǎn)換成向量集,作為本實(shí)驗(yàn)的數(shù)據(jù)集。

    表1 結(jié)果關(guān)系表Table1The relation of classification result

    4.2 測(cè)評(píng)指標(biāo)

    本節(jié)將分析模型分類結(jié)果和人工標(biāo)注結(jié)果是否一致,為評(píng)測(cè)模型的分類效果實(shí)驗(yàn)中用到了3個(gè)重要指標(biāo),即召回率(Recall)、準(zhǔn)確率(Precision)和F值。人工標(biāo)注結(jié)果與模型分類結(jié)果關(guān)系表示(見表1)。

    可融合的召回率r1是指模型分類與人工標(biāo)注結(jié)果均為可融合的POI數(shù)目占人工標(biāo)注中可融合總數(shù)的百分比,反映分類模型的完備性;可融合的準(zhǔn)確率p1是指模型分類與人工標(biāo)注結(jié)果均為可融合的POI數(shù)目占模型分類結(jié)果中可融合總數(shù)的百分比,可反映分類模型的準(zhǔn)確程度??扇诤系恼倩芈蕆1可表示為同樣不可融合的召回率r0可表示為不可融合的準(zhǔn)確率整個(gè)分類的準(zhǔn)確率p則可表示為F值是召回率和準(zhǔn)確率這2個(gè)指標(biāo)的綜合值,定義如下:

    式中:P為準(zhǔn)確率;R為召回率;β為召回率和準(zhǔn)確率相對(duì)權(quán)重,一般取1;因此F值可以表示為:

    4.3 基于規(guī)則的分類結(jié)果

    本文首先分別對(duì)POI中的各特征字段的相似度進(jìn)行線性回歸,通過設(shè)置不同的閥值進(jìn)行分類,得到每個(gè)特征相似度單獨(dú)參與分類的表現(xiàn)(見圖2):

    圖中f1是可融合的F值,f0是不可融合的F值,p為整個(gè)分類結(jié)果的準(zhǔn)確率。從3個(gè)圖中可以看出,無論是哪個(gè)字段,p和f1的變化趨勢(shì)是一樣的,且f1總是處于最上方,f0總是處于最下方。因?yàn)榭扇诤系腜OI占大部分,所以f1會(huì)更大程度地影響整體分類結(jié)果。圖中的峰值并不是說此時(shí)的p1或r1是最大值,而是說p1和r1處在一個(gè)最佳的平衡點(diǎn),不至于2個(gè)值一個(gè)過太一個(gè)過小。對(duì)于p0、r0也是一樣。在圖2(a)中,p和f1在[0.85,1]區(qū)間內(nèi)逐漸減小,對(duì)應(yīng)的f0不斷增大,但最大值仍舊很小,此時(shí)所有POI分類的結(jié)果為可融合。在圖2(b)中,3個(gè)曲線同增減,并在0.36處出現(xiàn)峰值。圖2(c)中的3條線變化趨勢(shì)也相同,且在0.001處出現(xiàn)峰值,同樣是這種情況下的平衡點(diǎn)。具體結(jié)果(見表2)。

    從上述結(jié)果分析可知,POI中各字段在區(qū)分可融合、不可融合分類過程的表現(xiàn)不同,其分類效果由弱到強(qiáng)分別是名稱、經(jīng)緯度、地址字段。名稱字段之所以比較差,主要因?yàn)楝F(xiàn)有POI集中的POI是根據(jù)待分類POI的名稱進(jìn)行模糊搜索得到的,它們的名稱相似度已經(jīng)很高,不足以有效區(qū)分POI。其中對(duì)地址和經(jīng)緯度字段進(jìn)行了融合,其結(jié)果表現(xiàn)的最佳。

    圖2 POI不同字段的分類結(jié)果Fig.2 Classification results for different POI attributes

    4.4 基于機(jī)器學(xué)習(xí)方法的分類結(jié)果

    在實(shí)驗(yàn)中,本文運(yùn)用了樸素貝葉斯、C4.5、Adaboost 3種分類器對(duì)數(shù)據(jù)集進(jìn)行了訓(xùn)練、測(cè)試,因?yàn)閿?shù)據(jù)有限,所以在這里采用了十折交叉驗(yàn)證的方法。分類結(jié)果(見表3)中可看出,各分類器效果差不多,對(duì)可融合的POI分類較好,但對(duì)不可融合部分各指標(biāo)還是偏低??傮w來說,C4.5效果較好,適合應(yīng)用在這個(gè)分類中。

    表2 根據(jù)不同字段分類的最佳閥值及結(jié)果Table 2 The optimal threshold and result

    表3 不同分類器的分類結(jié)果Table 3 Classification result for different classifier

    5 結(jié)語

    本文分別定義了POI各個(gè)特征字段的相似度,根據(jù)這些相似度構(gòu)造出POI相似模型,并對(duì)網(wǎng)絡(luò)上抽取的POI數(shù)據(jù)進(jìn)行有效分類。最后實(shí)驗(yàn)結(jié)果準(zhǔn)確率可達(dá)到90%左右,驗(yàn)證了根據(jù)相似度構(gòu)建模型的正確性和可行性。同時(shí)還說明對(duì)POI各字段進(jìn)行適當(dāng)?shù)娜诤希瑢?duì)其分類可以起到一定的積極作用。

    對(duì)于這些分類為可融合的POI,除名稱、地址、經(jīng)緯度外的其它部分不具有統(tǒng)一的數(shù)據(jù)結(jié)構(gòu),并且還存在大量的冗余信息,仍然不能不能直接應(yīng)用于位置服務(wù)中。下一步還需要研究改進(jìn)POI的融合模型,得更有價(jià)值的融合結(jié)果。

    [1] Krosche J,Boll S.The xPOI Concept[C].//Location and Context Awareness,Oberpfaffenhofen:Germang Springer,2005:113-119.

    [2] 王海波.基于GPS與實(shí)景影像的POI快速采集技術(shù) [J].中國(guó)科技信息,2007(12):121-122.

    [3] Tom M,Mitchell.Machine Learning[M].曾華軍,譯.北京:機(jī)械工業(yè)出版社,2005:38-56,112-135.

    [4] Ryszard S.Michalshi,Ivan Bratko.Machine Learning and Data Mining:Methods and Applications[M].朱明,譯.北京:電子工業(yè)出版社,2004:67-94,114-117.

    [5] Vivek S.Entity Resolution in Geospatial Data Integration [J].ACM-GIS,2006,11:10-11.

    [6] 牛永潔,張成.多種字符串相似度算法的比較研究 [J].計(jì)算機(jī)與數(shù)字工程,2012,3:14-17.

    [7] 江洲,李琦.地理編碼(Geocoding)的應(yīng)用研究 [J].地理與地理信息科學(xué),2003(3):22-25.

    [8] 孫亞夫,陳文斌.基于分詞的地址匹配技術(shù) [C].//中國(guó)地理信息系統(tǒng)協(xié)會(huì)第四次會(huì)員代表大會(huì)暨第十一屆年會(huì)論文集.北京:科學(xué)出版社,2007:114-125.

    [9] 宋玲,徐白.中文檢索系統(tǒng)的相似匹配技術(shù)研究和實(shí)現(xiàn) [J].計(jì)算機(jī)科學(xué) A輯,2010,37(12):46-48.

    [10] Beeri C,Kanza Y,Safra E.Object Fusion in Geographic Information System [C].Toronto:Proceeding of the 30th VLDB Conference,2004:816-827.

    猜你喜歡
    經(jīng)緯度字符串字段
    圖書館中文圖書編目外包數(shù)據(jù)質(zhì)量控制分析
    自制中學(xué)實(shí)驗(yàn)操作型經(jīng)緯測(cè)量?jī)x
    澳洲位移大,需調(diào)經(jīng)緯度
    一種利用太陽影子定位的數(shù)學(xué)模型
    CNMARC304字段和314字段責(zé)任附注方式解析
    無正題名文獻(xiàn)著錄方法評(píng)述
    一種新的基于對(duì)稱性的字符串相似性處理算法
    關(guān)于CNMARC的3--字段改革的必要性與可行性研究
    依據(jù)字符串匹配的中文分詞模型研究
    一種針對(duì)Java中字符串的內(nèi)存管理方案
    国产精品乱码一区二三区的特点| 最好的美女福利视频网| 在线十欧美十亚洲十日本专区| 亚洲在线自拍视频| √禁漫天堂资源中文www| av片东京热男人的天堂| 精品一区二区三区四区五区乱码| 国产精品美女特级片免费视频播放器 | 国内精品久久久久精免费| 两性午夜刺激爽爽歪歪视频在线观看 | 国产精品精品国产色婷婷| 精品欧美国产一区二区三| 欧美中文综合在线视频| 不卡av一区二区三区| 此物有八面人人有两片| 露出奶头的视频| 欧美成狂野欧美在线观看| 国产精品 欧美亚洲| 亚洲自偷自拍图片 自拍| 欧美日韩黄片免| 在线观看一区二区三区| 一级片免费观看大全| 成人国语在线视频| 国产成人精品久久二区二区免费| 亚洲av成人不卡在线观看播放网| videosex国产| 亚洲人成伊人成综合网2020| 国产精品野战在线观看| 狠狠狠狠99中文字幕| 免费在线观看亚洲国产| 在线观看舔阴道视频| 国产一级毛片七仙女欲春2| 亚洲熟女毛片儿| 久久九九热精品免费| 国产成人精品无人区| 亚洲国产欧美人成| 国产精品影院久久| 老司机靠b影院| 人妻夜夜爽99麻豆av| 久热爱精品视频在线9| 成人一区二区视频在线观看| 精品一区二区三区av网在线观看| 午夜久久久久精精品| 欧美成人免费av一区二区三区| 国产区一区二久久| 久99久视频精品免费| 午夜老司机福利片| 在线看三级毛片| 国产亚洲欧美98| 国内精品久久久久久久电影| 久久久久久亚洲精品国产蜜桃av| 欧美成人免费av一区二区三区| 色综合欧美亚洲国产小说| 50天的宝宝边吃奶边哭怎么回事| 国产伦在线观看视频一区| 此物有八面人人有两片| 制服丝袜大香蕉在线| 97超级碰碰碰精品色视频在线观看| 丁香六月欧美| 婷婷精品国产亚洲av在线| 久久香蕉国产精品| 欧美色欧美亚洲另类二区| 国产亚洲精品综合一区在线观看 | 最近最新免费中文字幕在线| 美女扒开内裤让男人捅视频| 三级男女做爰猛烈吃奶摸视频| 色噜噜av男人的天堂激情| 日本免费a在线| 最新在线观看一区二区三区| 欧美激情久久久久久爽电影| 婷婷六月久久综合丁香| 午夜福利视频1000在线观看| 国产精品一区二区免费欧美| 动漫黄色视频在线观看| 黄色视频不卡| 国产视频内射| 激情在线观看视频在线高清| 国产私拍福利视频在线观看| 久久久国产成人免费| 国产精品 欧美亚洲| 99热这里只有是精品50| 国产av麻豆久久久久久久| netflix在线观看网站| 午夜日韩欧美国产| 99国产精品99久久久久| 99国产精品一区二区三区| 欧美日韩精品网址| 12—13女人毛片做爰片一| 国产高清视频在线播放一区| 午夜影院日韩av| 女人高潮潮喷娇喘18禁视频| 99国产极品粉嫩在线观看| 欧美日韩黄片免| 777久久人妻少妇嫩草av网站| 免费无遮挡裸体视频| 999精品在线视频| 欧美不卡视频在线免费观看 | 久久欧美精品欧美久久欧美| 亚洲一区中文字幕在线| 色尼玛亚洲综合影院| 99在线视频只有这里精品首页| 中亚洲国语对白在线视频| 最近在线观看免费完整版| 亚洲人与动物交配视频| 日韩欧美国产在线观看| 天天一区二区日本电影三级| 动漫黄色视频在线观看| 国产av一区二区精品久久| 亚洲精品粉嫩美女一区| 午夜福利在线观看吧| 久9热在线精品视频| 桃色一区二区三区在线观看| 欧美精品亚洲一区二区| 亚洲熟妇熟女久久| 欧美中文日本在线观看视频| 小说图片视频综合网站| 中文字幕人妻丝袜一区二区| 国产视频内射| 国产视频一区二区在线看| 日本精品一区二区三区蜜桃| 成年免费大片在线观看| 激情在线观看视频在线高清| 长腿黑丝高跟| 亚洲欧美精品综合久久99| 激情在线观看视频在线高清| 国产精品久久久久久精品电影| 99riav亚洲国产免费| 亚洲人成网站高清观看| 999久久久国产精品视频| 亚洲人成77777在线视频| 免费在线观看成人毛片| 高潮久久久久久久久久久不卡| 日日爽夜夜爽网站| 少妇裸体淫交视频免费看高清 | 桃色一区二区三区在线观看| 国内精品久久久久精免费| 一边摸一边做爽爽视频免费| 99国产精品一区二区三区| 97碰自拍视频| 两个人免费观看高清视频| 精品久久久久久久毛片微露脸| 久久精品91无色码中文字幕| 日本三级黄在线观看| 好看av亚洲va欧美ⅴa在| 好男人电影高清在线观看| or卡值多少钱| 夜夜夜夜夜久久久久| 亚洲一区二区三区不卡视频| 精品电影一区二区在线| 九九热线精品视视频播放| 亚洲av熟女| 三级毛片av免费| 国内精品久久久久精免费| 精品国产超薄肉色丝袜足j| 一级a爱片免费观看的视频| 亚洲熟妇中文字幕五十中出| 欧美日韩福利视频一区二区| 国产免费男女视频| 国产精品久久久av美女十八| 国产精品精品国产色婷婷| 亚洲全国av大片| 久久热在线av| √禁漫天堂资源中文www| 级片在线观看| 91字幕亚洲| 欧美性猛交╳xxx乱大交人| 美女 人体艺术 gogo| 精品久久久久久久人妻蜜臀av| 在线观看免费视频日本深夜| 亚洲精品一区av在线观看| 狠狠狠狠99中文字幕| 精品久久久久久久人妻蜜臀av| 成年女人毛片免费观看观看9| 两性夫妻黄色片| 两性夫妻黄色片| 99热6这里只有精品| 757午夜福利合集在线观看| 久久亚洲精品不卡| 午夜激情福利司机影院| 欧美高清成人免费视频www| 国产野战对白在线观看| 日韩高清综合在线| 99久久99久久久精品蜜桃| 日韩欧美精品v在线| 99在线人妻在线中文字幕| 国产欧美日韩精品亚洲av| 国产一区二区激情短视频| 国产野战对白在线观看| 国产野战对白在线观看| 久久久水蜜桃国产精品网| 极品教师在线免费播放| 国产av又大| 亚洲国产日韩欧美精品在线观看 | 一本精品99久久精品77| 亚洲色图av天堂| 色在线成人网| 精品久久久久久久人妻蜜臀av| 久久久久国产精品人妻aⅴ院| 国产激情欧美一区二区| 亚洲欧美激情综合另类| 伦理电影免费视频| 最新美女视频免费是黄的| 在线观看www视频免费| 一个人免费在线观看的高清视频| 亚洲av成人精品一区久久| av中文乱码字幕在线| 欧美zozozo另类| 中文字幕久久专区| 久久精品夜夜夜夜夜久久蜜豆 | 亚洲男人的天堂狠狠| 亚洲18禁久久av| 91大片在线观看| √禁漫天堂资源中文www| √禁漫天堂资源中文www| 在线十欧美十亚洲十日本专区| 无遮挡黄片免费观看| 久久精品91无色码中文字幕| 日日摸夜夜添夜夜添小说| av天堂在线播放| 人成视频在线观看免费观看| 在线国产一区二区在线| 在线免费观看的www视频| 免费在线观看成人毛片| 人人妻人人看人人澡| ponron亚洲| 长腿黑丝高跟| 99国产综合亚洲精品| 国产高清激情床上av| 国产精品久久久久久亚洲av鲁大| 少妇人妻一区二区三区视频| 麻豆国产97在线/欧美 | 亚洲欧美激情综合另类| 精品国内亚洲2022精品成人| 不卡av一区二区三区| 国内精品一区二区在线观看| 淫妇啪啪啪对白视频| 国产区一区二久久| 男女那种视频在线观看| 精品不卡国产一区二区三区| 美女午夜性视频免费| 久久久水蜜桃国产精品网| 精品日产1卡2卡| 色哟哟哟哟哟哟| 亚洲av第一区精品v没综合| 91大片在线观看| 一进一出抽搐gif免费好疼| 亚洲国产欧美人成| 一进一出抽搐动态| 级片在线观看| 免费在线观看黄色视频的| 亚洲成a人片在线一区二区| 女人被狂操c到高潮| 久久草成人影院| 无限看片的www在线观看| av中文乱码字幕在线| 亚洲黑人精品在线| 国产精品亚洲美女久久久| 色在线成人网| 一个人观看的视频www高清免费观看 | 老熟妇仑乱视频hdxx| av免费在线观看网站| 又粗又爽又猛毛片免费看| 一进一出好大好爽视频| 一个人观看的视频www高清免费观看 | 丝袜人妻中文字幕| 国产成人一区二区三区免费视频网站| 亚洲第一电影网av| 午夜激情av网站| 久久精品国产清高在天天线| 精品久久久久久久末码| 亚洲在线自拍视频| 精品一区二区三区视频在线观看免费| 18禁黄网站禁片免费观看直播| 露出奶头的视频| 欧美丝袜亚洲另类 | 亚洲专区中文字幕在线| 毛片女人毛片| av免费在线观看网站| 免费观看人在逋| 看片在线看免费视频| 亚洲激情在线av| 精品无人区乱码1区二区| 999久久久精品免费观看国产| 亚洲精品中文字幕一二三四区| 丁香六月欧美| 亚洲熟妇中文字幕五十中出| 中文在线观看免费www的网站 | 国产又黄又爽又无遮挡在线| 日本 av在线| 在线看三级毛片| 亚洲人成网站在线播放欧美日韩| 黄色视频,在线免费观看| 丰满人妻熟妇乱又伦精品不卡| 老司机午夜福利在线观看视频| 国产成人欧美在线观看| 日韩欧美国产在线观看| 亚洲专区国产一区二区| 国产精品一区二区三区四区久久| 俺也久久电影网| 最新美女视频免费是黄的| 又粗又爽又猛毛片免费看| 精品免费久久久久久久清纯| 国产在线精品亚洲第一网站| 此物有八面人人有两片| 午夜福利免费观看在线| 别揉我奶头~嗯~啊~动态视频| 色老头精品视频在线观看| 国产精品精品国产色婷婷| 国产精品野战在线观看| 国产亚洲欧美在线一区二区| 国产精品电影一区二区三区| 亚洲18禁久久av| 精品久久久久久久久久久久久| av在线播放免费不卡| 国产69精品久久久久777片 | 草草在线视频免费看| 最新在线观看一区二区三区| 午夜免费成人在线视频| 亚洲人成伊人成综合网2020| 日本五十路高清| 别揉我奶头~嗯~啊~动态视频| 亚洲电影在线观看av| 母亲3免费完整高清在线观看| 国产伦在线观看视频一区| 久久精品综合一区二区三区| 久久 成人 亚洲| 亚洲av成人av| 日韩大尺度精品在线看网址| 波多野结衣高清作品| 最新美女视频免费是黄的| 国产一区在线观看成人免费| 亚洲成av人片免费观看| 国产一区二区激情短视频| 男人的好看免费观看在线视频 | 大型av网站在线播放| 日韩欧美国产在线观看| 大型黄色视频在线免费观看| 亚洲人成电影免费在线| ponron亚洲| 麻豆国产av国片精品| 久久久久久免费高清国产稀缺| 18美女黄网站色大片免费观看| 757午夜福利合集在线观看| 18禁美女被吸乳视频| 中文资源天堂在线| 99国产综合亚洲精品| 黑人操中国人逼视频| 麻豆国产97在线/欧美 | 不卡一级毛片| 欧美午夜高清在线| 欧美精品亚洲一区二区| 亚洲人成网站在线播放欧美日韩| 在线免费观看的www视频| 精品无人区乱码1区二区| 亚洲色图av天堂| 哪里可以看免费的av片| 欧美日韩一级在线毛片| 99国产精品99久久久久| 97超级碰碰碰精品色视频在线观看| 中文在线观看免费www的网站 | 亚洲精品久久成人aⅴ小说| 桃红色精品国产亚洲av| 天天一区二区日本电影三级| 波多野结衣高清作品| 午夜福利18| 99在线人妻在线中文字幕| www国产在线视频色| 妹子高潮喷水视频| 黄色视频,在线免费观看| 日本在线视频免费播放| 久久国产精品影院| 日本精品一区二区三区蜜桃| 国产视频内射| 国产精品99久久99久久久不卡| 91麻豆精品激情在线观看国产| 欧美色视频一区免费| 日日爽夜夜爽网站| 欧美又色又爽又黄视频| 最近最新中文字幕大全免费视频| xxx96com| 国产三级在线视频| 欧美成狂野欧美在线观看| 曰老女人黄片| 日韩三级视频一区二区三区| 精品欧美一区二区三区在线| 夜夜看夜夜爽夜夜摸| 国产精品一区二区精品视频观看| 男女做爰动态图高潮gif福利片| 啪啪无遮挡十八禁网站| 91老司机精品| 婷婷精品国产亚洲av在线| 国产成人精品久久二区二区91| 欧美最黄视频在线播放免费| 日韩 欧美 亚洲 中文字幕| 欧美日韩福利视频一区二区| av免费在线观看网站| 女生性感内裤真人,穿戴方法视频| 亚洲欧美日韩高清专用| 黄色丝袜av网址大全| 在线观看www视频免费| 淫秽高清视频在线观看| 欧美极品一区二区三区四区| 亚洲av五月六月丁香网| 日韩精品免费视频一区二区三区| 久久久久国内视频| 看黄色毛片网站| 18禁黄网站禁片免费观看直播| 欧美成狂野欧美在线观看| 亚洲av片天天在线观看| 午夜a级毛片| 免费在线观看亚洲国产| 欧美激情久久久久久爽电影| 精品国产美女av久久久久小说| 97人妻精品一区二区三区麻豆| 日日干狠狠操夜夜爽| 国产激情久久老熟女| 精品久久久久久,| 在线观看午夜福利视频| 久久久精品大字幕| 少妇人妻一区二区三区视频| 精品熟女少妇八av免费久了| av中文乱码字幕在线| 成年女人毛片免费观看观看9| avwww免费| 制服人妻中文乱码| 天堂√8在线中文| 亚洲精品av麻豆狂野| 舔av片在线| 国产成+人综合+亚洲专区| 亚洲aⅴ乱码一区二区在线播放 | 一本精品99久久精品77| 国产精品永久免费网站| 欧美日韩黄片免| 国产精品 国内视频| 一级毛片精品| 亚洲18禁久久av| 老司机福利观看| 婷婷六月久久综合丁香| 91大片在线观看| 国产午夜精品久久久久久| 久久 成人 亚洲| 丝袜美腿诱惑在线| 欧美高清成人免费视频www| 琪琪午夜伦伦电影理论片6080| 俄罗斯特黄特色一大片| 免费在线观看成人毛片| 99久久久亚洲精品蜜臀av| 亚洲欧美日韩高清专用| 欧美精品亚洲一区二区| 国产av不卡久久| 亚洲天堂国产精品一区在线| www日本黄色视频网| 精品日产1卡2卡| 18禁国产床啪视频网站| 亚洲 欧美一区二区三区| 九九热线精品视视频播放| 国产成+人综合+亚洲专区| 老鸭窝网址在线观看| 国产99白浆流出| x7x7x7水蜜桃| 国产一区二区在线观看日韩 | 国产精品一区二区免费欧美| 免费高清视频大片| 亚洲av成人一区二区三| 国产精品精品国产色婷婷| 亚洲av五月六月丁香网| 最近在线观看免费完整版| 日本五十路高清| 亚洲国产中文字幕在线视频| 亚洲激情在线av| 久久 成人 亚洲| 日本a在线网址| 久久国产精品影院| 国产麻豆成人av免费视频| 一级a爱片免费观看的视频| 日本在线视频免费播放| 国产黄a三级三级三级人| 久久久久久久久中文| 国产成人精品无人区| 亚洲人成网站在线播放欧美日韩| 午夜激情福利司机影院| 久久亚洲精品不卡| 可以在线观看毛片的网站| 男女之事视频高清在线观看| 亚洲国产高清在线一区二区三| 成人手机av| 熟女电影av网| 99国产精品一区二区蜜桃av| 国产av一区在线观看免费| 国产aⅴ精品一区二区三区波| 少妇人妻一区二区三区视频| x7x7x7水蜜桃| 日韩精品青青久久久久久| 毛片女人毛片| 在线观看66精品国产| 国产成人精品无人区| 国产精品一区二区三区四区免费观看 | 国产成人精品久久二区二区免费| 成人三级黄色视频| 欧美日韩一级在线毛片| 午夜两性在线视频| 51午夜福利影视在线观看| 99久久99久久久精品蜜桃| 亚洲熟妇熟女久久| 高潮久久久久久久久久久不卡| 国产一区二区在线观看日韩 | netflix在线观看网站| 亚洲精品美女久久av网站| svipshipincom国产片| 无遮挡黄片免费观看| 亚洲欧美激情综合另类| 天天躁夜夜躁狠狠躁躁| 51午夜福利影视在线观看| 欧美绝顶高潮抽搐喷水| 长腿黑丝高跟| 一卡2卡三卡四卡精品乱码亚洲| 久久久国产欧美日韩av| 亚洲一卡2卡3卡4卡5卡精品中文| 国产亚洲精品久久久久久毛片| 男女视频在线观看网站免费 | 长腿黑丝高跟| 啦啦啦观看免费观看视频高清| 国产成年人精品一区二区| 亚洲五月婷婷丁香| 国产av一区在线观看免费| 国产精品久久久av美女十八| bbb黄色大片| 动漫黄色视频在线观看| 禁无遮挡网站| 999精品在线视频| 精品无人区乱码1区二区| 黄色女人牲交| 黑人操中国人逼视频| 日韩大码丰满熟妇| 99国产极品粉嫩在线观看| 国产久久久一区二区三区| 视频区欧美日本亚洲| 亚洲一区中文字幕在线| 真人一进一出gif抽搐免费| av国产免费在线观看| 国产探花在线观看一区二区| а√天堂www在线а√下载| 老司机靠b影院| 欧美另类亚洲清纯唯美| 欧美性猛交黑人性爽| 成年版毛片免费区| 国产av又大| 国产一区二区在线观看日韩 | 一个人免费在线观看的高清视频| 在线观看免费视频日本深夜| 国产97色在线日韩免费| 日本精品一区二区三区蜜桃| 久久久久国产精品人妻aⅴ院| 亚洲人成电影免费在线| 两个人免费观看高清视频| 99国产精品99久久久久| 丝袜人妻中文字幕| 久久国产乱子伦精品免费另类| www.熟女人妻精品国产| 国产精品,欧美在线| 91老司机精品| 老汉色av国产亚洲站长工具| 91老司机精品| 最近视频中文字幕2019在线8| 又黄又粗又硬又大视频| 亚洲欧美一区二区三区黑人| 国产午夜福利久久久久久| 国产成人欧美在线观看| 日韩三级视频一区二区三区| av免费在线观看网站| 97超级碰碰碰精品色视频在线观看| 99热只有精品国产| 亚洲自偷自拍图片 自拍| 久久香蕉激情| 少妇被粗大的猛进出69影院| 国产精品亚洲美女久久久| tocl精华| 欧美黑人精品巨大| 男女那种视频在线观看| 91成年电影在线观看| 亚洲自偷自拍图片 自拍| 别揉我奶头~嗯~啊~动态视频| 久久精品夜夜夜夜夜久久蜜豆 | 精品电影一区二区在线| 国内久久婷婷六月综合欲色啪| 亚洲av日韩精品久久久久久密| 日本熟妇午夜| 午夜免费激情av| 亚洲精品国产一区二区精华液| 一进一出抽搐gif免费好疼| 在线看三级毛片| avwww免费| 国产又黄又爽又无遮挡在线| 亚洲精品国产精品久久久不卡| 一区二区三区国产精品乱码| 女生性感内裤真人,穿戴方法视频| 好看av亚洲va欧美ⅴa在| 男女视频在线观看网站免费 | 国产三级黄色录像| 国产精品电影一区二区三区| 免费看美女性在线毛片视频| 国产精品一区二区精品视频观看| av超薄肉色丝袜交足视频| 精品少妇一区二区三区视频日本电影| 久久午夜亚洲精品久久| 又粗又爽又猛毛片免费看| 美女 人体艺术 gogo| 国产真人三级小视频在线观看| svipshipincom国产片| 一个人免费在线观看的高清视频| 欧美三级亚洲精品| 国产精品久久电影中文字幕| 国产精品av久久久久免费| 一进一出抽搐gif免费好疼| 久久午夜综合久久蜜桃|