• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于本體的旅游產(chǎn)品映射的應(yīng)用研究

    2015-09-26 02:02:00王衛(wèi)東張琳
    現(xiàn)代計算機 2015年17期
    關(guān)鍵詞:實例本體概念

    王衛(wèi)東,張琳

    (上海海事大學,上?!?62500)

    基于本體的旅游產(chǎn)品映射的應(yīng)用研究

    王衛(wèi)東,張琳

    (上海海事大學,上海262500)

    0 引言

    近年來,線下旅游與線上旅游相互交融旅游行業(yè)信息大量分散的遍布在網(wǎng)絡(luò)中,使得傳統(tǒng)的旅游行業(yè)也得到了快速的發(fā)展。"傳統(tǒng)+聯(lián)網(wǎng)”模式的飛速發(fā)展,隨著阿里去啊、上海真旅、去哪兒、不夜城、美團及中國旅游信息網(wǎng)等旅游門戶網(wǎng)站的不斷發(fā)展,通過在各大旅游網(wǎng)站上進行需求搜索成為旅客獲得旅游信息的主體方式。然而大量網(wǎng)站在信息構(gòu)建都是基于傳統(tǒng)的方式,已有的信息無法很好地實現(xiàn)共享和重用,計算機無法智能地識別網(wǎng)絡(luò)中的信息使得用戶在搜索旅游信息時不易及時找到自己想要的信息。由于本體論在解決信息交互和共享方面具有明顯的優(yōu)勢,本體相關(guān)技術(shù)在實現(xiàn)旅游信息共享和重用方面也得到的大量研究者的重視。

    1 本體

    本體(ontology)最初是指對事物本質(zhì)研究的一種存在論,在計算機中用來表示將信息形式概念化的,用來表示領(lǐng)域知識中對象,概念和和各個實體間的關(guān)系[1]。隨著互聯(lián)網(wǎng)時代的到來和不斷成長,本體己有由原來的哲學領(lǐng)域知識運用到計算機領(lǐng)域來領(lǐng)域如人工智能、電子工程、遠程教育、電子商務(wù)等。本體論在信息領(lǐng)域一直沒有一個明確的規(guī)定,比較有代表的是Borst指出的:“本體是共享概念模型的形式化規(guī)范的說明”[2]。這個定義從以下四個方面來完善了本體在計算機科學領(lǐng)域的定義[3]:

    ①概念模型(Conceptualization):通過抽象出客觀世界中事物具有的共同特征得到的一些抽象模型,概念模型表達的信息和實際的狀態(tài)信息有直接的關(guān)聯(lián)。

    ②明確化(Explicit):所使用的概念信息都具有明確的約束和完備性。

    ③形式化(Formal):本體化的信息能被計算機智能化獲取和處理。

    ④共享(Share):本體化得到的信息是可以被相關(guān)領(lǐng)域人士所認可的,可實現(xiàn)重用的。

    (1)旅游業(yè)為游客提供旅程中的各種服務(wù),隨著生活質(zhì)量的不斷提高,人們對于旅游要求的多樣性和各大旅游網(wǎng)站針對個性化旅游路線的推出,這些服務(wù)涉及到不同行業(yè)。通過在網(wǎng)絡(luò)上搜索和“2014-2018年中國網(wǎng)上旅行預訂行業(yè)未來發(fā)展及投資研究報告”得到,旅游本體大概可以分為如下幾類:旅行路線、旅客概況,住宿、交通、飲食、景點、購物等,旅游本體庫如圖1:

    圖1 旅游本體庫

    2 本體映射

    在構(gòu)建本體過程中不同的時刻有著不同的需求,導致在相同領(lǐng)域內(nèi)存在許多構(gòu)建在不同技術(shù)上的本體。由此導致了在同一個領(lǐng)域中存在多個本體的現(xiàn)象,使得在實現(xiàn)不同本體間相互重用產(chǎn)生許多問題[4]:(1)用不同的名稱代表相同意義的信息,即同義異音,以及不同含義的信息用相同的名稱來表示,即同音異義;(2)在構(gòu)建本體時不同的本體表達形式,造成本體數(shù)據(jù)的沖突;(3)不同的需求導致在創(chuàng)建本體是導致不同本體的層次沖突。

    為了實現(xiàn)異構(gòu)本體間的復用,在解決上述提到的三個導致不同本體沖突問題主要采用以下三種方法[5]:

    (l)在異構(gòu)本體間建立從屬關(guān)系,使得源本體包含目標本體。這種方法的缺點是在修改源本體信息后需要重新建立從屬關(guān)系。

    (2)將源本體和目標本體進行合成形成一個大型的公用本體,但是由于不同本體技術(shù)構(gòu)建得到的本體不一樣使得合成后的本體實用性差,而且不宜于修改和維護。

    (3)在異構(gòu)本體間通過相似度計算的橋梁實現(xiàn)異構(gòu)本體的映射,實現(xiàn)源本體到目標本體的轉(zhuǎn)換。

    本體映射是一種常用的解決本體異構(gòu)的方法。在旅游本體中對于不同時間不同地點等要求本體需要對應(yīng)的修改,將異構(gòu)本體進行合成使得合成后的大型本體不宜于修改和維護,所以基于相似度計算實現(xiàn)本體間重用是一種相對較好的方式。在本體映射相似度計算過程中,不同領(lǐng)域的本體有著不同的一些特性,對于旅游領(lǐng)域的本體,對于時間、數(shù)字、地點等要求都嚴格,所以在進行相似度計算過程中不能只考慮單一的相似度計算方面,采用一種綜合的方法進一步改善計算的過程,從本體概念名稱、屬性、實例、結(jié)構(gòu)等方面計算概念的相似度,尋找更加有效的概念相似度計算方法。通過將一個國內(nèi)和一個國際的旅游本體進行相似度計算得到的結(jié)果和人們的主觀得到的結(jié)果相近。證明了綜合相似度計算的實際可用性。

    層次聚類也稱為樹聚類,通過一定的準則將信息對象劃分到不同的組之中。同一組內(nèi)的信息有著較高的相似度和相關(guān)度。不同組之間關(guān)聯(lián)性小。將數(shù)據(jù)對象進行數(shù)據(jù)結(jié)構(gòu)上的分解合并形成一個樹結(jié)構(gòu),在樹結(jié)構(gòu)中每個節(jié)點與其父節(jié)點、孩子節(jié)點,和兄弟節(jié)點存在一定的相似性。從而形成層次樹的結(jié)構(gòu)。一般來說,有兩種類型的層次聚類算法[7]:

    凝聚的層次聚類:通過自下而上將每個數(shù)據(jù)作為一個節(jié)點,然后合并節(jié)點從而形成一個節(jié)點組。

    分裂的層次聚類:通過自上而下的方法,首先將所有的節(jié)點至于一個節(jié)點組中,通過閾值的選定將一個節(jié)點組分裂成為幾個內(nèi)部高度相似度的小節(jié)點組。

    在層次聚類中確定兩個節(jié)點組距離有以下四種方法[8~9]:

    (1)最小距離:指兩個節(jié)點組中所有節(jié)點最近距離表示兩個節(jié)點組的最小距離:

    (2)最大距離:指兩個節(jié)點組中所有節(jié)點最近距離表示兩個節(jié)點組的最大距離:

    (3)平均值距離:指兩個節(jié)點組中所有節(jié)點中兩個中心節(jié)點表示兩個節(jié)點組的距離:

    (4)平均距離:指兩個節(jié)點組中所有節(jié)點距離的平均值所表示的距離:

    其中aibj分別表示a,b兩個節(jié)點組中的節(jié)點。

    (1)基于聚類的的概念相似度計算方法

    目前在不同本體間相似度的計算大多是通過一種綜合的相似度計算方法如通過計算概念名稱的相似度、概念屬性的相似度、概念實例的相似度等通過加權(quán)的方法得到最終的結(jié)果,在和采用單一的計算方法上有了很大的提高。但是在這其中無法避免計算量的增大,而且整個過程中聯(lián)系在一起,使得計算過程十分的復雜。

    針對上述提到的問題,提出了一種基于聚類的概念相似度計算方法,在計算本體相似度時,通過聚類算法將本體O1中的數(shù)據(jù)進行劃分得到幾個數(shù)據(jù)樹,在進行與本體O2的概念B進行相似度計算映射時,如果O1中的A與其的相似度大于給定的閾值,則認為A所在的數(shù)據(jù)樹所有信息與B的相似度大,可以將A所在組的信息所為相似度計算的候選集合,如果小于給定的閾值則在計算機計算過程中忽略不考慮兩者的相似度將其過濾掉。最終可以得到一個完整的相似度計算候選集合,通過相似度計算中用候選集合來進行計算減少本體映射過程的計算量。

    通過確定一個閾值,將本體O1中的概念o和O2中的得到的一組過濾后得到的概念組進行比較計算。過濾后得到的概念組通過概念名稱的相似度進行判斷。假設(shè)本體O1中的概念是X,本體O2中的概念是Y,若果得到的結(jié)果sim(Xname,Yname)大于閾值則X所在的節(jié)點組就成為相似度計算的候選集合,概念X、Y名字相似性度量公式為:

    概念名稱相似度:概念的名稱相似度是最能直接反應(yīng)概念結(jié)構(gòu)也是最基本的方法之一,但是這種方法僅僅作用在字符串上不能很好地將概念的語義信息考慮進去,將名稱按照字符串來計算相似度。常用的方法有Edit Distance,通過計算一個字符串到另一個需要經(jīng)過的插入和刪除等步驟[10]。

    其中ci和cj分別表示O1和O1的概念集合,最終的名稱相似度可表示為:

    概念屬性相似度:概念屬性在一定層次上決定了概念的內(nèi)在結(jié)構(gòu),在進行相似度計算過程中是不能忽略的一部分。而屬性的語義貼近度反映了屬性值之間的相似程度,。屬性x,y的類型相似度記為sp(x,y),它滿足以下三個基本條件[11]:(1)sp(x,y)=1;(2)sp(x,y)=sp(y,x);(3)0≤sp(x,y)≤1。如果兩個屬性的類型相同則相似度較高,類型不同的相似度較小。不同屬性值類型的類型相似度可根據(jù)表1結(jié)果來計算。

    表1

    如不同本體概念A,B分別有多個屬性。要計算A,B的之間的屬性相似度,首先要通過屬性的類型進行類型匹配進行屬性的相似度計算。把可比較的屬性對匹配記為(x1,y1),(x2,y2),…,(xk,yk)(k≤(m,n))。設(shè)A有m個屬性,B有n個屬性,則A與B的屬性相似度計算公式如下[11]:

    概念實例相似度:進行概念的實例相似度計算過程中有以下理論:一個孩子概念的實例也是其父概念和祖先概念的實例。如果概念所具有的實例全部都相同,那么這兩個概念可能是相同的;如果兩個概念具有相同實例的比重是相同的,那么這兩個概念可能是相似的。用具體實例來計算概念C1和C2的相似度,記為:

    基于實例的相似度計算是一種建立在機器學習的基礎(chǔ)上實現(xiàn)的。本體Wi中的實例集合用Ui表示,N(Ui)表示實例集中的實例個數(shù)。用表示既屬于A又屬于B的實例個數(shù)。以P(A,B)為計算用例,有以下六個步驟[12]:

    (1)用U1表示本體W1的全部實例集,分別用和表示屬于A概念的實例集和不屬于A的實例集;

    (3)用U2表示本體W2的全部實例集,分別用和表示屬于B概念的實例集和不屬于B的實例集;

    (5)將兩個本體W1,W2進行位置的互換,重復(1)(2)(3)(4)四個步驟,最終得到p(A,B)和

    (6)求得N(U1),N(U2),求得p

    采用同樣的方式求得:

    然后用公式(3)計算A,B的實例相似度siminstance(A,B)。

    概念關(guān)系相似度:在相似度計算過程中概念的類型關(guān)系和名稱關(guān)系具有重要的作用是不能忽視的。由于類型關(guān)系和名稱關(guān)系都是用字符串來表示的在類型相似度上唯一,所以可以用字符串匹配直接計算[13]。

    其中w1,w2表示權(quán)值,表示關(guān)系和名稱在關(guān)系相似度中起到的作用大小w1+w2=1。

    設(shè)概念A和概念B之間共計算出n個RSim(Si,Tj),權(quán)值為Wi,所以A和B的關(guān)系相似度可有下公式求得,表示為:

    綜合相似度:將上述四個相似度進行合并求和結(jié)果相似度時子相似度的權(quán)值時隨著子子相似度的變化而變化,合并公式如下:

    其中 Xi分別表示 simname(A,B),simproperty(A,B),siminstance(A,B),simrelation(A,B)概念結(jié)構(gòu)的相似度。其中δ表示權(quán)值由函數(shù)sigmoid[14]得到的:

    3 實驗工具與結(jié)果

    在運用一個國際旅游本體和國內(nèi)旅游本體上對該方法進行了實驗:第一組測試數(shù)據(jù)是源本體,該數(shù)據(jù)本體旅游產(chǎn)品針對國內(nèi)旅游進行了描述,第二組測試數(shù)據(jù)是目標本體,該數(shù)據(jù)本體旅游產(chǎn)品針對國際旅游進行了描述。實驗是使用Java語言基礎(chǔ)上在Eclipse IDE環(huán)境和Protege工具軟件完成。將實驗結(jié)果得到的結(jié)果和旅游領(lǐng)域?qū)<抑饔^得到的相似度進行對比如表2。

    表2 實驗結(jié)果

    4 結(jié)語

    文中源本體和目標本體分別是國內(nèi)旅游和國外旅游的本體。由實驗數(shù)據(jù)結(jié)果可知通過相似度計算和權(quán)值的設(shè)定得到源本體的概念映射到目標本體計算出概念相似度的表現(xiàn)力較強,具有較好的分辨能力,實驗表明,本算法在計算概念間相似度方面得到的結(jié)果比較理想。和通過旅游領(lǐng)域?qū)<业玫降慕Y(jié)果相近。本體的引入為解決旅游產(chǎn)品過程中的知識交互、共享混亂等問題提供了新的思路。將旅游產(chǎn)品只是共享融入本體相關(guān)技術(shù),使現(xiàn)有知識、經(jīng)驗知識等共享與重用得到進一步的發(fā)展。

    [1]鄧志鴻,唐世渭,張銘,等.Ontology研究綜述[J].北京大學學報(自然科學版),2002,38(5):730~738

    [2]鄭麗萍.本體映射的研究[D].濟南:山東科技大學,2005

    [3]Perez G A,Benjamins R V.Overview of Knowledge Sharing and Reuse Components:Ontologies and Problem-Solving Methods[A].In:Stockholm V R,Benjamins B,Chandrasekaraneds.Proceedings of the IJCAI-99 Workshop on Ontologies and Problem-Solving Methods (KRRS),1999:1~15

    [4]史忠植.Ontology科技譯名[J].科學術(shù)語研究(季刊),2004,6(4):13~14

    [5]鄧志鴻,唐世渭,張銘,等.Ontology研究綜述[J].北京大學學報(自然科學版),2002,38(5):730~738

    [6]Jiawei Han,Micheline Kamber著.數(shù)據(jù)挖掘概念與技術(shù).范明,孟小峰等譯.北京:機械工業(yè)出版社,2004.1~262

    [7]張承立.基于語義網(wǎng)的語義相似度算法改進[J].計算機工程與應(yīng)用,2006,42(17):165~166

    [8]朱俊武.面向企業(yè)本體復用的語義貼近度算法[J].計算機應(yīng)用研究,2006(10):46~49

    [9]朱莉.基于SVM和sigmoid函數(shù)的字符識別自適應(yīng)學習算法[J].電子技術(shù)應(yīng)用,2006(4)

    [10]Alexnader Meadehe,Boris Motik.Ontologies for Enterpeise Knowledge Management[J].IEEE Intelligent Systemes,2003:26~33

    Ontology;Tourism;Ontology Mapping;Similarity

    Research on the Application of Tourism Product Mapping Based on Ontology

    WANG Wei-dong,ZHANG Lin
    (Shanghai Marititme University,Shanghai 262500)

    1007-1423(2015)17-0054-05

    10.3969/j.issn.1007-1423.2015.17.012

    王衛(wèi)東(1990-),男,安徽黃山人,碩士研究生,研究方向為本體映射在旅游品產(chǎn)中相似度的計算

    2015-04-14

    2015-05-25

    目前旅游信息量大,且在網(wǎng)絡(luò)在分布不均勻。這就導致信息架構(gòu)方法的多樣化,計算機不能很好自動識別旅游信息,使得旅游業(yè)在信息的分享和重用上遇到各式各樣的問題。旅游業(yè)是對信息及時性和可靠性有著高度的依賴行業(yè)。在分析領(lǐng)域需求和旅游信息的基本需求后建立本體,通過一種選取候選集合實現(xiàn)本體映射相似度計算的方法在減少計算量的前提下實現(xiàn)不同本體間的共享和復用。通過一個國內(nèi)和國際的本體進行映射得到的結(jié)果和人們主觀上的結(jié)果相近,驗證這種綜合本體映射相似度在旅游本體上映射的正確性和有效性。

    本體;旅游;本體映射;相似度

    張琳(1973-),女,博士,副教授,碩士生導師,研究方向為港航信息化技術(shù)、智能信息處理、信息檢索、本體與知識工程等

    At present,tourism information of the network and large amount of distributed,heterogeneous computer knowledge,can't understand the semantic information,a large amount of information to achieve better sharing and reuse.The tourism industry is highly depended on the information industry.The establishment of the basic functions of tourism ontology based ontology modeling and analysis of tourism information,by means of an ontology mapping similarity calculation to realize comprehensive sharing and reuse between different ontology.Finally by the domestic and international ontology,the mapping results and effectiveness of the integrated ontology mapping similarity in ontology mapping of tourism.

    猜你喜歡
    實例本體概念
    Abstracts and Key Words
    哲學分析(2023年4期)2023-12-21 05:30:27
    Birdie Cup Coffee豐盛里概念店
    對姜夔自度曲音樂本體的現(xiàn)代解讀
    中國音樂學(2020年4期)2020-12-25 02:58:06
    幾樣概念店
    學習集合概念『四步走』
    聚焦集合的概念及應(yīng)用
    《我應(yīng)該感到自豪才對》的本體性教學內(nèi)容及啟示
    文學教育(2016年27期)2016-02-28 02:35:15
    完形填空Ⅱ
    完形填空Ⅰ
    Care about the virtue moral education
    卷宗(2013年6期)2013-10-21 21:07:52
    文山县| 汽车| 城步| 奉节县| 进贤县| 襄城县| 女性| 泰州市| 甘德县| 武平县| 荥经县| 金坛市| 南溪县| 额尔古纳市| 三穗县| 石家庄市| 滕州市| 洪雅县| 满城县| 同江市| 鄱阳县| 广元市| 万荣县| 清丰县| 红安县| 瑞丽市| 报价| 南昌县| 砚山县| 大宁县| 山阴县| 天祝| 渭南市| 改则县| 靖远县| 南华县| 简阳市| 阿克陶县| 且末县| 灵山县| 德安县|