薛醒思, 王金水
(福建工程學(xué)院信息科學(xué)與工程學(xué)院, 福建 福州 350118)
?
采用雙向個體標(biāo)注的本體匹配技術(shù)
薛醒思, 王金水
(福建工程學(xué)院信息科學(xué)與工程學(xué)院, 福建 福州350118)
針對現(xiàn)實本體中缺乏雙向標(biāo)注的個體而導(dǎo)致的基于個體的本體匹配技術(shù)難以得到廣泛應(yīng)用這一問題, 提出一種采用雙向個體標(biāo)注的本體匹配技術(shù). 該技術(shù)通過進(jìn)化算法實現(xiàn)本體間自動化個體雙向標(biāo)注和概念匹配的過程. 實驗采用OAEI 2012的測試數(shù)據(jù)集, 結(jié)果表明所提出的方法是有效的.
雙向個體標(biāo)注; 進(jìn)化算法; 本體匹配
語義網(wǎng)是萬維網(wǎng)的一個重要發(fā)展方向, 它提供了一個通用框架, 使得數(shù)據(jù)的共享和重用可以跨越應(yīng)用系統(tǒng)、 企業(yè)和社區(qū)的邊界. 在語義網(wǎng)環(huán)境下, 語義層面的交互是所有基于開放知識的系統(tǒng)和分布式系統(tǒng)的設(shè)計中所關(guān)注的重要特性, 也是兩個或多個信息系統(tǒng)在交互的過程中能夠自動地、 準(zhǔn)確地理解彼此通信內(nèi)容的真實含義的能力. 要實現(xiàn)語義層面的交互首先要求對所有數(shù)據(jù)信息的含義進(jìn)行充分的細(xì)節(jié)描述以克服潛在的語義不確定性, 即交互雙方都必須使用一個共享的、 正式的信息交換參考模型.
本體作為語義網(wǎng)的關(guān)鍵組件, 是目前最新的信息交換參考模型, 也是迄今為止用于獲取最準(zhǔn)確的語義規(guī)范化描述的技術(shù). 根據(jù)最常用的本體定義, 本體是概念化的明確的規(guī)范說明, 即對某個領(lǐng)域中存在的對象、 概念、 其他實體以及它們之間關(guān)系的正式的和規(guī)范化描述. 由于語言的快速進(jìn)化(例如舊的術(shù)語可能不斷擁有新的含義), 創(chuàng)建并維護(hù)一個包羅萬象的、 可以滿足所有應(yīng)用系統(tǒng)要求的本體是一個不可能的任務(wù). 因此, 目前在不同的系統(tǒng)中使用的都是由不同的團(tuán)體彼此獨立開發(fā)的本體. 然而, 不同本體設(shè)計者對于某個領(lǐng)域中的相同對象可能會有不同的描述方式(例如, 同一個概念在不同本體中可能會有不同的名字), 這就會導(dǎo)致術(shù)語和概念描述不一致的異質(zhì)本體的產(chǎn)生, 而異質(zhì)本體中存在的語義異質(zhì)問題是實現(xiàn)語義層面交互的最大障礙. 目前, 解決本體異質(zhì)問題的最有效的方法, 是通過執(zhí)行本體匹配過程來檢測并發(fā)現(xiàn)異質(zhì)本體中在語義上相似的實體之間的對應(yīng)關(guān)系, 最終輸出由在語義上相似的實體對組成的本體匹配結(jié)果. 由于本體匹配過程在諸如電子商務(wù)、 知識管理、 信息檢索、 知識獲取、 醫(yī)學(xué)、 生物信息學(xué)等應(yīng)用領(lǐng)域中具有重大的實用價值, 近年來開發(fā)了大量的本體匹配系統(tǒng). 這些本體匹配系統(tǒng)通常將源本體中的每一個實體同目標(biāo)本體中的所有實體進(jìn)行比較, 通過組合不同相似度度量技術(shù)來確定目標(biāo)本體中與其最相似的實體對象.
由于相比其概念的屬性而言, 概念所擁有的個體可以更好地描述其真實的語義, 這使得基于個體的本體匹配技術(shù)引起了廣泛的關(guān)注[1]. 然而, 現(xiàn)實的本體中缺乏同時與兩個本體中的概念都相關(guān)的個體(即雙向標(biāo)注的個體), 因此, 基于個體的本體匹配技術(shù)難以得到廣泛應(yīng)用[2]. 針對這一問題, 本研究提出一種雙向個體標(biāo)注的本體匹配技術(shù). 該技術(shù)通過進(jìn)化算法(evolutionary algorithm, EA)實現(xiàn)待匹配本體中自動的個體的雙向標(biāo)注過程, 并在此基礎(chǔ)上確定本體中概念間的對應(yīng)關(guān)系. 本研究的貢獻(xiàn)如下: ① 在采用雙向個體標(biāo)注的本體匹配技術(shù)中通過引入近似度量方法以降低該技術(shù)對領(lǐng)域?qū)<业囊蕾嚕?② 從雙向個體標(biāo)注角度為本體匹配問題構(gòu)建單目標(biāo)優(yōu)化模型, 并設(shè)計了采用雙向個體標(biāo)注的本體匹配算法以求解該問題; ③ 通過靜態(tài)測試技術(shù)分析實驗結(jié)果, 驗證采用雙向個體標(biāo)注的本體匹配技術(shù)的有效性.
1.1本體與本體映射
定義1[3]本體是一個八元組O=(C, P, I, ≤c, ≤p, φCP, φCI, φPI), 其中: C、 P和I分別指本體中的概念、 屬性和個體的集合, 三者統(tǒng)稱為本體中的實體(entity); ≤c是C的偏序集合, 即類的概念體系結(jié)構(gòu); ≤p是P的偏序集合, 即類的屬性體系結(jié)構(gòu); φCP:P→C×C是將屬性p∈P同概念間的關(guān)系關(guān)聯(lián)起來的函數(shù); φCI:C→R(I)是將概念c∈C同概念c的個體I的子集關(guān)聯(lián)起來的函數(shù); φPI:C→R(I2)是將屬性p∈P同笛卡爾集I×I的自己關(guān)聯(lián)起來的函數(shù), 其中, I×I表示通過屬性p∈P產(chǎn)生關(guān)聯(lián)關(guān)系的個體對.
定義2[3]給定兩個待匹配的本體O1和O2, 本體匹配結(jié)果A是一組k個映射的集合:
其中: ei是本體O1的第i個實體; ej是本體O2的第j個實體; ηl是第l個映射的可信度值; r是實體對ei和ej之間的語義關(guān)系(通常是等價關(guān)系).
1.2本體匹配結(jié)果評價
傳統(tǒng)的評價度量recall、 precision和f-measure最大的缺陷是需要由專家事先給出標(biāo)準(zhǔn)的本體匹配結(jié)果, 而該結(jié)果在實際應(yīng)用中往往是不存在的. 為了解決這一問題, 假定所需要的本體匹配結(jié)果是1 ∶1(即本體中的任何概念只能同另一個本體中的一個概念對應(yīng)), 采用如下的3個近似度量: MatchCover、 MatchRatio和MatchMeasure[4]分別用于近似傳統(tǒng)的recall、 precision和f-measure:
(1)
(2)
(3)
對于本體O1中的某個個體insti, 首先要確定在本體O2同insti相似的個體集合I2, 然后將insti關(guān)聯(lián)到I2中的個體所直接關(guān)聯(lián)的概念上以實現(xiàn)insti的雙向標(biāo)注.
2.1個體相似度度量技術(shù)
基于個體的本體匹配技術(shù)的關(guān)鍵問題之一就是如何度量不同個體之間的相似度[5]. 根據(jù)文獻(xiàn)[6], 兩個個體的相似度可以通過各自屬性值的相似程度來確定. 此外, 考慮到在個體相關(guān)的背景信息未知的前提下, 通過統(tǒng)計個體中屬性間的相似度以進(jìn)一步確定個體間相似度是目前有效的方法之一. 具體地說, 給定兩個個體inst1和inst2, 二者的相似度通過以下公式計算[7]:
(4)
其中:h和k分別是個體inst1和inst2的屬性集合的基數(shù); inst1i和inst2j分別表示inst1中第i個屬性和inst2中第j個屬性; 函數(shù)Sim()用于計算inst1i和inst2j的屬性值的SMOA距離[8-9].
通過上述度量方法可獲取兩個本體O1和O2的個體相似度矩陣S. S的第i行和第j列分別表示O1中的第i個個體和O2中的第j個個體, S的元素Sij表示O1中的第i個個體和O2中的第j個個體的相似度值.
2.2雙向個體標(biāo)注算法
在雙向個體標(biāo)注算法中, 有兩個關(guān)鍵參數(shù)需要確定: ① topN表示前N個同O1中的個體inst1i最相似的O2中的個體可以用于產(chǎn)生inst1i的雙向標(biāo)注; ② instanceThreshold表示只有同inst1i相似度值大于instanceThreshold的O2中的個體可以用于產(chǎn)生inst1i的雙向標(biāo)注. 如何確定這兩個參數(shù)的值對最終產(chǎn)生的本體映射結(jié)果有明顯的影響, 關(guān)于這兩個參數(shù)的討論詳見第4小節(jié).
給定待匹配本體O1和O2的個體相似度矩陣S、 參數(shù)topN和instanceThreshold, 雙向個體標(biāo)注算法的步驟如下: ① 將S中所有小于instanceThreshold的值置0; ② 遍歷S中的所有行, 對每一行的數(shù)值另行按照降序排列, 對排號大于topN的數(shù)值, 將S中相應(yīng)的元素置0; ③ 遍歷S中的所有列, 對每一列的數(shù)值另行按照降序排列, 對排號大于topN的數(shù)值, 將S中相應(yīng)的元素置0; ④ 對S中非零元素對應(yīng)的行和列的個體執(zhí)行雙向標(biāo)注, 例如: S中的元素Sij為非0元素, 則將O1中的個體inst1i關(guān)聯(lián)到O2的個體inst2j所關(guān)聯(lián)的概念, 同樣將O2的個體inst2j關(guān)聯(lián)到O1中的個體inst1i所關(guān)聯(lián)的概念.
通過上述算法, 實現(xiàn)兩個本體間的個體雙向標(biāo)注, 之后首先計算擁有個體的概念間的相似度, 然后通過上下文將相似度擴(kuò)散到?jīng)]有個體的概念間.
根據(jù)文獻(xiàn)[10], 改進(jìn)的Jaccard度量可以有效地計算兩個擁有個體的概念間的相似度. 因此, 采用改進(jìn)的Jaccard度量來計算兩個擁有個體的概念間的相似度:
(5)
其中:Instc1和Instc2分別是同概念c1和c2直接關(guān)聯(lián)的個體集合.
由于本體通常只有葉子節(jié)點的概念有定義個體集合, 為了獲取本體中沒有定義個體集合的概念間的相似度, 需要通過以下公式將相似度在相鄰的概念間進(jìn)行傳播: 給定兩個概念c1、 c2和它們的直接子概念集合Sc1和Sc2, c1和c2間的相似度值通過以下公式來計算[7]:
(6)
在雙向個體標(biāo)注算法中,topN較大意味著inst1i可能同更多的O2中的概念直接關(guān)聯(lián), 從而產(chǎn)生較多的本體中概念間的匹配. 而較小的topN意味著inst1i只會選擇相對更為相似的個體來產(chǎn)生雙向標(biāo)注, 從而保證匹配結(jié)果的準(zhǔn)確性. 較低的instanceThreshold使得inst1i可能同更多的O2中的概念直接關(guān)聯(lián), 隨著instanceThreshold的增加, O2中的個體可以用于產(chǎn)生inst1i的雙向標(biāo)注的選擇性也隨著提升, 產(chǎn)生較少的但是準(zhǔn)確性高的匹配結(jié)果. 這兩個參數(shù)取值的權(quán)衡問題類似于recall和precision之間的權(quán)衡: 當(dāng)想要獲取更高的precision的時候, 需要對結(jié)果有更嚴(yán)格的選擇條件, 這就不可避免地降低了recall的值; 反之亦然, 當(dāng)想要提高recall的值的時候, 必然要放寬結(jié)果的選擇條件, 這又導(dǎo)致了precision值的降低. 因此, 為了動態(tài)地確定最優(yōu)的topN與instanceThreshold以獲取高質(zhì)量的本體匹配結(jié)果, 本研究提出用EA來確定topN與instanceThreshold從而優(yōu)化本體匹配結(jié)果.
4.1本體匹配問題的優(yōu)化模型
本研究希望能夠通過確定雙向個體標(biāo)注算法中的topN和分別用于過濾個體映射結(jié)果和概念映射結(jié)果的instanceThreshold和conceptThreshold來獲取最優(yōu)的本體匹配結(jié)果. 其中, 本體匹配結(jié)果結(jié)果的質(zhì)量度量方法采用的是公式(3)中的MatchMeasure.MatchMeasure的值越大表示獲取的本體匹配結(jié)果越好. 綜上, 提出的本體匹配問題的優(yōu)化模型如下:
(7)
在該模型中,topN與instanceThreshold是雙向個體標(biāo)注算法中的兩個關(guān)鍵參數(shù),conceptThreshold是用于過濾本體匹配結(jié)果中的概念映射, 該模型的目標(biāo)是最大化映射結(jié)果的MatchMeasure值.
表1 進(jìn)化算法偽代碼Tab.1 Pseudocode of evolutionary algorithm
本體匹配問題是一種十分復(fù)雜(非線性問題且有許多局部最優(yōu)解)和耗時(計算數(shù)據(jù)量大)的問題. 尤其當(dāng)本體中的實體規(guī)模龐大的時候, 通常會采用近似的算法來求解本體匹配問題. 從這個角度來看, EA作為一種魯棒性好且尋優(yōu)能力強(qiáng)的全局優(yōu)化方法, 十分適合用于求解本體匹配問題. 表1給出了EA的偽代碼.
4.2編碼機(jī)制
采用實數(shù)編碼, 種群中的每個個體的第1個染色體代表topN, 其取值范圍從0到10; 第2個和第3個染色體分別代表個體和概念的相似度閾值, 取值范圍從0到1.
4.3適應(yīng)度函數(shù)
適應(yīng)度函數(shù)用于評價通過種群個體產(chǎn)生的本體匹配結(jié)果的質(zhì)量. 采用在1.2小節(jié)介紹的近似度量MatchMeasure作為適應(yīng)度函數(shù).
4.4 遺傳算子
1) 選擇算子. 采用賭輪盤選擇算子, 該算子為每一個個體賦予一個正比于它們的適應(yīng)度值的選擇概率, 這就使得適應(yīng)度值最高的個體擁有最高的概率產(chǎn)生下一代個體, 而適應(yīng)度值不是那么高的個體也有機(jī)會產(chǎn)生下一代個體.
2) 交叉算子. 采用單點交叉算子, 首先隨機(jī)地選擇父個體中的一個編碼位作為切割點, 切割點將父個體分為左右兩個部分, 然后通過交換父個體中的右邊的基因來產(chǎn)生新個體.
3) 變異算子. 采用位點變異方法, 如果變異的編碼位是第1位, 則將該編碼位上的數(shù)值隨機(jī)加上一個整數(shù)并取其與10相除后的余數(shù). 如果該變異的編碼位是第2位或是第3位, 按照以下公式進(jìn)行變異:
其中:cnew和cold分別表示變異前與變異后的值,r和rand分別是兩個取值范圍在0到1之間的隨機(jī)數(shù).
實驗采用OAEI 2012[11]測試案例集, 其中, 每個測試案例由一個種子本體根據(jù)不同方法修改獲取的目標(biāo)本體和一個由專家事先給出的參考匹配結(jié)果組成. 表2給出了OAEI 2012測試案例集的簡述.
表2 OAEI 2012測試案例集簡述Tab.2 Brief introduction of OAEI 2012 test cases
實驗中, EA的參數(shù)配置遵循以下原則:
① EA以交叉算子為主, 變異算子為輔. 因此, 交叉概率較大而變異概率較小. 如果交叉概率太大, 則會產(chǎn)生過多的解從而增加了計算量, 變異概率太大使得算法成為隨機(jī)算法, 結(jié)果無法收斂. 建議的交叉概率的取值區(qū)間為[0.2, 1], 而變異概率的取值區(qū)間為[0.01, 0.05]. 通過實驗發(fā)現(xiàn), 交叉概率0.7和變異概率0.02對于測試數(shù)據(jù)集中的各種異質(zhì)問題都能產(chǎn)生可接受的解.
② EA的群體規(guī)模以及算法的終止條件取決于問題的規(guī)模, 建議將取值區(qū)間分別設(shè)為[30, 300]和[200, 1000]. 由于所求解的問題規(guī)模不大, 因此, EA法的群體規(guī)模以及算法的終止條件分別設(shè)置為30個個體和300次適應(yīng)度評價.
綜上, EA算法采用的參數(shù)目的是為了獲取最高的平均匹配結(jié)果質(zhì)量. 通過這種方式獲取的參數(shù)配置對于OAEI 2012測試案例集中所有的測試數(shù)據(jù)是魯棒的, 因此, 也有望對于現(xiàn)實世界中常見的異質(zhì)問題是魯棒的. 實驗中, EA的參數(shù)配置如下:
數(shù)值精度=0.01, 群體規(guī)模=40個個體, 交叉概率=0.7, 變異概率=0.02, 最大代數(shù)=300
為了同前沿的本體匹配系統(tǒng)比較, 將已獲取的本體匹配結(jié)果用傳統(tǒng)的評價度量recall、 precision和f-measure重新評價. 表3中描述了本方法同前沿的本體匹配系統(tǒng)eTuner[12]和GOAL[13]的比較結(jié)果.
在表3中, 1XX、 2XX和3XX分別代表表2中的編號以1、 2和3開始的測試案例集, 符號R、P和f分別表示recall、 precision和f-measure, 表中的數(shù)值是相應(yīng)的測試數(shù)據(jù)集匹配結(jié)果評價的均值. 本方法的結(jié)果是在30次獨立運行后的平均結(jié)果. 在前沿的本體匹配系統(tǒng)中, 本研究選擇eTuner和GOAL的原因如下: ① eTuner采用自動化調(diào)諧參數(shù)的技術(shù), 但它是基于枚舉搜索的策略; ② GOAL同本文提出的方法類似, 是著名的基于EA的本體匹配系統(tǒng). 實驗比較的過程由兩個步驟組成: ① 通過靜態(tài)測試技術(shù), 即Friedman測試[14], 判斷是否比較的系統(tǒng)產(chǎn)生的結(jié)果之間存在差異; ② 如果第一個步驟判斷出比較的系統(tǒng)間存在差異, 則執(zhí)行后續(xù)的靜態(tài)測試, 即Holm測試[15], 以確定性能較優(yōu)的系統(tǒng).
Friedman測試是一種無參數(shù)的靜態(tài)測試過程, 致力于檢測兩個或兩個以上的算法之間是否存在明顯的行為差異. 具體地說, 該測試假設(shè)所有的算法都是等價的, 對這一假定的否決意味著被研究的算法間存在差異. 為了否決Friedman測試的假設(shè), 計算的χr的值必須等于或大于在特定級別的卡方臨界值[16]. 實驗中, 級別α=0.05. 由于比較的是3個本體匹配方法, 因此, 分析的過程需要考慮自由度為二的臨界值χ0.05, 該臨界值為5.991. 表3中圓括號中的數(shù)字是該結(jié)果相應(yīng)的排名. 通過執(zhí)行Friedman測試, 計算的χr的值是44.53. 由于χr的值大于χ0.05, Friedman的假設(shè)被否決, 因此, 比較的3個本體匹配系統(tǒng)之間可能存在明顯的差異.
根據(jù)這一結(jié)果, 需要執(zhí)行后續(xù)的關(guān)于系統(tǒng)間成對比較的靜態(tài)測試. Holm測試先要選擇一個控制算法, 并將其同其余的算法進(jìn)行比較. 一般情況下, 控制算法是在Friedman測試中排名值最低的算法. 從表3中的最后一行的平均值可以看出, 本方法排名值最低.
表3 本方法同前沿的本體匹配系統(tǒng)的比較Tab.3 Comparison between the state-of-the-art ontology matching systems and our approach
Holm測試在比較第i和第j算法的時候, 指定使用z值來從正態(tài)分布表中確定相關(guān)的概率(即p值), 然后將p值同級別參數(shù)α(實驗中α=0.05)進(jìn)行比較. Holm測試的結(jié)果在表4中給出. 通過表4中的數(shù)據(jù), 可以得出以下結(jié)論: 本方法在5%級別上靜態(tài)優(yōu)于eTuner和GOAL.
表4 Holm測試Tab.4 Holm’s test
本體匹配是本體工程中的重要步驟, 然而本體匹配過程中仍然有許多問題有待解決. 其中一個問題是由于現(xiàn)實的本體中缺乏雙向標(biāo)注的個體, 使得基于個體的本體匹配技術(shù)難以得到廣泛的應(yīng)用. 為此, 提出一種雙向個體標(biāo)注的本體匹配技術(shù), 該技術(shù)通過EA來實現(xiàn)本體間自動化個體雙向標(biāo)注和概念匹配的過程. 實驗采用OAEI 2012的測試數(shù)據(jù)集, 同前沿的本體匹配系統(tǒng)的結(jié)果比較表明本方法是有效的.
由于本研究提出的近似度量MatchCover、 MatchRatio和MatchFmeasure的前提條件是一種非常強(qiáng)的約束(標(biāo)準(zhǔn)匹配結(jié)果是1 ∶1), 該前提使得這些度量不適用于標(biāo)準(zhǔn)匹配結(jié)果是m∶n的應(yīng)用場景. 關(guān)于如何設(shè)計不依賴標(biāo)準(zhǔn)匹配結(jié)果且具有更好的普適性的本體匹配結(jié)果的質(zhì)量度量方法是未來需要解決的問題.
[1] WANG Z, LI J, ZHAO Y,etal. A unified approach to matching semantic data on the Web[J]. Knowledge-Based Systems, 2013, 39: 173-184.
[2] THOR A, KIRSTEN T, RAHM E. Instance-based matching of hierarchical ontologies[C]//BTW. Aachen: [s.n.], 2007: 436-448.
[3] ACAMPORA G, LOIA V, VITIELLO A. Enhancing ontology alignment through a memetic aggregation of similarity measures[J]. Information Sciences, 2013, 250: 1-20.
[4] KIRSTEN T, THOR A, RAHM E. Instance-based matching of large life science ontologies[C]//Proceeding of 10th International Conference on Data Integration in the Life Sciences. Philadelphia: [s.n.], 2007: 172-187.
[5] DUAN S, FOKOUE A, HASSANZADEH O,etal. Instance-based matching of large ontologies using locality-sensitive hashing[M]. Boston: Springer, 2012: 49-64.
[6] RONG S, NIU X, XIANG E W,etal. A machine learning approach for instance matching based on similarity metrics[M]. Boston: Springer, 2012: 460-475.
[7] ENGMANN D, MASSMANN S. Instance matching with coma++[C]// BTW. Aachen: [s.n.], 2007: 28-37.
[8] STOILOS G, STAMOU G, KOLLIAS S. A string metric for ontology alignment[M]. Galway: Springer, 2005: 624-637.
[9] WINKLER W E. The state of record linkage and current research problems: RR99/04[R]. Washington DC: Statistical Research Division, US Census Bureau, 1999.
[10] ISAAC A, VAN DER MEIJ L, Schlobach S,etal. An empirical study of instance-based ontology matching[M]. Busan: Springer, 2007: 253-266.
[11] AGUIRRE J L, GRAU B C, ECKERT K,etal. Results of the ontology alignment evaluation initiative 2012[C]//Proceeding of 7th ISWC Workshop on Ontology Matching. Boston: [s.n.], 2012: 73-115.
[12] LEE Y, SAYYADIAN M, DOAN A H,etal. eTuner: tuning schema matching software using synthetic scenarios[J]. The VLDB Journal-The International Journal on Very Large Data Bases, 2007, 16(1): 97-122.
[13] MARTINEZ-GIL J, ALBA E, ALDANA-MONTES J F. Optimizing ontology alignments by using genetic algorithms[C]//Proceedings of The Workshop on Nature Based Reasoning for The Semantic Web. Karlsruhe: [s.n.], 2008: 1-14, .
[14] GARCIA S, MOLINA D, LOZANO M,etal. A study on the use of non-parametric tests for analyzing the evolutionary algorithms’ behaviour: a case study on the CEC’2005 special session on real parameter optimization[J]. Journal of Heuristics, 2009, 15(6): 617-644.
[15] HOLM S. A simple sequentially rejective multiple test procedure[J]. Scandinavian Journal of Statistics, 1979 (6): 65-70.
[16] NASH M S. Handbook of parametric and nonparametric statistical procedures[J]. Technometrics, 2001, 43(3): 374-374.
(責(zé)任編輯: 沈蕓)
An ontology matching technology usingdually individual annotation
XUE Xingsi, WANG Jinshui
(College of Information Science and Engineering, Fujian University of Technology, Fuzhou, Fujian 350118, China)
Since individuals can better represent the real semantics of the concept they belong to, individual based ontology matching technology is able to improve the precision of the ontology alignment. However, in the real scenarios, the lack of the dually annotated individuals seriously limits the application of the individual based ontology matching technology. To overcome this shortcoming, in this paper, an ontology matching technology using dually individual annotation is proposed. In particular, our proposal utilizes the evolutionary algorithm (EA) to implement the process of automatic dually individual annotation and concept matching. The experiment uses the OAEI 2012 benchmarks, and the results show the effectiveness of our proposal.
dually instances annotation; evolutionary algorithm; ontology matching
10.7631/issn.1000-2243.2016.01.0064
1000-2243(2016)01-0064-07
2014-11-14
薛醒思(1981-), 講師, 主要從事智能計算與本體匹配技術(shù)研究, jack8375@gmail.com
國家自然科學(xué)基金資助項目(61503082, 61402108); 福建工程學(xué)院校科研啟動基金(GY-Z15007)
TP182
A