摘要: 為能準(zhǔn)確且快捷地驗(yàn)證地理鏈接數(shù)據(jù)多重實(shí)體空間拓?fù)潢P(guān)系的完整性, 提出一種基于RCC8模型的飽和推理方法, 用于檢驗(yàn)多重空間拓?fù)潢P(guān)系是否具有沖突
. 該方法應(yīng)用推理規(guī)則, 將關(guān)系對(duì)進(jìn)行兩兩組合推理, 逐步推導(dǎo)出潛在空間關(guān)系并對(duì)推理結(jié)果進(jìn)行檢驗(yàn), 不斷重復(fù)以上過(guò)程, 直到確保推理過(guò)程在所有關(guān)系對(duì)均被推
導(dǎo)后終止. 在此基礎(chǔ)上, 封裝一個(gè)基于RCC8 模型的飽和推理驗(yàn)證組件, 以方便使用者在無(wú)需重復(fù)編寫(xiě)代碼的情況下, 通過(guò)直接調(diào)用組件驗(yàn)證多重空間拓?fù)潢P(guān)系. 利用該方法
和組件對(duì)SLIPO項(xiàng)目的鏈接數(shù)據(jù)集的部分?jǐn)?shù)據(jù)進(jìn)行測(cè)試, 成功識(shí)別出GeoSHACL組件無(wú)法檢測(cè)到的多個(gè)空間拓?fù)潢P(guān)系沖突實(shí)體.
關(guān)鍵詞: 地理鏈接數(shù)據(jù); 空間完整性約束; 飽和式推理; 完整性驗(yàn)證; 空間約束組件
中圖分類(lèi)號(hào): TP181" 文獻(xiàn)標(biāo)志碼: A" 文章編號(hào): 1671-5489(2025)01-0060-07
Spatial Topological Integrity Verificationof Geographic Linked Data
LU Yubo, YE Yuxin, OUYANG Dantong
(College of Computer Science and Technology, Jilin University, Changchun 130012, China;
Key Laboratory of Symbolic Computation and Knowledge Engineering of Ministry of Education, Jilin University, Changchun 130012, China)
收稿日期: 2024-12-10.
第一作者簡(jiǎn)介: 盧禹博(2001—), 男, 漢族, 碩士研究生, 從事知識(shí)圖譜和時(shí)空推理的研究, E-mail: luyb23@mails.jlu.edu.cn.
通信作者簡(jiǎn)介: 葉育鑫(1981—), 男, 漢族, 博士, 教授, 博士生導(dǎo)師, 從事人工智能和邏輯推理的研究, E-mail: yeyx@jlu.edu.cn.
基金項(xiàng)目: 吉林省科技廳基礎(chǔ)研究項(xiàng)目(批準(zhǔn)號(hào): 20220101114JC).
Abstract: In order to accurately and quickly verify the integrity of multiple entity spatial topological relationships in geographic linked data,
we proposed a saturation reasoning method based on the RCC8 model to detect whether multiple spatial topological relationships had conflicts. The method applied
reasoning rules to perform pairwise combination reasoning of relationship pairs, gradually inferring potential spatial relationships and verifying the reasoning results.
The above process was repeated continuously until it was ensured that the reasoning process terminated after all relationship pairs had been fully derived.
On this basis, we encapsulated" a saturation reasoning verification component based on RCC8 model to facilitate" users in verifying" multiple spatial topological relationships
without the need for repetitive coding by directly invoking the component. By using the method and component to test" partial data from the linked dataset of the SLIPO project,
multiple" spatial topological conflict entities that the GeoSHACL component could not detect were successfully identified.
Keywords: geographic linked data; spatial integrity constraint; saturation reasoning; integrity verification; spatial constraint component
隨著信息技術(shù)的快速發(fā)展, 地理信息系統(tǒng)(GIS)與鏈接數(shù)據(jù)逐漸結(jié)合, 形成了新的數(shù)據(jù)處理和共享模式. 鏈接數(shù)據(jù)通過(guò)標(biāo)準(zhǔn)化的語(yǔ)義網(wǎng)技術(shù), 使地理信息能跨平臺(tái)、 跨領(lǐng)域
地共享和重用[1-2]. 空間推理作為GIS的重要組成部分, 在地理信息處理和時(shí)空推理領(lǐng)域應(yīng)用廣泛, 涉及時(shí)態(tài)數(shù)據(jù)庫(kù)、 計(jì)算機(jī)輔助設(shè)計(jì)(CAD)等多領(lǐng)
域[3-4]. 但隨著數(shù)據(jù)規(guī)模的擴(kuò)大和復(fù)雜性的提升, 數(shù)據(jù)完整性問(wèn)題逐漸突出, 尤其是空間實(shí)體間關(guān)系的完整性. 因此, 需根據(jù)空間實(shí)體的語(yǔ)義, 檢驗(yàn)它們之間的拓?fù)潢P(guān)系是否正確[5].
用戶(hù)通常使用SHACL和GeoSPARQL等標(biāo)準(zhǔn)及GeoSHACL組件檢查實(shí)體的空間拓?fù)潢P(guān)系是否正確. GeoSPARQL為通過(guò)RDF(resource description framework)描述的地理空間數(shù)據(jù)提供了
通用的表示方法, 支持包括簡(jiǎn)單要素關(guān)系和RCC8在內(nèi)的空間拓?fù)潢P(guān)系的標(biāo)準(zhǔn)化描述和查詢(xún)[6]. 形狀約束語(yǔ)言(S
HACL)作為萬(wàn)維網(wǎng)聯(lián)盟(W3C)推薦的標(biāo)準(zhǔn), 專(zhuān)注于驗(yàn)證RDF數(shù)據(jù)圖結(jié)構(gòu)是否符合特定要求[7]. SHACL區(qū)分了兩種RDF圖: 一種是需要驗(yàn)證的數(shù)據(jù)圖, 另一種是描述約束的
形狀圖[8]. SHACL關(guān)注數(shù)據(jù)的結(jié)構(gòu)完整性, 主要用于驗(yàn)證RDF圖中節(jié)點(diǎn)是否符合預(yù)定義的形狀約束.
在最新的GeoSPARQL1.1標(biāo)準(zhǔn)中已提出了一些SHACL約束形狀[9], 但這些形狀主要集中于驗(yàn)證圖結(jié)構(gòu)的正確性, 關(guān)注了需要被驗(yàn)證的地理空間鏈接數(shù)據(jù)的圖結(jié)構(gòu)是否
符合特定要求, 未能深入檢驗(yàn)空間實(shí)體間拓?fù)潢P(guān)系的正確性和完整性. 為解決該問(wèn)題," GeoSHACL[10]通過(guò)為地理空間數(shù)據(jù)的驗(yàn)證提供擴(kuò)展功能, 使其能
支持基于GeoSPARQL中定義的簡(jiǎn)單要素檢驗(yàn)空間實(shí)體間的拓?fù)潢P(guān)系. 但GeoSHACL的現(xiàn)有形狀主要集中于驗(yàn)證單一空間拓?fù)潢P(guān)系, 缺乏對(duì)多重空間拓?fù)潢P(guān)系推理與驗(yàn)證的支持, 將
導(dǎo)致在面臨多重空間拓?fù)潢P(guān)系時(shí), 無(wú)法有效評(píng)估這些空間實(shí)體拓?fù)潢P(guān)系之間的整體完整性. 此外, 雖然GeoSPARQL定義了包括RCC8在內(nèi)的空間關(guān)系模型, 但GeoSHACL尚未實(shí)現(xiàn)對(duì)RCC8
約束的支持, 使現(xiàn)有驗(yàn)證方法在多重空間拓?fù)潢P(guān)系推理場(chǎng)景下性能欠佳.
RCC8是一套專(zhuān)門(mén)用于描述面狀空間實(shí)體之間拓?fù)潢P(guān)系的模型, 包含8種彼此互斥且完全覆蓋的關(guān)系類(lèi)型. 彼此互斥是指兩個(gè)空間區(qū)域之間的關(guān)系只會(huì)滿(mǎn)足其中一個(gè)拓?fù)潢P(guān)系, 而不會(huì)同
時(shí)滿(mǎn)足多個(gè); 完全覆蓋是指對(duì)任意兩個(gè)面狀空間實(shí)體, 總能在RCC8的關(guān)系中找到一個(gè)準(zhǔn)確描述它們之間關(guān)系的類(lèi)型[11]. RCC8推理已在多領(lǐng)域中得到廣泛研究, 如
簡(jiǎn)單凹形區(qū)域間空間關(guān)系的表示方法及推理模型[12], 使用RCC8進(jìn)行定性空間推理研究[13-14], 定性概念空間中關(guān)于層級(jí)關(guān)系和RCC8約
束的推理[15], 在OWL(ontology Web language)中實(shí)現(xiàn)RCC8并結(jié)合SWRL(semantic Web rule language)
規(guī)則在衛(wèi)星圖像中進(jìn)行空間推理[16]等. 但這些研究主要關(guān)注于描述和分析空間拓?fù)潢P(guān)系, 而非直
接用于驗(yàn)證多重空間拓?fù)潢P(guān)系的完整性.
在現(xiàn)有標(biāo)準(zhǔn)中, 用戶(hù)通常需要根據(jù)具體場(chǎng)景和需求自定義約束確保鏈接數(shù)據(jù)的完整性. 但這些約束通常是相似的, 導(dǎo)致重復(fù)“造輪子”的問(wèn)題. GeoSHACL組件的設(shè)計(jì)初衷正是為
簡(jiǎn)化該過(guò)程, 并解決這種低效問(wèn)題. GeoSHACL組件的主要優(yōu)點(diǎn)是其模塊化和可重用性, 它為使用者提供了一個(gè)強(qiáng)大的工具集, 既不需要從頭開(kāi)始構(gòu)建復(fù)雜的驗(yàn)證邏輯, 也并不
需要理解組件的代碼結(jié)構(gòu), 只需通過(guò)簡(jiǎn)單調(diào)用現(xiàn)有的組件, 便可輕松實(shí)現(xiàn)空間數(shù)據(jù)的完整性驗(yàn)證. 該方法不僅降低了開(kāi)發(fā)門(mén)檻, 還極大提高了工作效率, 避免了重復(fù)工作和潛在的錯(cuò)
誤. 除本文介紹的GeoSHACL組件外, 許多其他領(lǐng)域的組件也發(fā)揮著重要作用, 并為不同應(yīng)用場(chǎng)景提供了高效的解決方案, 以MapWindow ActiveX組件為例, 它不僅具有開(kāi)源許可, 并
且還在污染場(chǎng)地規(guī)劃和評(píng)估中得到廣泛應(yīng)用[17]. GEOL-QMAPS是一個(gè)基于QGIS的開(kāi)源解決方案, 旨在促進(jìn)數(shù)字地質(zhì)測(cè)繪的標(biāo)準(zhǔn)化和靈活應(yīng)用[18]
. 海岸動(dòng)力分析器(CDA)也是一個(gè)QGIS插件, 通過(guò)自動(dòng)計(jì)算海岸線(xiàn)變化指標(biāo), 顯著提升了海岸侵蝕研究的效率和準(zhǔn)確性[19]. 這些組件的共同優(yōu)勢(shì)是它們的開(kāi)源性質(zhì)、
模塊化設(shè)計(jì)以及高度的可擴(kuò)展性, 使得使用者能輕松地根據(jù)自己的需求定制和部署解決方案. 此外, 組件的重復(fù)使用性也使開(kāi)發(fā)過(guò)程更高效, 減少了不同項(xiàng)目之間的重復(fù)工作,
增強(qiáng)了軟件工具的兼容性和長(zhǎng)期可維護(hù)性.
因此, 為能準(zhǔn)確且快捷地驗(yàn)證地理鏈接數(shù)據(jù)的多重實(shí)體空間拓?fù)潢P(guān)系的完整性, 本文提出采用空間拓?fù)潢P(guān)系復(fù)合表RCC8做完整性約束, 并利用飽和式推理進(jìn)行空間拓?fù)潢P(guān)系沖突的
自動(dòng)檢驗(yàn)和識(shí)別. 此外, 還設(shè)計(jì)并實(shí)現(xiàn)了一個(gè)可重用的多重空間拓?fù)渫暾则?yàn)證組件. 通過(guò)實(shí)際案例驗(yàn)證了該方法的有效性及其組件產(chǎn)品在地理鏈接數(shù)據(jù)完整性驗(yàn)證中的高效性.
1 基于飽和式推理的空間完整性驗(yàn)證
1.1 空間拓?fù)渫评硪?guī)則設(shè)計(jì)
開(kāi)放地理空間聯(lián)盟于2012年提出了地理空間數(shù)據(jù)的標(biāo)準(zhǔn)語(yǔ)言GeoSPARQL[20], 用于空間對(duì)象及其拓?fù)潢P(guān)系的語(yǔ)義描述和查詢(xún). GeoSPARQL預(yù)定義了多個(gè)不同拓?fù)潢P(guān)系
模型(如RCC8[11]和Inter9等模型)的拓?fù)湓~匯表, 涵蓋了常用的簡(jiǎn)單空間拓?fù)潢P(guān)系. 主要包含sfDisjoint,sfTouches,sfEquals,sfOverlaps,sfWithin
,sfContains等關(guān)系, 其中RCC8模型提供了較細(xì)致的空間關(guān)系分類(lèi), 包含8個(gè)互斥且完全覆蓋的關(guān)系, 使其在特定應(yīng)用中能提供更高的精確性和清晰度. 在此基礎(chǔ)上, GeoSHACL作
為基于GeoSPARQL的約束組件, 專(zhuān)注于空間對(duì)象的完整性約束表示, 進(jìn)一步支持空間拓?fù)浼s束的共享和重用[10]. 目前, GeoSHACL已支持空間對(duì)象屬性和單一拓?fù)涞?/p>
完整性約束定義和驗(yàn)證, 尚未提供對(duì)多個(gè)拓?fù)潢P(guān)系完整性約束的統(tǒng)一定義方式和驗(yàn)證方法. 本文給出多重空間拓?fù)潢P(guān)系定義.
定義1(多重空間拓?fù)潢P(guān)系)
設(shè)A,B,C,…是空間中的不同實(shí)體對(duì)象, R1,R2,…是關(guān)于實(shí)體對(duì)
象間的拓?fù)潢P(guān)系描述. 如果給出拓?fù)潢P(guān)系集合的基數(shù)不少于1, 則該描述稱(chēng)為關(guān)于不同實(shí)體對(duì)象A,B,C,…的多重空間拓?fù)潢P(guān)系.
本文考慮的主要問(wèn)題是多重空間拓?fù)潢P(guān)系的完整性驗(yàn)證. 給定一個(gè)實(shí)體對(duì)象集合, 其中包含多個(gè)空間實(shí)體(如A,B,C等)及其相互之間的拓?fù)潢P(guān)系, 當(dāng)A和B之間、 B和C
之間均存在某種拓?fù)潢P(guān)系時(shí), 需要驗(yàn)證兩組關(guān)系的復(fù)合是否與A,C間預(yù)設(shè)的拓?fù)潢P(guān)系一致.
定義2(多重空間拓?fù)潢P(guān)系的完整性)
給定一組多重空間拓?fù)潢P(guān)系和一組空間拓?fù)潢P(guān)系復(fù)合規(guī)則. 如果該組多重空間拓?fù)潢P(guān)系滿(mǎn)足該組空間拓?fù)?/p>
關(guān)系復(fù)合規(guī)則, 則稱(chēng)該組關(guān)系是空間拓?fù)渫暾?
多重空間拓?fù)潢P(guān)系的完整性驗(yàn)證在實(shí)際應(yīng)用中常見(jiàn), 它能揭示實(shí)體間潛在的拓?fù)潢P(guān)系, 并確??臻g關(guān)系的邏輯一致性和空間數(shù)據(jù)的正確性. 采用飽和推理機(jī)制能將新推導(dǎo)出的拓
撲關(guān)系不斷添加到數(shù)據(jù)集中, 直到無(wú)法產(chǎn)生新的關(guān)系[21]. RCC8是一個(gè)經(jīng)典的拓?fù)潢P(guān)系復(fù)合模型, 在GeoSPARQL和GeoSHACL等空間鏈接數(shù)據(jù)標(biāo)準(zhǔn)語(yǔ)言中被標(biāo)準(zhǔn)化和廣泛
采用. 本文以RCC8拓?fù)潢P(guān)系復(fù)合模型為完整性約束要求, 結(jié)合飽和推理機(jī)制設(shè)計(jì)一系列推理規(guī)則, 以識(shí)別和補(bǔ)全空間數(shù)據(jù)中的隱含信息. 這些推理規(guī)則不僅要考慮實(shí)體簡(jiǎn)單要素的關(guān)系, 也要融入RCC8模型的拓?fù)潢P(guān)系.
推理規(guī)則的具體設(shè)計(jì)和實(shí)現(xiàn)如下: 假設(shè)空間實(shí)體A和B之間的拓?fù)潢P(guān)系為R1, 表示為R1(A,B), 空間實(shí)體B和C之間的拓?fù)潢P(guān)系為R2
, 表示為R2(B,C), 可以推理出空間實(shí)體A和C之間的關(guān)系為R3, 表示為R3(A,C). 根據(jù)RCC8關(guān)系組合表可知, R3可能為確定的單一關(guān)系, 例如若R
1為EC, R2為EQ, 則R3為EC; R3也可能為不確定的多種關(guān)系, 例如若R1為EC, R2為NPP, 則R3為PO或TPP或NPP. RCC8的拓?fù)潢P(guān)系
復(fù)合表中共有64種組合, 其中有27種組合為確定的拓?fù)潢P(guān)系, 有37種組合為不確定的拓?fù)潢P(guān)系.
對(duì)確定的組合, 可以寫(xiě)出如下的推理規(guī)則, 即拓?fù)潢P(guān)系R1,R2組合產(chǎn)生唯一確定的拓?fù)潢P(guān)系R3: R1(A,B)∧R2(B,C)→R3(A,C).
對(duì)不確定的組合, 無(wú)法直接在規(guī)則中表示, 因?yàn)樵庸降奈鋈〔荒茏鳛橐?guī)則頭. 為解決該問(wèn)題, 本文通過(guò)引入輔助變量表示拓?fù)潢P(guān)系的析取. 例如,
輔助變量rcc8tpp_rcc8tppi可用于表示關(guān)系rcc8tpp和rcc8tppi的析取. 因此, 關(guān)于rcc8tpp和rcc8tpp關(guān)系組合的不確定推理規(guī)則可表示為: rcc8tpp(A,B)∧rcc8tpp(B,C)→rcc8tpp_rcc8tppi(A,C).
1.2 空間拓?fù)渫暾则?yàn)證算法
首先, 程序初始化多重空間拓?fù)潢P(guān)系集和RCC8復(fù)合推理規(guī)則集, 并將沖突關(guān)系集置為空. 其次, 逐一查找包含公共實(shí)體的關(guān)系對(duì), 根據(jù)RCC8規(guī)則推導(dǎo)出這些關(guān)系對(duì)復(fù)合后的可能
關(guān)系集合. 最后, 從多重空間拓?fù)潢P(guān)系集中提取與推導(dǎo)結(jié)果相關(guān)的實(shí)體對(duì), 并驗(yàn)證這些實(shí)體對(duì)是否已存在于關(guān)系集中. 如果已存在實(shí)體對(duì), 則進(jìn)一步獲取其在關(guān)系集中的空間關(guān)系, 并
與推導(dǎo)出的關(guān)系進(jìn)行比較. 如果發(fā)現(xiàn)兩者存在沖突, 則將沖突的空間關(guān)系記錄到?jīng)_突關(guān)系集中. 空間拓?fù)渫暾运惴ㄈ缦?
算法1
空間拓?fù)涞耐暾则?yàn)證.
輸入: 多重空間拓?fù)潢P(guān)系set, RCC8復(fù)合推理規(guī)則集RCC8_rules;
輸出: 沖突關(guān)系集conflict_set;
initial(set); //初始化多重空間拓?fù)潢P(guān)系set
initial(RCC8_rules); //初始化RCC8復(fù)合推理規(guī)則集
conflict_set=; //初始化沖突的關(guān)系集為空
for i≠jRi,Rj∈set do
if x.(x∈Ri and x∈Rj) //如果空間關(guān)系Ri,Rj存在公共實(shí)體
Rk_set←match(RCC8_rules,Ri,Rj);"" //根據(jù)Ri,Rj匹配RCC8_rules, 推出可能的關(guān)系集Rk_set
entities_pair←get_entities_pair(Rk_set); //根據(jù)Rk_set得到對(duì)應(yīng)的實(shí)體對(duì)
if entities_pair∈get_entities_pair(set) then
//檢測(cè)實(shí)體對(duì)是否出現(xiàn)在集合set的實(shí)體對(duì)集合中
Rs_set←relations(entities_pair,set);"""" //獲取實(shí)體對(duì)在set中的所有可能的空間關(guān)系Rs_set
if Rk_set ∩Rs_set= then //若Rk_set∩Rs_set為空, 則有沖突
conflict_set←conflict_set∪(Rs_set∩set); //將Rs_set∩set加入到?jīng)_突的關(guān)系集中
定理1(算法的推理復(fù)雜度)
假設(shè)多重空間拓?fù)潢P(guān)系的基數(shù)為n, 則空間拓?fù)渫暾则?yàn)證算法1的推理復(fù)雜度為O(n2).
證明: 假設(shè)有n個(gè)空間實(shí)體關(guān)系, 每次推理需要從n個(gè)實(shí)體關(guān)系中任選兩個(gè)關(guān)系進(jìn)行規(guī)則匹配. 因此, 最多需要進(jìn)行12n(n-1)次不同的推理. 故該算法的時(shí)間漸近復(fù)雜度為O(n2).
2 可重用組件的設(shè)計(jì)與實(shí)現(xiàn)
GeoSHACL設(shè)計(jì)有兩個(gè)決策: 不假設(shè)轉(zhuǎn)換規(guī)則已經(jīng)啟用和比較幾何體的詞法表示[10], 這兩條決策都存在缺陷.
對(duì)第一條決策, 該假設(shè)使GeoSHACL在處理幾何數(shù)據(jù)時(shí)面臨一定的局限性. 當(dāng)使用者使用GeoSHACL進(jìn)行驗(yàn)證時(shí), 如果幾何體的表示不符合預(yù)期的標(biāo)準(zhǔn)格式, 則驗(yàn)證過(guò)
程可能會(huì)出現(xiàn)問(wèn)題. 例如, 假設(shè)使用者希望驗(yàn)證兩個(gè)幾何體之間的空間關(guān)系, 但這些幾何體的表示形式并不一致, 或者使用了不同的坐標(biāo)系. 在這種情形下, 由于不假設(shè)轉(zhuǎn)換規(guī)則已經(jīng)啟用, GeoSHACL無(wú)法
自動(dòng)處理這些差異, 導(dǎo)致驗(yàn)證結(jié)果不準(zhǔn)確. 此外, 這也要求使用者在調(diào)用組件時(shí), 對(duì)幾何數(shù)據(jù)的格式和標(biāo)準(zhǔn)有更深入的理解, 以便能確保數(shù)據(jù)的完整性.
對(duì)另一條決策, 在調(diào)用GeoSHACL組件時(shí), 如果傳入的實(shí)參是一個(gè)幾何常量, 驗(yàn)證器可直接使用拓?fù)浜瘮?shù)進(jìn)行比較. 但如果傳入的是一個(gè)謂詞路徑, 情況就變得復(fù)雜了. 長(zhǎng)
的謂詞路徑可能會(huì)使幾何文本的定位更困難, 不僅增加了查詢(xún)的復(fù)雜性, 還要求使用者對(duì)數(shù)據(jù)有足夠的了解, 才能準(zhǔn)確構(gòu)建出有效的謂詞路徑. 這種依賴(lài)于使用者對(duì)數(shù)據(jù)模型
的熟悉程度, 可能會(huì)導(dǎo)致錯(cuò)誤或遺漏, 從而影響驗(yàn)證的準(zhǔn)確性和效率.
在設(shè)計(jì)組件時(shí), 本文將具體的SPARQL查詢(xún)語(yǔ)句封裝在內(nèi)部, 以簡(jiǎn)化使用者的使用過(guò)程, 使用者無(wú)需深入了解底層的查詢(xún)實(shí)現(xiàn), 即可直接調(diào)用這個(gè)組件. 這種封裝方式不僅提高了組件
的可用性, 還降低了使用門(mén)檻, 使即使不熟悉SPARQL的使用者也能方便地進(jìn)行空間數(shù)據(jù)驗(yàn)證.
此外, GeoSHACL標(biāo)準(zhǔn)采用了ASK查詢(xún)模式, 這種方式的優(yōu)點(diǎn)是其簡(jiǎn)單明了, 直接返回布爾值, 適合快速檢查某一特定條件是否滿(mǎn)足. 但ASK的局限性是它無(wú)法提供關(guān)于
查詢(xún)結(jié)果的詳細(xì)信息, 即如果查詢(xún)返回true, 則使用者并不能獲得滿(mǎn)足條件的具體數(shù)據(jù)或?qū)嶓w.
相比之下, 本文封裝的組件使用SELECT查詢(xún)模式. 這一選擇使使用者不僅可以判斷條件是否滿(mǎn)足, 還能獲得符合條件的詳細(xì)信息, 如相關(guān)的空間實(shí)體及其屬性. 這種方法的優(yōu)
勢(shì)在于, 它為使用者提供了更豐富的上下文信息, 便于進(jìn)行后續(xù)的數(shù)據(jù)分析和處理. 此外, 使用SELECT查詢(xún)還可以實(shí)現(xiàn)更復(fù)雜的數(shù)據(jù)提取和組合, 增強(qiáng)了組件的靈活性和適用性. 組件核心代碼示例下.
1 sh: nodeValidator [
2"" sh: select “““
3"" SELECT $this
4"" WHERE {
5"""" $this geo: rcc8dc ?s.
6"""" ?s geo: rcc8eq ?o.
7"""" FILTER NOT EXISTS {
8"""""" $this geo: rcc8dc ?o.
9""""""" }
10"""" }
11"""" ”””;
12"" ];
查詢(xún)的目標(biāo)是$this(第3行). 在WHERE子句中, 如果$this與?s存在geo: rcc8dc關(guān)系, 且?s與?o存在geo: rcc8eq關(guān)系, 則進(jìn)入驗(yàn)證(第4~6行). FILTER NOT EXISTS(第7行)
用于檢驗(yàn)$this與?o之間是否存在geo: rcc8dc關(guān)系, 如果不存在則有沖突.
3 實(shí)驗(yàn)與分析
3.1 實(shí)驗(yàn)數(shù)據(jù)集
本文實(shí)驗(yàn)使用的數(shù)據(jù)集來(lái)源于SLIPO項(xiàng)目的鏈接數(shù)據(jù), 為進(jìn)行充分的分析和驗(yàn)證, 本文選擇4座城市作為實(shí)驗(yàn)對(duì)象, 分別是雅典、 巴黎、 烏德勒支和蘇黎世. 所選數(shù)據(jù)集涵蓋了
多個(gè)主要空間特征類(lèi)別, 包括POI、 建筑物、 道路、 鐵路和水路, 其中POI指一些具有語(yǔ)義的地理實(shí)體. 這些特征類(lèi)別構(gòu)成了城市空間結(jié)構(gòu)的重要組成部分, 為研究者提供了豐富的背景信息. 部分實(shí)驗(yàn)數(shù)據(jù)如圖1所示.
圖1數(shù)據(jù)集詳細(xì)描述了一個(gè)地理空間實(shí)體的幾何類(lèi)型、 空間位置、 特征類(lèi)型、 唯一標(biāo)識(shí)符、 數(shù)據(jù)來(lái)源以及類(lèi)別信息, 為進(jìn)一步的地理信息處理和分析提供了豐富的基礎(chǔ)數(shù)據(jù).
3.2 地理鏈接數(shù)據(jù)的空間拓?fù)渫暾詫?shí)驗(yàn)
使用組件對(duì)數(shù)據(jù)進(jìn)行驗(yàn)證, 部分實(shí)驗(yàn)結(jié)果如圖2和圖3所示.
由上述實(shí)驗(yàn)結(jié)果可見(jiàn)組件在驗(yàn)證地理空間數(shù)據(jù)完整性方面的性能. 驗(yàn)證結(jié)果表明, 該組件能有效檢測(cè)數(shù)據(jù)中的潛在問(wèn)題, 并為后續(xù)的地理信息處理提供可靠的
支持. 從而進(jìn)一步驗(yàn)證了本文組件設(shè)計(jì)在實(shí)際應(yīng)用中的可行性和實(shí)用性.
綜上所述, 本文探討了提升地理空間鏈接數(shù)據(jù)質(zhì)量的重要性, 尤其是針對(duì)數(shù)據(jù)完整性的問(wèn)題. 通過(guò)引入飽和式推理機(jī)制, 利用空間實(shí)體間的關(guān)系推理規(guī)則, 提出了一種
有效的方法檢測(cè)數(shù)據(jù)中的缺失關(guān)系. 該方法不僅提升了地理空間數(shù)據(jù)的準(zhǔn)確性, 還為后續(xù)的數(shù)據(jù)分析和決策提供了更可靠的基礎(chǔ). 本文設(shè)計(jì)并實(shí)現(xiàn)的可重用推理組件, 展現(xiàn)了其在實(shí)際
應(yīng)用中的靈活性和有效性. 通過(guò)具體實(shí)例驗(yàn)證了組件能推理出數(shù)據(jù)中的潛在關(guān)系, 并補(bǔ)全缺失的空間信息, 為地理信息系統(tǒng)的應(yīng)用提供了強(qiáng)有力的支持. 在未來(lái)的工作中, 進(jìn)一步優(yōu)
化推理規(guī)則和算法將有助于提高推理效率; 探索與其他數(shù)據(jù)處理技術(shù)的結(jié)合, 會(huì)為地理空間數(shù)據(jù)的處理提供其他視角和方法.
參考文獻(xiàn)
[1] SUN K, ZHU Y Q, PAN P, et al. Geospatial Data Onto
logy: The Semantic Foundation of Geospatial Data Integration and Sharing [J]. Big Earth Data, 2019, 3(3): 269-296.
[2] DING L F, XIAO G H, CALVANESE D, et al. A Framework Unitin
g Ontology-Based Geodata Integration and Geovisual Analytics [J]. ISPRS International Journal of Geo-Information, 2020, 9(8): 474-1-474-26.
[3] 劉亞彬, 劉大有. 空間推理與地理信息系統(tǒng)綜述 [J]. 軟件學(xué)報(bào), 2000, 11(12): 1598-1606. (LIU Y B, LIU D Y. A Review on Spatial Reasonin
g and Geographic Information System [J]. Journal of Software, 2000, 11(12): 1598-1606.)
[4] 劉大有, 胡鶴, 王生生, 等. 時(shí)空推理研究進(jìn)展 [J]. 軟件學(xué)報(bào), 2004, 15(8): 1141-1149. (LIU D Y, HU H, WANG S S, et al.
Research Progress in Spatio-Temporal Reasoning [J]. Journal of Software, 2004, 15(8): 1141-1149.)
[5] SERVIGNE S, UBEDA T, PURICELLI A, et al. A Methodology for Spatial Consistenc
y Improvement of Geographic Databases [J]. GeoInformatica, 2000, 4(1): 7-34.
[6] BATTLE R, KOLAS D. Enabling the Geospatial Semantic Web with Parliament and GeoSPARQL [J]. Semantic Web, 2012, 3(4): 355-370.
[7] CORMAN J, REUTTER J L, SAVKOVIC' O. Semantics and Validation of Recursive SHACL [C]//International Se
mantic Web Conference. Berlin: Springer, 2018: 318-336.
[8] FIGUERA M, ROHDE P D, VIDAL M E. Trav-Shacl: Efficiently Validating Networks
of SHACL Constraints [C]//The Web Conference 2021. New York: ACM, 2021: 3337-3348.
[9] CAR N J, HOMBURG T. GeoSPARQL 1.1: Motivations, Details and Applications of th
e Decadal Update to the Most Important Geospatial LOD Standard [J]. ISPRS International Journal of Geo-Information, 2022, 11(2): 117-1-117-30.
[10] DEBRUYNE C, MCGLINN K. Reusable SHACL Constraint Components for Validating Ge
ospatial Linked Data [C]//Proceedings of the 4th International Workshop on Geospatial Linked Data. [S.l.]: CEUR-WS.org, 2021: 59-66.
[11] COHN A G, BENNETT B, GOODAY J, et al. Qualitative Spatial Representation and
Reasoning with the Region Connection Calculus [J]. GeoInformatica, 1997, 1(3): 275-316.
[12] 歐陽(yáng)繼紅, 富倩, 劉大有. 簡(jiǎn)單凹形區(qū)域間空間關(guān)系的一種表示及推理模型 [J]. 電子學(xué)報(bào), 2009, 37(8): 1830-1836. (OUYANG J H, FU Q, LIU D Y.
A Model for Representing and Reasoning of Spatial Relations between Simple Concave Regions [J]. Acta Electronica Sinica, 2009, 37(8): 1830-1836.)
[13] MARC-ZWECKER S, DE BEUVRON F B, ZANNI-MERK C, et al. Qualitative Spatial Reasoning in RCC8 with OWL and SWRL [C]//Proc
eedings of the International Conference on Knowledge Engineering and Ontology Development. [S.l.]: SciTe Press, 2013: 214-221.
[14] STOCKER M, SIRIN E. PelletSpatial: A Hybrid RCC-8 and RDF/OWL Reasoning and Query Engine [C]//Pro
ceedings of the 5th International Workshop on OWL: Experiences and Directions (OWLED 2009). [S.l.]: CEUR-WS.org, 2009: 2-31.
[15] SCHOCKAERT S, LI S. Reasoning about Betweenness and RCC8 Constraints in Qualitative Conceptual Spaces [C]//Proceedings of t
he Twenty-Seventh International Joint Conference on Artificial Intelligence. [S.l.]: IJCAI.org, 2018: 1963-1969.
[16] GUILLEM A, GROS A, RéBY K, et al. RCC8 for CIDOC CRM: Semantic Modeling of M
ereological and Topological Spatial Relations in Notre-Dame de Paris [EB/OL]. (2024-02-09)[2024-12-01]. https://hal.science/hal-04275714/document.
[17] PULSANI B R. Megasite Management Tool (MMT): A Decision Support System Built
Using Mapwindow Activex Control [C]//4th International GeoAdvances Workshop. [S.l.]: ISPRS, 2017: 319-323.
[18] PERRET J, JESSELL W M, BéTEND E. An Open-Source,
QGIS-Based Solution for Digital Geological Mapping: GEOL-QMAPS [J]. Applied Computing and Geosciences, 2024, 24: 100197-1-100197-17.
[19] SCALA P, MANNO G, CIRAOLO G. Coastal Dynamics Analyzer (CDA): A QGIS Plugin fo
r Transect Based Analysis of Coastal Erosion [J]. SoftwareX, 2024, 28: 101894-1-101894-10.
[20] PERRY M, HERRING J, KNIBBE F, et al. OGC, 22-047-2023: GeoSPARQL-A Geographi
c Query Language for RDF Data [S]. Open Geospatial Consortium: Access Restricted to OGC Members, 2023.
[21] KOOPMANN P, SCHMIDT R A. LETHE: Saturation-Based R
easoning for Non-standard Reasoning Tasks [C]//ORE-2015 Co-located with DL 2015. [S.l.]: CEUR-WS.org, 2015: 23-30.
(責(zé)任編輯: 韓 嘯)