高慧星,楊 蕊
(燕山大學里仁學院,河北 秦皇島 066000)
在信息時代的快速發(fā)展進程中,各類信息采集與存儲技術(shù)也隨之迅速發(fā)展,由此帶來數(shù)據(jù)量與類別的增長。在此情形下,語義網(wǎng)應(yīng)運而生,可實現(xiàn)計算機針對網(wǎng)絡(luò)內(nèi)有用信息的自行整合與處理[1-3]。但在語義網(wǎng)的持續(xù)發(fā)展過程中,其持續(xù)發(fā)展的語義服務(wù)與逐漸豐富的關(guān)聯(lián)數(shù)據(jù)均會導致語義網(wǎng)內(nèi)過多不確定性數(shù)據(jù)的產(chǎn)生,增加了語義網(wǎng)應(yīng)用的難度[4-6]。為解決此問題,需針對語義網(wǎng)內(nèi)不確定性數(shù)據(jù)實施表示與推理。
貝葉斯網(wǎng)絡(luò)在不確定性知識推理領(lǐng)域被大量應(yīng)用,它融合了圖論和概率論,能夠?qū)?shù)據(jù)變量間的概率分布及條件獨立性予以呈現(xiàn),通過模塊化對不確定性知識予以描述,實現(xiàn)概率推理,成為解決不確定性推理問題的關(guān)鍵,適用性強且維護方便[7,8]。模糊貝葉斯網(wǎng)絡(luò)是在貝葉斯網(wǎng)絡(luò)基礎(chǔ)上的擴展,它可實現(xiàn)模糊化與去模糊化處理持續(xù)變量,提升推理精度[9]。
基于以上分析,本文研究一種面向語義網(wǎng)的本體不確定性推理建模方法,通過本體建模原語與本體語言的確定,構(gòu)建包含語義網(wǎng)知識及語義的語義網(wǎng)本體模型,在此基礎(chǔ)上,結(jié)合模糊貝葉斯網(wǎng)絡(luò)與聯(lián)結(jié)樹信念傳播算法構(gòu)建語義網(wǎng)本體不確定性推理模型,實現(xiàn)對語義網(wǎng)本體不確定性的推理,并對推理結(jié)果實施模糊化與去模糊化處理,獲得最終的高精度推理結(jié)果,為語義網(wǎng)的高效應(yīng)用奠定基礎(chǔ)。
針對語義網(wǎng)內(nèi)逐步增長的不確定性數(shù)據(jù),對其實施有效的推理尤為關(guān)鍵,通過運用本體創(chuàng)建語義網(wǎng)內(nèi)知識與語義模型,并結(jié)合模糊貝葉斯網(wǎng)絡(luò)構(gòu)建基于模糊貝葉斯網(wǎng)絡(luò)的本體不確定性推理模型,對本體實施擴展,實現(xiàn)對語義網(wǎng)內(nèi)不確定性數(shù)據(jù)的直接表示與推理。本體不確定性推理建模整體框架如圖1所示。
圖1 本體不確定性推理建模整體框架
本體不確定性推理建模整體框架重點包括本體解析、本體模型構(gòu)建、推理模型三部分。其中,本體解析部分主要通過Jena API實現(xiàn),能夠讀取并解析所構(gòu)建的語義網(wǎng)本體,并向數(shù)據(jù)庫內(nèi)儲存解析之后的本體;本體模型構(gòu)建部分主要包括本體建模原語與本體語言的選取,通過二者的確定完成包含語義網(wǎng)知識及語義的本體模型構(gòu)建[10];推理模型部分是整體框架的關(guān)鍵部分,主要包括模糊貝葉斯網(wǎng)絡(luò)模型創(chuàng)建、聯(lián)結(jié)樹信念傳播算法實現(xiàn)及推理結(jié)果數(shù)據(jù)處理。
獲取語義網(wǎng)內(nèi)知識、提供此類知識的共同理解、將語義網(wǎng)內(nèi)共同認可的詞匯確定,同時通過各種層次的形式化模式準確定義此類詞匯間的關(guān)聯(lián),此即為語義網(wǎng)本體構(gòu)建的目標。構(gòu)建包含語義網(wǎng)知識與語義的語義網(wǎng)本體模型的關(guān)鍵在于本體建模原語與本體語言的確定。
2.2.1 本體建模原語確定
構(gòu)建語義網(wǎng)本體時,所運用的基礎(chǔ)建模原語包括:①概念或者類:語義方面主要是指對象的集合,屬于各種事物的策略、功能及推理過程等抽象;②關(guān)系:主要是指在語義網(wǎng)領(lǐng)域內(nèi)各概念間的相關(guān)關(guān)聯(lián)作用,它與對象元組集相對應(yīng),從形式上可將其設(shè)定為笛卡爾積子集,即R:A1×A2×…×Am,比如子類關(guān)系等;③函數(shù):第m個元素的僅有影響元素為前m-1個元素的一種特別關(guān)系即為函數(shù),可通過形式化實施定義,所定義映射可表示為E=A1×A2×…×Am-1→Am。例如函數(shù)father-of(x,y)所代表的為x屬于y的父節(jié)點;④公理:是指諸如概念Y在概念X的區(qū)間內(nèi)的永真斷言;⑤實例:在語義方面其所指為對象,即元素。以上五個基礎(chǔ)建模原語,為構(gòu)建語義網(wǎng)本體奠定了基礎(chǔ)。
2.2.2 本體語言確定
本文選取OWL(本體描述語言)作為本體語言對語義網(wǎng)本體實施描述,該語言包含DL、Lite及Full三個子語言,均具備逐漸增強的描述性能,能夠在各種領(lǐng)域內(nèi)應(yīng)用。其中OWL DL子語言具備OWL語言的全部構(gòu)造子,能夠以保障可判別性與運算完備性為前提,供應(yīng)描述性能最佳的描述機制,但該子語言應(yīng)在某些特定約束條件下使用;OWL Lite子語言所供應(yīng)的機制包括描述簡單約束特征的機制與描述分類層次的機制;OWL Full子語言所供應(yīng)的描述性能最佳,但其缺陷是無法保障運算的完備性。
創(chuàng)建模糊貝葉斯網(wǎng)絡(luò)模型,結(jié)合聯(lián)結(jié)樹信念傳播算法針對所構(gòu)建的語義網(wǎng)本體模型內(nèi)不確定性數(shù)據(jù)實施推理,并對推理后的數(shù)據(jù)實施模糊化與去模糊化處理,獲得精確推理結(jié)果。
2.3.1 模糊貝葉斯網(wǎng)絡(luò)
向模糊節(jié)點變量推送貝葉斯網(wǎng)絡(luò)的持續(xù)節(jié)點變量,即為模糊貝葉斯網(wǎng)絡(luò)。設(shè)語義網(wǎng)本體不確定性推理問題以某個有限節(jié)點集表示,即X={x1,x2,…,xm},通過Xi代表持續(xù)節(jié)點變量xi的全部可能狀態(tài)集。設(shè)某個模糊隨機變量以vi表示,將xi∈X模糊成vi,同時xi的全部狀態(tài)均由vi繼承。那么xi的模糊集合可表示成
(1)
(2)
(3)
式中
(4)
設(shè)V={v1,v2,…,vm},通過有向弧對V內(nèi)變量的因果關(guān)聯(lián)予以描述,即
L={(vi,vj)|i≠j;i,j=1,2,…,m?V×V}
(5)
運用條件概率描述此種關(guān)聯(lián)的概率
(6)
FBN=(V,L,P)
(7)
2.3.2 模糊概率推理算法
選取聯(lián)結(jié)樹信念傳播算法作為模糊貝葉斯網(wǎng)絡(luò)的模糊概率推理算法,降低模糊貝葉斯網(wǎng)絡(luò)的計算煩瑣性,獲得推理結(jié)果。在該算法內(nèi),將各個聯(lián)結(jié)樹(團樹)S看作一個節(jié)點,通過此類節(jié)點將消息傳送至周圍節(jié)點。設(shè)團樹S的構(gòu)成為團S1,S2,…,Sk,原始勢能可由各個團因子的乘積獲得。向團β(σ)指定各個σ∈Φ,則Sj的原始勢能可表示為
?j(Sj)=∏σ:β(σ)=jσ
(8)
式中,局部證據(jù)與各節(jié)點的條件概率相對應(yīng),也就是
P(xi|π(xi))=σxi(xi,π(xi))
(9)
團Sj初始化αi為?i,即
(10)
通過團Sj將其原始團勢能同其周圍全部消息相乘,運算Sj和Si割集以外全部變量之和,同時向Si傳遞所得結(jié)果消息。當周圍全部節(jié)點消息均被團Si節(jié)點接收之后,由團Si節(jié)點向外傳送,此刻通過運算團Si周圍全部消息和其原始勢能的乘積能夠獲得其最后勢能,即
(11)
(12)
(13)
2.3.3 數(shù)據(jù)模糊處理
通過聯(lián)結(jié)樹信念傳播算法實現(xiàn)模糊貝葉斯網(wǎng)絡(luò)的本體不確定性推理后,針對所獲得的推理數(shù)據(jù)實施模糊化與去模糊化處理,提升推理結(jié)果的精確性。
1)節(jié)點變量模糊化處理
(14)
而模糊貝葉斯網(wǎng)絡(luò)的模糊變量vi為此狀態(tài)時的證據(jù)F(vi)為
(15)
2)節(jié)點變量去模糊化處理
通過模糊貝葉斯網(wǎng)絡(luò)實施本體不確定性推理后,可通過以下向量描述模糊變量vi的信任度B(vi)
(16)
式中,模糊變量集V中的證據(jù)集以F表示。
(17)
(18)
以某地區(qū)汽車防撞警告系統(tǒng)語義網(wǎng)為例,應(yīng)用本文方法對其實施不確定性建模與推理。該系統(tǒng)是針對交通事故實施預防的一種安全系統(tǒng),通過其語義網(wǎng)知識創(chuàng)建碰撞警告領(lǐng)域本體。實驗中所用數(shù)據(jù)來自實驗地區(qū)交通運輸部門2019年所公布的汽車駕駛數(shù)據(jù)報告,報告內(nèi)分析了汽車的駕駛環(huán)境與駕駛者的注意力狀態(tài)等變量,實現(xiàn)對此類因素干擾汽車駕駛行為的評估。由其中選取出三種駕駛情景(A、B、C),三種情景與對應(yīng)的實體狀態(tài)如表1所示。
表1 三種駕駛情景與對應(yīng)實體狀態(tài)
其中,情景A所表示的是一名駕齡較低的新手司機,其在高速公路上行駛時車距較近的駕駛情景;情景B所表示的為一名駕駛技術(shù)高但駕駛狀態(tài)不好的高駕齡司機在高速公路上的駕駛情景;情景C所表示的為一名駕駛技術(shù)好而駕駛狀態(tài)稍差的中等駕齡司機在普通公路上的駕駛情景,且其駕駛中與前車的車距稍近。現(xiàn)運用本文方法對三種實驗駕駛情景實施推理,依據(jù)所得推理結(jié)果檢驗本文方法的推理效果。本文方法推理所得三種駕駛情景的詳細變化情況如圖2所示。
圖2 本文方法推理的三種情景非法駕駛概率變化情況
通過圖2能夠得出,在本文方法的推理中,增長的非法駕駛模糊行為狀態(tài)證據(jù)對非法駕駛行為的影響可在推理結(jié)果中準確顯示,可見,本文方法能夠?qū)崿F(xiàn)對各種情景模糊概率知識的準確推理,具有較高的有效性與可行性。
進一步檢驗本文方法推理結(jié)果在經(jīng)模糊化與去模糊化處理前后的準確性,通過抽樣技術(shù)均勻劃分實驗數(shù)據(jù)為12組,通過本文方法依次對12組實驗數(shù)據(jù)實施推理,獲取到各組實驗數(shù)據(jù)的推理結(jié)果,對結(jié)果實施模糊化與去模糊化處理后,統(tǒng)計并對比每組數(shù)據(jù)推理結(jié)果處理前后的準確度,統(tǒng)計與對比結(jié)果如圖3所示。
圖3 模糊處理前后推理結(jié)果準確度對比
由圖3能夠得出,通過對所得推理結(jié)果實施模糊化與去模糊化處理之后,12組數(shù)據(jù)推理結(jié)果的平均準確度可達到94.03%,相比處理前的平均準確度提高了3.67%,由此可見,對推理結(jié)果實施模糊化與去模糊化處理,能夠顯著提升每組數(shù)據(jù)最終推理結(jié)果的精度,提高整體推理結(jié)果的可靠性與價值度。
語義網(wǎng)應(yīng)用中所面臨的關(guān)鍵問題即為語義服務(wù)與關(guān)聯(lián)數(shù)據(jù)過多所導致的語義網(wǎng)內(nèi)出現(xiàn)大量的不確定性數(shù)據(jù),無形中提升了語義網(wǎng)的實際應(yīng)用難度,為此,本文針對一種面向語義網(wǎng)的本體不確定性推理建模仿真方法展開研究,通過結(jié)合基礎(chǔ)建模原語與OWL本體語言,構(gòu)建包含語義網(wǎng)知識與語義的本體模型,對所構(gòu)建本體模型實施讀取與解析后儲存至數(shù)據(jù)庫內(nèi),構(gòu)建模糊貝葉斯網(wǎng)絡(luò)模型,以聯(lián)結(jié)樹信念傳播算法作為所構(gòu)建模糊貝葉斯網(wǎng)絡(luò)的模糊概率推理算法,針對所構(gòu)建的語義網(wǎng)本體模型內(nèi)的不確定性數(shù)據(jù)實施推理,同時模糊化與去模糊化處理推理后數(shù)據(jù),獲得最終的精確推理結(jié)果。
將本文方法應(yīng)用于某地區(qū)汽車防撞警告系統(tǒng)語義網(wǎng)內(nèi),實際應(yīng)用結(jié)果表明,本文方法可將增長的非法駕駛模糊狀態(tài)證據(jù)對非法駕駛行為的影響顯示在推理結(jié)果中,并能夠?qū)崿F(xiàn)對各種情景模糊概率知識的推理,具有較高的有效性與可行性,另外,本文方法結(jié)合的模糊化與去模糊化處理,可明顯提升最終推理結(jié)果的精度,令整體推理結(jié)果更具可信度與應(yīng)用價值。