李家良,宋文賓,劉炳磊
(1.海裝天津局,北京100073;2.中國艦船研究院,北京100192)
當今社會,在網(wǎng)絡技術和電子技術等新技術的發(fā)展影響下,人類每天產(chǎn)生大量數(shù)據(jù),圖靈獎獲得者Jim Gray 提出了一個關于網(wǎng)絡環(huán)境下數(shù)據(jù)量的定律:網(wǎng)絡環(huán)境下每18 個月產(chǎn)生的數(shù)據(jù)量等于有史以來數(shù)據(jù)量之和[1]。如此海量的數(shù)據(jù)中蘊含著大量的知識和財富。
可是利用計算機進行簡單的數(shù)據(jù)查詢并不能有效地發(fā)掘知識,計算機如果能代替人對數(shù)據(jù)進行理解并在理解的基礎上進行處理分析,將會給使用者帶來極大便利。語義網(wǎng)技術正是為了解決這一問題。
語義網(wǎng)技術通過將萬維網(wǎng)中的數(shù)據(jù)進行數(shù)據(jù)加工,并引入約束和邏輯關系等,使得計算機可以形式化描述數(shù)據(jù),在此基礎上對數(shù)據(jù)進行理解和推理,從而實現(xiàn)人機的智能交互。數(shù)據(jù)加工的過程也就是數(shù)據(jù)表示和組織的過程,通常采用的方法是進行本體提取,在本體提取的基礎上,對本體進行約束限制和邏輯關系推理等。在應用中,針對不同應用的需求,往往引入安全技術以保證交互環(huán)境的可信。
語義網(wǎng)技術體系結構涉及語義網(wǎng)技術的實現(xiàn)基礎和語義網(wǎng)技術為上層應用的技術支撐。針對語義網(wǎng)技術的實現(xiàn)機制和其在應用中發(fā)揮的作用,Berners-Lee 于2000 年提出了語義網(wǎng)體系結構,這也就是為人熟知的語義網(wǎng)體系結構模型,如圖1所示[3]。
圖1 語義網(wǎng)體系結構Fig.1 Architecture of Semantic Web
語義網(wǎng)技術體系結構是實現(xiàn)語義網(wǎng)的技術體系,體系按照從最底層的編碼層到高層應用逐層構建。每一層為上一層實現(xiàn)提供接口或技術支持。該體系結構共有7 層,自下而上其各層功能逐漸增強。第1 層是字符集層,是整個語義網(wǎng)的基礎,負責資源的統(tǒng)一編碼和標識。第2 層是標記語言層,該層負責從語法上表示數(shù)據(jù)的內(nèi)容和結構,通過使用標準的語言將網(wǎng)絡信息的表現(xiàn)形式、數(shù)據(jù)結構和內(nèi)容分離。第3 層是資源描述框架層,該層主要是為元數(shù)據(jù)的描述提供標準的描述框架,對元數(shù)據(jù)的語義描述形成標準規(guī)范。第4 層是本體層,該層是在資源描述框架層的基礎上定義的概念及其關系的抽象描述,用于描述應用領域的知識,描述各類資源及資源之間的關系,實現(xiàn)對詞匯表的擴展。第5 層是邏輯層,負責提供公理和邏輯推理規(guī)則,用于對資源與資源之間的關系以及推理結果進行有效性驗證。第6 層是證明層,該層提供語義網(wǎng)可靠性和可用性等方面的技術。第7 層是可信層,它基于證明層和數(shù)字簽名等,確保語義網(wǎng)所提供服務的整體可信。
除了7 層結構,語義網(wǎng)體系結構中也引入了數(shù)字簽名和文檔等。數(shù)字簽名主要為滿足應用中對安全和可信的需求,結合從資源描述框架層到證明層的技術進行實現(xiàn)。體系結構中的文檔和數(shù)據(jù)指的是為各層技術提供支持的標準文檔、擴展文檔、相關數(shù)據(jù)等,例如在使用資源描述框架對專業(yè)領域的資源進行描述時,往往需要用到該領域?qū)I(yè)的資源描述文件和以往的數(shù)據(jù)等。
從技術角度出發(fā),語義網(wǎng)體系結構每層所使用的技術主要用于在不同層面實現(xiàn)對數(shù)據(jù)和數(shù)據(jù)關系的表示和組織,為上層的使用提供支持。實現(xiàn)語義網(wǎng)的關鍵是要解決數(shù)據(jù)表示、數(shù)據(jù)和數(shù)據(jù)之間關系描述、機器理解以及安全保證等。作為通用標準,語義網(wǎng)體系結構采用廣泛使用的標準技術作為每層的實現(xiàn)技術。其關鍵技術主要是XML(S)、RDF(S)和本體技術等。
1.2.1 XML 和XML Schema
XML 技術基于標簽實現(xiàn),與HTML 類似,但是XML 采用更加豐富的標簽描述數(shù)據(jù)的每一成分,并借助XML 嵌套結構定義各成分之間的關系。XML還將顯示與內(nèi)容區(qū)分開來,這使得XML 不僅能夠被計算機理解,而且同樣的內(nèi)容可以采用不同的風格顯示給用戶[4]。
XML Schema 是對XML 結構的擴展,它用于可替代文檔類型定義和對可擴展標記語言文檔的結構進行描述,是對XML 中組件的擴展,增強了XML的描述能力。
XML 和XML Schema 是語義網(wǎng)的技術基礎。用來對數(shù)據(jù)進行詞匯級別描述。它們的實現(xiàn)是基于統(tǒng)一編碼規(guī)則和統(tǒng)一資源定位符(URI)。
1.2.2 RDF 和RDF Schema
RDF 是現(xiàn)在廣泛流行的資源描述框架,一般采用三元組(<資源,屬性,值>)的形式對本體中的實體進行描述。RDF 是建立本體、執(zhí)行邏輯推理和描述Web 服務以及其他語義網(wǎng)行為的基礎。RDF被設計為提供一種描述信息的通用方法,所描述的內(nèi)容是以被計算機讀取和理解。
基于RDF 的擴展RDFS (RDF Schema)是對RDF 數(shù)據(jù)模型中所使用的詞匯的擴展。RDF 是允許用戶使用自己的詞匯描述資源的通用語言,用戶使用RDFS 定義專業(yè)領域的語義[5]。
RDF 是領域無關的,采用RDFS 對其詞匯擴展可以表示專業(yè)領域的資源,這種描述技術對所描述資源的約束少,這擴展了RDF 的使用范圍。但是在本體知識層面,存在一定的局限性,例如屬性基數(shù)約束困難,一個人有一個父親和一個母親,一門課至少由一個教授講授等[6]。為實現(xiàn)對本體更全面地描述,語義網(wǎng)體系結構引入本體技術。
1.2.3 本體技術
本體由實體描述集、實體屬性集、實體關系集、函數(shù)、限制、規(guī)則和公理等組成。本體目的是數(shù)據(jù)概念化、關系明確化、描述形式化和結果可共享。
本體提供語義交換的橋梁,能夠在不同知識之間達成有關術語概念的共識,為概念共享和統(tǒng)一理解提供支持,是構建語義網(wǎng)的關鍵。本體層在體系結構中更接近上層應用,它為邏輯層直接提供支持,為進一步的推理提供子集。
語義網(wǎng)技術在軍事領域的應用主要在資源描述、數(shù)據(jù)融合、信息共享等方面,重點應用于軍事信息基礎設施中網(wǎng)絡化信息服務設施。網(wǎng)絡化信息服務設施是支持信息按需共享和系統(tǒng)柔性重組,實現(xiàn)軍事信息系統(tǒng)由以平臺為中心系向網(wǎng)絡為中心轉(zhuǎn)變,提供“網(wǎng)絡中心、面向服務、按需分發(fā)、柔性重組”等支持能力的核心基礎設施[7]。語義網(wǎng)技術的應用,從信息表示,資源描述、理解和使用,服務組合、可信等方面有效提升了網(wǎng)絡化信息服務設施能力,如圖2 所示。
圖2 語義網(wǎng)技術在信息服務設施中作用Fig.2 Semantic Web in information infrastructure
隨著應用的不斷深入和相關技術的發(fā)展,語義網(wǎng)技術將在智能輔助決策、預警偵察等方面發(fā)揮更大作用。
2.2.1 軍事領域“XML 數(shù)據(jù)戰(zhàn)略”
當今軍事領域中,隨著各種傳感器和雷達等信息獲取設備的發(fā)展和網(wǎng)絡中大量數(shù)據(jù)的發(fā)布,軍事活動中所需要處理的數(shù)據(jù)量暴增??焖俜治鰯?shù)據(jù)并從中提取重要信息的能力對奪取信息優(yōu)勢來說極其重要。
XML 數(shù)據(jù)戰(zhàn)略是美軍提出的信息化戰(zhàn)爭的數(shù)據(jù)戰(zhàn)略的一部分。它的涵義是指導信息化戰(zhàn)爭在軍事信息網(wǎng)格——新一代軍事信息網(wǎng)絡環(huán)境下實現(xiàn)數(shù)據(jù)共享的計劃和策略。美軍在信息化戰(zhàn)爭《聯(lián)合構想2020》中指出,只有信息被決策者轉(zhuǎn)化為相關知識乃至智慧,并及時正確地做出合理決策,才能真正奪取信息優(yōu)勢,贏得聯(lián)合作戰(zhàn)勝利。實現(xiàn)知識的可理解性及計算機自動智能化推理是知識智能化共享的關鍵[8]。
XML 數(shù)據(jù)戰(zhàn)略的目標是實現(xiàn)數(shù)據(jù)的共享,作為“獲取—共享—協(xié)作”信息鏈中的關鍵一步,采用XML 作為統(tǒng)一的標準進行數(shù)據(jù)標識,不僅能夠為獲取的數(shù)據(jù)提供統(tǒng)一形式的表示和組織,而且在信息資源的整合和管控中起到重要作用。語義網(wǎng)技術在軍事領域中的應用為解決復雜戰(zhàn)場環(huán)境中資源的管控、資源按需重組和網(wǎng)絡信息安全等提供途徑。
2.2.2 戰(zhàn)場環(huán)境中增強的態(tài)勢感知
AKTiveSA 工程在模擬國際人道主義援助方案中利用語義網(wǎng)技術支持信息融合和增強態(tài)勢察覺。語義網(wǎng)技術為收獲來自大量的、不同的信息源的信息提供新的機會,并能更好地支持復雜的知識融合。對越來越多的知識資源來說,通過綜合考慮資源傳播、環(huán)境情報等,以及采用語義網(wǎng)技術,能夠?qū)崿F(xiàn)態(tài)勢察覺,即:在一定空間和時間的環(huán)境中對元素的察覺,對其意義的理解和在近期對其狀態(tài)的投影。目前,要過濾并聚集大量的資源以找到最有關聯(lián)性的信息較為困難。研究人員通過分析語義網(wǎng)初始和發(fā)展趨勢,面向解決信息超載問題,研究為信息過濾和分類提供一個更具表達性的、結合上下文的方法。
語義網(wǎng)技術憑借互聯(lián)網(wǎng)浪潮帶來的數(shù)據(jù)處理需求快速發(fā)展,正應用到電子商務、電子政府、醫(yī)療、語音識別等多個領域,技術的發(fā)展日新月異[9]。
語義網(wǎng)技術發(fā)展至今,主要的幾個研究方向是:關聯(lián)數(shù)據(jù)[10]、本體抽取、查詢語言、推理、縱向應用等[11]。
網(wǎng)絡中數(shù)據(jù)量的膨脹和數(shù)據(jù)的松散組織關系使得數(shù)據(jù)之間關系變得更加復雜。關聯(lián)數(shù)據(jù)技術借助語義網(wǎng)對數(shù)據(jù)之間關系進行發(fā)掘。未來,在電子商務領域、教育、軍事情報等領域,必將成為一種關鍵技術,發(fā)揮重要作用;本體的抽取能擴展數(shù)據(jù)所表示的意義,使得數(shù)據(jù)蘊含的意義更加豐富,隨著語義網(wǎng)技術應用范圍變得更加廣泛,領域內(nèi)智能本體發(fā)現(xiàn)、領域間本體描述等技術將會成為關鍵;如果將采用語義網(wǎng)技術組織的所有數(shù)據(jù)看作是一個大型的數(shù)據(jù)集合,對這些數(shù)據(jù)的查詢必不可少,查詢語言將至關重要,實現(xiàn)快速、便捷、高效的查詢?nèi)匀皇侵悄軝z索等領域的關鍵技術;語義網(wǎng)技術通過制定規(guī)則,按照規(guī)則推理獲得數(shù)據(jù),在不同系統(tǒng)和語言之間通過規(guī)則的轉(zhuǎn)化,實現(xiàn)推理過程;隨著語義網(wǎng)技術的發(fā)展不斷深入,不同領域之間、不同應用之間、不同數(shù)據(jù)之間如何實現(xiàn)語義網(wǎng)技術才能夠屏蔽底層技術、內(nèi)容等方面的不同,是縱向應用技術要面對的問題。
科技是第一生產(chǎn)力,軍事領域中,科技同樣發(fā)揮極其重要的作用。伴隨科技的發(fā)展,軍事作戰(zhàn)活動的樣式、空間、時間等都發(fā)生了深刻變化,信息戰(zhàn)成為戰(zhàn)爭最重要組成部分。信息戰(zhàn)不僅是體系與體系的對抗,系統(tǒng)對系統(tǒng)的攻防,更是信息處理能力的較量。
以海戰(zhàn)場為例,近年來我國海軍的技術和實力得到了長足的發(fā)展,海戰(zhàn)場中網(wǎng)絡、傳感器等共性信息基礎設施等得到長足發(fā)展,數(shù)據(jù)從匱乏到豐富。但是新舊系統(tǒng)兼容性、技術體制不統(tǒng)一、缺乏總體設計等矛盾依然突出,海戰(zhàn)場作戰(zhàn)的元素多樣性和環(huán)境多變性等決定了海戰(zhàn)場作戰(zhàn)中信息的多樣化和處理的復雜化,數(shù)據(jù)處理能力的不足導致無法形成信息優(yōu)勢,嚴重制約了我國海軍體系化協(xié)同作戰(zhàn)的能力。
語義網(wǎng)技術起源于互聯(lián)網(wǎng),推動了網(wǎng)絡中資源的描述和表示方式,并由此衍生出的數(shù)據(jù)挖掘、推理等都成為知識產(chǎn)生的重要途徑。語義網(wǎng)技術在其他領域的應用證明了其進行可用性,為在軍事領域中的應用奠定了基礎,在作戰(zhàn)資源描述等方面的應用為軍事領域中資源標識提供了一種手段,伴隨語義網(wǎng)技術的發(fā)展和在軍事領域應用的深入,其必將成為推動電子信息戰(zhàn)到知識信息戰(zhàn)轉(zhuǎn)變的關鍵技術。
語義網(wǎng)技術是伴隨大數(shù)據(jù)時代人們對于數(shù)據(jù)內(nèi)容處理能力的需求而提出的一項技術,它的使用為計算機理解數(shù)據(jù)以及智能發(fā)現(xiàn)和處理數(shù)據(jù)提供支持。語義網(wǎng)技術的發(fā)展必然會帶來計算機對數(shù)據(jù)處理能力的提升,創(chuàng)造人與計算機交互的新局面。隨著語義網(wǎng)技術的發(fā)展和在軍事領域的應用,逐漸形成以數(shù)據(jù)為基礎,以信息為主體,以知識為能力的信息時代軍事戰(zhàn)爭發(fā)展的一個新方向。
[1]曹強,黃建忠,萬繼光,等.海量網(wǎng)絡存儲系統(tǒng)原理與設計[M].武漢:華中科技大學出版社,2014.
[2]W3C.Linked Open Data[EB/OL].[2014 - 6 - 20].http://www.w3c.it/events/2014/lod2014/.
[3]Tim Berners-Lee.Semantic Web - XML2000 [EB/OL].[2014 -6 -21].http://www.w3.org/2000/Talks/1206-xml2k-tbl/slide10 -0.html.
[4]M.Murata.XML Media Types,RFC3023,Jan,2001.http://tools.ietf.org/pdf/rfc3023.pdf.
[5]RDF Working Group.RDF Schema 1.1[S].W3C,2014.
[6]Grigoris Antonios,F(xiàn)rankvan Harmelen:A Sematic Web Primer (Cooperative Information Systems ) [M].Cambridge:The MIT Press.2008.
[7]藍羽石,丁峰,王珩.信息時代的軍事信息基礎設施[M].北京:軍事科學出版社,2011:43 -65.
[8]段榮婷.國際軍事領域信息化條件下聯(lián)合作戰(zhàn)的戰(zhàn)略創(chuàng)新——“XML 數(shù)據(jù)戰(zhàn)略”的體系結構與應用研究[J].國防科技,2009,30(6):85 -90.DUAN Rong-ting.The innovative development of joint operation strategy under the condition of informatization in the international military domain:study on the architecture and application of XML data strategy[J].National Defense Science & Technology,2009,30(6):85 -90.
[9]周靜怡,黃國彬.2007 -2008 年國外語義網(wǎng)研究與應用進展[J].圖書館建設,2009(1):19 -23.ZHOU Jing-yi,HUANG Guo-bin.Review of the theory and application of semantic web abroad from 2007 to 2008[J].Library Development,2009(1):19 -23.
[10]Archer P.LOD-2014[R/OL].[2014 -6 -20].http://www.w3.org/2014/Talks/0220_phila_lod2014/#(1).
[11]W3C.Semantic Web[S/OL].[2014 -6 -20].http://www.w3.org/standards/semanticweb/.