韓智+周法國
摘 要: 為了解決高鐵機車設(shè)備運行數(shù)據(jù)的獨立采集與分析造成大量數(shù)據(jù)冗余以及數(shù)據(jù)結(jié)構(gòu)不一致、多源異構(gòu)數(shù)據(jù)不能融合等問題。探索高鐵動車行業(yè)知識圖譜的自動化構(gòu)建過程以及本體和知識圖譜之間映射匹配機制,采用本體建模語言O(shè)WL,對高速鐵路列車設(shè)備檢測系統(tǒng)的上位機進行本體建模。實踐證明高鐵動車設(shè)備檢測系統(tǒng)中本體框架的智能化維護是保證系統(tǒng)能正常運行的關(guān)鍵,利用本體技術(shù)和知識圖譜解決數(shù)據(jù)異構(gòu)和數(shù)據(jù)冗余的問題以及對車輛檢測設(shè)備平臺進行智能化本體維護。
關(guān)鍵詞: 高鐵動車; 本體; 多源異構(gòu)數(shù)據(jù); 知識圖譜; 設(shè)備檢測系統(tǒng); 智能化維護
中圖分類號: TN911.23?34 文獻標(biāo)識碼: A 文章編號: 1004?373X(2018)06?0011?04
Abstract: The operating data independent collection and analysis of high?speed train′s equipment have the problems of massive data redundancy and inconsistent data structure, and can′t fuse the multi?source heterogeneous data. The automatic construction process of the knowledge mapping of the high?speed rail industry and mapping matching mechanism between ontology and knowledge mapping are explored. The OWL is used to model the ontology of the host computer of the high?speed train′s equipment detection system. The practice results prove that the intelligent maintenance for ontology framework of high?speed train′s equipment detection system is the key to guarantee the normal operation of the system. The ontology technology and knowledge mapping can solve the problems of data heterogeneity and data redundancy, and perform the intelligent ontology maintenance for the vehicle′s equipment detection platform.
Keywords: high?speed train; ontology; multi?source heterogeneous data; knowledge mapping; equipment detection system; intelligent maintenance
0 引 言
高鐵動車上的車載設(shè)備,比如牽引設(shè)備、制動設(shè)備等,是機車行駛控制的重要部件,對機車行駛安全、實時狀況的檢測具有關(guān)鍵作用。如何檢測設(shè)備故障、實時監(jiān)測列車運行狀態(tài)以及在多源異構(gòu)數(shù)據(jù)中實現(xiàn)智能化本體維護,是適應(yīng)高鐵動車信息化發(fā)展的關(guān)鍵[1]。目前,高鐵動車上機車設(shè)備運行數(shù)據(jù)由各個單元檢測系統(tǒng)獨立地采集與分析,造成大量數(shù)據(jù)冗余和數(shù)據(jù)結(jié)構(gòu)不一致,所以需要解決機車設(shè)備各個系統(tǒng)單元缺乏統(tǒng)一的系統(tǒng)應(yīng)用平臺這一關(guān)鍵制約,以解決機車運行中數(shù)據(jù)冗余和數(shù)據(jù)異構(gòu)問題。隨著本體技術(shù)和知識圖譜的應(yīng)用為解決數(shù)據(jù)異構(gòu)和數(shù)據(jù)冗余問題提供了可能。
本體技術(shù)是指針對事物的本身給出構(gòu)成相關(guān)領(lǐng)域詞匯的關(guān)系和規(guī)則集合。而知識圖譜是描述真實世界中存在的各種實體、關(guān)系、理論,以及相互之間的關(guān)系。國內(nèi)外專家學(xué)者在異構(gòu)數(shù)據(jù)融合和防止數(shù)據(jù)大量冗余進行了大量的有益探索,歐洲FP5?IST Project就采用本體技術(shù)構(gòu)建異構(gòu)數(shù)據(jù)標(biāo)準(zhǔn)化文檔,實現(xiàn)數(shù)據(jù)共享,進而建立保護歐洲鐵路系統(tǒng)的處理方法。
借鑒國內(nèi)外鐵路系統(tǒng)應(yīng)用本體技術(shù)和知識圖譜的經(jīng)驗,將機車各子系統(tǒng),集成到統(tǒng)一的用戶平臺,該平臺框架采用統(tǒng)一的設(shè)計模式、數(shù)據(jù)存儲方式和接口通信協(xié)議,采用本體建模語言(OWL),構(gòu)建一種基于知識圖譜表示知識本體的高鐵設(shè)備檢測系統(tǒng)平臺框架,對機車車載設(shè)備檢測系統(tǒng)進行智能化本體框架構(gòu)建與維護[2?3]。
1 本體技術(shù)和知識圖譜
1.1 本體和知識圖譜
本體,是指事物的本身。近年來,隨著“共享”概念的廣泛提及,本體概念也被“共享”了,比較認可的定義是斯坦福大學(xué)的Gruber提出來的,即“本體是共享概模型的形式化規(guī)范說明”[4?5]。
知識圖譜是在語義Web數(shù)據(jù)源的數(shù)量激增、大量RDF數(shù)據(jù)被發(fā)布的大背景下,于2012年5月,由Google提出這一概念[6?7]。知識圖譜是表示真實世界里存在的各種實體、關(guān)聯(lián)、理論和相互之間的關(guān)系[8]。知識圖譜可以分為通用知識圖譜和行業(yè)知識圖譜。
1.2 知識圖譜與本體的關(guān)系[6]
知識圖譜在本體的根本上進行展開及擴大,擴大關(guān)鍵表現(xiàn)在實體層面:本體里突出與強調(diào)的是概念及概念間的相關(guān)性,而知識圖譜則在本體的根本上,添加了更多的有關(guān)實體的內(nèi)在信息。模式是對知識的提煉,而且按照預(yù)先設(shè)定的形式有助于知識標(biāo)準(zhǔn)化,更方便查詢等后續(xù)治理。本體其實是表示了知識圖譜的數(shù)據(jù)形式,本質(zhì)上是組建本體。本體是基于概念層次上面的體現(xiàn),對知識進行抽象化表示,側(cè)重概念和概念間的關(guān)聯(lián);而知識圖譜以實體為重心,關(guān)注實體本身間的關(guān)聯(lián)推理,對知識形象化的表示[9]。endprint
2 高鐵動車設(shè)備檢測系統(tǒng)的本體模型架構(gòu)
高鐵動車在運行結(jié)束后,檢測系統(tǒng)要采集各種行車參數(shù),對機車整體運行狀況進行檢測,以確保列車行車安全。檢測系統(tǒng)平臺主要包括CCU(中央控制單元)、BCU(制動自動控制單元)、TCU(牽引控制單元)、ACU(輔助控制單元)等子系統(tǒng)。
目前列車各種檢測系統(tǒng)主要采用分布式結(jié)構(gòu),各主要檢測單元是獨立采集數(shù)據(jù)、獨立進行故障檢測分析,所以需要多次重復(fù)采集數(shù)據(jù),造成數(shù)據(jù)大量冗余。同時,因為各個檢測系統(tǒng)之間對數(shù)據(jù)類型表示的不一致,從而無法有效地進行數(shù)據(jù)共享和列車運行狀況的整體分析。為了解決這一問題,構(gòu)建統(tǒng)一的檢測系統(tǒng)平臺,便于各個檢測單元間數(shù)據(jù)共享,兼容之前各個子系統(tǒng)的軟件功能,并考慮到未來新的軟件功能設(shè)計添加,所以系統(tǒng)基本框架采用本體模型進行構(gòu)建,利用模塊化動態(tài)設(shè)計思想,通過智能化配置動態(tài)生成新的應(yīng)用系統(tǒng),以實現(xiàn)知識共享和多源異構(gòu)數(shù)據(jù)融合[10]。系統(tǒng)的總體模型架構(gòu)如圖1所示。
系統(tǒng)框架從靜態(tài)資源描述和動態(tài)運作機制兩個方面進行本體建模,所以本體模型框架的描述有兩個方面[11]:
1) 數(shù)據(jù)的靜態(tài)本體模型以及系統(tǒng)框架中各個單元的數(shù)據(jù)的靜態(tài)語義表達,實現(xiàn)不同應(yīng)用之間的數(shù)據(jù)融合。
2) 對系統(tǒng)的數(shù)據(jù)協(xié)議處理過程建立動態(tài)語義模型,對知識的故障識別、匹配、執(zhí)行等過程進行動態(tài)語義描述。
高鐵設(shè)備檢測系統(tǒng)的本體模型架構(gòu)采用面向服務(wù)架構(gòu),并且該本體框架獨立于各具體的單元應(yīng)用,將檢測系統(tǒng)分層建模,然后每層再定義相應(yīng)的內(nèi)容,從而對高鐵設(shè)備檢測系統(tǒng)進行豐富的層次化描述和層次化本體模型構(gòu)建。其層次化本體框架如圖2所示。
1) 數(shù)據(jù)服務(wù)層:統(tǒng)一數(shù)據(jù)訪問接口,實現(xiàn)數(shù)據(jù)融合,提高框架的通用性。
2) 本體元素層:將系統(tǒng)內(nèi)知識用本體元素進行描述,并接收來自數(shù)據(jù)服務(wù)層的數(shù)據(jù)。
3) 本體邏輯層:利用通用模塊和專用模塊的動態(tài)運行機制,推理出需要的知識本體。
4) 適配插件層:根據(jù)本體框架動態(tài)運行機制,將傳上來的數(shù)據(jù)與各功能插件進行適配,然后將適配結(jié)果上傳應(yīng)用交互層。
5) 應(yīng)用交互層:用戶在該層對各類任務(wù)進行分類整合,對數(shù)據(jù)進行關(guān)聯(lián)分析,對列車設(shè)備故障、運行狀態(tài)進行整體分析。
高鐵設(shè)備檢測系統(tǒng)的本體構(gòu)建是一個比較復(fù)雜的過程,需要理清各種應(yīng)用單元實體間的層次關(guān)系、邏輯關(guān)系等,并且還要使計算機能夠識別和進行推理。為了實現(xiàn)高鐵設(shè)備檢測系統(tǒng)的本體構(gòu)建、計算機自動推理及后續(xù)本體框架智能化維護,利用各自本體的映射機制,對系統(tǒng)整體的本體框架進行抽象化的概念描述。
3 高鐵動車設(shè)備檢測系統(tǒng)的知識圖譜構(gòu)建
構(gòu)建該檢測系統(tǒng)的知識圖譜,首先要確定清晰的本體與知識圖譜映射匹配機制,然后形象化地構(gòu)建該檢測系統(tǒng)的知識圖譜。本體實質(zhì)上是將關(guān)系、實體等進行層次化的抽象表達。因為知識圖譜相當(dāng)于一張巨大的語義網(wǎng),其中的概念層次關(guān)系可以用樹來表示,實體關(guān)系可以繼續(xù)用圖來表示,概念節(jié)點作為樹的節(jié)點,實體節(jié)點可以作為圖的節(jié)點,相互間關(guān)聯(lián)線表達。因此知識圖譜和本體映射配合模式能當(dāng)作樹和樹、樹和圖的映射。
檢測系統(tǒng)的本體與知識圖譜映射匹配機制如圖3所示。
根據(jù)映射匹配機制進行高鐵動車設(shè)備檢測系統(tǒng)的知識圖譜構(gòu)建,圖4為具體的構(gòu)建過程。
因為要考慮車載設(shè)備中數(shù)據(jù)的多源異構(gòu)、融合、關(guān)鍵信息快速抽取等問題,所以,該檢測系統(tǒng)的知識圖譜的構(gòu)建過程是比較復(fù)雜的。需要自底向上,從底層數(shù)據(jù)庫、全局本體數(shù)據(jù)庫等進行整體的知識圖譜構(gòu)建。
4 系統(tǒng)平臺本體框架的智能化維護檢測
該高鐵動車設(shè)備檢測系統(tǒng)的知識圖譜是以本體庫為基礎(chǔ),在高鐵動車設(shè)備檢測系統(tǒng)的本體架構(gòu)應(yīng)用平臺上構(gòu)建的。所以,高鐵動車設(shè)備檢測系統(tǒng)中本體框架的智能化維護依然是保證系統(tǒng)能正常運行的關(guān)鍵,其中包括根類、子類以及實體的維護,類屬性的管理等。
4.1 根類維護
高鐵動車設(shè)備檢測系統(tǒng)的根類分為兩大類,包括模塊和單元應(yīng)用兩塊,也可根據(jù)實際情況定義通用模塊和專用模塊。主要功能包括編輯根類、刪除根類等。具體如表1所示。
4.2 子類維護
子類維護與根類操作相同,只是從根類繼承了根類的屬性和屬性默認值,對于具有相同操作的模塊具有相同屬性,同時子類也可以建立私有屬性。高鐵動車設(shè)備檢測系統(tǒng)中應(yīng)用模塊需要特殊操作模塊時,可在通用模塊下建立子類模塊,并建立私有屬性。主要包括編輯子類、刪除子類等,具體如表2所示。
4.3 實體維護
實體是將類實體化,類中定義有屬性和關(guān)系,實體依據(jù)這些類屬性和關(guān)系建立屬性值和實體關(guān)系。實體維護的主要功能包括增加實體、刪除實體等,具體如表3所示。
5 結(jié) 語
本文通過本體與知識圖譜的聯(lián)系與映射匹配機制,探索構(gòu)建一種基于知識圖譜的高鐵動車設(shè)備檢測系統(tǒng)的本體框架模型,在系統(tǒng)中引入一些新概念和新方法,解決多源異構(gòu)數(shù)據(jù)快速融合問題,使列車故障診斷和處置率有效提高。并進一步探索本體框架、行業(yè)知識圖譜在高鐵動車領(lǐng)域的深入應(yīng)用。需要指出的是,本體建模工具仍需不斷完善,下一步應(yīng)該是朝著自動化、智能化方向發(fā)展,進一步補充和完善已有的高鐵列車設(shè)備的本體庫,構(gòu)建適合于高鐵列車設(shè)備檢測系統(tǒng)的領(lǐng)域本體和行業(yè)知識圖譜,結(jié)合最新的人工智能技術(shù),探索知識圖譜的自動構(gòu)建機制。
注:本文通訊作者為周法國。
參考文獻endprint
[1] 韓春華.基于GIS的鐵路選線系統(tǒng)智能環(huán)境建模方法研究[D].成都:西南交通大學(xué),2008.
HAN Chunhua. Research on intelligent environment modeling method of railway route selection system based on GIS [D]. Chengdu: Southwest Jiaotong University, 2008.
[2] YANG Lianbao, LI Ping. Ontology?based decision tree model for intelligent maintenance of high?speed railway onboard equipment [J]. Railway transport and economy, 2017, 39(2): 55?59.
[3] 徐田華,楊連報,胡紅利,等.高速鐵路信號系統(tǒng)異構(gòu)數(shù)據(jù)融合和智能維護決策[J].西安交通大學(xué)學(xué)報,2015,49(1):72?78.
XU Tianhua, YANG Lianbao, HU Hongli, et al. Heterogeneous data fusion and intelligent maintenance decision for high speed railway signaling systems [J]. Journal of Xian Jiaotong University, 2015, 49(1): 72?78.
[4] 丘威,張立臣.本體語言研究綜述[J].情報雜志,2006(7):61?64.
QIU Wei, ZHANG Lichen. Research on ontology language [J]. Journal of information, 2006(7): 61?64.
[5] 王宇華,印桂生.基于本體的需求模型到UML模型轉(zhuǎn)換方法[J].哈爾濱工程大學(xué)學(xué)報,2012,33(6):735?740.
WANG Yuhua, YIN Guisheng. Automatically generating a UML model from a requirement model based on ontology [J]. Journal of Harbin Engineering University, 2012, 33(6): 735?740.
[6] 張德政,謝永紅,李曼,等.基于本體的中醫(yī)知識圖譜構(gòu)建[J].情報工程,2017,3(1):35?42.
ZHANG Dezheng, XIE Yonghong, LI Man, et al. Construction of knowledge graph of traditional Chinese medicine based on the ontology [J]. Technology intelligence engineering, 2017, 3(1): 35?42.
[7] 劉嶠,李楊,段宏,等.知識圖譜構(gòu)建技術(shù)綜述[J].計算機研究與發(fā)展,2016,53(3):582?600.
LIU Qiao, LI Yang, DUAN Hong, et al. Knowledge graph construction techniques [J]. Journal of computer research and development, 2016, 53(3): 582?600.
[8] 吳運兵,陰愛英,林開標(biāo),等.基于多數(shù)據(jù)源的知識圖譜構(gòu)建方法研究[J].福州大學(xué)學(xué)報(自然科學(xué)版),2017,45(3):329?335.
WU Yunbing, YIN Aiying, LIN Kaibiao, et al. Knowledge graph construction method based on multiple data sources [J]. Journal of Fuzhou University (Natural science edition), 2017, 45(3): 329?335.
[9] 胡芳槐.基于多種數(shù)據(jù)源的中文知識圖譜構(gòu)建方法研究[D].上海:華東理工大學(xué),2015.
HU Fanghuai. Research on construction method of Chinese knowledge atlas based on multiple data sources [D]. Shanghai: East China University of Science and Technology, 2015.
[10] 陳圣青.基于本體的知識發(fā)現(xiàn)系統(tǒng)框架研究[D].南京:南京航空航天大學(xué),2009.
CHEN Shengqing. Research on ontology based knowledge discovery system framework [D]. Nanjing: Nanjing University of Aeronautics & Astronautics, 2009.
[11] 韓春華,易思蓉,呂???基于GIS的鐵路選線智能環(huán)境及領(lǐng)域本體建模方法[J].中國鐵道科學(xué),2006,27(6):84?88.
HAN Chunhua, YI Sirong, L? Xikui. GIS based railway location intelligent environment and domain ontology modeling method [J]. China railway science, 2006, 27(6): 84?88.endprint