慈 穎,秦留洋,韓惠婕
(1.北京跟蹤與通信技術(shù)研究所,北京 100094;2.北京航天測(cè)控技術(shù)有限公司,北京 100041)
知識(shí)圖譜實(shí)質(zhì)上是一種對(duì)知識(shí)的有效組織和表征的手段,是一個(gè)龐大的知識(shí)庫,知識(shí)以圖的結(jié)構(gòu)形式進(jìn)行鏈接[1]。知識(shí)圖譜通過描述數(shù)據(jù)之間的關(guān)系,減少了數(shù)據(jù)的提取和計(jì)算的困難。知識(shí)圖譜的應(yīng)用可以將隱藏在數(shù)據(jù)中的難以利用的價(jià)值得到充分地挖掘。尤其是通過信息抽取、知識(shí)加工等技術(shù)將某些非結(jié)構(gòu)化數(shù)據(jù)構(gòu)建為知識(shí)圖譜,使其能夠以結(jié)構(gòu)化、關(guān)聯(lián)化的狀態(tài)和接近人類認(rèn)知的形式被組織、管理和理解。
航天裝備體系組成復(fù)雜、裝備重多,信息量、復(fù)雜度和獲取難度都很大。而對(duì)航天裝備的在役考核目前礙于各方面條件限制,開展的程度較低,很多還處于理論研究的初級(jí)階段。應(yīng)用知識(shí)圖譜技術(shù)對(duì)航天裝備在役考核進(jìn)行深度分析評(píng)估是一種較為可行的方法。
知識(shí)圖譜是一種用圖模型來描述知識(shí)和建模關(guān)聯(lián)關(guān)系的技術(shù)方法[2],由節(jié)點(diǎn)和邊組成。節(jié)點(diǎn)表示實(shí)體,是知識(shí)圖譜的基本單元,承載了文本的重要信息;實(shí)體之間連接的邊為關(guān)系,不同的關(guān)系將獨(dú)立的實(shí)體連接在一起編制成圖。
知識(shí)圖譜在構(gòu)建中,以“實(shí)體—>關(guān)系—>實(shí)體” 結(jié)構(gòu)化三元組存在,通常通過“實(shí)體—>屬性—>屬性值”的形式體現(xiàn)鏈接關(guān)系,存儲(chǔ)現(xiàn)實(shí)世界中的實(shí)體(概念)。G=
。其中有些關(guān)系稱為屬性,相應(yīng)地,尾實(shí)體稱為屬性值[3]。關(guān)系定義靈活,支持使用者根據(jù)擴(kuò)展。圖1為典型的知識(shí)圖譜表示形式。
圖1 知識(shí)圖譜表示示例圖
由于其簡(jiǎn)潔直觀的展示形式、豐富的建模方法和對(duì)多維數(shù)據(jù)的高效融合,知識(shí)圖譜以其豐富的表達(dá)形式和表達(dá)內(nèi)容,成為當(dāng)前各個(gè)領(lǐng)域的研究熱點(diǎn)。廣泛應(yīng)用于機(jī)器翻譯、智能問答、推薦系統(tǒng)等各個(gè)領(lǐng)域[4-7]。
由于知識(shí)圖譜在生成過程中需要對(duì)知識(shí)數(shù)據(jù)進(jìn)行全面的分析、分類和歸納,因此以模型化、模塊化方法完成知識(shí)圖譜的構(gòu)建流程。其主要過程如圖2所示。
圖2 知識(shí)圖譜建模流程
圖3 航天裝備知識(shí)圖譜構(gòu)建過程
數(shù)據(jù)和信息是知識(shí)圖譜構(gòu)建和應(yīng)用的主要載體,知識(shí)圖譜的構(gòu)建過程就是對(duì)數(shù)據(jù)和信息的組織、歸納和分析,以建模手段完成模型創(chuàng)建和校驗(yàn),從而形成完備的知識(shí)模型。
裝備知識(shí)圖譜通過模型確定裝備的多級(jí)知識(shí)的表達(dá)形式,可視化、直觀的模型表達(dá)是知識(shí)圖譜構(gòu)建的首要工作和重要基礎(chǔ)。知識(shí)圖譜的表達(dá)模型要求在可視化的直觀圖形控件之中,最大程度描述事物間的基本關(guān)系、內(nèi)在特點(diǎn)與發(fā)展規(guī)律。通過知識(shí)本體可定義領(lǐng)域內(nèi)不同的實(shí)體概念、特別屬性及概念間的關(guān)系和鏈接。
知識(shí)圖譜可視化模型起到支撐整個(gè)知識(shí)圖譜的概念架構(gòu)和主體框架的作用,進(jìn)而實(shí)現(xiàn)規(guī)范數(shù)據(jù)信息、規(guī)范表達(dá)語境、規(guī)范理解層級(jí)等客觀要求,實(shí)現(xiàn)多維知識(shí)的有機(jī)統(tǒng)一、提升資源的利用率。因此保證知識(shí)圖譜可視化模型搭建的高準(zhǔn)確率十分必要[8]。
知識(shí)來源大致包括結(jié)構(gòu)化數(shù)據(jù)(如狀態(tài)監(jiān)控?cái)?shù)據(jù))、半結(jié)構(gòu)化數(shù)據(jù)(如日志文件)和非結(jié)構(gòu)化數(shù)據(jù)(如圖片、文檔、視頻)等幾類[9]。從數(shù)據(jù)信息形式和獲取途徑上來說,知識(shí)作為知識(shí)圖譜的實(shí)體,涵蓋的范圍較為廣泛。知識(shí)圖譜技術(shù)可以有效利用數(shù)據(jù)信息,構(gòu)建高質(zhì)量的知識(shí)庫,以知識(shí)庫作為知識(shí)結(jié)構(gòu)化表示的重要依托。
每一種數(shù)據(jù)源的知識(shí)化都需要綜合各種不同的技術(shù)手段。其中:
非結(jié)構(gòu)化數(shù)據(jù)是裝備知識(shí)的重要來源,這類知識(shí)的獲取需要綜合實(shí)體識(shí)別、實(shí)體鏈接、關(guān)系抽取、事件抽取等自然語言抽取技術(shù),實(shí)現(xiàn)從文本中抽取[10];
結(jié)構(gòu)化數(shù)據(jù)是最常用的數(shù)據(jù)來源之一。已有的結(jié)構(gòu)化數(shù)據(jù)庫通常不能直接作為知識(shí)圖譜使用,需要將結(jié)構(gòu)化數(shù)據(jù)定義到本體模型之間的語義映射,再通過編寫語義編譯工具實(shí)現(xiàn)結(jié)構(gòu)化數(shù)據(jù)到知識(shí)圖譜的轉(zhuǎn)化。
此外,需要綜合采用實(shí)體消歧、數(shù)據(jù)融合、知識(shí)鏈接等技術(shù),提升數(shù)據(jù)的規(guī)范化水平,增強(qiáng)數(shù)據(jù)之間的關(guān)聯(lián)。
知識(shí)表示就是使用計(jì)算機(jī)符號(hào)描述表示自然知識(shí),以支持機(jī)器進(jìn)行模擬推理的方法和技術(shù)。知識(shí)表示決定了圖譜構(gòu)建的產(chǎn)出目標(biāo),即知識(shí)圖譜的語義描述框架(Description Framework)、Schema與本體(Ontology)、知識(shí)交換語法(Syntax)、實(shí)體命名及ID體系。
基本描述框架定義知識(shí)圖譜的基本數(shù)據(jù)模型(Data Model)和邏輯結(jié)構(gòu)(Structure)。Schema與本體定義知識(shí)圖譜的類集、屬性集、關(guān)系集和詞匯集。交換語法定義知識(shí)實(shí)際存在的物理形式。實(shí)體命名及ID體系定義實(shí)體的命名原則及唯一標(biāo)識(shí)規(guī)范等。
按知識(shí)類的不同,知識(shí)圖譜包括詞(Vocabulary)、實(shí)體(Entity)、關(guān)系(Relation)、事件(Event)、術(shù)語體系(Taxonomy)、規(guī)則(Rule)等。詞一級(jí)的知識(shí)以詞為中心,并定義詞與詞之間的關(guān)系,如WordNet、ConceptNet等。實(shí)體一級(jí)的知識(shí)以實(shí)體為中心,并定義實(shí)體之間的關(guān)系、描述實(shí)體的術(shù)語體系等。事件是一種復(fù)合的實(shí)體。
對(duì)應(yīng)與知識(shí)圖譜的“頭實(shí)體—關(guān)系(屬性表達(dá))—尾實(shí)體(屬性值)”的三元組結(jié)構(gòu),知識(shí)獲取過程可大致分為實(shí)體獲取、關(guān)系獲取和屬性獲取。由于屬性本身是一類從屬于中央實(shí)體的特殊子實(shí)體,因此知識(shí)獲取過程可簡(jiǎn)化為“實(shí)體獲取”和“關(guān)系獲取”。
在實(shí)際應(yīng)用和模型創(chuàng)建過程中,由于需要兼顧后續(xù)知識(shí)圖譜的應(yīng)用和對(duì)知識(shí)數(shù)據(jù)與信息的有效管理,在實(shí)體獲取過程中要對(duì)泛化表述進(jìn)行概念化提取。而關(guān)系作為知識(shí)推理和智能檢索的重要依據(jù)和橋梁,其對(duì)各類型、各層級(jí)實(shí)體的組織規(guī)則、提取觸發(fā)的事件形式等均需要進(jìn)行特別的設(shè)計(jì)。
綜上,現(xiàn)代知識(shí)圖譜建模過程主要涵蓋了概念獲取、實(shí)體識(shí)別、關(guān)系獲取、事件獲取和規(guī)則獲取等幾大步驟[11]。其中:
概念獲取針對(duì)泛化、通用的基本表述進(jìn)行概念化闡釋,使之可以構(gòu)成可識(shí)別的概念語族;
實(shí)體獲取在概念語族的基礎(chǔ)上,識(shí)別領(lǐng)域內(nèi)的專有名詞和特殊詞語并加以歸類;
關(guān)系獲取是將眾多離散的實(shí)體以網(wǎng)狀的知識(shí)結(jié)構(gòu)建立實(shí)體間的語義鏈接;
事件獲取是對(duì)關(guān)系觸發(fā)的事件進(jìn)行定量化抽取和結(jié)構(gòu)化轉(zhuǎn)化的過程;
規(guī)則獲取是對(duì)關(guān)系觸發(fā)的形式、觸發(fā)后的響應(yīng)等內(nèi)容進(jìn)行定量化抽取和結(jié)構(gòu)化轉(zhuǎn)化的過程。
在遺忘很長(zhǎng)一段時(shí)間里,傳統(tǒng)的知識(shí)獲取過程要依賴專家經(jīng)驗(yàn)和專家系統(tǒng),知識(shí)獲取的方式也主要依靠專家手動(dòng)錄入。隨著人工智能技術(shù)的推廣和應(yīng)用,現(xiàn)代知識(shí)框架和模型的構(gòu)建主要采用自主學(xué)習(xí)和智能獲取的手段,依靠完備的多元數(shù)據(jù)庫中已有的結(jié)構(gòu)化數(shù)據(jù)和信息資源進(jìn)行轉(zhuǎn)化,形成基礎(chǔ)數(shù)據(jù)集,再依靠自動(dòng)知識(shí)抽取和知識(shí)圖譜補(bǔ)全技術(shù),從多種數(shù)據(jù)來源進(jìn)一步擴(kuò)展知識(shí)圖譜,實(shí)現(xiàn)知識(shí)圖譜質(zhì)量的進(jìn)一步提升[12]。
其中,尤其以從文本等非結(jié)構(gòu)化數(shù)據(jù)中獲取知識(shí)最為關(guān)鍵和重要。當(dāng)前主要的從非結(jié)構(gòu)化數(shù)據(jù)中獲取知識(shí)的方法包括實(shí)體識(shí)別和關(guān)系抽取。實(shí)體識(shí)別主要分為實(shí)體類識(shí)別、時(shí)間類識(shí)別和數(shù)字類識(shí)別3個(gè)大類。通過將文本語料進(jìn)行預(yù)處理后,從中提取句子特征,并輸入到實(shí)體識(shí)別模型中,識(shí)別出具有特定意義的實(shí)體。典型的關(guān)系抽取方法可以分為基于特征模板的方法[13]、基于核函數(shù)的監(jiān)督學(xué)習(xí)方法[14]、基于遠(yuǎn)程監(jiān)督的方法[15]和基于深度學(xué)習(xí)的監(jiān)督方法[16]。
知識(shí)融合技術(shù)有效解決了固定化的知識(shí)圖譜難以擴(kuò)展的問題,從譜系中心實(shí)體的本身知識(shí)拓展需求和多型異構(gòu)譜的融合需求等多個(gè)方面實(shí)現(xiàn)了已有知識(shí)圖譜模型的擴(kuò)充和晚上。在多個(gè)知識(shí)圖譜作為子譜進(jìn)行同一化融合,或者將外部數(shù)據(jù)庫數(shù)據(jù)信息合并到本體知識(shí)庫時(shí),需要處理兩個(gè)層面的問題:
首先,結(jié)構(gòu)、關(guān)系等模式層的異構(gòu)必然為多子譜融合造成障礙,如何通過模式層的融合,將新得到的本體融入已有的本體庫中,以及新舊本體的融合是知識(shí)圖譜模型融合的重要問題;
其次,數(shù)據(jù)信息本身的結(jié)構(gòu)、內(nèi)容和存儲(chǔ)方式等數(shù)據(jù)層的差異也會(huì)對(duì)融合和并構(gòu)的準(zhǔn)確率與效率造成影響。如何通過數(shù)據(jù)層的融合(即實(shí)體和關(guān)系(包括屬性)元組的融合),包括實(shí)體的指稱、屬性、關(guān)系以及所屬類別等,避免實(shí)例以及關(guān)系的沖突,造成不必要的冗余,是知識(shí)圖譜融合過程中需要解決的另一個(gè)主要問題。
特別的,在考慮數(shù)據(jù)層的融合過程中,現(xiàn)有的常規(guī)方式是實(shí)體匹配或?qū)R。由于多維異構(gòu)的知識(shí)庫中實(shí)體類型和存儲(chǔ)方式并不相同,因此會(huì)出現(xiàn)大量的實(shí)體含義相同,但標(biāo)識(shí)符不同的現(xiàn)象,導(dǎo)致標(biāo)識(shí)符指稱和本體內(nèi)容出現(xiàn)歧義和混淆。因此需要對(duì)這些實(shí)體進(jìn)行合并處理[17-18]。此外,新增實(shí)體之后,為了保持新圖譜模型的可用性、內(nèi)容一致性和準(zhǔn)確性,還需要對(duì)新增實(shí)體和關(guān)系進(jìn)行驗(yàn)證。
實(shí)體驗(yàn)證完成實(shí)體的準(zhǔn)確性、合規(guī)性的校驗(yàn)評(píng)估,主流方法通常是在校驗(yàn)過程中,為新加入的中心實(shí)體節(jié)點(diǎn)信息和屬性實(shí)體節(jié)點(diǎn)信息等均賦予置信度的值,據(jù)此進(jìn)行知識(shí)的過濾和融合。通過實(shí)體對(duì)齊實(shí)現(xiàn)對(duì)實(shí)體的表述意義和方式的明確。
實(shí)體對(duì)齊主要用于解決多源實(shí)體的指代異常結(jié)構(gòu)和存在的問題。通常包括兩方面內(nèi)容和功能,分別為實(shí)體消歧和共指消解。其中實(shí)體消歧指的是判斷知識(shí)庫中的同名實(shí)體是否代表不同的含義,而共指消解主要判定知識(shí)庫中是否存在其他命名實(shí)體表示相同的含義。通過實(shí)體消歧和共指消解等技術(shù)手段,實(shí)現(xiàn)了融合后新譜的知識(shí)實(shí)體和屬性實(shí)體具有“3個(gè)一性”,即統(tǒng)一性、唯一性和同一性。常見的實(shí)體消歧和共指消解方法主要是聚類法,即通過空間向量、語義模型、社會(huì)網(wǎng)絡(luò)模型、百科知識(shí)模型和增量證據(jù)模型定義實(shí)體對(duì)象與指稱項(xiàng)之間的相似度。
本體是針對(duì)特定領(lǐng)域中Schema定義、概念模型和公里定義而言的,實(shí)現(xiàn)彌合詞匯異構(gòu)性和語義歧義的間隙,使溝通達(dá)成共識(shí)。這種共識(shí)通過一個(gè)反復(fù)的過程達(dá)到,每次迭代都是一次共識(shí)的修改。因此,本體對(duì)齊帶來的是共識(shí)模式的演化。本體演化管理框架采用KAON[19]、Conto-diff[20]和OntoView等。
知識(shí)推理通過知識(shí)圖譜補(bǔ)全方式實(shí)現(xiàn)?;诒倔w推理的補(bǔ)全方法是一類常見的知識(shí)圖譜補(bǔ)全方法。主要針對(duì)概念層進(jìn)行推理(TBox),也可以用來對(duì)實(shí)體級(jí)的關(guān)系進(jìn)行補(bǔ)全。
還有一類補(bǔ)全方法是基于圖結(jié)構(gòu)和關(guān)系路徑特征的方法,主要包括基于隨機(jī)游走獲取路徑特征的PRA算法、基于子圖結(jié)構(gòu)的SFE算法、基于層次化隨機(jī)游走模型的PRA算法等。這些算法的共同特點(diǎn)是通過兩個(gè)實(shí)體之間的路徑,以及節(jié)點(diǎn)周圍圖的結(jié)構(gòu)提取特征,并試圖降低特征提取的復(fù)雜度,然后疊加現(xiàn)行的學(xué)習(xí)模型進(jìn)行關(guān)系的預(yù)測(cè)。
另一類常見的知識(shí)圖譜補(bǔ)全算法是基于表示學(xué)習(xí)和知識(shí)圖譜嵌入的鏈接預(yù)測(cè)。對(duì)于簡(jiǎn)單的單步推理,可采用基本翻譯模型、組合模型和神經(jīng)元模型等簡(jiǎn)單的嵌入模型,對(duì)于復(fù)雜的模型,可以采用向量空間中引入隨機(jī)游走模型的方法。
此外,文本信息也常被用來輔助知識(shí)圖譜的補(bǔ)全,從而實(shí)現(xiàn)非結(jié)構(gòu)化信息的最大化應(yīng)用。
基于知識(shí)圖譜的知識(shí)檢索是知識(shí)圖譜的主要應(yīng)用形式,是將知識(shí)來源的元知識(shí)應(yīng)用到特定領(lǐng)域的最后一步。目前主要的形式包括語義檢索和智能問答兩種。其中,語義搜索通過直接對(duì)來自文本、圖片等各種信息資源的事物語義進(jìn)行搜索,并提這些事物的分類、屬性和關(guān)系的描述,有效提高搜索的效率和準(zhǔn)確率。例如直接搜索某型衛(wèi)星的基礎(chǔ)指標(biāo)出廠檢驗(yàn)值等屬性內(nèi)容作為分析評(píng)估的判定輸入。
智能問答實(shí)現(xiàn)對(duì)用戶提出的問題進(jìn)行解答,根據(jù)用戶輸入的自然語言問句進(jìn)行分類,按照已經(jīng)制定好的模板規(guī)則進(jìn)行匹配,再轉(zhuǎn)邏輯查詢語言到數(shù)據(jù)庫中查詢。在對(duì)問句進(jìn)行預(yù)處理后,與既定的問題模板進(jìn)行匹配,然后將自然語言查詢轉(zhuǎn)換為數(shù)據(jù)庫查詢語言,與此同時(shí),將問句中的核心實(shí)體識(shí)別出來,并將該實(shí)體的概念圖譜在前端呈現(xiàn),最終,依據(jù)概念圖譜與查詢語句便可以得到該問題的答案。如以某故障現(xiàn)象的排除作為問句,到故障診斷相關(guān)的知識(shí)圖譜中匹配答案,系統(tǒng)識(shí)別關(guān)鍵實(shí)體為故障現(xiàn)象,關(guān)系(理解為操作)為排除此故障的方法,則會(huì)通過案例等故障診斷資源實(shí)現(xiàn)排故建議答案的給出和生成。
航天裝備由一系列不同類型(型號(hào))的衛(wèi)星裝備和相應(yīng)配套的地面站構(gòu)成,共同完成相應(yīng)的作戰(zhàn)和保障任務(wù)。由于復(fù)雜的裝備構(gòu)成和裝備本身的復(fù)雜精密的特性,以航天裝備為典型評(píng)估對(duì)象,依托本文提出的基于三元組的知識(shí)圖譜對(duì)其進(jìn)行綜合評(píng)估,可以有效提高知識(shí)的檢索和應(yīng)用效率。下圖為航天裝備知識(shí)圖譜構(gòu)建與應(yīng)用的方法流程。
本文基于自主研發(fā)的航天裝備在役考核綜合評(píng)估系統(tǒng),在全面收集、梳理相應(yīng)的裝備零散知識(shí)的基礎(chǔ)上,應(yīng)用本文所述的知識(shí)圖譜創(chuàng)建與關(guān)聯(lián)方法實(shí)現(xiàn)了航天裝備的知識(shí)圖譜的創(chuàng)建與應(yīng)用,并以軟件形式對(duì)本文方法進(jìn)行了驗(yàn)證。
航天裝備的知識(shí)來源主要包括組成體系的衛(wèi)星裝備本體知識(shí)、體系構(gòu)建的結(jié)構(gòu)知識(shí)、體系服役期間的使用維護(hù)知識(shí)、體系的支援保障任務(wù)知識(shí)等內(nèi)容。航天裝備的知識(shí)特點(diǎn)是“靜態(tài)知識(shí)與動(dòng)態(tài)知識(shí)深度融合、歷史數(shù)據(jù)和實(shí)時(shí)數(shù)據(jù)互為依托、單體知識(shí)和體系知識(shí)各有側(cè)重”,總體呈現(xiàn)“知識(shí)體量龐大、知識(shí)來源復(fù)雜、知識(shí)體系零散、知識(shí)結(jié)構(gòu)多樣”的鮮明特征。
1)衛(wèi)星系統(tǒng)本體知識(shí)。主要來源于衛(wèi)星裝備的研制單位、生產(chǎn)單位、測(cè)試單位和使用單位。包括裝備設(shè)計(jì)文檔、技術(shù)資料、出廠檢驗(yàn)資料、使用履歷資料等多類型非結(jié)構(gòu)文本、結(jié)構(gòu)化數(shù)據(jù)庫數(shù)據(jù)。
2)體系構(gòu)建應(yīng)用知識(shí)。主要來源于航天裝備的應(yīng)用單位(以軍事航天部隊(duì)為主)。包括航天裝備的基本信息、體系的裝備構(gòu)成、體系的應(yīng)用數(shù)據(jù)等多類型非結(jié)構(gòu)文本、結(jié)構(gòu)化數(shù)據(jù)庫數(shù)據(jù)。
3)體系綜合維護(hù)知識(shí)。主要來源于航天裝備的應(yīng)用和維護(hù)單位。包括在役考核分析評(píng)估的指標(biāo)體系數(shù)據(jù)、航天裝備故障數(shù)據(jù)、綜合保障維護(hù)數(shù)據(jù)等多類型非結(jié)構(gòu)文本、結(jié)構(gòu)化數(shù)據(jù)庫數(shù)據(jù)。
4)作戰(zhàn)保障任務(wù)知識(shí)。主要來源于請(qǐng)求保障單位和航天裝備的應(yīng)用維護(hù)單位。包括航天裝備的作戰(zhàn)和保障任務(wù)詳情、多維度多層次約束條件等。
圖4為航天裝備知識(shí)的組織結(jié)構(gòu)圖,直觀地說明了航天裝備的知識(shí)來源。
圖4 航天裝備知識(shí)來源說明軟件示意圖
圖5 典型核心航天裝備知識(shí)圖譜表示軟件示意圖
圖6 航天裝備多層次知識(shí)獲取軟件示意圖
圖7 多元子譜融合軟件示意圖
圖8 基于知識(shí)圖譜的檢索推理軟件示意圖
航天裝備的知識(shí)表示結(jié)合體系復(fù)雜的知識(shí)來源和知識(shí)結(jié)果,以及航天裝備的特點(diǎn),以體系內(nèi)的主戰(zhàn)裝備為核心節(jié)點(diǎn),通過多維語言描述和關(guān)系運(yùn)算,對(duì)知識(shí)進(jìn)行體系化串聯(lián)、多極化表示和網(wǎng)絡(luò)化構(gòu)建[21]。
以型號(hào)為主軸,將主要型號(hào)裝備作為知識(shí)圖的核心要素,進(jìn)行多級(jí)多維知識(shí)圖譜子譜的構(gòu)建。如創(chuàng)建某型衛(wèi)星的知識(shí)圖譜,則該型衛(wèi)星就作為中心節(jié)點(diǎn),該衛(wèi)星的特征屬性、衛(wèi)星系統(tǒng)內(nèi)的其他裝備實(shí)體、裝備指標(biāo)體系等均可以藉由特定的關(guān)系描述與該衛(wèi)星連接,從而形成豐富的知識(shí)圖譜。
航天裝備的知識(shí)數(shù)據(jù)形式多種多樣,涵蓋了結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)等類型,因此協(xié)調(diào)統(tǒng)一的知識(shí)獲取方式尤為重要。
從結(jié)構(gòu)化數(shù)據(jù)庫表中獲取知識(shí)一般使用現(xiàn)有的D2R工具,如Triplify、D2RServer、OpenLink、SparqlMap、Ontop等。從非結(jié)構(gòu)化文本信息中獲取知識(shí)一般使用簡(jiǎn)單CNN、MP-CNN、MWK-CNN、PCNN、PCNN+Att和MIMLCNN等智能化分析算法。
航天裝備的的深度綜合分析評(píng)估涉及多類裝備系統(tǒng)、多型裝備型號(hào)、多個(gè)裝備實(shí)例等復(fù)雜情況,對(duì)應(yīng)的體系級(jí)知識(shí)圖譜必然要涵蓋這些分立的知識(shí)圖譜,這就需要構(gòu)建融合知識(shí)圖譜。在融合知識(shí)圖譜的構(gòu)建和應(yīng)用過程考慮兩個(gè)主要問題,即體系作為新的本體,如何融入已有的裝備本體庫中,以及不同實(shí)體之間是否存在關(guān)系的沖突或冗余(易發(fā)生在同型裝備的不同實(shí)例之間)。
通過為航天裝備創(chuàng)建全新的虛擬核心節(jié)點(diǎn)(即不需要真實(shí)裝備實(shí)體作為節(jié)點(diǎn)支撐)實(shí)現(xiàn)體系節(jié)點(diǎn)的具象化表達(dá)。為了實(shí)現(xiàn)對(duì)基于裝備型號(hào)的子譜的融合、囊括和一體化表征,以實(shí)際運(yùn)行的航天裝備組成為關(guān)系鏈條(邊),通過多維語言描述建立體系節(jié)點(diǎn)與型號(hào)裝備節(jié)點(diǎn)之間的連接,從而融合了以裝備節(jié)點(diǎn)為核心要素的型號(hào)裝備的子譜,構(gòu)成了統(tǒng)一的體系知識(shí)圖譜。
子譜融合過程中,采用語義分析和關(guān)系檢驗(yàn)方法對(duì)子譜進(jìn)行節(jié)點(diǎn)校驗(yàn)和析分、融合和冗余剔除。以多實(shí)例同型裝備子譜融合為例,在實(shí)際體系級(jí)知識(shí)圖譜創(chuàng)建過程中,基于體系構(gòu)成和智能分析方法,對(duì)多實(shí)例裝備采取兩種策略。對(duì)體系整體功能沒有特異性影響,實(shí)例的體系貢獻(xiàn)相同,只是單裝功能的線性疊加和增強(qiáng)的裝備實(shí)例而言,通過對(duì)其核心節(jié)點(diǎn)與體系節(jié)點(diǎn)的邊進(jìn)行賦權(quán)表征數(shù)量的方法實(shí)現(xiàn)融合;若不同實(shí)例的功能作用、體系貢獻(xiàn)、布局影響等要素不同,需要作為不同的節(jié)點(diǎn)分別與體系節(jié)點(diǎn)連接,從而精準(zhǔn)劃分裝備節(jié)點(diǎn),優(yōu)化知識(shí)圖譜。
航天裝備基于知識(shí)圖譜的綜合評(píng)估綜合運(yùn)用知識(shí)圖譜對(duì)多維知識(shí)的有效組織和層次化建模功能,滿足自身對(duì)知識(shí)定位、綜合評(píng)估的綜合性、高效性、實(shí)時(shí)性的需求。
以語義識(shí)別為基礎(chǔ),通過多種錄入搜索模式實(shí)現(xiàn)對(duì)知識(shí)的推理、檢索和分析。在廣泛豐富的數(shù)據(jù)資源的支撐下,通過補(bǔ)全圖譜方法,應(yīng)用深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)技術(shù),實(shí)現(xiàn)對(duì)知識(shí)圖譜的深化推理和拓展應(yīng)用。準(zhǔn)確的自然語義識(shí)別和分析、功能完善強(qiáng)大的多線程檢索引擎等技術(shù)的引入,實(shí)現(xiàn)了知識(shí)需求的快速分析、知識(shí)要素的精準(zhǔn)匹配和知識(shí)結(jié)果的高效輸出。
知識(shí)圖譜作為人工智能技術(shù)領(lǐng)域的知識(shí)容器和孵化器,已經(jīng)在AI領(lǐng)域的發(fā)展中發(fā)揮了重要的作用。而面對(duì)以航天裝備為代表的全軍各類型裝備的信息化升級(jí)和智能化應(yīng)用需求的不斷上升,以知識(shí)表示、抽取、存儲(chǔ)、計(jì)算、應(yīng)用等一系列技術(shù)“有機(jī)集合、體系整合、鏈條融合”為特征的知識(shí)圖譜技術(shù),必然會(huì)在智能裝備研制、生產(chǎn)和使用維護(hù)中真正落地,發(fā)揮重要的作用,助力裝備的升級(jí)和我國(guó)國(guó)防現(xiàn)代化事業(yè)的建設(shè)。