涂志健 吳建 衛(wèi)能 趙轉(zhuǎn)哲 馬強(qiáng)
(1 蕪湖賽寶機(jī)器人產(chǎn)業(yè)技術(shù)研究有限公司,安徽蕪湖,241003;2 蕪湖職業(yè)技術(shù)學(xué)院,安徽蕪湖,241000;3 安徽工程大學(xué)機(jī)械工程學(xué)院,安徽蕪湖,241000)
現(xiàn)如今工業(yè)發(fā)展迅速,RV 減速器是新興起的一種減速器,它具有質(zhì)量小、體積小、傳動(dòng)比變化的范圍大、使用壽命長、精度穩(wěn)定性好、傳動(dòng)效率高、傳動(dòng)性能平穩(wěn)等一系列優(yōu)點(diǎn)[1]。
故障處理的好壞是影響RV 減速器壽命長短的重要因素。由于RV 減速器的故障類型多,檢測處理效率低下復(fù)雜,并且處理成本高,導(dǎo)致其故障難以處理,因此,國內(nèi)外學(xué)者針對其故障處理提出了多種理論方法以及實(shí)踐。張冶[2]通過日常使用擺線針輪減速器,總結(jié)積累減速器故障處理經(jīng)驗(yàn),以此保證其正常使用;李學(xué)凌[3]提出分析工作中礦用減速器常見的故障種類和起因,總結(jié)常見的故障和原因,提出解決方法,為煤礦的安全生產(chǎn)提供可靠的保障;李蛟真[4]等主要對減速器的漏油與振動(dòng)異響兩類問題的成因及處理方法進(jìn)行了研究,提出了在減速器發(fā)生故障時(shí),查清故障成因,對癥采取措施,能有效解決“直接更換總成本較高”的問題;溥江[5]等通過計(jì)算行星齒輪減速器健康與斷齒故障下的時(shí)變嚙合剛度與動(dòng)力學(xué)模型,分析行星齒輪減速器在健康、點(diǎn)蝕、斷齒三種工況下的齒輪振動(dòng)特性,為減速器故障診斷提供理論依據(jù)。然而,以上的成果基本是通過人工總結(jié)和積累的故障處理經(jīng)驗(yàn),先查清故障成因,然后對故障進(jìn)行處理,沒有提出能夠快速查詢到故障原因的方法,同時(shí)其方法的使用需要日積月累,難以大眾化使用。
本文針對于RV 減速器故障處理的問題,提出建立知識(shí)圖譜,通過建立RV 減速器故障領(lǐng)域的知識(shí)圖譜將其數(shù)據(jù)可視化、可檢索,提高故障檢測的速度,使其能夠大眾化使用,提高了RV 減速器故障處理的便利性。
RV 減速器如圖1 所示。
圖1 RV 減速器
知識(shí)圖譜是利用圖的形式來描述知識(shí)和建模世界萬物之間關(guān)系的一種技術(shù)[6],百度對其的解釋為:知識(shí)圖譜是圖書情報(bào)界中的知識(shí)域可視化或知識(shí)領(lǐng)域映射地圖,是顯示知識(shí)發(fā)展進(jìn)程與結(jié)構(gòu)關(guān)系的一系列各種不同的圖形,用可視化技術(shù)描述知識(shí)資源及其載體,挖掘、分析、構(gòu)建、繪制和顯示知識(shí)及它們之間的相互聯(lián)系。
本質(zhì)上,知識(shí)圖譜是一種描述實(shí)體、實(shí)體屬性與實(shí)體關(guān)系的大型語義網(wǎng)絡(luò),基本形式是(實(shí)體1—關(guān)系—實(shí)體2)、(實(shí)體—屬性—屬性值),通常以網(wǎng)絡(luò)的形式出現(xiàn)。在知識(shí)圖譜中,節(jié)點(diǎn)可以代表一個(gè)概念、一個(gè)實(shí)體或一個(gè)屬性,邊可以代表實(shí)體、概念等相關(guān)屬性。
知識(shí)圖譜在不同應(yīng)用場景和不同業(yè)務(wù)的需求下都能夠提供服務(wù),知識(shí)圖譜的構(gòu)建步驟如圖2 所示。
圖2 知識(shí)圖譜構(gòu)建步驟示意圖
知識(shí)圖譜大致可分為兩類:一是通用知識(shí)圖譜,二是領(lǐng)域知識(shí)圖譜[7]。通用知識(shí)圖譜面向全領(lǐng)域,主要應(yīng)用于面向互聯(lián)網(wǎng)中的檢索、推薦、問答等業(yè)務(wù)場景,由于它強(qiáng)調(diào)的是廣度,精確度要求低,因而更多的是強(qiáng)調(diào)實(shí)體,很難生成完整的全局性本體層的統(tǒng)一管理。領(lǐng)域知識(shí)圖譜有嚴(yán)格與豐富的數(shù)據(jù)模式,因而要求構(gòu)建者有一定的深度與完備性,其對準(zhǔn)確度要求非常高,通常用于輔助各種復(fù)雜的分析應(yīng)用或決策支持,如軍事、機(jī)械、醫(yī)療等特定領(lǐng)域進(jìn)行輔助決策。本文所構(gòu)建的知識(shí)圖譜類型即為領(lǐng)域知識(shí)圖譜。
知識(shí)圖譜的數(shù)據(jù)來源非常多,如專業(yè)的數(shù)據(jù)庫、互聯(lián)網(wǎng)可供爬蟲爬取的數(shù)據(jù)等;數(shù)據(jù)類型基本為:結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化三種數(shù)據(jù),其中后兩者占比較大;因此對數(shù)據(jù)源的獲取需要使用知識(shí)圖譜中的知識(shí)抽取[8]。
對于結(jié)構(gòu)化數(shù)據(jù),經(jīng)過較簡單的處理便可獲得實(shí)體、實(shí)體關(guān)系、屬性、屬性值等;對于半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)而言,其數(shù)據(jù)置信度不高,規(guī)模較大,個(gè)性化的信息較多,形式復(fù)雜多樣,因此知識(shí)抽取主要處理的是半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。
知識(shí)抽取主要分為三大類:實(shí)體抽取,事件抽取與關(guān)系抽取。實(shí)體抽取的主要任務(wù)是實(shí)體識(shí)別,主要是識(shí)別三大類(實(shí)體類、時(shí)間類和數(shù)字類)與文本中的七小類(人名、機(jī)構(gòu)名、地名、時(shí)間、日期、 貨幣和百分比)命名實(shí)體,從而確定實(shí)體類別;事件抽取主要從數(shù)據(jù)中抽取出需要的事件信息,并以結(jié)構(gòu)化的形式呈現(xiàn)出來;關(guān)系抽取是通過給定的實(shí)體關(guān)系類別與結(jié)構(gòu)化數(shù)據(jù),自動(dòng)抽取實(shí)體之間的某種語義關(guān)系。
知識(shí)抽取常用的方法有:基于特征向量方法、基于核函數(shù)方法、基于神經(jīng)網(wǎng)絡(luò)方法,其中常用的為基于神經(jīng)網(wǎng)絡(luò)方法。
知識(shí)表示是將抽取的實(shí)體、實(shí)體關(guān)系、屬性、屬性值表示成機(jī)器能夠處理的數(shù)據(jù)結(jié)構(gòu)[8],其中最常用的是RDF 三元組結(jié)構(gòu)。該結(jié)構(gòu)能夠?qū)崿F(xiàn)不同領(lǐng)域的資源描述,為資源描述提供一種通用框架和實(shí)現(xiàn)數(shù)據(jù)集成的元數(shù)據(jù)解決方案。
RDF 三元組結(jié)構(gòu)的具體實(shí)施方式為:對實(shí)體加上一個(gè)屬性和相應(yīng)的屬性值,即實(shí)體1—關(guān)系—實(shí)體2、實(shí)體—屬性—屬性值,通過定義規(guī)則,將抽取的實(shí)體、屬性以及屬性定義轉(zhuǎn)換成RDF 三元組結(jié)構(gòu),形成數(shù)據(jù)層,在數(shù)據(jù)層的基礎(chǔ)上引入模式層,定義實(shí)體、屬性、關(guān)系來描述和約束資源,構(gòu)建基本的規(guī)則體系。
RDF 三元組結(jié)構(gòu)如圖3 所示。
圖3 RDF 三元組結(jié)構(gòu)示意圖
知識(shí)融合是將不同來源的數(shù)據(jù)知識(shí)進(jìn)行融合[8],進(jìn)行實(shí)體消歧、實(shí)體對齊、實(shí)體匹配等工作,其中最重要的是實(shí)體對齊工作。
不同來源的數(shù)據(jù)主要有結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。為了統(tǒng)一化管理,生成所需要的實(shí)體,使后續(xù)工作能夠進(jìn)行下去,必須要對不同來源的數(shù)據(jù)進(jìn)行融合。在進(jìn)行知識(shí)融合之前,第一步的工作便是實(shí)體對齊,實(shí)體對齊是為了判斷不同數(shù)據(jù)來源的實(shí)體是否為指向真實(shí)世界中同一個(gè)對象,包含實(shí)體消歧和共指消解。實(shí)體消歧的本質(zhì)在于解決一個(gè)詞有很多可能的意思,也就是在不同的上下文中所表達(dá)的含義不太一樣的問題;共指消解,也叫指代消解,解決指代不明的問題;通過實(shí)體對齊解決來自不同數(shù)據(jù)庫數(shù)據(jù)源一詞多義,以及指代不明的問題,提高知識(shí)融合后實(shí)體的準(zhǔn)確性。
知識(shí)推理是通過知識(shí)圖譜中已有的知識(shí)去推理未知的知識(shí)關(guān)系[8];如已知雄獅子吃肉,母獅子吃肉,能夠推出小獅子也吃肉;由于知識(shí)圖譜中的實(shí)體、實(shí)體關(guān)系和屬性種類繁多,人們難以將所有的推理方式都列舉出來,基本上都是在使用的過程中去總結(jié)。對于推理方式的總結(jié),人們必須依靠所使用知識(shí)圖譜中實(shí)體與實(shí)體關(guān)系或者實(shí)體與屬性來進(jìn)行實(shí)現(xiàn)。
知識(shí)圖譜中的知識(shí)是通過RDF 的結(jié)構(gòu)進(jìn)行表示的,其基本構(gòu)成單元是事實(shí),每個(gè)事實(shí)都被表示成三元組的形式。知識(shí)圖譜進(jìn)行知識(shí)存儲(chǔ)的常用存儲(chǔ)方式為圖數(shù)據(jù)庫存儲(chǔ),圖數(shù)據(jù)庫存儲(chǔ)的表現(xiàn)方式為節(jié)點(diǎn)、邊與屬性,節(jié)點(diǎn)代表的是實(shí)體、屬性值等對象;邊代表的是圖中連接節(jié)點(diǎn)的有方向的線條,用于代表不同節(jié)點(diǎn)之間的關(guān)系;屬性用于描述節(jié)點(diǎn)或者邊的特性;圖數(shù)據(jù)庫存儲(chǔ)的方式直觀、方便。
RV 減速器是新興起的減速器,而且其優(yōu)點(diǎn)明顯,是智能制造裝備與精密儀器的核心零件,但現(xiàn)在由于領(lǐng)域知識(shí)圖譜數(shù)據(jù)的特殊性和不斷更新的特性,因而現(xiàn)在對于構(gòu)建RV 減速器故障知識(shí)圖譜方面的技術(shù)很少,難以滿足人們對RV 減速器檢測的需求,故本文提出關(guān)于RV 減速器故障知識(shí)圖譜的構(gòu)建方法。
本文提出關(guān)于RV 減速器故障知識(shí)圖譜的構(gòu)建,并且根據(jù)RV 減速器的數(shù)據(jù)源提供了相應(yīng)的構(gòu)建方法,根據(jù)自頂向下和自底向上相結(jié)合的方式構(gòu)建垂直行業(yè)領(lǐng)域知識(shí)圖譜。自頂向下的構(gòu)建方法可以使知識(shí)圖譜的構(gòu)建得到簡化,并能使工作變簡單,實(shí)現(xiàn)快速構(gòu)建的目的。
本文提出自頂向下的方式構(gòu)建知識(shí)圖譜。首先定義知識(shí)圖譜的數(shù)據(jù)模式,數(shù)據(jù)模式從最頂層的概念開始構(gòu)建,通過人工構(gòu)建實(shí)體模式層,隨后逐漸向下一級細(xì)化,再通過底層數(shù)據(jù)的不斷填充,構(gòu)建并不斷滿足RV 減速器故障知識(shí)圖譜的需求。
根據(jù)RV 減速器故障的數(shù)據(jù)進(jìn)行實(shí)體、屬性、關(guān)系的定義,RV 減速器故障知識(shí)圖譜的構(gòu)建主要是數(shù)據(jù)的處理、知識(shí)表示、知識(shí)存儲(chǔ)與可視化、知識(shí)問答等過程。
知識(shí)圖譜建立的基礎(chǔ)是對數(shù)據(jù)源的抽取,因?yàn)镽V減速器為新型減速器,目前沒有其相關(guān)的結(jié)構(gòu)化數(shù)據(jù),因此本文主要對RV 減速器故障的非結(jié)構(gòu)化數(shù)據(jù)源進(jìn)行處理。
對RV 減速器故障的非結(jié)構(gòu)化數(shù)據(jù)的處理,主要通過知識(shí)抽取相關(guān)技術(shù),從不同結(jié)構(gòu)與類型的數(shù)據(jù)當(dāng)中,抽取出能夠被計(jì)算機(jī)理解的結(jié)構(gòu)化數(shù)據(jù),為知識(shí)圖譜的建立打下基礎(chǔ)。
本文通過人工的方式對采用的文本數(shù)據(jù)進(jìn)行處理,通過人工以及計(jì)算機(jī)對文本數(shù)據(jù)中關(guān)于RV 減速器不同部位的故障進(jìn)行分類處理。首先依據(jù)故障位置的不同,分為齒輪故障、漏油故障、噪聲振動(dòng)故障等;然后依據(jù)故障位置進(jìn)行故障分析,找出故障原因;最后提出改進(jìn)策略以及解決方案。
數(shù)據(jù)處理后,還需要通過知識(shí)表示才能使得處理后的數(shù)據(jù)成為被計(jì)算機(jī)可理解的數(shù)據(jù)結(jié)構(gòu)。
本文通過產(chǎn)生式規(guī)則[9]的方式進(jìn)行知識(shí)表示,通過已定義規(guī)則將已處理的數(shù)據(jù)通過三元組的形式表示,即定義為規(guī)則=<實(shí)體1,關(guān)系,實(shí)體2>的形式,規(guī)則代表的是已經(jīng)定義的規(guī)則;實(shí)體1 和實(shí)體2 代表的是實(shí)體的類別,如齒輪故障、磨損、膠合、加工精度差等;關(guān)系代表的是實(shí)體與實(shí)體之間的關(guān)系,如:齒輪故障,發(fā)生故障的原因是齒輪磨損,其中“齒輪故障”與“齒輪磨損”表示實(shí)體,“故障的原因”表示兩個(gè)實(shí)體之間的關(guān)系。根據(jù)定義的規(guī)則建立RV 減速器的知識(shí)結(jié)構(gòu),同時(shí)通過推理結(jié)構(gòu)控制整個(gè)過程的運(yùn)行,將其轉(zhuǎn)化為三元組結(jié)構(gòu)的形式,方便之后的查詢與分析。
產(chǎn)生式規(guī)則的表示結(jié)構(gòu)如圖4 所示。
圖4 產(chǎn)生式規(guī)則的表示結(jié)構(gòu)圖
RV 減速器知識(shí)圖譜數(shù)據(jù)只采用三元組的形式進(jìn)行存儲(chǔ),其使用人員能夠通過相關(guān)的信息進(jìn)行查詢,但是使用人員只能查詢到故障,卻不能直觀地看到查詢結(jié)果與故障之間的關(guān)系,這對于新人或者經(jīng)驗(yàn)較少的人員是及其不友好的。為了解決這個(gè)問題,本文采用現(xiàn)在應(yīng)用最為廣泛的圖數(shù)據(jù)庫軟件Neo4j[10]對三元組數(shù)據(jù)進(jìn)行處理,利用Python[11]相關(guān)代碼將RV 減速器的關(guān)系型數(shù)據(jù)寫入Neo4j 中,并通過Neo4j 生成可視化圖譜。
本文使用的可視化圖譜中含有32 個(gè)實(shí)體、7 種實(shí)體關(guān)系。其中,32 個(gè)實(shí)體在圖譜中表示為:10 個(gè)故障實(shí)體,例如齒輪、傳動(dòng)軸等;5 個(gè)故障表現(xiàn),例如齒輪磨損、斷齒、軸承振動(dòng)大、聲音異常等;6 個(gè)故障原因,例如加工精度差、制造設(shè)計(jì)強(qiáng)度不足、潤滑失效等;7 個(gè)故障改善,例如規(guī)范現(xiàn)場安裝聯(lián)軸器工藝,百分表檢測減速機(jī)輸入軸、輸出軸等;4 個(gè)建議,例如禁止超載使用、禁止違規(guī)操作等。可視化圖譜中每個(gè)實(shí)體都代表一個(gè)節(jié)點(diǎn),每條邊代表實(shí)體與實(shí)體之間的關(guān)系。實(shí)體即節(jié)點(diǎn)和邊的關(guān)系組成了RV 減速器知識(shí)可視化圖譜,其存儲(chǔ)方便并且提供了相應(yīng)的查詢算法,方便工作人員的使用與查詢??梢暬瘓D譜如圖5 所示。
圖5 可視化圖譜
建立可視化知識(shí)圖譜以后,便可以進(jìn)行知識(shí)問答系統(tǒng)的構(gòu)建。本文基于知識(shí)圖譜的問答系統(tǒng)包括問句分類程序、問句解析程序、回復(fù)程序以及問答程序四個(gè)模塊。
首先是問句分類程序模塊,使用的腳本文件是question_classifier——在其腳本文件中,對問句類型的特征詞進(jìn)行定義,例如齒輪故障、齒輪故障的子故障、齒輪膠合的原因等,實(shí)現(xiàn)對用戶輸入問句的類型進(jìn)行分類;然后是問句解析程序模塊,使用的腳本文件是questions_parse——在這個(gè)腳本文件中,需要根據(jù)上一步問句分類程序腳本文件中得到的問句類型,將其轉(zhuǎn)化為SQL 語句,根據(jù)SQL 語句對存儲(chǔ)在Neo4j 中的字段進(jìn)行提取;其次是回復(fù)程序模塊,使用的腳本文件是answer_search——在這個(gè)腳本文件中,需要根據(jù)上一步問句解析程序轉(zhuǎn)化得到的SOL 語句執(zhí)行查詢,并根據(jù)問句的類型來調(diào)用相應(yīng)的回復(fù)模板;最后是問答程序模塊,使用的腳本文件是chatbot_graph,其是通過調(diào)用以上的三個(gè)功能模塊來構(gòu)建并實(shí)現(xiàn)知識(shí)問答。當(dāng)給定自然語言問題之后,程序會(huì)對該問題進(jìn)行語義理解和解析,然后通過數(shù)據(jù)庫對解析結(jié)果進(jìn)行查詢,得到最終答案。問答界面如圖6 所示。
圖6 問答界面
為了提高RV 減速器故障的處理速度,本文提出構(gòu)建一種RV 減速器故障知識(shí)圖譜,并分析其在故障診斷中的有益之處;本文對知識(shí)圖譜的定義及相關(guān)技術(shù)進(jìn)行了介紹,并且從數(shù)據(jù)的處理、知識(shí)表示、知識(shí)存儲(chǔ)與可視化、知識(shí)問答等方面對RV 減速器故障知識(shí)圖譜的構(gòu)建進(jìn)行詳述,驗(yàn)證了RV 減速器故障知識(shí)圖譜能夠提高RV 減速器故障的處理速度,并且降低了其故障處理的難度。
RV 減速器故障知識(shí)圖譜的構(gòu)建極大地降低了故障處理所花費(fèi)的成本,也能夠?yàn)槠渌麢C(jī)械設(shè)備的故障知識(shí)圖譜構(gòu)建提供一些幫助。