馬 莉
在大數(shù)據(jù)時代下,海量的數(shù)據(jù)信息呈爆炸式增長。機械制造業(yè)是國民經(jīng)濟的基礎(chǔ)產(chǎn)業(yè),它的發(fā)展直接影響到國民經(jīng)濟各部門的發(fā)展。金屬切削是用刀具從工件切除多余材料,是金屬加工工藝中的一種重要成形方法,在機械制造中占據(jù)重要地位。工件和刀具在切削過程中相互作用,“機床-刀具-工件”構(gòu)成一個機械加工工藝系統(tǒng)。研究人員對金屬切削加工過程的研究持續(xù)不斷,且碩果累累。選取這些海量信息時,如何從其中的眾多數(shù)據(jù)信息中選出有價值以及有用的信息資源,同時向用戶呈現(xiàn)這些資源,已經(jīng)成為重點關(guān)注的一項問題。而知識圖譜的出現(xiàn),有效解決知識針對性選擇的問題,在各領(lǐng)域逐漸被廣泛應用,在金屬切削加工中,進行知識圖譜構(gòu)建意義重大,能夠有效提升加工效率,提升信息資源的利用率,本文對此進行深入分析,具體如下。
對于金屬切削加工而言,主要是通過具有刃口,并且工件堅硬的切削工具,切去坯件上存在的多余金屬,保證工件表面質(zhì)量、形狀及尺寸滿足規(guī)定要求,屬于一種較為常見的金屬加工方法。實際切削加工環(huán)節(jié),工件表面加工,主要是通過工件與切削工具相對運動進行實現(xiàn)。根據(jù)表面形成方式,可以將切削加工具體分為以下幾種類型:第一,刀尖軌跡法。這種方式主要是通過刀尖在工件表面按照既定的運動軌跡進行切削,使工件獲得要求的表面幾何形狀,包括刨削平面、車削以及磨削內(nèi)外圓等。第二,成形刀具法。根據(jù)工件表面輪廓,應用相應的成形砂輪及刀具等,進行實際加工,最終獲得成形面,在這一環(huán)節(jié),機床只進行橫向進給運動即可,例如成形砂輪磨削、成形銑刀銑削以及成形車刀車削等。第三,展成法。利用這種方法進行加工時,基于既定規(guī)律下,保證工件與切削工具進行相對展成運動,在坯件中,會在刀刃的作用下形成最終的加工表面。例如刨齒、插齒、滾齒以及錐砂輪磨齒等。除此之外,成形刀具法與刀尖軌跡法良好結(jié)合下,會形成一些新的切削加工形式,例如螺紋車削。根據(jù)工藝特征對切削加工進行分類。可將其分為刮削、車削、螺紋加工、鉆削、齒輪加工、銑削、鉗工、拋光、研磨、拋光、刨削、鏜削、超精加工等。通過強力切削、高速切削、振動切削以及等離子弧加熱切削等方式,能夠使加工效率得到進一步提升。
隨著對金屬切削加工深入的研究以及計算機系統(tǒng)在制造業(yè)的廣泛應用,已形成一系列概念和概念之間的關(guān)系用于描述金屬切削加工過程。例如,切削力、切削熱和切削溫度、刀具磨損等等。金屬切削過程就是用刀具在機床上從工件表面切去多余的金屬,形成已加工表面的過程,也是工件的切削層在刀具前面擠壓下產(chǎn)生塑性變形,形成切屑而被切下來的過程。隨著切削過程的發(fā)生和發(fā)展,形成了許多物理現(xiàn)象。例如,積屑瘤的成因,切屑形成的機理等。企業(yè)和高校的研究人員已總結(jié)形成了一整套關(guān)于金屬切削過程中的基本物理現(xiàn)象及其變化規(guī)律,本文將這些物理現(xiàn)象及其變化規(guī)律稱為事實性知識。
2012年,谷歌首次提出知識圖譜這一概念,其原本的目的在于提升搜索性能,實現(xiàn)智能化搜索,對用戶搜索體驗進行優(yōu)化。王昊奮等人員認為,基于本質(zhì)上來講,知識圖譜屬于一種語義網(wǎng)絡,在這一網(wǎng)絡中,實例通過結(jié)點進行表示,而實例間存在的各種語義關(guān)系,則通過邊進行表示。此外,相關(guān)研究人員認為,知識圖譜實際上屬于呈現(xiàn)知識屬性關(guān)系與發(fā)展流程的諸多圖形,在可視化技術(shù)配合下,清晰地呈現(xiàn)出圖形中所表示的知識實體及屬性、知識實體間存在的關(guān)系。按照服務領(lǐng)域,可將知識圖譜分為以下幾類:一類是通用知識圖譜,這一類型的知識圖譜,主要是為橫向需求提供服務,將橫向覆蓋面作為主要的關(guān)注點,涉及各個領(lǐng)域的大量實體,在相互關(guān)系作用下,從而形成多維度的知識圖譜,主要應用于問答、推薦以及搜索等業(yè)務場景中。另一類屬于行業(yè)知識圖譜,這一類型的知識圖譜,主要是為縱向需求提供服務,將縱深覆蓋面作為主要的關(guān)注點,因為會對專業(yè)領(lǐng)域的業(yè)務場景有所涉及,在實體數(shù)量上相對較少,需要基于縱向維度下,對實體間存在的關(guān)系進行充分的抽取,其主要在醫(yī)療、圖書情報以及金融行業(yè)應用較為廣泛。
當知識圖譜類型不同時,其實際的構(gòu)建方式也會存在較大的差異,在構(gòu)建形式上主要有以下幾種:一種為自頂向上的構(gòu)建方式,這種構(gòu)建方式在模型及規(guī)則上先于知識,另一種為自底向上的構(gòu)建方式,這一構(gòu)建方式的構(gòu)建知識先于模型。在圖譜構(gòu)建上,主要會經(jīng)歷三個步驟,步驟一,知識抽?。徊襟E二,知識融合;步驟三,知識存儲及更新。
首先,知識抽取。進行知識圖譜構(gòu)建時,知識從哪里來是最先需要考慮的問題,如何在大量的相關(guān)數(shù)據(jù)中,將有效的知識提出出來,就是知識抽取,知識抽取環(huán)節(jié),一般是在不用的領(lǐng)域中進行該領(lǐng)域數(shù)據(jù)的收集,預處理結(jié)構(gòu)化以及非結(jié)構(gòu)化數(shù)據(jù),形成知識的同時,獲取知識屬性,并且,還會枚舉出關(guān)系列表??梢酝ㄟ^以下方法進行實體抽?。旱谝?,利用規(guī)則進行實體抽取。對所需目標實體規(guī)則進行預先定義,基于該規(guī)則下,匹配原始語料,從而獲得符合需求的實體。第二,通過統(tǒng)計機器學習進行抽取。利用訓練好的模型,篩選數(shù)據(jù),最終得到想要的實體。相關(guān)研究者通過K緊鄰算法與線性條件隨機場模型的良好結(jié)合,進行實體識別。第三,利用開放域進行抽取。相關(guān)學者在實際分析中,在開放的網(wǎng)絡數(shù)據(jù)中,利用已知實體的語義特征進行實體抽取。在關(guān)系抽取方式上,有以下分類:第一,監(jiān)督學習下的關(guān)系抽取。該環(huán)節(jié)中,先標注相應數(shù)據(jù),隨后訓練模型,最終抽取數(shù)據(jù)集中的關(guān)系。第二,半監(jiān)督或無監(jiān)督下的關(guān)系抽取。將未標注及部分標注數(shù)據(jù)作為訓練源開展實際訓練,隨后抽取數(shù)據(jù)集中的關(guān)系。第三,模板下的關(guān)系抽取。這一抽取方式中,主要是進行抽取關(guān)系模板的預先定義,按照該模板抽取關(guān)系,不過這種方式存在較大的維護難度,同時,在大量數(shù)據(jù)中不適用。
其次,知識融合。對于知識融合而言,其表示的是提供用戶基于業(yè)務配置融合規(guī)則同自動算法相結(jié)合的知識融合等能力,能夠?qū)崿F(xiàn)沖突的自動檢測,并且按照決策進行針對性解決。進行知識融合時,主要會涉及到以下幾點重要內(nèi)容:第一,實體消歧。通常情況下,某個實體需要具體代表現(xiàn)實中存在的某個實物,部不可對應現(xiàn)實中存在的多個真實實物,進行實體消歧時,可以選擇實體連接以及聚類等方式。相關(guān)學者在維基百科知識背景下,精確的找出了實體間的相似性,達到了較好的消歧效果。第二,實體對齊。存在一些實體,其在現(xiàn)實中表示的是相同的實體,對于這種類型的數(shù)據(jù),應做出實體對齊處理??梢酝ㄟ^深度學習的方式,進行實體對齊。在嵌入表示的實體對齊方面,可以選擇監(jiān)督學習的方式進行實體對齊,這種方式對數(shù)據(jù)標注存在較大的依賴性,會花費較多的時間,而無監(jiān)督學習的方式,則會對驗證集相似度計算方式存在較大的依賴。第三,知識合并。此項工作開展中,會對不同源數(shù)據(jù)信息做出合并處理,一般為兩個層次的數(shù)據(jù),一是數(shù)據(jù)層融合,在這層數(shù)據(jù)融合中,主要關(guān)注的問題是如何防治關(guān)鍵沖突與實例沖突,防止冗余的出現(xiàn)。二是模擬層融合,其實際上就是在已有本體庫中,將新獲得的本體融入其中。
最后,知識存儲與更新。在大規(guī)模的知識圖譜存儲上,主要是以三元組存儲為核心,并且,其他類型知識的存儲也包含其中。在三元組知識的存儲上,具體包括兩種類型,一種是資源描述框架存儲,其主要的基礎(chǔ)為RDF圖模型,另一種為圖數(shù)據(jù)庫,其中多數(shù)應用的是屬性圖數(shù)據(jù)模型。在新數(shù)據(jù)的不斷生成下,實現(xiàn)知識更新,三元組的不斷更新及生成,從而更新圖譜。
進行金屬切削技工過程知識獲取時,先進行TBox,即本層模式層的構(gòu)建,隨后再進行ABox的建立。金屬切削環(huán)節(jié),實際上就是在機床上利用刀具,將工件表面多余的金屬切去,最終形成想要的加工表面,簡單而言,就是在刀具的擠壓作用下,使工件的切削層發(fā)生塑性變形,最終切下切屑的過程。在切削過程不斷發(fā)展中,形成了較多的物理現(xiàn)象,現(xiàn)階段,已經(jīng)形成一整套金屬切削環(huán)節(jié)的變化規(guī)律以及基本物理現(xiàn)象,即事實性知識,其對于生產(chǎn)率提高、加工質(zhì)量保證、生產(chǎn)實踐指導以及成本降低存在較為積極的作用。并且,當前信息化建設不斷深入,企業(yè)中廣泛應用到了各種新型系統(tǒng),例如MES、CAPP、ERP以及CAM等,企業(yè)中已經(jīng)具備較多的切削加工數(shù)據(jù),均是企業(yè)寶貴的數(shù)據(jù)資源,在指導生產(chǎn)及決策上意義重大,以上數(shù)據(jù)為過程性知識。在事實性知識與過程性知識的良好結(jié)合下,可以實現(xiàn)相互轉(zhuǎn)換。在相應軟件應用下,對其進行OWL本體建模。
構(gòu)建完成金屬切削知識圖譜的TBox后,進行ABox的構(gòu)建,根據(jù)本體模式,實現(xiàn)三元組形式數(shù)據(jù)的生成?,F(xiàn)階段,與其他機械制造型企業(yè)一樣,xx公司已有多種應用系統(tǒng),包括MES、CAPP以及ERP等,這些數(shù)據(jù)系統(tǒng)中,均存在與切削加工相關(guān)的數(shù)據(jù),同時彼此隔離,形成了相應的數(shù)據(jù)孤島?;旧线@些數(shù)據(jù)被存放在關(guān)系型數(shù)據(jù)中,屬于知識圖譜的關(guān)鍵數(shù)據(jù)源。所以,在金屬切削知識圖譜構(gòu)建中,根據(jù)本體模式進行多源數(shù)據(jù)的集成與融合,是一項較為關(guān)鍵的技術(shù)。
Ontop屬于現(xiàn)階段較為成熟的軟件平臺,其是在本體構(gòu)建的基礎(chǔ)上,對本體與關(guān)系數(shù)據(jù)庫表模式間存在的映射關(guān)系進行定義,進而對多數(shù)據(jù)源數(shù)據(jù)進行訪問,以OBDA為主要架構(gòu),支持所有W3C推薦的關(guān)于OBDA的標準,包括SWRL、OWL2QL、SPARQL以及后向推理等。本文通過這一軟件平臺,進行數(shù)據(jù)集成框架構(gòu)建,從而獲得金屬切削知識圖譜三元組,主要步驟為:首先,經(jīng)過JDBC,DatasourceManager會與各種關(guān)系數(shù)據(jù)庫進行連接;其次,制定出一個或多個Mappingaxiom,其中包含target、source以及mappingid,其中target表示的是一個多元組模板,與SQL中的列名通過占位符關(guān)聯(lián),source表示的是一條SQL查詢語句,主要針對關(guān)系型數(shù)據(jù)庫,mappingid表示的是一個字符串,其主要的作用是進行axiom的標識。最后,通過實際映射后,會形成虛擬三元組,在OntopAPI接口訪問下,能夠利用SPARQL查詢語言,獲得虛擬RDF圖,能夠?qū)?shù)據(jù)實例化為具體的三元組,在圖數(shù)據(jù)庫中進行存儲。
三元組生成環(huán)節(jié)為:第一,基于JDBC下,構(gòu)建Oacle連接,192.168.1.114是連接的主機地質(zhì),oracle實例為orcl,tms為用戶名,123為用戶密碼。第二,進行Mappingaxiom設計是較為關(guān)鍵的一步,因此需要做好映射關(guān)系的構(gòu)建。第三,變化才能調(diào)用ontop API,生成三元組?,F(xiàn)階段,xx公司已經(jīng)生成了40多萬余條三元組,實現(xiàn)了工件、機床、道具以及材料等方面的數(shù)據(jù)轉(zhuǎn)換。
進行數(shù)據(jù)集成過程中,一個較為關(guān)鍵的任務是融合不同數(shù)據(jù)源的同一客體實體,例如工件、機床以及刀具等,從而使知識圖譜數(shù)據(jù)具備更好的一致性以及準確性。集成多元數(shù)據(jù)環(huán)節(jié),通常情況下,不同的應用系統(tǒng)都是不用的軟件供應商供應,這種情況下,會使客觀實體編碼體系存在較大不同,所以,利用編碼分辨是否為統(tǒng)一實體,存在較大的難度。所以,可以通過計算屬性相似度的方式,進行實體對齊。因為進行工件、機床以及刀具描述的字符大多是短文本,在短文本相似度計算上,Levenshtein最小編輯距離以及Jaccard系數(shù)均具備較好的應用效果,所以,可以選擇兩者結(jié)合的方式,對實體等價性進行確定,保證獲得更高的準確性。
將圖數(shù)據(jù)庫Neo4j作為存儲系統(tǒng),該存儲屬于NOSQL數(shù)據(jù)庫,存在較高的性能,其能夠在圖上存儲結(jié)構(gòu)化數(shù)據(jù),而并不是在表中存儲。節(jié)點、關(guān)系與屬性均為基元。對于節(jié)點而言,其可以是零個屬性,也可以是多個屬性,均會以key-value對的形式存在,利用標簽標識不同類型的節(jié)點。Neo4j中,存在Cypher語言,能夠高效查詢圖數(shù)據(jù)庫。在OWL本體模型下,Neo4j的node-Relation與三元組Subject-Predicate-Object存在一定的不同,前者描述關(guān)系的對象屬性,可以存在數(shù)據(jù)屬性,而后者不可以。
現(xiàn)階段,知識圖譜在金屬加工領(lǐng)域的應用,能夠有效提升金屬切削加工方面的質(zhì)量與效率?,F(xiàn)階段在一些其他領(lǐng)域,包括醫(yī)療、金融以及電商等,知識圖譜均得到了廣泛應用,不過在工業(yè)加工領(lǐng)域的應用還需要不斷進行深入探索,本文提出的金屬切削加工知識圖譜,可以在以下方面進行應用:第一,輔助決策方面。在現(xiàn)代金屬切削加工方面,大多數(shù)是利用計算機輔助技術(shù)進行設計,實際設計環(huán)節(jié)對于設計人員設計經(jīng)驗以及專業(yè)知識存在較大的依賴性,構(gòu)建金屬切削加工知識圖譜,能夠在實際工作中,按照知識庫中存在的相關(guān)知識與關(guān)聯(lián)關(guān)系,為金屬切削加工提供輔助決策,從而減少對于人員的依賴性,進一步提升此項工作的開展效率。第二,金屬切削加工異常警告。進行金屬切削加工時,往往會存在一些細節(jié)上的問題,在金屬切削加工知識圖譜下,會按照存儲的關(guān)聯(lián)關(guān)系知識,對當前操作是否會發(fā)生異常進行預判,為相關(guān)工作人員做出相應提示,有效避免加工缺陷的出現(xiàn),提升金屬切削加工質(zhì)量。
綜上所述,金屬切削加工過程是工件和刀具相互作用的過程,機床、夾具、刀具和工件組成一個完整的機械加工工藝系統(tǒng)。對金屬切削機理大量的研究已形成描述基本物理現(xiàn)象和變化規(guī)律的諸多知識。而金屬切削加工在機械行業(yè)廣泛的應用已產(chǎn)生海量的各種類型的數(shù)據(jù),稱之為過程性知識。現(xiàn)階段,知識圖譜已經(jīng)被應用到各個領(lǐng)域,知識圖譜構(gòu)建過程中,會經(jīng)歷知識抽取、知識融合、知識存儲及更新環(huán)節(jié)。進行金屬切削加工知識圖譜構(gòu)建時,能夠有效解決制造業(yè)切削數(shù)據(jù)資源利用價值不高這一問題,在輔助決策以及金屬切削加工異常警告上,均能發(fā)揮出較好的作用,進一步提升制造加工水平。