陳剛 胡蓉
[摘? ? 要] 為了滿足紡織行業(yè)中不同類型企業(yè)對(duì)于紡織專業(yè)知識(shí)不同廣度和深度的需求,提升企業(yè)知識(shí)獲取、存儲(chǔ)和應(yīng)用水平,采用七步法構(gòu)建紡織領(lǐng)域本體?;谒鶚?gòu)建的領(lǐng)域本體,可形成系統(tǒng)性知識(shí)平臺(tái),為用戶提供層次結(jié)構(gòu)清晰、邏輯關(guān)系明確的專業(yè)知識(shí)數(shù)據(jù)庫。本體的模塊化和可擴(kuò)展性特點(diǎn)可以針對(duì)不同用戶提供個(gè)性化的知識(shí)管理解決方案。以紡織工程咨詢企業(yè)為用戶所構(gòu)建的紡織工程領(lǐng)域本體設(shè)置了工藝、勞動(dòng)對(duì)象、產(chǎn)業(yè)、產(chǎn)業(yè)經(jīng)濟(jì)、地域、工程、技術(shù)經(jīng)濟(jì)、案例和設(shè)備9個(gè)模塊,可以有效提高咨詢工作效率和質(zhì)量,同時(shí)也可為工程咨詢智能化奠定技術(shù)基礎(chǔ)。
[關(guān)鍵詞] 本體;紡織;工程咨詢;知識(shí)庫
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2020. 03. 069
[中圖分類號(hào)] TP391? ? [文獻(xiàn)標(biāo)識(shí)碼]? A? ? ? [文章編號(hào)]? 1673 - 0194(2020)03- 0167- 05
0? ? ? 前? ? 言
本體起源于哲學(xué)范疇,研究的基本問題是“什么可以被定義為存在”、“事物是什么”等。客觀存在有不同的表現(xiàn)形式,為了區(qū)別某個(gè)存在而不是其他,可以定義一個(gè)集合來描述這個(gè)存在,這就是本體。領(lǐng)域本體是本體的一個(gè)類型,是指特定領(lǐng)域的本體,包含了該領(lǐng)域特定的概念。本體可以很好解決知識(shí)共享和復(fù)用的問題。因此,生物醫(yī)學(xué)、農(nóng)業(yè)、化工、教育等很多領(lǐng)域都建立了領(lǐng)域本體。
構(gòu)建領(lǐng)域本體應(yīng)該遵循以下基本原則:①明確性。本體應(yīng)該有效表達(dá)研究領(lǐng)域的定義,并且這個(gè)定義應(yīng)該是客觀的。②一致性。本體的定義或公理應(yīng)當(dāng)是符合邏輯的。如果通過本體自身定義的邏輯推導(dǎo)出的結(jié)果產(chǎn)生自相矛盾的情況,則說明本體在一致性方面存在問題。③可擴(kuò)展性。所構(gòu)建的本體應(yīng)該具有良好的擴(kuò)展性。④最小偏差。本體應(yīng)該建立在普遍具有的知識(shí)理解層面,避免本體在不同應(yīng)用場(chǎng)景使用中造成的在知識(shí)理解方面的偏差,以促進(jìn)知識(shí)共享。⑤控制本體規(guī)模。所建立的本體涉及的內(nèi)容不應(yīng)盲目擴(kuò)張,滿足需要即可。
根據(jù)本體應(yīng)用領(lǐng)域和本體的類型不同,構(gòu)建方法也不同。IDEF5法、骨架法和TOVE法適用于企業(yè)本體構(gòu)建。對(duì)于領(lǐng)域本體,七步法是較為成熟的方法,也是本體構(gòu)建的基本方法之一。七步法包含的步驟分別是:確定領(lǐng)域的本體、檢索可供利用的現(xiàn)有本體、枚舉領(lǐng)域的重要概念、定義類和類的層級(jí)體系、定義類的屬性、定義屬性的分面(Facets)以及建立實(shí)例。針對(duì)紡織工程領(lǐng)域?qū)I(yè)知識(shí)服務(wù)與咨詢的需要,采用七步法構(gòu)建紡織工程領(lǐng)域本體,用于解決知識(shí)體系可視化、提高知識(shí)獲取效率和應(yīng)用水平,為搭建紡織工程咨詢知識(shí)平臺(tái)提供技術(shù)支撐。同時(shí),可供出版企業(yè)為特定領(lǐng)域用戶提供個(gè)性化知識(shí)管理服務(wù)。
1? ? ? 紡織工程領(lǐng)域本體構(gòu)建
1.1? ?確定本體的領(lǐng)域
本文所建立的是紡織工程領(lǐng)域本體。在這個(gè)領(lǐng)域中,具體的范圍是紡織工程咨詢智庫建設(shè)所需的知識(shí)。該本體的用戶是紡織工程咨詢企業(yè)。領(lǐng)域本體內(nèi)容覆蓋紡織工程咨詢業(yè)務(wù)過程中涉及的知識(shí),包括紡織、經(jīng)濟(jì)、城市規(guī)劃和公用工程等。
1.2? ?檢索可供利用的現(xiàn)有本體
通過互聯(lián)網(wǎng)檢索本體庫:DBpedia、Protégé本體庫等,沒有發(fā)現(xiàn)與紡織工程咨詢相關(guān)的領(lǐng)域本體,該領(lǐng)域本體的建設(shè)基本處于空白階段。
1.3? ?枚舉領(lǐng)域的重要概念
根據(jù)紡織工程咨詢業(yè)務(wù)內(nèi)容和特點(diǎn),將紡織工程咨詢領(lǐng)域劃分為工藝、勞動(dòng)對(duì)象、設(shè)備、工程、產(chǎn)業(yè)經(jīng)濟(jì)、技術(shù)經(jīng)濟(jì)、地域、產(chǎn)業(yè)和案例9個(gè)子領(lǐng)域。其中7個(gè)主要的概念及其邏輯關(guān)系見圖1。
一般情況下,工程咨詢工作是以市場(chǎng)為起點(diǎn),產(chǎn)業(yè)環(huán)境為基礎(chǔ)。這些內(nèi)容可列為產(chǎn)業(yè)經(jīng)濟(jì)范疇。然后明確生產(chǎn)什么產(chǎn)品、以什么為原料。這就決定了需要采用什么工藝。接下來明確采用什么設(shè)備,這些設(shè)備對(duì)車間面積、能源消耗等工程方面有什么要求。在以上內(nèi)容都確定之后,需要進(jìn)行技術(shù)經(jīng)濟(jì)評(píng)價(jià)。
產(chǎn)品和原料在產(chǎn)業(yè)鏈中可以是相對(duì)的概念。一個(gè)物品可以是上一個(gè)工序的產(chǎn)品,也可以是下一個(gè)工序的原料。例如白坯布既是上一個(gè)工序——紡紗的產(chǎn)品,又是下一個(gè)工序——印染的原料。“類”應(yīng)該有明確、清晰的邊界,這是“類”劃分的依據(jù)。因此在劃分子領(lǐng)域時(shí),將“原料”和“產(chǎn)品”統(tǒng)一定義為“勞動(dòng)對(duì)象”,不能將“原料”和“產(chǎn)品”作為獨(dú)立的子領(lǐng)域劃分。
1.4? ?定義類和類的層級(jí)體系
采用自頂向下的方式定義類的級(jí)別,把工藝、產(chǎn)品和設(shè)備等每個(gè)子領(lǐng)域列出的概念逐層分解。由于子領(lǐng)域有多種分類方式,為了保證領(lǐng)域本體模型各概念間的協(xié)同性,應(yīng)盡可能做到分類方式統(tǒng)一。例如工藝的分類方式是哪一種,與工藝對(duì)應(yīng)的設(shè)備也采用與工藝一致的分類方式。
工藝的分類是紡織工程領(lǐng)域本體的核心內(nèi)容之一。工藝的分類有多種方法,既可以采用橫向的分類方式,也可以采用縱向的分類方式。紡織行業(yè)常用的工藝分類方法如圖2所示。
這種工藝的分類方式與現(xiàn)有行業(yè)協(xié)會(huì)管理相對(duì)應(yīng)。但這種分類方法分類的缺陷在于維度不一致,有按產(chǎn)品分例如“服裝工藝”,也有按工序劃分例如“印染工藝”。而且,家用紡織品是紡織三大終端應(yīng)用領(lǐng)域之一,但家用紡織品卻沒有直接對(duì)應(yīng)的工藝。有些工藝之間存在交叉現(xiàn)象,例如毛紡工藝中的半精紡會(huì)用到棉紡的梳棉工藝。除此之外,當(dāng)“印染工藝”作為一類工藝存在,如果按照傳統(tǒng)的工藝分類方式,棉紡工藝、毛紡工藝以及針織工藝等都會(huì)與印染工藝存在交叉現(xiàn)象,因?yàn)樯鲜龉に嚩紩?huì)涉及印染生產(chǎn)環(huán)節(jié)。因此,本文按照工序?qū)に囘M(jìn)行分類,采用橫向的分類方式。調(diào)整后的工藝分類見圖3。
圖3所展示的分類方法特點(diǎn)在于并不指定產(chǎn)品,如是生產(chǎn)服裝還是家用紡織品;也不指定原料種類,如是棉紡還是毛紡。這種分類方式體現(xiàn)在某個(gè)工藝可以跨產(chǎn)業(yè)。例如纖維梳理工藝無論在棉紡產(chǎn)業(yè)還是毛紡產(chǎn)業(yè)都會(huì)被使用。這種分類方法具有更廣泛的適應(yīng)性。例如清梳聯(lián)工藝是把開松、清花和梳理聯(lián)合在一起的相對(duì)較新的工藝。采用以工序分類的方式,在本體中定義這一工藝時(shí)只需把開松、清花和梳理三個(gè)概念以恰當(dāng)?shù)年P(guān)系設(shè)置即可。
紡織工程領(lǐng)域本體模型中共設(shè)置了9個(gè)模塊,即工藝、勞動(dòng)對(duì)象、產(chǎn)業(yè)、產(chǎn)業(yè)經(jīng)濟(jì)、地域、工程、技術(shù)經(jīng)濟(jì)、案例和設(shè)備。對(duì)于工藝的子類前文已描述。勞動(dòng)對(duì)象的子類包括整個(gè)紡織產(chǎn)業(yè)鏈各環(huán)節(jié)加工對(duì)象以及加工后的產(chǎn)品。產(chǎn)業(yè)的子類按照產(chǎn)品、原料和工藝三個(gè)維度劃分。按產(chǎn)品分類包括服裝產(chǎn)業(yè)、床上用品產(chǎn)業(yè)和毛巾產(chǎn)業(yè)等類別。按原料分類包括絲綢產(chǎn)業(yè)、羊毛產(chǎn)業(yè)和滌綸產(chǎn)業(yè)等類別。按工藝分類包括紡紗產(chǎn)業(yè)、織造產(chǎn)業(yè)和染色產(chǎn)業(yè)等。產(chǎn)業(yè)經(jīng)濟(jì)包括產(chǎn)業(yè)集群、國(guó)際貿(mào)易和行業(yè)統(tǒng)計(jì)子類別。地域包括國(guó)家、省和市等子類別。案例包括產(chǎn)業(yè)規(guī)劃、園區(qū)規(guī)劃和可行性研究報(bào)告3個(gè)子類。9個(gè)模塊進(jìn)一步細(xì)分后,形成51個(gè)二級(jí)類及更多的三級(jí)、四級(jí)和五級(jí)類。紡織工程領(lǐng)域本體模型以知識(shí)圖譜的形式展現(xiàn),如圖4所示。
圖4是在軟件中用圖的形式展示本體結(jié)構(gòu)。知識(shí)可視化的方式是多種多樣的,在建立本體模型后,可以用其他軟件展示更加豐富的知識(shí)圖譜內(nèi)容,實(shí)現(xiàn)知識(shí)可視化。
1.5? ?定義類的屬性
在七步法中,定義類的屬性有兩個(gè)層面:一是類本身的屬性,包括內(nèi)在屬性和外在屬性;二是類之間的關(guān)系。
在定義類的屬性過程中,子類共同的屬性無須分別定義,只需將這個(gè)屬性定義在父類中,子類會(huì)自動(dòng)繼承父類的屬性。例如“氣流紡紗線”和“環(huán)錠紡紗線”是“紗線”的子類。將“支數(shù)是”定義為“紗線”的屬性后,“氣流紡紗線”和“環(huán)錠紡紗線”都自動(dòng)繼承“支數(shù)是”這個(gè)屬性。
在紡織工程咨詢領(lǐng)域,數(shù)據(jù)是非常重要的基礎(chǔ),幾乎所有分析以及方案的制定都離不開數(shù)據(jù)。在產(chǎn)業(yè)經(jīng)濟(jì)中,數(shù)據(jù)在供應(yīng)端主要體現(xiàn)在分國(guó)別、分地區(qū)、分產(chǎn)品等維度的產(chǎn)量、進(jìn)出口量等;在消費(fèi)端主要體現(xiàn)在消費(fèi)量、消費(fèi)額等指標(biāo)。在產(chǎn)品中,數(shù)據(jù)體現(xiàn)在產(chǎn)品的成分、規(guī)格等指標(biāo)。在工藝中,數(shù)據(jù)體現(xiàn)為工藝參數(shù)。鑒于數(shù)據(jù)的重要性,對(duì)本體中數(shù)據(jù)屬性的定義是本體構(gòu)建的關(guān)鍵環(huán)節(jié)。
根據(jù)對(duì)紡織工程咨詢領(lǐng)域知識(shí)內(nèi)容的抽象,將關(guān)系分為時(shí)間、空間和邏輯關(guān)系。時(shí)間關(guān)系主要體現(xiàn)在工藝生產(chǎn)在時(shí)間上的先后關(guān)系。空間關(guān)系體現(xiàn)在有位置屬性的類別中。紡織工程領(lǐng)域本體模型定義的對(duì)象屬性共有25個(gè),類與類之間的關(guān)系涵蓋在對(duì)象屬性中。定義關(guān)系和定義類是相互促進(jìn)的,兩者可以互相查漏補(bǔ)缺、迭代優(yōu)化。本文構(gòu)建的紡織工程領(lǐng)域本體模型具有的主要關(guān)系見表1。
增加同義詞的屬性是為了解決相同概念有不同表達(dá)方式的問題。通過同義詞的屬性標(biāo)注,可以進(jìn)一步豐富概念的語義標(biāo)注,為提高檢索效率提供技術(shù)基礎(chǔ)。例如對(duì)轉(zhuǎn)杯紡的同義標(biāo)注見圖5。
1.6? ?定義屬性的分面(Facets)
屬性的分面包含取值的類型、取值范圍、值的數(shù)量等相關(guān)的特征。定義屬性的分面需要根據(jù)每個(gè)屬性所要表達(dá)的語義內(nèi)容逐一定義。屬性用于標(biāo)注不同的類時(shí),其分面的取值可以是不同的。下面以“產(chǎn)品是”為例介紹對(duì)象屬性分面的定義。
“產(chǎn)品是”屬于對(duì)象屬性,定義屬性的分面需要確定取值的約束類型。常用的約束類型有5個(gè):存在、唯一、最小基數(shù)值、最大基數(shù)值和確切基數(shù)值。此處的約束類型可以和E-R模型中兩個(gè)實(shí)體之間的關(guān)系聯(lián)系起來。E-R模型中有三種關(guān)系:一對(duì)一(1:1)、一對(duì)多(1:n)和多對(duì)多(m:n)。其中一對(duì)一的關(guān)系,在屬性分面中可以用“唯一”這一約束類型定義;對(duì)于一對(duì)多的關(guān)系,在屬性分面中可以用“存在”這一約束類型定義。
例如定義“噴氣織機(jī)”這個(gè)類與“機(jī)織布”的關(guān)系時(shí),由于噴氣織機(jī)生產(chǎn)的機(jī)織布不是唯一的,有多個(gè)種類,因此在這個(gè)情況下,對(duì)“產(chǎn)品是”的約束條件為“存在(Some)”。在軟件的效果展示見圖6。
1.7? ?建立實(shí)例
建立實(shí)例是本體構(gòu)建七步法的最后一步。實(shí)例是某個(gè)類的個(gè)體。例如高浴比間歇染色機(jī)是一類設(shè)備,某生產(chǎn)廠家生產(chǎn)的一臺(tái)這個(gè)類別的設(shè)備就是一個(gè)實(shí)例。如果把類在關(guān)系型數(shù)據(jù)庫中建立一張表,一個(gè)實(shí)例可以理解為表中的一條記錄。
在某些本體構(gòu)建軟件中,可以實(shí)現(xiàn)對(duì)新定義的實(shí)例自動(dòng)歸類的功能。前提條件是對(duì)類的屬性首先定義值的類型和值的范圍,即定義規(guī)則。例如首先定義好高浴比染色機(jī)的浴比大于等于8這個(gè)規(guī)則,當(dāng)出現(xiàn)符合條件的實(shí)例時(shí),實(shí)例會(huì)被自動(dòng)添加到高浴比染色機(jī)這一類中。
2? ? ? 結(jié)論與展望
紡織工程咨詢領(lǐng)域本體力求涵蓋企業(yè)工作過程涉及的所有知識(shí),分為9個(gè)模塊。模型中的紡織工藝和紡織產(chǎn)業(yè)及其產(chǎn)品的歸納和分類是重點(diǎn)。對(duì)于紡織工藝的分類,揚(yáng)棄了傳統(tǒng)的分類方法,以多維度劃分工藝。對(duì)于產(chǎn)品,也采用多維度的分類方法。這對(duì)于準(zhǔn)確高效定義現(xiàn)實(shí)中具體問題,發(fā)現(xiàn)新的工藝或產(chǎn)品組合具有重要意義。
在本體構(gòu)建技術(shù)方面,隨著本體構(gòu)建技術(shù)的發(fā)展,將會(huì)有更加完善的本體構(gòu)建自動(dòng)或半自動(dòng)技術(shù)出現(xiàn),這將大幅提高本體構(gòu)建的效率。盡管目前在自動(dòng)提取概念和關(guān)系方面,存在噪音數(shù)據(jù)多,仍需要人工二次干預(yù),但自動(dòng)化或半自動(dòng)化技術(shù)仍然是本體構(gòu)建主要的研究方向之一。
在本體應(yīng)用方面,工程咨詢領(lǐng)域本體與人工智能進(jìn)一步結(jié)合具有廣闊的研究前景。本體概念被信息技術(shù)吸納以來,人工智能一直是本體重要應(yīng)用領(lǐng)域。但應(yīng)用程度在不同行業(yè)之間存在著較大差異?;诒倔w的紡織工程咨詢智能輔助系統(tǒng)可以幫助咨詢工程師從某些煩瑣的工作過程中解放出來,提高工程咨詢的效率和質(zhì)量。
主要參考文獻(xiàn)
[1]Gruber T R.A Translation Approach to Portable Ontology Specifications[J]. Knowledge Acquisition,1993,5(2):199-220.
[2]楊春媛,李滿生,朱云平.生物醫(yī)學(xué)領(lǐng)域本體的構(gòu)建、評(píng)估與應(yīng)用[J].中國(guó)科學(xué):生命科學(xué), 2013(3):223-239.
[3]謝能付,王文生.農(nóng)業(yè)知識(shí)本體構(gòu)建方法[J].農(nóng)業(yè)網(wǎng)絡(luò)信息, 2007(8):12-16.
[4]張安超,韓娜.化工領(lǐng)域本體的構(gòu)建與應(yīng)用[J].出版科學(xué), 2017, 25(5):88-91.
[5]馬捷,劉小樂,黃嵐,等.教育領(lǐng)域本體構(gòu)建研究[J].情報(bào)理論與實(shí)踐,2012, 5(7):104-108.
[6]杜小勇,馬文峰,武文娟.學(xué)科領(lǐng)域本體的構(gòu)建與進(jìn)化——以經(jīng)濟(jì)學(xué)領(lǐng)域本體為例[J]. 現(xiàn)代圖書情報(bào)技術(shù), 2007, 2(3):7-12.
[7]Gruber T R.Toward Principles for the Design of Ontologies Used for Knowledge Sharing[J].International Journal of Human-Computer Studies, 1995, 43(5-6):907-928.
[8]Newell S,Robertson M, Scarbrough H, et al.Managing Knowledge Work and Innovation[M].2nd Edition.Baingtoke,UK:Palgrave MacMillan,2009.
[9]梅自強(qiáng).紡織辭典[M].北京:中國(guó)紡織出版社, 2007.