查 翔, 倪世宏, 謝 川, 張 鵬
(空軍工程大學(xué)航空航天工程學(xué)院, 陜西 西安 710038)
?
云相似度的概念躍升間接計(jì)算方法
查翔, 倪世宏, 謝川, 張鵬
(空軍工程大學(xué)航空航天工程學(xué)院, 陜西 西安 710038)
摘要:針對(duì)現(xiàn)有云模型相似性度量方法結(jié)果不穩(wěn)定以及區(qū)分度不高的問(wèn)題,提出一種云相似度的概念躍升間接計(jì)算方法,以表征云相似性的期望曲線相交區(qū)域?yàn)榍腥朦c(diǎn),將其面積的計(jì)算轉(zhuǎn)移至更高層次概念上,實(shí)現(xiàn)原相交區(qū)域代表概念比重的等價(jià)轉(zhuǎn)換。討論了期望曲線交點(diǎn)數(shù)目及位置的不同情形,并給出相應(yīng)的判別規(guī)則;在此基礎(chǔ)上,通過(guò)計(jì)算截?cái)囔孬@得綜合云,實(shí)現(xiàn)概念的躍升;以綜合云與各基礎(chǔ)云的期望曲線相交面積作為相似性的新度量標(biāo)準(zhǔn),給出了相似度的間接計(jì)算公式。通過(guò)設(shè)計(jì)的仿真算例以及具體應(yīng)用的實(shí)驗(yàn)結(jié)果,驗(yàn)證了該方法的有效性和普適性。
關(guān)鍵詞:云模型; 相似度; 期望曲線; 概念躍升
0引言
自然語(yǔ)言是人類思維的基本工具,作為知識(shí)的載體,已成為人工智能領(lǐng)域重要的研究對(duì)象。用概念表示的自然語(yǔ)言本身具有不確定性,關(guān)于這一特性的描述主要包含隨機(jī)性和模糊性,但兩者之間的關(guān)系常被割裂。李德毅院士提出的云模型不僅能夠反映出自然語(yǔ)言中的不確定性,而且反映了隨機(jī)性和模糊性之間的關(guān)聯(lián),具有直觀性和普遍性[1-2],已被廣泛應(yīng)用在系統(tǒng)評(píng)估[3]、模式識(shí)別[4]、進(jìn)化計(jì)算[5]和狀態(tài)預(yù)測(cè)[6-7]等領(lǐng)域。
云模型屬于研究定性概念的一種量化方法,雖然現(xiàn)有云理論對(duì)云滴與概念之間相似程度的研究已相當(dāng)完備和成熟,但該理論在面對(duì)云與云之間相似程度的判定問(wèn)題時(shí)常缺乏有效的評(píng)估標(biāo)準(zhǔn),如何定量分析和表達(dá)云模型之間的相似性成為當(dāng)前亟待解決的重要問(wèn)題。文獻(xiàn)[8]提出利用隨機(jī)云滴之間的距離(similar cloud measurement,SCM)來(lái)衡量云相似程度,而文獻(xiàn)[9]則采用了云滴確定度的交互式計(jì)算法,這兩種基于隨機(jī)云滴的方法一定程度上體現(xiàn)了云不確定性的本質(zhì),但相似度精度和穩(wěn)定性依賴于選取的云滴數(shù)量和實(shí)驗(yàn)次數(shù),大量的云滴及重復(fù)式計(jì)算帶來(lái)了較大的復(fù)雜度,特別是當(dāng)兩云完全相同時(shí),相似度卻并不一定為1。向量余弦法[10-11]事先構(gòu)造包含數(shù)字特征的云向量,利用不同云向量之間的夾角余弦值作為相似度,但在某個(gè)數(shù)字特征占優(yōu)的情況下容易削弱不確定性,產(chǎn)生較大的誤差?;谄谕€的面積比例法(expectation based cloud model,ECM)[12-13]充分利用了云模型本身的形態(tài)特性,以各期望曲線與橫軸圍成的相交面積代表概念之間的公共成分,并以其作為相似性的標(biāo)度,但這一公共區(qū)域在各云中所占比重等價(jià),導(dǎo)致區(qū)分度不高,而且不符合人的認(rèn)知。
針對(duì)上述問(wèn)題,以正態(tài)云為研究對(duì)象,提出一種云相似度的概念躍升間接計(jì)算方法(concept skipping indirect approach of cloud model,CCM)。該方法在深入分析和認(rèn)識(shí)云模型相似度實(shí)質(zhì)內(nèi)涵的基礎(chǔ)上,從云模型幾何特征的角度出發(fā),以基于期望曲線的相交面積為切入點(diǎn),將相似度的計(jì)算過(guò)程通過(guò)概念躍升轉(zhuǎn)移至更高層次概念上,實(shí)現(xiàn)了相交面積的等價(jià)轉(zhuǎn)換。仿真實(shí)驗(yàn)表明,該方法取得的結(jié)論與現(xiàn)有方法相一致,并且在穩(wěn)定性以及區(qū)分度效果方面有較好的優(yōu)越性。
1云模型及相似度的計(jì)算
云是某個(gè)定性概念與其定量表示之間的一種不確定性轉(zhuǎn)換模型,構(gòu)成了定性與定量之間的相互映射,其定義如下:
定義 1設(shè)U是用精確數(shù)值表示的定量論域,C為U上的一個(gè)定性概念,若U中的定量值x為定性概念C的一次隨機(jī)實(shí)現(xiàn),那么x對(duì)C的確定度y=μC(x)∈[0,1]是具有穩(wěn)定傾向的隨機(jī)數(shù),則稱在論域U上(x,y)的分布為云,(x,y)為其中的一個(gè)云滴[1]。
云的數(shù)字特征反映了定性概念的整體定量特性,即期望Ex、熵En和超熵He,其中Ex表示云滴在論域空間分布的期望值,代表了定性概念的重心位置;En是定性概念隨機(jī)性以及亦此亦彼性的度量,En越大,可被概念接受的論域范圍越大,概念也就更為模糊;He為熵不確定性的度量,即熵的熵,體現(xiàn)了論域值隸屬于概念程度的凝聚性,其值間接反映在云的厚度上。根據(jù)這3個(gè)數(shù)字特征,語(yǔ)言集中某一定性概念C對(duì)應(yīng)的云模型可表示為C(Ex,En,He),實(shí)際中常使用正態(tài)云。
云模型實(shí)現(xiàn)了定性概念的不確定性表示,同一定性概念的不同語(yǔ)言原子依據(jù)數(shù)字特征進(jìn)行區(qū)分,如網(wǎng)絡(luò)交易中的信任程度這一定性概念[14],可將其劃分為極不可信、不可信、低可信、一般可信以及高可信共5個(gè)等級(jí),這里的等級(jí)相當(dāng)于語(yǔ)言原子,不同的數(shù)字特征用來(lái)描述和區(qū)分各等級(jí)。相關(guān)性度量主要研究以云模型表示的不同定性概念間關(guān)聯(lián)程度或者某個(gè)概念隸屬于其他概念程度的定量表達(dá)問(wèn)題,在基于云方法的綜合評(píng)估及模式識(shí)別等關(guān)鍵問(wèn)題中占有重要地位,不合理的度量方法將會(huì)影響到問(wèn)題的最終決策。以綜合評(píng)估/評(píng)價(jià)問(wèn)題為例[3,14],對(duì)于未知的對(duì)象概念,如何將其歸類到目標(biāo)語(yǔ)言原子中,需要相應(yīng)的評(píng)判標(biāo)準(zhǔn)以及可信程度;在模式識(shí)別問(wèn)題中[15],結(jié)果的準(zhǔn)確率以及算法效率除了與模型本身有關(guān)外,還取決于所涉及的相似性度量方法。
從正態(tài)云發(fā)生器產(chǎn)生的云圖[1]上觀察,云模型具有明顯的幾何特征,而基于這一特征的云相似度計(jì)算方法充分利用了云模型本身的形態(tài)特點(diǎn),簡(jiǎn)單直觀且普適性較好。對(duì)云幾何特征的研究可分別從垂直、正交以及水平方向著手,相應(yīng)地得到回歸曲線、主曲線以及期望曲線。前兩種曲線由于不具有具體的解析形式,一般通過(guò)線性逼近的方式近似獲取,應(yīng)用范圍有限,故實(shí)際中常利用期望曲線表征云模型的整體形態(tài),其定義為:
定義 2對(duì)云滴變量x,若滿足x~N(Ex,En′),其中En′~N(En,He)且En≠0,固定x的確定度y(x),將得到相應(yīng)的云滴期望值,所有這樣的期望值共同組成一條固定的期望曲線[16],其解析式為
(1)
期望曲線由云滴在水平方向上的統(tǒng)計(jì)規(guī)律得出,它是一條貫穿云滴集合的光滑曲線,能夠直觀地描繪出云的基本輪廓,描述云的整體幾何形態(tài),可用來(lái)表征概念的主體部分。兩個(gè)云模型的期望曲線在論域范圍內(nèi)必然相交,與橫軸共同圍成一個(gè)相交區(qū)域(稱為“與”區(qū)域),其面積隨不同云模型而改變,故本文根據(jù)“與”區(qū)域面積的思想度量云相似度。
2云模型相似度的概念躍升間接計(jì)算方法
兩個(gè)云模型之間的“與”區(qū)域在各自所代表的概念中占的比重不同,鑒于此,首先基于概念躍升的思想構(gòu)造兩個(gè)云模型的綜合云,其定義依賴于截?cái)囔?。為了凸顯不同類型云的特點(diǎn),將待計(jì)算相似度的兩個(gè)云稱為基礎(chǔ)云,與綜合云分別表征兩個(gè)不同層次的概念。根據(jù)獲得的綜合云數(shù)字特征,分別計(jì)算各基礎(chǔ)云與綜合云“與”區(qū)域的面積,即將原基礎(chǔ)云“與”區(qū)域的求解轉(zhuǎn)換至更高層次概念上,實(shí)現(xiàn)原相交區(qū)域代表概念比重的等價(jià)轉(zhuǎn)換,進(jìn)而按照面積的比例關(guān)系計(jì)算最終的相似度。
2.1交點(diǎn)求解及位置判別規(guī)則
兩基礎(chǔ)云期望曲線的交點(diǎn)決定了截?cái)囔匾约熬C合云不同的求解方式,而交點(diǎn)的個(gè)數(shù)和位置與基礎(chǔ)云的數(shù)字特征有關(guān)。設(shè)基礎(chǔ)云對(duì)象Ci(Exi,Eni,Hei),i=1,2,根據(jù)式(1)有
(2)
聯(lián)立方程求解交點(diǎn)坐標(biāo),主要?dú)w納為以下3種情形,并相應(yīng)地給出交點(diǎn)位置的判斷規(guī)則,同時(shí)以云圖的方式給出各情形的直觀表示,如圖1所示。
(1)En1=En2且Ex1≠Ex2,此時(shí)只有一個(gè)交點(diǎn)(單交點(diǎn)):
p=(Ex1En2+En1Ex2)/(En1+En2)
(3)
對(duì)于交點(diǎn)p,顯然有min(Ex1,Ex2)≤p≤max(Ex1,Ex2),即交點(diǎn)位于兩基礎(chǔ)云的期望基線x=Ex1與x=Ex2之間(見圖1(a))。
(2)En1≠En2且Ex1=Ex2,有p1=p2,即只有一個(gè)交點(diǎn)(單交點(diǎn))。兩期望曲線的位置關(guān)系反映在云圖中為熵值較小的云被完全包含在熵值較大的云內(nèi),此時(shí)交點(diǎn)為兩期望曲線的重合頂點(diǎn)(見圖1(b))。
(3)En1≠En2且Ex1≠Ex2,此時(shí)存在兩個(gè)交點(diǎn)(雙交點(diǎn)):
(4)
不妨設(shè)Ex1 圖1 交點(diǎn)數(shù)目以及位置的不同分類 在上述討論中并未涉及兩基礎(chǔ)云完全相同的極特殊情形(En1=En2且Ex1=Ex2),因?yàn)榇藭r(shí)兩期望曲線完全重合。以上對(duì)交點(diǎn)位置判定的過(guò)程有助于后續(xù)各種面積的計(jì)算。若根據(jù)常見的“3En”規(guī)則限定云滴的取值范圍,將情形(3)中期望曲線的交點(diǎn)個(gè)數(shù)進(jìn)一步細(xì)分為單交點(diǎn)和雙交點(diǎn),以求減少計(jì)算量,意義并不大。在不考慮“3En”規(guī)則的前提下,在整個(gè)論域統(tǒng)一按雙交點(diǎn)情形討論,反而更顯簡(jiǎn)潔。 2.2綜合云的生成及“與”區(qū)域面積的計(jì)算 綜合云的生成屬于一種概念的躍升過(guò)程,它基于概念的不確定性,將低層次的概念進(jìn)行抽取而合并為一個(gè)更高層次的綜合概念,從而提高了概念的抽象度。這一抽取過(guò)程使得綜合后的概念具有低層次概念所蘊(yùn)含的全部信息,并且與各基礎(chǔ)云有不同的交集,實(shí)現(xiàn)了原基礎(chǔ)云“與”區(qū)域占各概念比重的等價(jià)轉(zhuǎn)換。生成綜合云過(guò)程的關(guān)鍵在于計(jì)算各基礎(chǔ)云的截?cái)囔?若yi(x)為基礎(chǔ)云Ci的期望曲線,i=1,2,令 (5) (6) 顯然,L1(x)、L2(x)為論域上兩期望曲線的最大值,代表y1(x)與y2(x)的不相交部分,在期望曲線的各交點(diǎn)處截開得到,其中交點(diǎn)情形的確定按2.1節(jié)的方法。則各截?cái)囔囟x為 (7) (8) 式(7)~式(8)中的積分符號(hào)代表求解被積變量(實(shí)為曲線)與橫軸所圍區(qū)域的面積,稱之為“或”區(qū)域。根據(jù)期望曲線的交點(diǎn)位置分布,當(dāng)y1(x)與y2(x)只有單交點(diǎn)時(shí),積分計(jì)算相對(duì)簡(jiǎn)單,每個(gè)截?cái)囔刂簧婕皢蝹€(gè)區(qū)域;若存在雙交點(diǎn),積分可能包含不連續(xù)的兩個(gè)區(qū)域,需要分別求解然后相加。 根據(jù)得到的截?cái)囔匾约盎A(chǔ)云的數(shù)字特征,計(jì)算綜合云Cz(Exz,Enz,Hez)的數(shù)字特征: (9) 由式(9)可知,綜合云的生成是基礎(chǔ)云共同作用下的結(jié)果,它的每一數(shù)字特征均由基礎(chǔ)云的相應(yīng)數(shù)字特征以及截?cái)囔貨Q定,其中綜合云的熵為兩截?cái)囔刂?期望與超熵則是以各截?cái)囔貫闄?quán)值的加權(quán)和。 將綜合云與各基礎(chǔ)云置于同一云圖中,如圖2所示,yz(x)、y1(x)與橫軸,yz(x)、y2(x)與橫軸之間各形成了“與”區(qū)域,面積分別為H1和H2。計(jì)算H1和H2面臨的直接問(wèn)題是綜合云與各基礎(chǔ)云期望曲線交點(diǎn)的位置分布,它決定了面積計(jì)算的參考基準(zhǔn),具體判別方式可參考2.1節(jié)。不妨設(shè)Ex1 圖2 基礎(chǔ)云與綜合云的位置關(guān)系 在圖2中,yz(x)與y1(x)的交點(diǎn)為p1、p2,yz(x)與y2(x)的交點(diǎn)為p3、p4。對(duì)于H1,在雙交點(diǎn)情形下共包含了3個(gè)獨(dú)立區(qū)域(見圖2中的陰影部分),并以p1和p2所在的縱軸為界,用以計(jì)算面積的各區(qū)域的邊界期望曲線從左至右依次為y1(x)、yz(x)以及y1(x),則 (10) 將各期望曲線的解析式帶入: (11) 考慮到各被積函數(shù)不可積的問(wèn)題,利用標(biāo)準(zhǔn)正態(tài)分布概率密度函數(shù)的性質(zhì)進(jìn)行變量代換,令u=(x-Ex1)/En1,v=(x-Exz)/Enz,dx=En1·du=Enz·dv,則 (12) 設(shè)Ф(·)為標(biāo)準(zhǔn)正態(tài)分布的概率分布函數(shù),則式(12)可進(jìn)一步表示為 (13) 同理,結(jié)合圖2,用于計(jì)算H2的邊界期望曲線從左至右依次為y2(x)、yz(x)以及y2(x),那么有 (14) 采取類似計(jì)算H1的變量代換方式,得 (15) 由此可知,在確定基礎(chǔ)云與綜合云的交點(diǎn)坐標(biāo)后,先通過(guò)查詢標(biāo)準(zhǔn)正態(tài)分布表獲取所有Ф(·)的值,然后再計(jì)算H1和H2。同時(shí)注意到,上述過(guò)程中并未引入云理論中常用的“3En”規(guī)則,由于H1與H2的求解主要通過(guò)論域上的變量積分實(shí)現(xiàn),考慮“3En”規(guī)則會(huì)影響積分的區(qū)間端點(diǎn)取值,從而增加過(guò)程復(fù)雜度。 綜合云與基礎(chǔ)云只有單交點(diǎn)時(shí)的計(jì)算過(guò)程相對(duì)簡(jiǎn)化,對(duì)如圖1(a)所示情形(En1=En2),“與”區(qū)域面積的計(jì)算只涉及到兩部分;而對(duì)圖1(b)所示情形(En1≠En2且Ex1=Ex2),由綜合云的生成算法可推知: (16) (17) 根據(jù)式(9),此時(shí)綜合云的數(shù)字特征為: (1) 若En1>En2,則Exz=Ex1,Enz=En1,Hez=He1; (2) 若En1 由此可知,該情形下的綜合云取決于各基礎(chǔ)云的熵,與熵較大的基礎(chǔ)云完全相同,期望曲線也必然重合。因此“與”區(qū)域面積的計(jì)算僅包含一部分,且該區(qū)域?yàn)殪刂递^小的期望曲線與橫軸所圍的部分。 2.3相似度的間接求解 基礎(chǔ)云與綜合云的“與”區(qū)域代表了基礎(chǔ)云概念對(duì)綜合云概念的貢獻(xiàn)程度,是概念由低層次向更高層次的延伸和躍升。由于熵決定了可被自然概念接受的云滴取值范圍,假定兩基礎(chǔ)云的熵保持不變,若兩基礎(chǔ)云表征的概念極不相關(guān),反映在云圖中為兩期望基線之間距離(即|Ex1-Ex2|)很大,使其與綜合云期望曲線的相交區(qū)域極小,相似度幾乎為零;若兩基礎(chǔ)云較為接近,此時(shí)對(duì)生成的綜合云概念有較大的貢獻(xiàn)程度,概念也就越相似。當(dāng)兩基礎(chǔ)云完全相同時(shí),生成的綜合云與基礎(chǔ)云也完全相同,兩期望曲線必然重合,此時(shí)概念的貢獻(xiàn)程度均達(dá)到100%,顯然相似度為1?;谶@一思想,給出基于概念躍升間接計(jì)算的基礎(chǔ)云C1與C2的相似度定義: (18) 其中,Sz為綜合云與橫軸所圍區(qū)域的面積: (19) 作變量代換u=(x-Exz)/Enz,dx=Enz·du,則 (20) 結(jié)合式(7)~式(9),有 (21) 從式(21)可以看出,Sz也等于兩基礎(chǔ)云期望曲線組成的“或”區(qū)域面積。該方法定義的相似度被轉(zhuǎn)移至綜合云上進(jìn)行計(jì)算,通過(guò)求解其包含的各“與”區(qū)域面積間接實(shí)現(xiàn),因而綜合云充當(dāng)了一種橋梁作用。其中相似度s(C1,C2)滿足以下性質(zhì): 性質(zhì) 10 證明設(shè)兩基礎(chǔ)云與橫軸所圍區(qū)域的面積分別為S1、S2。根據(jù)本文對(duì)“與”區(qū)域的定義,H1為S1與Sz的相交部分,H2為S2與Sz的相交部分,故0 證畢 對(duì)于半云的相似性度量問(wèn)題,運(yùn)用本文方法可能無(wú)法直接得到“與”以及“或”區(qū)域。解決該問(wèn)題的思路是將半云擴(kuò)展至對(duì)應(yīng)的完整云,然后計(jì)算截?cái)囔匾约案飨嘟幻娣e。對(duì)于超出半云界外的相交區(qū)域,將其從對(duì)應(yīng)的相交面積中減去即可。另外,在整個(gè)相似度的計(jì)算過(guò)程中并未涉及超熵的因素。期望和熵能夠完整表示云模型的整體特征,而超熵是熵的不確定性度量,反映云滴圍繞期望曲線分布的離散程度。若采用含超熵期望曲線的方式[13]引入超熵以代替原期望曲線,最終需分別取平均值,其實(shí)質(zhì)與基于期望曲線的方式無(wú)異。 3仿真實(shí)驗(yàn) 為驗(yàn)證本文CCM方法的合理性,在兩基礎(chǔ)云期望曲線存在單交點(diǎn)和雙交點(diǎn)的情形下分別列舉不同的算例,并與現(xiàn)有方法作對(duì)比分析。最后以一個(gè)具體實(shí)例說(shuō)明該方法的實(shí)際應(yīng)用。 3.1單交點(diǎn)情形的相似度計(jì)算 根據(jù)2.1節(jié),單交點(diǎn)涉及的情形包括兩種:①En1=En2;②En1≠En2且Ex1=Ex2。為此,本文相應(yīng)的設(shè)計(jì)如下兩組云模型算例: (1)C1(1.50,0.55,0.10),C2(8.50,0.55,0.24),C3(9.00,0.55,0.09); (2)C1(1.50,0.16,0.28),C2(1.50,0.78,0.62),C3(1.50,0.01,0.32)。 在設(shè)計(jì)每組云模型算例時(shí),主要考慮了以下原則:其中的兩個(gè)云應(yīng)盡量靠近,即相似度盡量的大,而第3個(gè)云應(yīng)盡量遠(yuǎn)離其他兩個(gè)云,即與其他兩云的相似度盡可能的小,目的是突出本文CCM方法在區(qū)分度上的優(yōu)勢(shì)。對(duì)每組算例,重點(diǎn)考察3個(gè)云模型彼此相似程度以及在穩(wěn)定性、區(qū)分度方面的差異,并同時(shí)與SCM方法、ECM方法進(jìn)行對(duì)比。由于SCM方法是基于隨機(jī)產(chǎn)生的云滴度量相似性的,能夠較好地描述云模型之間相似程度,但該方法每次計(jì)算的相似度均會(huì)發(fā)生變化,因此本文采取重復(fù)實(shí)驗(yàn)的方式,將云滴數(shù)目設(shè)置為1 000,反復(fù)進(jìn)行20次,并取所有結(jié)果的均值作為該方法最終的相似度。各方法的相似度結(jié)果如表1~表2所示。 表1 第1組算例的相似度 表2 第2組算例的相似度 由兩組算例的交互式計(jì)算結(jié)果可知,CCM方法得出的相似性結(jié)論與SCM方法、ECM方法均一致。雖然SCM直接利用云模型本身的云滴實(shí)現(xiàn),但結(jié)果不穩(wěn)定,且計(jì)算的準(zhǔn)確度以及復(fù)雜度依賴于云滴數(shù)。ECM和CCM均是基于期望曲線相交區(qū)域的面積計(jì)算相似度的,而期望曲線由云數(shù)字特征決定,因此這兩種方法每次實(shí)驗(yàn)得到的相似度均保持不變,且具有較低的計(jì)算復(fù)雜度。對(duì)第1組云模型,按照相似程度,與C1最相似的云為C3,與C2最相似的云為C3,與C3最相似的云為C2,且s(C2,C3)相對(duì)于其他云對(duì)而言最大,說(shuō)明3個(gè)云模型中C2與C3最為相似。 對(duì)單個(gè)云模型而言,如果與它同類的云的相似度越大,而屬不同類的云的相似度越小,說(shuō)明該度量方法能凸顯云模型之間的差異程度,有利于輔助決策。以第1組算例中的C3為例,按照相似度的具體數(shù)值衡量,與其最相似的云為C2,最不相似的為C1,并且s(C2,C3)更接近于1,而s(C1,C3)接近于0,可認(rèn)為C3與C2同屬一類,而與C1屬于不同類。若定義C3的概念差異度δ: (22) 容易算得各方法的概念差異度為δCCM=0.698 0,δECM=0.652 8,故δCCM>δECM,說(shuō)明CCM方法更能表征不同概念之間的差異,區(qū)分度更高。 對(duì)第2組云模型,仍以C3為例,卻有δCCM<δECM。根據(jù)期望曲線推斷,這組云模型的個(gè)體之間是包含與被包含的關(guān)系,即C3?C1?C2。即使某個(gè)云代表的概念不確定性程度很低,但與被包含的云之間的相似度不會(huì)趨于0。由表2可知,各方法均有s(C1,C3)>s(C2,C3),但ECM方法得到的s(C2,C3)卻趨于0,而SCM與CCM方法得出的相似度在0.5以上。其原因在于,ECM方法衡量?jī)苫A(chǔ)云相似程度的標(biāo)準(zhǔn)為期望曲線之間的相交區(qū)域,對(duì)第2組云模型算例,若某個(gè)云概念越明確,這一相交區(qū)域的面積越小,得到相似度也就更接近于0,以致得出不相似的結(jié)論。而SCM與CCM方法能夠較好地解決這一問(wèn)題:SCM計(jì)算的是不同基礎(chǔ)云中云滴之間的距離,對(duì)有較明確概念的云存在的情形,得到的仍是有限的距離;CCM通過(guò)概念躍升將用于計(jì)算相似度的相交區(qū)域轉(zhuǎn)換至綜合云中,對(duì)于某基礎(chǔ)云被包含的情形,由2.2節(jié)可知,這一相交區(qū)域的面積要大于熵值較大的期望曲線與橫軸所圍部分,即H1+H2>max(H1,H2),故此時(shí)CCM得出的相似度不低于0.5。 3.2雙交點(diǎn)情形的相似度計(jì)算 雙交點(diǎn)的情形更具有普適性,設(shè)計(jì)如下3個(gè)云模型算例:C1(1.41,0.61,0.31),C2(9.10,0.66,0.33),C3(8.85,0.75,0.28),容易驗(yàn)證這組云模型個(gè)體之間均存在兩個(gè)交點(diǎn)。與3.1節(jié)類似,此處3個(gè)云模型算例的設(shè)計(jì)原則仍然是在保證相似性結(jié)論正確的前提下,突出不同類別云之間的差異,保證有較大的區(qū)分度。 仍然將本文的CCM方法與SCM、ECM方法進(jìn)行對(duì)比,實(shí)驗(yàn)結(jié)果如表3所示。 表3 雙交點(diǎn)情形算例的計(jì)算結(jié)果 由表3可知,CCM仍然可以得到與SCM、ECM方法一致的結(jié)論,C2與C3的相似性最高,C1與C2其次,C1與C3最低。由于CCM與ECM方法均是基于相交區(qū)域面積的思想而計(jì)算相似度的,以C3為研究對(duì)象,易知s(C2,C3)更接近于1,s(C1,C3)卻接近于0,而計(jì)算的概念差異度δCCM=0.892 9,δECM=0.856 9,有δCCM>δECM,說(shuō)明本文提出的CCM方法在期望曲線具有雙交點(diǎn)的情形下,更能凸顯不同類別的云模型之間的差異,且適應(yīng)性較好。 3.3裝備保障系統(tǒng)的能力評(píng)估實(shí)驗(yàn) 這一部分實(shí)驗(yàn)主要驗(yàn)證CCM方法在某裝備保障系統(tǒng)能力評(píng)估中的有效性,并與文獻(xiàn)[10]采用的方法進(jìn)行對(duì)比。利用黃金分割法將裝備保障系統(tǒng)的能力進(jìn)行論域的劃分,共包括優(yōu)、良、中、差、極差5個(gè)能力等級(jí)(語(yǔ)言原子),對(duì)應(yīng)子區(qū)間以及建立的評(píng)估標(biāo)尺云如表4所示。 表4 劃分的子區(qū)間及對(duì)應(yīng)云的數(shù)字特征 第i個(gè)云的數(shù)字特征按如下方式給出: (23) 表5 目標(biāo)云與各標(biāo)尺云的相似度 從表5兩種方法的結(jié)果對(duì)比中可得到如下結(jié)論:目標(biāo)云TC與能力等級(jí)為優(yōu)的標(biāo)尺云最為相似,并且相似度值明顯高出其他的能力等級(jí),認(rèn)為裝備保障系統(tǒng)當(dāng)前的能力評(píng)估結(jié)果為優(yōu),與實(shí)際狀況一致。同時(shí)也可以發(fā)現(xiàn),CCM方法具有較大的概念差異度,這是由于文獻(xiàn)[10]的方法采用向量投影的方式計(jì)算相似度,其缺點(diǎn)在于某個(gè)分量值過(guò)大或過(guò)小會(huì)削弱其中某個(gè)分量的作用,余弦差異值不明顯,而CCM方法則不存在這一問(wèn)題。 4結(jié)論 作為描述概念相似程度的手段,對(duì)不同云模型之間相似度的研究,有助于云模型在系統(tǒng)評(píng)估和決策等領(lǐng)域中的推廣應(yīng)用。本文以云圖為平臺(tái),在現(xiàn)有研究成果的基礎(chǔ)上,提出了一種將云相似度的計(jì)算躍升至高層次概念的新思路,以實(shí)現(xiàn)云相似度的間接計(jì)算,并對(duì)算法進(jìn)行了描述和分析,給出了關(guān)鍵過(guò)程變量的計(jì)算公式。對(duì)不同交點(diǎn)情形的仿真實(shí)例以及具體應(yīng)用的實(shí)驗(yàn)結(jié)果表明,該方法能夠較客觀地反映不同概念之間的相似程度,并且在一定程度上克服了結(jié)果隨機(jī)性大、數(shù)字特征向量的部分分量過(guò)度占優(yōu)、區(qū)分度不高等問(wèn)題。本文著眼于概念的實(shí)現(xiàn)細(xì)節(jié),是對(duì)云模型理論的進(jìn)一步探索和完善,具有較好的理論價(jià)值與實(shí)際意義。但本文的研究對(duì)象主要集中在云模型與云模型上,如何將其擴(kuò)展至精確定量數(shù)值與云模型之間的相似度判定上,有待于進(jìn)一步研究。 參考文獻(xiàn): [1] Li D Y, Du Y.Artificialintelligencewithuncertainty[M]. Beijing: National Defense Industry Press,2005:143-145.(李德毅,杜鹢. 不確定性人工智能[M]. 北京:國(guó)防工業(yè)出版社,2005:143-145.) [2] Li D Y, Liu C Y, Liu L Y. Study on the universality of the normal cloud model[J].EngineerSciences, 2005, 3(2):18-24. [3] Zhang L M, Wu X G, Ding L Y, et al. A novel model for risk assessment of adjacent buildings in tunneling environments[J].BuildingandEnvironment, 2013, 65(7):185-194. [4] Jin B, Wang Y, Liu Z Y, et al. A trust model based on cloud model and Bayesian networks[J].ProcediaEnvironmentSciences, 2011, 11(12):452-459. [5] Wang W X, Wang X, Ge X L, et al. Muti-objective optimization model for muti-project scheduling on critical chain[J].AdvancesinEngineeringSoftware, 2014, 68(2):33-39. [6] Xie D W, Shi S L. Mine water inrush prediction based on cloud model theory and Markov model[J].JournalofCentralSouthUniversity, 2012, 43(6):2308-2315.(謝道文,施式亮. 基于云理論與加權(quán)馬爾可夫模型的礦井涌水量預(yù)測(cè)[J].中南大學(xué)學(xué)報(bào),2012,43(6):2308-2315.) [7] Ling W N, Hang N S, Li R Q. Short-term wind power forecasting based on cloud SVM model[J].ElectricPowerAutomationEquipment, 2013, 33(7):34-38.(凌武能,杭乃善,李如琦. 基于云支持向量機(jī)模型的短期風(fēng)電功率預(yù)測(cè)[J].電力自動(dòng)化設(shè)備,2013,33(7):34-38.) [8] Zhang Y, Zhao D N, Li D Y. The similar cloud and the measurement method[J].InformationandControl, 2004, 33(2):129-132.(張勇,趙東寧,李德毅.相似云及其度量分析方法[J].信息與控制,2004,33(2):129-132.) [9] Zhang S B, Xu C X. Study on the trust evaluation approach based on cloud model[J].ChineseJournalofComputers, 2013, 36(2):422-431.(張仕斌,許春香. 基于云模型的信任評(píng)估方法研究[J].計(jì)算機(jī)學(xué)報(bào),2013,36(2):422-431.) [10] Yang H W, Yue Y, Yang X Q. New determining algorithm for conception membership of one-dimensional normal cloud[J].ComputerIntegratedManufacturingSystems, 2012, 18(9):2117-2123.(楊宏偉,岳勇,楊學(xué)強(qiáng). 一種新的一維正態(tài)云概念隸屬度判定算法[J].計(jì)算機(jī)集成制造系統(tǒng),2012,18(9):2117-2123.) [11] Zhang G W, Li D Y, Li P, et al. A collaborative filtering recommendation algorithm based on cloud model[J].JournalofSoftware, 2007, 18(10):2403-2411.(張光衛(wèi),李德毅,李鵬,等. 基于云模型的協(xié)同過(guò)濾推薦算法[J].軟件學(xué)報(bào),2007,18(10):2403-2411.) [12] Li H L, Guo C H, Qiu W R. Similarity measurement between normal cloud models[J].ActaElectronicaSinica,2011,39(11):2561-2567.(李海林,郭崇慧,邱望仁.正態(tài)云模型相似度計(jì)算方法[J].電子學(xué)報(bào),2011,39(11):2561-2567.) [13] Yan Y, Tang Z M. Pertinence measurement of cloud model by using expectation-entropy curves[J].JournalofHuazhongUniversityofScienceandTechnology, 2012, 40(10):95-100.(閻巖,唐振民. 基于含熵期望曲線的云模型相關(guān)性度量方法[J].華中科技大學(xué)學(xué)報(bào),2012,40(10):95-100.) [14] Zhang S B, Xu C X, An Y J. Study on the risk evaluation approach based on cloud model[J].JournalofUniversityofElectronicScienceandTechnologyofChina, 2013, 42(1):92-104.(張仕斌,許春香,安宇俊. 基于云模型的風(fēng)險(xiǎn)評(píng)估方法研究[J].電子科技大學(xué)學(xué)報(bào),2013,42(1):92-104.) [15] Guan X, Guo Q, Zhang Z C, et al. Novel method for emitter recognition based on backward cloud model[J].JournalofUniversityofElectronicScienceandTechnologyofChina, 2012, 41(5):663-677.(關(guān)欣,郭強(qiáng),張政超,等.基于逆云模型的雷達(dá)輻射源識(shí)別方法[J].電子科技大學(xué)學(xué)報(bào),2012,41(5):663-677.) [16] Li H L, Guo C H. Piecewise aggregate approximation method based on cloud model for time series[J].ControlandDecision, 2011, 26(10): 1525-1529.(李海林,郭崇慧. 基于云模型的時(shí)間序列分段聚合近似方法[J].控制與決策,2011,26(10):1525-1529.) 查翔(1988-),男,博士研究生,主要研究方向?yàn)轱w機(jī)狀態(tài)監(jiān)控與故障診斷、人工智能及其應(yīng)用。 E-mail:zha_xiang@126.com 倪世宏(1963-),男,教授,博士研究生導(dǎo)師,主要研究方向?yàn)轱w行數(shù)據(jù)智能處理。 E-mail:470474069@qq.com 謝川(1974-),男,副教授,博士,主要研究方向?yàn)轱w行數(shù)據(jù)智能處理。 E-mail:1830486912@qq.com 張鵬(1982-),男,講師,博士,主要研究方向?yàn)轱w機(jī)故障診斷、故障預(yù)測(cè)與健康管理。 E-mail:zhangpeng25@21cn.com 網(wǎng)絡(luò)優(yōu)先出版地址:http://www.cnki.net/kcms/detail/11.2422.TN.20150323.1706.001.html Indirect computation approach of cloud model similarity based on conception skipping ZHA Xiang, NI Shi-hong, XIE Chuan, ZHANG Peng (CollegeofAeronauticsandAstronauticsEngineering,AirForceEngineering University,Xi’an710038,China) Abstract:To solve the unstable conclusion and low difference of current similarity measurement approaches of the cloud model, an indirect computation approach of cloud model similarity is proposed based on conception skipping. As a breakthrough point, intersecting areas shaped by expectation curves represent the similarity and are transferred to a higher level of conception, aiming to realize an equivalent change of respective conception importance in terms of original intersecting areas. Numbers and locations of intersections of expectation curves are discussed and corresponding judging rules are provided. Conception skipping is achieved by computing interrupting entropy to obtain the synthetic cloud. Intersecting areas of expectation curves from the synthetic cloud and fundamental clouds serve as a new criterion, and the indirect computing formula of similarity is given. Experimental results of designed simulate examples and an application confirm the effectiveness and wide feasibility. Keywords:cloud model; similarity; expectation curves; conception skipping 作者簡(jiǎn)介: 中圖分類號(hào):TP 18 文獻(xiàn)標(biāo)志碼:A DOI:10.3969/j.issn.1001-506X.2015.07.32 基金項(xiàng)目:國(guó)家自然科學(xué)基金(61372167,61379104)資助課題 收稿日期:2014-10-21;修回日期:2015-01-08;網(wǎng)絡(luò)優(yōu)先出版日期:2015-03-23。