孟 茜 ,萬仁霞,3* ,苗奪謙 ,趙公杰
(1.北方民族大學(xué)數(shù)學(xué)與信息科學(xué)學(xué)院,銀川,750021;2.同濟(jì)大學(xué)電子與信息工程學(xué)院,上海,201804;3.寧夏智能信息與大數(shù)據(jù)處理重點(diǎn)實(shí)驗室,北方民族大學(xué)數(shù)學(xué)與信息科學(xué)學(xué)院,銀川,750021)
形式概念分析[1](Formal Concept Analysis,F(xiàn)CA)是1982 年德國學(xué)者Wille 提出的一種有效的知識表示與知識發(fā)現(xiàn)的工具,具有層次性和可視化的特點(diǎn),已被廣泛應(yīng)用于知識工程、機(jī)器學(xué)習(xí)、信息檢索、數(shù)據(jù)挖掘和語義Web 等多個領(lǐng)域[2-5].在多學(xué)科多理論交叉融合的研究趨勢下,形式概念分析與其他相關(guān)理論的交叉和互補(bǔ)研究使其進(jìn)一步蓬勃發(fā)展,特別是與粗糙集、模糊集、三支決策理論的結(jié)合,有效地拓寬了形式概念分析的應(yīng)用領(lǐng)域.Qi et al[6]基于三支決策理論與經(jīng)典概念分析提出三支概念分析理論(Three-way Concept Analysis,3WCA),將形式概念二支表達(dá)拓寬為三支表達(dá).三支概念一經(jīng)提出便引起眾多學(xué)者的廣泛關(guān)注[7-10].龍柄翰和徐偉華[11]將三支概念分析融入模糊集合論,提出模糊三支概念分析與模糊三支概念格,對標(biāo)處理模糊不確定信息,從而實(shí)現(xiàn)不確定對象的有效識別和分類.然而,三支概念理論及其推廣理論可以處理“非此即彼”的布爾數(shù)據(jù),又或是“亦此亦彼”的模糊數(shù)據(jù),但對于“范圍已知,內(nèi)部未知”的灰色區(qū)間數(shù)據(jù)的處理卻涉及較少,因此本文考慮將灰色系統(tǒng)理論中處理灰色區(qū)間信息的方法引入三支概念,以拓展三支概念分析研究的理論背景.
灰色系統(tǒng)理論[12-14]最早由我國數(shù)學(xué)家鄧聚龍?zhí)岢觯渲饕碚摪ɑ疑^念、灰色預(yù)測、灰色決策和灰色數(shù)學(xué)等,其中灰色數(shù)學(xué)是其核心理論之一.在灰色數(shù)學(xué)中,灰數(shù)是指“某個只知道大概范圍而不知道確切值的數(shù)”,在此基礎(chǔ)上,王清?。?5]分析并結(jié)合模糊集合的表示方法,基于灰數(shù)的概念給出灰集合與灰數(shù)的描象描述.2005 年Yamaguchi et al[16]將粗糙集理論與灰色數(shù)學(xué)理論相結(jié)合,提出基于灰格的分類提取與約簡的決策規(guī)則,并定義了灰數(shù)運(yùn)算.隨后,Yamaguchi et al[17]針對包含區(qū)間數(shù)據(jù)的信息系統(tǒng),提出了一種基于灰色系統(tǒng)理論的粗糙集模型.2009 年Wu and Liu[18]在概念格約簡的灰色粗集方法中將基于灰數(shù)包含關(guān)系的灰色粗糙集模型融入到經(jīng)典形式概念分析中,提出了一種基于灰色粗糙集理論的區(qū)間數(shù)據(jù)形式概念分析方法,將灰色這一概念融入到形式概念分析中.
一方面,由于現(xiàn)實(shí)生活中的信息表示的復(fù)雜性、不確定性和不精確性等因素,許多觀測值常以區(qū)間數(shù)據(jù)的形式存在,如電流、電壓等,而灰色數(shù)學(xué)理論為這些區(qū)間數(shù)據(jù)的處理提供了理論基礎(chǔ);另一方面,三支概念分析突破了經(jīng)典形式概念中只能表示“共同擁有”的特點(diǎn),可以同時表示“共同擁有”和“共同不擁有”兩個部分,基于三支決策的思想,通過全域、正域和負(fù)域的相關(guān)運(yùn)算表達(dá)出邊界域,使三支概念分析較經(jīng)典形式概念分析更具有優(yōu)越性.因此,本文考慮將灰色數(shù)學(xué)與三支概念分析相結(jié)合,基于包含區(qū)間值的灰色形式背景提出灰色三支概念,并為解決區(qū)間數(shù)據(jù)的建格問題提供一種可行性方案,拓寬三支概念分析研究的理論支持及實(shí)際應(yīng)用范圍.
1.1 三支概念分析用P(·)表示集合的冪集,用DP(·)表示P(·)×P(·).
定義1[6]一個形式背景K=(U,V,I)由兩個集合U和V以及U和V之間的關(guān)系I組成,其中U為對象集,V為屬性集.若(x,a)∈I(也寫作xIa),則表示對象x具有屬性a或?qū)ο髕擁有屬性a.
對于X?U和A?V,定義兩對對偶算子分別如下:
正算子*:P(U)到P(V)上的映射和P(V)到P(U)的映射被定義為:
負(fù)算子*ˉ:P(U)到P(V)上的映射和P(V)到P(U)的映射被定義為:
其中,Ic=(U×V)-I.
結(jié)合正算子*和負(fù)算子*ˉ,可以得到以下兩對三支算子.
定義2[6]給定一個形式背景K=(U,V,I),對于X,Y?U和A?V,一對由屬性誘導(dǎo)的三支算子,?∶P(V)到DP(U)的映射及?∶DP(U)到P(V)的映射定義為:
它們簡稱為AE算子.
定義3[6]給定一個形式背景K=(U,V,I),對于X?U和A,B?V,一對由對象誘導(dǎo)的三支算子,?∶P(U)到DP(V)的映射及?∶DP(V)到P(U)的映射定義為:
它們簡稱為OE算子.
定義4[6]給定一個形式背景K=(U,V,I),對于X,Y?U和A?V,若有A?=(X,Y)且(X,Y)?=A,則稱((X,Y),A)為屬性導(dǎo)出三支概念,簡稱AE概念.其中,(X,Y)為AE概念((X,Y),A)的外延,A為AE概念((X,Y),A)的內(nèi)涵.
設(shè)((X,Y),A)和((Z,W),B)是AE概念,它們的偏序關(guān)系定義如下:
若((X,Y),A)≤((Z,W),B),則((X,Y),A)稱為((Z,W),B)的亞概念,同時((Z,W),B)稱為((X,Y),A)的超概念.
所有AE概念組成的集合記為AEL(U,V,I),稱為屬性導(dǎo)出三支概念格,簡稱為AE概念格.對于AE概念格,有以下結(jié)論.
定理1[6]一個形式背景K=(U,V,I)的AE概念格AEL(U,V,I)是一個完備格,對于任意的((X,Y),A),((Z,W),B)∈AEL(U,V,I),其上確界和下確界分別為:
其中,∨和∧分別表示上確界和下確界符號,也經(jīng)常稱為并和交.
類似地,也可以定義對象導(dǎo)出三支概念(OE概念).
定義5[6]給定一個形式背景K=(U,V,I),對于X?U和A,B?V,若有X?=(A,B)且(A,B)?=X,則稱(X,(A,B))為對象導(dǎo)出三支概念,簡稱OE概念.其中,X為OE概念(X,(A,B))的外延,(A,B)為OE概念(X,(A,B))的內(nèi)涵.
設(shè)(X,(A,B))和(Y,(C,D))是OE概念,它們的偏序關(guān)系定義如下:
若 (X,(A,B))≤(Y,(C,D)),(X,(A,B))稱為(Y,(C,D))的亞概念,同時(Y,(C,D))稱為(X,(A,B))的超概念.
由所有OE概念組成的集合記為OEL(U,V,I),稱為對象導(dǎo)出三支概念格,簡稱OE概念格.對于OE概念格,有以下結(jié)論.
定理2[6]一個形式背景K=(U,V,I)的OE概念格OEL(U,V,I)是一個完備格,對于任意的(X,(A,B)),(Y,(C,D))∈OEL(U,V,I),其上確界和下確界分別為:
1.2 灰數(shù)
定義6[17]G是論域U上的灰集合,由上隸屬度函數(shù)(x)和下隸屬度函數(shù)(x)兩個映射共同定義,如下:
定義10[17]對?x,y∈R,則其對應(yīng)的灰數(shù)為?x和?y,灰數(shù)的基本運(yùn)算定義如下:
(1)并運(yùn)算
(3)補(bǔ)運(yùn)算
定義11[19]灰度設(shè)灰數(shù)?x產(chǎn)生的背景或論域為Ω,μ(?x)為灰數(shù)?x取數(shù)域的測度,則:
稱g°(?x)為灰數(shù)?x的灰度.
本節(jié)將灰數(shù)理論與三支概念分析結(jié)合,在灰色形式背景下構(gòu)造灰色三支概念格,用來處理灰色區(qū)間數(shù)據(jù).
以下用G(·)表示灰集合的冪集,用DG(·)表示G(·)×G(·).
定義12稱=(U,V,)為一個灰色形式背景,其中U為所有對象的集合,V為所有屬性的集合,是定義在U×V上的灰集合,對于?(x,a)∈U×V,有(x,a).其中,
注本文中(x,a)表示對象x在a屬性上的值的上隸屬度和下隸屬度,即屬性a在對象x上可能存在值的最小值和最大值;(X,a)表示對象子集X在屬性a上的共同可能存在值的最小值和最大值;(x,A)表示屬性子集A在對象x上共同可能存在值的最小值和最大值;表示(x,a)的灰度,即(x,a)的未知程度;灰數(shù)?s則表示某對象在某屬性上的值的合格灰色區(qū)間.
基于灰色形式背景,定義正、負(fù)灰色算子如下.
定義13給定一個灰色形式背景=(U,V,)以及灰數(shù)?s,X?U,A?V,γ(X)和γ(A)分別為X與A上的灰度組成的集合,則灰色正算子?*:G(U)到G(V)上的映射和G(V)到G(U)的映射定義為:
它們稱為灰色AE算子.
定義15給定一個灰色形式背景=(U,V,),對于X?U和A,B?V,一對由對象誘導(dǎo)的三支算子,?∶G(U)到DG(V)的映射及?∶DG(V)到G(U)的映射定義為:
它們稱為灰色OE算子.
下面為灰色AE概念和灰色OE概念的定義.
定義16給定一個灰色形式背景=(U,V,)以及灰數(shù)?s,X,Y?U,A?V,記:
若X?=(γ(A),γ(B)),且(γ(A),γ(B))?=X.則稱(X,(γ(A),γ(B)))為對象導(dǎo)出灰色三支概念,簡稱GYOE概念.其中,X叫作GYOE概念的外延,(γ(A),γ(B))叫作GYOE概念的內(nèi)涵.
命題1給定一個灰色形式背景=(U,V,)以及灰數(shù)?s,X,X1,X2,X3,X4?U為對象子集,A,A1,A2,A3,A4?V為屬性子集,則下列結(jié)論成立:
同理可證X?X??.
(3)由命題(2)可知A??A???,再由命題(1)知A?A??,得A????A?,故A?=A???得證.
同理可證X?=X???.
(4)因為有:
由命題(1)得:
因此,
同理可證:
故證得:
同理可證:
由命題(1)得:
故命題(5)得證.
同理可證:
(6)令(γ(X1),γ(X2))=A?,由命題(2)可知A??A???.
又因為:
命題(6)可證.
同理可證:
(7)由命題(6)可知:
再由命題(5)可知:
可證.
同理可證:
由命題(4)知:
同理可證:
定義18設(shè)=(U,V,)為灰色形式背景,AEGL(U,V,) 表示由灰色形式背景=(U,V,)生成的所有GYAE概念的集合.
對任意:
定義其偏序關(guān)系如下:
定理3設(shè)=(U,V,)為灰色形式背景,AEGL(U,V,) 表示由灰色形式背景=(U,V,) 生成的所有GYAE概念的集合,則AEGL(U,V,在偏序關(guān)系≤下是一個完備格,稱灰色AE概念格,簡稱GYAE概念格.
對任意:
其下確界和上確界分別為:
證明由于上確界與下確界證明類似,這里只證明下確界.因為,
由命題(3)得:
再由定義18 得:
為一個下界.
定義19設(shè)=(U,V,)為灰色形式背景,OEGL(U,V) 表示由灰色形式背景=(U,V,)生成的所有GYOE概念的集合.
對任意:
定義其偏序關(guān)系如下:
定理4設(shè)=(U,V,)為灰色形式背景,OEGL(U,V,) 表示由灰色形式背景=(U,V,) 生成的所有GYOE概念的集合,則OEGL(U,V,)在偏序關(guān)系≤下是一個完備格,稱灰色OE概念格,簡稱GYOE概念格.
對任意:
其下確界和上確界分別為:
其證明同定理3 類似.
例1給定一個灰色形式背景=(U,V,),其中,U={x1,x2,x3,x4}表示供貨商備選集合,V={a,b,c}表示供應(yīng)商的產(chǎn)品質(zhì)量、產(chǎn)品價格及運(yùn)送時間三個屬性(x,a)表示某個供應(yīng)商某個屬性的普遍評價區(qū)間,且(x,a)區(qū)間在[0,1]范圍之內(nèi),如表1 所示,取?s=[0.6,1]為合格區(qū)間.
表1 灰色形式背景Table 1 A grey context
對于?(x,a)∈U×V,(x,a)在[0,1],根據(jù)定義11,此時μ(Ω)=1,則本示例分析中灰度計算如下:
由表1 可得屬性導(dǎo)出灰色三支概念的外延與內(nèi)涵(表2)以及對應(yīng)的GYAE概念格(圖1).從AE5可以看出,同時具備a和b屬性合格的是x2,且合格的共同評價區(qū)間為?,故灰度為0,而a和b屬性同時不合格的是x3,且未能合格的共同評價區(qū)間為[0.45,0.58],則灰度為0.13,表明供應(yīng)商2 號在產(chǎn)品質(zhì)量和產(chǎn)品價格方面評價較好,且并未有重合部分,供應(yīng)商3 號在這兩方面普遍評價較差,未能合格,且重合部分的灰度為0.13.
圖1 GYAE 概念格Fig.1 GYAE concept lattice
表2 屬性導(dǎo)出灰色三支概念的外延與內(nèi)涵Table 2 The extension and intension of grey three-way concept induced by attributes
對偶地,根據(jù)表1 可得對象導(dǎo)出灰色三支概念的外延與內(nèi)涵(表3)以及對應(yīng)的GYOE概念格(圖2).其中,從OE8可以看出x2和x4的b屬性同時合格,且合格共同評價區(qū)間為?,因此灰度為0;x2和x4的c屬性同時不合格,且評價區(qū)間為[0.45,0.55],則此時灰度為0.1.因此,表示供應(yīng)商2 號和供應(yīng)商3 號在產(chǎn)品價格方面評價較好,且評價區(qū)間并未重合,在運(yùn)送時間方面評價較差,未能合格,且重合部分的評價灰度為0.1.
圖2 GYOE 概念格Fig.2 GYOE concept lattice
表3 對象導(dǎo)出灰色三支概念的外延與內(nèi)涵Table 3 The extension and intension of grey three-way concept induced by objects
通過上述實(shí)例的概念格圖,可以直觀地看出各供應(yīng)商所具備的屬性、評價區(qū)間以及各概念的結(jié)構(gòu)關(guān)系.
在現(xiàn)實(shí)生活的信息系統(tǒng)中,數(shù)據(jù)的類型不僅包括“非此即彼”的布爾數(shù)據(jù)、“亦此亦彼”的模糊數(shù)據(jù),還包括一些“范圍已知,內(nèi)部未知”的灰色區(qū)間數(shù)據(jù),而以往的概念格信息處理中鮮有涉及這類數(shù)據(jù).本文將灰度和灰格運(yùn)算融入三支概念分析,提出灰色三支概念及灰色三支概念格,給出了灰色三支的正負(fù)算子、灰色三支概念的相關(guān)定義、定理及其性質(zhì),并通過實(shí)例說明灰色三支概念和灰色三支概念格的實(shí)用性.一方面可以將得出的結(jié)論清晰地表示在圖中,另一方面也通過灰度展示灰色信息的未知程度,為分析灰色區(qū)間數(shù)據(jù)提供一種合理的方法.
本文實(shí)例中的(x4,a)=[0.55.0.66],故(x4,a)屬于合格區(qū)間?s=[0.6,1]的可能性較大,實(shí)例則將其直接歸入不合格區(qū)間,雖然杜絕了所有不合格數(shù)據(jù)歸入合格區(qū)間,但還需進(jìn)一步考慮將這些“中間數(shù)據(jù)”進(jìn)行更合理地分類.下一步將考慮結(jié)合變精度的相關(guān)概念,進(jìn)一步優(yōu)化灰色三支概念分析理論.