鄧廷權(quán),楊成東,張月童
(1.哈爾濱工程大學(xué)理學(xué)院,黑龍江 哈爾濱 150001;2.哈爾濱工程大學(xué)計算機(jī)科學(xué)與技術(shù)學(xué)院,黑龍江 哈爾濱 150001;3.臨沂大學(xué) 信息學(xué)院,山東 臨沂 276000)
Z.Pawlak[1]于 1982 年提出的粗糙集是一種有效的軟計算工具,已經(jīng)廣泛應(yīng)用于決策分析、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)和人工智能等各個領(lǐng)域.隨著理論研究的深入和應(yīng)用的需求,經(jīng)典粗糙集有了進(jìn)一步的拓展,其中變精度粗糙集和模糊粗糙集是2種典型的代表.
從實際應(yīng)用的角度而言,由于數(shù)據(jù)獲取或數(shù)據(jù)處理方面的原因,信息系統(tǒng)或數(shù)據(jù)庫中不可避免地含有噪音,而經(jīng)典粗糙集對噪音數(shù)據(jù)比較敏感.鑒于此,1993年 W.Ziarko[2]引入了集合的相對錯誤包含度的概念,并提出了變精度粗糙集模型,該模型有效地解決了人為錯誤或噪音導(dǎo)致的錯誤分類問題,具有較好的抗噪和容錯能力.
經(jīng)典粗糙集處理的是清晰(分明)的、離散的符號值數(shù)據(jù),但在實際中經(jīng)常遇到連續(xù)的、具有模糊性的數(shù)據(jù).對于這類問題,經(jīng)典做法是將連續(xù)的屬性值離散化后運(yùn)用經(jīng)典粗糙集處理,這種方法造成了一定的信息損失.模糊粗糙集[3-5]將粗糙集和模糊集理論結(jié)合起來,利用數(shù)據(jù)相似性程度作為數(shù)據(jù)間的相似關(guān)系,從而避免了連續(xù)屬性值離散化帶來的信息損失.
變精度模糊粗糙集[6-9]是變精度粗糙集與模糊粗糙集的融合.它不僅具有變精度粗糙集的特點,具有一定的抗噪和容錯能力,也具有模糊粗糙集的特點,能夠處理具有模糊性的知識.
然而,變精度模糊粗糙集是基于模糊等價關(guān)系建立的.在實際應(yīng)用中,很難直接構(gòu)造模糊等價關(guān)系,往往先構(gòu)造模糊相似關(guān)系,再通過求模糊相似關(guān)系的傳遞閉包將其模糊等價關(guān)系.文獻(xiàn)[10]指出,這種方法會丟失較多有價值的信息.因此,研究模糊相似關(guān)系下的變精度模糊粗糙集模型具有重要的意義.
首先回顧經(jīng)典粗糙集模型.
定義1[1]設(shè)U是有限論域,R是U上的一個等價關(guān)系,X?U,X的R下近似和R上近似分別定義為.集合稱為X的R邊界域;稱為X的R正域;稱為X的R負(fù)域.顯然,
在經(jīng)典粗糙集模型基礎(chǔ)上,W.Ziarko提出變精度粗糙集模型,增強(qiáng)了模型的抗噪和容錯能力.
定義2[2]設(shè)U是有限論域,R是U上的一個等價關(guān)系,0≤β <0.5,X?U,定義X的 β 下近似和β上近似分別為
式中:c(X,Y)為集合X和Y的相對錯誤包含度,定義如式(1)
式中:|X|為集合X的基數(shù).
論域U的全體模糊子集組成的集合稱為U的模糊冪集,記作F(U).給定論域U和V,則U×V的模糊子集R∈F(U×V)是一個模糊關(guān)系.一個模糊關(guān)系R稱為模糊相似關(guān)系,若R滿足:
1)自反性:R(x,x)=1,?x∈U;
2)對稱性:R(x,y)=R(y,x),?x,y∈U.
模糊相似關(guān)系R通常不滿足傳遞性,即R不滿足R?R?R.若滿足傳遞性,則稱R為模糊等價關(guān)系.
模糊邏輯算子是模糊集理論和模糊邏輯中的重要概念,在模糊信息分析和處理中具有重要應(yīng)用.T-范數(shù)和模糊蘊(yùn)含是2種重要的模糊邏輯算子.
若*滿足1)交換律;2)結(jié)合律;3)關(guān)于2個變量都是遞增的;4)邊界條件:0*b=0;1*b=b對任意b∈[0,1]成立,稱[0,1]上的二元運(yùn)算* 為T-范數(shù).若→滿足1)邊界條件:1→0=0,0→0=0→1=1→1=1;2)關(guān)于第1個變量單調(diào)遞減,關(guān)于第2個變量單調(diào)遞增,稱[0,1]上的二元運(yùn)算→為模糊蘊(yùn)含算子.
有很多T-范數(shù)和模糊蘊(yùn)含算子[11].比如
都是典型且常用的T-范數(shù).模糊蘊(yùn)含算子常通過T-范數(shù)以如下方式構(gòu)造:
1)負(fù)蘊(yùn)含:a→b=1-T(a,1-b).
2)剩余蘊(yùn)含:a→b=sup{λ∈[0,1]|a* λ≤b},其中sup為集合的上確界.
本文只考慮T-范數(shù)的模糊剩余蘊(yùn)含算子.式(2)對應(yīng)的模糊剩余蘊(yùn)含算子分別為:
為了處理模糊信息,本文首先定義了基于模糊邏輯算子的模糊相對錯誤包含度的概念.
定義3 設(shè)F1和F2是有限論域U上的模糊子集,即F1,F(xiàn)2∈F(U).模糊集F1和F2的相對錯誤包含度e(F1,F(xiàn)2)定義為
式中:S(Fi)為支集,即S(Fi)={x∈U|Fi(x)>0}.
定義3中的模糊相對錯誤包含度是定義2中分明集合的相對錯誤包含度在模糊集中的推廣.
命題 1 對?F,F(xiàn)1,F(xiàn)2∈F(U),若F1?F2,則e(F,F(xiàn)1)≥e(F,F(xiàn)2).
證明 當(dāng)F=?時,e(F,F(xiàn)1)=e(F,F(xiàn)2)=0.當(dāng)F≠?時,因為F1?F2,則對于任意的x∈U,有F1(x)≤F2(x).由→算子定義可知,它是關(guān)于第2變量遞增的.所以,
定義4 設(shè)U是有限論域,F(xiàn)(U)是U的模糊冪集,R是U×U上的模糊相似關(guān)系.?F∈F(U),F(xiàn)關(guān)于R的β下模糊近似RβF與β上模糊近似F分別定義為:
式中:β是精度控制參數(shù),0≤β≤0.5;
當(dāng)R為U上的經(jīng)典等價關(guān)系,F(xiàn)為U的分明子集且0≤β<0.5時,定義4退化為定義2;當(dāng)R為經(jīng)典等價關(guān)系,F(xiàn)為U的分明子集且β=0時,定義4退化為定義1.因此,有下面2個命題.
命題2 當(dāng)R為U上的經(jīng)典等價關(guān)系,F(xiàn)為U的分明子集,0≤β<0.5時,該模型退化為Ziarko變精度粗糙集模型.
證明 僅證β下模糊近似可以退化到Ziarko下近似,β上模糊近似可以退化到Ziarko上近似的證明類似.用RZF表示集合F在Ziarko模型下的β下近似
βRZβF=∪{E∈U/R|c(E,F(xiàn))≤β},經(jīng)典等價關(guān)系R和分明子集F分別為特殊的模糊關(guān)系和模糊集.下面證明RβF(x)=1,當(dāng)且僅當(dāng)x∈RZβF.
對于?x∈RZβF,則?E∈U/R,使得x∈E且c(E,F(xiàn))≤β.若E?F,那么e(E,F(xiàn))=0;若c(E,F(xiàn))≤β,根據(jù)定義 1 可知,e(E,F(xiàn))≤β,即x∈WxF.根據(jù)ωF(x)的定義可知,RβF(x)=1.
反之,若RβF(x)=1,則 ?y∈U,使得e([y]R,F(xiàn))≤β,且R(y,x)=1.
由于R是經(jīng)典的等價關(guān)系,所以[y]R就是y的等價類且x∈[y]R.
根據(jù)經(jīng)典集合的相對錯誤包含度與模糊相對錯誤包含度的定義可知,
證畢.
命題3 當(dāng)R為經(jīng)典等價關(guān),F(xiàn)為U的分明子集,β=0時,該模型退化為Pawlak粗糙集.
證明同理于命題2.
下面研究新建立的變精度模糊粗糙集的性質(zhì).
性質(zhì)1 當(dāng)0≤β<0.5時,β模糊近似有以下性質(zhì):
證明 1)?x∈U,若WxF=?,那么RβF(x)=0,顯然RF(x)≤F(x).若Wx≠?,則?y∈Wx,βFF都滿足e([y]R,F(xiàn))≤β.由于 0≤β <0.5,所以e([y]R,F(xiàn))≤1-β,即y∈.根據(jù)RβF與F的定義可知,RβF(x)≤F(x).
由x的任意性得RβF?F.
2)?x∈U,若Wx=?,因為sup(?)=0,所以?對于?y∈WxF,都有R(y,x)≤sup(?)=0,根據(jù)ωF(x)的定義,可知R?(x)=0;若Wx=?,根據(jù)RFβ?β(x)的定義可知,Rβ?(x)=0.由x的任意性得Rβ? =?.
由性質(zhì)1得,RβU?U,因此僅需證RβU=U.?x∈U,都有U(x)=1,所以?y∈U,都有e([y]R,U)=0≤β.而R(y,x)≤sup(U)=1,所以WxU=U.由于R是模糊相似關(guān)系,所以R(x,x)=1.根據(jù)ωF(x)的定義可得,RβU(x)=1.由x的任意性得RβU=U.
3)?x∈U,若,根據(jù)RβF(x)的定義可知,RβF1(x)=0,顯然RβF1(x)≤F2(x).
根據(jù)RβF(x)的定義可知,RβF1(x)≤RβF2(x),即
4)由F1∪F2?F1,F(xiàn)1∪F2?F2和性質(zhì) 3 可得Rβ(F1∪F2)?RβF1,Rβ(F1∪F2)?RβF2.所 以,Rβ(F1∪F2)?RβF1∪RβF2.
5)由F1∩F2?F1,F(xiàn)1∩F2?F2和性質(zhì) 3 可得Rβ(F1∩F2)?RβF1,Rβ(F1∩F2)?RβF2.因此,Rβ(F1∩F2)?RβF1∩RβF2.
6)證明過程同性質(zhì)4)的證明過程.
7)證明過程同性質(zhì)5)的證明過程.
2)β上模糊近似和β下模糊近似與 經(jīng)典變精度相同,也不滿足擴(kuò)張性和反擴(kuò)張性.
顯然RβF?F?F.因此,β上模糊近似和β下模糊近似也不滿足擴(kuò)張性和反擴(kuò)張性.
3)β上模糊近似和β下模糊近似與經(jīng)典變精度相同,也不滿足冪等性.
仍取2)中的例子,按照定義可以計算得Rβ(RβF)={0.6,0.92,0.73,0.92,0.85}.
顯然Rβ(RβF)≠RβF,所以 β 下模糊近似不滿足冪等性.同樣,β上模糊近似也不滿足冪等性.
例如,取a→b=min(1,1-a+b),則 β=0.45時,?={1,0.1,0.2}.因此?≠?.這是條件過寬所致,特別地,對模糊蘊(yùn)含算子加個限制,則空集的上近似為空集.
性質(zhì)2 若模糊蘊(yùn)含算子滿足s→0=0(s>0),則?=?.
證明 根據(jù)模糊相對錯誤包含度的定義可知,若s→0=0(s>0),則e(F1,F(xiàn)2)=1.因為[x]R≠?,所以?x∈U,都有e([x]R,?)=1.由于0≤β <0.5,所以沒有y∈U滿足e([y]R,?)<1 - β,即Wx?=?.根據(jù)F(x)的定義可知,?(x)=0.綜上所述,?x∈U,都有?(x)=0,即?=?.
性質(zhì)3 若0≤β1<β2<0.5,則
證明記為在 β1精度下的WxF記為在β 精度下的Wx.2F
由于0≤β1< β2<0.5,所以e([y]R,F(xiàn))≤β2,因此由RβF(x)的定義得Rβ1F(x)≤Rβ2F(x),e([y]R,F(xiàn))≤1-β,即y∈.根據(jù)定義4可得RβF(x)≤F(x).
同理可證
Rˉβ1F?F.
本文研究了基于模糊相似關(guān)系的變精度模糊粗糙集模型.用模糊相似關(guān)系來刻畫未知的集合.新的變精度模糊粗糙集模型有如下優(yōu)勢:
1)該模型是對變精度粗糙集的一般化和模糊化;
2)該模型既能夠處理連續(xù)值模糊信息,又具有一定程度的抗噪和容錯能力;
3)該模型是基于模糊相似關(guān)系建立的,不需要對論域進(jìn)行任何形式的劃分,而是用模糊相似矩陣表示模糊信息,具有更大的靈活性和實用性.
[1]PAWLAK Z.Rough sets[J].International Journal of Computer and Information Sciences,1982,11:341-356.
[2]ZIARKO W.Variable precision rough set model[J].Journal of Computer and System Science,1993,46(1):39-59.
[3]DUBOIS D,PRADE H.Rough fuzzy sets and fuzzy rough sets[J].International Journal of General Systems,1999,17:191-209.
[4]郭海剛,高井貴,張振良.模糊相似關(guān)系下的模糊粗糙集[J].遼寧師范大學(xué)學(xué)報:自然科學(xué)版,2006,29(3):289-291.GUO Haigang,GAO Jinggui,ZHANG Zhenliang.Fuzzy rough sets based on fuzzy similar relation[J].Journal of Liaoning Normal University:Natural Science Edition,2006,29(3):289-291.
[5]米據(jù)生,吳偉志,張文修.粗糙集的構(gòu)造與公理化方法[J].模式識別與人工智能,2002,15(3):280-286.MI Jusheng,WU Weizhi,ZHANG Wenxiu.Constructive and axiomatic approaches of the theory of rough sets[J].Pattern Recognition and Artificial Intelligence,2002,15(3):280-286.
[6]李凡,劉啟和,楊國瑋.變精度模糊粗糙集的一種定義[J].控制與決策,2008,23(11):1206-1210.LI Fan,LIU Qihe,YANG Guowei.Definition of variable precision fuzzy rough sets[J].Contro1 and Decision,2008,23(11):1206-1210.
[7]張東星,苗奪謙,李道國,等.基于數(shù)據(jù)庫系統(tǒng)的可變精度粗糙集模型[J].計算機(jī)科學(xué),2005,32(12):172-174.ZHANG Dongxing,MIAO Duoqian,LI Daoguo,et al.A variable precision rough set model based on database system[J].Computer Science,2005,32(12):172-174.
[8]黃春娥,張振良.基于截集的變精度模糊粗糙集模型[J].模糊系統(tǒng)與數(shù)學(xué),2004,18(9):200-203.HUANG Chune,ZHANG Zhenliang. Variable precision fuzzy rough set model based on cut set[J].Fuzzy Systems and Mathematics,2004,18(9):200-203.
[9]馮林,王國胤.用于數(shù)據(jù)分析的變精度模糊粗糙模型[J].西南交通大學(xué)學(xué)報,2008,43(5):582-589.FENG Lin,WANG Guoyin.Variable precision fuzzy rough model for data analysis[J].Journal of Southwest Jiaotong University,2008,43(5):582-589.
[10]王熙照,趙素云.基于相似關(guān)系的模糊粗糙集模型[J].計算機(jī)科學(xué),2004,31(10A):31-35.WANG Xizhao,ZHAO Suyun.Modelling fuzzy rough sets based on similarity relation[J].Computer Science,2004,31(10A):31-35.
[11]尤飛,馮艷賓,李洪興.模糊蘊(yùn)涵算子及其構(gòu)造(I)[J].北京師范大學(xué)學(xué)報:自然科學(xué)版,2003,39(5):606-611.YOU Fei,F(xiàn)ENG Yanbin,LI Hongxing.Fuzzy implication operators and their construction(I)[J].Journal of Beijing Normal University:Natural Science,2003,39(5):606-611.