李長清,張燕蘭
(1.閩南師范大學(xué) 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,福建 漳州 363000;2.閩南師范大學(xué) 計(jì)算機(jī)學(xué)院,福建 漳州 363000)
基于集對分析的多值信息系統(tǒng)粗糙集模型
李長清1,張燕蘭2
(1.閩南師范大學(xué) 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,福建 漳州 363000;2.閩南師范大學(xué) 計(jì)算機(jī)學(xué)院,福建 漳州 363000)
鑒于多值信息系統(tǒng)下相似關(guān)系和容差關(guān)系存在的局限性,結(jié)合集對分析思想,給出一種集對聯(lián)系度粗糙集模型,這種模型比以上兩種模型更廣.
多值信息系統(tǒng);相似關(guān)系;容差關(guān)系;集對分析;聯(lián)系度相似關(guān)系
經(jīng)典粗糙集理論[1]是波蘭數(shù)學(xué)家Pawlak Z.于1982年提出的,它是一種處理不確定和不完整問題的新型數(shù)學(xué)工具,現(xiàn)已在決策與分析、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、模式識別、智能信息處理[2-6]等諸多領(lǐng)域得到廣泛應(yīng)用.經(jīng)典粗糙集處理的是完備信息系統(tǒng),而在現(xiàn)實(shí)應(yīng)用中,由于對數(shù)據(jù)獲取的限制,系統(tǒng)屬性值大都存在不唯一,系統(tǒng)成了多值信息系統(tǒng).對多值信息系統(tǒng)的處理已有很多模型[7-9],相似關(guān)系[4]和容差關(guān)系[10]是兩種最普遍的模型,但這兩種模型都存在局限性.
集對分析方法[11]是趙克勤教授提出的用于研究集合之間不確定性關(guān)系的一種新理論,現(xiàn)已得到廣泛的應(yīng)用[12-16].本文針對相似關(guān)系和容差關(guān)系兩種模型存在的局限性,結(jié)合集對分析的思想,提出一種集對粗糙集模型,克服了這兩種模型的局限性,并證明集對粗糙集模型是這兩種模型的推廣.
定義1[4]設(shè)S=〈U,A∪j5i0abt0b〉為一個信息系統(tǒng),其中U是論域,A是條件屬性集,j5i0abt0b是決策屬性集.?a∈A?j5i0abt0b,有a∶U→Va,其中Va為a的值域.若對于?u∈U,a∈A,有|a(u)|=1,則稱S是完備信息系統(tǒng);否則稱S是多值信息系統(tǒng)(或不完備信息系統(tǒng)),|?|表示集合的基數(shù).
定義2[4]設(shè)S為多值信息系統(tǒng),?≠B?A,B上的相似關(guān)系定義為:
SIMB滿足自反性和對稱性,但不滿足傳遞性.u在B上的相似類為:
定義3[4]設(shè)S為多值信息系統(tǒng),?≠B?A,若|b(x)|>1,則令b(x)=*(*表示空值),B上的容差關(guān)系定義為:
TB滿足自反性和對稱性,但不滿足傳遞性.u在B上的容差類為:TB(u)={v∈U|(u,v)∈TB}.
相似關(guān)系和容差關(guān)系都是對經(jīng)典不可分辨關(guān)系的拓展,但這兩種模型都存在局限性.例如對u1=(1,2,3,…,50),u2=(0,2,3,…,50),相似關(guān)系認(rèn)為u1與u2完全不同,必須劃在不同類中,這會使劃分過細(xì),特別不適合對大型多值信息系統(tǒng)的處理.而例如對v1=(1,{1,3},3),v1=({2,3},2,{1,2}),可令v1=(1,*,3),v1=(*,2,*),容差關(guān)系認(rèn)為v1與v2不可分辨,必須劃在同一類中,而事實(shí)上,v1與v2完全不可能相同.因此,這兩種關(guān)系在多值信息系統(tǒng)下都存在局限性.
定義4[14]設(shè)S為多值信息系統(tǒng)?≠B?A,?u,v∈U,u和v在B下的集對聯(lián)系度:
這里p=|M(u,v)|/n表示u和v在B下的同一度,q=|M(u,v)|/n表示u和v在B下的差異度,r=|K(u,v)|/n表示u和v在B下的對立度,n=|B|.
定義5 設(shè)S為多值信息系統(tǒng),?≠B?A,0≤α,β≤1,聯(lián)系度相似關(guān)系定義為:
PB滿足自反性和對稱性,但不滿足傳遞性.u在B上的聯(lián)系度相似為:PB(u)={v∈U|(u,v)∈PB}.
定理1 設(shè)S為多值信息系統(tǒng),?≠B?A,PB是聯(lián)系度相似關(guān)系,SIMB是相似關(guān)系,則當(dāng)α=β=0時,PB=SIMB.
定理2 設(shè)S為多值信息系統(tǒng),?≠B?A,PB是聯(lián)系度相似關(guān)系,TB是容差關(guān)系,則當(dāng)α=0,β=1,時,TB?PB.
此定理顯然成立.
由定理1與2可以看出聯(lián)系度相似關(guān)系是相似關(guān)系和容差關(guān)系的推廣.
定義6 設(shè)S為多值信息系統(tǒng),?≠B?A,?X?U,X在聯(lián)系度相似關(guān)系下的上、下近似分別為:
性質(zhì)1 設(shè)S為多值信息系統(tǒng),?≠B?A,?X,Y?U,容易驗(yàn)證以下性質(zhì):
上、下近似考慮的是元素u所在類包含于X的情況,而在許多實(shí)際情況下,我們要考慮u所在類對X的隸屬情況,這就成了變精度.以下定義在聯(lián)系相似關(guān)系下的變精度.
定義7 設(shè)S為多值信息系統(tǒng),?≠B?A,?X?U,0.5<γ≤1,在聯(lián)系度相似關(guān)系下的γ上、下近似分別為:
基于γ上、下近似得到的粗糙集模型稱為γ變精度粗糙集模型.當(dāng)γ=1時,因此,可看出γ變精度模型是更廣的模型.
以下用一個實(shí)例來比較分析多值信息系統(tǒng)集對聯(lián)系度相似關(guān)系的粗糙集模型與相似關(guān)系、容差關(guān)系粗糙集模型之間的性能,說明多值信息系統(tǒng)集對聯(lián)系度相似關(guān)系的粗糙集模型優(yōu)于這兩種集模型.
設(shè)多值信息系統(tǒng)S=〈U,A∪j5i0abt0b〉,其中論域U={u1,u2,…,u6},條件屬性集A={a1,a2,…,a10},d為決策屬性,見表1.
表1 多值信息系統(tǒng)Tab.1Multi-value information system
用相似關(guān)系分析這個系統(tǒng):
在這種分類中,u1與u3只有在屬性a10取值不同就劃在不同類中,導(dǎo)致了系統(tǒng)劃分過細(xì),特別不適合于對大型系統(tǒng)的處理.
用容差關(guān)系分析這個系統(tǒng):
在這種分類中,u1與u6在屬性a2,a6,a8,a10的取值都不可能相同卻劃在同類,使得劃分很不合理,而且容易使系統(tǒng)劃分過粗.
用聯(lián)系度相似關(guān)系分析這個系統(tǒng):取
用這種關(guān)系分類,顯然克服了以上兩種關(guān)系的局限性.
本文在多值信息系統(tǒng)下結(jié)合集對分析的思想,建立了集對聯(lián)系度的粗糙集模型,這種模型既吸收了相似關(guān)系和容差關(guān)系模型的優(yōu)點(diǎn),又克服了它們的局限性,是比這兩種模型更廣的模型,還可根據(jù)實(shí)際運(yùn)用的需要,對α,β合理的調(diào)節(jié),達(dá)到對系統(tǒng)更靈活的處理.
[1]Pawlak Z.Rough sets[J].International Journal of Comput?er and Information Science,1982,11:341-356.
[2]Pawlak Z,Busse J G,slowinski R,et al.Rough sets[J].communications of the ACM,1995,38(11):89-95.
[3]王國胤.Rough理論與知識獲取[M].西安:西安交通大學(xué)出版社,2001.
[4]張文修,仇國芳.基于粗糙集的不確定決策[M].北京:科學(xué)出版社,2005.
[5]王超,羅可.不完備信息系統(tǒng)中基于限制容差關(guān)系的屬性約簡方法[J].計(jì)算機(jī)應(yīng)用,2011,31(12):3236-3239.
[6]陳家俊,蘇守寶,金萍.一種對象完備度優(yōu)先填補(bǔ)的決策樹規(guī)則提取算法[J].計(jì)算機(jī)應(yīng)用與軟件,2014,31(5):264-267.
[7]舒暢.多值RS理論中屬性約簡的另一種算法[J].四川師范大學(xué)學(xué)報(bào):自然科學(xué)版,2005,28(1):43-45.
[8]蘇莉.基于條件信息熵的多值信息系統(tǒng)的屬性約簡[J].電腦學(xué)習(xí),2010(6):106-107.
[9]吳根秀,王玏,紀(jì)軍,等.多值信息系統(tǒng)的基于相似度的粗糙集模型[J].江西師范大學(xué)學(xué)報(bào):自然科學(xué)版,2011,35(1):88-90.
[10]Kryszkiewicz M.Rough set approach to incomplete infor?mation system[J].Information Sciences,1998,11(2):39-49.
[11]趙克勤.集對分析及其初步應(yīng)用[M].杭州:浙江出版社,2000.
[12]黃兵,鐘斌,周獻(xiàn)中.改進(jìn)的集對粗集模型[J].計(jì)算機(jī)工程與應(yīng)用,2004,40(2):82-84.
[13]劉富春.基于集對分析的變精度粗糙集模型[J].計(jì)算機(jī)工程與應(yīng)用,2005,41(10):74-76.
[14]李長清,李克典.不完備信息系統(tǒng)下基于重要度相似關(guān)系的粗集模型[J].海南師范大學(xué)學(xué)報(bào):自然科學(xué)版,2008,21(4):401-403.
[15]陳蓉素.不完備信息系統(tǒng)中的集對粗糙集模型分析[J].計(jì)算機(jī)工程與應(yīng)用,2009,45(16):63-65.
[16]陳圣兵,李龍澍,紀(jì)霞,等.不完備信息系統(tǒng)中基于集對相似度的粗集模型[J].計(jì)算機(jī)科學(xué),2010,37(7):186-190.
責(zé)任編輯:畢和平
Rough Set Model Based on Set-pair Analysis in Multivalude Information Systems
LI Changqing1,ZHANG Yanlan2
(1.School of Mathematics and Statistics,Minnan Normal University,Zhangzhou363000,China;2.College of Computer,Minnan Normal University,Zhangzhou363000,China)
In view of the limitations of similarity relation and tolerance in multivalude information systems,in the paper a new rough set model,set-pair connectivity rough set model,was proposed by introducting set-pair analysis.It generalized the two models above.
Multivalude information system;Similarity relation;Tolerance relation;Set-pair analysis;Connectivity simi?larity relation
TP 18
A
1674-4942(2015)02-0119-03
2015-03-08
福建省基金項(xiàng)目(2015J05011,JA14200,2013J01029,JA13198,JK2014028)