摘要:屬性約簡(jiǎn)是粗糙集理論的一個(gè)核心問(wèn)題.根據(jù)變精度粗糙集理論與包含度理論,引入不協(xié)調(diào)決策信息系統(tǒng)β-上近似約簡(jiǎn)和β-下近似約簡(jiǎn)的概念,提出了一種新的知識(shí)約簡(jiǎn)算法,該算法以β-上近似辨識(shí)集和β-下近似辨識(shí)集為基礎(chǔ),先分別求解出β-上近似辨識(shí)集與β-下近似辨識(shí)集,再通過(guò)最小析取范式確定知識(shí)約簡(jiǎn)集,從而進(jìn)一步推導(dǎo)出最優(yōu)決策規(guī)則集.理論分析和實(shí)例結(jié)果表明,該屬性約簡(jiǎn)算法具有有效性和實(shí)用性.
關(guān)鍵詞:不協(xié)調(diào)決策信息系統(tǒng);β-上(下)近似辨識(shí)集;知識(shí)約簡(jiǎn);決策方法
中圖分類(lèi)號(hào):O159"" 文獻(xiàn)標(biāo)志碼:A
Knowledge Reduction and Decision-making Methodfor Variable Precision Inconsistent Decision Information Systems
WANG Wei-yuan, WANG Qian*
(College of Mathematics and Computer Science, Northwest Minzu University, Lanzhou 730030, China)
Abstract:Attribute reduction is a key problem in rough set theory. In this paper,the concepts of β-upper approximate reduction and β-lower approximate reduction in inconsistent decision information system is proposed based on variable precision rough set theory and inclusion degree theory. And a new knowledge reduction algorithm is proposes based on β-upper approximate identification set and β-lower approximate identification set. By solving the β-upper approximate identification set,the β-lower approximate identification set and the minimum disjunctive norm, the knowledge reduction set and the optimal decision rule set is obtained. Theoretical analysis and experimental results show that the new attribute reduction algorithm is effective and practical.
Key words:inconsistent decision information system; β-upper(lower) approximate recognition sets; knowledge reduction; decision rule
粗糙集理論[1],作為繼概率論、模糊集等之后的新興數(shù)學(xué)工具,主要用于不精確和不確定的數(shù)據(jù)處理.該理論在多個(gè)領(lǐng)域,如機(jī)器學(xué)習(xí)、知識(shí)獲取、決策制定、信息處理、數(shù)據(jù)挖掘、模式識(shí)別及過(guò)程控制中,均獲得了廣泛應(yīng)用與深入推廣[2].粗糙集理論是處理復(fù)雜、不確定及不精確數(shù)據(jù)的強(qiáng)有力工具,尤其擅長(zhǎng)解決傳統(tǒng)統(tǒng)計(jì)或計(jì)算難以應(yīng)對(duì)的問(wèn)題.它重新定義知識(shí),把知識(shí)看作是不可分辨關(guān)系對(duì)論域的分類(lèi)能力.通過(guò)引入上下近似概念,該理論有效量化知識(shí)中的不確定度,從數(shù)據(jù)中提煉有價(jià)值信息.
隨著科技發(fā)展的需要,從海量信息中汲取有價(jià)值知識(shí)的需求日益迫切.文獻(xiàn)[3]中深入剖析了產(chǎn)業(yè)鏈信息的不確定性問(wèn)題;文獻(xiàn)[4]則巧妙運(yùn)用邏輯回歸的方法,有效縮減信息的復(fù)雜性和冗余.知識(shí)發(fā)現(xiàn)是一個(gè)嚴(yán)謹(jǐn)?shù)倪^(guò)程,它需要通過(guò)精確的數(shù)學(xué)方法來(lái)揭示信息的深層結(jié)構(gòu),在此過(guò)程中,粗糙集理論被證明是一種極具價(jià)值的方法.粗糙集理論通過(guò)等價(jià)關(guān)系細(xì)分對(duì)象,為復(fù)雜信息中提取穩(wěn)定知識(shí)提供新視角.Pawlak模型雖在數(shù)據(jù)處理與分類(lèi)上展現(xiàn)了強(qiáng)大的功能,但二元分類(lèi)忽略現(xiàn)實(shí)模糊性,且限于靜態(tài)數(shù)據(jù),對(duì)動(dòng)態(tài)變化應(yīng)對(duì)不足,沒(méi)有有效的處理方法.1993年,ZIARKO W[5]拓展了Pawlak粗糙集模型,提出變精度粗糙集模型,引入了閾值概念,使對(duì)象分類(lèi)不再局限于嚴(yán)格等價(jià),在實(shí)際應(yīng)用中能更好地適應(yīng)各種復(fù)雜場(chǎng)景,提高分類(lèi)的準(zhǔn)確性和魯棒性.文獻(xiàn)[6-7]中進(jìn)一步探討了變精度粗糙集理論的知識(shí)約簡(jiǎn)方法.
從不協(xié)調(diào)決策信息系統(tǒng)中獲得屬性約簡(jiǎn)和知識(shí)約簡(jiǎn)是決策系統(tǒng)研究領(lǐng)域的一個(gè)重要課題.本文旨在探討從不協(xié)調(diào)決策信息系統(tǒng)中高效獲取這兩種約簡(jiǎn)并進(jìn)行決策的方法.在已有的不協(xié)調(diào)決策信息系統(tǒng)屬性約簡(jiǎn)技術(shù)的基礎(chǔ)上,通過(guò)引入不協(xié)調(diào)決策信息系統(tǒng)β-上近似約簡(jiǎn)和β-下近似約簡(jiǎn)的概念,提出了一種新的知識(shí)約簡(jiǎn)算法,該算法以β-上近似辨識(shí)集和β-下近似辨識(shí)集為基礎(chǔ),先分別求解出β-上近似辨識(shí)集與β-下近似辨識(shí)集,再通過(guò)最小析取范式來(lái)確定知識(shí)約簡(jiǎn)集,從而進(jìn)一步推導(dǎo)出最優(yōu)決策規(guī)則集.最后,采用實(shí)例分析的方式,對(duì)所述算法的有效性和實(shí)用性進(jìn)行了驗(yàn)證.
1 不協(xié)調(diào)決策信息系統(tǒng)
定義1[8-9] 設(shè)(U,A,F(xiàn),d)為決策信息系統(tǒng),
RA=xi,xjflxi=flxjal∈A,
Rd=xi,xjdxi=dxj,
若RARd,則稱(chēng)(U,A,F(xiàn),d)是協(xié)調(diào)的,若RARd,則稱(chēng)(U,A,F(xiàn),d)是不協(xié)調(diào)的.
(U,A,F(xiàn),d)為決策信息系統(tǒng),
RB=xi,xjflxi=
flxjal∈BBA,
U/RB=xiBxi∈U,
U/Rd=D1,D2,…,Dr,
其中xiB=xjxi,xj∈RB.
對(duì)xi∈U,記DDj/xiB=Dj∩xiBxiBj≤r,則U上關(guān)于B的β上近似協(xié)調(diào)集、β下近似協(xié)調(diào)集定義為
MβBxi=
DjDDj/xiBgt;1-βxi∈U,(1)
GβBxi=
DjDDj/xiBgt;βxi∈U.(2)
定義2[8-9] 設(shè)(U,A,F(xiàn),d)為不協(xié)調(diào)決策信息系統(tǒng),BA,
(1)對(duì)xi∈U,若MβBxi=MβAxi,則B為β上近似協(xié)調(diào)集,如果B的任何真子集都不是β上近似協(xié)調(diào)集,則必是β上近似約簡(jiǎn)集.
(2)對(duì)xi∈U,若GβBxi=GβAxi,則B為β下近似協(xié)調(diào)集,如果B的任何真子集都不是β下近似協(xié)調(diào)集,則必是β下近似約簡(jiǎn)集.
例1 不協(xié)調(diào)決策信息系統(tǒng)如表1所列,取β=3/5.
按照分類(lèi),等價(jià)關(guān)系有
U/RA=x1,x2,x3,x4,x5,x6,
U/Rd=x1,x4,x2,x3,x5,x6.
顯然,RARd,因此U,A,F(xiàn),d是不協(xié)調(diào)決策信息系統(tǒng),并且
Ra1=x1,x2,x3,x4,x5,x6,
Ra2=x1,x2,x3,x4,x5,x6,
Ra3=x1,x2,x3,x4,x5,x6,
Ra4=x1,x2,x3,x4,x5,x6.
于是得到β下近似協(xié)調(diào)集為
GβAx1=GβAx2=,
GβAx3=GβAx4=GβAx5=GβAx6=D2,
Gβa1x1=Gβa1x2=
Gβa1x3=Gβa1x4=Gβa1x5=
Gβa1x6=D2,
Gβa2x1=Gβa2x2=,
Gβa2x3=Gβa2x4=Gβa2x5=
Gβa2x6=D2,
Gβa3x1=Gβa3x2=,
Gβa3x3=Gβa3x4=Gβa3x5=
Gβa3x6=D2,
Gβa4x1=Gβa4x2=Gβa4x3=
Gβa4x4=Gβa4x5=Gβa4x6=D2.
β上近似協(xié)調(diào)集為
MβAx1=MβAx2=D1,D2,
MβAx3=MβAx4=MβAx5=
MβAx6=D2,
Mβa1x1=Mβa1x2=Mβa1x3=
Mβa1x4=Mβa1x5=Mβa1x6=D2,
Mβa2x1=Mβa2x2=D1,D2,
Mβa2x3=Mβa2x4=Mβa2x5=
Mβa2x6=D2,
Mβa3x1=Mβa3x2=D1,D2,
Mβa3x3=Mβa3x4=Mβa3x5=
Mβa3x6=D2,
Mβa4x1=Mβa4x2=Mβa4x3=
Mβa4x4=Mβa4x5=Mβa4x6=D2.
2 知識(shí)約簡(jiǎn)理論分析
設(shè)(U,A,F(xiàn),d)為不協(xié)調(diào)決策信息系統(tǒng),對(duì)于xi∈U,由上述定義1及定義2,可對(duì)屬性子集的約簡(jiǎn)性和協(xié)調(diào)性進(jìn)行區(qū)分.以下給出β上下近似辨識(shí)集對(duì)的相關(guān)概念以及性質(zhì)和定理.
定義3 設(shè)不協(xié)調(diào)決策信息系統(tǒng)為(U,A,F(xiàn),d),U/RA=x1A,x2A,…,xiA,MβBxi={Dj|D(Dj/[xi]Bgt;1-β)},GβB(xi)={Dj|D(Dj/[xi]Bgt;β)},xi∈U,其中β上下近似對(duì)象集對(duì)分別定義為
D*βM=
[xi]A,[xj]AMβAxi≠M(fèi)βAxj,(3)
D*βG=
[xi]A,[xj]AGβAxi≠GβAxj.(4)
定義4 設(shè)(U,A,F(xiàn),d)為不協(xié)調(diào)決策信息系統(tǒng),U/RA=C1,C2,…,Cm,fakCi表示ak關(guān)于Ci的值.
a) 記
DβMCi,Cj=
akak∈A,fak(Ci)≠fak(Cj),
Ci,Cj∈D*βM;
,Ci,CjD*βM,(5)
則定義MβM=DβMCi,Cj,i,j≤m為β上近似辨識(shí)矩陣.
b) 記
DβGCi,Cj=
akak∈A,fak(Ci)≠fak(Cj),
Ci,Cj∈D*βG;
,Ci,CjD*βG,(6)
則MβG=DβGCi,Cj,i,j≤m為β下近似辨識(shí)矩陣.
基于定義3和定義4,可推導(dǎo)出以下的性質(zhì)和定理.
性質(zhì)1 設(shè)不協(xié)調(diào)決策信息系統(tǒng)為(U,A,F(xiàn),d),U/RA=C1,C2,…,Cm,MβM,MβG具有以下性質(zhì):
(1) MβM,MβG為對(duì)稱(chēng)矩陣, 即
DβMCi,Cj=DβMCj,Ci,
DβGCi,Cj=DβGCj,Ci,i,j≤m.
(2) MβM,MβG對(duì)角線上元素都為A,即
DβMCi,Cj=DβGCi,Cj=A, i,j≤m.
(3) DβM(Ci,Cj)DβM(Ci,Ck)∪DβM(Ck,Cj),i,j,k≤m.
DβG(Ci,Cj)DβG(Ci,Ck)∪DβG(Ck,Cj),i,j,k≤m.
定理1 設(shè)不協(xié)調(diào)決策信息系統(tǒng)為(U,A,F(xiàn),d),對(duì)于BA,有
(1)B是β上近似協(xié)調(diào)集當(dāng)且僅當(dāng)Ci,Cj∈D*βM,有B∩DβMCi,Cj≠.
(2)B是β下近似協(xié)調(diào)集當(dāng)且僅當(dāng)Ci,Cj∈D*βG,有B∩DβGCi,Cj≠.
證明 (1) 充分性.假設(shè)B是β上近似協(xié)調(diào)集,若Ci,Cj∈D*βM,記Ci=xiA,Cj=[xj]A,則由β上近似協(xié)調(diào)集定義可知MβAxi≠M(fèi)βAxj.根據(jù)β上近似協(xié)調(diào)集(B為β上近似協(xié)調(diào)集當(dāng)且僅當(dāng)MβAx=MβBx,BA)可知,[xi]A∩[xj]A=,則ak∈B,使得fkxi≠fkxj,即fkCi≠fkCj,因而有ak∈DβMCi,Cj成立,從而B(niǎo)∩DβMCi,Cj≠.
必要性.假設(shè)Ci,Cj∈D*βM,使得B∩DβMCi,Cj=成立,記 Ci=xiA,Cj=[xj]A,則由β上近似協(xié)調(diào)集定義可知MβAxi≠M(fèi)βA(xj).對(duì)于ak∈B,必然akDβM(Ci,Cj),使得fkCi=fkCj,即fkxi=fkxj,這說(shuō)明[xi]B=[xj]B,根據(jù)β上近似協(xié)調(diào)集定義可知B不是β上近似協(xié)調(diào)集.
(2)充分性.假設(shè)B是β下近似協(xié)調(diào)集,若Ci,Cj∈D*βG,記 Ci=xiA,Cj=[xj]A,則由β下近似協(xié)調(diào)集定義可知GβAxi≠GβAxj.根據(jù)β下近似協(xié)調(diào)集(B為β下近似協(xié)調(diào)集當(dāng)且僅當(dāng)GβAx=GβBx,BA)可知,[xi]A∩[xj]A=,則ak∈B,使得fkxi≠fkxj,即fkCi≠fkCj,因而有ak∈DβGCi,Cj成立,從而B(niǎo)∩DβGCi,Cj≠.
必要性.假設(shè)Ci,Cj∈D*βG,使得B∩DβGCi,Cj=成立,記Ci=xiA,Cj=[xj]A,則由β下近似協(xié)調(diào)集定義可知GβAxi≠GβAxj.對(duì)ak∈B,必akDβGCi,Cj,使得fkCi=fkCj,即fkxi=fkxj,這說(shuō)明[xi]B=[xj]B,根據(jù)β下近似協(xié)調(diào)集定義可知B不是β下近似協(xié)調(diào)集.
定理1提供了判斷變精度不協(xié)調(diào)決策信息系統(tǒng)的屬性子集是否具有協(xié)調(diào)性的理論基礎(chǔ).
定義5 設(shè)不協(xié)調(diào)決策信息系統(tǒng)為(U,A,F(xiàn),d),對(duì)于U/RA=C1,C2,…,Cm,其β上近似區(qū)分公式,β下近似區(qū)分公式分別定義為
FM=∧Ci,Cj∈D*βM∨DβMCi,Cj,(7)
FG=∧Ci,Cj∈D*βG∨DβGCi,Cj.(8)
定理2 設(shè)不協(xié)調(diào)決策信息系統(tǒng)為(U,A,F(xiàn),d),F(xiàn)M最小析取范式簡(jiǎn)記為FM=∨mk=1∧ni=1ai,若Bk=aii=1,2,…,n,則{Bk|k=1,2,…,m}包含所有β上近似約簡(jiǎn)集.
證明 對(duì)于k≤m,Ci,Cj∈D*βM,依據(jù)最小析取范式的定義可知Bk∩DβMCi,Cj≠,結(jié)合定理1中的(1),可推出Bk為β上近似協(xié)調(diào)集.若FM=∨mk=1Bk從Bk中約去任意元素ai成為Bk′,即Bk′=Bk-ai,則xi,xj∈U,且Ci=xiA,Cj=[xj]A,Ci,Cj∈D*βM,使Bk′∩DβMCi,Cj=,則Bk不是β上近似協(xié)調(diào)集,進(jìn)而,Bk是β上近似約簡(jiǎn)集.又因區(qū)分公式FM涵蓋所有DβMCi,Cj,因此不包含其他的分布約簡(jiǎn).
定理3 設(shè)不協(xié)調(diào)決策信息系統(tǒng)為(U,A,F(xiàn),d),F(xiàn)G為最小析取范式,簡(jiǎn)記為FG=∨mk=1∧ni=1ai,若Bk=aii=1,2,…,n,則{Bk|k=1,2,…,m}包含所有β下近似約簡(jiǎn)集.
證明 對(duì)于k≤m,Ci,Cj∈D*βG,依據(jù)最小析取范式的定義可知Bk∩DβGCi,Cj≠,結(jié)合定理1中的(2),可推出Bk為β下近似協(xié)調(diào)集.若FG=∨mk=1Bk從Bk中約去任意元素ai成為Bk′,即Bk′=Bk-ai,則xi,xj∈U,且Ci=xiA,Cj=[xj]A,Ci,Cj∈D*βG,使Bk′∩DβGCi,Cj=,則Bk不是β下近似協(xié)調(diào)集,進(jìn)而,Bk是β下近似約簡(jiǎn)集.又因區(qū)分公式FG涵蓋所有DβGCi,Cj,因此不包含其他的分布約簡(jiǎn).
定理1、定理2和定理3為處理變精度不協(xié)調(diào)決策信息系統(tǒng)提供了理論支撐.利用β上近似區(qū)分公式與β下近似區(qū)分公式,可以計(jì)算出相應(yīng)的最小析取范式,進(jìn)而簡(jiǎn)化規(guī)則,同時(shí)確保其完整性,獲取各類(lèi)變精度不協(xié)調(diào)決策信息系統(tǒng)的相對(duì)約簡(jiǎn)集.此方法能有效提取優(yōu)化決策規(guī)則,并應(yīng)對(duì)數(shù)據(jù)的不確定性與不協(xié)調(diào)性.
3 變精度不協(xié)調(diào)決策信息系統(tǒng)的知識(shí)約簡(jiǎn)方法
3.1 算法原理與描述
基于知識(shí)約簡(jiǎn)理論,根據(jù)定義3和定義4求解變精度不協(xié)調(diào)決策信息系統(tǒng)的辨識(shí)集對(duì),也就是β上下近似辨識(shí)集對(duì),對(duì)對(duì)象的屬性集進(jìn)行精確的分類(lèi).再依據(jù)定義5、定理2以及定理3,構(gòu)建出β上近似辨識(shí)矩陣和β下近似辨識(shí)矩陣.最后,通過(guò)計(jì)算這些矩陣的最小析取范式,獲取所有的相對(duì)約簡(jiǎn)集.具體見(jiàn)算法1.
算法1 基于β上近似區(qū)分對(duì)象集的知識(shí)約簡(jiǎn)算法
輸入:不協(xié)調(diào)決策信息系統(tǒng)S=(U,A,F(xiàn),d).
輸出:β上近似約簡(jiǎn)集和β下近似約簡(jiǎn)集.
步驟(1) 對(duì)S=(U,A,F(xiàn),d),xi∈U,計(jì)算xiA.
步驟(2) 對(duì)S=(U,A,F(xiàn),d),xi∈U,計(jì)算決策等價(jià)類(lèi)xid:
U/Rd=D1,D2,…,Dr=
(xi,xj)∈U×Ud(xi)=d(xj).
步驟(3) 計(jì)算S=(U,A,F(xiàn),d)的β上近似約簡(jiǎn)集:
①根據(jù)定義1,對(duì)xi∈U,求MβAxi,
MβAxi=
DjDDj/xiAgt;1-β,xi∈U.
②計(jì)算D*βM,得到β上近似區(qū)分對(duì)象集對(duì),
D*βM=
[xi]A,[xj]AMβAxi≠M(fèi)βAxj.
③根據(jù)β上近似區(qū)分對(duì)象集對(duì),計(jì)算β上近似區(qū)分屬性集DβMCi,Cj.
DβMCi,Cj=
akak∈A,fak(Ci)≠fak(Cj),
Ci,Cj∈D*βM;
,Ci,CjD*βM.
④根據(jù)DβMCi,Cj,計(jì)算β上近似辨識(shí)矩陣.
MβM=∧i,j∨DβM(Ci,Cj)=
∧Ci,Cj∈D*βM∨DβM(Ci,Cj).
⑤計(jì)算FM=∨mk=1∧ni=1ai的最小析取范式,得到β上近似約簡(jiǎn)集FminM.
步驟(4) 計(jì)算S=(U,A,F(xiàn),d)的β下近似約簡(jiǎn)集.
①根據(jù)定義1,對(duì)xi∈U,求GβAxi.
GβAxi=
DjDDj/xiAgt;βxi∈U.
②計(jì)算D*βG,得到β下近似區(qū)分對(duì)象集對(duì),
D*βG=
[xi]A,[xj]AGβAxi≠GβAxj.
③根據(jù)β下近似區(qū)分對(duì)象集對(duì),計(jì)算β下近似區(qū)分屬性集DβGCi,Cj,
DβGCi,Cj=
akak∈A,fak(Ci)≠fak(Cj),
Ci,Cj∈D*βG;
,Ci,CjD*βG.
④根據(jù)DβGCi,Cj,計(jì)算β下近似辨識(shí)矩陣,
MβG=∧i,j∨DβG(Ci,Cj)=
∧Ci,Cj∈D*βG∨DβG(Ci,Cj).
⑤計(jì)算FG=∨mk=1∧ni=1ai的最小析取范式, 得到所有β下近似約簡(jiǎn)集FminG.
步驟(5) 輸出β上近似約簡(jiǎn)集和β下近似約簡(jiǎn)集.
3.2 算法分析
算法1步驟(1)和(2)的時(shí)間復(fù)雜度均為ΟU.對(duì)于步驟(3) 和步驟(4)中,①,②均可在時(shí)間復(fù)雜度ΟU3內(nèi)完成,③的時(shí)間復(fù)雜度分別為ΟD*βM.C和Ο(|D*βG|.|C|),④,⑤的時(shí)間復(fù)雜度均接近于ΟU2.因此,本算法總的時(shí)間復(fù)雜度為 ΟU3.算法1的空間復(fù)雜度為ΟU3.
與算法1相比,文獻(xiàn)[12]在計(jì)算不協(xié)調(diào)信息系統(tǒng)的屬性約簡(jiǎn)時(shí), 需要構(gòu)建決策系統(tǒng)的區(qū)分矩陣來(lái)存儲(chǔ)差別屬性, 其算法的空間復(fù)雜度為 ΟC.U2, 因此, 當(dāng)屬性集的個(gè)數(shù)大于對(duì)象集的個(gè)數(shù)時(shí),即Cgt;U時(shí),占用的存儲(chǔ)空間較大.相較于目前常用的屬性約簡(jiǎn)算法,本文算法在時(shí)間復(fù)雜度和空間復(fù)雜度上有較大的優(yōu)勢(shì),并且能夠求出系統(tǒng)所有β上近似約簡(jiǎn)集和β下近似約簡(jiǎn)集.
4 基于β上近似協(xié)調(diào)算法的決策規(guī)則獲取
屬性約簡(jiǎn)是識(shí)別和簡(jiǎn)化決策表中條件屬性和決策屬性之間關(guān)系的過(guò)程,通過(guò)這個(gè)過(guò)程,粗糙集理論可以從復(fù)雜的數(shù)據(jù)中提取出簡(jiǎn)潔而有用的知識(shí),為決策提供支持.采用簡(jiǎn)化的決策表,并運(yùn)用歸納方法提取條件屬性與決策屬性間的關(guān)聯(lián)規(guī)則,進(jìn)而推導(dǎo)出變精度不協(xié)調(diào)決策信息系統(tǒng)的決策準(zhǔn)則[10].在此過(guò)程中,決策規(guī)則的前提和后件分別對(duì)應(yīng)于屬性集的描述和最終的決策判定.設(shè)不協(xié)調(diào)決策信息系統(tǒng)為S=(U,A,F(xiàn),d),BA,d=d,U/Rd=d1,d2,…,dr,決策規(guī)則可表示為rx:∧a,v→∨d,w,a∈BA,v∈Va,w∈Vd,其中,Va表示a的值域,Vd表示d的值域.
用Crix衡量rx的可信度因子[10],
Crix=maxmi=1xB∩xdxB,
其中,B的等價(jià)類(lèi)是xB,d的等價(jià)類(lèi)是xd,集合基數(shù)是·.顯然,若Crx=1,rx為確定規(guī)則;若0lt;Crxlt;1,rx為不確定規(guī)則.
定義6[11] 設(shè)∧a,v→∨d,w是一般決策規(guī)則,則稱(chēng)red∧a,v→∨d,w是優(yōu)化決策規(guī)則.
在變精度不協(xié)調(diào)決策信息系統(tǒng)中,通過(guò)β上下近似約簡(jiǎn)簡(jiǎn)化決策表,成為新的決策表,得到新的決策信息系統(tǒng),它包含更少的屬性但仍然能夠進(jìn)行有效的決策.為評(píng)估決策規(guī)則的可靠性,本文選取了規(guī)則可信度[10]的概念,利用該概念對(duì)已獲取的決策規(guī)則進(jìn)行優(yōu)化處理,進(jìn)而提煉出更為高效的決策規(guī)則.針對(duì)變精度不協(xié)調(diào)決策信息系統(tǒng),提取優(yōu)化決策規(guī)則的具體算法,詳見(jiàn)算法2.
算法2 變精度不協(xié)調(diào)決策信息系統(tǒng)的優(yōu)化決策規(guī)則
輸入:不協(xié)調(diào)決策信息系統(tǒng)S=(U,A,F(xiàn),d).
輸出:最優(yōu)決策規(guī)則集.
步驟(1) 基于算法1給出的約簡(jiǎn)算法,進(jìn)一步計(jì)算出S=(U,A,F(xiàn),d)中所有的β上近似約簡(jiǎn)集FminM與β下近似約簡(jiǎn)集FminG.
步驟(2) 利用a) 計(jì)算出的FminM和FminG,構(gòu)造新的決策信息系統(tǒng)S′=(U,A,F(xiàn),d).
步驟(3) 規(guī)則的獲取與選擇.計(jì)算每條規(guī)則的可信度,從新的決策信息系統(tǒng)S′=(U,A,F(xiàn),d)中提取滿足條件的決策規(guī)則.
步驟(4) 當(dāng)某條決策規(guī)則的可信度達(dá)到或超過(guò)給定閾值時(shí),將其視為最優(yōu)決策規(guī)則,分別輸出確定性的規(guī)則集Crx=1不確定性的規(guī)則集0lt;Crxlt;1,并對(duì)這些規(guī)則進(jìn)行統(tǒng)一的整合處理.
5 算例分析
為了進(jìn)一步分析本文算法的有效性,設(shè)S=(U,A,F(xiàn),d)是不協(xié)調(diào)決策信息系統(tǒng),其中U=x1,x2,…,x6,C=a1,a2,a3,a4,d=d,如表2所列.求出以下不協(xié)調(diào)決策信息系統(tǒng)在β=0.7時(shí)的β上近似約簡(jiǎn)和在β=0.6時(shí)的β下近似約簡(jiǎn).
第1步 由算法1的步驟(1),計(jì)算條件屬性等價(jià)類(lèi)為
C1=x1A=x1,
C2=x2A=x2,
C3=x3A=x3,x5,x6,
C4=x4A=x4.
第2步 由算法1的步驟(2),計(jì)算決策屬性等價(jià)類(lèi)為
D1=x1,x5,x6,D2=x2,x3,x4.
第3步 由算法1的步驟(3),計(jì)算在β=07時(shí)的β上近似約簡(jiǎn):
(a) 根據(jù)算法1中步驟(3)中①計(jì)算β=0.7時(shí)的β上近似協(xié)調(diào)集M0.7Axi的值i=1,2,…,6,M0.7Ax1=1,0,M0.7Ax2=0,1,M0.7A(x3)=M0.7A(x5)=M0.7A(x6)=0.67,0.33,M0.7Ax4=0,1.
(b) 根據(jù)算法1中步驟(3)中②,計(jì)算在β=0.7時(shí)β上近似區(qū)分對(duì)象集對(duì)為
D*0.7M=C1,C2,C1,C3,
C1,C4,C2,C3,C3,C4.
(c) 根據(jù)算法1中步驟(3)中③計(jì)算β上近似屬性集:D*0.7MC1,C2=a1,a2,a3,a4,D*0.7M(C1,C3)={a1,a2},D*0.7M(C1,C4)={a1,a2,a3},D*0.7M(C2,C3)={a3,a4},D*0.7M(C3,C4)={a3}.
(d) 根據(jù)算法1中步驟(3)中④和⑤,計(jì)算最小析取范式:
FM=a1∨a2∨a3∨a4∧
a1∨a2∧a1∨a2∨a3∧a3∨a4
∧a3=a1∧a3∨a2∧a3.
因此,S=(U,A,F(xiàn),d)在β=0.7時(shí)的β上近似約簡(jiǎn)集為a1,a3和a2,a3.
第4步 由算法1的步驟(4)中①,求在β=0.6時(shí)的β下近似約簡(jiǎn):
(a) 根據(jù)算法1中步驟(4)中①,計(jì)算β=06時(shí)的下近似協(xié)調(diào)集G0.6Axi,i=1,2,…,6,G0.6Ax1=D1,G0.6Ax2=D2,G0.6Ax3=G0.6Ax5=G0.6Ax6=D1,G0.6Ax4=D2.
(b) 根據(jù)算法1中步驟(4)中②,計(jì)算在β=0.6時(shí)β下近似區(qū)分對(duì)象集對(duì):
D*0.6G=
C1,C2,C1,C4,C2,C3,C3,C4.
(c) 根據(jù)算法1中步驟(4)中③,計(jì)算β下近似區(qū)分屬性集:
D*0.6GC1,C2=a1,a2,a3,a4,
D*0.6GC1,C4=a1,a2,a3,
D*0.6GC2,C3=a3,a4,
D*0.6GC3,C4=a3.
(d) 根據(jù)算法1中步驟(4)中④和⑤,計(jì)算最小析取范式,
FG=a1∨a2∨a3∨a4∧
a1∨a2∨a3∧a3∨a4∧
a3=a3.
因此,S=(U,A,F(xiàn),d)在β=0.6時(shí)的β下近似約簡(jiǎn)集為a3.
第5步 由算法2,基于FminM=a1,a3,對(duì)應(yīng)優(yōu)化決策規(guī)則集為
r1:a1,1∧a3,0→d,1,
r2:a1,0∧a3,1→d,2,
r3:a1,0∧a3,0→d,1∨d,2.
基于FminM=a2,a3,對(duì)應(yīng)優(yōu)化決策規(guī)則集為
r1:a2,0∧a3,0→d,1,
r2:a2,1∧a3,1→d,2,
r3:a2,1∧a3,0→d,1∨d,2.
第6步 基于FminG=a3,對(duì)應(yīng)優(yōu)化決策規(guī)則集為
r1:a3,0→d,1∨d,2,
r2:a3,1→d,2.
因此,不協(xié)調(diào)決策信息系統(tǒng)S=(U,A,F(xiàn),d)在β=0.7時(shí)的β上近似約簡(jiǎn)集為B1=a1,a3,a2,a3,在β=0.6時(shí)β下近似約簡(jiǎn)集B2=a3,這些方法均能從不協(xié)調(diào)的決策系統(tǒng)中有效地提取出優(yōu)化后的決策規(guī)則,從而提升決策的效率和準(zhǔn)確性.
6 結(jié)束語(yǔ)
本文針對(duì)不協(xié)調(diào)決策信息系統(tǒng),根據(jù)變精度粗糙集理論與包含度理論,引入β-上近似約簡(jiǎn)和β-下近似約簡(jiǎn)的概念,提出了一種新的知識(shí)約簡(jiǎn)算法.該算法通過(guò)引入變精度參數(shù),能夠靈活調(diào)整決策邊界,優(yōu)化決策規(guī)則.實(shí)例證明,本文方法有效降低了數(shù)據(jù)冗余,提高了決策效率.下一步將針對(duì)動(dòng)態(tài)信息系統(tǒng),在泛化決策表的基礎(chǔ)上,重點(diǎn)研究知識(shí)約簡(jiǎn)的動(dòng)態(tài)更新理論和增量式約簡(jiǎn)算法.
參考文獻(xiàn):
[1] PAWLAK Z.Rough set[J].International Journal of Computer and Information Sciences,1982,11(5):341-356.
[2] WEI W,LIANG J Y.Information fusion in rough set theory:An overview[J].Information Fusion,2018,48(c):107-118.
[3] 趙文丹,汪定偉.基于信息熵的Push/Pull策略下供應(yīng)鏈不確定性[J].東北大學(xué)學(xué)報(bào)(自然科學(xué)版),2019,40(4):457-460,466.
[4] LIANG D C,LIU D,LI T R.Incorporating logistic regression to decision-theoretic rough sets for classifications[J].International Journal of Approximate Reasoning,2014,55(1):197-210.
[5] ZIARKO W.Variable precision rough set model[J].Journal of Computer and System Sciences,1993,46(1):39- 59.
[6] 王子茵,李磊軍,米據(jù)生,等.基于誤分代價(jià)的變精度模糊粗糙集屬性約簡(jiǎn)[J].計(jì)算機(jī)科學(xué),2022,49(4):161-167.
[7] 金承勇,胡寶清.區(qū)間集值變精度粗糙集[J].閩江學(xué)院學(xué)報(bào),2023,44(5):1-9.
[8] 張文修,米據(jù)生,吳偉志.不協(xié)調(diào)目標(biāo)信息系統(tǒng)的知識(shí)約簡(jiǎn)[J].計(jì)算機(jī)學(xué)報(bào),2003,26(1):12-18.
[9] 米據(jù)生,吳偉志,張文修.基于變精度粗糙集理論的知識(shí)約簡(jiǎn)方法[J].系統(tǒng)工程理論與實(shí)踐,2004,24(1):76-82.
[10] 汪凌.不協(xié)調(diào)決策信息系統(tǒng)的知識(shí)約簡(jiǎn)及決策規(guī)則優(yōu)化研究[J].計(jì)算機(jī)應(yīng)用研究,2019,36(7):2011-2014.
[11] 郭慶,吳磊.多粒度背景下直覺(jué)模糊信息系統(tǒng)的粗糙集及其決策[J].系統(tǒng)工程與電子技術(shù),2016,38(2):347-351.
[12] 方連花,李克典.基于優(yōu)勢(shì)-等價(jià)關(guān)系下不協(xié)調(diào)目標(biāo)信息系統(tǒng)的分布約簡(jiǎn)[J].模糊系統(tǒng)與數(shù)學(xué),2013,27(3):182-189.
[責(zé)任編輯:趙慧霞]
蘭州文理學(xué)院學(xué)報(bào)(自然科學(xué)版)2025年2期