陶 志,岳美汐
(中國民航大學理學院,天津 300300)
優(yōu)勢關系集值決策系統(tǒng)中變精度粗集模型
陶 志,岳美汐
(中國民航大學理學院,天津 300300)
將變精度的思想引入優(yōu)勢值關系的集值決策系統(tǒng)中,構建了一種基于優(yōu)勢值關系的變精度集值決策系統(tǒng)粗糙集模型,并討論了該模型的性質及閾值β的變化對模型的影響.新模型可以處理存在偏序關系的不確定或不完備信息系統(tǒng),并具有一定的容錯能力.另一方面,通過合理設置參數(shù)β可使新模型的分類效果更加符合實際情況以及人在數(shù)據(jù)處理過程中的直觀感受.實例分析進一步驗證了相關結論的正確性.
優(yōu)勢值關系;集值決策系統(tǒng);變精度粗糙集模型
粗糙集理論[1]是由Z.Pawlak于20世紀80年代初提出的一種用于處理不確定性和不完備信息的新型數(shù)學工具,該理論不依賴于數(shù)據(jù)集之外有關信息,直接從給定問題的描述信息出發(fā)來發(fā)現(xiàn)問題的本質特征和內在規(guī)律,且已被成功應用于機器學習、數(shù)據(jù)挖掘、智能數(shù)據(jù)分析、控制算法獲得等領域,為智能信息處理中不確定環(huán)境下知識獲取提供了一種重要方法。
Pawlak提出的粗糙集模型是基于信息系統(tǒng)上的一種等價關系,由等價關系得到的分類形成研究對象集的劃分。但在實際應用中,由于問題的復雜性,人們得到的數(shù)據(jù)并不一定精確和完整。如果信息系統(tǒng)中某個對象的屬性值未知或部分已知,則稱這種信息系統(tǒng)是不完備信息系統(tǒng)。信息除了缺損外,還可能存在不確定性問題,即對于某些屬性,一些對象在這些屬性下的取值不是取一個值,而是取幾個值,這樣的信息系統(tǒng)就稱為集值決策系統(tǒng)[2]。不完備信息系統(tǒng)在某些情形下可轉化為一類特殊的集值決策系統(tǒng)進行研究[3]。針對信息的不確定性,本文利用屬性集值的取值大小在集值決策系統(tǒng)上定義一種新的優(yōu)勢值關系[4],然后將可變精度粗糙集模型引入到優(yōu)勢值關系下的集值決策系統(tǒng)中,這樣既可處理不確定性信息,又允許存在一定程度的分類誤差率,從而有利于從認為不相關的數(shù)據(jù)中發(fā)現(xiàn)相關數(shù)據(jù)??勺兙却植诩P涂朔藰藴蚀植诩P蛯?shù)據(jù)噪聲過于敏感的缺點,因而增強了數(shù)據(jù)分析和處理的魯棒性。本文所提出的模型可處理存在偏序關系的不確定信息系統(tǒng),同時還具有一定的容錯能力,從而為帶有偏序關系的不完備或不確定信息處理提供了一種新的有效方法。
定義1 稱一個五元組I=(U,A∪D,F(xiàn),G)為一個集值決策系統(tǒng),其中U={x1,x2,…,xn}是有限對象集,稱為論域;A={a1,a2,…,ap}為條件屬性集,D={d1, d2,…,dq}為決策屬性集,且P0(Vk),k≤p}是U×A到P0(Vk)映射的集合,其中Vk是條件屬性ak的值域,P0(Vk)表示Vk的所有非空子集全體;G={gm|U×D→P1(Vm)}是U×D到P1(Vm)映射的集合,其中Vm是決策屬性dm的值域,P1(Vm)表示Vm的所有非空子集全體。
在集值決策系統(tǒng)中,每個對象的條件屬性值、決策屬性值都是集合,無法直接比較大小,所以,為確定不同對象間優(yōu)劣順序,在集值決策系統(tǒng)中引入如下優(yōu)勢值關系。
定義2 設I=(U,A∪D,F(xiàn),G)是一個集值決策系統(tǒng),對于B?A,令
優(yōu)勢值關系集值決策系統(tǒng)中,對于某一確定的屬性集合,有限對象間存在某種與之對應的偏序關系。
若記?xi∈U
變精度粗糙集模型引入了一個閾值β(0≤β< 0.5),在分類過程中允許存在一定程度的分類誤差率,從而克服了傳統(tǒng)分類方法中存在的對數(shù)據(jù)噪聲過于敏感的缺點。本節(jié)將在優(yōu)勢值關系的集值決策系統(tǒng)中引進變精度粗集模型,為此首先給出分類正確率的概念。
定義3 設X和Y表示有限論域U的非空子集,若令
則稱c(X,Y)為集合X相對于集合Y的分類正確率[5],其中表示集合的基。分類正確率表明,如果將集合X中的元素分到集合Y中,則做出分類正確的比例為c(X,Y),真正分類正確的元素數(shù)目為
X的下近似集合可以理解為將U中的對象以不小于1-β的分類正確率分于X的對象集合,而X的上近似集合可以理解為將U中的對象以大于β的分類正確率分于X的對象集合。所以將近似集合對稱作X的基于優(yōu)勢值關系的變精度粗糙集合。
定理1 設I=(U,A∪D,F(xiàn),G)是一個集值決策系統(tǒng),對于其中
證明由定義4可直接得到。
定理1表明,在集值決策系統(tǒng)中基于優(yōu)勢值關系的變精度粗集模型中,某一對象集X的負域可以理解為將U中的對象以不小于1-β的分類正確率分于X的補集(即~X)的對象集合。
集值決策系統(tǒng)中基于優(yōu)勢值關系的變精度粗集模型還具有如下一些性質:
定理2 設I=(U,A∪D,F(xiàn),G)是一個集值決策系統(tǒng),給定0≤β<0.5,X,Y?U,B?A,則有:
這里只給出2)的證明,其他結論可類似證明。
證2)?X,Y?U,由于
且
在可變精度的集值粗糙集中,閾值β的變化會對模型的分析結果有重要的影響,下面簡單討論一下β的變化對近似集合的影響:
1)當β=0時,集值決策系統(tǒng)下的優(yōu)勢值關系的變精度粗集模型退化為優(yōu)勢關系下的集值模型[3]。
2)當β→0.5時,近似集將趨于以下的極限
此外,為了描述集合X被β基本集近似分類的程度,定義β近似精度為
β近似精度表示在相對誤差β下對集合X近似描述的不精確程度。當β增大時,集合X的上近似的基數(shù)將變小,下近似的基數(shù)將變大。這說明隨著分類誤差的增大,相對精度將增加。
在表1所示的集值決策系統(tǒng)中,U={x1,x2,x3,x4,x5,x6},A={a1,a2,a3,a4},則按定義4所描述的基于優(yōu)勢值關系的變精度粗集模型,有
表1 集值決策系統(tǒng)表Tab.1 Decision system of set value
于是有
即定理2中3)得到驗證。
又若當β=0時,有
同時觀察到,當β從0增加到0.25時,相對精度α從2/3增加到1,這說明隨著分類誤差的增大,相對精度將會逐步增加。
對于屬性值存在偏序關系且含有噪聲的不確定或不完備數(shù)據(jù)集,一般處理方法可以先將其轉化為一類集值決策系統(tǒng),然后再利用本文提出的基于優(yōu)勢值關系的變精度粗集模型進行數(shù)據(jù)分析和知識發(fā)現(xiàn)。本文所提出的模型不僅可以反映決策者主觀偏好,而且還具有一定的容錯能力,從而增強了數(shù)據(jù)分析、處理的實用性和魯棒性。下一步工作應該是在此模型基礎上,進一步研究存在偏序關系的不確定或不完備系統(tǒng)中的屬性約簡和規(guī)則抽取問題,為實際應用系統(tǒng)開發(fā)奠定理論和算法基礎。
[1]PAWLAK Z.Rough set[J].International Journal of Computer and Information Science,1983,11:341-356.
[2]宋笑雪,李鴻儒,張文修.集值決策系統(tǒng)的知識約簡與屬性特征[J].計算機工程,2006,32(22):26-27.
[3]胡軍華,陳曉紅.基于優(yōu)勢關系和可變精度粗糙集的多準則決策方法[J].系統(tǒng)工程與電子技術,2010,32(4):759-763.
[4]陳子春,劉鵬惠,秦克云.集值信息系統(tǒng)基于優(yōu)勢關系下的知識約簡[J].計算機科學,2009,36(12):176-178.
[5]張文修,吳偉志,梁吉業(yè),等.粗糙集理論與方法[M].北京:科學出版社,2003.
(責任編輯:楊媛媛)
Variable precision rough set model in dominance relation of set-valued decision system
TAO Zhi,YUE Mei-xi
(College of Science,CAUC,Tianjin 300300,China)
The variable precision idea is introduced in the dominance relation value of set-valued decision system,building a variable precision rough set model of set-valued decision system based on dominance relation value,and discussing the nature of the model as well as the impact of changes on the threshold β model.The new model can not only deal with the uncertainty of the existence of partial order relationship or incomplete information system,but also has a certain degree of fault tolerance.On the other hand,by setting the appropriate parameters β,the classification results of the new model become more consistent with the actual situation as well as human's intuitive feeling during data processing.Case analysis further verifies the correctness of related conclusion.
dominance relation value;set-valued decision system;variable precision rough set model
TP18
:A
:1674-5590(2015)01-0055-04
2013-05-08;
:2013-11-24
:國家自然科學基金項目(60672178);中國民航大學科研基金項目(2010kys01)
陶志(1963—),男,遼寧沈陽人,教授,博士,研究方向為復雜系統(tǒng)建模、粗糙集理論及其應用等.