張嘉茹 吳偉志 楊 燁
粒計(jì)算(Granular Computing, GrC)[1-4]是人工智能領(lǐng)域活躍的研究方向之一.它模擬人類問(wèn)題思考模式,以粒(Granule)為基本計(jì)算單位,通過(guò)信息?;仁侄芜_(dá)到簡(jiǎn)化復(fù)雜問(wèn)題求解的主要目標(biāo).粒計(jì)算的研究主要集中在粒的描述、表示與構(gòu)造,粒的多層次合成與分解,具有多層次或多粒度結(jié)構(gòu)數(shù)據(jù)的信息粒的變換、最優(yōu)粒度或尺度的選擇,蘊(yùn)含在數(shù)據(jù)集上的粒與粒之間的IF-THEN規(guī)則的提取,以及粒結(jié)構(gòu)的不確定性分析等.目前,粒計(jì)算已成為大數(shù)據(jù)挖掘與決策分析的一種重要研究方法[5-9].
粗糙集[10]是推動(dòng)和發(fā)展粒計(jì)算研究的一個(gè)重要數(shù)據(jù)分析模型,它以各種各樣的信息系統(tǒng)(Information Systems)或決策系統(tǒng)(Decision Systems)為數(shù)據(jù)分析對(duì)象,通過(guò)定義在數(shù)據(jù)樣本集上的二元關(guān)系構(gòu)造“?!??;撚蚧驑颖究臻g,并通過(guò)屬性約簡(jiǎn)方法挖掘蘊(yùn)含在數(shù)據(jù)集上的決策規(guī)則集.傳統(tǒng)粗糙集數(shù)據(jù)分析呈現(xiàn)的數(shù)據(jù)集大都是單尺度形式的,即信息系統(tǒng)中每個(gè)對(duì)象在每個(gè)屬性上只取唯一的值.然而,在實(shí)際生活中,人們可能需要在多粒度或多尺度環(huán)境下處理和分析數(shù)據(jù),要在不同尺度下對(duì)同一對(duì)象在同一屬性下的數(shù)據(jù)進(jìn)行觀察、分析并做出相應(yīng)決策.為此,Wu等[11]提出多尺度粗糙集數(shù)據(jù)分析模型,處理的數(shù)據(jù)集稱為多尺度信息系統(tǒng),系統(tǒng)中的每個(gè)對(duì)象在同個(gè)屬性下根據(jù)不同的尺度呈現(xiàn)不同標(biāo)記的值,并且從細(xì)尺度的屬性值到粗尺度的屬性值都有相應(yīng)的信息粒度變換.這種數(shù)據(jù)處理模型又稱為Wu-Leung模型[12].在該模型中,較細(xì)尺度對(duì)應(yīng)的數(shù)據(jù)所含信息較詳細(xì),但是意味著獲取信息成本較高,而較粗尺度對(duì)應(yīng)的數(shù)據(jù)所含信息較少,獲取信息成本也較低.在實(shí)際問(wèn)題研究中,選取合適尺度去解決問(wèn)題就顯得至關(guān)重要.多尺度粗糙集數(shù)據(jù)分析的核心思想是:根據(jù)決策目標(biāo),對(duì)每個(gè)屬性選擇一個(gè)合適的尺度或粒度(稱為最優(yōu)尺度),構(gòu)成一個(gè)新的單尺度信息系統(tǒng),再在保持相同目標(biāo)約束要求下使用粗糙集方法給出屬性約簡(jiǎn),做出最終的決策(如分類、聚類或排序決策等).因此,多尺度信息系統(tǒng)或多尺度決策系統(tǒng)中的最優(yōu)尺度選擇是從該類數(shù)據(jù)集上獲取知識(shí)的關(guān)鍵步驟,現(xiàn)已成為多尺度粗糙集數(shù)據(jù)分析的一個(gè)重要研究方向[13-21].
經(jīng)典Wu-Leung模型的一個(gè)基本假設(shè)是數(shù)據(jù)集上所有屬性具有相同的尺度個(gè)數(shù),并且在數(shù)據(jù)分析時(shí)只能取同層尺度.然而在實(shí)際問(wèn)題中,數(shù)據(jù)集上不同屬性可能具有不同的尺度個(gè)數(shù),為此,Li等[12]引入尺度組合的概念,提出廣義多尺度信息系統(tǒng)的知識(shí)獲取模型.近年來(lái),針對(duì)各類廣義多尺度信息系統(tǒng)的最優(yōu)尺度組合及知識(shí)獲取的研究受到相關(guān)研究人員的關(guān)注,并取得重要進(jìn)展[22-30].由于Li等[12]提出的廣義多尺度決策表的決策屬性是單尺度的,在實(shí)際應(yīng)用中,同一對(duì)象的決策屬性也可能根據(jù)不同尺度取不同的值.為此,Huang等[31]提出決策屬性也是多尺度的廣義多尺度信息系統(tǒng)(簡(jiǎn)稱為廣義決策多尺度信息系統(tǒng))的數(shù)據(jù)分析模型,研究協(xié)調(diào)廣義決策多尺度信息系統(tǒng)的最優(yōu)尺度選擇方法.
證據(jù)理論,又稱Dempster-Shafer證據(jù)理論[32](簡(jiǎn)稱D-S證據(jù)理論),是處理不精確和不確定性問(wèn)題的數(shù)學(xué)工具之一.它的核心思想是通過(guò)由信任結(jié)構(gòu)導(dǎo)出的一對(duì)信任函數(shù)與似然函數(shù)刻畫(huà)概念的不確定性.粗糙集理論的下近似集與上近似集和證據(jù)理論的信任測(cè)度與似然測(cè)度可分別看作是對(duì)同個(gè)不確定概念(集合)的定性和定量不確定性表示,因此,兩個(gè)理論具有很強(qiáng)的關(guān)聯(lián)性.相關(guān)研究已證實(shí),由粗糙近似空間導(dǎo)出的集合的下近似概率和上近似概率一定是某個(gè)信任結(jié)構(gòu)下的信任測(cè)度與似然測(cè)度,反之,任給一個(gè)信任結(jié)構(gòu)及其導(dǎo)出的信任函數(shù)與似然函數(shù),一定可表示為某個(gè)粗糙近似空間下的下近似概率和上近似概率[33-35].基于這兩個(gè)理論之間的關(guān)系,學(xué)者們提出利用證據(jù)理論進(jìn)行粗糙集數(shù)據(jù)分析,取得很多重要成果[36].近幾年,使用證據(jù)理論刻畫(huà)多尺度環(huán)境下的最優(yōu)尺度選擇也取得一些研究進(jìn)展.
眾所周知,多屬性決策或排序是粗糙集數(shù)據(jù)分析中一類重要的研究問(wèn)題,也是現(xiàn)實(shí)生活中較常見(jiàn)的數(shù)據(jù)處理問(wèn)題.Greco等[37-39]定義序信息系統(tǒng)中屬性(在序信息系統(tǒng)中又稱為準(zhǔn)則)子集導(dǎo)出的優(yōu)勢(shì)關(guān)系,提出基于優(yōu)勢(shì)關(guān)系的粗糙集方法(Domi-nance-Based Rough Set Approach, DRSA),解決序信息系統(tǒng)或序決策系統(tǒng)的序IF-THEN規(guī)則的提取或排序問(wèn)題.隨后,針對(duì)不同數(shù)據(jù)類型的DRSA也相繼被提出[40-43].Xu等[44]使用證據(jù)理論的信任函數(shù)與似然函數(shù),研究序信息系統(tǒng)的屬性約簡(jiǎn)問(wèn)題,而Du等[45]使用證據(jù)理論的信任函數(shù)與似然函數(shù),討論序決策系統(tǒng)的屬性約簡(jiǎn)問(wèn)題.
近年來(lái),針對(duì)多尺度環(huán)境下信息系統(tǒng)的多屬性決策、排序等問(wèn)題已受到相關(guān)領(lǐng)域研究人員的關(guān)注[46-48].Zheng等[20]研究Wu-Leung模型下多尺度序信息系統(tǒng)的最優(yōu)尺度選擇問(wèn)題,使用證據(jù)理論中的信任函數(shù)與似然函數(shù)等價(jià)刻畫(huà)協(xié)調(diào)和不協(xié)調(diào)多尺度序決策系統(tǒng)中下近似最優(yōu)尺度和上近似最優(yōu)尺度的特征.
盡管多尺度環(huán)境下很多數(shù)據(jù)類型的最優(yōu)尺度選擇和知識(shí)獲取方面的研究取得重要進(jìn)展,但迄今未有學(xué)者對(duì)決策屬性也是多尺度的多尺度序信息系統(tǒng)(稱為決策多尺度序信息系統(tǒng))的知識(shí)獲取方面展開(kāi)研究.本文在文獻(xiàn)[20]和文獻(xiàn)[31]基礎(chǔ)上,探索研究協(xié)調(diào)決策多尺度序信息系統(tǒng)的最優(yōu)尺度選擇及其相應(yīng)的序決策規(guī)則提取問(wèn)題.
在本文中,對(duì)于給定的非空有限集合U={x1,x2,…,xr}(也稱為論域),記P(U)為U的冪集.對(duì)于X∈P(U),記~X為X在U上的補(bǔ)集,即
~X=U-X={x∈U|x?X}.
定義1[10]稱S=(U,A)為一個(gè)信息系統(tǒng),其中U={x1,x2,…,xr}為一個(gè)非空有限對(duì)象集,稱為論域,A={a1,a2,…,am}為一個(gè)非空有限屬性集,對(duì)于?a∈A,有a∶U→Va,即a(x)∈Va,x∈U,其中
Va={a(x)|x∈U}
為屬性a的值域.
對(duì)于信息系統(tǒng)S=(U,A),B?A,記
RB={(x,y)∈U×U|a(x)=a(y),?a∈B},
RB為由屬性子集B誘導(dǎo)的不可分辨關(guān)系,RB可將U中元素分成兩兩不相交的等價(jià)類,即
[x]B={y∈U|(x,y)∈RB}, ?x∈U,
它們構(gòu)成U的一個(gè)劃分,即
U/RB={[x]B|x∈U}.
對(duì)于X∈P(U),X關(guān)于屬性子集B的下近似和上近似定義如下:
定義2[31]稱S=(U,C∪j5i0abt0b)為一個(gè)具有多尺度決策的廣義多尺度信息系統(tǒng),簡(jiǎn)稱為廣義決策多尺度信息系統(tǒng),其中,
為一個(gè)廣義多尺度信息系統(tǒng),d?C為具有n個(gè)尺度的決策屬性,S也可表示為
在廣義決策多尺度信息系統(tǒng)
即
使得
即
定義3[31]設(shè)
為一個(gè)廣義決策多尺度信息系統(tǒng),若將條件屬性aj(1≤j≤m)限制在該屬性的第ij(1≤ij≤Ij)尺度下,則
K=(i1,i2,…,im)
稱為S的條件屬性的一個(gè)尺度組合,記S的條件屬性尺度組合全體為K.若在此基礎(chǔ)上將決策屬性d限制在第t(1≤t≤n)尺度下,則
Q=(i1,i2,…,im,t)
稱為S的一個(gè)尺度選擇.記S的尺度選擇全體為Q,則每個(gè)尺度選擇
(i1,i2,…,im,t)=Q∈Q
形成一個(gè)單尺度決策表SQ=(U,CK∪{dt}),其中
定義4設(shè)
為一個(gè)廣義決策多尺度信息系統(tǒng).對(duì)于兩個(gè)尺度組合
設(shè)
為一個(gè)廣義決策多尺度信息系統(tǒng),Q為S的尺度選擇全體.對(duì)于
定義
其中,
且
t1∧t2=min{t1,t2},t1∨t2=max{t1,t2},
則可驗(yàn)證
Q1?Q2?Q1∧Q2=Q1?Q1∨Q2=Q2.
且(Q,?,∧,∨)為一個(gè)有界格,其中(1,1,…,1,n)為最小元,(I1,I2,…,Im,1)為最大元.
定義5稱二元組(L,≤)為一個(gè)全序集,其中L≠?稱為標(biāo)記集,≤為L(zhǎng)上的二元關(guān)系,滿足
1)自反性.對(duì)于?x∈L,x≤x.
2)傳遞性.對(duì)于?x∈L,y∈L,z∈L,x≤y,y≤z蘊(yùn)含x≤z.
3)≤是線性序.對(duì)于?x∈L,y∈L,或x≤y,或y≤x.
定義6對(duì)于2個(gè)全序集(L1,≤1)和(L2,≤2),若映射
g∶(L1,≤1)→(L2,≤2),
對(duì)?l∈L1,s∈L1,有
l≤1s?g(l)≤2g(s),
則稱映射g為保序的.
不失一般性,本文討論序信息系統(tǒng)中的屬性取值按照優(yōu)先級(jí)遞增排序.在信息系統(tǒng)S=(U,A)中,若屬性a的值域是全序集,則稱屬性a為一個(gè)標(biāo)準(zhǔn)或準(zhǔn)則.設(shè)a∈A為一個(gè)準(zhǔn)則,在a的值域Va上建立偏序關(guān)系≥a,對(duì)于x∈U,y∈U,y≥ax意為關(guān)于準(zhǔn)則a,對(duì)象y至少和對(duì)象x一樣優(yōu),或者說(shuō)對(duì)象y支配對(duì)象x.若對(duì)于準(zhǔn)則集B?A,y≥Bx,意為對(duì)于?a∈B,y≥ax,即對(duì)于B中的任意準(zhǔn)則,對(duì)象y至少和對(duì)象x一樣優(yōu).
定義7[40]設(shè)S=(U,A)為一個(gè)信息系統(tǒng),若S的條件屬性集A={a1,a2,…,am}中每個(gè)屬性都是標(biāo)準(zhǔn)或準(zhǔn)則,則稱S為一個(gè)序信息系統(tǒng)(Ordered Information System, OIS).
在序信息系統(tǒng)中,對(duì)于B?A,記
定義8[40]稱S=(U,A∪j5i0abt0b)為一個(gè)序決策系統(tǒng)(Ordered Decision System, ODS),若S=(U,A)為一個(gè)序信息系統(tǒng),決策屬性d?A也是標(biāo)準(zhǔn)或準(zhǔn)則,記
定義9[32]設(shè)U為一個(gè)非空有限集合,對(duì)于一個(gè)集合函數(shù)m∶P(U)→[0,1],若滿足
則稱m為一個(gè)mass函數(shù)或一個(gè)基本概率指派.
對(duì)于一個(gè)集合X∈P(U),若m(X)>0,則稱X為函數(shù)m的一個(gè)焦元.記
M={X∈P(U)|m(X)>0}
為m的全體焦元構(gòu)成的集合,則稱序?qū)?M,m)為U上的一個(gè)信任結(jié)構(gòu).
任何一個(gè)信任結(jié)構(gòu)可導(dǎo)出一對(duì)信任函數(shù)與似然函數(shù).
定義10[32]設(shè)(M,m)為U上的一個(gè)信任結(jié)構(gòu),在U上定義信任函數(shù)Bel∶P(U)→[0,1]和似然函數(shù)Pl∶P(U)→[0,1]如下:
可驗(yàn)證,信任函數(shù)和似然函數(shù)是對(duì)偶的,即
Bel(X)=1-Pl(~X),
Pl(X)=1-Bel(~X),
其中~X為X在U中的補(bǔ)集.
粗糙集理論和D-S證據(jù)理論之間具有較強(qiáng)的聯(lián)系,已證實(shí),信息系統(tǒng)中每個(gè)屬性子集導(dǎo)出的集合的下近似概率與上近似概率分別為該集合在某個(gè)信任結(jié)構(gòu)下的信任度與似然度.
定理1[33]設(shè)S=(U,A)為一個(gè)信息系統(tǒng),對(duì)于?X∈P(U),B?A,記
其中,
|X|為X的基數(shù),則
Bel∶P(U)→[0,1],Pl∶P(U)→[0,1]
分別為U上的信任函數(shù)與似然函數(shù),對(duì)應(yīng)的mass函數(shù)為:
定義11設(shè)
為一個(gè)廣義決策多尺度信息系統(tǒng),若對(duì)于
Q1=(1,1,…,1)∈Q,SQ1=(U,CK1∪{d1})
由定義11知,只要
SQ1=(U,CK1∪{d1})
為序決策系統(tǒng),且條件屬性的信息粒度變換和決策屬性的信息粒度變換都是保序的,則對(duì)于S的任意一個(gè)尺度選擇
Q=(K,t)∈Q,K∈K,
對(duì)應(yīng)的決策系統(tǒng)
SQ=(U,CK∪{dt})
都是一個(gè)序決策系統(tǒng).
定義12設(shè)
為一個(gè)廣義決策多尺度序信息系統(tǒng),
K=(i1,i2,…,im)∈K,
記
類似于文獻(xiàn)[20],可證明命題1成立.
命題1設(shè)
為一個(gè)廣義決策多尺度序信息系統(tǒng),
X∈P(U),Y∈P(U),K∈K,Q=(K,t)∈Q,
則如下性質(zhì)成立:
6)若X?Y,則
8)若K′∈K,K?K′,則
9)若記
Kmin=(1,1,…,1)∈K,Kmax=(I1,I2,…,Im)∈K,
則對(duì)于?K∈K,有
定義13設(shè)
為一個(gè)廣義決策多尺度序信息系統(tǒng),
?x∈U,K∈K,Q=(K,t)∈Q,
記
類似于文獻(xiàn)[20],可得命題2.
命題2設(shè)
為一個(gè)廣義決策多尺度序信息系統(tǒng),對(duì)于
?x∈U,K∈K,K′∈K,K?K′,
則
t∈{1,2,…,n-1},
5)PosCK′(dt)?PosCK(dt),
r(CK′,dt)≤r(CK,dt),
6)PosCK(dt)?PosCK(dt+1),
r(CK,dt)≤r(CK,dt+1),
t∈{1,2,…,n-1},
7)若Kmin=(1,1,…,1)∈K,
Kmax=(I1,I2,…,Im)∈K,
則對(duì)于?K∈K,都有
r(CKmax,dt)≤r(CK,dt)≤r(CKmin,dt).
類似于文獻(xiàn)[44]和文獻(xiàn)[45]可得,廣義決策多尺度序信息系統(tǒng)中每個(gè)尺度組合下集合的下近似集與上近似集的概率一定是某個(gè)信任結(jié)構(gòu)下該集合的信任度與似然度.
定理2設(shè)
為一個(gè)廣義決策多尺度序信息系統(tǒng),K∈K,對(duì)于X∈P(U),記
則
分別為U上一對(duì)對(duì)偶的信任函數(shù)與似然函數(shù),對(duì)應(yīng)的mass函數(shù)為:
其中,
推論1設(shè)
尺度選擇是從多尺度信息系統(tǒng)中知識(shí)獲取的一個(gè)關(guān)鍵步驟,在廣義決策多尺度序信息系統(tǒng)中,尋找最優(yōu)尺度選擇的目的是從系統(tǒng)中選擇一個(gè)合適的單尺度序決策系統(tǒng),用于最終的決策規(guī)則提取.
定義14設(shè)
為一個(gè)廣義決策多尺度序信息系統(tǒng),
K1=(1,1,…,1)∈K
定義15設(shè)
為一個(gè)廣義決策多尺度序信息系統(tǒng),對(duì)于
K=(i1,i2,…,im)∈K,
對(duì)應(yīng)一個(gè)具有多尺度決策的單尺度信息系統(tǒng)
定理3設(shè)
為一個(gè)廣義決策多尺度序信息系統(tǒng),K∈K,K′∈K,若K?K′,且SK′是協(xié)調(diào)的,則SK也是協(xié)調(diào)的.
SK=(U,CK∪j5i0abt0b)
也是協(xié)調(diào)的.
證畢.
定理4設(shè)
為一個(gè)廣義決策多尺度序信息系統(tǒng),
Q1=(K1,t1)∈Q,Q2=(K2,t2)∈Q,Q1?Q2,
若序決策系統(tǒng)SQ2是協(xié)調(diào)的,則SQ1也是協(xié)調(diào)的.
證畢.
定義16設(shè)
為一個(gè)協(xié)調(diào)廣義決策多尺度序信息系統(tǒng),對(duì)于
Q=(K,t)∈Q,
若滿足
2)對(duì)任意滿足QQ′的Q′=(K′,t′)∈Q,SQ′是不協(xié)調(diào)的,即
則稱Q=(K,t)為S的一個(gè)最優(yōu)尺度選擇,并稱
SQ=(U,CK∪{dt})
為S的一個(gè)最優(yōu)協(xié)調(diào)序決策系統(tǒng).
由定義16可見(jiàn),一個(gè)協(xié)調(diào)廣義決策多尺度序信息系統(tǒng)S=(U,C∪j5i0abt0b)的一個(gè)最優(yōu)尺度選擇
Q=(K,t)∈Q
是Q中使SQ是協(xié)調(diào)的最粗的尺度選擇,因此,尋求協(xié)調(diào)廣義決策多尺度序信息系統(tǒng)的一個(gè)最優(yōu)尺度選擇問(wèn)題可轉(zhuǎn)化為求以下最優(yōu)解問(wèn)題:
滿足上述最優(yōu)解問(wèn)題的一個(gè)尺度選擇Q就是S的一個(gè)最優(yōu)尺度選擇.
定義17設(shè)
為一個(gè)協(xié)調(diào)廣義決策多尺度序信息系統(tǒng),
K1=(1,1,…,1)∈K,Q=(K,t)∈Q,
則
1)若對(duì)于?x∈U,有
則稱SQ關(guān)于S是下近似協(xié)調(diào)的; 若SQ關(guān)于S是下近似協(xié)調(diào)的,且對(duì)于任意滿足QQ′的
Q′=(K′,t′)∈Q,
?y∈U,使得
即SQ′關(guān)于S不是下近似協(xié)調(diào)的,則稱Q=(K,t)是S的一個(gè)下近似最優(yōu)尺度選擇.
2)若對(duì)于?x∈U,都有
則稱SQ關(guān)于S是上近似協(xié)調(diào)的;若SQ關(guān)于S是上近似協(xié)調(diào)的,且對(duì)于任意滿足QQ′的
Q′=(K′,t′)∈Q,
?y∈U,使得
即SQ′關(guān)于S不是上近似協(xié)調(diào)的,則稱Q=(K,t)是S的一個(gè)上近似最優(yōu)尺度選擇.
定義18設(shè)
為一個(gè)協(xié)調(diào)廣義決策多尺度序信息系統(tǒng),
K1=(1,1,…,1)∈K,Q=(K,t)∈Q,
則
1)若對(duì)于?x∈U,都有
則稱SQ關(guān)于S是信任協(xié)調(diào)的;若SQ關(guān)于S是信任協(xié)調(diào)的,且對(duì)于任意滿足QQ′的
Q′=(K′,t′)∈Q,
?y∈U,使得
即SQ′關(guān)于S不是信任協(xié)調(diào)的,則稱Q=(K,t)是S的一個(gè)信任最優(yōu)尺度選擇.
2)若對(duì)于?x∈U,都有
則稱SQ關(guān)于S是似然協(xié)調(diào)的; 若SQ關(guān)于S是似然協(xié)調(diào)的,且對(duì)于任意滿足QQ′的
Q′=(K′,t′)∈Q,
?y∈U,使得
即SQ′關(guān)于S不是似然協(xié)調(diào)的,則稱Q=(K,t)是S的一個(gè)似然最優(yōu)尺度選擇.
定理5設(shè)
為一個(gè)協(xié)調(diào)廣義決策多尺度序信息系統(tǒng),
Q=(K,t)∈Q,
則
1)SQ關(guān)于S是下近似協(xié)調(diào)的當(dāng)且僅當(dāng)SQ關(guān)于S是信任協(xié)調(diào)的.
2)Q是S的下近似最優(yōu)尺度選擇當(dāng)且僅當(dāng)Q是S的信任最優(yōu)尺度選擇.
3)SQ關(guān)于S是上近似協(xié)調(diào)的當(dāng)且僅當(dāng)SQ關(guān)于S是似然協(xié)調(diào)的.
4)Q是S的上近似最優(yōu)尺度選擇當(dāng)且僅當(dāng)Q是S的似然最優(yōu)尺度選擇.
證明先證1).充分性.設(shè)SQ關(guān)于S是下近似協(xié)調(diào),則對(duì)?x∈U,有
從而
即
因此,SQ關(guān)于S是信任協(xié)調(diào)的.
必要性.若SQ關(guān)于S是信任協(xié)調(diào)的,則對(duì)?x∈U,
即
又由于
于是可得
因此,SQ關(guān)于S是下近似協(xié)調(diào)的.
再證2).由結(jié)論1)即得.
再證3)充分性.設(shè)SQ關(guān)于S是上近似協(xié)調(diào)的,則對(duì)于?x∈U,有
從而
即
因此,SQ關(guān)于S是似然協(xié)調(diào)的.
必要性.若SQ關(guān)于S是似然協(xié)調(diào)的,則對(duì)于?x∈U,有
即
又由于
于是可得
因此,SQ關(guān)于S是上近似協(xié)調(diào)的.
最后證明4).由結(jié)論3)即得.
證畢.
定理6設(shè)
為一個(gè)協(xié)調(diào)廣義決策多尺度序信息系統(tǒng),
Q=(K,t)∈Q,
則SQ是協(xié)調(diào)的當(dāng)且僅當(dāng)SQ關(guān)于S是信任協(xié)調(diào)的.
證明充分性.設(shè)SQ是協(xié)調(diào)的,則?x∈U,有
由命題1知,
這樣就證明
又由于K1=(1,1,…,1)是最細(xì)的尺度組合,因此
從而
即序決策系統(tǒng)S(K1,t)也是協(xié)調(diào)的,從而也有
成立,于是
再由定理5知
即SQ關(guān)于S是信任協(xié)調(diào)的.
必要性.設(shè)SQ是關(guān)于S信任協(xié)調(diào)的,由定理5知,對(duì)于?x∈U,有
證畢.
定義19設(shè)
為一個(gè)協(xié)調(diào)廣義決策多尺度序信息系統(tǒng),
K1=(1,1,…,1)∈K,
對(duì)于t∈{1,2,…,n},S的信任和Mt與似然和Nt分別定義為
其中,
為決策屬性d在第t個(gè)尺度下決策優(yōu)勢(shì)類全體.
定理7設(shè)
為一個(gè)廣義決策多尺度序信息系統(tǒng),
Q=(K,t)∈Q,
則
1)SQ是協(xié)調(diào)的當(dāng)且僅當(dāng)
2)Q=(K,t)∈Q為S的最優(yōu)尺度選擇當(dāng)且僅當(dāng)
且對(duì)任意滿足QQ′的
Q′=(K′,t)∈Q,
有
證明由定理6和推論1即證明1).由結(jié)論1)即證明2).
證畢.
定理8設(shè)
為一個(gè)協(xié)調(diào)廣義決策多尺度序信息系統(tǒng),
Q=(K,t)∈Q,
則
1)SQ是似然協(xié)調(diào)的當(dāng)且僅當(dāng)
2)Q=(K,t)∈Q是S的似然最優(yōu)尺度選擇當(dāng)且僅當(dāng)
且對(duì)任意滿足QQ′的Q′=(K′,t)∈Q,有
證明類似于定理7的證明.
證畢.
由上述結(jié)論可見(jiàn),保持序決策系統(tǒng)是協(xié)調(diào)的最粗尺度選擇(即最優(yōu)尺度選擇)與下近似最優(yōu)尺度選擇和信任最優(yōu)尺度選擇都是等價(jià)的,而上近似最優(yōu)尺度選擇與似然最優(yōu)尺度選擇也是等價(jià)的.因此,定義16~定義18給出的5種類型的最優(yōu)尺度選擇概念實(shí)際上只有2種不同的類型.
例1表1為一個(gè)廣義決策多尺度序信息系統(tǒng)
其中,
U={x1,x2,x3,x4,x5,x6,x7,x8,x9,x10,x11,x12},C={a1,a2}.
條件屬性a1、a2都有3個(gè)尺度,決策屬性d有2個(gè)尺度.條件屬性a1、a2和決策屬性
d={dt|t=1,2}
的信息粒度變換分別如下.對(duì)于x∈U:
其中,數(shù)值型值域Va1j和Vd1按自然順序排序,條件屬性值域Va2j,Va3j和決策屬性值域Vd2上的全序關(guān)系分別為
B>C>D>E, N>M>K.表1 一個(gè)廣義決策多尺度序信息系統(tǒng)Table 1 A generalized decision multi-scale ordered information system
圖1為S的全體尺度選擇的格結(jié)構(gòu).
圖1 尺度選擇的格結(jié)構(gòu)Fig.1 Lattice structure of scale selections
1)判斷S是否是協(xié)調(diào)的;2)確定S的最優(yōu)尺度選擇;3)確定S的上近似最優(yōu)尺度選擇、下近似最優(yōu)尺度選擇、信任最優(yōu)尺度選擇和似然協(xié)調(diào)最優(yōu)尺度選擇.
即
{x1,x4,x7,x8,x11},{x5,x7,x8,x12},
{x1,x5,x6,x7,x8,x9,x12},{x7},{x7,x8,x12},
{x1,x5,x6,x7,x8,x9,x10,x12},
{x1,x4,x5,x6,x7,x8,x9,x11,x12},{x12}}.
對(duì)于d1,有
則
{x7,x12},{x1,x2,x3,x4,x5,x6,x7,x8,x9,x12}}.
對(duì)于d2,有
即
{x1,x2,x4,x7,x8,x12},{x1,x5,x7,x8,x12},
{x1,x5,x6,x7,x8,x9,x12},{x7},
{x1,x7,x8,x12},
{x1,x5,x6,x7,x8,x9,x10,x12},
{x1,x2,x4,x5,x6,x7,x8,x9,x11,x12}},
因此
{x1,x2,x3,x4,x7,x8,x12},{x1,x4,x7,x8,x12},
{x5,x7,x8,x12},{x1,x5,x6,x7,x8,x9,x12},
{x7},{x7,x8,x12},
{x1,x5,x6,x7,x8,x9,x10,x12},
{x1,x4,x5,x6,x7,x8,x9,x11,x12},{x12}},
因此
因此
所以S有唯一的最優(yōu)尺度選擇(2,1,1).
且對(duì)于x12,有
成立.
且對(duì)于x12,有
所以S有唯一的下近似最優(yōu)尺度選擇(2,1,1).
所以(3,3,1)是S的上近似最優(yōu)尺度選擇.
求S的信任最優(yōu)尺度選擇.當(dāng)t=1時(shí),
當(dāng)t=2時(shí),
因此,(2,1,1)為S的信任最優(yōu)尺度選擇.
求S的似然最優(yōu)尺度選擇.由于(3,3,1)是S的上近似最優(yōu)尺度選擇,只需驗(yàn)證K9=(3,3)和t=1時(shí)即可.
有
(3,3,1)為S的似然最優(yōu)尺度選擇.
對(duì)于S,(2,1,1)為最優(yōu)尺度選擇、下近似最優(yōu)尺度選擇和信任最優(yōu)尺度選擇,(3,3,1)為上近似最優(yōu)尺度選擇和似然最優(yōu)尺度選擇.
定義20設(shè)
為一個(gè)協(xié)調(diào)廣義決策多尺度序信息系統(tǒng),
定理9設(shè)
為一個(gè)協(xié)調(diào)廣義決策多尺度序信息系統(tǒng),
K1∈K,K2∈K,K1K2,Q1=(K1,t)∈Q,Q2=(K2,t)∈Q.
若B是S的Q2-尺度協(xié)調(diào)集,則B是S的一個(gè)Q1-尺度協(xié)調(diào)集.
證明由定義20與定理3可證.
證畢.
定義21設(shè)
為一個(gè)協(xié)調(diào)廣義決策多尺度序信息系統(tǒng),
K=(i1,i2,…,im)∈K,Q=(K,t)∈Q,
定義
其中
定義22設(shè)
為一個(gè)協(xié)調(diào)廣義決策多尺度序信息系統(tǒng),
B?C,K∈K,Q=(K,t)∈Q,
定義
為S在尺度選擇Q上的可辨識(shí)函數(shù),其中,∧為合取,∨為析取.
類似于文獻(xiàn)[37]~文獻(xiàn)[39],將上式給出的合取式轉(zhuǎn)化為極小析取范式,則該極小析取范式中每個(gè)合取式中的屬性集合就是系統(tǒng)的一個(gè)Q-尺度約簡(jiǎn).
獲取
本節(jié)在最優(yōu)尺度選擇約簡(jiǎn)的基礎(chǔ)上給出蘊(yùn)含在廣義決策多尺度序信息系統(tǒng)中的序決策規(guī)則.
定義23設(shè)
為一個(gè)廣義決策多尺度序信息系統(tǒng),對(duì)于B?C,
蘊(yùn)含在決策信息系統(tǒng)中的命題知識(shí)可使用決策規(guī)則的形式表示:t→s,其中,t為規(guī)則的前件,s為規(guī)則的后件,表示由t可得出s.對(duì)同時(shí)滿足規(guī)則的前件和后件的對(duì)象,稱為支持這條規(guī)則.
對(duì)于協(xié)調(diào)廣義決策多尺度序信息系統(tǒng),結(jié)合原子公式的概念,類似于Greco等[37-39]提出序決策規(guī)則,可得蘊(yùn)含在系統(tǒng)中基于優(yōu)勢(shì)關(guān)系的確定性序決策規(guī)則如下:
例2(接例1) 由于S的最優(yōu)尺度選擇為Q=(2,1,1),則可得到在尺度選擇Q下S的可辨識(shí)矩陣如表2所示.
由于
該規(guī)則支持的對(duì)象為x1,x7,x8,x12.
該規(guī)則支持的對(duì)象為x1,x2,x4,x5,x7,x8,x12.
該規(guī)則支持的對(duì)象為x1,x2,x3,x4,x5,x6,x7,x8,x9,x12.
該規(guī)則支持的對(duì)象為U.
表2 尺度選擇Q下S的可辨識(shí)矩陣Table 2 Discernibility matrix of S under scale selection Q
最優(yōu)尺度選擇是多尺度信息系統(tǒng)知識(shí)獲取的一個(gè)關(guān)鍵步驟,最優(yōu)尺度選擇的作用是從多尺度信息系統(tǒng)中找到一個(gè)符合目標(biāo)條件的最優(yōu)子表用于最終的決策(如聚類、分類或排序).本文針對(duì)協(xié)調(diào)廣義決策多尺度序信息系統(tǒng)中的知識(shí)獲取問(wèn)題,分別使用粗糙集理論和證據(jù)理論定義下近似最優(yōu)尺度選擇與上近似最優(yōu)尺度選擇、信任最優(yōu)尺度選擇與似然最優(yōu)尺度選擇的概念,證明保持序決策系統(tǒng)是協(xié)調(diào)的最粗尺度選擇(即最優(yōu)尺度選擇)與下近似最優(yōu)尺度選擇和信任最優(yōu)尺度選擇都是等價(jià)的,而上近似最優(yōu)尺度選擇與似然最優(yōu)尺度選擇也是等價(jià)的.并在最優(yōu)尺度選擇基礎(chǔ)上,進(jìn)一步使用粗糙集辨識(shí)矩陣方法給出屬性約簡(jiǎn),最終獲得蘊(yùn)含在協(xié)調(diào)廣義決策多尺度序信息系統(tǒng)中的序決策規(guī)則集.在后續(xù)研究中:一方面,可進(jìn)一步研究在協(xié)調(diào)和不協(xié)調(diào)廣義決策多尺度序信息系統(tǒng)中局部最優(yōu)尺度選擇及規(guī)則提取問(wèn)題; 另一方面,其它更復(fù)雜數(shù)據(jù)類型(如不完備廣義決策多尺度序信息系統(tǒng)等)的最優(yōu)尺度選擇及序決策規(guī)則提取也是值得研究的問(wèn)題.