楊文聽,易黃建,陳 躍,李小南
(1 西安電子科技大學(xué) 數(shù)學(xué)與統(tǒng)計學(xué)院,陜西 西安 710126;2 西北大學(xué) 信息科學(xué)與技術(shù)學(xué)院,陜西 西安 710127)
Pawlak提出的粗糙集理論是一種處理不確定性問題的有效工具,此外,概率粗糙集[1-2]和決策粗糙集[3-5]作為經(jīng)典粗糙集模型的重要推廣,也是處理不確定問題的一種有效方法。Yao等在粗糙集和決策粗糙集的基礎(chǔ)上提出三支決策理論[6-7],作為粗糙集的一個有效改進(jìn)模型,三支決策同樣是處理不確定性和復(fù)雜問題的有效工具且得到廣泛應(yīng)用。Hu等在三支決策空間中提出了2種新型的三支決策,并討論了參數(shù)變化及三支決策的性質(zhì)等問題[8];Sun等研究了在論域上基于多粒度模糊決策理論粗糙集的三支群決策[9];Li等將包含關(guān)系推廣至一般評價函數(shù),研究了雙論域上的三支決策,提出了一種計算閾值的方法[10];Li等將三支決策模型從0-1表推廣到一般的信息表,研究了現(xiàn)有相關(guān)模型間的聯(lián)系,提出加權(quán)信息熵這一測度來確定閾值和最優(yōu)的三劃分[11]。
沖突是反映支持與反對的一種對立狀態(tài),為更好地解釋沖突問題,Pawlak提出了基于粗糙集理論的沖突分析,而沖突分析與三支決策之間存在著某些天然的聯(lián)系[12-13]。因此,部分學(xué)者開始將三支決策的思想用于沖突分析的研究中[14-16]。如Lang等在決策粗糙集和三支決策理論的基礎(chǔ)上,通過推廣Pawlak沖突分析模型,引入了沖突分析的概率模型,使用一對閾值而不是Pawlak模型中的閾值0.5來定義聯(lián)盟、沖突和中立關(guān)系[17];Sun等提出了一種基于粗糙集逼近算子的沖突分析方法[18];Fan等以基于評價的三支決策模型為基礎(chǔ),并運用形式概念分析中的求導(dǎo)算子研究了沖突分析的定量模型[19];Yao等將Pawlak的沖突分析模型進(jìn)行推廣重構(gòu),通過一個距離函數(shù)定義代理間的三支沖突模型[20]。
在分析沖突原因和尋求沖突解決辦法時,通常需要統(tǒng)計各個代理對問題的態(tài)度值,并整理成信息表。理想情況下,我們假設(shè)每個代理對問題都給出支持、中立或反對態(tài)度,即每個代理的態(tài)度值都是可獲取的,不存在缺失的情況。這樣理想狀態(tài)下獲得的態(tài)度值表,稱之為完備信息表。目前,大多數(shù)學(xué)者對沖突分析所做的研究也正是基于完備信息表,如Lang等提出基于畢達(dá)哥拉斯模糊集理論的三支群沖突分析[21];Sun等提出基于概率粗糙集的沖突分析[22],Yao等提出基于Pawlak模型拓展的三支沖突分析[20];Li等提出將一般的信息系統(tǒng)推廣到三角模糊信息系統(tǒng)中,用相對面積來定義代理對問題的態(tài)度,再對問題賦予模糊權(quán)重,最后根據(jù)決策理論粗糙集計算閾值得到代理的三劃分,從而建立了三角模糊信息系統(tǒng)的沖突分析模型[23];Bashir等提出了用博弈論和粗糙集來解決沖突[24]。但是,人類社會的沖突往往是動態(tài)復(fù)雜的,代理對問題的態(tài)度受各種因素的影響,代理可以給出明確的態(tài)度,也可以保持沉默,這就很有可能造成部分代理態(tài)度值暫時或永久的缺失,從而得到的是不完備信息系統(tǒng)[25]。Liu等提出了在不完備信息系統(tǒng)中一種新的三支決策模型[26];Luo等提出了基于相似性和滿意度的不完備信息三支決策[27]。因此,將沖突分析從完備的信息系統(tǒng)推廣到不完備的信息系統(tǒng)是十分有意義的。本文將在不完備信息系統(tǒng)背景下,重新建立一個新的三支沖突分析模型進(jìn)行問題研究。首先,介紹了完備信息系統(tǒng)下的沖突分析,在此基礎(chǔ)上將其推廣至不完備的信息系統(tǒng)中。其次,通過處理信息表中的缺失值定義了代理之間的沖突相似距離,進(jìn)一步定義了代理之間的沖突關(guān)系,從而建立了不完備信息系統(tǒng)上的三支沖突分析模型。最后,基于決策理論粗糙集,并運用貝葉斯最小風(fēng)險決策原理得到了該模型中代理三劃分所需的閾值,從而得到最為合理的決策結(jié)果。
定義1[12](三值信息系統(tǒng))三值信息系統(tǒng)是一個四元組S=(U,A,Va,f),其中U={x1,x2,…,xn}是一個非空有限代理集,A={a1,a2,…,am}是一個非空有限問題集,a(∈A)的值集Va={-1,0,+1},f:U×A→Va是一個二元映射。
注1在以上三值信息系統(tǒng)中,用二元映射f表示代理對問題所持的態(tài)度,即?xi∈U,aj∈A,若f(xi,aj)=-1,表示代理xi對問題aj持反對態(tài)度;f(xi,aj)=0,表示代理xi對問題aj持中立態(tài)度;f(xi,aj)=+1,表示代理xi對問題aj持肯定態(tài)度。
表1是一個三值信息系統(tǒng),其中每個代理對問題都給出了清晰明確的態(tài)度,不存在態(tài)度值缺失或暫時不明晰的情況,因此這是一個完備信息系統(tǒng)。下面介紹一個輔助函數(shù)來描述一對代理間的關(guān)系。
表1 完備三值信息系統(tǒng)
定義2[12]對每個a∈A,代理間的一個二元關(guān)系φa:U2→{-1,0,1}定義為
若φa(x,y)=1,則代理x和y對問題a持相同的態(tài)度,即代理x和y在問題a上是聯(lián)盟的;若φa(x,y)=0,則x和y至少有一個對問題a持中立態(tài)度,即代理x和y在問題a上是中立的;若φa(x,y)=-1,則x和y對問題a持有相反的意見,即代理x和y在問題a上是沖突的。
以表1為例,對于問題a1,可得
定義3[12]設(shè)S=(U,A,Va,f)是一個三值信息系統(tǒng),問題集?≠B?A,代理x與y的距離函數(shù)
其中
定義4[17]設(shè)S=(U,A,Va,f)是一個三值信息系統(tǒng),問題集?≠B?A,α、β是一對給定閾值且滿足0≤β<α≤1,則代理對(x,y)∈U2在問題集B上的關(guān)系如下:
定義5[17]設(shè)S=(U,A,Va,f)是一個三值信息系統(tǒng),問題集?≠B?A,α、β是一對給定閾值且滿足0≤β<α≤1,定義代理x的聯(lián)盟、中立和沖突集如下:
定義6[2]設(shè)S=(U,A,Va,f)是一個信息系統(tǒng),α、β是一對給定閾值且滿足0≤β<α≤1,則X(?U)的上下近似定義為
r(α,β)(X)={x∈U|P(X|[x])≤β}。
定義7[2]設(shè)S=(U,A,Va,f)是一個信息系統(tǒng),α、β是一對給定閾值且滿足0≤β<α≤1,X(?U)的概率正、負(fù)以及邊界域P(α,β)(X)、N(α,β)(X)、B(α,β)(X)為
P(α,β)(X)={x|U|P(X|[x])≥α};
N(α,β)(X)={x∈U|P(X|[x])≤β};
B(α,β)(X)={x∈U|β
注2由上述定義可知,正域、邊界域以及負(fù)域的三劃分與閾值的大小密切相關(guān)。因此,可以將其運用在不完備信息系統(tǒng)的沖突分析中,從而可以得到在不完備信息系統(tǒng)中閾值的大小以確定代理的三劃分。
定義8[25]不完備信息系統(tǒng)是一個四元組S=(U,A,Va∪{*},f),其中U={x1,x2,…,xn}是一個非空有限代理集,A={a1,a2,…,am}是一個非空有限問題集,a(∈A)的值集Va={-1,0,+1,*},f:U×A→Va是一個二元映射。
注3在不完備信息系統(tǒng)中,-1、0、+1表示的含義與完備信息表相同,*表示信息缺失。
對于缺失值*,它表示代理對于問題的態(tài)度,且對決策起著十分重要的作用。缺失值*可能為Va的子集,即Bai?Va,|Bai|>0。從而將不完備的信息表轉(zhuǎn)換為完備的信息表,即表2、表3。
表2 不完備信息表
表3 混合信息表
定義9設(shè)S=(U,A,Va∪{*},f)是一個不完備信息系統(tǒng),問題集?≠B?A,則代理x和y的相似距離函數(shù)為
S(ai)(x,y)=
S(ai)(x,y)=1表示代理x和y對問題ai的態(tài)度一致且不缺失的情況下,二者間的相似程度;
S(ai)(x,y)=0表示代理x和y對問題ai的態(tài)度不一致,且其中一個代理對問題持中立態(tài)度,另外一個代理對問題的態(tài)度缺失情況下,二者間的相似程度;
S(ai)(x,y)=-1表示代理x和y對問題ai的態(tài)度不一致,一個代理對問題持支持,另外一個代理對問題持反對態(tài)度的情況下,二者間的相似程度;
定義10設(shè)S=(U,A,Va∪{*},f)是一個不完備信息系統(tǒng),問題集?≠B?A,則代理x和y的沖突相似距離為
式中:|B|表示問題集B的基數(shù);SB(x,y)表示代理x和y面對多個問題時,二者間的平均相似程度。
注4該定義的沖突相似距離表示的是兩個代理之間相似程度的大小。若兩個代理的沖突相似距離越大,則聯(lián)盟機(jī)率越大;反之,若沖突相似距離越小,則具有沖突的機(jī)率越大。
由以上的沖突相似距離,可得以下性質(zhì)。
性質(zhì)1(1)0≤S(x,y)≤1;
(2)S(x,y)=S(y,x);
(3)S(x,y)=1,當(dāng)且僅當(dāng)x=y。
例1在不完備信息系統(tǒng)中(如表2),對缺失值進(jìn)行處理可重新得到一個完整的混合信息系統(tǒng),如表3。代理間對單個問題的態(tài)度相似程度可以通過定義9的沖突相似距離計算得到:
Sa3(x1,x2)=1,Sa4(x1,x2)=1。
表4 代理對多個問題的沖突相似距離
采用政治選舉問題表示這個不完備信息表,U={x1,x2,x3,x4,x5,x6}代表6個選民,即代理集,A={a1,a2,a3,a4}代表4個黨派,即問題集。在不完備信息系統(tǒng)的背景下,研究選民對黨派的支持與否,從而得到選民間的聯(lián)盟、中立以及沖突關(guān)系,并且它是根據(jù)以上得到的沖突相似距離而確定的。沖突相似距離越大,說明選民對黨派所表明的態(tài)度一致,因此可以判斷為聯(lián)盟機(jī)率較大;沖突相似距離越小,說明選民對黨派所表明的態(tài)度不一致,因此二者之間的沖突較大;其余則為中立者。
將Pawlak模型這一完備信息系統(tǒng)推廣至不完備信息系統(tǒng)上,從而研究不完備狀態(tài)下的沖突分析情況。在不完備信息系統(tǒng)中,將沖突相似距離這個相似度作為沖突函數(shù),從而得到代理之間的聯(lián)盟、中立以及沖突關(guān)系。
定義11設(shè)S=(U,A,Va∪{*},f)是一個不完備信息系統(tǒng),問題集?≠B?A,?x,y∈U,則代理x與y之間的沖突函數(shù)為
沖突函數(shù)的大小在一定程度上表示了代理x與y的沖突程度。
定義12設(shè)S=(U,A,Va∪{*},f)是一個不完備信息系統(tǒng),?x,y∈U,α、β是一對給定閾值且滿足0≤β<α≤1,x與y的沖突函數(shù)為S(x,y),則x與y在問題集B上的關(guān)系如下:
(1)S(x,y)≥α,表示代理x與y是聯(lián)盟關(guān)系;
(2)β
(3)S(x,y)≤β,表示代理x與y是沖突關(guān)系。
定義13設(shè)S=(U,A,Va∪{*},f)是一個不完備信息系統(tǒng),?x,y∈U,α、β是一對給定閾值且滿足0≤β<α≤1,則可定義代理的沖突、中立以及聯(lián)盟集:
(1)AL(x)={y∈U|S(x,y)≥α};
(2)NE(x)={y∈U|β
(3)CO(x)={y∈U|S(x,y)≤β}。
由定義12、13可知,所得到的聯(lián)盟、中立及沖突集與閾值有關(guān)。閾值的大小決定著代理間的關(guān)系,但當(dāng)α=1時,代理間的沖突最小,聯(lián)盟意愿最強(qiáng);β=0時,代理間的沖突最大,聯(lián)盟意愿幾乎沒有。
定理1設(shè)S=(U,A,Va∪{*},f)是一個不完備信息系統(tǒng),根據(jù)定義13可知,
(1)y∈AL(x)?x∈AL(y);
(2)y∈NE(x)?x∈NE(y);
(3)y∈CO(x)?x∈CO(y)。
證明:(1)由y∈AL(x),得S(x,y)≥α,又由性質(zhì)1得S(x,y)=S(y,x),所以得到S(y,x)≥α,即得到AL(y)={x∈U|S(y,x)≥α},所以x∈AL(y)。
(2)由y∈NE(x),得β
(3)由y∈CO(x),得S(x,y)≤β,又由性質(zhì)1得S(x,y)=S(y,x),所以得到S(x,y)≤β,即得到CO(y)={x∈U|S(y,x)≤β},所以x∈CO(y)。
例2根據(jù)表4的沖突相似距離結(jié)果,得到以下結(jié)果。
在表4中,由于知道每個代理對多個問題的沖突相似距離,根據(jù)定義13可得每個代理對多個問題的聯(lián)盟集、沖突集以及中立集。
若取定閾值α=0.55,β=0.4,每個代理對應(yīng)的聯(lián)盟集、沖突集以及中立集如表5。
表5 每個代理在多個問題中的聯(lián)盟集、沖突集以及中立集
以上例子表明,通過沖突相似距離以及給定的閾值得到了關(guān)于每個選民的聯(lián)盟集、中立集以及沖突集,但由于給定的閾值具有隨機(jī)性,導(dǎo)致在一定的程度上可能存在著決策的風(fēng)險。因此,下面通過決策理論粗糙集來確定閾值的大小,從而得到風(fēng)險較小的決策結(jié)果。
決策理論粗糙集是在2個狀態(tài)和3個行動中運用的,特征狀態(tài)集Ω={X,┐X),這里X表示屬于X的代理對問題持支持態(tài)度,而┐X表示不屬于┐X的代理對問題持反對或者否定的態(tài)度。D={aP,aB,aN}表示行動集,這里P、B、N表示在決策中的3種行動方式,分別決定x∈AL(X),x∈NE(X),x∈CO(X)。關(guān)于3種行為在2種狀態(tài)下的風(fēng)險或成本的損失函數(shù)由一個3×2矩陣(表6)給出。
表6 不同狀態(tài)下的損失函數(shù)矩陣
在這個矩陣中,λPP、λBP、λNP表示代理在支持狀態(tài)下,在3種行動aP、aB、aN下遭受的損失。同樣,λPN、λBN、λNN表示代理在反對或者中立狀態(tài)下,在3種行動aP、aB、aN下遭受的損失。由于本文研究的是不完備信息系統(tǒng)的三值表,因此在本文中所涉及的損失函數(shù)考慮采用單值函數(shù)。
由定義9可得在不完備信息系統(tǒng)上的相似性關(guān)系。
a∈B}。
這里h表示一個閾值,只有在沖突相似距離大于h時,才會確定代理間的相似關(guān)系,從而得到兩代理之間較高的相似程度。
定義15設(shè)S=(U,A,Va∪{*},f)是一個不完備信息系統(tǒng),對?≠B?A,則?x∈B,相似類可定義為
在不完備信息系統(tǒng)中,根據(jù)相似關(guān)系得到代理的相似類,對某一類問題可以得到代理間意見相對一致的集合,這在根據(jù)粗糙集決策理論進(jìn)行三支沖突分析中更具有理論價值。
定義16設(shè)S=(U,A,Va∪{*},f)是一個不完備信息系統(tǒng),?X?U,可基于相似關(guān)系得到條件概率
定義17設(shè)S=(U,A,Va∪{*},f)是一個不完備信息系統(tǒng),?X?U,?≠B?A,且0≤β<α≤1。X?U的上下近似可定義為
定義18設(shè)S=(U,A,Va∪{*},f)是一個不完備信息系統(tǒng),α、β是一對給定閾值且滿足0≤β<α≤1,則X?U的概率正域、負(fù)域、中立,即聯(lián)盟、沖突以及中立為
由定義17可知,若給定的代理集X在代理xi相似類的條件概率大于等于α?xí)r,可知代理U的某些代理是聯(lián)盟的;若給定的代理集X在代理xi相似類的條件概率在α、β之間時,可知代理U的某些代理是中立的;若假設(shè)給定的代理集X在代理xi相似類的條件概率小于等于β時,可知代理U的某些代理是沖突的。
在不完備信息系統(tǒng)中,假設(shè)λPP、λBP、λNP、λPN、λBN和λNN是損失函數(shù),滿足λPP≤λBP≤λNP,λNN≤λBN≤λPN,則?x∈U,得到在3種行動aP、aB、aN下的期望損失如下:
根據(jù)貝葉斯最小風(fēng)險決策理論可得定理2。
定理2設(shè)S=(U,A,Va∪{*},f)是一個不完備信息系統(tǒng), ?x∈U,在3種行動aP、aB、aN下的期望損失為R(aP|x)、R(aB|x)和R(aN|x),則
證明根據(jù)貝葉斯最小風(fēng)險決策原理有
(P)R(aP|x)≤R(aB|x)?
λPN-λBN≤[(λBP-λBN)+
R(aP|x)≤R(aN|x)?
同理,得到
(B)R(aB|x)≤R(aP|x)?
R(aB|x)≤R(aN|x)?
(N)R(aN|x)≤R(aP|x)?
R(aN|x)≤R(aB|x)?
令
得到β≤γ≤α。即得到
所以,定理成立。
例3根據(jù)例1中的政治選舉問題來分析代理之間的沖突關(guān)系,表7為政治選舉的決策損失矩陣,即λPP、λBP、λNP、λPN、λBN和λNN是損失函數(shù),且滿足λPP≤λBP≤λNP,λNN≤λBN≤λPN。
表7 政治選舉決策損失函數(shù)
若取定h=0.3,可得每個代理的相似類,即在閾值確定的情況下得到每個代理的相似類集合
給定X={x1,x4,x5},且X?U,由定義14得
根據(jù)定理2,由政治選舉決策損失函數(shù)可得閾值
再由定義18與定理2決策規(guī)則可得聯(lián)盟集、中立集以及沖突集
對于政治選舉,由于選民對問題所持態(tài)度不同,選民間會引起不必要的矛盾沖突。通過以上模型得到,當(dāng)α=0.545、β=0.467時,選民間有一個較為合理的劃分:聯(lián)盟集為{x4,x5},這表明選民x4、x5面對整個事件持有積極的態(tài)度;中立集{x6},這表明選民x6對整個事件持有中立的態(tài)度;沖突集{x1,x2,x3},這表明選民x1、x2、x3面對整個事件持有消極的態(tài)度。因此,在此事件中,以得到的選民三劃分為基礎(chǔ),應(yīng)充分考慮積極者面對整個事件所持有的信息數(shù)據(jù),以預(yù)測選民間沖突演化的結(jié)果,從而為決策者提供有效的信息,這有效地避免了在信息缺少情況下出現(xiàn)的問題,也大大減小了所出現(xiàn)的決策風(fēng)險,具有一定的應(yīng)用價值。
本文基于Pawlak的沖突分析模型,將Pawlak模型中完備的三值情況推廣至不完備的信息系統(tǒng)中,提出了不完備信息系統(tǒng)中的沖突分析模型。在不完備信息表中,通過對缺失值的處理,將不完備的信息系統(tǒng)轉(zhuǎn)換為完備的信息系統(tǒng),進(jìn)而研究代理間的聯(lián)盟沖突關(guān)系。本文定義了一個沖突相似距離,根據(jù)這個函數(shù)來判定代理間的沖突情況。閾值是沖突分析中一個重要的研究對象,本文根據(jù)決策理論粗糙集和貝葉斯最小風(fēng)險決策原理,確定了閾值的大小,進(jìn)而得到了最為合理的聯(lián)盟集、中立集和沖突集。本文是在不完備三值信息表中進(jìn)行的研究,下一步的工作將推廣至模糊集中來討論研究。