胡明禮, 丁 磊(南京航空航天大學(xué) 經(jīng)濟(jì)管理學(xué)院, 南京 211106)
基于不完備信息系統(tǒng)的灰度優(yōu)勢粗糙近似模型①
胡明禮, 丁 磊
(南京航空航天大學(xué) 經(jīng)濟(jì)管理學(xué)院, 南京 211106)
為解決不完備信息的偏好決策問題, 多種優(yōu)勢關(guān)系及其相應(yīng)的粗糙集模型被提出并證實(shí)其實(shí)用性. 然而在實(shí)際情況中, 只要存在缺失值那么無論使用何種方法對比出來的優(yōu)勢關(guān)系都存在一定的不確定性. 基于此, 本文分析了影響灰度大小的因素, 定義了優(yōu)勢關(guān)系中灰度和差異系數(shù)的概念并給出了計(jì)算方法, 建立了兩對象間進(jìn)行對比的灰度度量. 提出了基于灰度的優(yōu)勢關(guān)系及其粗糙集近似模型. 與廣義擴(kuò)展優(yōu)勢關(guān)系和擴(kuò)展優(yōu)勢關(guān)系相比, 基于灰度優(yōu)勢關(guān)系的粗糙集模型近似分類精度和質(zhì)量均有提高. 最后通過實(shí)例證明了灰度優(yōu)勢關(guān)系及其粗糙近似模型的實(shí)用性.
不完備信息系統(tǒng); 灰度優(yōu)勢關(guān)系; 粗糙集; 廣義擴(kuò)展優(yōu)勢關(guān)系
由于環(huán)境的復(fù)雜性、人類計(jì)算能力和認(rèn)知能力的局限性、信息的不對稱性, 人們做出的決策并非完全理性的, 即存在一定的不確定性. 針對模糊信息和不明確表述, Pawlak等[1]最先提出了粗糙集理論來對不精確或不確定的知識進(jìn)行近似描述和處理. 為了解決偏好序問題, Greco等[2-4]拓展了傳統(tǒng)粗糙集中對象間的二元關(guān)系, 在不可分辨性的基礎(chǔ)上提出了二元優(yōu)勢關(guān)系. 何亞群等[5]提出了擴(kuò)展優(yōu)勢關(guān)系的概念, 將粗糙集方法從完備信息系統(tǒng)拓展到不完備信息系統(tǒng)中. 胡明禮等考慮到可比較信息的多少對分類準(zhǔn)確性的影響,認(rèn)為不具有共同非空屬性的兩個(gè)對象在擴(kuò)展優(yōu)勢關(guān)系中進(jìn)行對比時(shí)誤分類的幾率非常大. 基于這種觀點(diǎn),文獻(xiàn)[6]以共同非空屬性個(gè)數(shù)是否為0為衡量指標(biāo), 對可比較信息多少進(jìn)行了限定, 提出了基于有限擴(kuò)展優(yōu)勢關(guān)系的粗糙集決策方法. 在此基礎(chǔ)上, 胡明禮[7]提出, 當(dāng)條件屬性較多的時(shí)候, 通過限定共同非空屬性個(gè)數(shù)是否為0并不能很好的反映可比較信息的多少, 條件過于寬松. 于是便提出了基于廣義擴(kuò)展優(yōu)勢關(guān)系的粗糙決策方法. 通過設(shè)定閾值的方法來限定可比較信息的多少. 然而只要存在缺失值, 那么無論對比的方法多么科學(xué), 也必然存在誤分類的情況, 優(yōu)勢關(guān)系都具有不確定性. 現(xiàn)有的優(yōu)勢關(guān)系粗糙集模型僅對可比較信息多少做出限定, 考慮不夠全面. 同時(shí)并沒有對兩對象間優(yōu)勢關(guān)系的不確定性大小做出明確的區(qū)分.如何處理不完備信息系統(tǒng)下優(yōu)勢關(guān)系不確定性問題仍需進(jìn)一步研究.
在傳統(tǒng)粗糙集方法中部分學(xué)者通過將粗糙集與灰色系統(tǒng)相結(jié)合的方法來處理不確定問題. Yamaguchi[8]使用灰色粗糙集模型中的灰格關(guān)系代替了粗糙集中的不可分辨關(guān)系提出了基于灰格的灰色粗糙集模型. 此外,該模型還存在一定的不足,它以灰格一致關(guān)系為基礎(chǔ),在對兩個(gè)對象進(jìn)行分類的時(shí)候顯得條件過于苛刻.因此, Yamaguchi[9]等人又提出了以灰格包關(guān)系為基礎(chǔ)的灰色粗糙集模型,較基于灰格一致關(guān)系的灰色粗糙集模型在分類限制條件上做了一定的改進(jìn). 王天擎等[10]認(rèn)為Yamaguchi提出的模型中單個(gè)屬性的上近似集僅僅根據(jù)兩個(gè)對象值相交不為空就被認(rèn)為是處于同一類中, 這種條件顯得過于寬松; 而下近似集則要求兩個(gè)對象具有包含關(guān)系, 可能使得這兩個(gè)對象值絕大部分相同卻不能分在同一類中這種條件又過于嚴(yán)苛. 因此,他提出了一種基于可變精度分類的變精度灰色粗糙集模型. 趙煥煥等[11]利用灰色相似關(guān)聯(lián)度定義基于閾值的灰色相似關(guān)聯(lián)關(guān)系, 并用灰色相似關(guān)聯(lián)關(guān)系代替粗糙集中的不可分辨關(guān)系, 很好地克服屬性值離散化處理過程中容易造成一定程度的信息損失問題.
借鑒以上研究, 本文將灰度概念引入到優(yōu)勢關(guān)系粗糙集中. 通過對優(yōu)勢關(guān)系中不確定因素的分析, 結(jié)合齊當(dāng)別[12]模型中的觀點(diǎn), 本文認(rèn)為優(yōu)勢關(guān)系的不確定性除了與信息多少有關(guān)以外, 還與屬性的重要性以及屬性值差異大小有關(guān). 以此為基礎(chǔ), 構(gòu)建灰度度量,建立灰度優(yōu)勢關(guān)系, 并運(yùn)用灰數(shù)分級理論對優(yōu)勢關(guān)系粗糙集作進(jìn)一步拓展.
定義1. (不完備有序決策系統(tǒng))[5]在決策系統(tǒng)S=(U, A, V,f)中U代表論域; A代表屬性集合, A=C∪D, C代表?xiàng)l件屬性, D代表決策屬性; V代表屬性的值域, VC代表?xiàng)l件屬性的值域, VD決策屬性的值域, 值域具有偏好次序; f: U×A→V代表一個(gè)信息函數(shù), 表示對每一個(gè)x∈U, q∈A, f( x, q)∈Vq, 如果存在某些屬性值Vq*∈Vc等于空值“*”, 則S稱為不完備有序決策系統(tǒng).
定義2. (二元關(guān)系)[13]R為集合A上的二元關(guān)系(1) 若?x∈A,xRx 成立, 則稱R是自反的; (2) ?x,y∈A , x和y之間存在序關(guān)系, 若y? x 則x? y, 則稱x, y間滿足序?qū)ΨQ性;
(3) ?x, y, z∈A , 如果xRy, yRz, 那么xRz, 則稱R具有傳遞性.
定義3, 4, 5均基于一個(gè)給定的決策系統(tǒng)S=(U, A, V,f),p?A, x, y ∈U
定義3. (擴(kuò)展優(yōu)勢關(guān)系)
y優(yōu)于x用yDpEDomx表示. 擴(kuò)展優(yōu)勢將優(yōu)勢關(guān)系從完備信息系統(tǒng)擴(kuò)展到不完備信息系統(tǒng)中.
其中Bp, 表示不存在空缺值的屬性. y優(yōu)于x用yDLpEDomx表示. 有限擴(kuò)展優(yōu)勢關(guān)系在擴(kuò)展優(yōu)勢關(guān)系的基礎(chǔ)之上作出限定Bp(x)∩Bp(y)≠?即共同非空屬性的個(gè)數(shù)不為0.
定義5. (廣義有限擴(kuò)展優(yōu)勢關(guān)系)[7]
y優(yōu)于x用yDGpEDomx表示. 廣義擴(kuò)展優(yōu)勢關(guān)系使用了一個(gè)閾值λ來限制非空屬性與條件屬性的個(gè)數(shù)比來對優(yōu)勢關(guān)系進(jìn)行約束.
3.1 影響灰度的因素
借鑒灰色系統(tǒng)中對灰度的定義, 本文將優(yōu)勢關(guān)系中灰度定義為某一對象優(yōu)于或者劣于另一對象的不確定程度.
在不完備信息系統(tǒng)中, 優(yōu)勢二元關(guān)系的不確定性是普遍存在的. 兩對象間優(yōu)勢關(guān)系的不確定性越大,即灰度越大, 那么將一個(gè)對象優(yōu)于或者劣于另一對象判斷錯(cuò)誤的可能性越大, 誤分類的情況也會隨之發(fā)生.
(1) 信息的多少
茍光磊[14]認(rèn)為, 人們更愿意使用信息更優(yōu)更詳細(xì)的數(shù)據(jù). 兩對象間進(jìn)行對比時(shí), 在不考慮其他因素的前提下, 兩對象的不確定信息越少, 對比出來的優(yōu)勢關(guān)系確定性越大. 例如, 本文第5節(jié)應(yīng)用實(shí)例中, 在判斷供應(yīng)商X1是否優(yōu)于供應(yīng)商X8時(shí), 共同非空屬性有3個(gè); 而在判斷供應(yīng)商X10是否優(yōu)于供應(yīng)商X8時(shí), 卻沒有共同非空屬性, 所包含的確定信息遠(yuǎn)小于前者. 在不考慮其他因素的情況下, 前者所判斷出的優(yōu)勢關(guān)系灰度小于后者, 確定性更大, 因而誤分類的可能性越小.
(2) 屬性權(quán)重
在實(shí)際應(yīng)用中, 不同屬性的重要度肯定是有差異的. 在部分?jǐn)?shù)據(jù)表中, 少數(shù)重要度極大的條件屬性在決策的過程中對決策結(jié)果起著至關(guān)重要的作用. 在不考慮其他因素的作用下, 當(dāng)缺失值所在屬性的權(quán)重越大, 該優(yōu)勢二元關(guān)系的不確定性越大, 即灰度越大.例如, 本文第5節(jié)應(yīng)用實(shí)例中, 為了區(qū)分重要性的差異, 假定屬性A1、A2、A3、A4的權(quán)重分別為0.3、0.1、0.1、0.5. 在不考慮其他因素的作用下, 當(dāng)缺失值出現(xiàn)在A4中時(shí), 灰度較大.
(3) 屬性值的差異程度大小.
借鑒齊當(dāng)別模型[12]中的思想, 人們在做決策的時(shí)候會人為地忽略差異小的屬性, 而將差異大的屬性作為最終的抉擇依據(jù). 單個(gè)屬性的屬性值差異越大, 那么這個(gè)屬性對整體優(yōu)勢關(guān)系的影響越大; 差異越小,那么這個(gè)屬性對整體優(yōu)勢關(guān)系的影響就越小.
綜合考慮以上因素, 本文選取確定信息多少、屬性權(quán)重和差異大小作為構(gòu)建灰度度量的三個(gè)主要因素.
3.2 差異系數(shù)
為了區(qū)分屬性值差異大的情況和屬性值差異小的情況, 本文設(shè)定了一個(gè)差異系數(shù).稱為在屬性q下, 對象x 優(yōu)于對象x的差異mij系數(shù).=1表示在屬性q下, 對象x確定優(yōu)于對象mix且屬性值大小差異較大;=0表示在屬性q下, jm對象xi與對象xj屬性值大小差異較小, 可以忽略;不存在表示在屬性qm下, 不能判斷對象xi優(yōu)于對象xj.由差異系數(shù)的定義可知, 通過α和ε的設(shè)定, 忽略屬性值差異較小的情況, 從而建立一個(gè)差別機(jī)制, 將屬性值差異大的情況和屬性值差異小的情況進(jìn)行了區(qū)分. 同時(shí)減弱了噪音數(shù)據(jù)的干擾, 使得模型整體具備一定的容差能力. 在不考慮其他因素的情況下, 屬性值差異越大, 一個(gè)對象優(yōu)于或者劣于另一對象的可能性就越大, 不確定性越小.
3.3 灰度
定義7. 對于xi, xj∈U,如果對象xi和對象xj中存在缺失值, 并且對于?q∈■■Bp(xi)∩Bp(xj)■■,都有f( xi, q)≥f( xj, q), 那么灰度定義如下:
3.4 灰度優(yōu)勢關(guān)系
定義8. 對于一個(gè)給定的決策系統(tǒng)S=(U, A, V,f), xi, xj∈U, P?A , 灰度優(yōu)勢關(guān)系GDR(P)定義為:
與廣義擴(kuò)展優(yōu)勢關(guān)系所設(shè)置的閾值不同的是, 灰度優(yōu)勢關(guān)系用灰度對優(yōu)勢關(guān)系的不確定性做了一個(gè)限定, 同時(shí)考慮了權(quán)重和屬性值差異程度對分類的影響,更加符合在實(shí)際應(yīng)用中所遇到的情況. 通過調(diào)整閾值的大小來確定對優(yōu)勢關(guān)系的約束力度, 從而有效地減小了因?yàn)椴淮_定性差異而誤分類的幾率.
性質(zhì)1. 灰度優(yōu)勢關(guān)系滿足自反性和序?qū)ΨQ性, 但不一定滿足傳遞性.
性質(zhì)2. 閾值λ的取值范圍為[0,1].
定義9. (灰度優(yōu)勢集、灰度劣勢集)給定一個(gè)決策系統(tǒng)S=(U, A, V,f),x∈U, 則對象x的灰度優(yōu)勢集(灰度劣勢集)定義為:
3.5 基于灰度優(yōu)勢關(guān)系的粗糙近似
定義10. 在決策系統(tǒng)S=(U, A, V,f)中, 對于P?A,x?U, Cl≥,Cl≤?U, t=1,2,…,n , 在灰度優(yōu)勢
tt關(guān)系下, 分別對上聯(lián)合和下聯(lián)合的粗糙近似作如下定義:
t=1,2,…,n在灰度優(yōu)勢關(guān)系下, 上聯(lián)合和下聯(lián)合的粗糙近似分類精度定義為:
4.1 幾種優(yōu)勢關(guān)系的對比
證明: 根據(jù)定義10中邊界域Bn( Cl)GDR的概念以及
t定理1和定理2的結(jié)論可直接證得推論1.
4.2 幾種基于拓展優(yōu)勢關(guān)系的近似分類性能對比
定理3. 三種優(yōu)勢關(guān)系近似分類精度對比:
證明: 根據(jù)定義11近似分類精度的定義以及定理1和定理2的結(jié)論可直接證得定理3.
定理4. 三種優(yōu)勢關(guān)系近似分類質(zhì)量對比:
證明: 根據(jù)定義12中近似分類質(zhì)量的定義以及定理1和定理2的結(jié)論可直接證得定理4.
為證明灰度優(yōu)勢關(guān)系的實(shí)用性, 下面應(yīng)用一個(gè)實(shí)例來進(jìn)行說明. 表1是某公司下屬供應(yīng)商的信息表.屬性A1, A2, A3, A4為條件屬性, 分別代表了對供應(yīng)商考核的4個(gè)指標(biāo), 表中1、2、3分別表示差、中、優(yōu). A5為決策屬性, 表示對供應(yīng)商的選擇情況, 3表示選擇該供應(yīng)商, 1表示不選擇該供應(yīng)商, “*”代表空值. 為了凸顯不同屬性間重要度的差異, 本文假定屬性A1、A2、A3、A4的權(quán)重分別為0.3、0.1、0.1、0.5. 同時(shí)假定α=0.2,ε=0.
表1 某公司對供應(yīng)商考核信息表
由表1, 我們可得如下信息:
A1, A2, A3, A4, A5均可視為偏好屬性. A1, A2, A3, A4為條件屬性, A5為決策屬性.
在擴(kuò)展優(yōu)勢關(guān)系下進(jìn)行計(jì)算得如下結(jié)果:
上聯(lián)合:
在廣義擴(kuò)展優(yōu)勢關(guān)系下進(jìn)行計(jì)算得如下結(jié)果:
在灰度優(yōu)勢關(guān)系下, 借鑒灰數(shù)分級理論, 將灰數(shù)分成五級, 分別令λ=0.8,0.6,0.4,0.2, 計(jì)算得個(gè)對象間灰度大小如表2所示.
表2 灰度矩陣
為了便于理解, 表2中分別使用X1到X10代表編號為1到10的員工. 表中所計(jì)算出的數(shù)值代表行對象優(yōu)于列對象的灰度.
運(yùn)用三種優(yōu)勢關(guān)系Edom、LEDom、GDR所求出的近似分類精度和近似分類質(zhì)量的計(jì)算結(jié)果如下:
上聯(lián)合:
優(yōu)勢關(guān)系EdomLEDom GDR λ\ \ 0.80.60.40.2 α33 7 1 1 1 4 87 γ137 10 1 251 1
下聯(lián)合:
通過結(jié)果對比發(fā)現(xiàn), 灰度優(yōu)勢關(guān)系粗糙集模型(GDR)相比較廣義擴(kuò)展優(yōu)勢關(guān)系(LEDom)和擴(kuò)展優(yōu)勢關(guān)系(Edom)所對應(yīng)的粗糙集模型而言近似分類精度α和近似分類質(zhì)量γ都有了一定的提高, 從而從實(shí)例的角度證明了定理3和定理4. 灰度優(yōu)勢關(guān)系在一定程度上可以減少因?yàn)椴淮_定性太大造成誤分類的情況.隨著閾值的減小, 分類對確定程度的要求越來越高.
本文提出的灰度優(yōu)勢關(guān)系是對不完全信息系統(tǒng)下優(yōu)勢關(guān)系的拓展, 在前者的基礎(chǔ)之上加入了權(quán)重和差異程度的概念, 以此來構(gòu)建灰度度量, 通過調(diào)整閾值的大小來減少因?qū)ο箝g優(yōu)勢關(guān)系的不確定性而造成誤分類的情況, 使得計(jì)算結(jié)果更加符合實(shí)際. 通過證明和實(shí)例演算比較的結(jié)果, 灰度優(yōu)勢關(guān)系的粗糙近似方法具有更優(yōu)的近似分類性能.
1 Pawlak Z, Skowron A. Rudiments of rough sets. Information Science, 2007, 177(1): 3–27.
2 Greco S, Matarazzo B, Slowinski R. Rough sets theory for multicriteria decision analysis. European J of Operational Research, 2001, 129(1): 1–47.
3 Greco S, Matarazzo B, Slowinski R. Generalizing rough set theory through dominance-based rough set approach. 10th International Conference on Rough set, Fuzzy Sets, Data Mining and Granular Computing. Heidelberg: Springer-Verlag. 2005. 1–11.
4 Greco S, Matarazzo B, Slowinski R. Dominance-based rough set approach to case-based reasoning. 3rd International Conference on Modeling Decisions for Artifical Intelligence. Heidelberg: Springer-Verlag. 2006. 7–18.
5何亞群,胡壽松.不完全信息的多屬性粗糙決策分析方法.系統(tǒng)工程學(xué)報(bào),2004,19(2):117–120.
6胡明禮,劉思峰.基于有限擴(kuò)展優(yōu)勢關(guān)系的粗糙決策分析方法.系統(tǒng)工程,2006,24(4):106–110.
7胡明禮,劉思峰.基于廣義擴(kuò)展優(yōu)勢關(guān)系的粗糙決策分析方法.控制與決策,2007,22(12):1347–1351.
8 Yamaguchi D, Li GD, Nagai M. On the combination of rough set theory and grey theory based on grey lattice operations. International Conference on Rough Sets & Current Trends in Computing. 2006. 507–516.
9 Yamaguchi D, Li GD, Nagai M. A grey-based rough approximation model for interval data Processing. Information Sciences, 2007, 177(21): 4727–4744.
10 王天擎,李琪.基于灰格運(yùn)算的變精度粗集模型及規(guī)則獲取.統(tǒng)計(jì)與決策,2015,(2):22–25.
11 趙煥煥,劉勇,Jeffrey F,劉思峰.基于灰色相似關(guān)系的灰色變精度粗糙集模型及其應(yīng)用.系統(tǒng)工程,2015,(2):146–151.
12 李紓,畢研玲,梁竹苑,孫彥,汪祚軍,鄭蕊.無限理性還是有限理性?—齊當(dāng)別抉擇模型在經(jīng)濟(jì)行為中的應(yīng)用.管理評論,2009,21(5):103–114.
13 苗奪謙,李道國.粗糙集理論、算法與應(yīng)用.北京:清華大學(xué)出版社,2008.
14茍光磊,王國胤,利節(jié),吳迪.基于置信優(yōu)勢關(guān)系的粗糙集近似模型.控制與決策,2014,29(7):1325–1329.
Grey Rough Approximate Model Based on Incomplete Information System
HU Ming-Li, DING Lei
(College of Economics and Management, Nanjing University of Aeronautics and Astronautics, Nanjing 211106, China)
Some scholars have already proposed a lot of dominance relation and corresponding rough models under incomplete information system in order to deal with the problem of preference decision which has incomplete information. It is uncertain that no matter use which method to contrast two objects as long as there is missing value. According to this defect, this article analyzes the factors that influence the gray scale, defines the concept of the gray and the difference coefficient in the dominance relation, and gives the calculation method and establishes an index to measure the degrees of the contrast between two objects. Therefore, the dominance relation based on grey system and its rough approximation model is presented. Through the comparison analysis, the precision and quality of the rough set model based on the grey dominance relation are improved. The given example proves the practicality and effectiveness of the grey dominance relation and its rough approximation model.
incomplete information system; grey dominance relation; rough sets; generalize extended dominance relation
國家自然科學(xué)基金(90924022,71171112);教育部人文社科基金項(xiàng)目(10YJC630084);中國博士后科學(xué)基金項(xiàng)目(2013M531356);江蘇省基礎(chǔ)研究計(jì)劃(自然科學(xué)基金)--青年基金項(xiàng)目(BK20130786);江蘇省博士后科研資助計(jì)劃(1301106C);中央高校基本科研業(yè)務(wù)費(fèi)專項(xiàng)科研項(xiàng)目(NS2011018,NN2012016,NJ20130020,NS2014085)
2016-07-07;收到修改稿時(shí)間:2016-09-23
10.15888/j.cnki.csa.005719