方連花, 林玉梅, 李克典
(1.泉州信息工程學(xué)院2.通識(shí)教育中心,福建 泉州 362000,3.閩南師范大學(xué)數(shù)統(tǒng)學(xué)院,福建 漳州 363000)
粗糙集理論[1]是繼概率論、模糊集、證據(jù)理論之后的又一個(gè)刻畫不完整性和不確定性的數(shù)學(xué)工具。目前,許多學(xué)者從各個(gè)方面對(duì)目標(biāo)信息系統(tǒng)的知識(shí)獲取和規(guī)則提取做了深入的研究,并且取得了大量成果[2-8]。一個(gè)信息系統(tǒng)的知識(shí)庫往往都是確定的,但在實(shí)際應(yīng)用中,經(jīng)常會(huì)在原信息系統(tǒng)上添加有限個(gè)研究對(duì)象,或者增加(刪除)屬性特征,進(jìn)而對(duì)新信息系統(tǒng)進(jìn)行分類、知識(shí)獲取等等。在這方面,已經(jīng)有學(xué)者對(duì)其進(jìn)行了研究,文獻(xiàn)[9]在等價(jià)關(guān)系的前提下研究了合成信息系統(tǒng)與子信息系統(tǒng)的屬性約簡(jiǎn)問題。由于現(xiàn)實(shí)中有些信息是不確定、不完備或者是多值的系統(tǒng),文獻(xiàn)[10]在優(yōu)勢(shì)關(guān)系下研究序信息系統(tǒng)的合成與分解的屬性特征,文獻(xiàn)[11]和[12]分別在擬序關(guān)系下研究合成集值信息系統(tǒng)以及決策表的屬性特征。他們的研究主要是基于兩個(gè)信息系統(tǒng)的合成,而在實(shí)際問題中并不僅僅只有兩個(gè)子系統(tǒng)的合成與分解,信息系統(tǒng)中又會(huì)存在大量的冗余數(shù)據(jù),因此研究有限多個(gè)信息系統(tǒng)的合成以及其屬性特征是有必要的。給出任意有限個(gè)對(duì)象合成信息系統(tǒng)和有限個(gè)屬性合成信息系統(tǒng)的概念,分別討論了它們的屬性特征與有限個(gè)原子信息系統(tǒng)的屬性特征之間的關(guān)系。
定義1.1[5]I=(U,A,F)是一個(gè)信息系統(tǒng),其中
U是對(duì)象集,U={x1,x2,…,xn};A是條件屬性集,A={a1,a2,…,ap};
F是U與A的關(guān)系集,F(xiàn)={fk:U→Vk,k≤p},Vk是ak的有限值域。
信息系統(tǒng)中的不同屬性對(duì)劃分有不同的作用,有的屬性是必不可少的,稱為核心屬性;有的屬性是可以被其他屬性代替的,稱為相對(duì)必要屬性;有的屬性是根本不需要的,稱為不必要屬性。下面給出這三種屬性特征的數(shù)學(xué)刻畫。
定義1.3[13]設(shè)I=(U,A,F)是一個(gè)信息系統(tǒng),對(duì)于B?A,若RB=RA,稱B是劃分協(xié)調(diào)集。若B是劃分協(xié)調(diào)集,而B的任何真子集均不是劃分協(xié)調(diào)集,則稱B是劃分約簡(jiǎn)集。
定義1.4[13]設(shè)I=(U,A,F)是一個(gè)信息系統(tǒng),Bk(k≤r)為所有劃分約簡(jiǎn)集,
在信息系統(tǒng)中,為了研究不同屬性的特征,在文獻(xiàn)[14]和[15]中有如下等價(jià)刻畫定理:
定理1.1[14]設(shè)(U,A,F)是信息系統(tǒng),則有以下結(jié)論:
(1)a是劃分核心當(dāng)且僅當(dāng)RA-{a}≠RA;
(2)a是劃分不必要屬性當(dāng)且僅當(dāng)R(a)?Ra,其中R(a)=∪{RB-{a}|RB?RA,B?A};
(3)a是劃分相對(duì)必要屬性當(dāng)且僅當(dāng)RA-{a}=RA成立且R(a)?Ra不成立。
定理1.2[15]設(shè)(U,A,F)是信息系統(tǒng),則有以下結(jié)論:
(1)a是劃分核心當(dāng)且僅當(dāng)RA-{a}?Ra不成立。
(2)a是劃分不必要屬性或者劃分相對(duì)必要屬性當(dāng)且僅當(dāng)RA-{a}?Ra成立。
根據(jù)定義1.3、定義1.4和定理1.1、定理1.2可以得到對(duì)象合成信息系統(tǒng)的協(xié)調(diào)集、不必要屬性、相對(duì)必要屬性與n個(gè)原子信息系統(tǒng)的屬性特征之間的關(guān)系。
定理1.3設(shè)(∪Ui,A,∪Fi)為信息系統(tǒng)(U1,A,F1),(U2,A,F2),…,(Un,A,Fn)的對(duì)象合成信息系統(tǒng),B?A。若B是(∪Ui,A,∪Fi)的一個(gè)約簡(jiǎn),則B分別是(U1,A,F1),(U2,A,F2),…,(Un,A,Fn)的協(xié)調(diào)集。
同理可證,B分別是(U2,A,F2),…,(Un,A,Fn)的協(xié)調(diào)集。
定理1.4設(shè)(∪Ui,A,∪Fi)為信息系統(tǒng)(U1,A,F1),(U2,A,F2),…,(Un,A,Fn)的對(duì)象合成信息系統(tǒng),a∈A。若a是(∪Ui,A,∪Fi)的不必要屬性,則a分別是(U1,A,F1),(U2,A,F2),…,(Un,A,Fn)的不必要屬性。
同理可證,a分別是(U2,A,F2),……,(Un,A,Fn)的不必要屬性。
定理1.5設(shè)(∪Ui,A,∪Fi)為信息系統(tǒng)(U1,A,F1),(U2,A,F2),…,(Un,A,Fn)的對(duì)象合成信息系統(tǒng),則(U1,A,F1),(U2,A,F2),…,(Un,A,Fn)的核心屬性一定是(∪Ui,A,∪Fi)的核心屬性。
同理可證,(U2,A,F2),…,(Un,A,Fn)的核心屬性是(∪Ui,A,∪Fi)的核心屬性。
例1.1通過例子驗(yàn)證定理1.3、定理1.4和定理1.5的結(jié)論。
設(shè)(U1,A,F1),(U2,A,F2),(U3,A,F3)是三個(gè)信息系統(tǒng),表1是它們的對(duì)象合成信息系統(tǒng)(U1∪U2∪U3,A,F1∪F2∪F3),其中A={a,b,c},U1={x1,x2,x3},U2={x4,x5,x6,x7},
U3={x8,x9,x10,x11,x12}。
由劃分的定義可得對(duì)象合成信息系統(tǒng)(U1∪U2∪U3,A,F1∪F2∪F3)的等價(jià)類為{x1,x9,x11},{x2,x3,x8},{x4,x6},{x5,x7,x10},{x12}。
根據(jù)辨識(shí)矩陣,容易得出{a,c}是(U1∪U2∪U3,A,F1∪F2∪F3)的一個(gè)約簡(jiǎn),則由定理1.3知,{a,c}分別是(U1,A,F1),(U2,A,F2)和(U3,A,F3)的協(xié)調(diào)集;容易驗(yàn)證是(U1∪U2∪U3,A,F1∪F2∪F3)的不必要屬性,則由定理1.4知,分別是(U1,A,F1),(U2,A,F2)和(U3,A,F3)的不必要屬性;容易驗(yàn)證{c}是(U1,A,F1)的核心屬性,由定理1.5知{c}是(U1,A,F1),(U2,A,F2),(U3,A,F3)的核心屬性。
Ai∩Aj=?,i≠j。
定 理2.1設(shè)(U,∪Ai,∪Fi)為系統(tǒng)(U,A1,F1),(U,A2,F2),…,(U,An,Fn)的屬性合成系統(tǒng),對(duì)于任意的Bi?Ai,若Bi是(U,Ai,Fi)的一個(gè)約簡(jiǎn),則∪Bi是(U,∪Ai,∪Fi)的協(xié)調(diào)集。
表1 對(duì)象合成信息系統(tǒng)
證 明:設(shè)?(x,y)∈RB1∪B2∪…∪Bn,若RB1∪B2∪…∪Bn=∩RBi則(x,y)∈∩RBi。若∩RBi=∩RAi=RA1∪A2∪…∪An則(x,y)∈RA1∪A2∪…∪An,即RB1∪B2∪…∪Bn?RA1∪A2∪…∪An。另一方面,RA1∪A2∪…∪An?RB1∪B2∪…∪Bn。因此,RA1∪A2∪…∪An=RB1∪B2∪…∪Bn,即∪Bi是(U,∪Ai,∪Fi)的協(xié)調(diào)集。
定理2.2設(shè)(U,∪Ai,∪Fi)為信息系統(tǒng)(U,A1,F1),(U,A2,F2),…,(U,An,Fn)的屬性合成信息系統(tǒng),則(U,A1,F1),(U,A2,F2),…,(U,An,Fn)的不必要屬性一定是(U,∪Ai,∪Fi)的不必要屬性。
證 明:設(shè)a∈A1是(U,A1,F1)的不必要屬性,則由定理1.2可知RA1-{a}?R{a}。若RA1∪A2∪…∪An-{a}?RA1-{a},則RA1∪A2∪…∪An-{a}?R{a},所以a是(U,∪Ai,∪Fi)的不必要屬性。
同理,(U,A2,F2),…,(U,An,Fn)的不必要屬性一定是(U,∪Ai,∪Fi)的不必要屬性。
定理2.3設(shè)(U,∪Ai,∪Fi)為信息系統(tǒng)(U,A1,F1),(U,A2,F2),…,(U,An,Fn)的屬性合成信息系統(tǒng),a∈∪Ai。若a是(U,∪Ai,∪Fi)的核心屬性,則當(dāng)a∈Ai時(shí),a是(U,Ai,Fi)的核心屬性。
證 明:設(shè)a∈Ai是(U,∪Ai,∪Fi)的核心屬性,則由定理1.2可知RA1∪A2∪…∪An-{a}?R{a},即?x,y∈U,滿足(x,y)∈RA1∪A2∪…∪An-{a},(x,y)?R{a}。又因?yàn)镽A1∪A2∪…∪An-{a}?RAi-{a},故(x,y)∈RAi-{a},即RAi-{a}?R{a}。因此,a是(U,Ai,Fi)的核心屬性。
目前關(guān)于知識(shí)系統(tǒng)合成的研究都是基于兩個(gè)信息系統(tǒng)的合成,而在實(shí)際問題中并不僅僅只有兩個(gè)子系統(tǒng)的合成與分解,信息系統(tǒng)中又會(huì)存在大量的冗余數(shù)據(jù),因此研究有限多個(gè)信息系統(tǒng)的合成以及其屬性特征是有必要的。文中給出了任意有限個(gè)對(duì)象合成信息系統(tǒng)和有限個(gè)屬性合成信息系統(tǒng)的概念,分別討論了它們的核心屬性、不必要屬性、相對(duì)必要屬性等屬性特征與有限個(gè)原子信息系統(tǒng)的屬性特征之間的關(guān)系。并通過實(shí)例驗(yàn)證了該方法的有效性,為今后進(jìn)一步研究合成信息系統(tǒng)與有限個(gè)子信息系統(tǒng)的屬性約簡(jiǎn)問題奠定了基礎(chǔ)。