黃建新, 許麗婷, 于佩秋, 李進(jìn)金,
(1. 華僑大學(xué) 數(shù)學(xué)科學(xué)學(xué)院, 福建 泉州 362021; 2. 閩南師范大學(xué) 數(shù)學(xué)與統(tǒng)計學(xué)院, 福建 漳州 363000)
Zakowski[1]在20世紀(jì)80年代提出的覆蓋粗糙集理論是Pawlak經(jīng)典粗糙集理論[2]的推廣,是知識發(fā)現(xiàn)、規(guī)則獲取領(lǐng)域強(qiáng)有力的數(shù)學(xué)工具.它不僅豐富了粗糙集理論,而且擴(kuò)展了粗糙集理論在實(shí)際問題中的應(yīng)用.覆蓋粗糙集和經(jīng)典粗糙集都旨在處理定性(離散)數(shù)據(jù),由于數(shù)據(jù)庫中屬性的值既可以是符號的,也可以是實(shí)值的[3],因此,在處理實(shí)值數(shù)據(jù)集時存在很大的局限性.然而,模糊集理論[4]對于克服這些局限性非常有用,因為它可以有效地處理模糊的概念和分級的不可分辨性.因此,學(xué)者們將覆蓋粗糙集模型擴(kuò)展為模糊覆蓋粗糙集.
許多學(xué)者基于模糊覆蓋概念構(gòu)建一些模糊粗糙集模型[5-8],可以看作是覆蓋粗糙集理論和模糊粗糙集理論的橋梁.在文獻(xiàn)[5,7]中模糊覆蓋的定義中β的值為1,具有一定局限性.Ma[9]通過引入模糊β-覆蓋和模糊β-鄰域的概念,定義更一般的模糊覆蓋粗糙集模型,其中,參數(shù)β的范圍為(0,1].Yang等[10]對模糊β-覆蓋近似空間的性質(zhì)和基于模糊覆蓋的粗糙集模型[9]進(jìn)行研究,提出3種基于模糊覆蓋的粗糙集模型作為模型的推廣.D′err等[11]將4種基于覆蓋的鄰域算子的定義擴(kuò)展到模糊集,并且將模糊鄰域算子與模糊覆蓋相結(jié)合,得到16個不同的模糊鄰域算子,并研究這16個算子之間的偏序關(guān)系.Yang等[12]通過引入鄰域系統(tǒng)、模糊β-最小和最大描述等概念,研究這些模糊鄰域算子的性質(zhì)及其相互關(guān)系,并構(gòu)造6種類型的模糊β-覆蓋.
知識約簡是知識發(fā)現(xiàn)的重要過程,是尋找最簡單規(guī)則和最大泛化規(guī)則的重要手段,因而也是粗糙集理論的核心內(nèi)容之一.知識庫中知識并不是同等重要的,甚至其中某些知識是冗余的,當(dāng)知識庫數(shù)據(jù)是隨機(jī)采集時,其冗余性更為普遍.冗余知識的存在一方面是資源的浪費(fèi)(需要儲存空間);另一方面,干擾人們作出正確而簡潔的決策.因此,知識約簡的概念被提出,即在保持知識庫分類能力不變的前提下,刪除不相關(guān)或不重要的知識.通過知識約簡,去掉不必要的知識,簡化知識的同時,又不丟失基本信息.
在覆蓋粗造集中,Wang等[13]提出IN-可約元及IN-約簡,使用矩陣方法計算最小和最大描述和覆蓋約簡.在模糊β-覆蓋近似空間中,Yang等[10]提出如果模糊β-覆蓋中的某一個元素可表示為其余某些元素的并集,則這個元素被稱為模糊β-覆蓋中的可約元的定義.Yang等[14]提出了模糊β-最小描述的定義,研究模糊β-最小描述的矩陣表示,并討論了模糊β-最小描述與約簡之間的聯(lián)系.但是在模糊β-覆蓋中對于交可約元及模糊β-最大描述與約簡之間的聯(lián)系沒有相關(guān)研究.因此,本文利用一種新的矩陣方法計算模糊β最小和最大描述,從而討論模糊β-最大描述與約簡之間的聯(lián)系.
實(shí)際上,文獻(xiàn)[5,7]中的模糊β-覆蓋的β=1是模糊β-覆蓋的特例.
為了簡化模糊β-最小和最大描述的定義,Yang等[12]給出x的β-鄰域系統(tǒng)的定義.
根據(jù)定義4,x∈U的模糊β-最小和最大描述分別表示為
Yang等[14]提出模糊β-最小描述的定義通過,研究模糊β-最小描述的矩陣表示.通過定義一些新的矩陣,從而給出一種新的模糊β-最小和最大描述的矩陣表示.
根據(jù)定義5,有
對于β=0.5時,根據(jù)定義7,有
根據(jù)定義6,9,可以得到模糊β-最小描述的矩陣表示.
根據(jù)定義6,10,可以得到模糊β-最大描述的矩陣表示.
證明:類似定理1可證明.
提出的模糊β-最小和最大描述的矩陣表示跟文獻(xiàn)[14]中的相比,計算步驟、利用到的矩陣較少.計算的方法簡潔明了且快速,提高計算效率.
根據(jù)定義5,可得
對于β=0.5時,根據(jù)定義7,有
根據(jù)定義9,10,x1的模糊β-最小和最大描述的矩陣表示為
由上述步驟,x2,x3,x4,x5的模糊β-最小和最大描述的矩陣分別表示為
由定理1,當(dāng)β=0.5時,模糊β-最小描述分別為
根據(jù)定理2,當(dāng)β=0.5時,模糊β-最大描述分別為
若模糊β-覆蓋中的某一個元素可以表示為其余某些元素的并集,則這個元素被稱為模糊β-覆蓋中的可約元[10].模糊β-覆蓋中的某一個元素可以表示為其余某些元素的交集的情況,即定義11.
定理4表明在模糊β-覆蓋中刪除交可約元不會生成任何新的交可約元,也不會使其他在原始模糊β-覆蓋中的交可約元成為新模糊β-覆蓋中的交不可約元.因此,可以通過同時刪除所有交可約元或逐步刪除可約元計算模糊β-覆蓋的約簡.
算法1計算模糊β-覆蓋的約簡
1: For i=1→n
2: C(xi)←0
3: For j=1→m
4: C(xi)←C(xi)∨Cj(xi)
5: End For
6: If C(xi)<β
β-覆蓋”
8: Break
9: End If
10: End For
12: For k=1→m,
13: T←?
14: For l=1→m
15: If Ck?Cl(k≠l)
16: T←T∩Cl
17: End If
18: End For
19: If T=Ck
21:End If
22:End For
Yang等[14]研究討論模糊β-最小描述與去除并可約元的約簡之間的聯(lián)系.定理5研究模糊β-覆蓋中去除交可約元的約簡與模糊β-最大描述之間的關(guān)系.
模糊β-覆蓋近似空間是模糊覆蓋的推廣,可以解決模糊覆蓋的局限性.模糊β-覆蓋近似空間是近年才提出的定義,對其研究具有一定意義.在模糊β-覆蓋近似空間中,許多基本問題與模糊β-最小和最大描述有關(guān).對于具有大基數(shù)的模糊β-覆蓋近似空間,使用集合表示解決關(guān)于模糊β-最小和最大描述的問題將是繁瑣而復(fù)雜的.因此,有必要通過矩陣表示,將計算變?yōu)樗惴?,并由計算機(jī)輕松實(shí)現(xiàn).