馮琴榮,溫瑋華
(山西師范大學(xué)數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院 山西 臨汾 041004)
粗糙集理論是由Pawlak[1]于1982 年提出的,它是一種處理不一致、不完備和不精確信息的有效工具。近年來,粗糙集理論已被成功地應(yīng)用于諸多領(lǐng)域,如知識(shí)發(fā)現(xiàn)、數(shù)據(jù)挖掘及模式識(shí)別等。
Shannon[2]提出的信息熵是一種度量不確定性的重要工具,已被廣泛地應(yīng)用于許多領(lǐng)域。在粗糙集理論中,針對(duì)劃分情形,文獻(xiàn)[3-4]給出了粗糙集理論中主要概念與運(yùn)算的信息表示,研究了知識(shí)的粗糙性與信息熵之間的關(guān)系。文獻(xiàn)[5]研究了粗糙集理論的香農(nóng)熵度量和哈特萊熵度量,并給出了公理化性質(zhì)。文獻(xiàn)[6]利用信息熵的最小描述長度原則,提出了3 種模型選擇準(zhǔn)則,且定義了3 種條件熵來預(yù)測屬性重要性。文獻(xiàn)[7]研究了粗糙集和粗糙關(guān)系數(shù)據(jù)庫的粗糙熵度量。文獻(xiàn)[8]提出了一種基于信息增益互補(bǔ)的信息熵并驗(yàn)證了其合理性,并在此基礎(chǔ)上,引入了條件熵和互信息。文獻(xiàn)[9]從信息熵、粗糙熵和知識(shí)粒度角度研究了粗糙集理論的不確定性。文獻(xiàn)[10]研究了劃分情形的信息熵與補(bǔ)熵,并將其擴(kuò)展到覆蓋情形,雖然覆蓋情形下的熵是香農(nóng)熵的形式,但其不滿足單調(diào)性。目前,劃分情形的熵度量已得到了完善解決。
區(qū)間值信息系統(tǒng)作為單值信息系統(tǒng)的一種推廣,能很好地描述不精確的對(duì)象和保存數(shù)據(jù)的特征。在區(qū)間值信息系統(tǒng)中,基于區(qū)間值的相似度構(gòu)建相容關(guān)系,由相容關(guān)系產(chǎn)生的相容類構(gòu)成論域的覆蓋。關(guān)于該情形下的熵度量,文獻(xiàn)[11]研究了區(qū)間值和集值信息系統(tǒng)基于模糊偏序關(guān)系的模糊粗糙熵和模糊知識(shí)粒度,并研究了熵度量與粒度度量之間的關(guān)系。文獻(xiàn)[12]通過引入相似度的概念定義了基于相容關(guān)系的θ-相容類,并提出用θ-相似熵來度量區(qū)間值信息系統(tǒng)的不確定性。文獻(xiàn)[13]定義了α-弱相似關(guān)系,建立了基于α-弱相似關(guān)系的粗糙集模型,并給出不完備區(qū)間值信息系統(tǒng)的精度、粗糙度和近似精度,用以度量不完備區(qū)間值信息系統(tǒng)的不確定性。雖然學(xué)者們對(duì)區(qū)間值信息系統(tǒng)的不確定性度量進(jìn)行了研究,但仍缺少香農(nóng)熵形式的熵度量。鑒于此,本文給出了一種由覆蓋導(dǎo)出劃分的方法,并證明了覆蓋越細(xì),由其導(dǎo)出的劃分越細(xì),進(jìn)而構(gòu)造了區(qū)間值信息系統(tǒng)的信息熵與補(bǔ)熵,并且證明了它們的單調(diào)性和有界性。
區(qū)間值信息系統(tǒng)是單值信息系統(tǒng)的一種推廣形式,雖然學(xué)者們對(duì)其不確定性度量進(jìn)行了大量研究,但仍缺少香農(nóng)熵形式的熵度量。為此,本文給出了一種由覆蓋導(dǎo)出劃分的方法,并證明了覆蓋越細(xì),由其導(dǎo)出的劃分越細(xì),進(jìn)而用導(dǎo)出的劃分分別構(gòu)造了區(qū)間值信息系統(tǒng)的熵和補(bǔ)熵,并證明了其單調(diào)性和有界性。進(jìn)一步可以繼續(xù)研究區(qū)間值信息系統(tǒng)的聯(lián)合熵和條件熵及其它們的性質(zhì)。