張仕學(xué)
( 畢節(jié)學(xué)院 數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院,貴州 畢節(jié) 551700 )
粗糙集理論是一種比較新的數(shù)學(xué)工具,能處理不確定、不完整、不精確和不一致的信息,從中發(fā)現(xiàn)隱含知識,揭示潛在規(guī)律。屬性約簡則是在保持信息庫分類能力不變的條件下,刪除其中不相關(guān)或不重要的知識。張仕學(xué)[1]、鄭濱[2]研究了屬性約簡算法及應(yīng)用。
混凝土具有能抵御化學(xué)侵蝕、磨損、氣候變化或任何其它破壞過程的能力,即當(dāng)混凝土在暴露的環(huán)境中,能耐久保持其形態(tài)質(zhì)量和使用功能,這稱為混凝土的耐久性。其中,抗凍性是混凝土的耐久性的一個重要方面?;炷恋目箖鲂允侵富炷猎嚰尚秃蠼?jīng)過標(biāo)準(zhǔn)養(yǎng)護(hù)或同條件養(yǎng)護(hù)后,在規(guī)定的凍融條件下保持強(qiáng)度和外觀完整性的能力。因此,研究混凝土的抗凍性對提高混凝土的耐久性有著積極的作用[3][4][5]。
根據(jù)粗糙集關(guān)于信息處理的理論,給出如下定義。
定義 1 設(shè)S=(U,A)是一個信息系統(tǒng),其中U={u1,u2,…,un}是有限非空集,稱為論域,U中的元素稱為屬性;對于每個a∈A,有一個映射a:U→a(U),且a(U)={a(u)|u∈U}稱為屬性a的值域。如果A=C∪D,C∩D=?,則稱信息系統(tǒng)(U,A)為一個決策表,其中C中的屬性稱為條件屬性,D中的屬性稱為決策屬性。
定義2 設(shè)S=(U,A,V,f)為一個信息系統(tǒng),|U|=n,則S的區(qū)分矩陣M是一個n×n矩陣,其任一元素a(x,y)={a∈A|f(x,a)≠f(y,a)},即矩陣元素a(x,y)是區(qū)別對象x和y的所有屬性的集合。
影響混凝土抗凍性的主要因素有外加濟(jì)、含氣量、骨料、水灰比和坍落度等。本文利用連續(xù)屬性粗糙離散化、屬性約簡、屬性值約簡算法以及其改進(jìn)算法,對混凝土的抗凍性進(jìn)行決策挖掘和分析。表1是某工程質(zhì)量檢測機(jī)構(gòu)對某個混凝土工程中的 16個檢測點(diǎn)中關(guān)于混凝土抗凍性的檢測結(jié)果。其中,條件屬性集為 C={c1,c2,c3,c4,c5},c1到c5依次為外加濟(jì)、含氣量、骨料、水灰比和坍落度,它們分別反映了混凝土五方面的物理性質(zhì)的檢驗(yàn)結(jié)果;最后一個屬性d是決策屬性,值為1表示抗凍,0表示不抗凍。
利用動態(tài)聚類的離散化算法[6]對決策表1進(jìn)行離散化(其中α取0.0001,β取0.2),得到粗糙離散化后的決策表,見表2。對混凝土抗凍決策表離散化結(jié)果(表2)進(jìn)行初步約簡,可得混凝土抗凍性決策表離散化并約簡的結(jié)果,見表3,其中c3是冗余屬性,被去掉了。
表1 混凝土抗凍性決策表
表2 混凝土抗凍性決策表自動聚類離散化結(jié)果表
表3 混凝土抗凍性決策表離散化并約簡的結(jié)果表
屬性約簡是整個數(shù)據(jù)挖掘中的重要環(huán)節(jié),現(xiàn)在用屬性約簡算法[7]對屬性決策表 1的離散化結(jié)果表3進(jìn)行屬性約簡。設(shè)決策表的區(qū)分矩陣為M,如圖1所示。
相對D核是區(qū)分矩陣中所有單個元素組成的集合,即,
對于區(qū)分矩陣M中的所有取值為非空的集合元素cij,建立相應(yīng)的析取邏輯表達(dá)式Lij如下:
合取范式L=L1.9∧L1.10∧…∧L8.16。
將L轉(zhuǎn)換為析取范式得:c1∨c2∨c4∨c5。
因此,決策表的相對約簡為REDC(D)= {c1,c2,c4,c5}。
圖1 決策表的區(qū)分矩陣M
屬性約簡只是在一定程度上去掉了決策信息系統(tǒng)中的冗余信息。為了得到更精確的決策規(guī)則,還需要進(jìn)一步對經(jīng)過屬性約簡后的決策表進(jìn)行屬性值約簡。
根據(jù)以上的屬性約簡結(jié)果REDC(D)={c1,c2,c4,c5},由于重復(fù)行之間存在冗余,因此重復(fù)行的數(shù)據(jù)可以去掉。去掉重復(fù)行后得到如表 4所示的混凝土抗凍性屬性約簡結(jié)果。
表4 混凝土抗凍性屬性約簡結(jié)果表
采用分辨矩陣的屬性值約簡算法:
第1步 首先根據(jù)表4構(gòu)造分辨矩陣M如下:
第2步 由分辨矩陣M可得表4的屬性約簡為{c1,c4,c5},因此,又可以去掉屬性 c2,可求得如下分辨矩陣M*:
第3步 根據(jù)分辨矩陣M*可算出屬性值約簡結(jié)果,如表5所示。
第4步 對表5再一次去掉其重復(fù)行,即得最終的屬性值約簡結(jié)果,如表6所示。
表6中的記錄即是混凝土抗凍性決策表經(jīng)過本文所介紹的基于粗糙集理論的數(shù)據(jù)挖掘方法所挖掘出來的決策規(guī)則。
由表1(混凝土抗凍性決策表)經(jīng)過連續(xù)屬性離散化、屬性約簡和屬性值約簡后得如表 6所示的挖掘結(jié)果。直觀即可看出,表1中的屬性c2(含氣量)與c3(骨料)在挖掘過程中被去掉了,說明這兩個屬性對于混凝土的抗凍性影響不大,是冗余的。而屬性c1(外加濟(jì))、c4(水灰比)和c5(坍落度)則是影響混凝土抗凍性的主要因素。這與實(shí)際檢測的結(jié)果基本相符,說明本文所討論的基于屬性約簡的混凝土抗凍性挖掘方法在混凝土的抗凍性挖掘中有一定的應(yīng)用價值。
[1] 張仕學(xué),丁曉明.基于粗糙集理論的軟件項(xiàng)目質(zhì)量管理研究[J].西南大學(xué)學(xué)報(自然科學(xué)版),2011,33(3):118-120.
[2] 鄭濱,金永興.基于屬性約簡的海事人為失誤致因分析[J].上海海事大學(xué)學(xué)報,2010,31(1):91-94.
[3] 劉成玉.影響混凝土抗凍性的主要因素及改善措施[J].珠江現(xiàn)代建設(shè),2009,4(2):13-16.
[4] 龐軍,孟祥禮,王明輝.淺談提高混凝土抗凍性的重要性[J].吉林交通科技,2008,(2):15-16.
[5] 溫寶山,王興庭,周明學(xué).水工混凝土抗凍性能影響因素研究[J].東北水利水電,2010,(1):56-58.
[6] 苗奪謙,李道國.粗糙集理論、算法與應(yīng)用[M].北京:清華大學(xué)出版社,2008:220-221,226-227.
[7] 張文修,吳偉志,梁吉業(yè),李德玉.粗糙集理論與方法[M].北京:科學(xué)出版社,2001:12-16.