戰(zhàn)希臣 楊睿英 郭 聚
(海軍航空大學(xué)航空基礎(chǔ)學(xué)院 煙臺 264001)
裝備是部隊執(zhí)行各項任務(wù)的基本物質(zhì)保證,其質(zhì)量情況與部隊作戰(zhàn)能力息息相關(guān)。影響裝備質(zhì)量的因素復(fù)雜多樣,其中基因要素對裝備質(zhì)量特性的形成具有決定性作用。質(zhì)量基因要素是指在裝備全壽命周期中,對裝備質(zhì)量產(chǎn)生決定性作用且具有一定遺傳特性的一系列關(guān)鍵指標[2]。在對裝備質(zhì)量進行跟蹤管理的過程中,只要掌握了質(zhì)量基因要素,也就掌握了裝備的整體質(zhì)量狀況。所以,在影響裝備質(zhì)量的眾多因素中篩選出質(zhì)量基因要素,是非常重要的。比如在某型裝備研制生產(chǎn)階段,可根據(jù)該裝備質(zhì)量特性形成的過程和特點,歸納出裝備質(zhì)量的影響因素集,并以之構(gòu)建質(zhì)量指標體系。在此基礎(chǔ)上,運用基于粗糙集屬性約簡的方法,可將該裝備研制生產(chǎn)階段的質(zhì)量基因要素指標篩選出來。
借鑒現(xiàn)代產(chǎn)品質(zhì)量管理分析理論,從某型裝備研制生產(chǎn)階段的質(zhì)量特性形成過程來看,其關(guān)鍵性影響因素為“5M1E”,即:人(Man)、機器設(shè)備(Ma?chine)、材料(Material)、測量(Measurement)、方法(Method)和環(huán)境(Environment)6 個方面[1]。結(jié)合“5M1E”理論與該裝備實際研制生產(chǎn)的特點,其質(zhì)量的影響因素可歸納為以下7個方面:人員因素、生產(chǎn)設(shè)備因素、產(chǎn)品原材料因素、技術(shù)工藝因素、環(huán)境因素、資金保障因素和質(zhì)量信息管理因素。通過在某軍工單位實地調(diào)研的情況,對以上質(zhì)量因素進行細化研究,可得到質(zhì)量指標因素的二級指標,從而構(gòu)建較為完整的裝備質(zhì)量指標體系,如圖1所示。
圖1 裝備研制生產(chǎn)階段質(zhì)量指標體系
1982年,波蘭的Z.Pawlak教授在現(xiàn)有關(guān)系理論以及集合論的基礎(chǔ)上,提出了粗糙集(Rough Set)的概念,用以處理難以精確計算以及不完整的數(shù)據(jù)。粗糙集以等價關(guān)系(不可分辨關(guān)系)將集合中的元素進行分類,并形成與其相對應(yīng)的劃分。同一劃分被稱為等價類,可用于信息的簡化[5]。
粗糙集基于等價關(guān)系,通過構(gòu)建信息表,利用可準確計算的近似集逼近待定的不精確集合。該集合的邊界區(qū)域為上、下近似集之差。通過等價關(guān)系可以精確描述上、下近似集,而邊界區(qū)域的模糊元素數(shù)目可以被計算出來。粗糙集理論的主要應(yīng)用有兩方面,一是對現(xiàn)有數(shù)據(jù)集合進行屬性約簡;二是分析分類規(guī)則[6]。本文主要是應(yīng)用粗糙集屬性約簡的方法對裝備質(zhì)量基因要素指標進行篩選。下面介紹關(guān)于粗糙集的幾個重要定義。
1)信息表
稱四元組S=(U,A,V,f)為信息表(也叫決策表)。其中U={x1,x2,…,xn}為非空有限集合(xn為對象),稱為論域;A為對象的屬性集合,分為條件屬性C和決策屬性D,A=C∪D,C∩D=φ;V=∪Va是屬性值的集合,Va表示屬性a∈A的屬性值值域;f:U×A→V是賦值函數(shù),用于給所有對象的屬性賦值,即a∈A,x∈U,fa(x)∈Va。
2)等價關(guān)系
對 于 ?a∈R,R?A,x∈U,y∈U,如 果 有fa(x)=fa(y)成立,稱對象x和y是對屬性R的等價關(guān)系(也稱不可分辨關(guān)系),也就是根據(jù)R中的屬性無法區(qū)分對象x和y。表示為
3)等價類與劃分
在U中,具有同樣的等價關(guān)系IND(R)的集合稱為等價類,有:
由此可知,正域POSR(X)為一定屬于集合X的對象組成的集合;負域NEGR(X)為一定不屬于集合X的對象組成的集合;邊界域BNDR(X)表示不能確定是否屬于集合X的對象組成的集合。
關(guān)于上近似、下近似、正域、負域、邊界域的關(guān)系如圖2所示。圖中,橢圓區(qū)域表示集合X,紅色區(qū)域為X的正域(下近似),灰色區(qū)域為X的負域,綠色區(qū)域為X的邊界域,紅色∪綠色區(qū)域為X的上近似。
圖2 近似集、正域、負域、邊界域示意圖
6)粗糙集
若R-(X)=R-(X),即BNDR(X)=φ,稱X為R的可定義集;若R-(X)≠R-(X),即BNDR(X)≠φ,稱X為R的粗糙集(也稱不可定義集)。
R-(X)是包含X的最大R可定義集,R-(X)是包含X的最小R可定義集,若X為粗糙集,則X只能通過R-(X)與R-(X)近似地描述。
7)約簡與核
信息表中的屬性可能存在冗余屬性,冗余屬性對信息表的分類能力沒有作用。屬性約簡也就是保持信息表分類能力不變的前提下,去除冗余屬性。
對信息表S=(U,A,V,f),如果B?A且有IND(B)=IND(A),則B為A的一個約簡,記為RED(A)。
屬性集A的所有約簡的交集稱為A的核,記為
8)相對約簡與相對核
設(shè)決策屬性D的劃分為U/D={E1,E2,…En},則條件屬性C相對于決策屬性D的正域為
若c∈C,且POS(C-{c})(D)=POSC(D) ,則 稱c是C中不必要的,即可約簡的;否則,稱c是C中不可約簡的。
若R?C,且R中所有元素都是必要的,如果有POSR(D)=POSC(D),則稱R是C中相對于D的約簡,記為REDD(C),所有這樣的約簡的交集稱為C相對于D的核,記為
約簡后的屬性集稱為屬性約簡集,信息表的屬性約簡集一般不唯一,約簡集中屬性個數(shù)最少的叫做最小約簡集。屬性約簡問題一般都是求最小約簡集,最小約簡集不一定唯一,可根據(jù)問題實際進行選擇。
基于粗糙集的指標信息篩選,也就是通過粗糙集理論的屬性約簡原理,通過約簡得出屬性集的最小約簡集,從而在最大限度保留原始信息量的前提下,去除冗余指標,達到將指標體系化繁為簡的目的,這也正是裝備質(zhì)量基因要素信息的本質(zhì)要求,所以對于裝備質(zhì)量基因要素信息的篩選可以采用基于粗糙集的屬性約簡方法。
篩選模型的基本步驟如下。
Step 1指標體系初建。根據(jù)指標體系建立的一般原則,結(jié)合問題對象特點,通過調(diào)研,仔細分析問題的影響因素集(屬性集),而后由大到小、由表及里地分層構(gòu)建指標體系。
Step 2數(shù)據(jù)離散化。通過實地調(diào)研、采集歷史數(shù)據(jù)或者專家打分等方法,收集指標的相應(yīng)數(shù)據(jù),并根據(jù)篩選模型的要求進行數(shù)據(jù)預(yù)處理。由于粗糙集方法不能處理連續(xù)屬性問題,所以需要將數(shù)據(jù)離散化。定量指標一般為連續(xù)型數(shù)據(jù),可采用等寬離散、等頻離散或者聚類等方法離散化(具體方法見文獻[6~8]);對于定性指標,可采用專家打分法直接得到離散化數(shù)據(jù)。
Step 3建立信息表。根據(jù)指標性質(zhì),區(qū)分條件屬性C和決策屬性D;根據(jù)采集的數(shù)據(jù)樣本份數(shù)確定論域U,而后構(gòu)建信息表。
Step 4屬性約簡。通過粗糙集屬性約簡理論去除冗余屬性(指標),得到最小約簡集,從而得到篩選后的指標體系。
Step 5指標檢驗。采用KW檢驗、F統(tǒng)計量檢驗等方法檢驗篩選后的指標是否符合預(yù)定的數(shù)據(jù)相關(guān)性要求。若不符合要求,則調(diào)整指標體系,返回Step 1;若符合要求,則指標信息篩選完成。篩選模型的流程如圖3所示。
圖3 指標信息篩選模型流程圖
對于某型裝備研制生產(chǎn)階段的質(zhì)量基因要素信息篩選問題,根據(jù)圖1中的質(zhì)量指標體系展開信息篩選,該指標體系由7個一級指標和25個二級指標構(gòu)成。質(zhì)量基因要素指標屬于一級指標,因此主要針對7個一級質(zhì)量指標收集數(shù)據(jù)。
為了準確收集某型裝備研制生產(chǎn)階段質(zhì)量指標信息,采取在某軍工單位實地調(diào)研以及邀請軍工單位和部分院校專家進行專家打分的方式,采集7個指標的相關(guān)數(shù)據(jù)。鑒于粗糙集理論對于離散化數(shù)據(jù)的要求,將各項指標參數(shù)劃分為4個等級,每個等級分別對應(yīng)1~4分,如表1所示。通過專家打分得到每個指標對應(yīng)的等級和分數(shù),作為信息表的離散化數(shù)據(jù)。收集15組樣本,并建立信息表,如表2所示。
表1 指標參數(shù)等級表
1)由表2可直接得到論域U,條件屬性C,決策屬性D:
表2 裝備質(zhì)量指標信息表
4)根據(jù)以上計算,可知C的核CORED(C)={c1,c2,c3,c4,c7},c5和c6是兩個不必要屬性,但不一定能同時約簡。下面計算同時去除c5和c6時C相對于D的正域:
POS(C-c5-c6)(D)=POSC(D),所以,c5和c6可以同時約簡。
所以,C的最小約簡為。經(jīng)過屬性約簡,環(huán)境條件因素c5和資金保障因素c6被篩除。
指標篩選完成后,可采用KW檢驗法進行檢驗以驗證篩選指標是否合理。
1)KW檢驗法
KW檢驗即Kruskal-Wallis檢驗,也稱為H檢驗。KW檢驗是一種秩和檢驗,根據(jù)所有數(shù)據(jù)從小到大排列,算出每個數(shù)據(jù)的秩并計算每組數(shù)據(jù)的秩和,然后根據(jù)下式計算KW值:
其中,Ni為每組的樣本個數(shù),Ri為每組的秩和。n為所有數(shù)據(jù)總數(shù),k為組數(shù)。如果樣本中存在結(jié)值(具有相同秩值的數(shù)據(jù)),則需要在KW值中加入校正系數(shù)C:
其中τj是第j個結(jié)值的個數(shù)。校正后的KW′值為
求出KW′值后,可通過查卡方檢驗表判斷每組數(shù)據(jù)間是否具有顯著性差異,從而驗證篩選指標是否合理。
2)用SPSS軟件進行篩選指標的KW檢驗
SPSS軟件是IBM設(shè)計的一款數(shù)據(jù)分析與計算軟件,具有實用高效便利的特點。本文使用SPSS Statistics 26版本進行篩選指標的KW檢驗。
在SPSS菜單欄“分析”中下拉菜單“非參數(shù)檢驗”、“舊對話框”、“K個相關(guān)樣本”中打開KW檢驗功能。分別輸入未篩選的7個指標數(shù)據(jù)和篩選后的5個指標數(shù)據(jù),相關(guān)檢驗結(jié)果如圖4、5所示。
圖4 篩選指標的KW檢驗結(jié)果
圖5 原指標的KW檢驗結(jié)果
由圖可知,篩選前7個指標的漸進顯著性為0.143,篩選后5個指標的漸進顯著性為0.101,篩選后的指標集的數(shù)據(jù)差異性變大了,說明數(shù)據(jù)的相對獨立性更好,信息載荷量更大。因此,篩選的指標是合理的。至此,將原質(zhì)量指標體系的7個質(zhì)量指標成功簡化為5個指標:人員因素、生產(chǎn)設(shè)備因素、產(chǎn)品原材料因素、技術(shù)工藝因素、質(zhì)量信息管理因素,此即某型裝備在研制生產(chǎn)階段的質(zhì)量基因要素。
在現(xiàn)階段裝備質(zhì)量管理中,要提高工作效率、更好地掌握裝備質(zhì)量動態(tài)情況,就勢必要在繁冗復(fù)雜的質(zhì)量指標因素中化繁為簡、提取要素。裝備質(zhì)量基因要素信息篩選工作正是基于此思路展開的。本文構(gòu)建的基于粗糙集理論的裝備質(zhì)量基因要素信息篩選模型,為裝備質(zhì)量信息的收集和提取提供了實用手段,并為后續(xù)的裝備質(zhì)量動態(tài)評估與跟蹤管理以及裝備質(zhì)量信息系統(tǒng)的構(gòu)建提供信息來源和數(shù)據(jù)支撐。