李 季 孫 凱 白 文
(1.軍械工程學(xué)院 石家莊 050003)(2.63871部隊(duì) 華陰 714200)
?
復(fù)雜設(shè)備維修保障數(shù)據(jù)預(yù)處理技術(shù)研究*
李季1孫凱2白文2
(1.軍械工程學(xué)院石家莊050003)(2.63871部隊(duì)華陰714200)
摘要復(fù)雜設(shè)備維修保障數(shù)據(jù)的預(yù)處理是其正確性與準(zhǔn)確性的重要保證,決定著后續(xù)維修保障工作的質(zhì)量與效益。論文分析了復(fù)雜設(shè)備維修保障數(shù)據(jù)的應(yīng)用需求及特點(diǎn),對(duì)其預(yù)處理過(guò)程中的相關(guān)技術(shù)和方法進(jìn)行了歸納,并在此基礎(chǔ)上總結(jié)建立了維修保障數(shù)據(jù)預(yù)處理的基本流程,最后結(jié)合某設(shè)備維修性數(shù)據(jù)采用信息熵理論進(jìn)行了數(shù)據(jù)規(guī)約實(shí)例分析。
關(guān)鍵詞復(fù)雜設(shè)備; 維修保障; 數(shù)據(jù)清洗; 數(shù)據(jù)規(guī)約
Class NumberTP391
隨著設(shè)備復(fù)雜化程度的逐步提高,對(duì)于其維修保障工作提出了更高的要求,開(kāi)展維修保障決策所需數(shù)據(jù)的重要性也日益凸顯。復(fù)雜設(shè)備維修保障數(shù)據(jù)的正確性與準(zhǔn)確性決定著后續(xù)維修保障工作的質(zhì)量與效益,因此在開(kāi)展RMS分析、維修決策、保障資源規(guī)劃等各項(xiàng)維修保障工作之前必須要進(jìn)行所需基礎(chǔ)數(shù)據(jù)的預(yù)處理工作。
數(shù)據(jù)預(yù)處理相關(guān)理論與方法很多,在許多領(lǐng)域也進(jìn)行了應(yīng)用[1~2]。然而,在復(fù)雜設(shè)備的維修保障方面,目前并沒(méi)有與之適切的維修保障數(shù)據(jù)預(yù)處理流程規(guī)范以及相應(yīng)理論與技術(shù)方法的探索研究。因此,為了便于復(fù)雜設(shè)備維修保障工作的順利高效進(jìn)行,本文首先分析復(fù)雜設(shè)備維修保障數(shù)據(jù)的應(yīng)用需求及特點(diǎn),結(jié)合以上分析對(duì)其預(yù)處理過(guò)程中的相關(guān)技術(shù)和方法進(jìn)行歸納,并在此基礎(chǔ)上總結(jié)建立維修保障數(shù)據(jù)預(yù)處理的基本流程,最后基于上述研究成果開(kāi)展實(shí)例應(yīng)用分析。
作為資產(chǎn)管理的重要內(nèi)容之一,維修保障工作的好與壞決定著設(shè)備的完好率和生產(chǎn)率的高低,也影響著設(shè)備的綜合效能。現(xiàn)代設(shè)備維修保障科學(xué)化精確化的發(fā)展趨勢(shì),尤其是信息化技術(shù)與手段的成熟,使得維修保障數(shù)據(jù)所發(fā)揮的決策支持作用越來(lái)越大,其應(yīng)用需求也越來(lái)越廣泛。
2.1復(fù)雜設(shè)備維修保障數(shù)據(jù)的應(yīng)用需求
復(fù)雜設(shè)備維修保障數(shù)據(jù)的用途很廣,從不同的角度也可有不同的分類方式[3]。本文從設(shè)備使用過(guò)程中信息統(tǒng)計(jì)的角度,重點(diǎn)探討其故障規(guī)律、維修器材消耗規(guī)律、使用維修性分析等應(yīng)用需求問(wèn)題。
2.1.1設(shè)備故障規(guī)律
根據(jù)設(shè)備的使用信息、故障信息、技術(shù)狀態(tài)信息等,統(tǒng)計(jì)分析設(shè)備及其零部件的故障率、平均壽命等參數(shù),進(jìn)行故障原因分析,研究確定設(shè)備及其零部件的壽命分布規(guī)律。根據(jù)故障規(guī)律分析結(jié)果,評(píng)估設(shè)備維修方案的科學(xué)性和合理性。研究設(shè)備維修項(xiàng)目?jī)?yōu)化的內(nèi)容、程序、方法和模型,為優(yōu)化設(shè)備維修工作項(xiàng)目的類型、級(jí)別和間隔期提供技術(shù)支持。
2.1.2維修器材消耗規(guī)律
根據(jù)設(shè)備使用與維修中維修器材消耗品種、數(shù)量等數(shù)據(jù),統(tǒng)計(jì)分析設(shè)備使用過(guò)程中不同時(shí)間階段維修器材需求率、配套率等,研究維修器材消耗量分布規(guī)律。根據(jù)維修器材消耗規(guī)律分析結(jié)果,預(yù)測(cè)維修器材消耗品種和數(shù)量,制訂和修訂維修器材儲(chǔ)供標(biāo)準(zhǔn),優(yōu)化維修器材庫(kù)存,提高維修器材儲(chǔ)供決策的科學(xué)性和器材供應(yīng)保障的準(zhǔn)確性。
2.1.3使用維修性分析
根據(jù)設(shè)備的維修事件、維修工序、維修時(shí)間、維修人員、資源消耗等數(shù)據(jù),統(tǒng)計(jì)分析設(shè)備及其零部件的維修時(shí)間參數(shù)、維修工時(shí)參數(shù)、維修費(fèi)用參數(shù)等,研究確定設(shè)備及其零部件的維修時(shí)間分布規(guī)律。根據(jù)設(shè)備使用維修性分析結(jié)果,研究設(shè)備使用維修性評(píng)估目標(biāo)、評(píng)估參數(shù)體系、評(píng)估模型,為設(shè)備維修性改進(jìn)提供技術(shù)支持。
2.2維修保障數(shù)據(jù)的特點(diǎn)
復(fù)雜設(shè)備維修保障數(shù)據(jù)的特點(diǎn)影響數(shù)據(jù)預(yù)處理流程的確定以及相關(guān)分析技術(shù)的選擇,本文將復(fù)雜設(shè)備維修保障數(shù)據(jù)的特點(diǎn)歸納如下:
1) 多屬性并存
如2.1節(jié)所述,設(shè)備維修保障中存在故障規(guī)律、維修器材消耗規(guī)律、設(shè)備使用維修性分析等各種需求,在許多情況下同一數(shù)據(jù)是多種需求的綜合體現(xiàn),也可以發(fā)揮多方面的作用,兼具多種屬性。因此在設(shè)備維修保障方面,多屬性并存是需要考慮的問(wèn)題。
2) 單位量綱不一致
設(shè)備維修保障的模型中所需的參數(shù)眾多:時(shí)間、人力、費(fèi)用等,因此存在不同的單位。即使是相同的單位,量綱也存在不同,如時(shí)間參數(shù)有日歷時(shí)間:秒、天、年等,也有使用時(shí)間:行駛里程、運(yùn)轉(zhuǎn)次數(shù)等。在后續(xù)處理之前需要進(jìn)行單位量綱的一致化。
3) 多層次結(jié)構(gòu)
設(shè)備維修保障中數(shù)據(jù)針對(duì)的層次也存在不同,有對(duì)單個(gè)零部件,有對(duì)局部分系統(tǒng),也有對(duì)全系統(tǒng)等。低層次的數(shù)據(jù)是高層次數(shù)據(jù)的基礎(chǔ),高層次數(shù)據(jù)是低層次數(shù)據(jù)的融合,同一層次數(shù)據(jù)之間又存在相輔互補(bǔ)關(guān)系。
在數(shù)據(jù)采集過(guò)程中,會(huì)受到環(huán)境、使用情況等方面的影響,導(dǎo)致所采集的數(shù)據(jù)并不能直接作為一個(gè)理想樣本來(lái)處理,尤其是現(xiàn)場(chǎng)數(shù)據(jù),因此在對(duì)其進(jìn)行正式分析與應(yīng)用之前,必須采取相應(yīng)的手段進(jìn)行預(yù)處理,以提高數(shù)據(jù)源的正確性與準(zhǔn)確性。通常來(lái)說(shuō),數(shù)據(jù)完成收集后,需要進(jìn)行規(guī)格化、清洗、規(guī)約等處理,才可作為有效的數(shù)據(jù)源[4],如圖1所示。
圖1數(shù)據(jù)預(yù)處理一般流程
3.1維修保障數(shù)據(jù)的收集
信息的采集是進(jìn)行信息分析的基礎(chǔ),在維修保障工作中會(huì)產(chǎn)生描述產(chǎn)品可靠性和維修性水平及其質(zhì)量狀況的各種數(shù)據(jù)[5],復(fù)雜設(shè)備維修保障數(shù)據(jù)的來(lái)源主要有:
1) 設(shè)備基本信息
設(shè)備(系統(tǒng))在出廠之時(shí)都附帶有設(shè)備的使用說(shuō)明書,其中就包括設(shè)備的基本信息:設(shè)備的性能參數(shù)、設(shè)備的兼容性、設(shè)備附件的使用等。
2) 設(shè)備故障信息
設(shè)備發(fā)生故障都是由維修人員進(jìn)行保障,在此期間維修人員會(huì)對(duì)設(shè)備故障的信息進(jìn)行統(tǒng)計(jì),如設(shè)備故障率、設(shè)備零件更換次數(shù)、設(shè)備部件實(shí)際使用壽命等。
3) 設(shè)備維修信息
維修保障人員在維修過(guò)后會(huì)對(duì)設(shè)備使用的情況進(jìn)行統(tǒng)計(jì),如設(shè)備報(bào)廢前維修次數(shù)、維修費(fèi)用、維修周期等。
3.2維修保障數(shù)據(jù)的規(guī)格化
設(shè)備維修保障模型屬性較多,尤其是不同采集人員極易導(dǎo)致數(shù)據(jù)的格式、單位量綱等存在混亂,因此需要數(shù)據(jù)規(guī)格化。數(shù)據(jù)規(guī)格化主要有以下兩種:
1) 數(shù)字格式規(guī)格化
當(dāng)在數(shù)據(jù)源中數(shù)據(jù)存在不一致格式時(shí)應(yīng)用多種格式函數(shù)、變換函數(shù)、標(biāo)準(zhǔn)函數(shù)庫(kù)和匯總分解函數(shù)去實(shí)現(xiàn)數(shù)字格式的一致性。
2) 單位量綱規(guī)格化
統(tǒng)一采用單位無(wú)量綱化,默認(rèn)為國(guó)際標(biāo)準(zhǔn)的單位量綱,在數(shù)據(jù)源中進(jìn)行數(shù)據(jù)的轉(zhuǎn)換,如15min,無(wú)量綱化時(shí)應(yīng)該數(shù)據(jù)轉(zhuǎn)換為15/60,即0.25,此時(shí)默認(rèn)的單位應(yīng)該為國(guó)際單位小時(shí)(h)。
3.3維修保障數(shù)據(jù)的清洗
數(shù)據(jù)清洗的就是利用現(xiàn)有的技術(shù)手段和方法檢測(cè)出數(shù)據(jù)源中的“臟數(shù)據(jù)”,并將“臟數(shù)據(jù)”轉(zhuǎn)化為滿足數(shù)據(jù)使用者要求的數(shù)據(jù)[6~7]。結(jié)合設(shè)備維修保障數(shù)據(jù)的應(yīng)用與特點(diǎn),初始獲得的維修保障數(shù)據(jù)主要有以下幾種情況需要處理:
1) 含噪聲數(shù)據(jù)
從工程學(xué)的角度講,噪聲是一個(gè)測(cè)量變量中的隨機(jī)錯(cuò)誤或偏差,包括錯(cuò)誤的值或偏離期望的孤立點(diǎn)值。由于其會(huì)導(dǎo)致錯(cuò)誤的分析結(jié)果,因此需要通過(guò)數(shù)據(jù)清洗,去除空值數(shù)據(jù)、不一致數(shù)據(jù)以外的其他不準(zhǔn)確、不客觀數(shù)據(jù)。
2) 錯(cuò)誤數(shù)據(jù)
錯(cuò)誤數(shù)據(jù),即在數(shù)據(jù)源中與其他的數(shù)據(jù)有著明顯的差異,格式或形式等存在錯(cuò)誤。設(shè)備維修保障數(shù)據(jù)有不同的屬性,可采用不同屬性間的約束來(lái)檢測(cè)和修正錯(cuò)誤。在沒(méi)有有效的工具支撐的急迫情境下,也可以人工檢測(cè)與修正數(shù)據(jù)的錯(cuò)誤。
3) 重復(fù)數(shù)據(jù)
重復(fù)數(shù)據(jù)一般是由于在數(shù)據(jù)源中產(chǎn)生人為的失誤,在記錄過(guò)程中存在重復(fù)現(xiàn)象。此類數(shù)據(jù)可采用優(yōu)先隊(duì)列算法來(lái)處理,該算法幾乎不受數(shù)據(jù)規(guī)模的影響,能很好地適應(yīng)數(shù)據(jù)規(guī)模的變化。對(duì)于某條記錄存在多條重復(fù)記錄的情況,優(yōu)先隊(duì)列也有更好的適應(yīng)性。
4) 缺失數(shù)據(jù)
在數(shù)據(jù)收集的過(guò)程中或者一些其他偶然因素,使得數(shù)據(jù)源記錄不完整,不符合數(shù)據(jù)的規(guī)律性,就會(huì)導(dǎo)致缺失數(shù)據(jù)。目前對(duì)其處理多采用忽略缺失值,但該方法在記錄多個(gè)屬性存在缺失值或每個(gè)屬性缺失值的百分比變化很大時(shí)性能不是特別明顯。
3.4維修保障數(shù)據(jù)的規(guī)約
數(shù)據(jù)規(guī)約是對(duì)海量數(shù)據(jù)的壓縮和簡(jiǎn)約,形成小型的數(shù)據(jù)且不影響數(shù)據(jù)完整性。數(shù)據(jù)規(guī)約的主要目的是解決元組規(guī)約中屬性的提取以及屬性重要性排序,同時(shí)也解決屬性規(guī)約中的屬性離散化。
1) 數(shù)據(jù)的屬性離散化
屬性離散化通過(guò)將屬性值域劃分為區(qū)間,利用數(shù)據(jù)離散化技術(shù)來(lái)減少給定屬性值的個(gè)數(shù)[8]。此時(shí),區(qū)間的標(biāo)記可以替代實(shí)際的數(shù)據(jù)值,用少數(shù)區(qū)間標(biāo)記替換連續(xù)屬性的數(shù)值,從而減少和簡(jiǎn)化了原來(lái)的數(shù)據(jù)。
2) 屬性重要性排序
對(duì)數(shù)據(jù)屬性的重要性也要進(jìn)行排序,這是后續(xù)信息處理的必要準(zhǔn)備工作,常用理論依據(jù)有信息熵、粗糙集等[9~10]。之后進(jìn)一步實(shí)施屬性提取,包括人工甄別、小波變換、投影尋蹤、多維標(biāo)度等較為復(fù)雜的處理方式,在此不作詳細(xì)介紹。
將上述過(guò)程采用更為直觀形象的形式進(jìn)行描述,可得到維修保障數(shù)據(jù)預(yù)處理流程如圖2所示。
圖2 復(fù)雜設(shè)備維修保障數(shù)據(jù)預(yù)處理流程
為便于理解應(yīng)用,下面對(duì)某設(shè)備維修性數(shù)據(jù)進(jìn)行規(guī)約處理,采用信息熵理論,對(duì)其數(shù)據(jù)屬性重要度進(jìn)行排序,并利用Matlab進(jìn)行功能實(shí)現(xiàn)。
4.1基于信息熵的數(shù)據(jù)屬性重要度排序原理
按照信息熵理論,一個(gè)信息系統(tǒng)可表示為:S=(U,R,V,f)。其中,U為對(duì)象的非空有限集合,即論域;R為屬性的非空有限集合;V為屬性r的值域;f是一個(gè)信息函數(shù),指定U中各對(duì)象的屬性唯一值。
在粗糙集理論研究中,Duntsch等建立了知識(shí)與信息熵的關(guān)系,引入了信息熵和條件熵概念[11]。信息熵是信源總體的平均不確定性的量度。定義知識(shí){屬性集合}P的熵H(P)和知識(shí){屬性集合}Q相對(duì)于知識(shí){屬性集合}P的條件信息熵H(Q/P)為:
式中,P(xi)為P在論域U上的劃分X=(x1,x2,…,xn)上的概率。
P(xi)=|xi|/|U|
P(yj/xi)=|yj∩xi|/|xi|
其中,i=1,2,…,n;j=1,2,…,m。
這樣,就可以利用每個(gè)條件屬性對(duì)決策屬性的條件信息熵大小來(lái)判斷該條件屬性與決策屬性的影響程度。
4.2設(shè)備維修性數(shù)據(jù)規(guī)約實(shí)例分析
表1為某設(shè)備生產(chǎn)能力的各個(gè)屬性構(gòu)成以及所對(duì)應(yīng)的各屬性值,如可靠度、保障性、返修率等數(shù)據(jù)?;诰S修性的特點(diǎn),每個(gè)屬性值均用1和0來(lái)表示。具體含義為系統(tǒng)配套1表示配套齊全,0表示配套不齊;可靠度1表示可靠度高,0表示可靠度低;維修間隔期1表示維修間隔期長(zhǎng),0表示維修間隔期短;保障性1表示保障性好,0表示保障性差;零部件使用壽命1表示使用壽命長(zhǎng),0表示使用壽命短;返修率1表示返修率低,0表示返修率高;裝生產(chǎn)能力1表示生產(chǎn)能力好,0表示生產(chǎn)能力差。
表1 某設(shè)備生產(chǎn)能力屬性統(tǒng)計(jì)表
在Matlab軟件中依據(jù)表格數(shù)據(jù)形成txt文件,在命令窗口中輸入rsdav3命令啟動(dòng)程序界面,得出如圖3所示對(duì)話框[12]。在Browse按鈕讀入信息系統(tǒng)決策表,給出C屬性和D屬性所需列號(hào),則可以進(jìn)一步分析。單擊Redu進(jìn)行簡(jiǎn)約,結(jié)果將在Results欄目顯示。
圖3 粗糙集數(shù)據(jù)分析界面
圖3所表示的含義為:屬性2、3的重要度最高,即可靠度以及維修間隔期是影響設(shè)備生產(chǎn)能力的重要因素。
本文主要分析研究了復(fù)雜設(shè)備維修保障數(shù)據(jù)預(yù)處理的相關(guān)理論與技術(shù)方法,總結(jié)了維修保障數(shù)據(jù)預(yù)處理的基本流程,并結(jié)合實(shí)例數(shù)據(jù)進(jìn)行了應(yīng)用分析,為后續(xù)維修保障工作的順利與有效開(kāi)展奠定了基礎(chǔ)。由于復(fù)雜設(shè)備維修保障數(shù)據(jù)預(yù)處理是一項(xiàng)龐大的系統(tǒng)性、全局性工程,工作量大、涉及知識(shí)面廣,對(duì)于數(shù)據(jù)的預(yù)處理理論與技術(shù)在其中的應(yīng)用以及所構(gòu)建的流程框架,還需在今后進(jìn)一步深化和細(xì)化。
參 考 文 獻(xiàn)
[1] 劉云霞.數(shù)據(jù)預(yù)處理[M].廈門:廈門大學(xué)出版社,2011.
LIU Yunxia. Data Preprocessing[M]. Xiamen: Xiamen University Press,2011.
[2] 關(guān)大偉.數(shù)據(jù)挖掘中的數(shù)據(jù)預(yù)處理[D].長(zhǎng)春:吉林大學(xué)碩士學(xué)位論文,2006.
GUAN Dawei. Data Preparation for Data Ming[D]. Changchun: Master Degree Thesis of Jilin University,2006.
[3] 方幼林,楊冬青,等.數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)質(zhì)量控制研究[J].計(jì)算機(jī)工程與應(yīng)用,2003(13):1-4.
FANG Youlin, YANG Dongqing, et al. Data Quality Management in Data Warehouse[J]. Computer Engineering and Application,2003(13):1-4.
[4] 和春慧.數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)預(yù)處理的研究與算法實(shí)現(xiàn)[D].長(zhǎng)春:吉林大學(xué)碩士學(xué)位論文,2004.
HE Chunhui. The Research and Implementation of Algorithms on Data Preprocessing in DW[D]. Changchun: Master Degree Thesis of Jilin University,2004.
[5] 韓慶田,劉夢(mèng)年.軍用裝備現(xiàn)場(chǎng)數(shù)據(jù)收集應(yīng)注意的問(wèn)題[J].質(zhì)量與可靠性,2002(6):38-41.
HAN Qingtian, LIU Mengnian. The Problems in Field Data Collection of Military Equipment[J]. Quality and Reliability,2002(6):38-41.
[6] 田芳,劉震.數(shù)據(jù)倉(cāng)庫(kù)清洗技術(shù)討論[J].青海師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2005(4):50-53.
TIAN Fang, LIU Zhen. The Discussion about Data Cleansing of Data Warehouse[J]. Journal of Qinghai Normal University(Natural Science Edition),2005(4):50-53.
[7] 王武.數(shù)據(jù)清洗方法研究及工具設(shè)計(jì)[D].上海:上海交通大學(xué)碩士學(xué)位論文,2009.
WANG Wu. Research on Data Cleansing and Tool Designing[D]. Shanghai: Master Degree Thesis of Shanghai Jiaotong University,2009.
[8] 汪慶,張巍,劉鵬.連續(xù)特征離散化綜述[D].上海:上海財(cái)經(jīng)大學(xué)碩士學(xué)位論文,2004.
WANG Qing, ZHANG Wei, LIU Peng. Summary of Continuous Feature Discretization[D]. Shanghai: Master Degree Thesis of Shanghai University of Finance and Economics,2004.
[9] 劉菁,解大.基于粗糙集理論和信息融合的變電站故障診斷方法[J].繼電器,2007,35(6):5-9.
LIU Jing, JIE Da. Substation Fault Diagnosis Method Based on Rough Set Theory and Information Fusion[J]. Relay,2007,35(6):5-9.
[10] 謝春明,肖露欣,等.基于粗糙集和TS-ANN的柴油機(jī)故障診斷推理[J].計(jì)算機(jī)測(cè)量與控制,2013,21(1):54-56.
XIE Chunming, XIAO Luxin, et al. Research on Fault Diagnosis for Diesel Engine Based on Rough Set and TS-ANN[J]. Computer Measurement and Control,2013,21(1):54-56.
[11] 張文修,吳偉志.粗糙集理論與方法[D].北京:科學(xué)出版社,2001.ZHANG Wenxiu, WU Weizhi. The Theory and Method of Rough Set[D]. Beijing: Science Press,2001.
[12] 王琦,高軍鋒,常春藤.等.MATLAB基礎(chǔ)與應(yīng)用實(shí)例集粹[M].北京:人民郵電出版社,2007.
WANG Qi, GAO Junfeng, CHANG Chunteng, et al. The MATLAB Foundation and Application Study[M]. Beijing: People’s Posts and Telecommunications Press,2007.
收稿日期:2015年10月8日,修回日期:2015年11月27日
作者簡(jiǎn)介:李季,男,碩士研究生,講師,研究方向:裝備維修工程。孫凱,男,碩士,工程師,研究方向:裝備試驗(yàn)與鑒定。白文,男,碩士,工程師,研究方向:裝備試驗(yàn)數(shù)據(jù)分析。
中圖分類號(hào)TP391
DOI:10.3969/j.issn.1672-9722.2016.04.033
Maintenance Support Data Preprocessing Technology for Complex Devices
LI Ji1SUN Kai2BAI Wen2
(1. Ordnance Engineering College, Shijiazhuang050003)(2. No. 63871 Troops of PLA, Huayin714200)
AbstractThe preprocessing of maintenance support data for complex devices is an important guarantee of its correctness and accuracy, which also determines the quality and effectiveness of the subsequent maintenance support work. The application requirements and characteristics of complex equipment maintenance support data are analyzed, the related technologies and methods are summarized, and the basic process of data preprocessing is constructed. Finally, a numerical example is analyzed with the information entropy theory for data protocol.
Key Wordscomplex device, maintenance support, data cleaning, data protocol