劉克明(國家新聞出版廣電總局724臺,陜西寶雞 722400)
數(shù)據(jù)挖掘技術(shù)在設(shè)備預防性維護中的應用探討
劉克明(國家新聞出版廣電總局724臺,陜西寶雞 722400)
數(shù)據(jù)挖掘技術(shù)理念,對大功率中短波發(fā)射機的科學維護、規(guī)范運行具有非常廣闊的應用前景和現(xiàn)實意義。
數(shù)據(jù)挖掘 發(fā)射機 運行 維護
隨著西新工程多年的建設(shè),我國以100KWPSM、150KWPSM、500KWPSM和DX為主的四種大功率中短波發(fā)射機的廣播機型全面普及,經(jīng)過多年的運行和維護,取得了大量的維護經(jīng)驗,各維護單位也十分重視維護經(jīng)驗的積累和交流,切實的提高了設(shè)備的維護水平和發(fā)射機運行穩(wěn)定性,但是傳統(tǒng)的維護水平已經(jīng)進入一個相對較高的穩(wěn)定的平臺期,以往的單純依靠經(jīng)驗積累的傳統(tǒng)維護方法,短期內(nèi)難以再有明顯的提高,但是我們卻忽視了一些對我們很有價值的東西,這就是我們在日常維護和設(shè)備運行中積累的大量的數(shù)據(jù),隨著近年來大規(guī)模的信息化建設(shè),播音設(shè)備全面的計算機化、網(wǎng)絡(luò)化,很多維護單位已經(jīng)積累了數(shù)以TB計的設(shè)備運行和維護的數(shù)據(jù),但是擁有大量的數(shù)據(jù)與擁有許多有用的知識完全是兩回事,這些數(shù)據(jù)除過極少量的部分被工作人員拿來進行維護管理參考外,大多數(shù)都被擱置或沉睡在數(shù)據(jù)庫中,沒有發(fā)揮出應有的效益,如何有效的發(fā)現(xiàn)這些數(shù)據(jù)的價值呢?數(shù)據(jù)挖掘技術(shù)無疑給我們指出了一條道路,特別是對我們的預防性維護工作有很好的指導和借鑒意義,下面我們就來對數(shù)據(jù)挖掘技術(shù)理念在預防性維護中的應用作一探討。
數(shù)據(jù)挖掘就是從大量的數(shù)據(jù)中挖掘出有用的信息,即從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數(shù)據(jù)中發(fā)現(xiàn)隱含的、規(guī)律性的、人們事先未知的,但又是潛在有用的并且最終可理解的信息和知識的非平凡過程。這個定義包括好幾層含義:數(shù)據(jù)源必須是真實的、大量的、含噪聲的;發(fā)現(xiàn)的是用戶感興趣的知識;發(fā)現(xiàn)的知識要可接受、可理解、可運用;并不要求發(fā)現(xiàn)放之四海皆準的知識,僅支持特定的發(fā)現(xiàn)問題。原始數(shù)據(jù)可以是結(jié)構(gòu)化的,如關(guān)系數(shù)據(jù)庫中的數(shù)據(jù);也可以是半結(jié)構(gòu)化的,如文本、圖形和圖像數(shù)據(jù);甚至是分布在網(wǎng)絡(luò)上的異構(gòu)型數(shù)據(jù)。發(fā)現(xiàn)知識的方法可以是數(shù)學的,也可以是非數(shù)學的;可以是演繹的,也可以是歸納的。發(fā)現(xiàn)的知識可以被用于信息管理,查詢優(yōu)化,決策支持和過程控制等,還可以用于數(shù)據(jù)自身的維護。因此,數(shù)據(jù)挖掘是一門交叉學科,它把人們對數(shù)據(jù)的應用從低層次的簡單查詢,提升到從數(shù)據(jù)中挖掘知識,提供決策支持。這里所說的知識發(fā)現(xiàn),不是要求發(fā)現(xiàn)放之四海而皆準的真理,也不是要去發(fā)現(xiàn)嶄新的自然科學定理和純數(shù)學公式,更不是什么機器定理證明。實際上,所有發(fā)現(xiàn)的知識都是相對的,是有特定前提和約束條件,面向特定領(lǐng)域的,同時還要能夠易于被用戶理解。最好能用自然語言表達所發(fā)現(xiàn)的結(jié)果,把先進的數(shù)據(jù)挖掘技術(shù)理念引入到大功率發(fā)射設(shè)備的運行和維護中,為設(shè)備維護和管理人員提供有價值的潛在信息,這樣就能更好的保證設(shè)備的運行質(zhì)量。無疑對我們提高設(shè)備運維的科學化、系統(tǒng)化有著非凡的意義。
數(shù)據(jù)挖掘的處理對象是大量的數(shù)據(jù),這些數(shù)據(jù)一般存儲在數(shù)據(jù)庫系統(tǒng)中,是長期積累的結(jié)果。但往往不合適直接在這些數(shù)據(jù)上進行知識挖掘,需要做一些準備工作,也就數(shù)據(jù)的預處理。數(shù)據(jù)預處理包括數(shù)據(jù)的選擇(選擇相關(guān)數(shù)據(jù))、凈化(消除噪音、冗余數(shù)據(jù))、推測(推算缺值數(shù)據(jù))、轉(zhuǎn)換(離散型數(shù)據(jù)與連續(xù)型數(shù)據(jù)之間的轉(zhuǎn)換)、數(shù)據(jù)縮減(減少數(shù)據(jù)量)等。
數(shù)據(jù)挖掘的過程可能需要多次的循環(huán)反復,每一個步驟一旦與預期目標不符,都要回到前面的步驟,重新調(diào)整,重新執(zhí)行。數(shù)據(jù)挖掘是一個多領(lǐng)域技術(shù)人員合作的過程,也是一個在資金上和技術(shù)上高投入的過程,但我們可以在日常的設(shè)備運行和維護中借鑒數(shù)據(jù)挖掘的理念,在反復過程中,不斷地趨近事物的本質(zhì),不斷地優(yōu)化問題的解決方案。
數(shù)據(jù)挖掘非常清晰的界定了它所能解決的幾類問題,數(shù)據(jù)挖掘的應用就是把這幾類問題演繹的一個過程。
分類問題屬于預測性的問題,但是它跟普通預測問題的區(qū)別在于其預測的結(jié)果是類別而不是一個具體的值。例如:發(fā)射機倒頻時發(fā)生故障,一般判斷可能為調(diào)諧類故障,那么這個問題就屬于分類問題;但是如果根據(jù)各種信息直接判斷為調(diào)諧電容擊穿,那么這個問題就屬于后面要說到的預測問題。調(diào)諧類故障我們一般認為主要在倒頻時發(fā)生,不會馬上造成直接性的停播,分類問題在故障處理中有著重要的意義,根據(jù)基本現(xiàn)象作出預測性的判斷,在故障處理中起著方向性的作用。
聚類問題不屬于預測性的問題,它主要解決的是把一組數(shù)據(jù)劃分幾個分組的問題。劃分的依據(jù)是聚類問題的核心,也就是分類條件、屬性。聚類的問題很容易與分類的問題混淆,但分類問題與聚類問題是有本質(zhì)區(qū)別的:分類問題是預測一個未知類別的數(shù)據(jù)于哪個類別,而聚類問題是根據(jù)選定的條件,對一組數(shù)據(jù)進行劃分,它不屬于預測問題。聚類問題在我們?nèi)粘>S護工作中也是一個非常常見的的問題,例如根據(jù)發(fā)射機的幾大系統(tǒng)構(gòu)成進行的故障分類,不同系統(tǒng)的故障均有可能造成設(shè)備停機,但故障原因歸屬的系統(tǒng)不同就應該劃歸不同的系統(tǒng)故障分類,如一樣是高末調(diào)諧電容引起的故障,如果是電容擊穿打火我們就應該將故障劃歸為射頻系統(tǒng)類故障,但如果是調(diào)諧電容抱死造成調(diào)諧不到位則應劃歸為調(diào)諧類故障,需要選擇若干個明確區(qū)分條件對已有的數(shù)據(jù)進行劃分:條件一致的數(shù)據(jù)聚為一類,不同的數(shù)據(jù)分屬于不同的類。聚類的方法層出不窮,比較直觀的就是依據(jù)積累的經(jīng)驗和已知問題、條件進行分類,這些方法也是我們?nèi)粘9ぷ髦凶畛J褂玫姆椒?而依據(jù)數(shù)據(jù)挖掘理論,運用數(shù)學方法對隱含其中的知識進行挖掘才是我們更加需要探索的方向。
說起關(guān)聯(lián)問題,最典型應該是大家都知道的沃爾瑪超市“啤酒和尿布”的故事,這個典型的案例給了我們一個啟示:世界上的萬事萬物都有著千絲萬縷的聯(lián)系,尋找和發(fā)現(xiàn)這種關(guān)聯(lián),可以給我們帶來一些意想不到的收獲。
關(guān)聯(lián)分析要解決的主要問題是:一組數(shù)據(jù)發(fā)生后,哪些數(shù)據(jù)必然同時發(fā)生或發(fā)生幾率比較高?例如:我們常見的DF100型PSM短波發(fā)射機,1PS6R33燒毀故障,一般均伴隨著1A9的濾波電容的擊穿,細心的維護人員從這種多次出現(xiàn)的伴生現(xiàn)象,分析電路,得出結(jié)論,原來1A9的濾波電容才是這個故障的“元兇”?,F(xiàn)在我們從原因看結(jié)果視乎覺得一切都理所應當,邏輯明晰,但這個故障更大的價值不在于故障本身,而是發(fā)現(xiàn)這個故障的過程給我的啟迪,從數(shù)據(jù)挖掘的視角看,這就是典型的數(shù)據(jù)關(guān)聯(lián)的問題,我們因為多次的關(guān)聯(lián)找到了故障的根本原因。所以說在研究問題的過程中,分析的重點就是所有數(shù)據(jù)之間關(guān)聯(lián)性。
此處說的預測問題指的是狹義的預測,并不包含前面闡述的分類問題,因為分類問題也屬于預測。一般來說我們談預測問題主要指預測變量的取值為連續(xù)數(shù)值型的情況。例如:估計下一年度的播音量、預測下一年度的備件需求、規(guī)劃調(diào)整檢修周期等等,預測問題的解決更多的是采用統(tǒng)計學的方法。
數(shù)據(jù)挖掘技術(shù)是一項龐大的應用工程,也是一項新興學科,很多行業(yè)也均在積極的嘗試階段,在過去,我們常用的知識獲取方法是由有經(jīng)驗的維護人員把積累的經(jīng)驗和知識經(jīng)過分析、篩選、比較、綜合、再提取出知識和規(guī)則。然而,由于維護人員本身所擁有知識的局限性,所以很多時候就難以收到理想的結(jié)果。但借鑒數(shù)據(jù)挖掘技術(shù)的理念可以給我很大的幫助,對大功率中短波發(fā)射機的科學維護、規(guī)范運行具有非常廣闊的應用前景和現(xiàn)實意義。