韋偉 胡亮 王偉偉 張玉
摘 ?要:在自動化技術(shù)愈發(fā)成熟的背景下,卷煙工業(yè)設備功能復雜、精確度提高、設備之間的關(guān)聯(lián)性增強,目前對設備的風險健康狀態(tài)評估僅停留在計劃性維修,難以保證設備的可靠性水平。文章結(jié)合煙廠設備的實際情況,從設備運行積累的大量數(shù)據(jù)進行挖掘,利用Apriori算法找出與工藝指標存在關(guān)聯(lián)關(guān)系的參數(shù),利用熵權(quán)法確定權(quán)重。建立設備綜合健康狀態(tài)評價模型,計算出綜合健康指數(shù)來判斷設備的健康情況。最后通過案例分析驗證了此方法的可用性,為設備維修保養(yǎng)的決策方案提供依據(jù)。
關(guān)鍵詞:卷煙工業(yè);健康狀態(tài)評價;Apriori算法;健康指數(shù)
中圖分類號:TP271 ? ?文獻標志碼:B
DOI:10.13714/j.cnki.1002-3100.2023.09.012
Abstract: In the context of increasingly mature automation technology, the function of cigarette industry equipment is complex, the accuracy is improved, and the correlation between equipment is also enhanced. At present, the risk health status assessment of equipment only stays in the planned maintenance, which is difficult to ensure the reliability level of equipment. In this paper, combined with the actual situation of tobacco factory equipment, a large amount of data accumulated from the operation of equipment is mined, and the Apriori algorithm is used to find out the parameters associated with process indicators, and the entropy weight method is used to determine the weight. The comprehensive health status evaluation model of equipment is established, and the comprehensive health index is calculated to judge the health status of equipment. Finally, the feasibility of this method is verified by case analysis, which provides a basis for the decision-making scheme of equipment maintenance.
Key words: cigarette industry; assessment of health status; Apriori algorithm; health index
0 ?引 ?言
隨著自動化技術(shù)在卷煙工業(yè)企業(yè)的廣泛應用,卷煙工廠在設備運行及產(chǎn)品生產(chǎn)過程中,積累了大量歷史數(shù)據(jù),在看似雜亂無章的數(shù)據(jù)中,卻記錄了設備真實的運行狀態(tài)。在此背景下,通過對相關(guān)數(shù)據(jù)進行深度研究和挖掘,開展設備健康風險的評價,以確保設備的安全高效運行。
設備健康度普遍用0到1的范圍來描述設備的健康狀態(tài),其中1代表設備十分健康,0表示設備處于故障狀態(tài)。目前有很多學者對設備的健康風險進行研究。韋偉等[1]通過卷煙廠設備管理的實際需求,構(gòu)建TOPSIS模型作為核心算法,引入熵權(quán)法確定權(quán)重來進行健康狀態(tài)的評價。楊帆等[2]提出一種基于最優(yōu)等級數(shù)的多位特征量開關(guān)柜健康狀態(tài)評價方法,解決了評價等級數(shù)的主觀設定問題。劉博元等[3]以系統(tǒng)運行的實時大數(shù)據(jù)為基礎,通過信息熵原理利用大數(shù)據(jù)分析的方法,對系統(tǒng)的健康度做出實時評估。袁偉中等[4]也有通過BP神經(jīng)網(wǎng)絡對設備參數(shù)進行回歸估計,獲得歷史數(shù)據(jù)和訓練數(shù)據(jù),構(gòu)建殘差與參數(shù)分數(shù)的映射關(guān)系,計算嚴重等級和工況運行等級。趙麗琴等[5]提出利用指數(shù)函數(shù)對各參數(shù)的權(quán)重動態(tài)變化進行研究,來更精確地評價設備的健康度。李鑫等[6]采用基于模糊無量綱處理和改進的層次分析法(AHP),結(jié)合綜合變權(quán)綜合原理對設備的健康狀態(tài)進行評估。
如今煙廠設備的健康評價指標與對應參數(shù)的關(guān)系是人工預設好固定的,沒有對新的數(shù)據(jù)采集系統(tǒng)中實時采集的1 000多個參數(shù)(大數(shù)據(jù)環(huán)境)進行一次挖掘,發(fā)現(xiàn)參數(shù)之間的關(guān)聯(lián)關(guān)系。通過TOPSIS法計算機平臺綜合評價得分的方法,僅靠最后得分來判斷設備健康狀態(tài)不夠嚴謹。本文通過研究每個關(guān)鍵參數(shù)與設備運行過程中設備的各種狀態(tài)的關(guān)聯(lián)性,通過Apriori算法挖掘參數(shù)之間的關(guān)聯(lián)關(guān)系,進而確定評價的參數(shù)指標。利用熵權(quán)法客觀地對參數(shù)權(quán)重進行確定。建立設備綜合健康狀態(tài)評價模型,對各指標數(shù)據(jù)進行綜合健康指數(shù)統(tǒng)計,得出設備的健康狀態(tài),為設備的保養(yǎng)、維修的決策方案提供建議。
1 ?基本理論
1.1 ?基于Apriori算法的關(guān)聯(lián)規(guī)則挖掘
Apriori算法步驟的核心是使用一種稱為逐層搜索的迭代方法,其中K項集用于探索項K+1項集[7]。關(guān)聯(lián)規(guī)則的挖掘是一個兩步的過程,即先找出所有的頻繁項集,再由頻繁項集產(chǎn)生強關(guān)聯(lián)規(guī)則。具體步驟如下:
第一步:通過掃描數(shù)據(jù)庫,收集滿足最小支持度的項,找出頻繁1項集的集合,該集合記為L。最小支持度的計算公式如下:
SupportA= ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?(1)
其中:A表示項集,D表示事務數(shù)據(jù)庫。
第二步:用L找出頻繁2項集的集合L,使用L找出L,如此下去,直到不能再找到頻繁K項集。每找出一個L需要一次數(shù)據(jù)庫的完整掃描。
第三步:由找出的頻繁項集產(chǎn)生強關(guān)聯(lián)規(guī)則。根據(jù)設定的置信度來判斷是否具有關(guān)聯(lián)規(guī)則,最小置信度的計算公式如下:
confidenceA∪B= ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (2)
第四步:根據(jù)最小置信度篩選出具有相關(guān)性的參數(shù),算法結(jié)束。
Apriori算法使用頻繁項集的先驗性質(zhì)來壓縮搜索空間,在大規(guī)模數(shù)據(jù)中尋找變量之間的有趣性關(guān)系,具體操程如圖1所示。
1.2 ?基于熵權(quán)法確定權(quán)重
熵權(quán)法的原理是從各項指標所提供信息量的大小不同而確定其目標權(quán)重的一種方法。這是一種客觀賦權(quán)法,其步驟主要如下:
(1)計算各二級指標對一級指標所占的比重,即第i個一級評價指標第j項指標占所有評價第j項指標之和的比重。
p= ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (3)
(2)計算第j項指標的熵值E:
E=-plnp ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (4)
其中:E>0, 若p=0時,則E=0。
(3)計算第j項指標的熵權(quán)W:
W= ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (5)
但在實際處理中,第j項指標差異越大,對評價的結(jié)果影響就越大,熵值則越小。因此,這里做進一步處理。得到的熵值之間確定其權(quán)重,計算公式為:
W=, 0≤W≤1 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?(6)
W=1 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?(7)
通過構(gòu)建上述模型可以得到各個指標的熵權(quán)W=w,w,…,w。
1.3 ?設備綜合健康狀態(tài)評價模型
健康指數(shù)是一種將設備健康程度進行量化的指標,通過全面分析設備運行中各指標數(shù)據(jù)的狀態(tài)信息和實際運作工況情況所得到的介于0和1之間的單一數(shù)值,其值越大表示設備的健康程度越高,1代表最優(yōu)狀態(tài),0代表處于完全失效[8]。健康指數(shù)的具體計算過程如下:
h= ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (8)
其中:h為設備特征參數(shù)x的健康指數(shù);x為實際測量值,x和x是該參數(shù)的最小和最大值;是指該參數(shù)的最優(yōu)值。
基于卷接機組多設備綜合健康指數(shù)HI的表達式如下:
HI=wρh ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?(9)
其中:HI為基于設備狀態(tài)的系統(tǒng)綜合健康指數(shù),HI∈0,1;w是熵權(quán)法獲得各參數(shù)的權(quán)重;ρ是各指標的權(quán)值,n是參數(shù)的個數(shù),m是指標數(shù)目。
根據(jù)卷煙工業(yè)的實際生產(chǎn)經(jīng)驗,建立設備系統(tǒng)健康指數(shù)與運行狀況評價等級之間的映射關(guān)系,對設備健康狀態(tài)劃分為4個等級,如表1所示。
2 ?模型計算應用實例
以某卷煙廠設備機組為例,機組中存在大量運行數(shù)據(jù),設備健康狀態(tài)的預估始終只能根據(jù)事后數(shù)據(jù)顯示,無法利用運行數(shù)據(jù)提前預知對設備的維護保養(yǎng)。且對設備的輪保無法做到合理化安排,使設備維護保養(yǎng)更加科學化和明細化。本文提出對設備即時的評價模型步驟主要有以下幾步:
首先從各系統(tǒng)中獲取大量的設備實時數(shù)據(jù),將它們存入格式化的表格中,再將這些大數(shù)據(jù)進行清洗和數(shù)據(jù)預處理,獲得篩選數(shù)據(jù)。利用這些數(shù)據(jù)進行Apriori算法來尋找哪些參數(shù)的變動對設定的指標之間存在同步的關(guān)系,從而確定評價指標;第二步是利用這些參數(shù)的標準值和閾值來對實時收集的參數(shù)進行健康度的計算;第三步是利用熵權(quán)法計算出評價指標的權(quán)重;最后利用健康度和權(quán)重對設備綜合健康狀態(tài)進行評估。具體流程如圖2所示:
2.1 ?評級指標的挖掘
設備系統(tǒng)中每2秒采集一次數(shù)據(jù),且設置有1 000多個傳感器,且數(shù)據(jù)量巨大,根據(jù)卷接機組設備采集的數(shù)據(jù)形式,無法直接使用Apriori算法進行運行,必須做一次數(shù)據(jù)處理。具體做法如下:
步驟1:去除重復值,得到數(shù)據(jù)表。
步驟2:將數(shù)據(jù)表轉(zhuǎn)化為稀疏矩陣。即每一個參數(shù)與本身上一個狀態(tài)相比,若改變了記為1,若沒有變動就記為0。
步驟3:對狀態(tài)性固定指標數(shù)據(jù)進行去除,即稀疏矩陣中全為0的列的參數(shù)。
步驟4:對累計變化量數(shù)據(jù)進行去除,即稀疏矩陣中全為1的列的參數(shù)。
固定其第一列,因數(shù)據(jù)巨大,僅展示部分數(shù)據(jù)預處理的結(jié)果,如表2所示。
利用Python語言編程對Apriori算法實現(xiàn),使用了Pycharm開發(fā)調(diào)試工具,在Windows10操作系統(tǒng)下進行運行。設置的置信度為80%,支持度為20%,根據(jù)控制變量法,每次只改變第一列數(shù)據(jù),觀察數(shù)據(jù)變化。以煙支空頭平均剔除率為例,如表3所示。
2.2 ?卷接機組設備評價計算結(jié)果
根據(jù)選擇出來的參數(shù),依據(jù)式(3)至式(7)計算出各參數(shù)的權(quán)值,再根據(jù)式(8)對其參數(shù)的健康指數(shù)進行計算,具體的計算結(jié)果如表4所示。
由公式(9)計算得到卷接設備綜合健康指數(shù)值HI為0.660,可知該卷包設備運行狀態(tài)處于建議輪保狀態(tài)。
3 ?結(jié) ?論
通過對設備參數(shù)大數(shù)據(jù)的關(guān)聯(lián)關(guān)系挖掘,更好地發(fā)現(xiàn)參數(shù)之間的關(guān)系,不預先確定參數(shù)進行設備健康的評價,更具有一定的客觀性。建立了多特征參數(shù)健康狀態(tài)評價模型,將參數(shù)的波動情況集中到整體設備的健康狀態(tài)評價,并進行量化,進而判斷設備的健康情況。從而更接近做到事前維修保養(yǎng)。對設備的維護保養(yǎng)更加精細,更有利于提高生產(chǎn)效率。
參考文獻:
[1] 韋偉,戴文靜. 基于改進TOPSIS法的健康評價模型研究[J]. 設備管理與維修,2021(13):17-19.
[2] 楊帆,鄧一帆,李東東,等. 基于最優(yōu)等級數(shù)的多維特征量開關(guān)柜健康狀態(tài)評價方法[J]. 高電壓技術(shù),2020,46(11):3934-3942.
[3] 劉博元,王煥鋼,范文慧,等. 基于大數(shù)據(jù)的復雜生產(chǎn)線系統(tǒng)健康度實時評估方法[J]. 清華大學學報(自然科學版),2014,54(10):1377-1383.
[4] 袁偉中,沈利,鄭必君,等. 基于多維參數(shù)動態(tài)偏差的電廠設備健康評價方法[J]. 信息技術(shù)與信息化,2021(11):48-51.
[5] 趙麗琴,劉昶,易發(fā)勝. 基于動態(tài)權(quán)重的設備健康狀態(tài)評估方法[J]. 計算機系統(tǒng)應用,2020,29(9):198-204.
[6] 李鑫,劉瑩瑩,李贛華,等. 基于模糊變權(quán)原理的衛(wèi)星健康評估方法[J]. 系統(tǒng)工程與電子技術(shù),2014,36(3):476-480.
[7] 劉文雅,徐永能. 基于改進Apriori算法的地鐵故障關(guān)聯(lián)規(guī)則挖掘[J]. 兵器裝備工程學報,2021,42(12):210-215.
[8] 張彥如,耿夢曉. 基于健康指數(shù)的設備運行狀態(tài)評價與預測[J]. 合肥工業(yè)大學學報(自然科學版),2015,38(10):1318-1323.