伍盛達(dá), 田宇
(工業(yè)和信息化部電子第五研究所, 廣東 廣州 511370)
預(yù)測(cè)性維護(hù)是指通過(guò)各種技術(shù)手段進(jìn)行數(shù)據(jù)和信號(hào)的采集、 分析, 同時(shí)結(jié)合設(shè)備運(yùn)行的壽命期統(tǒng)計(jì)規(guī)律或歷史數(shù)據(jù), 預(yù)測(cè)可能的后果, 提前采取有針對(duì)性的維護(hù)活動(dòng)[1]。 得益于無(wú)損檢測(cè)、 智能監(jiān)控和工業(yè)物聯(lián)網(wǎng)等技術(shù)的發(fā)展, 數(shù)據(jù)中心積累了大量的設(shè)備運(yùn)行參數(shù)、 環(huán)境參數(shù)等監(jiān)測(cè)指標(biāo), 為預(yù)測(cè)性維護(hù)提供了良好的基礎(chǔ)。
設(shè)備溫度是預(yù)測(cè)性維護(hù)中重點(diǎn)關(guān)注的指標(biāo)之一。 溫度異常經(jīng)常是通信機(jī)房設(shè)備存在隱患的前兆[2]。 紅外熱成像技術(shù)作為一種非接觸、 無(wú)損的溫度檢測(cè)手段, 如何應(yīng)用到數(shù)據(jù)中心預(yù)測(cè)性維護(hù)中, 值得我們探討。
應(yīng)用紅外熱成像技術(shù)的預(yù)測(cè)性維護(hù)流程圖如圖1 所示。 根據(jù)設(shè)備的使用壽命規(guī)律和歷史數(shù)據(jù)來(lái)制定預(yù)測(cè)性維護(hù)策略, 通過(guò)數(shù)據(jù)采集篩選, 最終形成歷史數(shù)據(jù)庫(kù)。 根據(jù)決策判斷方法及模型標(biāo)準(zhǔn), 結(jié)合歷史數(shù)據(jù)對(duì)采集結(jié)果進(jìn)行對(duì)比分析, 若出現(xiàn)異常值, 則進(jìn)行原因查找并修復(fù), 修復(fù)后進(jìn)行數(shù)據(jù)復(fù)測(cè)并重新錄入歷史數(shù)據(jù)庫(kù)進(jìn)行對(duì)比; 若無(wú)異常值, 當(dāng)次檢測(cè)完成, 根據(jù)檢測(cè)數(shù)據(jù)重新制定預(yù)測(cè)性維護(hù)策略。
圖1 應(yīng)用紅外熱成像技術(shù)的預(yù)測(cè)性維護(hù)流程圖
預(yù)測(cè)性維護(hù)策略包括維護(hù)范圍、 維護(hù)頻次和更新策略等。
根據(jù)紅外熱成像技術(shù)的特點(diǎn), 將維護(hù)范圍規(guī)定為電纜、 母排、 接線端子和斷路器等電氣元件。
在設(shè)備投入使用的早期, 其失效率較高, 隨著時(shí)間的延續(xù)呈逐步下降趨勢(shì)[3]。 這一時(shí)期被稱(chēng)為早期失效期。 因此, 在設(shè)備施工調(diào)試后正式投入使用前需進(jìn)行預(yù)測(cè)性維護(hù), 并且在額定滿負(fù)荷狀態(tài)下測(cè)量電氣元件的溫度并采集相關(guān)數(shù)據(jù)。 在設(shè)備投入使用的首年, 預(yù)測(cè)性維護(hù)頻率為每季度一次。 若一年內(nèi), 檢測(cè)數(shù)據(jù)符合要求且無(wú)明顯的變化, 則可判斷設(shè)備進(jìn)入恒定失效率期。 在此期間, 應(yīng)以半年一次的頻率檢測(cè)電氣元件的溫度。 當(dāng)設(shè)備運(yùn)行時(shí)間接近壽命限期或從數(shù)據(jù)分析中發(fā)現(xiàn)劣化趨勢(shì), 可判斷它已進(jìn)入耗損失效期, 預(yù)測(cè)性維護(hù)頻率應(yīng)加大到每季度一次。
對(duì)于超期使用的設(shè)備, 預(yù)測(cè)性維護(hù)頻率應(yīng)加大到每月一次, 若溫度指標(biāo)無(wú)異常, 經(jīng)維護(hù)審批部門(mén)對(duì)其維護(hù)成本、 更換成本和使用價(jià)值評(píng)估后可決定是否繼續(xù)使用。 對(duì)于溫度指標(biāo)異常的設(shè)備應(yīng)進(jìn)行修復(fù)或更換。
數(shù)據(jù)采集可通過(guò)在線監(jiān)測(cè)及離線檢測(cè)兩種手段完成。 檢測(cè)過(guò)程中, 要注意排除人體熱輻射、 陽(yáng)光、 運(yùn)行指示燈或熒光燈等干擾。 當(dāng)發(fā)現(xiàn)異常熱點(diǎn)時(shí), 應(yīng)確定紅外發(fā)射率已根據(jù)熱點(diǎn)位置的材料進(jìn)行合理設(shè)置, 并以不同的角度反復(fù)掃描, 排除外部熱反射引入的干擾。
數(shù)據(jù)采集完成后, 存入歷史數(shù)據(jù)庫(kù)進(jìn)行歸檔, 用于后續(xù)的判斷分析中。 歸檔數(shù)據(jù)應(yīng)包含采集日期、 被測(cè)元件位置、 電流、 環(huán)境溫度和熱像圖等信息。 必要時(shí)還可以添加更詳細(xì)的描述, 如設(shè)備(元件) 的額定電流、電流諧波、 紅外發(fā)射率和外部影響因素等內(nèi)容, 使分析的原材料更豐富和詳實(shí), 提高決策判斷的可信度。
決策判斷方法主要有3 種, 分別是表面溫度判斷法、 同類(lèi)比較法和歷史比較法。 判斷輸出結(jié)果有4 種情況, 分別為正常、 一般缺陷、 嚴(yán)重缺陷和緊急缺陷。 為了方便判斷分析, 下文提供了各種方法的數(shù)學(xué)模型, 并規(guī)定正常、 一般缺陷、 嚴(yán)重缺陷和緊急缺陷4 種情況分別對(duì)應(yīng)數(shù)字0、 1、 2 和3。
a) 表面溫度判斷法
將紅外熱成像儀測(cè)得的電氣元件表面溫度與溫度限值進(jìn)行比較判斷。 對(duì)于實(shí)際的運(yùn)行負(fù)荷電流為額定電流或接近額定電流時(shí), 判斷結(jié)果的可信度較高。 因此, 在早期失效期內(nèi)進(jìn)行滿載壓力檢測(cè)時(shí),優(yōu)先采用此方法進(jìn)行判斷。 表面溫度判斷法的模型如下:
式(1) 中: t——電氣元件最熱點(diǎn)的溫度;
T1, T2——溫度限值。
T1, T2的具體取值如表1 所示。
表1 T1、 T2 具體的取值表 [4]
b) 同類(lèi)比較法
在同一電氣回路中, 當(dāng)三相電流對(duì)稱(chēng)和三相(或兩相) 設(shè)備相同時(shí), 比較三相(或兩相) 電流致熱型設(shè)備對(duì)應(yīng)部位的溫升值, 判斷設(shè)備是否正常。 若三相設(shè)備同時(shí)出現(xiàn)異常, 可與同回路的同類(lèi)設(shè)備比較[5]。 此外, 還應(yīng)引入溫升限值作為判斷依據(jù)。 同類(lèi)比較法的模型如下:
式(2) 中: t——電氣元件最熱點(diǎn)的溫度;
δ——被測(cè)點(diǎn)與同類(lèi)點(diǎn)的相對(duì)溫差;
T1——溫度限值。
T1的具體取值如表2 所示。
表2 T1 的具體取值表
c) 歷史數(shù)據(jù)比較法
將紅外熱成像儀測(cè)得的電氣元件表面溫度與歷史數(shù)據(jù)進(jìn)行比較。 綜合分析負(fù)荷電流、 環(huán)境溫度、圖像特征和變化趨勢(shì)等因素, 得出判斷結(jié)果。 在歷史數(shù)據(jù)存量較少無(wú)法擬合趨勢(shì)線的情況下, 可僅與前次的數(shù)據(jù)進(jìn)行比較; 在兩次的負(fù)載電流及環(huán)境溫度相近時(shí), 其模型如下:
式(3) 中: δ——本次檢測(cè)值與上次檢測(cè)值的相對(duì)溫差。
數(shù)據(jù)中心中電氣元件的異常熱點(diǎn)以電流致熱型為主。 溫度異常原因有接觸不良, 電纜松股、 斷股、 老化和設(shè)計(jì)容量不足等, 可根據(jù)各種缺陷的典型熱像圖進(jìn)行分析。
根據(jù)缺陷的嚴(yán)重程度制定相應(yīng)的修復(fù)策略。 對(duì)于一般缺陷, 可利用停電維護(hù)的機(jī)會(huì), 有計(jì)劃地安排修復(fù)工作, 消除缺陷; 對(duì)于嚴(yán)重缺陷, 宜在一周內(nèi)進(jìn)行修復(fù); 對(duì)于緊急缺陷, 應(yīng)立即進(jìn)行修復(fù)。
以華南某大型數(shù)據(jù)中心為例做分析。
首先, 制定初次預(yù)測(cè)性維護(hù)策略。 規(guī)定本次預(yù)測(cè)性維護(hù)的范圍為變壓器出線柜、 ATS 柜、 饋線柜、 UPS 輸入柜、 輸出柜和動(dòng)力配電柜內(nèi)的電氣元件。 經(jīng)統(tǒng)計(jì), 設(shè)備已運(yùn)行8 年, 而交直流配電設(shè)備的平均壽命約15 年。 根據(jù)全生命周期失效率變化規(guī)律, 可知設(shè)備處于恒定失效率期。 預(yù)測(cè)性維護(hù)頻率為半年一次。
采集配電房溫度及流過(guò)各個(gè)電氣元件的電流參數(shù)及紅外熱成像儀的檢測(cè)結(jié)果存入歷史數(shù)據(jù)庫(kù)。 例如: 3-2UP6 B 相銅排存入以下要素, 如圖2 所示。
圖2 歷史數(shù)據(jù)要素
由于此次是初次預(yù)測(cè)性維護(hù), 缺乏歷史數(shù)據(jù),因此, 只采用表面溫度判斷法和同類(lèi)比較法進(jìn)行分析, 過(guò)程中發(fā)現(xiàn)兩處缺陷。
如圖3 所示, 3 # 電抗器的最熱電溫度為134.1 ℃, 可直接采用表面溫度判斷法進(jìn)行判斷。根據(jù)式(1) 及表1 判斷該處存在緊急缺陷。 如圖4所示, A 相最熱電為34.8 ℃, 雖然熱點(diǎn)溫度未超過(guò)限值, 但溫度高于其余兩相。 因此, 選擇同類(lèi)比較法進(jìn)行分析。 通過(guò)DCIM 平臺(tái)參數(shù)采集可知, 環(huán)境溫度為22.6 ℃, A 相電流為122.6 A, B 相電流為120.1 A, C 相電流為118.2 A, 三相電流接近。通過(guò)紅外熱成像儀檢測(cè)得出B、 C 相的最熱電溫度分別為25.6、 25.2 ℃。 計(jì)算得到A 相熱點(diǎn)相對(duì)B相熱點(diǎn)的相對(duì)溫差δ 為307%。 根據(jù)式(2) 及表2判斷該處存在嚴(yán)重的缺陷。
圖3 -1F P12 配電柜3 #電抗器熱像圖
圖4 3-1UP1 A 相銅排熱像圖
如圖3 所示, 電抗器與外部電氣接線的連接處為最熱點(diǎn), 溫度以接頭為中心向四周快速地遞減,因此推斷缺陷原因可能為接頭老化或接觸不良。 立即啟動(dòng)緊急缺陷響應(yīng)措施, 更換電抗器接頭, 復(fù)測(cè)后溫度恢復(fù)正常。 如圖4 所示, 熱像以銅排連接處螺栓為中心緩慢地向四周擴(kuò)散, 因此可推斷缺陷原因可能為連接螺栓松動(dòng)。 并在兩周后完成了螺栓緊固工作, 溫度恢復(fù)正常。
實(shí)踐表明, 通過(guò)紅外熱成像數(shù)據(jù)采集, 合理地選取決策判斷模型進(jìn)行分析, 能有效地發(fā)現(xiàn)缺陷,消除隱患, 對(duì)數(shù)據(jù)中心的安全可靠運(yùn)行起到積極的效果。
紅外熱成像技術(shù)在數(shù)據(jù)中心預(yù)測(cè)性維護(hù)應(yīng)用中的難點(diǎn)在于決策分析, 因?yàn)檫@不僅涉及大量的數(shù)據(jù)統(tǒng)計(jì)比對(duì), 還涉及圖像特征的判斷。 當(dāng)前, 對(duì)紅外熱像的特征判斷還停留在人工階段。 如何利用圖像識(shí)別技術(shù)進(jìn)行圖像特征智能識(shí)別, 提高判斷效率及準(zhǔn)確性。 這一課題值得我們研究探討。