陽 惠,曾 輝,張 倬,楊昆霖,黃擎宇,林源峰
(中國核動力研究設計院 核反應堆系統(tǒng)設計技術重點實驗室,成都 610213)
核電廠狀態(tài)監(jiān)測和故障診斷,是核電廠安全運行的重要保證。早期的狀態(tài)監(jiān)測普遍使用傳統(tǒng)的閾值方法,當檢測出異常情況時,可能已經(jīng)發(fā)展到難以處理的地步,因此后期逐步發(fā)展為優(yōu)于閾值方法的基于神經(jīng)網(wǎng)絡模型的方法[1-3]。針對核反應堆設備的故障診斷發(fā)展較早,經(jīng)歷了個體專家經(jīng)驗診斷、基于材料壽命分析與估計、基于傳感器與計算機技術等幾個階段的發(fā)展,隨著人工智能技術的發(fā)展,邁入了智能化故障診斷及預測階段,以知識處理和知識推理代替數(shù)值計算和信號處理手段[4-5]。
控制棒驅動系統(tǒng)是核電站反應堆一回路中的重要專用儀控系統(tǒng),用于提升、插入和保持控制棒束,實現(xiàn)反應堆正常啟堆、停堆和維持反應功率[6]??刂瓢趄寗酉到y(tǒng)的工作原理為接收邏輯控制裝置發(fā)出的指令,按照特定的時序向控制棒驅動機構(CRDM)各線圈供電,形成磁場按照順序使機構內(nèi)部配合動作。CRDM作為反應堆結構中唯一運動部件,動作的準確性和及時性直接關系到反應堆的功率控制與運行安全,當CRDM出現(xiàn)故障或性能退化到一定程度時,可能發(fā)生卡棒、滑棒和提不起等事故,甚至使控制棒失控掉落觸發(fā)停堆,影響核電廠的安全經(jīng)濟運行[7-10]。
CRDM動作故障的原因可分為兩個方面。一方面是CRDM電氣控制設備故障導致線圈電流波形異常,這可以通過監(jiān)視線圈電流大小、波紋、過渡過程來確認。另一方面是CRDM機械部件磨損或故障導致機構動作不正常,這種故障可以通過檢查線圈電流波形上的動作點發(fā)現(xiàn),也可以在動作故障累積到一定程度導致控制棒位置故障后,通過監(jiān)視控制棒位置發(fā)現(xiàn)。
因此,對CRDM的線圈電流進行監(jiān)測與故障診斷具有重要意義。西屋公司很早就提出利用CRDM線圈電流來監(jiān)測CRDM的運動狀態(tài),通過將當前動作點處的平均斜率與前一周期對應處的平均斜率進行對比,用來檢測線圈電流上動作點的變化[11]。楊城凱[12]依據(jù)CRDM線圈電流的大小和時序作為報警依據(jù),當線圈電流幅值超過設定的上下限定或轉換時間限定時,便會產(chǎn)生報警。昌正科[13]針對秦山核電站反應堆CRDM線圈電流,總結出線圈電流無動作點、線圈電流大小異常以及線圈電流異常震蕩等多種故障形式,并根據(jù)線圈電流的大小以及時序,設計了線圈電流故障診斷判據(jù)。曾杰等人[14]提出將濾波后的線圈電流分為3個部分進行研究,分別提取各部分的特征參數(shù),將這些特征參數(shù)與標準參數(shù)進行比較,用以判斷線圈電流的異常。周澤軍[19]使用支持向量機(SVM)探討了在含有噪聲復雜條件下的動作點識別的可能性,發(fā)現(xiàn)在使用小波能量值作為特征向量時能取得較好的識別效果,但是由于分析對象選取的限制,該方法只能用于識別線圈電流無動作點的故障。李國勇[24]基于LabVIEW平臺設計了CRDM性能監(jiān)測平臺,該平臺可生成設定的線圈電流轉換時序和線圈電流幅值上下限,當采集到的線圈電流時序或幅值大小與設定的線圈電流時序或幅值大小產(chǎn)生偏差時,軟件平臺將會報警。文獻[25]針對線圈電流時序故障,設計了特殊的線圈健康狀態(tài)指數(shù)來識別故障。
本研究通過對CRDM線圈電流和振動信號的監(jiān)測與特征分析,構建了CRDM狀態(tài)判別與故障診斷智能模型,并利用實時數(shù)字仿真系統(tǒng)建立了控制棒驅動系統(tǒng)自適應控制數(shù)字化模型,通過將故障診斷模型與CRDM控制系統(tǒng)集成耦合,實現(xiàn)對CRDM運行狀態(tài)的自我感知、判別、診斷、反饋、控制等功能。
CRDM通常包含有驅動軸、線圈、銜鐵和勾爪等部件[21],其結構如圖1所示。每組CRDM中包含有提升線圈、傳遞線圈和保持線圈各1個,磁通環(huán)與線圈構成電磁鐵,三塊電磁鐵與兩個勾爪相配合實現(xiàn)控制棒的運動[15]。以控制棒提升1步為例,其步驟為:傳遞線圈通電、保持線圈斷電、提升線圈通電、控制棒提升、保持線圈通電、傳遞線圈斷電、提升線圈斷電、銜鐵釋放[16]。3個線圈按一定的時序密切配合,實現(xiàn)控制棒提升或插入的步進運動[22-24]。
圖1 CRDM結構示意圖
通過對CRDM運行狀態(tài)數(shù)據(jù)線圈電流、振動信號的實時完備獲取,結合CRDM各種正常運行工況(提升、下插、落棒、保持等)和典型故障模式(如滑棒、卡棒、提不起等)的機理分析,獲取運行數(shù)據(jù)與工況模式之間的關聯(lián)關系,并借助機器學習構建CRDM狀態(tài)識別與故障診斷智能模型。通過分析并模擬CRDM的靜態(tài)和動態(tài)特性,建立CRDM數(shù)字化模型,并基于半實物仿真系統(tǒng)dSPACE搭建控制棒驅動系統(tǒng)自適應控制數(shù)字化模型,并與棒控系統(tǒng)電源控制設備形成有機連接。根據(jù)對CRDM電流、振動信號的實時監(jiān)測,由自適應控制系統(tǒng)通過Netty數(shù)據(jù)轉發(fā)服務將信號傳遞給算法服務,利用故障診斷智能模型對CRDM的運行狀態(tài)進行判別,并將狀態(tài)判別的結果返回給自適應控制系統(tǒng),實現(xiàn)控制策略和控制參數(shù)的自適應調整。CRDM智能感知與自適應控制系統(tǒng)架構如圖2所示,該系統(tǒng)建立了監(jiān)測、分析、診斷、控制完善的閉環(huán)反饋機制,實現(xiàn)對CRDM運行狀態(tài)的實時感知、在線診斷與自適應控制。
圖2 CRDM智能感知與自適應控制系統(tǒng)架構
2.1.1 CRDM故障診斷智能模型構建系統(tǒng)設計與實現(xiàn)
CRDM故障診斷智能模型構建系統(tǒng)采用B/S架構模式,主要采用Python+Java語言混合開發(fā),后端采用SpringCloud框架,前端采用Vue框架,系統(tǒng)結構如圖 3所示,自底向上分別由基礎平臺層、數(shù)據(jù)層、中間層、業(yè)務層、網(wǎng)關、表現(xiàn)層。
圖3 CRDM故障診斷智能模型構建系統(tǒng)結構圖
1)基礎平臺層:作為整個系統(tǒng)運行的底層支撐環(huán)境,主要包括Java和Python運行環(huán)境。
2)數(shù)據(jù)層:通過關系型數(shù)據(jù)庫、非關系型數(shù)據(jù)庫等不同形式對數(shù)據(jù)進行存儲。設備運行數(shù)據(jù)通過數(shù)據(jù)接入服務以文件形式存儲于分布式文件系統(tǒng),并將文件路徑地址存于關系數(shù)據(jù)庫;進行數(shù)據(jù)預處理服務時從文件系統(tǒng)中讀取文件并對其進行解析和預處理,處理過程中的中間數(shù)據(jù)放入數(shù)據(jù)緩存中以便上層應用使用。
3)中間層:包括算法架構和微服務架構;算法架構基于Tensorflow框架和SkLearn庫,主要為數(shù)據(jù)清洗、特征提取等數(shù)據(jù)預處理和模型訓練提供服務;微服務架構主要支撐業(yè)務層內(nèi)各服務的正常運行。
4)業(yè)務層:包括系統(tǒng)功能所需要對外提供的各個服務。
5)網(wǎng)關:通過Nginx做服務代理、SpringCloudGateway以及OAuth2進行權限驗證。
6)表現(xiàn)層:采用Vue、Echarts等前端框架對業(yè)務功能進行渲染,并在瀏覽器進行可視化展示。
CRDM故障診斷智能模型構建系統(tǒng)的功能模塊主要包括:
1)運行數(shù)據(jù)接入模塊:利用Python pandas庫實現(xiàn)csv、excel等源文件數(shù)據(jù)的接入,通過文件流方式將文件上傳到服務器,并提取文件元數(shù)據(jù)信息保存到MySQL數(shù)據(jù)庫。
2)數(shù)據(jù)預處理模塊:采用Python sklearn和pandas庫結合CRDM運行數(shù)據(jù)特點開發(fā),實現(xiàn)數(shù)據(jù)清洗、數(shù)據(jù)切割、數(shù)據(jù)標注、數(shù)據(jù)增廣、特征處理、數(shù)據(jù)均衡處理等功能。
3)算法管理模塊:包括算法模型開發(fā)、算法庫管理等功能。算法模型開發(fā)基于TensorFlow框架,實現(xiàn)故障診斷算法選擇、數(shù)據(jù)集劃分、模型訓練、模型驗證與評估、模型生成等功能。
4)數(shù)據(jù)存儲模塊:基于MySQL數(shù)據(jù)庫存儲系統(tǒng)在使用過程中產(chǎn)生的數(shù)據(jù),包括預處理后的數(shù)據(jù)、模型數(shù)據(jù)、模型應用的結果數(shù)據(jù)、用戶數(shù)據(jù)、日志數(shù)據(jù)等。
5)系統(tǒng)管理模塊:包括用戶管理、角色管理、日志管理及字典管理等。
2.1.2 CRDM運行數(shù)據(jù)預處理
為構建CRDM故障診斷模型,需對電流和振動信號進行數(shù)據(jù)切割與標注、數(shù)據(jù)集增強、數(shù)據(jù)不平衡處理、特征處理等數(shù)據(jù)預處理。
CRDM的正常運行工況包括提升、下插、單保持、雙保持和落棒5種狀態(tài),通過對提升線圈(LC)、保持線圈(SC)、傳遞線圈(MC)3種線圈電流和振動信號的特征分析,可根據(jù)規(guī)則設置數(shù)據(jù)切割周期和運行狀態(tài)的自動標注(見圖4)。數(shù)據(jù)周期切割的規(guī)則如下:當傳遞線圈電流和保持線圈電流同時上升時為提升工況;保持線圈電流持續(xù)為4.7 A(誤差±0.2),提升線圈電流和傳遞線圈電流為0 A時為單保持工況;保持線圈電流從4.7 A下降到0 A,直到振動信號趨于平緩為落棒工況;保持線圈電流上升,20 ms后提升線圈電流上升為下插工況。受線圈電流過渡時間限制,控制棒移動的最大速度為72步/分鐘,對應提升、插入的時序周期為833 ms,因此CRDM運行數(shù)據(jù)的切割周期設定為833個運行數(shù)據(jù)。
圖4 數(shù)據(jù)切割與標注
針對CRDM的單保持、雙保持、落棒等運行工況,通過分析發(fā)現(xiàn)數(shù)據(jù)沒有周期性的特點,因此可采用重疊采樣方式對數(shù)據(jù)進行數(shù)據(jù)增廣。數(shù)據(jù)重疊采樣是指從原始信號采集訓練樣本時,每一段信號與其后一段信號是重疊的。另外,考慮到數(shù)據(jù)是從任意位置進行采樣,在進行模型實時診斷時,無法保證數(shù)據(jù)在切割后剛好滿足所在狀態(tài)的分段數(shù)據(jù)在一個完整周期內(nèi),因此進行重疊采樣可以使得模型的狀態(tài)識別具有容錯性,在任意起始點和一個周期的長度內(nèi)都可以正確識別出當前的狀態(tài)。當設置偏移量為50,雙保持數(shù)據(jù)從原來的10個擴充到103個,落棒數(shù)據(jù)從原來的16擴充到185個。分別將數(shù)據(jù)擴充前和擴充后的數(shù)據(jù)集采用LSTM模型進行訓練,測試集精度分別為96%和100%,混淆矩陣如圖 5所示。
圖5 數(shù)據(jù)集擴充前后模型測試結果混淆矩陣圖
從混淆矩陣圖可以看出,當未進行數(shù)據(jù)擴充時,受到數(shù)據(jù)不平衡的影響,會使得單保持、雙保持和落棒狀態(tài)的識別存在誤判,而采用了重疊采樣后,每種狀態(tài)的數(shù)據(jù)達到平衡狀態(tài),模型最終的精度可以達到100%,說明使用重疊采樣進行增廣可以解決落棒數(shù)據(jù)和雙保持數(shù)據(jù)的數(shù)據(jù)不平衡問題,從而使模型達到更好容錯性。但是這種方法是基于落棒數(shù)據(jù)和雙保持數(shù)據(jù)沒有周期性的特點,不適用于有周期性的故障數(shù)據(jù)。
針對CRDM運行工況數(shù)據(jù)集,由于受到實驗條件等因素限制,各個工況的數(shù)據(jù)集存在明顯的不平衡情況(通常情況下把多數(shù)類樣本的比例接近100:1這種情況下的數(shù)據(jù)稱為不平衡數(shù)據(jù)),特別是卡棒、滑棒、提不起等故障模式數(shù)據(jù)相比于正常運行工況數(shù)據(jù)量較少,為避免構建的故障診斷模型出現(xiàn)過擬合問題,采用SMOTE算法[17]進行數(shù)據(jù)均衡處理。
SMOTE算法的基本思想是對少數(shù)類樣本進行分析,并根據(jù)少數(shù)類樣本人工合成新樣本添加到數(shù)據(jù)集中,算法流程如下:
1)對于少數(shù)類樣本中的每一個樣本x,計算該點與少數(shù)類中其它樣本點的距離,得到最近的k個近鄰(即對少數(shù)類點進行KNN算法)。
2)根據(jù)樣本不平衡比例設置一個采樣比例以確定采樣倍率,對于每一個少數(shù)類樣本,從其k近鄰中隨機選擇若干個樣本,假設選擇的近鄰為x’。
3)對于每一個隨機選出的近鄰x’,分別與原樣本按照如下的公式構建新的樣本:
xnew=x+rand(0,1)*(x’-x)
采用SMOTE算法對故障模式數(shù)據(jù)樣本進行擴充,并將擴充前后的數(shù)據(jù)集分別放入LSTM模型中進行訓練,針對滑棒、提不起、卡棒故障模式的識別準確率提升了75.1%~100%,說明SMOTE在一定程度上可以提高模型的泛化能力,且總體效果優(yōu)于隨機過采樣(見表1)。
針對CRDM保持線圈電流、提升線圈電流、傳遞線圈電流和振動信號,分別提取其時域特征和頻域特征,并針對所提取的特征集,采用方差選擇法,計算各個特征的方差,然后根據(jù)閾值大小(時域方差設置為5,頻域方差設置為0.01)進行特征篩選。對CRDM線圈電流和振動信號的最大值、最小值、峰值、峰峰值、均值、整流平均值、方差、標準差、均方值、均方根值、方根幅值、偏度、峭度、峰值因子、裕度因子、脈沖因子、波形因子等17種時域特征以及平均頻率、重心頻率、均方頻率、均方根頻率、頻率方差、頻率標準差等6種頻域特征進行特征選擇的結果如圖 6所示。
圖6 電流、振動信號特征處理
保持線圈電流方差大于5的時域特征有:最大值、峰值、峰峰值、方差、均方值、峭度;方差大于0.01的頻域特征有:均方頻率、均方根頻率、頻率方差、頻率標準差。提升線圈電流方差大于5的時域特征有:最大值、峰值、峰峰值、方差、均方值、均方根值、偏度、峭度;方差大于0.01的頻域特征有:重心頻率、均方頻率、均方根頻率、頻率方差。傳遞線圈電流方差大于5的時域特征有:最大值、峰值、峰峰值、均值、整流平均值、方差、均方值、均方根值、峭度;方差大于0.01的頻域特征有:重心頻率、均方頻率、均方根頻率、頻率方差、頻率標準差。振動信號方差大于5的時域特征有:峭度;方差大于0.01的頻域特征有:重心頻率、均方頻率、均方根頻率、頻率方差。
2.1.3 CRDM故障診斷智能模型構建
通過對CRDM正常運行工況和故障模式的機理分析和電流、振動信號的數(shù)據(jù)特征分析,本研究基于LSTM、CNN、Random-Forest、SVM、KNN等算法構建了5種故障診斷智能模型。故障診斷智能模型構建的基本流程如下:
圖7 自適應控制參數(shù)辨識控制器
1)將CRDM提升、下插、單保持、雙保持、落棒5種正常運行工況和卡棒、滑棒、提不起3種故障模式的帶標簽數(shù)據(jù)組合在一起,并切割為833的片段數(shù)據(jù)集。
2)將切割好的數(shù)據(jù)集按比例(如7:3)劃分為訓練集、測試集。利用訓練集對算法進行迭代訓練,獲得模型最優(yōu)參數(shù)。
3)利用測試集對訓練好的模型進行測試,評估模型性能。
針對提升、下插等正常運行工況和卡棒、滑棒等故障模式,CRDM故障診斷智能模型的識別準確率均達到99.2%以上(見表2)。
根據(jù)控制棒驅動系統(tǒng)控制和驅動電路原理,基于半實物仿真系統(tǒng)dSPACE[18]搭建了控制棒驅動系統(tǒng)數(shù)字模型的IGBT控制方案仿真模型(如圖 7所示)。
表2 CRDM故障診斷算法對比表 %
dSPACE實時仿真系統(tǒng)是德國dSPACE公司開發(fā)的一套基于MATLAB/Simulink 的控制系統(tǒng)在實時環(huán)境下的開發(fā)及測試工作平臺。dSPACE實時系統(tǒng)具有實時性強,可靠性高,擴充性好等優(yōu)點,目前已成為進行快速控制原型驗證和半實物仿真的首選實時平臺。
自適應控制參數(shù)辨識控制器實時采樣CRDM電感電流(I_RL信號)、指令電流(I_LC_order信號)和IGBT拓撲斬波管的PWM信號(PWM_1信號),利用遺忘因子遞推最小二乘法辨識得到系統(tǒng)結構參數(shù)。圖8顯示了自適應控制方法與傳統(tǒng)PI控制方法的效果對比,自適應控制模型的辨識準確率可達到95%。
圖8 傳統(tǒng)控制算法與自適應控制方法對比
CRDM故障診斷智能模型與自適應控制系統(tǒng)基于Netty通信實現(xiàn)集成。Netty是一個基于NIO(Nonblocking I/O,即非阻塞IO)的客戶、服務器端的編程框架,提供異步的、事件驅動的網(wǎng)絡應用持續(xù)框架和工具,用以快速開發(fā)高性能、高可靠的網(wǎng)絡服務器和客戶端程序。
自適應控制系統(tǒng)接收到dSPACE實時仿真系統(tǒng)發(fā)送的CRDM線圈電流、振動信號,將數(shù)據(jù)按照UDP協(xié)議數(shù)據(jù)格式轉發(fā)給Netty服務器。UDP數(shù)據(jù)包的總長度為43個字節(jié),每個參數(shù)占4個字節(jié),從左到右依次為:LC線圈電流、MC線圈電流、SC線圈電流、振動信號、LC線圈辨識參數(shù)a1,LC線圈辨識參數(shù)b0,MC線圈辨識參數(shù)a1、MC線圈辨識參數(shù)b0,SC線圈辨識參數(shù)a1、SC線圈辨識參數(shù)b0。Netty服務器接收到數(shù)據(jù)監(jiān)控轉發(fā)的實時數(shù)據(jù)后,根據(jù)協(xié)議進行數(shù)據(jù)解析,并按數(shù)據(jù)切割周期(每833個數(shù)據(jù)一個周期)進行數(shù)據(jù)封裝滿足模型輸入要求,以HTTP方式調用算法服務,根據(jù)故障診斷智能模型進行CRDM運行狀態(tài)的判別與診斷,并將判別結果通過UDP協(xié)議進行封裝,發(fā)送給自適應控制系統(tǒng),模型集成流程如圖 9所示。
圖9 模型集成流程圖
為驗證CRDM智能感知與自適應控制系統(tǒng)狀態(tài)感知、模式判別、故障診斷、反饋控制等功能,本研究基于dSPACE系統(tǒng)搭建了實驗樣機,并與CRDM形成有機連接(如圖10所示)。接口模塊實時接收提升線圈、傳遞線圈和保持線圈的電流信號和振動傳感器的振動信號,并將所獲取的信號傳遞到CRDM智能感知與自適應控制系統(tǒng)。CRDM故障診斷智能模型對所接收的電流、振動信號進行實時監(jiān)測與判別,并將識別出的運行狀態(tài)模式信號(分別用0~8九個狀態(tài)碼表示單保持、雙保持、落棒、下插、提升、滑棒、提不起、提升卡棒、下插卡棒9種運行狀態(tài))傳遞給自適應控制系統(tǒng),根據(jù)運行狀態(tài)模式信號,控制系統(tǒng)產(chǎn)生相應的時序指令信號,使控制電流在外部環(huán)境變化和CRDM動態(tài)運行過程中都能滿足電流的響應要求,實現(xiàn)系統(tǒng)控制回路的自適應控制。
圖10 樣機系統(tǒng)連接圖
功能驗證的操作步驟如下:
1)操作CRDM智能感知與自適應控制系統(tǒng)帶動CRDM運行,監(jiān)測智能模型的工況識別結果和驅動電流的穩(wěn)態(tài)誤差、時序精度及轉換時間;
2)向CRDM發(fā)出提升控制指令,監(jiān)測智能模型的工況識別結果和控制電流的穩(wěn)態(tài)誤差、時序精度及轉換時間;
3)向CRDM發(fā)出插入控制指令,監(jiān)測智能模型的工況識別結果和控制電流的穩(wěn)態(tài)誤差、時序精度及轉換時間。
圖11顯示了當CRDM以72步/分的速度進行下插運動時,智能診斷模型能實時準確地識別出CRDM的運行工況。同時,針對提升線圈、移動線圈和保持線圈在大電流波動、小電流波動、零電流到大電流時間的采集值與額定值進行對比分析,時序電流的控制精度優(yōu)于額定值的±4%(如圖12所示)。
圖11 CRDM運行狀態(tài)驗證
圖12 控制電流實測值
本研究構建了一套CRDM智能感知與自適應控制系統(tǒng),通過實驗樣機模擬驗證,得到如下結論:
(1)通過對CRDM保持線圈、傳遞線圈、提升線圈電流信號和振動信號的特征分析,基于LSTM、CNN、隨機森林、SVM和KNN算法構建了5種CRDM故障診斷智能模型,對提升、下插、保持、落棒等正常運行工況和卡棒、滑棒、提不起等典型故障模式均可實現(xiàn)運行狀態(tài)的準確判別與故障診斷,識別準確率在99.2%以上。
2)通過在dSPACE實時仿真系統(tǒng)上構建控制棒自適應控制數(shù)字化模型,并集成CRDM故障診斷智能模型,可實時獲取與監(jiān)測CRDM線圈電流和振動信號,實現(xiàn)CRDM運行狀態(tài)的實時感知與判別、故障模式的在線診斷、控制完善的閉環(huán)反饋機制,提高了CRDM的智能化水平、可靠性和安全性,為深入開展核反應堆智能設備的研制工作奠定了技術基礎。