孟獻蒙,郭興眾,程凡永 ,陳旺斌,方駿仁
近年來,隨著石油、天然氣等不可再生資源的日益消耗,越來越多的國家開始進行低碳能源轉型[1]。在可再生、低碳能源生產中,太陽能光電技術顯現(xiàn)出小規(guī)模能源生產的巨大潛力[2]。2005年以來,中國光伏制造產業(yè)發(fā)展迅速,并于2007年超過日本,成為世界上最大的光伏組件制造國[3]。截至2017年,中國、美國、印度、德國、日本等國家積極部署太陽能光伏產業(yè),并已經在光伏市場中占主導地位[4]。未來太陽能光伏在全球各個國家低碳能源產業(yè)發(fā)展中繼續(xù)具有重要的戰(zhàn)略地位。而逆變器是光伏發(fā)電系統(tǒng)中的核心部件,其一旦發(fā)生故障,不僅會影響系統(tǒng)的正常運行,而且可能會對設備造成不可估量的損失。因此,開展光伏逆變器的故障診斷研究在設備損耗和降低成本投入以及逆變器保護等方面有著至關重要的意義。
目前,關于逆變器的故障診斷方法大體上可以分為如下3 類:基于參數(shù)辨識的方法、基于物理信號分析的方法和基于人工智能的方法。文獻[5]通過對實測電流-電壓(I-V)曲線進行參數(shù)辨識,以識別并且發(fā)現(xiàn)故障。文獻[6]通過采集三相電壓逆變器的輸出電流信號,然后根據電流矢量的瞬時頻率特征和瞬時角度特征的變化來進行故障診斷。文獻[7-8]利用小波包分解和主成分分析法實現(xiàn)了故障診斷,其中,文獻[7]基于極端學習機實現(xiàn)了單器件及多器件開路等多種故障診斷,文獻[8]基于徑向基神經網絡對NPC 三電平逆變器開路故障進行了診斷。但是這些故障診斷方法都需要專業(yè)的物理知識和復雜的特征提取工程,不具備強的通用性。近年來,隨著人工智能技術的發(fā)展,越來越多的深度學習技術被廣泛地應用于逆變器的故障診斷中。文獻[9]針對光伏組件中各種類型的故障,采用多層感知器來識別發(fā)生故障的類型和位置,但由于特征區(qū)分能力的限制,該方法不能有效地診斷不顯著的故障類型。文獻[10]為提高特征區(qū)分能力,采集了電壓、電流和速度的變化信號,利用神經網絡和遺傳算法相結合的結構,對感應電動機電壓源逆變器故障進行了診斷。盡管該方法提高了故障診斷率,但是需要3 個傳感器采集數(shù)據,增加了設備的投入。
為減少傳感器的使用數(shù)量和提高特征區(qū)分能力,本文提出一種基于經驗模式分解(empirical mode decomposition,EMD)和二維卷積神經網絡(twodimensional convolutional neural network,2D-CNN)結合的故障診斷方法。該方法首先使用一個傳感器采集光伏逆變器的直流側電流信號,采用EMD 提取電流中的多個本征模函數(shù)與原始數(shù)據組成的二維特征圖作為2D-CNN 的輸入;然后,利用2D-CNN 進行特征提?。蛔詈?,用2D-CNN 模型對多類開路故障進行診斷和分類。
光伏發(fā)電系統(tǒng)利用電池組件將太陽能直接轉變?yōu)殡娔?。在光照條件下,太陽電池組件產生一定的電動勢,通過組件的串并聯(lián)形成太陽能電池方陣,使得光伏陣列的電壓達到系統(tǒng)輸入電壓的要求。光伏發(fā)電系統(tǒng)的主電路拓撲結構如圖1 所示,左側由光伏陣列產生直流輸入,經過逆變器輸出三相電流和電壓。圖中R、L分別是電阻和電感,C是電容,T1~T6 為6 個絕緣柵雙極型晶體管(insulated gate bipolar transistors,IGBT),S1~S6 是6 個開關,系統(tǒng)通過調制電路來控制IGBT 的導通。
圖1 光伏發(fā)電系統(tǒng)主電路拓撲結構Fig.1 Topological structure of main circuit of the photovoltaic power generation system
逆變器的故障可以分為IGBT 短路故障和IGBT開路故障兩類[11]。IGBT 短路因時間短暫可以在電路上直接進行處理,目前已經有相當成熟的解決方法[12]。當一個或兩個IGBT 發(fā)生開路時,會導致逆變器不能正常導通。如果同一時間內有更多的IGBT開路,則此時逆變器早已不能正常工作,對于研究已無意義。因此文中的研究對象為一個或兩個IGBT 開路故障。如圖1 所示,當電路中一個開關斷開的情況下,將會出現(xiàn)單管故障,共6 種情況(T1~T6 分別開路)。當電路中兩個開關斷開情況下,將會出現(xiàn)兩管故障,而兩管故障又分3 種情況:同一相的兩個功率管開路故障,例如T1 和T4,共3 種;同一半橋的兩個功率管開路故障,例如T1 和T3,共6 種;交叉的兩個功率管開路故障,例如T1 和T6,共6 種。把正常情況歸為一類,則IGBT開路故障的類型為22種。
經驗模式分解(EMD),又可以稱為Hilbert-Huang 變換(Hilbert-Huang transform,HHT)[13],它是一種新型自適應信號時頻處理方法。經驗模式分解能夠從單個信號中提取多尺度特征,特別適用于非線性、非平穩(wěn)信號的分析處理之中[14]。EMD 能夠使復雜信號分解為有限個本征模函數(shù)(intrinsic mode function,IMF)和一個殘余項(res)之和,所分解出來的各IMF 分量包含了原信號的不同時間尺度的局部特征信號。
EMD 的基本分解流程如下:
1)獲取原始時間序列x(t)的極值點;
2)采用三次樣條插值函數(shù)擬合形成原數(shù)據的上包絡x1(t)和下包絡x2(t),計算包絡均值m(t),
3)計算新序列h(t),
4)判斷h(t)是否滿足IMF 的兩個條件;
5)如果不是,則以h(t)代替x(t),重復以上步驟,直到h(t)滿足判據,則h(t)就是需要提取的IMF;
6)每得到一階IMF,就從原信號中去除它,重復以上步驟,直到信號最后剩余部分就只是單調序列或者常值序列。
這樣,經過EMD 分解,將原始信號x(t)分解成高頻到低頻的IMF 分量的線性組合和殘余項r(t);
式中:ci(t)為第i個IMF 分量;
r(t)為殘余項,不包含信號的震蕩模態(tài),只反映信號的變化趨勢。
前面幾個高頻的IMF 分量包含了原始信號中顯著且重要的特征信息。
3.2.1 卷積層
卷積層用到了數(shù)學運算-卷積,卷積是一種特殊的線性運算,用來替代一般的矩陣乘法運算。卷積運算的數(shù)學公式如下:
式中:X為二維矩陣;
W為權重參數(shù),它可以是一個或多個二維矩陣;
y(i,j)為卷積運算的輸出;
*為卷積運算符號。
在CNN 中,除了權重參數(shù),還存在偏置。濾波器的參數(shù)就對應之前的權重。具體的卷積層運算如圖2 所示,有一個3*3 的卷積核,卷積核都與輸入信號進行卷積運算。卷積核滑動步長為1,卷積核為3*3,輸入數(shù)據為4*4,經過卷積運算后,加上相對應的偏置,經過激活函數(shù)激活后就得到了大小為2*2的輸出特征圖。
圖2 卷積運算示例Fig.2 Illustration of convolution operation
3.2.2 池化層
理論上來說,所有經過卷積層獲取的特征都可以直接輸入到分類器中,但是巨大的計算量是一個難題。為了解決這個問題,一般會使用池化層來減少卷積計算中的冗余特征。池化層會將平面內某一位置及其相鄰位置的特征值進行聚合統(tǒng)計(降采樣),并且將聚合后的結果作為這一位置在該平面內的值。假設第l-1 層為池化層的上一層卷積層,第l層為池化層,則可以得到從第l-1 層到第l層的最大池化傳播公式如下:
式中:down(·)為一個下采樣方法,可以采用最大池化或平均池化;
σ(·)是激活函數(shù)。
圖3 所示為最大池化層處理結果示意圖,其中左側圖是原始的二維矩陣網格數(shù)據(深度為2,寬度和高度各為4),池化核的大小是2*2,并且池化核每次移動的步長是2。右側圖給出了網格數(shù)據經過最大池化之后的輸出結果。
圖3 最大池化層處理結果示意圖Fig.3 Schematic diagram of the treatment results of the maximum pooling layer
3.2.3 全連接層
卷積層從輸入中提取特征,這些特征經過池化層處理后被輸入到一個全連接層中進行分類。全連接層的計算公式為
式中:yl為第l層的輸出;
bl為第l-1 層的所有神經元到第l層的所有神經元集合的偏置;
σ(·)為激活函數(shù)。
為了確定IMF 的個數(shù),本研究中對5 類開路故障中的一種故障數(shù)據分別進行了EMD 分解,每一種故障數(shù)據的序列長度為200,所得到的實驗結果如圖4 所示。所設計的二維卷積神經網絡模型(2D-CNN)如圖5 所示,由輸入層、3 個卷積-池化模塊、平鋪層、全連接層、Softmax 層和輸出層構成。
圖4 5 類開路故障數(shù)據的EMD 分解Fig.4 EMD of five types of open-circuit fault data
圖5 2D-CNN 模型示意圖Fig.5 2D-CNN model diagram
基于EMD-CNN 的故障診斷方法如圖6 所示。
圖6 基于EMD-CNN 的故障診斷方法Fig.6 Fault diagnosis method based on EMD-CNN
基于EMD-CNN 的故障診斷的具體步驟如下:
1)控制開關的閉合來模擬光伏逆變器的IGBT開路故障,并利用傳感器采樣電流信號;
2)設置IMF 的個數(shù),對電流信號進行EMD 分解,得到各開路故障下的IMF 分量;
3)組合IMF 和原始數(shù)據,獲取不同開路故障下的特征向量樣本;
4)將故障數(shù)據集分為訓練集和測試集,利用訓練集訓練EMD-CNN 故障診斷模型;
5)把測試集輸入訓練的EMD-CNN 中進行故障識別和診斷。
本研究中所設計的光伏發(fā)電系統(tǒng)的仿真模塊如圖7 所示。圖7 所示仿真模塊具有最大功率點跟蹤和電壓前饋控制功能。在仿真中,采樣頻率設置為104Hz,總運行時間為4.1 s,電阻為0.1 Ω,電感為0.002 H,三相電流頻率為50 Hz。前0.1 s,系統(tǒng)剛剛通電,數(shù)據的波動巨大,所以舍去這一部分的數(shù)據,數(shù)據采集的時間為0.1~4.1 s。此外,當采樣過程執(zhí)行到0.25 s 時,系統(tǒng)的工作條件發(fā)生變化,光照強度從700 W/m2變?yōu)? 000 W/m2。這樣做的目的是更加符合光伏逆變器的實際工作環(huán)境。從圖中可以看出,6個IGBT 分別連接了一個開關。數(shù)據集的獲取方法如下:人為地控制不同開關的閉合,利用傳感器以數(shù)據段的形式等時間采樣每一種情況下(22 種)的直流側電流信號,每種故障的采樣數(shù)為2 000 個,總共收集了20 個數(shù)據段,最后經EMD 分解后,匯總成440個樣本的數(shù)據集。
圖7 光伏逆變系統(tǒng)的仿真模塊Fig.7 Simulation of the photovoltaic inverter system
每個故障樣本數(shù)據序列長度為2 000 個,它仍然是一個長的一維時間序列數(shù)據。在2D-CNN 模型訓練過程中,如果把這個長的一維時間序列數(shù)據經過EMD 處理后一次性輸入2D-CNN 模型中,會帶來很大的計算復雜度。為了解決這個問題,對數(shù)據采用了分段分割[15]。根據采樣周期,長的一維時間序列數(shù)據可以被分割成若干個等長度的短一維時間序列數(shù)據段,并將短的一維時間序列數(shù)據段作為一個故障樣本。為了提高相鄰樣本之間的相關性,文中采用了滑動窗口重疊采樣方法[16]。通過這種方法,可以獲得更多的故障樣本用于2D-CNN 診斷模型的訓練和測試。
圖8 所示為數(shù)據分割的重疊采樣法示意圖。
圖8 數(shù)據分割的重疊采樣法Fig.8 Overlapping sampling method for data segmentation
在圖8 中,長的一維時間序列數(shù)據段有2 000 個數(shù)據。采用滑動窗口重疊采樣方法,即每一次向前移動200 個數(shù)據,這樣就可以得到6 個新的樣本。每個新樣本的長度為1 000 個數(shù)據。重疊樣本的數(shù)據點數(shù)量為800 個,重疊率為80%。重疊采樣的樣本量計算方法定義如下[17]:式中:Samplenum為利用重疊采樣法得到的新故障樣本量;
Ilength為原始數(shù)據段的數(shù)據點數(shù)量;
Wlength為滑動窗口內數(shù)據點的數(shù)量;
Slength為檢測步長的數(shù)據點數(shù)量。
本研究中,Ilength為2 000 個數(shù)據,Wlength為1 000個數(shù)據,Slength為200 個數(shù)據。因此,根據公式可以計算出圖8 的Samplenum為6。
在仿真實驗中,光伏逆變器的直流側電流信號是在理想狀態(tài)下獲取的,它不受外界因素的影響。為了保證數(shù)據的有效性,人為地在數(shù)據上加入了不同信噪比(signal noise ratio,SNR)的噪聲,SNR 的計算公式如下:SNR=10 lg(Ps/Pn)。 (8)
式中:Ps為信號的有效功率;Pn為噪聲的有效功率。
在模型訓練過程中,參數(shù)設置對網絡模型的性能有重要影響。檢測步長是網絡模型中的一個重要參數(shù),它代表模型中數(shù)據的更新數(shù)量。5 dB 噪聲下不同檢測步長的診斷準確性以條形圖顯示,如圖9 所示。
圖9 不同檢測步長的故障分類準確率Fig.9 Fault classification accuracy rate ofdifferent detection steps
由圖9 可知,當檢測步長設置為200 個數(shù)據時,故障診斷的效果最佳,準確度達到了0.987 4。同時,200 個數(shù)據的采樣時間正好為0.02 s,這與相電流的周期保持一致。因此,文中的后續(xù)實驗將檢測步長設置為200 個數(shù)據。
滑動窗口代表每一次輸入網絡模型的數(shù)據樣本個數(shù),其數(shù)值的改變將會影響模型的故障診斷和分類。實驗過程中設置了5 種滑動窗口,其數(shù)據量分別為400, 600, 800, 1 000, 1 200。5 種噪聲下的故障診斷準確率如圖10 所示。
圖10 不同噪聲下5 種滑動窗口的故障分類準確率Fig.10 Accuracy rate of the fault classification of five sliding windows under different noises
由圖10 可知,相較于另外4 種滑動窗口,當滑動窗口為1 000 個數(shù)據時,5 種噪聲下的故障診斷準確率均最高。因此,當滑動窗口為1 000 個數(shù)據時,故障的分類效果最好。
選擇kNN(k-nearest neighbor)[18]、SVM(支持向量機)[19]和CNN 方法進行對比實驗。
1)kNN 方法。在實驗中,kNN 的超參數(shù)n_neighbor 設置為7。
2)SVM 方法。實驗中采用線性核支持向量機對逆變器數(shù)據進行故障診斷。
3)CNN方法。將輸入數(shù)據變形為[400,1]的形狀,并輸入CNN 網絡,最后通過Softmax 層輸出故障診斷結果。
在實驗中,批量大小設置為600 個數(shù)據,學習率設置為0.000 1。所得4 種方法的故障診斷結果如表1所示。從表1 中的數(shù)據可以得知,EMD-CNN 的診斷精度均優(yōu)于前3 種方法。最重要的是,EMD-CNN 在5 種不同級別的噪聲上均具有最佳性能。這主要是由于EMD 對故障數(shù)據進行了多尺度分解,CNN 可以快速且精準地對故障數(shù)據進一步提取特征,最后實現(xiàn)故障的診斷和分類。因此,EMD-CNN 在處理光伏逆變器的IGBT 開路故障和獲得最佳故障診斷性能方面具有明顯的優(yōu)勢。
表1 不同噪聲下不同方法的故障診斷準確率Table 1 Accuracy rate of different methods under different noises
本文提出了一種結合EMD 和CNN 的光伏逆變器故障診斷方法,利用直流側電流對開路故障進行監(jiān)測。并且對光伏逆變器系統(tǒng)進行了Simulink 仿真,以驗證所提出方法的性能。為了測試該方法的魯棒性和適用性,將不同強度的高斯噪聲人工添加到數(shù)據集中。實驗結果表明,與傳統(tǒng)的分類方法相比,該方法在不同噪聲水平下可以獲得更高的故障診斷精度。
后續(xù)研究中,為了充分利用CNN 進行直流側電流的深度特征提取能力和LSTM 在處理時間序列數(shù)據上的優(yōu)異性能,值得研究CNN-LSTM 的組合模型,以進一步提高在較高噪聲水平下的故障診斷性能。