張松林, 馬棟梁, 王德禹
(上海交通大學 海洋工程國家重點實驗室; 高新船舶與深海開發(fā)裝備協同創(chuàng)新中心, 上海 200240)
船舶長期處于復雜惡劣的海洋環(huán)境中,受到各種周期性載荷和隨機載荷的作用,疲勞裂紋是其主要的損傷形式[1],而當裂紋擴展到一定程度時,就會導致災難性事故的發(fā)生,造成嚴重的人員傷亡和經濟損失.
為避免船體損傷帶來的安全隱患,許多研究者建立了基于結構健康監(jiān)測(SHM)技術的船體結構應力監(jiān)測系統(tǒng).賈連徽等[2]通過建立全船有限元模型,得到船體結構應力響應函數,最后根據高應力區(qū)域和海況信息選取應力監(jiān)測點.這種方法通常需要建立精確的全船有限元模型,以人為施加載荷的方式確定測點位置,而實際情況下船體所受載荷具有隨機性,特別是極端海況下的波激振動和抨擊顫振很難通過有限元計算進行預測.基于動力響應的結構損傷檢測方法重點關注結構在損傷前后的振動特性,不需要施加載荷的過程.該方法通過選取一個對結構損傷敏感的參數,比如固有頻率、振型或其曲率、剛度矩陣或柔度矩陣等,分析該參數的前后變化實現結構損傷檢測的目標.Yang等[3]分析了板的振動模態(tài),結合數值仿真和實驗研究的結果,對裂紋的位置進行了檢測.對于更加復雜的結構,采用單一的檢測方法往往具有局限性,Mehrjoo等[4]將動力響應檢測方法與神經網絡相結合,提出了一種基于多層感知器(MLP)神經網絡的損傷檢測方法.盡管傳統(tǒng)神經網絡在損傷檢測方面取得了一定的成果,但其具有收斂速度慢、預測精度低和算法不穩(wěn)定等缺點.
近年來,隨著人工智能(AI)和深度學習(DL)的發(fā)展,利用深度學習模型進行損傷檢測得到了許多研究者的關注.在眾多深度學習模型中,長短期記憶(LSTM)網絡通過將時間序列的概念引入到網絡結構設計中,能夠有效處理長期復雜的時間序列[5],在實時損傷檢測方面扮演著十分重要的角色.張建付等[6-7]分別采用小波包變換(Wavelet Packet Transformation,WPT)和經驗模態(tài)分解處理滾動軸承的振動信號,并將所得到的故障特征作為LSTM的輸入,最后診斷出滾動軸承的常見故障.以上方法采用了人工提取損傷特征值的方式,雖然去除了部分信號干擾,但也不可避免地丟失了許多重要的信息.此外,多層LSTM神經網絡本身就具有提取特征值的能力[8],通過推理原始數據得到的特征往往更能反映數據的特性.Yu等[9]采用三層LSTM神經網絡識別軸承故障,直接將原始信號作為輸入,通過與單層LSTM、支持向量機等模型進行對比,證明了該方法具有較好的學習能力和識別精度.Luo等[10]同樣采用了多層LSTM神經網絡直接處理原始信號,實現了端到端的軸承故障識別.
目前,基于LSTM神經網絡的損傷檢測方法在滾輪軸承等機械結構的研究較多,但相比之下,船體結構的損傷識別更加復雜,并具有以下特點:一是船舶所處的海洋環(huán)境復雜惡劣,背景噪聲極大,采集的信號很有可能被噪聲所掩蓋;二是船舶作為一種大型結構,其初始損傷所帶來的安全隱患更為嚴重,需要及時有效地識別出損傷.本文以船體結構中普遍存在的板結構作為研究對象,將深度神經網絡應用于板裂紋的損傷檢測,提出了一種基于LSTM神經網絡的板裂紋損傷檢測方法.該方法的優(yōu)勢是直接將板的加速度響應作為神經網絡的輸入數據,將損傷特征的提取與分類合二為一,通過LSTM模型學習結構響應和裂紋損傷的內在關系,能夠以端到端的模式實現不同位置裂紋損傷的智能分類,極大縮短了裂紋損傷定位的時間,使實時在線檢測成為可能.
圖1 LSTM單元結構Fig.1 Cell structure of LSTM
LSTM神經網絡是一種基于傳統(tǒng)循環(huán)神經網絡(RNN)的改進網絡,通過引入記憶模塊,具有更加復雜的隱層節(jié)點激活方式,能夠有效學習長期依賴關系,解決了傳統(tǒng)RNN梯度爆炸和梯度消失的問題[5],廣泛應用于機器翻譯和語音識別等領域.LSTM單元結構如圖1所示.圖中:t為時刻;xt為當前時刻的輸入;ht-1和ht分別是上一時刻的輸出和當前時刻的輸出;Ct-1和Ct分別是上一時刻的記憶和當前時刻的記憶;σ和tanh分別為signoid激活函數和雙曲正切激活函數.每個單元是一個“記憶細胞”,存儲著對輸入序列的記憶.細胞里面一共有3個門控單元,分別是遺忘門 (Forget Gate)、輸入門(Input Gate)和輸出門(Output Gate),三者共同控制LSTM單元有選擇性地更新和存儲記憶,實現信息的有效流動.
3個門控單元的輸入都是ht-1和xt.其中,遺忘門的輸出ft控制有多少上一時刻記憶狀態(tài)的信息流入到當前時刻記憶狀態(tài),表示為
ft=σ(Wf·[ht-1xt]+bf)
(1)
輸入門的輸出it控制有多少當前時刻輸入的信息流入到當前時刻記憶狀態(tài),表示為
it=σ(Wi·[ht-1xt]+bi)
(2)
(3)
(4)
輸出門的輸出ot控制有多少當前時刻記憶狀態(tài)的信息輸入到下一時刻,表示為
ot=σ(Wo·[ht-1xt]+bo)
(5)
ht=ot⊙tanhCt
(6)
式(1)~(6)中,Wf、Wi、Wc及Wo為權重矩陣,bf、bi、bc及bo為偏置項,σ和tanh表示為
(7)
(8)
由LSTM單元組成的神經網絡可以看成是一個非常復雜的非線性函數,通過數據訓練調整內部權重,實現對輸入數據的逼近,從而達到識別數據的目的.LSTM是一種監(jiān)督學習算法,每個訓練樣本都有一個標簽.本文所研究的是板單裂紋位置的檢測,將標簽設置為1個1×1的向量Q.其中,Q的元素q表示裂紋在板中的對應位置,q=0時表示板不存在裂紋損傷.
裂紋位置的檢測需要在結構的諸多響應信號中準確地檢測出任何一種損傷位置的信號,因此是一個多分類問題.LogSoftmax函數是多分類問題中常用的分類函數,表示為
LogSoftmax(x[i])=
(9)
(i,j=0,1,…,n)
根據式(9),LogSoftmax函數將向量x的每個元素x[i]變換為向量P的對應元素P[i](P[i]<0).在本文中,P[i]越大,表示損傷發(fā)生在位置i的概率越高,因此P中最大元素P[k]的索引k(即概率最高的位置)表示預測的損傷位置.此外,本文利用損失函數度量LSTM模型的預測值(預測損傷位置)與標簽值(實際損傷位置)之間的差異,NLLLoss函數是多分類問題中常用的損失函數,表示為
NLLLoss(P,Q)=-P[q]
(10)
根據式(10), NLLLoss函數返回-P[q]作為損失值,其中P為上文經過LogSoftmax函數變換后的向量.結合式(9)、(10)可知,-P[q]越小,即P[q] 越大,則表示LSTM模型預測損傷發(fā)生在位置q的概率越大,因此可以認為NLLLoss函數是一個需要最小化的目標函數.
LSTM模型通過最小化損失函數進行訓練,進而調整內部權重,其訓練過程采用基于時間的反向傳播算法(BPTT),主要有以下4個步驟:① 通過前向計算得到輸出值;② 通過損失函數反向計算得到誤差,包括時間反向和網絡層級反向;③ 根據誤差計算每個權重的梯度;④ 利用梯度優(yōu)化算法更新每個權重.以下針對板不同位置裂紋損傷的智能分類問題,構建一種基于LSTM神經網絡的板裂紋損傷檢測方法.
圖2 LSTM神經網絡模型結構Fig.2 Structure of LSTM neural network model
本文LSTM神經網絡模型的結構如圖2所示,圖中a為每個時刻的輸入數據,共有1個輸入層、6個隱藏層和1個輸出層,隱藏層包含3個LSTM層和3個全連接層.輸入數據為板的結構響應,數據結構為b×t×d,其中b為批量大小,即每次迭代的樣本數量,d為每個時刻輸入向量的長度(個數).輸入數據首先輸入到3層LSTM神經單元中進行計算,將前一層LSTM神經單元的輸出作為后一層對應LSTM神經單元的輸入,并把第3層各個時刻的輸出作為全連接層的輸入,然后輸入到3層全連接層神經單元,最后通過LogSoftmax函數進行分類,其輸出數據為1×n的向量,代表LSTM模型預測的裂紋位置.
為了防止LSTM模型出現過擬合,本文在3層LSTM層之間添加了Dropout層,使模型按照一定概率舍棄部分神經元[11],從而不會過度依賴某些局部特征.同時,在3層全連接層之間使用LeakyReLU激活函數:
(11)
本文LSTM模型的實現步驟如下:首先,建立LSTM神經網絡模型,包括結構設計和相關函數選??;其次,為了驗證所提出的LSTM模型的可行性,采用有限元數值模擬的方法計算板的結構響應并進行數據處理,得到LSTM模型的輸入數據;然后,多次訓練模型并進行超參數選擇,優(yōu)化模型配置;最后,對訓練好的具有識別能力的LSTM模型進行測試,得出結果.
本文利用Python語言對Abaqus軟件進行二次開發(fā),建立有限元分析模型.該模型為矩形板,長L=3 000 mm,寬B=1 000 mm,厚D=14 mm,網格尺寸為50 mm.本文分別設置了四邊簡支和四邊固支兩種邊界條件,采用瑞利阻尼[C]=α[M]+β[K]模擬阻尼效應,其中[M]和[K]分別為質量矩陣和剛度矩陣,α和β為阻尼系數,矩形板材料參數和無損狀況前8階固有頻率分別如表1、2所示.
表1 矩形板材料參數Tab.1 Material parameters of rectangular plate
表2 矩形板固有頻率Tab.2 Natural frequency of rectangular plate
以簡支板為例,其數學模型如圖3所示.本文所研究的是單裂紋位置的檢測,因此設置了5種不同位置的裂紋,裂紋方向為沿板寬方向,如圖3(a)所示,同時為了方便網格劃分,裂紋形狀設置為菱形,最大寬度為0.02 mm.此外,每種裂紋包含4種裂紋長度Lc,分別為0.1B、0.2B、0.3B和0.4B.考慮到傳感器技術已經廣泛應用于工程實際中,本文選取板的垂向加速度響應作為輸入數據,同時設置了11個加速度采集點,如圖3(b)所示.綜上所述,該矩形板的計算狀況一共有21個,包括20個損傷狀況(5種裂紋位置×4種裂紋長度)和1個無損狀況.
圖3 簡支板數學模型Fig.3 Mathematical model of simply supported plate
本文采用的動態(tài)激勵為高斯白噪聲激勵,其均值為0,標準差為0.01 MPa,同時激勵施加頻率為104Hz,激勵時間為4 s,并通過截止頻率為600 Hz的巴特沃斯濾波器進行濾波.此外,本文設置的加速度采樣時間為4 s,由于本文主要關注前8階固有頻率,因此采樣頻率設置為512 Hz,得到每個加速度采集點的數據長度(個數,下同)為 2 048.
為了提高LSTM模型的收斂速度和預測精度,本文對采集到的加速度數據進行高斯歸一化處理.同時,考慮到在實際損傷檢測中,結構響應不可避免地會受到噪聲的影響,因此本文采用均值為0,標準差為0.3的高斯白噪聲對噪聲進行模擬.
此外,由于板在振動初始階段存在由初始激勵引起的自由振動,因此需要去除該自由振動的影響.通過對簡支板施加瞬時激勵,得到無損狀況下板中心位置采集點的加速度(a)曲線,如圖4所示.可以發(fā)現,簡支板在前0.5 s內的自由振動較為明顯,同時在1 s后該自由振動幾乎衰減為0,其影響基本可以忽略.
圖4 采集點加速度曲線Fig.4 Acceleration curves of collection point
此外,LSTM是一種基于深度學習的神經網絡,需要大量的數據進行訓練和學習.本文在綜合考慮實際硬件條件和計算成本之后,采用以下方法保證LSTM模型能夠有效地訓練.① 對有限元模型進行多次計算.此方法旨在得到足夠的樣本,同時保證樣本數據的平衡.其原理為對損傷狀況和無損狀況分別計算了50、80次,最終得到 1 080 個樣本(20個損傷狀況×50次計算+1個損傷狀況×80次計算).② 對有限元計算得到的樣本進行數據擴充.數據擴充是深度學習中獲得大量數據的有效方法,同時可以提高模型的泛化能力,防止過擬合.
本文采用的數據擴充方法為數據裁剪,其流程如圖5所示,分為非隨機裁剪和隨機裁剪兩個部分,圖中N為有限元計算得到的原始樣本數量.考慮到板的自由振動,本文去除掉板前1 s的加速度,選取后3 s長度為 1 536 的加速度數據生成數據集.非隨機裁剪的原理是直接將長度為 1 536 的加速度信號平均裁剪成3份,每份信號的長度為512,如圖5(a)所示.隨機裁剪的原理是首先從原始數據集中隨機抽取b個樣本[12],然后從每個樣本中隨機裁剪出長度為512的加速度信號,如圖5(b)所示.簡言之,本文通過數據裁剪得到時間長度為1 s的加速度信號.
LSTM的訓練與測試需要訓練集(Training Set)、驗證集(Validation Set)和測試集(Testing Set).為了保證數據集之間的獨立性,首先對有限元得到的原始樣本數據按照7∶1∶2的比例分為訓練集、驗證集和測試集,然后對各個數據集分別進行高斯歸一化處理和數據擴充,得到LSTM模型的輸入數據集.
圖5 數據裁剪流程Fig.5 Data cropping process
超參數是指在深度學習中,神經網絡模型訓練之前人為設置的參數,而不是通過訓練得到的權重,選擇合適的超參數對LSTM模型的性能至關重要.
對于LSTM模型而言,其超參數主要有學習率、時期、批處理大小、輸入特征維度、隱藏層維度、LSTM層數和舍棄概率.本文以簡支邊界條件為例,主要探究了學習率對LSTM模型的影響,其他超參數設置如表3所示.此外,本文采用Adam作為優(yōu)化器,同時以指數衰減的形式更新學習率.
表3 LSTM模型超參數Tab.3 Hyperparameters of LSTM model
為了選擇合適的超參數,本文采用驗證集的損失值作為評價指標,對比了4種不同的學習率(分別為0.1、0.01、0.001和 0.000 1)對LSTM模型的影響.圖6、7分別是不同學習率下無噪聲和有噪聲驗證集的損失值變化曲線,圖中R為學習率.
圖6 LSTM不同學習率的驗證集損失值變化曲線(無噪聲)Fig.6 Validation loss at different learning rates of LSTM (without noise)
由圖6、7可知,當學習率為0.01時,LSTM模型的收斂性較好,損失值較低,同時對噪聲敏感性較低.因此,本文選取0.01作為學習率,并選擇損失值最低的時期對應的模型進行測試.
圖7 LSTM不同學習率的驗證集損失值變化曲線(有噪聲)Fig.7 Validation loss at different learning rates of LSTM (with noise)
圖8 MLP、WPT-MLP和 LSTM計算流程Fig.8 Calculation process of MLP, WPT-MLP, and LSTM
為了評估LSTM模型的性能,本文采用了MLP和WPT-MLP兩種神經網絡模型進行對比.其中,MLP模型采用3層全連接層結構,其直接選取加速度信號作為裂紋損傷特征進行訓練.此外,WPT-MLP模型首先將處理得到的加速度信號進行小波包變換處理,提取各頻帶的能量信息作為損傷特征[13],然后輸入到3層全連接層進行訓練.本文在對加速度信號進行WPT處理時,選取的小波基函數為Db2函數,分解層數為4,因此得到長度為16的特征向量.圖8顯示了MLP、WPT-MLP和LSTM三種模型的計算流程,圖中全連接層前后的數字表示向量的長度,同時三者采用相同的數據集、分類函數、損失函數、激活函數及優(yōu)化器.
圖9、10分別是簡支邊界條件和固支邊界條件下MLP、WPT-MLP和LSTM三種模型的測試結果,其中準確率為測試集上預測正確的樣本數量占整個測試集的比例,是反應模型性能的重要指標.可以看到,三種模型在兩種邊界條件下的準確率非常接近,說明邊界條件對LSTM模型在板裂紋損傷檢測的影響較小.本文以簡支邊界條件下的測試結果為例,評估LSTM模型的性能.
圖9 MLP、WPT-MLP和LSTM的測試集準確率(簡支)Fig.9 Testing accuracy of MLP,WPT-MLP, and LSTM (simply supported)
圖10 MLP、WPT-MLP和LSTM的測試集準確率(固支)Fig.10 Testing accuracy of MLP,WPT-MLP, and LSTM (fixed supported)
由圖9可知,MLP模型的準確率遠遠低于WPT-MLP模型和LSTM模型,說明進行損傷特征提取能夠有效提高檢測性能.對比WPT-MLP模型和LSTM模型可知,對于無噪聲數據,LSTM模型的準確率為99.59%,近乎完美地檢測出了板的裂紋位置,高于WPT-MLP模型97.32%的準確率.而對于有噪聲數據,LSTM模型的檢測性能有所下降,準確率為94.75%,但相較于WPT-MLP模型86.49%的準確率仍然有明顯優(yōu)勢,說明LSTM模型對于噪聲的敏感程度低于WPT-MLP模型的敏感程度.
為了對比WPT-MLP模型和LSTM模型對不同裂紋位置q的檢測性能,本文對不同裂紋位置的定位精度進行了分析,如圖11、12所示.由圖11可知,對于無噪聲數據,LSTM模型能夠較好地對每個裂紋位置進行檢測,定位精度均在98.5%以上,而WPT-MLP模型對每個裂紋位置的定位精度都要低于LSTM模型,最大誤差達到了5.67%.由圖12可知,對于有噪聲數據,LSTM模型的定位精度有所降低,但仍然保持在91.5%以上,對比WPT-MLP模型有顯著優(yōu)勢.同時可以發(fā)現,兩種模型對板中心位置裂紋的定位精度要明顯高于其他狀況的定位精度,說明噪聲的存在基本不會掩蓋板中心位置裂紋的損傷信息,但容易影響無損狀況和其他位置裂紋的檢測.此外,對比圖11、12可知,噪聲降低了每個裂紋位置的定位精度,同時對WPT-MLP模型的影響明顯高于對LSTM模型的影響,說明LSTM模型對噪聲的敏感程度較低.
圖11 WPT-MLP和LSTM不同裂紋位置的定位精度(無噪聲)Fig.11 Localization accuracy of WPT-MLP and LSTM at different crack locations (without noise)
圖12 WPT-MLP和LSTM不同裂紋位置的定位精度(有噪聲)Fig.12 Localization accuracy of WPT-MLP and LSTM at different crack locations (with noise)
為了進一步分析噪聲對不同裂紋長度Lc的定位精度的影響,本文對WPT-MLP模型和LSTM模型不同裂紋長度的定位精度進行了分析,如圖13所示.由圖13可知,兩種模型對0和0.1B裂紋長度的定位精度遠遠低于其他3種裂紋長度的定位精度,說明噪聲主要影響無損傷狀況和低損傷狀況的檢測,幾乎不影響高損傷狀況的檢測.同時LSTM模型對0.1B裂紋長度的定位精度為78.89%,遠遠高于WPT-MLP模型42.86%的定位精度,表現出更好的抗噪聲能力.此外,結合圖12可知,噪聲的存在實際上導致LSTM模型錯誤預測了少數無損狀況和0.1B長度的裂紋損傷狀況.
圖13 WPT-MLP和LSTM不同裂紋長度的定位精度(有噪聲)Fig.13 Localization accuracy of WPT-MLP and LSTM at different crack lengths (with noise)
綜上所述,無論是無噪聲數據還是有噪聲數據,LSTM模型均表現出更好的裂紋位置檢測性能.雖然LSTM模型對于噪聲存在一定的敏感性,但仍然能夠極好地辨別不同位置的裂紋,同時在無損傷狀況和低損傷狀況的定位精度也要明顯高于WPT-MLP模型,在抗噪聲方面有明顯的優(yōu)勢,拓展了深度學習在結構損傷檢測的應用.
本文提出了一種基于LSTM神經網絡的板裂紋損傷檢測新方法,用來檢測板的健康狀況以及裂紋在板中的對應位置.通過建立板有限元模型,計算得到板的加速度響應,并采用數據擴充方法得到LSTM模型的輸入數據集.對比LSTM、MLP和WPT-MLP的預測結果,得出以下結論:
(1) 相較于MLP方法和WPT-MLP方法,LSTM方法無論在無噪聲數據還是在有噪聲數據均具有較高的預測精度,表現出更好的特征提取能力和抗噪聲能力;
(2) LSTM方法直接將原始數據作為輸入,不需要額外的損傷特征提取,極大地降低了人力成本和時間成本;
(3) 噪聲的存在容易掩蓋無損傷狀況和低損傷狀況的特征,但基本不影響高損傷狀況的檢測.
總體而言,本文驗證了LSTM神經網絡在板裂紋損傷檢測領域的適用性,拓展了深度學習在結構損傷檢測的應用,為未來智能船舶的實時在線損傷檢測提供了新思路.