魏強強,李 欣,李新超,盧文月
(1. 上海交通大學(xué) 海洋工程國家重點實驗室,上海 200240; 2. 上海交通大學(xué) 三亞崖州灣深海科技研究院,海南 三亞 572024; 3. 海洋石油工程股份有限公司,天津 300461)
近年來,隨著海洋工程逐步向深海進發(fā),半潛平臺作業(yè)環(huán)境變得越來越惡劣,平臺的耦合運動響應(yīng)特性變得十分復(fù)雜,這種平臺運動的不規(guī)則性和隨機性對平臺作業(yè)、棧橋(Gangway)控制以及直升機起落等造成極大的不確定和未知風(fēng)險,對半潛平臺的運動響應(yīng)預(yù)報可有效規(guī)避這些風(fēng)險,具有重要的工程意義[1-3]。
對浮體運動響應(yīng)的極短期預(yù)報國內(nèi)外都做了一定的研究工作[2-3],概括起來有流體力學(xué)方法、時間序列分析法和基于神經(jīng)網(wǎng)絡(luò)的預(yù)測模型。對于流體力學(xué)方法,一般需要假設(shè)波浪運動和平臺運動是各態(tài)歷經(jīng)的平穩(wěn)隨機過程,且浮體為線性系統(tǒng),基本適用于小振幅波浪引起的運動響應(yīng),對非線性效應(yīng)明顯的深水半潛平臺運動響應(yīng)的預(yù)測效果不太理想。與之相比,統(tǒng)計學(xué)方法僅需要平臺本身運動響應(yīng)的歷史數(shù)據(jù)進行分析尋求規(guī)律并進行預(yù)報。
1949年,Wiener[4]提出了一種平穩(wěn)的統(tǒng)計預(yù)報方法,但該方法需要知道預(yù)報信號的功率譜,實際應(yīng)用中有諸多限制。Kaplan[5]提出利用卷積法對艦船運動進行預(yù)報。但由于缺少合適的核函數(shù),因此實際應(yīng)用中效果較差。
1994年,Broome等[6]采用ARMA方法對海試數(shù)據(jù)進行預(yù)報,對橫搖的有效預(yù)報時間達到10 s。彭秀艷[7]提出遞推最小二乘法對AR模型參數(shù)進行自適應(yīng)估計,有效預(yù)報時間達10 s。Wei等[8]基于ARMA模型對艦載直升機平臺升沉位移進行多步預(yù)測。楊震[9]采用基于改進支持向量機(SVR)的方法對船舶橫搖運動姿態(tài)進行預(yù)報,提升了預(yù)報模型的自適應(yīng)性。吳爽等[10]提出了基于小波變換的遞推最小二乘的估計算法對艦船橫搖運動進行預(yù)報,很好地解決了橫搖運動在線自適應(yīng)預(yù)報問題。唐剛等[11]提出Newton-ARMA模型提高了船舶升沉運動的預(yù)測精度。
豐雁等[12]采用對角回歸神經(jīng)網(wǎng)絡(luò)模型對船舶縱搖進行預(yù)報。蓋曉娜等[13]提出了復(fù)合的小波_SVR組合方法應(yīng)用于平臺運動的極短期預(yù)報,對非平穩(wěn)時間序列進行分解。劉煜城[14]結(jié)合LSTM神經(jīng)網(wǎng)絡(luò)提出基于自相關(guān)函數(shù)的定階方法對船舶升沉數(shù)據(jù)做出了有效預(yù)測。
從頻譜分析可以知曉縱蕩和橫蕩響應(yīng)以低頻的自振周期的頻率為主,而波頻的運動響應(yīng)成分較少。而垂蕩、橫搖和縱搖運動響應(yīng)周期與波浪相近,低頻的運動響應(yīng)成分較少,屬于波頻運動[15-16]。但在波浪作用下會發(fā)生垂蕩、縱搖和橫搖的非線性耦合效應(yīng),特別是當波浪頻率接近垂蕩和縱搖固有頻率之和時,會引起平臺較強的非線性耦合運動,而且平臺浮力和恢復(fù)力的周期性變化也會引起平臺的非線性響應(yīng)[17]。因此半潛平臺運動響應(yīng)具有較高的時間相關(guān)性和較強的非線性。為了解決運動響應(yīng)的復(fù)雜特性和復(fù)雜的頻域信息,信號分解必不可少,而上述文獻中的方法沒有很好地處理這個問題,因此采用經(jīng)驗?zāi)B(tài)分解(EMD)[18]算法將復(fù)雜的非線性時間序列分解為平穩(wěn)的不同分量,再結(jié)合長短時記憶網(wǎng)絡(luò)(LSTM)[19]處理長時間序列的能力,提出一種復(fù)合的EMD-LSTM預(yù)報方法,對在水池模型試驗的半潛平臺運動響應(yīng)數(shù)據(jù)進行仿真預(yù)報,并通過對比證明該方法的有效性。
經(jīng)驗?zāi)B(tài)分解(empirical mode decomposition,簡稱EMD)[20]算法是一種新的信號處理時頻分析方法,尤其適用于非線性、非平穩(wěn)性時間序列的處理。不同于傅里葉變化和小波變化,EMD算法可以在不需要知道任何先驗知識的情況下,依據(jù)自身時間尺度特征來進行信號分解處理,EMD被認為是對以線性和平穩(wěn)假設(shè)為基礎(chǔ)的傅立葉分析和小波變換等傳統(tǒng)時頻分析方法的重大突破[21]。EMD算法可將時間序列分解成有限個本征模函數(shù)(intrinsic mode function,簡稱IMF)和一個趨勢項(殘差),分解出的IMF分量反映了原時間序列的不同時間尺度的波動信息。
EMD的分解過程是:對給定的時間序列x(t),先確定所有極值點,再分別對極大值點和極小值點通過插值擬合得到上下包絡(luò)線xmax和xmint,其均值記為m(t),將原時間序列減去該平均值,得到一個新的時間序列h(t):
h(t)=x(t)-m(t)
(1)
如果h(t)滿足IMF分量的兩個條件:一是信號零點數(shù)和極值點數(shù)相同或最多相差一個;二是信號是零均值,則h(t)是IMF分量,否則用h(t)代替原時間序列繼續(xù)篩選,直到滿足兩個約束條件。每得到一個IMF分量就從原時間序列中移去,重復(fù)以上篩選步驟,直到得到單調(diào)序列或者常值序列Rn,則EMD分解過程結(jié)束。原時間序列x(t)的EMD分解表達式為:
(2)
長短期記憶(long short-term memory,簡稱LSTM)[19-22]神經(jīng)網(wǎng)絡(luò)是一種特殊的循環(huán)神經(jīng)網(wǎng)絡(luò),解決了傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡(luò)的梯度消失和爆炸問題,對時間序列具有較強的學(xué)習(xí)能力,因此,長短期記憶(LSTM)神經(jīng)網(wǎng)絡(luò)可以處理復(fù)雜的非線性長時間序列[23-24]。在LSTM體系結(jié)構(gòu)中,有三種特殊的結(jié)構(gòu)賦予了其在長時間序列中處理相關(guān)性的能力,它們分別是“遺忘門”“輸入門”和“輸出門”。以一個記憶單元為例,LSTM模型的結(jié)構(gòu)示意如圖1。
圖1 長短時記憶單元(LSTM)結(jié)構(gòu)示意Fig. 1 LSTM structure diagram
在LSTM神經(jīng)網(wǎng)絡(luò)是記憶單元中,“遺忘門”ft可控制上一記憶單元狀態(tài)Ct-1被遺忘的程度,“遺忘門”ft由上單元的輸出ht-1與本單元的輸入xt經(jīng)激活函數(shù)得到,其值域為[0,1],“0”表示完全遺忘,“1”表示完全保留?!斑z忘門”ft表示為:
ft=σ(Wxfxt+Whfht-1+bf)
(3)
式中:Wxf、Whf為“遺忘門”的權(quán)重系數(shù),bf為“遺忘門”的偏置系數(shù),σ為“sigmoid”激活函數(shù)。
it=σ(Wxixt+Whiht-1+bi)
(4)
(5)
(6)
式中:W為權(quán)重系數(shù),b為偏置系數(shù),σ為“sigmoid”激活函數(shù),符號“·”表示點乘積。
在LSTM神經(jīng)網(wǎng)絡(luò)是記憶單元中,“輸出門”可控制記憶單元的輸出,記憶單元的最終輸出由tanh函數(shù)激活更新后的單元狀態(tài)Ct,并通過“輸出門”,用數(shù)學(xué)表達式如下:
Ot=σ(Wxoxt+Whoht-1+bo)
(7)
ht=Ot·tanh(Ct)
(8)
式中:Wxo、Who為“輸出門”的權(quán)重系數(shù),bo為“輸出門”的偏置系數(shù),σ為“sigmoid”激活函數(shù),符號“·”表示點乘積。
海面平臺在復(fù)雜的海洋環(huán)境下,由于波浪力和其他干擾力的存在,平臺運動姿態(tài)的時間序列普遍具有復(fù)雜特性,對于這種非平穩(wěn)、非線性預(yù)報問題,通過對EMD算法和LSTM模型的研究,提出了基于EMD-LSTM的預(yù)測模型[25],用以實現(xiàn)平臺的極短期預(yù)報,整體的流程圖如圖2。
圖2 EMD-LSTM模型流程圖Fig. 2 EMD-LSTM flow chart
基于EMD-LSTM模型的預(yù)測步驟:
步驟一:先將待分析的時間序列進行預(yù)處理,即降低原始數(shù)據(jù)的采樣頻率,減少數(shù)據(jù)量,選取合適大小的數(shù)據(jù)集,在保證預(yù)測精度的前提下,降低訓(xùn)練時間;
步驟二:將處理過的時間序列通過EMD分解算法,分解得到n個本征模函數(shù)(IMF1,IMF2,……,IMFn)和殘差(Rn);
步驟三:對所有的IMF分量和殘差分別建立LSTM模型,對所有分量進行預(yù)測,將預(yù)測結(jié)果累加得到最終預(yù)測結(jié)果。
陵水17-2半潛式平臺位于南海北部西部大陸架瓊東南盆地北部,作業(yè)水深為1 220 m到1 560 m,為了研究陵水17-2半潛平臺的性能,在深水試驗池中完成模型試驗。選定模型縮尺比為1∶60,模型示意如圖3,平臺主尺度如表1。
圖3 陵水17-2半潛平臺模型示意Fig. 3 Sketch of the LS17-2 semi-submersible platform model
表1 平臺主尺度
深水試驗池尺寸為50 m×40 m×10 m(長×寬×深),模型的系泊錨鏈超過水池最大長度,因此采用等效截斷系泊系統(tǒng)代替原型,模型實物圖如圖4所示。試驗中采用電阻式浪高儀測量波浪波高、周期以及波面相對升高,采用非接觸式光學(xué)六自由度運動測量系統(tǒng)測量平臺模型重心處的六自由度運動。在波浪試驗過程中,為了避免瞬態(tài)效應(yīng),數(shù)據(jù)采集系統(tǒng)在模型運動達到穩(wěn)態(tài)后才開始采集所需的數(shù)據(jù)信號,穩(wěn)態(tài)后的采樣持續(xù)時間大于23.24分鐘(對應(yīng)實際3小時),采樣頻率為60 Hz[26]。試驗內(nèi)容包括:靜水衰減試驗;白噪聲不規(guī)則波試驗;不規(guī)則波風(fēng)浪流試驗。選取陵水17-2半潛平臺在4種不同波浪條件(如表2)下的垂蕩運動數(shù)據(jù)進行分析預(yù)測。
圖4 陵水17-2半潛平臺模型Fig. 4 LS17-2 semi-submersible platform model
表2 波浪條件
模型試驗中獲得的初始數(shù)據(jù)采樣頻率為60 Hz,根據(jù)采樣定理[27]在完整保留信號的情況下降低采樣頻率至12 Hz,處理后的數(shù)據(jù)換算成實船的采樣時間間隔為0.65 s,選取垂蕩數(shù)據(jù)中10 000個數(shù)據(jù)點,并預(yù)測之后的50個時間步,即預(yù)測之后的32 s,在Matlab中利用經(jīng)驗?zāi)B(tài)分解(EMD)算法將時間序列分為4個IMF分量和一個殘差分量,選取1號工況部分數(shù)據(jù)進行分解結(jié)果展示,如圖5。
圖5 經(jīng)驗?zāi)B(tài)分解結(jié)果Fig. 5 Empirical modal decomposition results
每個工況都選取預(yù)處理后的垂蕩時間序列數(shù)據(jù)中的10 000個數(shù)據(jù)點,對經(jīng)過分解的所有的IMF分量和殘差分別建立LSTM模型,因此,每個LSTM模型的數(shù)據(jù)集為10 000個數(shù)據(jù)點,共計20個數(shù)據(jù)集。所有IMF分量和殘差的LSTM模型訓(xùn)練集和測試集按4∶1劃分,每個訓(xùn)練集為8 000個數(shù)據(jù)點,測試集為2 000個數(shù)據(jù)點。隱藏層維度設(shè)置為250,迭代次數(shù)為100。
預(yù)測方法采用滑窗預(yù)測,用前50個數(shù)據(jù)點預(yù)測后一個,再用預(yù)測出的數(shù)據(jù)代替第一個數(shù)據(jù),即用xt-50、xt-49、……、xt-1預(yù)測xt,再用xt-49、xt-48、……、xt-1和預(yù)測出的xt預(yù)測xt+1,并依次向后滑動預(yù)測。將預(yù)測結(jié)果累加得到最終預(yù)測結(jié)果,將所提出的EMD-LSTM模型的預(yù)測結(jié)果同LSTM模型和EMD-BP模型的預(yù)測結(jié)果進行比較,比較結(jié)果如圖6。
圖6 不同模型預(yù)測結(jié)果對比Fig. 6 Comparison of prediction results of different models
從圖6中可以看到EMD-LSTM模型的預(yù)測曲線與實際值的變化趨勢基本相同,較其他模型預(yù)測誤差小,可以看出所提出模型的優(yōu)越性。從預(yù)測結(jié)果圖形上看,EMD-LSTM模型的有效預(yù)測時間達20 s,相比之下,LSTM模型和EMD-BP模型有效預(yù)測時間大概為5~10 s,所以在處理極短期運動響應(yīng)的預(yù)測問題上,EMD-LSTM模型有較好的效果。
對傳統(tǒng)的LSTM模型預(yù)測結(jié)果通常使用兩個評價標準,即均方根誤差(RMSE)和平均絕對百分比誤差(MAPE),其中均方根誤差衡量的是預(yù)測結(jié)果和事實的平均誤差,而平均絕對百分比誤差直觀的表示了誤差的百分比,其計算公式分別為:
(9)
(10)
由于此次使用的試驗數(shù)據(jù)為平臺模型的垂蕩數(shù)據(jù),實際值存在零點,所以無法使用平均絕對百分比誤差(MAPE),即采用均方根誤差(RMSE)作為預(yù)測結(jié)果的整體評價標準。同時實際工程中對極值也是十分關(guān)心,而預(yù)報模型一般預(yù)測都偏保守,即對極值預(yù)測的絕對值都偏小,因此對極值預(yù)測結(jié)果的評價有利于判斷預(yù)測模型的好壞,本文采用均方根誤差(RMSE)和絕對百分比誤差(MAPE)對極值預(yù)測結(jié)果進行評估。
計算不同方法的均方根誤差隨預(yù)測時間變化,得到如圖7的結(jié)果。計算各模型的5 s、10 s和20 s處的均方根誤差,加粗為每組最優(yōu)值,結(jié)果如表3所示。分別計算不同預(yù)測方法的前三個極值的均方根誤差和絕對百分比誤差,加粗為每組最優(yōu)值,結(jié)果如表4所示。
圖7 不同模型的均方根誤差Fig. 7 Root mean square error of different models
從圖7、表3和表4可以十分明顯地看出,提出的EMD-LSTM模型預(yù)測精度最高。分析結(jié)果表明:
1) 比較表3中EMD-LSTM和LSTM模型在各工況5 s、10 s和20 s處的均方根誤差,可以看出EMD-LSTM模型的預(yù)測誤差一直小于LSTM模型,這表明在LSTM直接預(yù)測中,由于運動響應(yīng)數(shù)據(jù)包含復(fù)雜的頻域信息,難以提取足夠多的信息,而EMD分解算法將組成原始信號的各尺度分量不斷從高頻到低頻進行提取,有助于減輕原始時間序列的噪聲,平穩(wěn)的信號分量更有利于LSTM模型去預(yù)測,從而獲得更好地預(yù)測效果。
2) 由表3中EMD-LSTM和EMD-BP模型在各工況5 s、10 s和20 s處的均方根誤差,可以看出除4號工況外,EMD-BP模型只在前10個時間步(5~10 s)預(yù)測效果尚可,但之后誤差陡增,這是BP網(wǎng)絡(luò)無法將信息在時間維度上從前往后的傳遞和積累,而LSTM網(wǎng)絡(luò)可以處理長時間序列,完成時間維度上的長期記憶問題。
表3 不同模型均方根誤差比較
3) 在實際工程中十分關(guān)心的極值的預(yù)測,從表4可以看出在預(yù)測前三個極值時,EMD-LSTM模型也表現(xiàn)得最好。EMD-LSTM模型在各工況下的預(yù)測結(jié)果平均絕對百分比誤差(MAPE)分別為5.03%、3.47%、11.94%、5.80%,在每個工況下表現(xiàn)都為最優(yōu);EMD-LSTM模型在各工況下的預(yù)測結(jié)果均方根誤差(RMSE)分別為0.1876、0.1968 、0.0427、0.0189,在每個工況都遠好于另兩種模型,其中在1號工況下表現(xiàn)最為優(yōu)異,均方根誤差是LSTM模型預(yù)測結(jié)果的53%,是EMD-BP模型預(yù)測結(jié)果的13%。
表4 不同模型極值誤差比較
采用EMD分解算法將復(fù)雜的、非線性的平臺垂蕩運動響應(yīng)時間序列分解成平穩(wěn)的信號分量,隔離了不同尺度的垂蕩運動響應(yīng)數(shù)據(jù)之間的相互影響,而LSTM模型不同于以往的循環(huán)神經(jīng)網(wǎng)絡(luò),其處理長時間序列的能力十分突出,利用LSTM模型對不同分量分別建立預(yù)測模型,最后將各序列預(yù)測結(jié)果相加,得到最終預(yù)測。對比結(jié)果表明,將EMD算法和LSTM模型結(jié)合起來的復(fù)合方法大大提高了模型的預(yù)測能力與預(yù)測精度,相較于單一的LSTM模型、處理長時間序列能力較弱的EMD-BP模型,對處理復(fù)雜的非平穩(wěn)非線性時間序列具有更好的效果,并且預(yù)測速度較快,具有實際工程意義。EMD-LSTM模型可以成功預(yù)測,本質(zhì)上利用了運動的連續(xù)性和運動不會突變的性質(zhì),因此可以對運動響應(yīng)時間序列的歷史數(shù)據(jù)進行訓(xùn)練,然后完成極短期預(yù)測。目前僅對試驗?zāi)P蛿?shù)據(jù)進行預(yù)報,下一步,將利用原型數(shù)據(jù)進行預(yù)報比較誤差;同時從提取信號關(guān)鍵特征入手,提高預(yù)測模型的可靠性,進一步優(yōu)化對非線性效應(yīng)明顯的情況下的運動響應(yīng)預(yù)測,并繼續(xù)研究屬于低頻運動的縱蕩和橫蕩,對其進行分析預(yù)測。