孫乾洋, 周 利, 丁仕風, 劉仁偉, 丁 一
(1. 江蘇科技大學 船舶與海洋工程學院,江蘇 鎮(zhèn)江 212100;2. 上海交通大學 船舶海洋與建筑工程學院,上海 200240)
隨著全球氣候變化和冰川融化,北極航線的開放時間更長,極地航運和資源開發(fā)已成為國際上關(guān)注的焦點問題,吸引了越來越多的關(guān)于極地船舶冰區(qū)航行的研究工作.其中,準確預報冰阻力是科學評價船舶極地航行能力的重要指標,能夠有效提高航行安全.由于船舶破冰是一種復雜的非線性動態(tài)響應(yīng)過程,以及海冰本構(gòu)模型的復雜性,所以國內(nèi)外還沒有一種準確且被廣泛使用的冰阻力預報方法.
在冰阻力研究中,需要深刻地理解冰況、船體幾何形狀和船-冰作用過程.目前冰阻力計算方法主要有經(jīng)驗和半經(jīng)驗公式方法、冰池模型試驗、全尺度試驗方法、數(shù)值分析方法,其中最可靠的是冰池模型試驗和全尺度試驗,但它們既昂貴又耗時.數(shù)值分析是計算冰阻力的一種很好的替代方法,但它依賴于對船-冰相互作用機理的理解[1],往往會對一些條件進行簡化和假設(shè),從而對分析結(jié)果產(chǎn)生影響.常用的方法是經(jīng)驗半經(jīng)驗公式方法,但每種經(jīng)驗半經(jīng)驗公式都有其各自的適用范圍、應(yīng)用背景和基本假定,因此,在某些情況下,與模型試驗對比,其計算誤差高達40%[2].此外,大多數(shù)經(jīng)驗半經(jīng)驗公式將總阻力劃分為不同的分量來預測平整冰作用下的阻力,關(guān)于冰道中有碎冰的阻力研究較少,因此,需要一種新的具有較高精度的模型來進行冰阻力預報.
近年來,機器學習方法被廣泛應(yīng)用于海洋工程領(lǐng)域中,其中,人工神經(jīng)網(wǎng)絡(luò)(ANN)方法在許多領(lǐng)域中得到了應(yīng)用,相較于回歸模型和其他統(tǒng)計方法,ANN具有更好的靈活性和泛化效果,能更好地處理復雜非線性問題.本文參考傳統(tǒng)經(jīng)驗半經(jīng)驗公式,選取合適的輸入特征量,以船舶模型試驗數(shù)據(jù)為ANN模型的訓練數(shù)據(jù),對訓練數(shù)據(jù)進行數(shù)據(jù)預處理和皮爾遜相關(guān)性分析,構(gòu)建徑向基(RBF)模型并用遺傳算法(GA)進行網(wǎng)絡(luò)優(yōu)化.將實船試驗和模型試驗作為驗證對象,與RBF和遺傳算法優(yōu)化徑向基(RBF-GA)神經(jīng)網(wǎng)絡(luò)模型預報結(jié)果進行對比分析.
自動分析建模的機器學習方法可用于處理復雜非線性問題,例如函數(shù)近似、分類和回歸,ANN是機器學習領(lǐng)域中一種常用的方法.ANN是模仿人類思維的一種方式,是以工程技術(shù)手段模擬人腦神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和功能特征的系統(tǒng),從本質(zhì)上講,它是一個大規(guī)模并行的非線性動態(tài)系統(tǒng)[3].雖然單個神經(jīng)元結(jié)構(gòu)簡單,功能有限,但由多個神經(jīng)元組成的網(wǎng)絡(luò)系統(tǒng)具有良好的泛化能力.ANN由一組算法組成,這些算法通過輸入數(shù)據(jù)集進行訓練,以找出目標問題的最優(yōu)假設(shè)函數(shù),它已被證實是解決高維度非線性問題的一種可行和實用的方法.輸入特征量(如船長和冰厚等)的數(shù)量對輸出結(jié)果的可靠性有著重要影響,其數(shù)量越多,代表著訓練模型的穩(wěn)定性越好,但在選擇特征量時,重點是要在方差和偏差之間建立良好的平衡,以便為預測提供良好的泛化效果.
ANN方法近年來得到了快速發(fā)展,已成功應(yīng)用于許多工程領(lǐng)域,在海洋工程領(lǐng)域的應(yīng)用相對新穎,研究人員正在探索將其應(yīng)用于解決不同問題.Koushan[4]應(yīng)用ANN方法預測船舶阻力和濕表面積,并使用多個拖曳試驗結(jié)果驗證了該模型.Couser等[5]成功地使用ANN預測雙體船的船體阻力.Cui等[6]開發(fā)了一種基于機器學習的船舶設(shè)計優(yōu)化方法.Yang等[7]提出了一種基于RBF算法的集裝箱船阻力預報模型,用于預測集裝箱船在不同吃水下的阻力.陳愛國等[8]以60艘船舶模型試驗為數(shù)據(jù)集,提出了一種基于ANN方法的船舶阻力預報模型.張喬宇等[9]提出了一種基于經(jīng)典機器學習回歸預測模型,以預報船舶阻力.Kim等[10]介紹了一種基于ANN的冰阻力預報方法,用于預測船舶在平整冰中的航行阻力.Islam[11]提出了一種機器學習技術(shù),用于船舶在敞水和冰上性能預測.Zhang等[12]提出了一種可解釋的ANN冰阻力預報模型,在此基礎(chǔ)上開展了冰厚和船速分布的統(tǒng)計分析工作,將冰阻力預報ANN模型應(yīng)用于評估船舶在冰雪覆蓋水域的運行情況.目前,基于ANN方法的冰阻力預報研究相對較少,在已有的研究中,冰阻力預報精度在一定范圍內(nèi)都比較準確.然而,要獲得一個更先進、預測誤差更低的模型,還有很多需要研究的內(nèi)容.
要建立一個可靠的極地船舶冰阻力預報模型,必須具有良好的非線性映射能力、泛化能力和高效的計算能力.RBF神經(jīng)網(wǎng)絡(luò)是一種三層前向神經(jīng)網(wǎng)絡(luò)[13-14],其學習收斂速度快,能夠快速逼近任意非線性函數(shù),因此RBF神經(jīng)網(wǎng)絡(luò)已被廣泛應(yīng)用于函數(shù)逼近、模式識別和非線性控制等領(lǐng)域.
為了建立一個可靠的冰阻力預報模型,選擇合適的神經(jīng)網(wǎng)絡(luò)輸入?yún)?shù)至關(guān)重要,目前6種常用的半經(jīng)驗公式可以為模型的輸入特征選擇提供重要依據(jù).為了選擇合適的神經(jīng)網(wǎng)絡(luò)輸入特征,研究了半經(jīng)驗公式中使用的參數(shù).根據(jù)6種常用的半經(jīng)驗公式,討論了一些影響冰阻力的主要參數(shù):
(1) Lewis等[15]總結(jié)了“風”級破冰船在冰海中航行的實船試驗、 “風”級破冰船的模型試驗、M-5和M-9船舶在淡水冰中的模型試驗以及在鹽水冰中的試驗的冰阻力數(shù)據(jù).根據(jù)這些數(shù)據(jù),提出了冰阻力預報公式,假定為船速、冰厚度、冰密度和冰彎曲強度的函數(shù).
(2) Vance[16]根據(jù)USCG Katmai Bay的全尺度試驗,開發(fā)了一套與船舶長度和寬度相關(guān)的最佳回歸方程,以預測破冰船航行阻力.
(3) Zahn等[17]通過USCG Mobile Bay全尺度試驗,提出了冰阻力公式.阻力是船舶主尺度和冰厚的函數(shù).
(4) Lindqvist[18]根據(jù)在波的尼亞海灣進行的實船試驗開發(fā)了冰阻力預報公式,冰阻力分力主要分為破碎、彎曲和浸沒,公式表示為船舶主尺度、船體形狀系數(shù)、冰厚、冰摩擦系數(shù)和冰彎曲強度的函數(shù).
(5) Riska等[19]通過更新Ionov[20]和Lindqvist[18]的方程,提出了平整冰的阻力預測公式.這些方程式基于一組經(jīng)驗系數(shù),這些系數(shù)來自波羅的海多艘船舶的全尺寸試驗.該公式顯示了冰阻力與船速之間的線性關(guān)系.
(6) 考慮到5艘破冰船,Keinonen等[21]也進行了冰阻力預測研究.這些公式與船舶尺寸、船型、冰彎曲強度和環(huán)境溫度等條件有關(guān).
上述6個公式很好地說明了影響冰阻力的主要因素,主要參數(shù)如表1所示.
表1 經(jīng)驗和半經(jīng)驗公式主要參數(shù)Tab.1 Main parameters of empirical and semi-empirical formula
從表中可以看出,船長、船寬、船速、冰厚和彎曲強度被各經(jīng)驗半經(jīng)驗公式廣泛采用,而水線角、彈性模量和雪厚采用較少.結(jié)合參數(shù)在模型試驗和實船試驗中出現(xiàn)的頻次,且ANN本身不受輸入特征物理特性的影響,本研究選取7個特征參數(shù)輸入,分別為:船長、船寬、吃水、首柱傾角、船速、冰厚和彎曲強度,輸出為冰阻力.對特征輸入和冰阻力之間進行皮爾遜相關(guān)系數(shù)分析,并對數(shù)據(jù)集進行歸一化處理.
在搭建可靠的ANN模型時,數(shù)據(jù)集尤為重要.為確保模型的預報質(zhì)量,充分和全面的數(shù)據(jù)準備是前提.由于全尺度試驗數(shù)據(jù)較少,本研究選取來自18個不同的模型試驗中140余組數(shù)據(jù)作為數(shù)據(jù)集,其中數(shù)據(jù)集分為訓練集和驗證集,分割比例為 8∶2,相關(guān)論文研究和船舶[1-2,22-34]如表2所示.所有訓練數(shù)據(jù)根據(jù)給定的比例因子λ放大到全尺度,模型試驗數(shù)據(jù)換算到全尺度的相似關(guān)系,如表3所示[35].
表2 冰阻力預報模型數(shù)據(jù)集來源Tab.2 Source of data set of ice resistance prediction model
表3 冰區(qū)船舶建模的相似性關(guān)系[35]Tab.3 Similarity relations for modeling vessels in ice areas[35]
理想情況下,船舶全尺度試驗是確定船舶冰阻力的最準確、可靠的方法.但由于其昂貴性、耗時性以及不可重復性,所以,大多數(shù)情況下通過船舶模型試驗進行替代.由于尺度效應(yīng),將模型試驗數(shù)據(jù)轉(zhuǎn)換為全尺度試驗數(shù)據(jù)時會存在一定的誤差性.Schwarz[36]比較了破冰船CCGS FRANKLIN號模型試驗和全尺度試驗的冰阻力,結(jié)果表明,誤差在8%以內(nèi),模型試驗可用于船舶初步設(shè)計.因此,本文選用船舶模型試驗數(shù)據(jù)作為ANN數(shù)據(jù)集.
為了提高神經(jīng)網(wǎng)絡(luò)模型的收斂速度和預報精度,需要對特征量進行縮放,使維數(shù)保持在可比范圍內(nèi),本研究使用歸一化方法進行特征量縮放,使訓練后得到的每個特征量權(quán)重處于同一尺度上.歸一化公式如下,縮放后的特征量范圍在[0,1]之間,數(shù)據(jù)集歸一化前后對比如圖1所示.從圖1中可以看出,歸一化前的輸入輸出特征值不在可比范圍內(nèi),各特征量之間幾乎互不影響,歸一化后的各特征量之間是相互影響的.
圖1 數(shù)據(jù)集歸一化前后對比Fig.1 Comparison of data sets before and after normalization
(1)
式中:zmax和zmin分別為一個特征量的最大值和最小值;z和z′分別為歸一化前后的數(shù)據(jù).
為了量化輸入特征量和輸出之間的線性關(guān)系,引入皮爾遜相關(guān)系數(shù)ρx,y[37]:
(2)
式中:cov(x,y)為變量x和y的協(xié)方差;μ為變量x和y的均值,其中x和y都是經(jīng)過歸一化的;σx和σy為x和y的標準偏差;E為數(shù)學期望.
表4給出了7個輸入特征量和冰阻力之間的線性相關(guān)性.從表中可以看出,船寬、船長、吃水和冰厚與冰阻力之間高度相關(guān),而首柱傾角和彎曲強度對冰阻力的依賴性相對較小,船速和冰阻力之間幾乎沒有相關(guān)性.
表4 特征選擇和皮爾遜相關(guān)系數(shù)Tab.4 Feature selection and Pearson correlation coefficient
在船舶模型試驗時,數(shù)據(jù)和參數(shù)的選擇記錄受試驗本身環(huán)境的影響,一些因素可能會被理想化或忽略.例如,Lindqvist公式?jīng)]有考慮破碎強度對冰阻力的影響,這對于破碎強度較低的波羅的海的冰況來說可能是合理的,但在其他海域的船舶全尺度試驗中,當冰的破碎強度非常大時,總冰阻力可能會被低估.由于皮爾遜相關(guān)系數(shù)僅依賴于數(shù)據(jù)庫,從表4中可以看出,船速和冰阻力之間的皮爾遜相關(guān)系數(shù)最小,這并不代表船速對冰阻力的影響最小,皮爾遜相關(guān)系數(shù)僅度量線性關(guān)系,即使相關(guān)系數(shù)為0,也可能存在有意義的關(guān)系.
RBF神經(jīng)網(wǎng)絡(luò)屬于前向神經(jīng)網(wǎng)絡(luò)[38],網(wǎng)絡(luò)的輸出是由輸入和神經(jīng)元參數(shù)組成的RBF函數(shù)的線性組合,其結(jié)構(gòu)如圖2所示.圖中:ui和wij分別為輸入到隱藏層、隱藏層到輸出的權(quán)值;c1~cj為隱藏層神經(jīng)元;‖xp-ci‖為歐氏范數(shù);xp為第p個輸入樣本;ci為高斯函數(shù)的中心;σ為高斯函數(shù)的方差.
圖2 RBF神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.2 Structure of RBF neural network
RBF神經(jīng)網(wǎng)絡(luò)的激活函數(shù)可以表示為
(3)
式中:i=1,2,…,n,n為網(wǎng)絡(luò)輸出節(jié)點數(shù).
輸出層的表達函數(shù)為
(4)
式中:cj為網(wǎng)絡(luò)隱含層結(jié)點的中心;wij為隱含層到輸出層的連接權(quán)值;h為隱含層結(jié)點數(shù);yj為輸入樣本對應(yīng)的網(wǎng)絡(luò)輸出結(jié)點的實際輸出.
RBF和RBF-GA模型的函數(shù)關(guān)系分別表示為
式中:W1是一組146×1的矩陣;b1是一組10×1的矩陣.
GA是模仿自然界生物進化機制發(fā)展起來的隨機全局搜索和優(yōu)化方法,其本質(zhì)是一種高效、并行、全局搜索的方法,能在搜索過程中自動獲取和積累有關(guān)搜索空間的信息,并自適應(yīng)地控制搜索過程以求得最佳解.
RBF-GA神經(jīng)網(wǎng)絡(luò)是用GA來優(yōu)化RBF神經(jīng)網(wǎng)絡(luò)的初始權(quán)值和閾值,使優(yōu)化后的RBF神經(jīng)網(wǎng)絡(luò)能更好地預測函數(shù)輸出.RBF-GA神經(jīng)網(wǎng)絡(luò)包括種群初始化、適應(yīng)度函數(shù)、選擇操作、交叉操作和變異操作.在GA中,將問題的候選解用染色體表示,實現(xiàn)解空間向編碼空間的映射,然后用隨機數(shù)初始化一個種群,種群里的個體即為編碼,根據(jù)個體得到RBF神經(jīng)網(wǎng)絡(luò)的初始權(quán)值和閾值,把網(wǎng)絡(luò)預測輸出和期望輸出之間的誤差絕對值和E作為個體適應(yīng)度值F.用選擇函數(shù)擇優(yōu)選擇,讓個體基因變異,產(chǎn)生子代,重復上述步驟,直到新種群的產(chǎn)生,其流程如圖3所示.
圖3 GA流程圖Fig.3 Flow chart of GA
其中,適應(yīng)度函數(shù)為
(6)
式中:yi為RBF神經(jīng)網(wǎng)絡(luò)第i個節(jié)點的期望輸出;oi為第i個節(jié)點的預報值;k為系數(shù).
圖4為GA優(yōu)化過程匯總的最佳個體適應(yīng)度值和GA優(yōu)化RBF網(wǎng)絡(luò)的預測誤差.從圖4(a)中可以看出,GA優(yōu)化過程中,適應(yīng)度值隨著迭代次數(shù)的增加而快速減小,在迭代次數(shù)40以后趨于平緩,并在迭代次數(shù)為100時尋得最佳個體適應(yīng)度值,其最大迭代次數(shù)為100.在圖4(b)中,預測樣本為從訓練集中選取的30余組數(shù)據(jù),其中,藍色為實驗值,橙色為預報值.可以看出,經(jīng)過GA優(yōu)化后的模型預報值與實驗值較為接近,其預報值呈現(xiàn)出較高的準確性和可靠性.表5為RBF-GA的超參數(shù)值.
圖4 GA優(yōu)化過程Fig.4 Optimization process of GA
表5 RBF-GA的超參數(shù)值Tab.5 Hyperparametric value of RBF-GA
RBF-GA的函數(shù)關(guān)系如下:
(7)
σ2=0.2
W2=
式中:W2是一組146×7的矩陣;b2是一組10×1的矩陣.
本節(jié)以一艘標準破冰船[39]為研究對象,該船的模型試驗是在兩種給定的冰厚條件下進行的,其冰厚分別為0.97 m和1.57 m.圖5為按比例放大的冰阻力測量值和RBF、RBF-GA模型預測的冰阻力Rice.
圖5 在不同冰厚下的冰阻力模型預報Fig.5 Ice resistance model prediction at different ice thicknesses
從圖5中可以看出,RBF模型預報的冰阻力沒有顯著變化,RBF-GA模型預報結(jié)果隨著船速的增加而增加.當冰厚為0.97 m時,RBF模型的預報值比測量值低得多,其平均誤差為15.5%,RBF-GA模型的預報值比測量值偏高,其平均誤差為8.6%.當冰厚為1.57 m時,RBF模型的預報值基本穩(wěn)定在950 kN,其平均誤差為32.5%,RBF-GA模型的預報值與實測值趨勢一致,其平均誤差為7.2%.可觀察到,在不同的冰厚下,隨著船速增加,RBF-GA 模型的預報誤差約在8%,其與RBF模型相比,精度得到了明顯的提高.
選用破冰船PSV的模型實驗[40]數(shù)據(jù)進行預報分析,數(shù)據(jù)按比例放大到全尺度,預報結(jié)果如圖6所示.從圖6中可以看出,RBF-GA模型預報值與實測值最為接近,隨著船速的增加,其預報值和實測值趨勢一致,與實測值相比,平均誤差為8.2%,當v=0.5 m/s時,兩者結(jié)果基本一致.RBF模型在進行阻力預報時,隨著船速的增加,其預報值基本不變,與實測值相比,平均誤差為17.5%.
圖6 基于ANN模型的破冰船PSV冰阻力預報Fig.6 Ice resistance prediction of ice breaker PSV based on ANN model
Tor Viking II是一艘多用途破冰船,以該船在波羅的海北部的試驗[1]為例,將RBF、RBF-GA模型預報結(jié)果與測量值進行比較分析,如圖7所示.從圖7中可以看出,當v<0.5 m/s時,RBF和RBF-GA預報值是實測值的幾倍之多,其原因可能在于訓練樣本集中,當v=0~0.5 m/s時,冰阻力數(shù)據(jù)過少,從而導致模型在預測船舶低速航行下的冰阻力時,產(chǎn)生了較大的偏差.隨著船速的增加,兩個模型預報值與實測值誤差也隨之減小,當v=2~6 m/s時,RBF模型預報值與實測值之間的平均誤差為11.9%,RBF-GA模型預報值與實測值更為接近,平均誤差為7.4%.隨著船速的增加,RBF模型預報值幾乎不變;而RBF-GA模型預報值與實測值趨勢一致,在一定程度上說明了經(jīng)過GA優(yōu)化后的RBF模型對船速的敏感性優(yōu)于未被優(yōu)化的RBF模型.
圖7 基于ANN模型的Tor Viking II 冰阻力預報Fig.7 Ice resistance prediction of Tor Viking II based on ANN model
提出一種基于ANN的極地船舶冰阻力預報模型,介紹兩種神經(jīng)網(wǎng)絡(luò)預測方法:RBF和RBF-GA,將兩種預報模型與船舶模型試驗和全尺度試驗進行對比分析,考慮了在不同冰厚和船速下的模型預報結(jié)果,得出的主要結(jié)論如下:
(1) RBF-GA模型具有良好的泛化效果,對冰厚和船速的敏感性優(yōu)于RBF模型,能夠準確預報冰阻力,其平均誤差在8%左右.
(2) 在高質(zhì)量且充足的數(shù)據(jù)前提下,特征量歸一化是保持每個特征權(quán)重在可比范圍內(nèi)的關(guān)鍵,可以有效確保預測結(jié)果的穩(wěn)定性和準確性.
(3) 在數(shù)據(jù)庫中,平整冰條件下的船舶試驗數(shù)據(jù)較多,這使得神經(jīng)網(wǎng)絡(luò)模型在平整冰條件下的預報結(jié)果更加準確.低速航行時,預報誤差較大,這可能由于訓練樣本缺少船舶低速試驗數(shù)據(jù).
(4) 船速和冰阻力之間的皮爾遜相關(guān)系數(shù)最小,這并不代表船速對冰阻力的影響最小.皮爾遜相關(guān)系數(shù)僅衡量線性關(guān)系,即使系數(shù)為0,也不代表著沒有相關(guān)性.