范若楠,曾 進(jìn),任慶生,李 斌
(1. 中國船舶重工集團(tuán)公司 第705研究所,陜西 西安,710075; 2. 上海交通大學(xué)數(shù)學(xué)系,上海,200240; 3. 上海交通大學(xué) 計算機科學(xué)與工程系,上海,200240)
基于神經(jīng)網(wǎng)絡(luò)響應(yīng)面的魚雷總體性能參數(shù)仿真優(yōu)化方法
范若楠1,曾進(jìn)2,任慶生3,李斌1
(1. 中國船舶重工集團(tuán)公司 第705研究所,陜西 西安,710075; 2. 上海交通大學(xué)數(shù)學(xué)系,上海,200240; 3. 上海交通大學(xué) 計算機科學(xué)與工程系,上海,200240)
利用水聲尋的仿真進(jìn)行魚雷總體性能參數(shù)優(yōu)化匹配時,需要獲取大量的仿真樣本數(shù)據(jù),為節(jié)省優(yōu)化時間,節(jié)約優(yōu)化成本,提出了一種基于神經(jīng)網(wǎng)絡(luò)響應(yīng)面(NN-RSM)的魚雷總體性能參數(shù)仿真優(yōu)化方法。利用神經(jīng)網(wǎng)絡(luò)構(gòu)建能夠快速計算的響應(yīng)面,并通過空間映射方法獲得水聲仿真系統(tǒng)的最優(yōu)解,最后利用該方法對自導(dǎo)作用距離、毀傷半徑等魚雷總體性能指標(biāo)進(jìn)行了仿真優(yōu)化。優(yōu)化結(jié)果顯示,該方法不僅能夠獲得原問題有效的優(yōu)化結(jié)果,且優(yōu)化計算時間小于普通優(yōu)化方法的1/20。該方法可以進(jìn)一步拓展應(yīng)用到其他復(fù)雜系統(tǒng)多參數(shù)、多目標(biāo)的仿真優(yōu)化中。
魚雷; 總體性能優(yōu)化; 神經(jīng)網(wǎng)絡(luò); 響應(yīng)面; 空間映射
魚雷是極具特色的水下精確制導(dǎo)武器,如何根據(jù)作戰(zhàn)需求優(yōu)化設(shè)計魚雷總體性能指標(biāo),提高魚雷實際作戰(zhàn)環(huán)境中的效能,始終是魚雷型號研制和總體技術(shù)研究的重點。這方面的相關(guān)研究很多,黃科人等用遺傳算法探討了大深度魚雷發(fā)射管的優(yōu)化設(shè)計方法[1]; 段富海等人通過對控制器參數(shù)離線尋優(yōu)等方式設(shè)計了非線性魚雷系統(tǒng)彈道深度控制器[2]; 郭勍等人基于廣義功極小值原理初步研究了魚雷的姿態(tài)最優(yōu)控制和最優(yōu)制導(dǎo)問題[3]; 聶衛(wèi)東等人基于龐特里亞金(Pontryagin)極小值原理研究了輕型反潛魚雷的最優(yōu)垂直命中導(dǎo)引律[4]。但利用水聲尋的仿真進(jìn)行魚雷總體性能的優(yōu)化研究始終是魚雷研究中的難點,也是迫切需要解決的研究熱點。
目前魚雷總體設(shè)計的研究領(lǐng)域包括雷體線型、鰭舵、推進(jìn)器、殼體結(jié)構(gòu)、總體布置、彈道、聲學(xué)和可靠性等領(lǐng)域,這就使得用于研究其作戰(zhàn)效能的水聲尋的仿真系統(tǒng)構(gòu)成非常復(fù)雜,其基本組成原理框圖如圖1所示,也使得在此基礎(chǔ)上的性能參數(shù)優(yōu)化研究極具挑戰(zhàn)性。
圖1 魚雷全彈道數(shù)學(xué)仿真模型Fig. 1 Mathematical simulation model of torpedo?s complete trajectory
文章從節(jié)約計算成本出發(fā),首先建立一個能夠快速計算的基于神經(jīng)網(wǎng)絡(luò)響應(yīng)面的粗糙仿真模型。由于近似的神經(jīng)網(wǎng)絡(luò)響應(yīng)面與原仿真模型存在差異,使得這2個模型的最優(yōu)值與最優(yōu)值點不盡相同,從而導(dǎo)致在神經(jīng)網(wǎng)絡(luò)響應(yīng)面基礎(chǔ)上求得的最優(yōu)值與最優(yōu)值點往往不是原模型的最優(yōu)解,但與以往研究最大的不同是,尋優(yōu)算法并不直接在神經(jīng)網(wǎng)絡(luò)響應(yīng)面上求最優(yōu)解,而是借助于神經(jīng)網(wǎng)絡(luò)響應(yīng)面快速響應(yīng)的特點,利用空間映射方法引導(dǎo)尋優(yōu)過程,以較少的計算成本獲得原仿真模型的有效優(yōu)化結(jié)果,優(yōu)化計算時間可以從8 h左右減少到不足20 min。
文章以魚雷長度、沾濕表面積、自導(dǎo)作用距離、毀傷半徑、自導(dǎo)扇面寬度、末程攔截距離和比例導(dǎo)引法系數(shù)作為優(yōu)化參數(shù),以最小脫靶量和最短航程為優(yōu)化目標(biāo),這是一個典型的多參數(shù)、多目標(biāo)的優(yōu)化問題,其數(shù)學(xué)描述形式為
式中: x1為魚雷長度; x2沾濕表面積; x3為自導(dǎo)作用距離; x4為毀傷半徑; x5為自導(dǎo)扇面寬度;x6為末程攔截距離; x7為比例導(dǎo)引法系數(shù); R為引信作用距離; D為航程最大值。而f1( x1,x2,x3,x4,x5,x6,x7)為魚雷與目標(biāo)的最近距離,f2(x1,x2,x3,x4,x5,x6,x7)為魚雷航程,它們均由一個魚雷尋的—導(dǎo)引—命中全過程的、集成的仿真系統(tǒng)給出(見圖1)。
在給定魚雷長度等參數(shù)條件下,由于仿真計算過程涉及魚雷運行的全過程,因此由仿真程序計算目標(biāo)函數(shù)f1與f2的計算時間過于漫長,在目前常規(guī)的微機(CPU: 3 GHz; 內(nèi)存: 4 GB)上進(jìn)行一次計算需要近3.5 min,這使得在此基礎(chǔ)上的尋優(yōu)研究會面臨計算時間代價過大的問題(因為最優(yōu)解的質(zhì)量往往直接決定于解空間的搜索量,即仿真程序的計算次數(shù))。因此快速優(yōu)化算法的研究變得非常重要。
文章先利用神經(jīng)網(wǎng)絡(luò)響應(yīng)面建立一個快速的近似仿真模型,該模型雖然計算效果比已有仿真程序差,但計算速度快。然后在此基礎(chǔ)上利用空間映射方法,將大部分原先基于精確仿真模型的優(yōu)化工作轉(zhuǎn)移到神經(jīng)網(wǎng)絡(luò)響應(yīng)面,同時利用精確仿真模型進(jìn)行修正,從而能夠在較短的時間內(nèi)給出魚雷總體性能參數(shù)最優(yōu)化結(jié)果。
2.1BP算法
D.E.Rumelhart和J.L.McClelland提出了一種利用誤差反向傳播訓(xùn)練算法的神經(jīng)網(wǎng)絡(luò),簡稱BP(back propagation)神經(jīng)網(wǎng)絡(luò)[5]。它是一種有隱含層的前饋系統(tǒng)。若網(wǎng)絡(luò)的輸入節(jié)點為M,輸出節(jié)點數(shù)為L,則該網(wǎng)絡(luò)可以看作一個從M維歐氏空間到L維歐氏空間的非線性映射,因此這種網(wǎng)絡(luò)模型在非線性函數(shù)逼近中獲得廣泛應(yīng)用。
BP算法的中心思想是通過調(diào)整權(quán)值來使得網(wǎng)絡(luò)的總誤差最小,其學(xué)習(xí)過程是一種誤差向后傳播并修正權(quán)系數(shù)的過程。在運用BP學(xué)習(xí)算法的時候,實際上有正向和反向傳播2個階段,正向傳播過程中,輸入信息從輸入層經(jīng)過隱含層逐層處理,最后傳向輸出層; 其中,每一層神經(jīng)元的狀態(tài)只影響下一層神經(jīng)元的狀態(tài)。如果輸出層的輸出結(jié)果與期望值有偏差,則進(jìn)入反向傳播,依據(jù)誤差來修改各層的權(quán)值,使誤差信號最小。
圖2為具有一個隱含層的BP網(wǎng)絡(luò),其中輸入節(jié)點有M個,分別為x1,x2,…,xM,輸出節(jié)點有L個,網(wǎng)絡(luò)的隱含層共有Q個神經(jīng)元。
當(dāng)隱層使用S型函數(shù),輸入和輸出層使用線性函數(shù)時,神經(jīng)網(wǎng)絡(luò)可對任意連續(xù)函數(shù)進(jìn)行逼近,而增加隱層可以在一定程度上減小網(wǎng)絡(luò)規(guī)模,提高推廣能力。圖2中的Wih和Whj是待定參數(shù),稱為權(quán)值,可通過樣本學(xué)習(xí)獲得。
圖2 具有隱含層的BP網(wǎng)絡(luò)Fig. 2 BP networks with hidden layer
2.2學(xué)習(xí)樣本點的獲取
響應(yīng)面方法以試驗設(shè)計為基礎(chǔ),試驗設(shè)計對模型精度有很大影響,需要能夠反映設(shè)計空間特性的樣本點,樣本點選取的好壞對后面近似模型的精確度和問題的優(yōu)化起著非常重要的作用。
采用拉丁超立方方法[6]進(jìn)行樣本點的選取。拉丁超立方體抽樣(latin hypercube sampling,LHS)是一種對抽樣分布全面分層,再從每層中隨機取值的方法。它使得輸入組合相對均勻地填滿整個試驗區(qū)間,每個因素的設(shè)計空間都被均勻劃分,并且所有因素都有同樣數(shù)目的分區(qū),每一個因素的每個水平只被研究一次。
LHS能夠以較少的樣本點反映整個設(shè)計空間的特性,成為一種有效的樣本縮減技術(shù),具有效率高,均衡性能好的優(yōu)點。
LHS方法需假設(shè)在n維向量空間里抽取m個樣本,具體步驟如下。
1)將每一維分成互不重疊的m個區(qū)間,使得每個區(qū)間有相同的概率(通??紤]一個均勻分布,這樣區(qū)間的長度相同);
2)在每一維里的每一個區(qū)間中隨機的抽取一個點;
3)再從每一維里隨機抽出步驟2)中選取的點,將它們組成樣本向量。
2.3神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)效果
由于本問題的復(fù)雜性,通過LHS方法分別構(gòu)造了規(guī)模為3 000的學(xué)習(xí)樣本集和規(guī)模為200的測試樣本集。在仿真研究中采用的網(wǎng)絡(luò)結(jié)構(gòu)為7個輸入單元和1個輸出單元,對不同的隱層結(jié)構(gòu)做了仿真,結(jié)果如表1所示。
表1 神經(jīng)網(wǎng)絡(luò)仿真結(jié)果Table 1 Simulation results of neural network
從表中可以看到,學(xué)習(xí)誤差可以隨著網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜性的增加而降低,但相應(yīng)的測試誤差卻會增加,說明網(wǎng)絡(luò)結(jié)構(gòu)的復(fù)雜性增加時,對學(xué)習(xí)樣本的特征學(xué)習(xí)加強了,但卻產(chǎn)生了過學(xué)習(xí)的情況,網(wǎng)絡(luò)學(xué)習(xí)了過多的樣本細(xì)節(jié),卻未能充分反映樣本內(nèi)含的規(guī)律,導(dǎo)致不能很好處理未學(xué)習(xí)過的新樣本。這也同時說明,魚雷的仿真過程是一個極度復(fù)雜的強非線性系統(tǒng),針對這個復(fù)雜系統(tǒng),已經(jīng)為其設(shè)計了一個5層網(wǎng)絡(luò),但并沒有得到非常好的擬合效果。與原有的仿真系統(tǒng)計算結(jié)果相比,神經(jīng)網(wǎng)絡(luò)響應(yīng)面的計算結(jié)果還存在比較大的誤差。
為此,引入空間映射的概念,建立原仿真系統(tǒng)與神經(jīng)網(wǎng)絡(luò)響應(yīng)面的對應(yīng)關(guān)系,不是直接在神經(jīng)網(wǎng)絡(luò)響應(yīng)面上求解最優(yōu)值,而是利用神經(jīng)網(wǎng)絡(luò)響應(yīng)面的快速運算能力和快速尋優(yōu)能力去逼近原仿真系統(tǒng)的最優(yōu)值。
考慮如下優(yōu)化問題
對R分別建立精確模型Rf(xf)和粗糙模型Rc(xc)。精確模型Rf對于原系統(tǒng)R能夠準(zhǔn)確擬合,但計算速度慢,其最優(yōu)解即使能夠求解,計算成本也會非常高昂。粗糙模型Rc雖然只能大致反映原始系統(tǒng)R的特性,但計算速度快,能較快獲得其最優(yōu)解,但若直接將代入Rf則其值并不理想。為此,空間映射理論[7]假設(shè)精確模型和粗糙模型的變量空間之間存在映射P,滿足
圖3 空間映射Fig. 3 Space mapping
空間映射的優(yōu)勢在于把許多優(yōu)化工作放在粗糙空間中完成,而在精確空間中只進(jìn)行優(yōu)化結(jié)果的驗證,這樣能夠充分利用粗糙模型的快速高效性和精確模型的準(zhǔn)確性,以較少的計算成本獲得有效的優(yōu)化結(jié)果。
在最早提出的初始空間映射方法[7]中,會在附近隨機選擇一定數(shù)量的樣本點作為精確空間的初始設(shè)計點,然后逐個求出這些點在精確空間中的響應(yīng)值,再通過參數(shù)提取獲得相應(yīng)的粗糙空間設(shè)計基點,最后根據(jù)2個空間的樣本基點建立兩者的線性映射關(guān)系。
初始空間映射方法由于一開始要進(jìn)行一定量基點的精確計算,計算時間仍然比較長,且線性關(guān)系通常不足以反映2個空間之間的關(guān)聯(lián),因此提出了主動空間映射方法,該方法結(jié)合擬牛頓迭代法求解方程主動空間映射方法由粗糙模型最優(yōu)解獲得精確模型最優(yōu)解的估計值,每次精確模型計算結(jié)果都參與映射關(guān)系P的建立,通過Broyden 1階導(dǎo)數(shù)近似關(guān)系式對精確模型設(shè)計參數(shù)進(jìn)行預(yù)測和更新。該算法易實現(xiàn),計算效率高,其計算流程如下。
5)j=0,并重復(fù)以下步驟直至滿足一定的終止標(biāo)準(zhǔn):
目前已有的仿真系統(tǒng)能夠較好地模擬魚雷的尋的和攻擊目標(biāo)過程,直接將其作為精確模型。該精確模型在給定7個參數(shù)時能夠較準(zhǔn)確地給出相應(yīng)的性能指標(biāo)f,但計算時間約為3 min。如果直接在這一精確模型的基礎(chǔ)上進(jìn)行優(yōu)化,由于需要多次計算f的值,總的計算時間需要8 h以上。
與此同時,為該系統(tǒng)建立了一個基于神經(jīng)網(wǎng)絡(luò)響應(yīng)面的粗糙模型,其輸入輸出與精確模型相同,能夠大致反映原始魚雷系統(tǒng)的性能,計算速度快,利用這一粗糙模型進(jìn)行常規(guī)的優(yōu)化計算僅用20 s左右就能夠得到結(jié)果,但該結(jié)果如果直接代入精確模型,則所得到的實際輸出很差,即粗糙模型的最優(yōu)參數(shù)不能直接用于精確模型,需要進(jìn)行修正。
為此,文中使用了主動空間映射方法進(jìn)行優(yōu)化計算,圖4和圖5展現(xiàn)的是尋優(yōu)過程中所獲最優(yōu)值隨精確模型計算次數(shù)的變化情況,橫坐標(biāo)表示精確模型的計算次數(shù),縱坐標(biāo)表示所獲得的最優(yōu)解。圖4體現(xiàn)了傳統(tǒng)優(yōu)化算法的優(yōu)化過程,通過近150次精確模型的計算,耗時近8 h,得到精確模型的最優(yōu)值為0.346 1,即優(yōu)化目標(biāo)的最小值。圖5體現(xiàn)的是使用主動空間映射方法的優(yōu)化過程,在這個過程中,精確模型和粗糙模型都參與了計算,雖然粗糙模型的計算次數(shù)有400多次,但由于整個尋優(yōu)過程僅用到了5次精確模型的計算,整個計算過程耗時不到20 min,獲得的精確模型的最優(yōu)值為0.346 2。該結(jié)果與精確模型的最優(yōu)解結(jié)果一致,符合該問題在工程實際經(jīng)驗中的參數(shù)取值和優(yōu)化結(jié)果。表2為直接優(yōu)化方法與空間映射優(yōu)化方法得到的最優(yōu)值所對應(yīng)的優(yōu)化參數(shù)對比。由表中可以看出,2種算法得到的7個優(yōu)化參數(shù)差值比較小,參數(shù)差在參數(shù)搜索空間中的比例均不高于6%,說明當(dāng)空間映射方法的優(yōu)化結(jié)果收斂到最優(yōu)值時,其參數(shù)取值也收斂到一個較小的參數(shù)取值空間。
圖5 空間映射優(yōu)化方法計算結(jié)果曲線Fig. 5 Curve of computation result with space mapping optimization method
表2 2種方法的參數(shù)優(yōu)化結(jié)果對比Table 2 Comparison of parameter optimization between two methods
魚雷全彈道仿真系統(tǒng)由于全面考慮魚雷運行過程中涉及的諸多因素,使仿真過程耗時較長,為在此基礎(chǔ)上的優(yōu)化增加了難度。為了更快捷有效地獲得此問題的最優(yōu)設(shè)計方案,提出用神經(jīng)網(wǎng)絡(luò)法先建立一個近似仿真系統(tǒng),并通過空間映射法建立此近似仿真系統(tǒng)與原仿真系統(tǒng)的聯(lián)系,借助于神經(jīng)網(wǎng)絡(luò)近似仿真系統(tǒng)的快速運算能力和快速搜索能力,快速搜索到原魚雷全彈道仿真系統(tǒng)的最優(yōu)解,具體的優(yōu)化計算結(jié)果顯示該方法是可行和有效的,可以進(jìn)一步拓展到其他復(fù)雜系統(tǒng)多參數(shù)、多目標(biāo)的仿真優(yōu)化之中。
[1] 黃科,高興,段浩,等. 基于遺傳算法的魚雷發(fā)射管優(yōu)化設(shè)計[J]. 魚雷技術(shù),2013,21(2): 156-160.
Huang Ke,Gao Xing,Duan Hao,et al. Optimization Design of Torpedo Launch Tube Based on Genetic Algorithm[J]. Torpedo Technology,2013,21(2): 156-160.
[2] 段富海,章衛(wèi)國,何長安. 一種非線性優(yōu)化控制方法及其在魚雷控制中的應(yīng)用[J]. 控制理論與應(yīng)用,2000,17(1): 65-68.
Duan Fu-han,Zhang Wei-guo,He Chang-an. A Nonlinear Optimal Control Method and Its Application in the Torpedo Control[J]. Control Theory and Application,2000,17(1): 65-68.
[3] 勍郭,黨濤立,范奎武. 基于廣義功極小值原理的魚雷最優(yōu)控制問題[J]. 魚雷技術(shù),2006,14(5): 38-41. Guo Qing,Dang Tao-li,F(xiàn)an Kui-wu. Optimization Control of Torpedo Based on Generalized Work Minimum Principle[J]. Torpedo Technology,2006,14(5): 38-41.
[4] 聶衛(wèi)東,高智勇,劉艷波. 輕型反潛魚雷最優(yōu)垂直命中末彈道設(shè)計[J]. 魚雷技術(shù),2012,20(1): 1-7.
Nie Wei-dong,Gao Zhi-yong,Liu Yan-bo. Optimization Design of Perpendicular Hit Terminal Trajectory for Lightweight Antisubmarine Torpedo[J]. Torpedo Technology,2012,20(1): 1-7.
[5] Rumelhart D E,McClelland J L. Parallel Distributed Processing: Explorations in the Microstructure of Cognition [M]. Cambridge: MIT Press,1986.
[6] 方開泰,王元. 數(shù)論方法在統(tǒng)計中的應(yīng)用[M]. 北京:科學(xué)出版社,1996: 222-224.
[7] Bandler J W,Biernacki R M,Chen S H,et al. Space Mapping Technique for Electromagnetic Optimization[J]. IEEE Transactions on Microwave Theory and Techniques,1994,42(12): 2536-2544.
(責(zé)任編輯: 陳曦)
Optimization Method of Overall Performance Parameters of Torpedo via Simulation Based on Neural Network Response Surface
FAN Ruo-nan1,ZENG Jing2,REN Qing-sheng3,LI Bin1
(1.The 705 Research Institute,China Shipbuilding Industry Corporation,Xi?an 710075,China; 2. Department of Mathematics,Shanghai Jiaotong University,Shanghai 200240,China; 3. Department of Computer Science and Engineering,Shanghai Jiaotong University,Shanghai 200240,China)
Underwater acoustic homing simulation can exhibit operational effectiveness of a torpedo in a real environment,however a large number of sample data is needed in the simulation for the overall performance parameters optimization of the torpedo,thus optimization time becomes the bottleneck. Based on the quick neural network response surface method(NN-RSM),this paper uses the space mapping method to reduce the cost of optimization calculation and directly get the optimal solution to the underwater acoustic homing system. Subsequently,the overall performance indices of a torpedo,such as homing range and damage radius,are optimized. Optimization results show that effective optimization of the original problem is achieved with computation time less than 1/20 that of the general optimization methods. The present method can be applied to optimization of other complicated system with multiple parameters and multiple objectives.
torpedo; overall performance optimization; neural network; response surface; space mapping
TJ630.1
A
1673-1948(2015)05-0326-06
10.11993/j.issn.1673-1948.2015.05.002
2015-05-20;
2015-06-09.
范若楠(1984-),女,碩士,主要研究領(lǐng)域為魚雷仿真技術(shù).