姬正一,陳陽,沈培志,韓先平,齊鴻坤
(1.中國人民解放軍92941部隊(duì),遼寧 葫蘆島 125000;2.中國人民解放軍92493部隊(duì),遼寧 葫蘆島 125000;3.海軍航空大學(xué),山東 煙臺(tái) 264001)
反艦導(dǎo)彈是打擊海上目標(biāo)的主戰(zhàn)武器裝備,是決定海上作戰(zhàn)任務(wù)成敗的關(guān)鍵因素,科學(xué)評(píng)估反艦導(dǎo)彈武器系統(tǒng)的作戰(zhàn)效能,將對(duì)指揮決策起著至關(guān)重要的作用[1-2]。反艦導(dǎo)彈武器系統(tǒng)作戰(zhàn)效能評(píng)估經(jīng)典方法(以下簡稱為經(jīng)典方法)是采取結(jié)構(gòu)化的方式構(gòu)建模型,例如層次分析法、模糊綜合評(píng)價(jià)法、集對(duì)-指數(shù)分析法等[3],通過科學(xué)劃分能力層級(jí)、專家打分等方式建立一套完整的能力指標(biāo)體系,能夠較為合理地評(píng)價(jià)反艦導(dǎo)彈武器系統(tǒng)作戰(zhàn)效能。
在實(shí)際應(yīng)用中,經(jīng)典方法同時(shí)存在一些弊端,在能力分層、權(quán)重設(shè)計(jì)與歸一化評(píng)分等方面都需要依靠主觀經(jīng)驗(yàn)確定,并且在處理實(shí)戰(zhàn)環(huán)境下的大數(shù)據(jù)、非結(jié)構(gòu)化樣本時(shí),計(jì)算復(fù)雜度和時(shí)間成本較高[4]。
伴隨大數(shù)據(jù)時(shí)代來臨,數(shù)據(jù)資源的獲取變得更加容易,基于先驗(yàn)信息的機(jī)器學(xué)習(xí)方法在軍事領(lǐng)域的應(yīng)用將成為一種趨勢[5]。本文以數(shù)據(jù)為驅(qū)動(dòng),通過效能評(píng)估指標(biāo)體系構(gòu)建特征工程,結(jié)合經(jīng)典方法建立隨機(jī)森林和梯隊(duì)提升回歸樹2種決策樹集成的機(jī)器學(xué)習(xí)效能評(píng)估模型,并將2種方法分別與經(jīng)典方法進(jìn)行了對(duì)比,以檢驗(yàn)決策樹集成方法在反艦導(dǎo)彈作戰(zhàn)效能評(píng)估中的應(yīng)用效果。
隨著信息化技術(shù)快速發(fā)展,反艦導(dǎo)彈武器系統(tǒng)組成越發(fā)復(fù)雜,效能評(píng)估涉及諸多因素,尤其在實(shí)戰(zhàn)環(huán)境下,要將導(dǎo)彈系統(tǒng)自身戰(zhàn)技性能與復(fù)雜戰(zhàn)場環(huán)境等影響綜合考慮[6],對(duì)作戰(zhàn)效能評(píng)估方法提出了較高要求。為綜合評(píng)估武器系統(tǒng)效能,美國工業(yè)界武器系統(tǒng)效能咨詢委員會(huì)提出了ADC(availability dependability capacity)通用評(píng)估模型[7],它把系統(tǒng)效能指標(biāo)表示為武器系統(tǒng)可用度、任務(wù)可信度和系統(tǒng)能力的函數(shù),即系統(tǒng)效能E是有效度向量A、可信度矩陣D和能力矩陣C的乘積,表達(dá)式為
E=ADC.
(1)
ADC評(píng)估主要考慮的是武器系統(tǒng)自身性能要素的影響,而現(xiàn)代戰(zhàn)爭中任何裝備的使用都離不開作戰(zhàn)環(huán)境。實(shí)踐表明,反艦導(dǎo)彈武器系統(tǒng)信息化程度越高,作戰(zhàn)環(huán)境對(duì)其作戰(zhàn)效能的影響就會(huì)越大[8]。因此,要使評(píng)估更加具備現(xiàn)實(shí)意義,必須對(duì)實(shí)戰(zhàn)環(huán)境加以考慮,為衡量反艦導(dǎo)彈武器系統(tǒng)復(fù)雜戰(zhàn)場環(huán)境的適應(yīng)能力,增加了戰(zhàn)場環(huán)境影響因子H,改進(jìn)后的ADC模型[9]為
E=ADCH.
(2)
在充分考慮反艦導(dǎo)彈武器系統(tǒng)性、客觀性、獨(dú)立性、層次性以及一致性的基礎(chǔ)上,按照定性、定量相結(jié)合的原則分析構(gòu)建反艦導(dǎo)彈武器系統(tǒng)作戰(zhàn)效能評(píng)價(jià)指標(biāo)體系。
(1)反艦導(dǎo)彈武器系統(tǒng)有效度A由系統(tǒng)的維修率和故障率組成。
(2)可信度D由系統(tǒng)的飛行控制可靠性、發(fā)射可靠性和命中毀傷可靠性組成。
(3)作戰(zhàn)能力C:第1層指標(biāo)由反艦導(dǎo)彈的突防能力、選擇捕捉能力、命中能力和毀傷能力組成;第2層指標(biāo)中的捕捉能力由雷達(dá)覆蓋能力、雷達(dá)制導(dǎo)方式和雷達(dá)截獲能力組成,第2層指標(biāo)中的突防能力由隱身性能和飛行性能組成,第2層指標(biāo)中的命中能力由命中密集度和命中準(zhǔn)確度組成,第2層指標(biāo)中的毀傷能力由導(dǎo)彈戰(zhàn)斗部性能和引信性能組成。
(4)戰(zhàn)場環(huán)境適應(yīng)能力H:第1層指標(biāo)包括電磁環(huán)境和自然環(huán)境適應(yīng)能力;第2層指標(biāo)中的電磁環(huán)境適應(yīng)能力包括抗敵電磁干擾、抗戰(zhàn)場自然電磁干擾和裝備系統(tǒng)間電磁兼容能力,第2層指標(biāo)中的自然環(huán)境適應(yīng)能力包括海洋水文環(huán)境(海浪、能見度)和海洋氣象環(huán)境(風(fēng)、溫度、氣壓)。
該指標(biāo)體系中故障率、維修率、發(fā)射可靠性、飛行控制可靠性等19個(gè)能力指標(biāo)將作為后續(xù)2種決策樹集成模型的19個(gè)數(shù)據(jù)特征,改進(jìn)ADC評(píng)估模型求出的反艦導(dǎo)彈作戰(zhàn)效能E將作為模型的數(shù)據(jù)標(biāo)記值。評(píng)價(jià)指標(biāo)體系如圖1所示。
1.2.1 有效度A
當(dāng)武器系統(tǒng)在任意時(shí)間工作時(shí),有效度A表示系統(tǒng)在開始執(zhí)行任務(wù)時(shí)所處狀態(tài)的指標(biāo)。由于反艦導(dǎo)彈武器系統(tǒng)由火控系統(tǒng)和導(dǎo)彈系統(tǒng)組成,單一系統(tǒng)的初始狀態(tài)一般情況下可分為正常工作和故障維修2種狀態(tài),對(duì)于反艦導(dǎo)彈武器系統(tǒng)可以有4種狀態(tài),其有效向量A為
A=(a1,a2,a3,a4),
(3)
式中:a1為導(dǎo)彈系統(tǒng)和火控系統(tǒng)均正常工作的概率;a2為導(dǎo)彈系統(tǒng)正常工作、火控系統(tǒng)故障的概率;a3為導(dǎo)彈系統(tǒng)故障、火控系統(tǒng)正常工作的概率;a4為導(dǎo)彈系統(tǒng)和火控系統(tǒng)均故障的概率。對(duì)于單一系統(tǒng)或平臺(tái)來說,處于正常工作狀態(tài)的概率為
(4)
式中:MTBF為平均故障間隔時(shí)間;MTTR為平均故障修復(fù)時(shí)間;λ為故障率;μ為修復(fù)率。
1.2.2 可信度矩陣D
可信度D是對(duì)系統(tǒng)在開始執(zhí)行任務(wù)處于某一狀態(tài)而結(jié)束時(shí)處于另一狀態(tài)的系統(tǒng)狀態(tài)轉(zhuǎn)移性指標(biāo)表述,反映了系統(tǒng)可靠性的好壞。按照評(píng)估指標(biāo)體系,可信度取決于發(fā)射可靠性、飛行控制可靠性和命中毀傷可靠性3個(gè)指標(biāo),由于反艦導(dǎo)彈武器系統(tǒng)自身不可修復(fù),若在開始執(zhí)行任務(wù)時(shí)各系統(tǒng)發(fā)生故障,則整個(gè)任務(wù)過程中不會(huì)正常工作[10]。假設(shè)執(zhí)行任務(wù)時(shí)反艦導(dǎo)彈武器系統(tǒng)的故障率服從指數(shù)定律,則發(fā)射系統(tǒng)可靠性Rm、飛行控制系統(tǒng)可靠性Rk、命中毀傷系統(tǒng)可靠性Rs分別為
(5)
式中:λm,λk,λs分別為發(fā)射系統(tǒng)、飛行控制系統(tǒng)和命中毀傷系統(tǒng)執(zhí)行任務(wù)時(shí)故障率;Tm,Tk,Ts分別為發(fā)射系統(tǒng)、飛行控制系統(tǒng)和命中毀傷系統(tǒng)執(zhí)行任務(wù)的持續(xù)時(shí)間。
考慮到飛行控制系統(tǒng)和命中毀傷系統(tǒng)均為彈上系統(tǒng),為使可信度矩陣計(jì)算較為便捷,使彈上系統(tǒng)可靠性Rh表示為
Rh=RkRs.
(6)
由此可得可信度矩陣為
(7)
1.2.3 作戰(zhàn)能力矩陣C
表示系統(tǒng)完成規(guī)定任務(wù)能力的指標(biāo)。在圖1中對(duì)反艦導(dǎo)彈作戰(zhàn)能力進(jìn)行系統(tǒng)分析,劃出選捕、突防、命中、毀傷4個(gè)能力指標(biāo)以及雷達(dá)覆蓋能力、制導(dǎo)體制等9個(gè)子能力指標(biāo),計(jì)算時(shí)先分別找出與9個(gè)子能力指標(biāo)對(duì)應(yīng)的裝備性能參數(shù),然后采取指數(shù)分析法進(jìn)行計(jì)算,反艦導(dǎo)彈武器系統(tǒng)作戰(zhàn)能力C可表示為
圖1 反艦導(dǎo)彈武器系統(tǒng)作戰(zhàn)效能評(píng)估指標(biāo)體系Fig.1 Operational effectiveness evaluation index system of anti-ship missile weapon system
(8)
式中:C1,C2,C3,C4分別表示選捕、突防、命中和毀傷能力;DR為末制導(dǎo)雷達(dá)作用距離,反映子能力指標(biāo)中的雷達(dá)覆蓋能力;AR為末制導(dǎo)雷達(dá)航向跟蹤范圍,S為末制導(dǎo)雷達(dá)距離跟蹤范圍,反映雷達(dá)截獲目標(biāo)能力;ε為有無復(fù)合制導(dǎo)體制影響因子,反映雷達(dá)制導(dǎo)體制影響因素;I為RCS反射面積,反映導(dǎo)彈隱身能力;H為最大巡航高度;L為最大有效射程;M為巡航速度,反映導(dǎo)彈飛行性能;P為單發(fā)命中概率,反映導(dǎo)彈命中準(zhǔn)確率;Q為自控終點(diǎn)散布誤差,反映導(dǎo)彈命中密集度;Y為引信靈敏度,反映引信性能;G為戰(zhàn)斗部質(zhì)量,反映戰(zhàn)斗部性能;w1,w2,…,w11為指標(biāo)權(quán)重。利用層次分析法(analytic hierarchy process,AHP)進(jìn)行指標(biāo)權(quán)重分配,然后采用集對(duì)分析法對(duì)指標(biāo)體系進(jìn)行處理,即通過構(gòu)造理想矩陣的指標(biāo)向量方式形成聯(lián)系矩陣,再與所得的權(quán)重系數(shù)進(jìn)行線性疊加,即可求出能力矩陣C。
1.2.4 戰(zhàn)場環(huán)境適應(yīng)能力矩陣H
考慮到戰(zhàn)場環(huán)境影響因素的復(fù)雜性、動(dòng)態(tài)性,為了較為客觀反映反艦導(dǎo)彈的戰(zhàn)場環(huán)境適應(yīng)能力,采取以下步驟計(jì)算:
(1)指標(biāo)量化:由于抗敵電磁干擾、抗戰(zhàn)場自然電磁干擾、裝備系統(tǒng)間電磁兼容能力以及海洋水文環(huán)境和氣象環(huán)境適應(yīng)能力5個(gè)子指標(biāo)既有定量數(shù)據(jù)又有定性描述,故依據(jù)軍事用戶給出的性能參數(shù)一些常用范圍值,廣泛征詢專家意見,采取專家打分、歸一化處理的方法得出具體的量化值,且這些值范圍在0到1之間。
(2)確定權(quán)重系數(shù):按照AHP法分別計(jì)算一級(jí)指標(biāo)和二級(jí)指標(biāo)對(duì)應(yīng)的權(quán)重系數(shù)。首先采取1-9標(biāo)度法構(gòu)造判斷矩陣;其次通過一致性檢驗(yàn)判斷矩陣是否協(xié)調(diào)一致避免相互矛盾;利用方根法求出判斷矩陣的特征值與特征向量,得出相應(yīng)的權(quán)值[9]。
(3)用線性加權(quán)和法確定戰(zhàn)場環(huán)境適應(yīng)因子H:
(9)
式中:μi,μij分別為一級(jí)指標(biāo)和二級(jí)指標(biāo)的權(quán)重系數(shù);Fij為5個(gè)子指標(biāo)的專家打分值;m為一級(jí)指標(biāo)數(shù)量;ni為第i類一級(jí)指標(biāo)中二級(jí)指標(biāo)數(shù)量。
在分別得出有效度A、可信度D、作戰(zhàn)能力C和戰(zhàn)場環(huán)境適應(yīng)能力H后,按照式(2)計(jì)算得到的系統(tǒng)綜合效能值作為決策樹集成模型數(shù)據(jù)樣本的標(biāo)記值,每個(gè)標(biāo)記值和相應(yīng)的19個(gè)特征值構(gòu)成了一條完整數(shù)據(jù)。
決策樹集成是機(jī)器學(xué)習(xí)領(lǐng)域有監(jiān)督學(xué)習(xí)的一類重要算法,它以決策樹為基礎(chǔ)構(gòu)建基本分類器,集成無數(shù)個(gè)基本分類器開展分類和預(yù)測任務(wù)[11]。本文用到的2種決策樹集成方法分別是隨機(jī)森林算法和梯隊(duì)提升回歸樹算法,隨機(jī)森林中決策樹為隨機(jī)構(gòu)建,預(yù)測結(jié)果取決于投票眾數(shù);梯度提升樹中決策樹為層層遞進(jìn),預(yù)測結(jié)果取決于最后一顆樹。
作為基本分類器,決策樹本身就是一種學(xué)習(xí)預(yù)測模型,從一層層if/else問題中進(jìn)行學(xué)習(xí)并得到結(jié)論,根據(jù)信息增益或基尼系數(shù)的大小來決定先分類哪一個(gè)特征[12]。本文策略是從根節(jié)點(diǎn)到葉節(jié)點(diǎn)采用遞歸的方法,構(gòu)建信息熵下降最快的樹,信息熵可以用來度量每一個(gè)節(jié)點(diǎn)上的信息量與不確定性,它的大小通常與事件發(fā)生的概率相反,公式為
(10)
式中:P(xi)為某事件發(fā)生的概率。針對(duì)多個(gè)變量時(shí),常用聯(lián)合熵來表征一個(gè)節(jié)點(diǎn)上的信息量與不確定度,計(jì)算公式為
(11)
通常情況下,聯(lián)合熵會(huì)大于每一個(gè)單獨(dú)的信息熵,小于所有獨(dú)立的信息熵之和,并且聯(lián)合熵與某個(gè)變量的信息熵的差稱之為條件熵,公式為
(12)
信息熵的差值用信息增益(Gain)來表示,能夠影響決策樹的選擇,向下分裂時(shí)優(yōu)先選擇信息增益大的,信息增益的計(jì)算公式為
Gain=Hb-Ha?t,
(13)
式中:Hb為分裂前信息熵;Ha為分裂后信息熵;?t為加權(quán)平均數(shù)。
決策樹算法運(yùn)行效率高,對(duì)數(shù)據(jù)適應(yīng)性強(qiáng),不需要特征歸一化處理,但會(huì)出現(xiàn)過擬合,且泛化能力較弱,因此在實(shí)際應(yīng)用中往往使用集成的方法有效解決上述問題。
隨機(jī)森林(random forest,RF)算法是多顆隨機(jī)決策樹的集合,利用每棵樹對(duì)特征和樣本采樣的差異性,有效降低過擬合,提升整體泛化能力[13]。該算法建立反艦導(dǎo)彈作戰(zhàn)效能評(píng)估模型的主要步驟如下(圖2):
圖2 隨機(jī)森林算法結(jié)構(gòu)Fig.2 Algorithm structure of random forest
(1)運(yùn)用連續(xù)變量離散化或缺失數(shù)據(jù)插值等處理手段,對(duì)反艦導(dǎo)彈數(shù)據(jù)集進(jìn)行預(yù)處理,再將數(shù)據(jù)集分為訓(xùn)練集和測試集。
(2)假設(shè)訓(xùn)練集中包含有N個(gè)樣本(反艦導(dǎo)彈的N種狀態(tài)),T種分類屬性(每種狀態(tài)下的T個(gè)特征),采用Bootstrap抽樣方法得到新的樣本集。
(3)在設(shè)定的T種特征中,隨機(jī)抽取t(t≤T)種特征,使用某種決策樹最優(yōu)特征標(biāo)準(zhǔn),選擇最優(yōu)分類節(jié)點(diǎn)。
(4)對(duì)步驟(3)重復(fù)進(jìn)行K次,生成K棵決策樹。
(5)對(duì)這K棵決策樹的預(yù)測結(jié)果采取投票機(jī)制,根據(jù)投票結(jié)果決定最終的效能預(yù)測數(shù)據(jù)。投票機(jī)制的函數(shù)模型如下:
(14)
式中:hi(x)表示第i棵決策樹的預(yù)測值;Y表示目標(biāo)變量(分類標(biāo)簽或預(yù)測值);arg max表示找出能夠使函數(shù)取到最大值的自變量。
隨機(jī)森林將多個(gè)弱分類器組合使用,得到一個(gè)分類性能更好的強(qiáng)分類器,經(jīng)過訓(xùn)練后相比較于決策樹分類器模型泛化能力更強(qiáng),故在反艦導(dǎo)彈作戰(zhàn)效能評(píng)估中首選了隨機(jī)森林算法模型。同時(shí)每棵決策樹是獨(dú)立同分布的,便于并行化處理數(shù)據(jù),且不需要數(shù)據(jù)集標(biāo)準(zhǔn)化歸一化處理,效率較高[14]。
梯度提升回歸樹(gradient boosting regression tree,GBRT)是基于誤差函數(shù)的一種優(yōu)化算法,通過集成弱分類器來生成一種強(qiáng)分類器。首次計(jì)算由基本模型完成,而下次計(jì)算是為了減小上次模型的殘差(residua),在殘差梯度(gradient)方向新建立一個(gè)新的模型,通過持續(xù)調(diào)整優(yōu)化弱分類器權(quán)重,逐漸減小損失函數(shù),到達(dá)閾值后形成一個(gè)強(qiáng)分類器[15]。該算法建立反艦導(dǎo)彈作戰(zhàn)效能評(píng)估模型的主要步驟如下(圖3):
圖3 梯度提升回歸樹算法結(jié)構(gòu)Fig.3 Algorithm structure of gradient boosting regression tree
(1)假設(shè)損失函數(shù)為L(y,f(x)),每一棵回歸樹的葉節(jié)點(diǎn)數(shù)為J,其輸入空間分割為J個(gè)不相交區(qū)域R1m,R2m,…Rjm,對(duì)每一個(gè)區(qū)域估計(jì)一個(gè)常量值bjm。回歸樹用公式表示為
(15)
(16)
(17)
(3)對(duì)弱分類器進(jìn)行迭代,迭代次數(shù)為m(m=1,2,…,M),樣本為i(i=1,2,…,T),計(jì)算第m輪第i個(gè)樣本值的殘差(即第m-1輪損失函數(shù)的負(fù)梯度),計(jì)算公式為
(18)
(4)使用(xi,rmj)來擬合一棵新的即第m棵樹gm(x),其對(duì)應(yīng)的葉節(jié)點(diǎn)區(qū)域?yàn)镽jm,j=1,2,…,J,J為葉節(jié)點(diǎn)個(gè)數(shù),并計(jì)算梯度下降的步長,計(jì)算公式為
(19)
(5)更新強(qiáng)分類器,每一輪損失函數(shù)的計(jì)算都是與yj比較,故需加上本輪的,計(jì)算公式為
(20)
(6)得到強(qiáng)分類器,并計(jì)算輸出數(shù)據(jù),數(shù)據(jù)計(jì)算公式為
(21)
梯度提升決策樹能夠靈活處理各種類型的數(shù)據(jù),包括連續(xù)和離散值,用較少的訓(xùn)練時(shí)間能得到預(yù)測準(zhǔn)確率較高的模型。但由于弱分類器之間存在依賴關(guān)系,難以并行開展訓(xùn)練。
擬定反艦導(dǎo)彈武器系統(tǒng)的火控子系統(tǒng)平均故障間隔為1 500~2 100 h之間,平均修理時(shí)間為40~50 h之間,導(dǎo)彈子系統(tǒng)平均故障間隔時(shí)間為2 000~3 000 h之間,平均修理時(shí)間為80~100 h之間,執(zhí)行任務(wù)時(shí)間為10~25 min之間,有復(fù)合末制導(dǎo)體制的反艦導(dǎo)彈ε=1,無復(fù)合末制導(dǎo)體制的ε=0.5~0.9。不同狀態(tài)的反艦導(dǎo)彈戰(zhàn)術(shù)技術(shù)性能指標(biāo)如表1所示,戰(zhàn)場環(huán)境適應(yīng)因子如表2所示。為提供足夠的訓(xùn)練和測試數(shù)據(jù),本文共收集了240種不同狀態(tài)的反艦導(dǎo)彈性能數(shù)據(jù)。
表1 反艦導(dǎo)彈武器系統(tǒng)戰(zhàn)術(shù)技術(shù)性能指標(biāo)Table 1 Tactical and technical performance index of anti-ship missile weapon system
表2 反艦導(dǎo)彈武器系統(tǒng)戰(zhàn)場環(huán)境適應(yīng)因子Table 2 Battlefield environment adaptive factors of anti-ship missile weapon system
對(duì)每一種狀態(tài)的反艦導(dǎo)彈分別求出有效度A、可信度D、作戰(zhàn)能力C和戰(zhàn)場環(huán)境適應(yīng)能力H后,按照公式(2)計(jì)算得到的系統(tǒng)綜合效能值E。
不同狀態(tài)的反艦導(dǎo)彈有效度A分別為
A1=(0.952 26,0.021 76,0.025 39,0.000 5),A2=(0.941 24,0.028 23,0.029 63,0.000 8),…
A240=(0.942 1,0.021 19,0.035 88,0.000 8)
可信度D分別為
作戰(zhàn)能力C分別為
C1=2.236 38,C2=1.829 9,…
C240=0.955 45,
戰(zhàn)場環(huán)境適應(yīng)能力H分別為
H1=0.832 679,H2=0.800 567,…
H240=0.820 023.
經(jīng)計(jì)算得系統(tǒng)綜合效能值E分別為
E1=0.529 8,E2=0.789 9,…,E240=0.270 1。系統(tǒng)的綜合效能E將作為數(shù)據(jù)集的標(biāo)簽值。
隨機(jī)森林評(píng)估模型選擇以信息熵作為分類標(biāo)準(zhǔn),以R2分?jǐn)?shù)作為評(píng)定標(biāo)準(zhǔn),為獲取最優(yōu)模型,需要調(diào)參選擇最優(yōu)參數(shù),用K折交叉驗(yàn)證(K-fold cross validation)方法測試模型的泛化能力,用網(wǎng)格搜索(grid search)算法循環(huán)遍歷候選參數(shù)并以交叉驗(yàn)證結(jié)果作為指標(biāo)得到最優(yōu)參數(shù)。樹最大深度和決策樹數(shù)量是隨機(jī)森林模型中較為重要的2個(gè)參數(shù),通過搜索,決策樹數(shù)量為200,最大深度為40,2個(gè)參數(shù)的尋優(yōu)平均分?jǐn)?shù)熱圖如圖4所示。
圖4 RF模型決策樹個(gè)數(shù)和最大深度平均分?jǐn)?shù)熱圖Fig.4 Number of decision trees and maximum depth average fractional heatmap of RF model
其他參數(shù)取值范圍由反艦導(dǎo)彈數(shù)據(jù)集樣本條件初定,采取隨機(jī)搜索尋找最優(yōu)取值,隨機(jī)森林模型參數(shù)的范圍及優(yōu)選取值如表3所示。
表3 隨機(jī)森林模型參數(shù)選擇Table 3 Parameter selection of RF model
仿真結(jié)果表明,與改進(jìn)ADC評(píng)估模型求出的反艦導(dǎo)彈作戰(zhàn)效能E相比較,隨機(jī)森林算法在測試集中評(píng)估預(yù)測性能較好,輸入特征值后,模型的預(yù)測準(zhǔn)確率為92%。兩者對(duì)比如圖5所示,其中紅線為改進(jìn)ADC評(píng)估模型求出的反艦導(dǎo)彈作戰(zhàn)效能標(biāo)簽值,綠線為隨機(jī)森林模型預(yù)測值。
圖5 隨機(jī)森林模型預(yù)測結(jié)果與反艦導(dǎo)彈作戰(zhàn)效能對(duì)比圖Fig.5 Comparison of prediction results of RF model and combat effectiveness of anti-ship missile
梯度提升回歸樹模型將Huber損失函數(shù)作為模型殘差處理方法以降低樣本殘差損失,同時(shí)為了評(píng)估模型優(yōu)劣,用平均絕對(duì)百分誤差(MAPE)為評(píng)價(jià)指標(biāo),計(jì)算公式為
(22)
式中:ttrue,i為反艦導(dǎo)彈i狀態(tài)下的作戰(zhàn)效能標(biāo)簽值;tpredict,i為梯度提升回歸模型預(yù)測值。
模型有2個(gè)關(guān)鍵參數(shù):學(xué)習(xí)率和樹的深度。通常情況下,隨著樹的棵數(shù)和樹的深度的增加,模型能夠減小訓(xùn)練誤差,但是如果兩者數(shù)太大,將會(huì)導(dǎo)致其泛化能力迅速減弱,模型也會(huì)出現(xiàn)過擬合現(xiàn)象導(dǎo)致預(yù)測性能降低。因此,通過優(yōu)化模型的學(xué)習(xí)率和樹的深度將預(yù)測誤差降到最低。以MAPE為評(píng)價(jià)指標(biāo)(數(shù)值越小表示預(yù)測準(zhǔn)確率越好),學(xué)習(xí)率和樹的深度2個(gè)參數(shù)的尋優(yōu)平均分?jǐn)?shù)熱圖如圖6所示。
圖6 GBRT模型學(xué)習(xí)率和樹的最大深度平均分?jǐn)?shù)熱圖Fig.6 Learning rate and maximum depth average fractional heatmap of GBRT model
通過隨機(jī)搜索尋找最優(yōu)取值,隨機(jī)森林模型參數(shù)的范圍及優(yōu)選取值如表4所示。
表4 梯度提升回歸樹模型參數(shù)選擇Table 4 Parameter selection of GBRT model
仿真結(jié)果表明,與改進(jìn)ADC評(píng)估模型求出的反艦導(dǎo)彈作戰(zhàn)效能E相比較,在輸入特征值后,梯度提升回歸樹模型對(duì)測試集的預(yù)測準(zhǔn)確率為97%。兩者對(duì)比如圖7所示,其中紅線為改進(jìn)ADC評(píng)估模型求出的反艦導(dǎo)彈作戰(zhàn)效能標(biāo)簽值,綠線為梯度提升回歸樹的模型預(yù)測值。
圖7 梯度提升回歸樹模型預(yù)測結(jié)果與 反艦導(dǎo)彈作戰(zhàn)效能對(duì)比圖Fig.7 Comparison of prediction results of GBRT model and combat effectiveness of anti-ship missile
本文針對(duì)實(shí)戰(zhàn)化條件下反艦導(dǎo)彈武器系統(tǒng)作戰(zhàn)效能評(píng)估特點(diǎn),在作戰(zhàn)效能評(píng)估指標(biāo)體系基礎(chǔ)上建立了隨機(jī)森林和梯度提升回歸樹2種決策樹集成模型。采用240組數(shù)據(jù)樣本對(duì)該模型進(jìn)行了仿真測試,通過與改進(jìn)ADC評(píng)估模型的對(duì)比分析,決策樹集成方法的評(píng)估預(yù)測準(zhǔn)確率分別達(dá)到了92%和97%,證明了2種方法在反艦導(dǎo)彈作戰(zhàn)效能評(píng)估研究上的可行性,并且實(shí)施過程簡單高效,較大程度規(guī)避主觀經(jīng)驗(yàn),容易推廣到其他武器系統(tǒng)效能評(píng)估中,具有一定的應(yīng)用價(jià)值。