薛永亮,陳振林
(海軍航空大學(xué),山東煙臺(tái)264001)
航材保障能力是形成作戰(zhàn)能力、遂行多樣化軍事任務(wù)的物質(zhì)基礎(chǔ),航材供應(yīng)的及時(shí)性影響著航空部隊(duì)?wèi)?zhàn)斗力的生成。航材預(yù)測(cè)是航材精細(xì)化保障的重要工作,已有較多學(xué)者進(jìn)行了研究[1-5]。對(duì)某型直升機(jī)航材消耗建立模型時(shí),該機(jī)型較新、服役時(shí)間短,難以獲取足夠數(shù)據(jù)。同時(shí),該機(jī)型備件國(guó)產(chǎn)化水平低,大部分要依靠進(jìn)口,對(duì)該機(jī)型航材消耗,不僅要預(yù)測(cè)T+1時(shí)刻,還要預(yù)測(cè)T之后較長(zhǎng)步幅的區(qū)間。本文參考多種分類、預(yù)測(cè)方法,針對(duì)上述問(wèn)題,使用非參數(shù)回歸算法建立模型。非參數(shù)回歸是一種不對(duì)模型參數(shù)做任何假設(shè)的回歸算法[6],在預(yù)測(cè)的過(guò)程中,不對(duì)模型做先驗(yàn)假設(shè),按照算法約定探究數(shù)據(jù)自身規(guī)律,僅規(guī)定一些一般性條件,近年來(lái)該算法在多學(xué)科運(yùn)用較為廣泛[7-13]。根據(jù)航材消耗序列轉(zhuǎn)化為消耗變異系數(shù)與序列突變系數(shù)[14],將航材分為消耗平穩(wěn)型航材、突變型航材、離散型航材。本文針對(duì)平穩(wěn)型航材波動(dòng)性、離散性較小的消耗特點(diǎn),使用核近鄰非參數(shù)回歸建立消耗預(yù)測(cè)模型。
核近鄰估計(jì)是最經(jīng)典的非參數(shù)回歸算法,由Nadariyu 和Watson 提出,它的核心算法為在估計(jì)f(x0)時(shí),給予接近觀測(cè)點(diǎn)x0更高的權(quán)重。同時(shí),給予遠(yuǎn)離觀測(cè)點(diǎn)更低的權(quán)重[15]。令:
式(1)中:zi表示第i個(gè)觀測(cè)值x與聚焦點(diǎn)x0之間存在正負(fù)區(qū)別的距離;h表示估計(jì)帶寬,通過(guò)調(diào)整核函數(shù)的寬度來(lái)控制非參數(shù)回歸曲線的光滑程度。
當(dāng)帶寬h過(guò)大時(shí),得到的回歸函數(shù)會(huì)失去數(shù)據(jù)曲度的一些細(xì)節(jié),導(dǎo)致回歸估計(jì)過(guò)平滑。當(dāng)帶寬h過(guò)小時(shí),回歸估計(jì)過(guò)于密切擬合數(shù)據(jù),導(dǎo)致回歸曲線粗糙,并且容易受到異常因素影響[16]。因此,需要在光滑度與擬合度之間做有效的平衡,其方法就是選取適合的帶寬h。定義一個(gè)核函數(shù)k(z),將最大的權(quán)重靠近焦點(diǎn)x0的觀測(cè),而后隨著 ||z的增長(zhǎng)令權(quán)重對(duì)稱、平滑降低。得到權(quán)重[15]:
計(jì)算可得:
式中,yi表示第i個(gè)月份航材消耗數(shù)。
在核近鄰估計(jì)算法中,常用的核函數(shù)包括:三角核函數(shù)、余弦核函數(shù)、beta族核函數(shù)、高斯核函數(shù)等[16]。
核函數(shù)的選擇依據(jù)是根據(jù)距離分配各個(gè)樣本點(diǎn)不同貢獻(xiàn)程度的密度值。文獻(xiàn)[17]中指出,在核近鄰回歸中,核函數(shù)的選取對(duì)于回歸模型擬合效果影響較小。但通過(guò)航材消耗預(yù)測(cè)實(shí)驗(yàn),由于數(shù)據(jù)特點(diǎn)多樣,對(duì)于不同類型的航材消耗數(shù)據(jù),選用不同的核函數(shù)有較大影響,針對(duì)平穩(wěn)型航材,利用Quartic核函數(shù),回歸曲線能較好擬合數(shù)據(jù)。Quartic核表達(dá)式為:
當(dāng)帶寬h相對(duì)較小時(shí),曲線擬合較好,但曲線的光滑性較差,峰值谷值突出,隨機(jī)性影響較大,出現(xiàn)過(guò)度擬合;當(dāng)帶寬h相對(duì)較大時(shí),曲線的光滑度很高但平均化作用過(guò)于明顯,導(dǎo)致擬合不足,無(wú)法描述曲線趨勢(shì)性變化,預(yù)測(cè)效果較差[18]。
基于核近鄰回歸對(duì)平穩(wěn)型航材建立消耗模型,針對(duì)兩端極化較大、邊界帶誤差較大的問(wèn)題,設(shè)計(jì)帶寬h為可變帶寬,在兩端帶寬較小,使得曲線與實(shí)際值較為貼近,在序列中端利用經(jīng)典推論。例如,最優(yōu)拇指帶寬或交叉驗(yàn)證最優(yōu)帶寬等。
利用高斯核函數(shù),將對(duì)稱軸選在序列中間值,其數(shù)學(xué)表達(dá)式為:
式(5)中:h0是拇指帶寬或最優(yōu)帶寬計(jì)算結(jié)果;N為樣本容量。
設(shè)拇指帶寬計(jì)算得出h0=0.5,取某型航材6年消耗記錄,以月份為單位,N=72,可變帶寬最大值最小值之比為1.6,為進(jìn)一步強(qiáng)化帶寬在序列兩端的擬合效果,將帶寬公式調(diào)整為:
帶寬變化更為明顯,在序列兩端帶寬較小,曲線擬合時(shí),更加接近樣本數(shù)值。
由于多種因素,某型直升機(jī)在役數(shù)量波動(dòng)較大。為方便研究,本文將機(jī)群消耗數(shù)量轉(zhuǎn)變?yōu)閱螜C(jī)消耗數(shù)。同時(shí),根據(jù)調(diào)研結(jié)果,可以假定該機(jī)型每年訓(xùn)練量、訓(xùn)練環(huán)境相近,因而可以假設(shè)其服役強(qiáng)度一致。某型航材72個(gè)月份消耗數(shù)據(jù)序列見(jiàn)表1。
表1 航材消耗序列表Tab.1 Sequence table of material consumption
由表1可見(jiàn),該型航材消耗有一定波動(dòng),整體呈上升趨勢(shì),數(shù)據(jù)離散程度相對(duì)較小,消耗序列突變不大。
為做充分對(duì)比,分別利用拇指法,則帶寬與可變帶寬非參數(shù)回歸(Non-Parametric Regression)對(duì)某型平穩(wěn)型航材建立消耗預(yù)測(cè)模型,并對(duì)比支持向量機(jī)回歸(Support Vector Regression)、最小二乘法(Least Squares)3 階、4 階等方法。為有效、精確評(píng)價(jià)模型預(yù)測(cè)效果,利用以下2 個(gè)指標(biāo)分析對(duì)比不同模型的預(yù)測(cè)準(zhǔn)確性。
1)均值百分比誤差MAPE,其數(shù)學(xué)表達(dá)式為[10]:
2)均方根差RMSE,其數(shù)學(xué)表達(dá)式為[10]:
式(7)、(8)中:yi為實(shí)際值;y?i為預(yù)測(cè)值。
仿真實(shí)驗(yàn)對(duì)比多種預(yù)測(cè)模型,預(yù)測(cè)結(jié)果見(jiàn)表2。利用MAPE 與MRSE 對(duì)預(yù)測(cè)效果進(jìn)行對(duì)比,如表3 所示。利用基于可變帶寬的核近鄰非參數(shù)回歸模型,對(duì)比原回歸方法,仿真結(jié)果如圖1所示。
表2 預(yù)測(cè)結(jié)果詳表Tab.2 Table of prediction results
表3 預(yù)測(cè)結(jié)果評(píng)價(jià)表Tab.3 Comparison table of prediction results
圖1 非參數(shù)回歸對(duì)比圖Fig.1 Contrast figure of nonparametric regression
由圖1 可以看出,核鄰近非參數(shù)回歸在序列兩端偏差較大,受起始點(diǎn)位置影響較大。利用可變帶寬,在兩端帶寬較小,使得回歸曲線接近數(shù)據(jù)樣本,對(duì)數(shù)據(jù)信息更為敏感,較好地對(duì)原方法進(jìn)行了優(yōu)化。
利用改進(jìn)的核近鄰非參數(shù)回歸模型對(duì)比參數(shù)回歸模型3階、4階最小二乘算法,仿真結(jié)果見(jiàn)圖2。
對(duì)于平穩(wěn)型航材消耗數(shù)據(jù),4階最小二乘、非參數(shù)回歸模型都能較好擬合消耗規(guī)律,預(yù)測(cè)航材趨勢(shì)性變化,而3階最小二乘曲線過(guò)于光滑,擬合效果不佳。
對(duì)比支持向量機(jī)回歸,仿真結(jié)果見(jiàn)圖3。
利用支持向量機(jī)回歸建立模型時(shí),消耗序列呈上升趨勢(shì),因而通過(guò)逐項(xiàng)訓(xùn)練對(duì)比,即前一數(shù)據(jù)為后一數(shù)據(jù)的訓(xùn)練集,得出擬合函數(shù),再用后12 項(xiàng)數(shù)據(jù)進(jìn)行預(yù)測(cè),仿真效果不佳,未對(duì)航材趨勢(shì)性變化做出有效預(yù)測(cè)。
圖2 回歸算法對(duì)比圖Fig.2 Comparison figure of regression algorithm
圖3 支持向量機(jī)回歸對(duì)比圖Fig.3 Comparison figure of support vector machine regression
由于航材消耗相對(duì)平穩(wěn)、呈上升趨勢(shì),使用核近鄰非參數(shù)算法出現(xiàn)邊界帶誤差較大、中位數(shù)據(jù)權(quán)重較大的問(wèn)題。針對(duì)這一問(wèn)題,基于高斯函數(shù)建立可變帶,在兩端帶寬較小,使得曲線與實(shí)際值擬合更為緊密,減小中部數(shù)據(jù)權(quán)重較大的問(wèn)題,對(duì)比多種預(yù)測(cè)模型,證明基于可變帶寬的核近鄰非參數(shù)回歸對(duì)于平穩(wěn)型消耗航材預(yù)測(cè)效果較好。