陳 鞭,伍友利,吳 鑫,甘躍鵬
(空軍工程大學(xué),西安 710038)
紅外對(duì)抗是紅外空空導(dǎo)彈與目標(biāo)相互博弈的一個(gè)過程。紅外對(duì)抗是高非線性、高復(fù)雜性問題,對(duì)其研究的關(guān)注點(diǎn)是在不同的對(duì)抗場(chǎng)景下,紅外導(dǎo)彈能否命中目標(biāo),即脫靶量是否滿足要求。但是紅外對(duì)抗中的影響因素眾多,包括導(dǎo)彈、目標(biāo)、誘餌以及彈目相對(duì)態(tài)勢(shì)等方面,且存在很大的不確定性。對(duì)于這種超復(fù)雜的紅外對(duì)抗問題,雖然目前無法直接給出各影響因素與脫靶量之間的函數(shù)關(guān)系,但是仍然需要研究其之間的聯(lián)系,發(fā)現(xiàn)影響導(dǎo)彈抗干擾能力的一些規(guī)律。
關(guān)聯(lián)規(guī)則分析是數(shù)據(jù)挖掘中最活躍的研究方法之一,目的是在一個(gè)數(shù)據(jù)集中找出各項(xiàng)之間的關(guān)聯(lián)關(guān)系,而這種關(guān)系并沒有在數(shù)據(jù)中直接表現(xiàn)出來。文獻(xiàn)[3]利用關(guān)聯(lián)規(guī)則探索危險(xiǎn)源原因,從而挖掘出導(dǎo)致危險(xiǎn)源的不安全事件。文獻(xiàn)[4]采用關(guān)聯(lián)規(guī)則方法挖掘圖書館圖書流通數(shù)據(jù),不僅幫助讀者找到不同學(xué)科知識(shí)之間的內(nèi)在聯(lián)系,同時(shí)還有利于圖書館調(diào)整資源布局。文獻(xiàn)[5]使用關(guān)聯(lián)規(guī)則方法研究隧道管片滲漏與盾構(gòu)掘進(jìn)參數(shù)之間的關(guān)聯(lián)性,分析關(guān)鍵掘進(jìn)參數(shù)滲漏原理。文獻(xiàn)[6]根據(jù)數(shù)據(jù)挖掘理論,挖掘出民航鳥擊事件中各屬性間的關(guān)系,從而發(fā)現(xiàn)導(dǎo)致鳥擊事件的相關(guān)因素。文獻(xiàn)[7]通過關(guān)聯(lián)規(guī)則方法對(duì)數(shù)據(jù)進(jìn)行挖掘分析,根據(jù)得到的關(guān)聯(lián)規(guī)則強(qiáng)弱對(duì)紅外抗干擾評(píng)估指標(biāo)體系進(jìn)行約簡(jiǎn)。同樣,關(guān)聯(lián)規(guī)則方法也可應(yīng)用到紅外對(duì)抗問題中,但以上文獻(xiàn)中對(duì)于連續(xù)型因素都是直接根據(jù)經(jīng)驗(yàn)人為取值或劃分區(qū)間來進(jìn)行離散化,未充分利用已有數(shù)據(jù); 同時(shí),對(duì)于挖掘出的關(guān)聯(lián)規(guī)則,直接作為最終規(guī)則使用,沒有對(duì)規(guī)則本身進(jìn)行深入分析和篩選。
為此,本文將基于獲取的試驗(yàn)數(shù)據(jù),采用-Means聚類算法對(duì)連續(xù)因素離散化,預(yù)處理后用FP-Growth算法進(jìn)行關(guān)聯(lián)規(guī)則挖掘,然后用和兩個(gè)指標(biāo)對(duì)所得規(guī)則作進(jìn)一步分析和篩選。
紅外對(duì)抗示意圖如圖1所示。紅外導(dǎo)彈打擊目標(biāo)飛機(jī)時(shí),飛機(jī)會(huì)投擲誘餌彈來干擾導(dǎo)彈,從而影響導(dǎo)彈的作戰(zhàn)效能。導(dǎo)彈、目標(biāo)飛機(jī)、誘餌是紅外對(duì)抗過程中的三個(gè)主要因素,此外,還有彈目相對(duì)態(tài)勢(shì)、自然環(huán)境等。
圖1 紅外對(duì)抗示意圖Fig.1 Schematic diagram of infrared countermeasure
基于以上分析,本文確定的紅外對(duì)抗因素見表1。
表1 紅外對(duì)抗因素
其中,誘餌齊投數(shù)及方向取值:1表示單發(fā)左右交替投擲,即目標(biāo)向左側(cè)投擲1枚誘餌,經(jīng)過相應(yīng)的組內(nèi)時(shí)間間隔后,再向右側(cè)投擲1枚,然后經(jīng)過組內(nèi)時(shí)間間隔后,再向左側(cè)投擲1枚,如此循環(huán),每次僅投擲1枚,直至這一組誘餌投完; 2表示單發(fā)左右同時(shí)投擲,即目標(biāo)同時(shí)向兩側(cè)各投擲1枚誘餌,經(jīng)過相應(yīng)的組內(nèi)時(shí)間間隔后,再同時(shí)向兩側(cè)各投擲1枚,如此循環(huán),每次共投擲2枚,直至這一組誘餌投完; 3表示雙發(fā)同時(shí)左邊投擲,即目標(biāo)向左側(cè)一次性投擲2枚誘餌,經(jīng)過相應(yīng)的組內(nèi)時(shí)間間隔后,再向左側(cè)一次性投擲2枚,如此循環(huán),每次投擲2枚,直至這一組誘餌投完; 4表示雙發(fā)同時(shí)右邊投擲,與3類似。
誘餌組數(shù)蘊(yùn)含在因素的取值中,可由誘餌總數(shù)除以每組誘餌數(shù)得到,如誘餌總數(shù)為12枚,每組誘餌數(shù)為4枚,則有3組。一組投完后,經(jīng)過相應(yīng)的組間時(shí)間間隔,再接著投下一組,且每一組均按照選定的誘餌齊投數(shù)及方向投擲誘餌。組與組之間可能有交集:當(dāng)組內(nèi)時(shí)間間隔較大,而組間時(shí)間間隔較小時(shí),一組誘餌可能還沒投擲完,就已經(jīng)經(jīng)過了相應(yīng)的組間時(shí)間間隔,需要開始投擲下一組誘餌了,這種情況是可以的。因?yàn)樵谡T餌投擲器中,每組誘餌之間互不干涉,按照設(shè)定的程序各自獨(dú)立投放誘餌,每組的工作持續(xù)時(shí)間可能有“干涉”。
目標(biāo)機(jī)動(dòng)類型取值:1為無機(jī)動(dòng); 2為右轉(zhuǎn)彎?rùn)C(jī)動(dòng); 3為左轉(zhuǎn)彎?rùn)C(jī)動(dòng); 4為躍升機(jī)動(dòng); 5為俯沖機(jī)動(dòng)。目標(biāo)的每種機(jī)動(dòng)類型數(shù)據(jù),都是通過軟件生成的,已經(jīng)包含了飛行速度、機(jī)動(dòng)過載、飛行高度等因素值的設(shè)定,生成的機(jī)動(dòng)數(shù)據(jù)直接裝訂到仿真系統(tǒng)中,試驗(yàn)時(shí)直接選用。
誘餌投擲時(shí)刻、導(dǎo)彈水平進(jìn)入角、彈目初始距離為連續(xù)型因素。導(dǎo)彈垂直進(jìn)入角設(shè)為0°。
為了獲取大量數(shù)據(jù),基于MATLAB2018和Visual Studio2010,開發(fā)了紅外對(duì)抗仿真平臺(tái)。仿真原理如圖2所示。在表1中,各因素取一個(gè)具體值后,構(gòu)成一個(gè)水平組合,即一個(gè)具體的對(duì)抗場(chǎng)景。由拉丁超立方抽樣方法得到不同的水平組合,即可設(shè)置出覆蓋面廣的對(duì)抗場(chǎng)景進(jìn)行仿真試驗(yàn),得到所需數(shù)據(jù)。
圖2 仿真原理圖Fig.2 Simulation schematic diagram
由于關(guān)聯(lián)規(guī)則方法無法處理連續(xù)型數(shù)值變量,為了將原始數(shù)據(jù)轉(zhuǎn)換為適合建模的格式,需要對(duì)數(shù)據(jù)進(jìn)行離散化。而聚類算法可以充分利用已有數(shù)據(jù)對(duì)連續(xù)型因素進(jìn)行離散化處理。
聚類分析是在沒有給出劃分類別的情況下,根據(jù)數(shù)據(jù)相似度進(jìn)行樣本分組的一種方法。聚類模型可以建立在無類標(biāo)記的數(shù)據(jù)上,是一種非監(jiān)督的學(xué)習(xí)算法。聚類的輸入是一組未被標(biāo)記的樣本,聚類根據(jù)數(shù)據(jù)自身的距離或相似度將其劃分為若干組,劃分的原則是組內(nèi)樣本最小化而組間距離最大化。常用的聚類方法有劃分方法、層次分析法等,本文采用劃分方法中的-Means算法進(jìn)行離散化處理。-Means聚類算法是典型的基于距離的非層次聚類算法,在最小化誤差函數(shù)的基礎(chǔ)上將數(shù)據(jù)劃分為預(yù)定的類數(shù),采用距離作為相似性的評(píng)價(jià)指標(biāo),即認(rèn)為兩個(gè)對(duì)象的距離越近,其相似度就越大。則誘彈投擲時(shí)刻、導(dǎo)彈水平進(jìn)入角、彈目初始距離聚類離散化后的結(jié)果如表2所示。
表2 連續(xù)型因素離散分組表
根據(jù)表1~2對(duì)數(shù)據(jù)進(jìn)行預(yù)編號(hào),如表3所示。表中共有41個(gè)編號(hào),分別對(duì)應(yīng)10個(gè)參數(shù)的不同項(xiàng)。其中,脫靶量是仿真結(jié)果,表示在對(duì)應(yīng)輸入因素作用下,運(yùn)行紅外對(duì)抗仿真系統(tǒng)所得導(dǎo)彈脫靶量。至此數(shù)據(jù)預(yù)處理完畢,可用于后續(xù)關(guān)聯(lián)規(guī)則挖掘。
表3 數(shù)據(jù)編號(hào)規(guī)則
關(guān)聯(lián)規(guī)則分析也稱為購(gòu)物籃分析,最早是為發(fā)現(xiàn)超市銷售數(shù)據(jù)庫(kù)中不同商品之間的關(guān)聯(lián)關(guān)系,從而采取有效措施來增加超市整體利潤(rùn)。常用的關(guān)聯(lián)規(guī)則方法有Apriori算法,該算法是通過連接產(chǎn)生候選項(xiàng)及其支持度,然后通過剪枝生成頻繁項(xiàng)集。但是,每次生成新的頻繁項(xiàng)集都要對(duì)數(shù)據(jù)庫(kù)進(jìn)行一次完整掃描,當(dāng)數(shù)據(jù)庫(kù)較大時(shí),其效率低下。而FP-Growth算法(Frequent Pattern Growth Algorithm)通過構(gòu)造頻繁模式樹將數(shù)據(jù)庫(kù)進(jìn)行壓縮,極大地減少數(shù)據(jù)庫(kù)掃描次數(shù),提高算法效率,非常適用于紅外對(duì)抗仿真大規(guī)模高維度數(shù)據(jù)挖掘。
關(guān)聯(lián)規(guī)則挖掘中通常使用的度量指標(biāo)有支持度和置信度兩個(gè),定義如下:
(1) 支持度
支持度表示因素組合項(xiàng)在整個(gè)數(shù)據(jù)記錄中發(fā)生的可能性,公式為
(1)
式中:(→)表示因素項(xiàng)發(fā)生的同時(shí)因素項(xiàng)發(fā)生,(,)為因素項(xiàng){,}的頻數(shù),()為數(shù)據(jù)庫(kù)所包含的記錄數(shù)。
(2) 置信度
置信度表示因素項(xiàng)發(fā)生的前提下因素項(xiàng)發(fā)生的可能性大小,公式為
(2)
置信度過低,則一般認(rèn)為因素項(xiàng)發(fā)生的前提下因素項(xiàng)發(fā)生的可能性很小,說明該規(guī)則→可信度很低。
關(guān)聯(lián)規(guī)則挖掘就是要找出形如→的表達(dá)式,使其支持度、置信度都不小于最小支持度和最小置信度。FP-Growth算法的主要步驟為:首先,根據(jù)數(shù)據(jù)構(gòu)造出FP樹; 然后,通過FP樹發(fā)現(xiàn)滿足最小支持度的所有頻繁項(xiàng)集; 最后,從提取的頻繁項(xiàng)集中找出滿足置信度要求的關(guān)聯(lián)規(guī)則。
基于預(yù)處理數(shù)據(jù),為得到含有數(shù)據(jù)量比較少的因素的規(guī)則,最小支持度設(shè)為0.05,最小置信度設(shè)為0.65,通過FP-Growth算法,初步挖掘出關(guān)聯(lián)規(guī)則。
支持度指標(biāo)受數(shù)據(jù)記錄總數(shù)影響,其度量性能較差,僅用支持度和置信度對(duì)關(guān)聯(lián)規(guī)則進(jìn)行評(píng)價(jià)不夠全面,需要添加新指標(biāo)來進(jìn)一步過濾關(guān)聯(lián)規(guī)則。為此,引入(Kulczynski)和(Imbalance Ratio)兩個(gè)指標(biāo)。和兩個(gè)度量指標(biāo)與數(shù)據(jù)記錄總數(shù)無直接關(guān)聯(lián),而是與因素項(xiàng)本身的個(gè)數(shù)有關(guān),可度量出因素項(xiàng)之間相關(guān)性的強(qiáng)弱。當(dāng)用支持度和置信度得到關(guān)聯(lián)規(guī)則后,因?yàn)橹С侄纫紤]到數(shù)據(jù)記錄總數(shù),這時(shí)可能會(huì)遺留一些實(shí)際上相關(guān)性弱的規(guī)則,如果與其他規(guī)則一起分析和使用,可能會(huì)產(chǎn)生矛盾或得到錯(cuò)誤的結(jié)論。而由和兩個(gè)指標(biāo)可過濾掉相關(guān)性不強(qiáng)的規(guī)則,使剩下的關(guān)聯(lián)規(guī)則更可靠,留下更感興趣的規(guī)則。
(1)指標(biāo)
指標(biāo)可以視為因素項(xiàng)集{,}之間置信度的平均值,即
(3)
若(,)<0.5,則因素項(xiàng)集{,}之間是負(fù)相關(guān); 若(,)=0.5,則因素項(xiàng)集{,}之間無明顯關(guān)聯(lián); 若(,)>0.5,則因素項(xiàng)集{,}之間是正相關(guān); 且(,)值越接近0.5,因素項(xiàng)集{,}之間關(guān)聯(lián)越弱。
(2)指標(biāo)
指標(biāo)是度量因素集{,}間的不平衡程度,即
(4)
當(dāng)(,)值接近0.5時(shí),需要用指標(biāo)進(jìn)行二次判斷。若(,)值越接近0,則因素集{,}之間關(guān)聯(lián)越弱; 若(,)值越接近1,則因素集{,}之間關(guān)聯(lián)越強(qiáng)。
設(shè)置<04或>0.6,min=04,若04≤≤06,則判斷≥min。對(duì)于初步獲得的關(guān)聯(lián)規(guī)則,經(jīng)過和指標(biāo)評(píng)價(jià)后,共刪減掉69條關(guān)聯(lián)規(guī)則,得到最終規(guī)則。將最終規(guī)則分為脫靶量的規(guī)則和僅含對(duì)抗因素的規(guī)則。部分規(guī)則分別如表4~5所示。
表4 含脫靶量的關(guān)聯(lián)規(guī)則
表4為紅外對(duì)抗因素與導(dǎo)彈脫靶量之間的關(guān)聯(lián)規(guī)則,部分規(guī)則分析如下,其余不再贅述。
序號(hào)2:規(guī)則G1, I1→J1的支持度為30%,置信度為90%,表示導(dǎo)彈水平進(jìn)入角在0°~60°、彈目初始距離在3~6 km時(shí),脫靶量小于10 m的概率達(dá)到90%。此種態(tài)勢(shì)下彈目距離較近,導(dǎo)彈從尾后攻擊目標(biāo),目標(biāo)飛機(jī)尾焰暴露在導(dǎo)引頭視場(chǎng)中,且輻射特征明顯。導(dǎo)彈能識(shí)別目標(biāo),不會(huì)輕易被誘餌誘偏,能穩(wěn)定跟蹤目標(biāo),命中概率大,脫靶量較小。
序號(hào)12:規(guī)則F1, G2, I2→J3表示誘餌投擲組間間隔為0.2 s、導(dǎo)彈水平進(jìn)入角在60°~110°、彈目初始距離在6~8 km時(shí),脫靶量大于30 m的概率達(dá)到75%。此種態(tài)勢(shì)下彈目距離較遠(yuǎn),導(dǎo)彈側(cè)向攻擊目標(biāo),目標(biāo)部分尾焰被機(jī)身遮蔽,且誘餌組間間隔取最小值0.2 s,誘餌能持續(xù)保持高輻射,對(duì)導(dǎo)彈產(chǎn)生強(qiáng)干擾。此時(shí),導(dǎo)彈被誘偏后,需要較長(zhǎng)時(shí)間才能再次定位,目標(biāo)容易逃離導(dǎo)引頭視場(chǎng),使導(dǎo)彈脫靶,產(chǎn)生很大的脫靶量。
序號(hào)13:規(guī)則D2, G2, H4→J2表示誘餌投擲時(shí)刻在1~2.5 s、導(dǎo)彈水平進(jìn)入角在60°~110°、目標(biāo)躍升機(jī)動(dòng)時(shí),脫靶量基本在10~30 m。此種態(tài)勢(shì)下導(dǎo)彈側(cè)向攻擊目標(biāo),目標(biāo)部分尾焰被機(jī)身遮蔽,且目標(biāo)躍升逃逸; 同時(shí),當(dāng)目標(biāo)發(fā)現(xiàn)導(dǎo)彈后較早地投擲誘餌彈,導(dǎo)彈容易被誘偏,對(duì)抗場(chǎng)景十分復(fù)雜,對(duì)導(dǎo)彈造成很強(qiáng)的干擾,命中率很低,脫靶量一般比較大。
表5為紅外對(duì)抗因素之間的關(guān)聯(lián)規(guī)則,表示各對(duì)抗因素之間不易發(fā)現(xiàn)的關(guān)系。
表5 對(duì)抗因素之間的關(guān)聯(lián)規(guī)則
序號(hào)6:規(guī)則F1, B2→D2表示在單發(fā)誘餌兩邊同時(shí)投擲、組間時(shí)間間隔為0.2 s時(shí),誘餌投擲時(shí)刻基本上取在1~2.5 s。序號(hào)10:規(guī)則B1, H3, I1→D1表示彈目初始距離在3~6 km、目標(biāo)左轉(zhuǎn)彎?rùn)C(jī)動(dòng)、誘餌單發(fā)左右交替投擲時(shí),誘餌投擲時(shí)刻基本上取在1 s以內(nèi)。序號(hào)12:規(guī)則D1, E4, I1→B1表示彈目初始距離在3~6 km、誘餌投擲時(shí)刻在1 s以內(nèi)、組內(nèi)時(shí)間間隔為0.4 s時(shí),誘餌投擲方式基本上選單發(fā)左右交替投擲。當(dāng)然,所得各對(duì)抗因素之間的一般關(guān)系及其組合的效果,還需通過試驗(yàn)結(jié)果進(jìn)行驗(yàn)證。
(1) FP-Growth算法可以挖掘出隱藏在紅外對(duì)抗因素和導(dǎo)彈脫靶量中的內(nèi)在關(guān)系,為紅外彈的抗干擾評(píng)估和作戰(zhàn)使用提供參考。
(2)-Means聚類算法可對(duì)連續(xù)數(shù)據(jù)進(jìn)行離散化處理,能充分利用已有數(shù)據(jù),避免人為取值而影響挖掘效率和效果。
(3) 由過濾的69條規(guī)則可知,和兩個(gè)指標(biāo)能對(duì)挖掘結(jié)果進(jìn)行深度篩選。
文中主要考慮紅外導(dǎo)引頭的外部因素,對(duì)于其內(nèi)部參數(shù)和相關(guān)算法等方面沒有進(jìn)行深入分析。同時(shí),獲取更真實(shí)的數(shù)據(jù)、選取合理的類別數(shù)、確定合適的篩選指標(biāo)值,均需要慎重考慮。以上不足和問題都是后續(xù)的工作方向。