遲明祎,侯興明,周 瑜,陳小衛(wèi)
(1.航天工程大學航天保障系,北京 102200;2.解放軍63850 部隊,吉林 白城 137001;3.解放軍32183 部隊,遼寧 錦州 121000)
防空火力試驗科目中,紅方發(fā)射防空導彈攔截前來襲擾的藍軍戰(zhàn)斗機(以靶機代替),數(shù)據(jù)采集人員借助紅外經(jīng)緯儀測量系統(tǒng)對導彈跟蹤拍攝,事后解算導彈坐標、遭遇段的靶機航跡和脫靶量。如何在稍縱即逝的發(fā)射窗口期內(nèi)確保較高的測量精度和目標捕獲率,一直是困擾著參試人員的難題。靶場傳統(tǒng)方法是指派經(jīng)驗豐富的測試指揮員、技術骨干,制定初步布站方案和數(shù)據(jù)采集策略,經(jīng)過會審敲定,該方法是一種過多依賴專家主觀經(jīng)驗和閱歷的“粗放式”的方法,易造成“不合格品”。劉建宏等提出一種基于自適應遺傳算法的光測設備布站優(yōu)化方法,構建了基于提升測量精度的目標函數(shù),提升了經(jīng)緯儀交會精度,缺點在于需要對測量精度、設備跟蹤精度、逆光條件、區(qū)域約束條件和通視約束5 類復雜約束條件的分析,涉及大量運算,且容易陷入局部最優(yōu)解。歐士揚等提出在有若干種方案可供選擇的情況下,通過建立方案評估的指標體系和權重對各種方案的優(yōu)劣進行評估,該方法過多依賴專家的專業(yè)知識、經(jīng)驗素質(zhì)和推理能力,主觀因素占比較大。近年來,隨著各類光學設備承擔常規(guī)武器性能、作戰(zhàn)試驗任務的增多,試驗機構積累了大量的歷史試驗數(shù)據(jù),這些數(shù)據(jù)在完成試驗鑒定之后往往入庫封存不再利用。如何在基于已有歷史試驗數(shù)據(jù)分析的基礎上,避開對復雜約束因子和目標之間關系的分析,構建數(shù)據(jù)采集方案優(yōu)化策略集,減少試驗方案設計優(yōu)化中主觀“人算”因素,提高“機算”、“智算”的比例,從而提升數(shù)據(jù)捕獲率和測試精度,對于為后續(xù)試驗數(shù)據(jù)采集方案的優(yōu)化改進具有重要的意義,是本文研究的主要內(nèi)容。
本文提出借助對已有歷史試驗數(shù)據(jù)的關聯(lián)規(guī)則挖掘,采取定性與定量相結合的方法,解決紅外經(jīng)緯儀測量系統(tǒng)數(shù)據(jù)采集方案優(yōu)化的問題。Apriori算法是關聯(lián)規(guī)則挖掘算法中較為經(jīng)典的算法,能夠有效降低頻繁集計算量,操作簡單,應用廣泛。PDCA 戴明環(huán)是質(zhì)量管理和優(yōu)化領域應用最基本、科學的方法,具有形象化、不斷演進和提高的特點。本文將廣度優(yōu)先搜索策略Apriori 關聯(lián)規(guī)則挖掘算法和PDCA 戴明環(huán)相結合,通過對大量以往數(shù)據(jù)采集方案文本數(shù)據(jù)的分析和關聯(lián)挖掘,探究影響試驗數(shù)據(jù)錄取的事件和因子有哪些,并分析其作用機理,采用階躍PDCA 方法對數(shù)據(jù)采集方案進行循環(huán)優(yōu)化,規(guī)避不利因素,從而提升數(shù)據(jù)錄取率和精度。
Apriori 算法核心思想是通過逐層次搜索迭代,對數(shù)據(jù)庫進行搜索分析,獲得頻繁1-項集,而后進行兩兩連接JOIN 操作形成頻繁2-項集,以此類推,直至找到最高階頻繁k-項集,搜索結束。Apriori 算法流程如下:
1)設置最小支持度min-support 和最小置信度min-confidence;
2)搜索數(shù)據(jù)庫所有數(shù)據(jù),得到候選1-項集,計算支持度和置信度,剔除候選項集中支持度小于min-support 和置信度小于min-confidence 的項目,得到頻繁1-項集,記為L;
3)連接步:對所有的頻繁k-1-項集L進行JOIN 連接操作,得到候選k-項集;
4)剪枝步:剪除候選k-項集中包含不頻繁項的項集。剪枝步能夠有效減少對候選項集支持度和置信度比較計算的計算量,壓縮數(shù)據(jù)規(guī)模;
5)計算支持度和置信度,剔除支持度小于min-support 和置信度小于min-confidence 的項,得到頻繁k-項集,記為L;
6)重復第3)步~5)步,直到不再出現(xiàn)更高階的項集,退出迭代,算法流程如圖1 所示。
圖1 Apriori 算法流程
在防空火力試驗文本數(shù)據(jù)中:
1)設D 表示跟數(shù)據(jù)錄取有關的事務數(shù)據(jù)庫,其組成元素是若干個項集d,項集d 表示跟數(shù)據(jù)錄取有關的事件的集合,其組成元素是若干個事件T。
支持度(support)是指D 中同時含有A,B 的概率,它表示規(guī)則在整個數(shù)據(jù)中的重要性:
置信度(confidence)是指在D 中包含A 的前提下,含有B 的概率,它表示A→B 規(guī)則的有效性:
為了研究的需要,以某型紅外經(jīng)緯儀測量系統(tǒng)為分析對象。在近7 年時間內(nèi),該設備參與完成的每一次試驗科目中,試驗設計人員會將本次參試基本情況:基線長度、站點位置、紅外作用距離、長/短焦模式、地表溫度、空中可見度、操作手技能等參數(shù)準確記錄在案,經(jīng)整理形成數(shù)據(jù)采集文本數(shù)據(jù)進行留存,供后續(xù)試驗過程回溯參考使用。本例篩選300 組有代表性的數(shù)據(jù)構建數(shù)據(jù)庫,部分數(shù)據(jù)如表1 所示。
表1 事件數(shù)據(jù)庫原始數(shù)據(jù)
其中,事件代號及其基本描述如表2 所示。
表2 事件代號及其基本描述
由于涉及的事件較多,且種類、量綱和屬性各不相同,為了便于對數(shù)據(jù)進行關聯(lián)規(guī)則挖掘,對各項數(shù)值進行分類分級,離散化處理,用編號代替以便于計算機處理。
基線長度(T):A(1≤T<1.5),A(1.5≤T<2.5),A(2.5≤T<3.5),A(3.5≤T);
操作手技能(T):A(合格),A(良),A(優(yōu));
地表溫度(T):A(T≤-20℃),A(-20℃<T≤-5℃),A(-5℃<T≤20℃),A(20℃<T);
目標最大角速度(T):A(T≤2°/s),A(2°/s<T≤4°/s),A(4°/s<T);
紅外作用距離(T):A(T≤1.5 km),A(1.5 km<T≤3 km),A(3 km<T);
全系統(tǒng)無故障率(T):A(T≤70%),A(70%<T≤85%),A(85%<T);
站點個數(shù)(T):A(2 站),A(3 站及以上);
空中可見度(T):A(2 km 以內(nèi)),A(2 km~3 km),A(3 km 以上);
彈丸發(fā)光特性(T):A(發(fā)動機),A(尾焰初始段消失),A(尾焰中段消失),A(尾焰終段消失);
天時(T):A(白晝),A(清晨),A(傍晚),A(夜間);
發(fā)射口令(T):A(伺機),A(倒計時);
技術把關(T):A(中),A(良),A(優(yōu));
分站操作經(jīng)驗(T):A(中),A(良),A(優(yōu));
跟蹤方式(T):A(手動),A(自跟轉手跟),A(紅外自動),A(凝視);
數(shù)據(jù)錄取效果(T):A(T≤70%),A(70%<T≤80%),A(80%<T≤90%),A(90%<T)。
采用廣度優(yōu)先搜索策略的Apriori 算法,對經(jīng)過預處理的數(shù)據(jù)進行關聯(lián)規(guī)則挖掘,設置最小支持度min-support 為10%,最小置信度min-confidence 為70%,借助MATLAB 工具,對300 組數(shù)據(jù)進行掃描和分析,得到所有頻繁項集,其中部分關聯(lián)規(guī)則如表3 所示。
表3 頻繁項集關聯(lián)結果
對表中關聯(lián)規(guī)則進行解讀,得到部分結論如下:
規(guī)則1:基線長度在2.5 km~3.5 km 之間,彈丸最大角速度小于2°/s,空中可見度3 km 以上,數(shù)據(jù)錄取在90 分以上;
規(guī)則2:站點個數(shù)3 個~4 個,紅外作用距離2 km~3 km,地表溫度-5℃~20℃,數(shù)據(jù)錄取在80 分以上;
規(guī)則3:技術把關中等,操作手技能合格,分站操作經(jīng)驗中等,數(shù)據(jù)錄取在80 分以下;
規(guī)則4:發(fā)動機無火焰,自跟蹤,紅外作用距離>3 km,基線較長,數(shù)據(jù)錄取結果較差。
通過關聯(lián)規(guī)則挖掘得到各影響時間,在專家分析的基礎上,繪制數(shù)據(jù)采集方案影響要素動態(tài)因果關系圖,如圖2 所示,實線為正反饋+,虛線為負反饋-。
圖2 要素動態(tài)因果關系
通過關聯(lián)規(guī)則挖掘,得到頻繁項集,繪制了數(shù)據(jù)采集方案設計要素的動態(tài)因果關系圖,在此基礎上,借助PDCA 循環(huán)對數(shù)據(jù)采集方案的設計進行優(yōu)化。PDCA 循環(huán)又稱“戴明環(huán)”,由美國質(zhì)量管理專家休哈特博士提出,經(jīng)戴明推廣普及,P、D、C、A分別代表優(yōu)化過程的4 個步驟:
Plan:根據(jù)目標和要求,制定計劃;
Do:執(zhí)行,實施計劃;
Check:檢查計劃實施情況是否與預期目標一致;
Action:處理,反饋。對結果進行處理,推廣成功經(jīng)驗,總結失敗教訓。
通常在Action 環(huán)節(jié)中,未解決的問題放在下一個PDCA 的循環(huán)當中,即對PDCA 戴明環(huán)分解嵌套,實現(xiàn)循環(huán)提高,階梯式進步,其原理如下頁圖3所示。
圖3 PDCA 戴明環(huán)工作原理
結合本案例,優(yōu)化分析步驟如下:
Step 1:根據(jù)PDCA 戴明環(huán)原理,將歷史試驗數(shù)據(jù)關聯(lián)挖掘結果視為上一輪循環(huán)的結果,通過分析、總結、檢查和處理,得出改進的結論;
Step 2:從影響數(shù)據(jù)錄取質(zhì)量的因子出發(fā),基于關聯(lián)規(guī)則頻繁項集所反映的規(guī)律,為下一次試驗數(shù)據(jù)采集方案制定詳細計劃;
Step 3:在執(zhí)行過程中,根據(jù)設計和布局,執(zhí)行計劃的內(nèi)容,并記錄哪類問題得到解決,哪些經(jīng)驗值得推廣,哪類問題沒有得到解決,以及出現(xiàn)的新問題;
Step 4:在理論和實踐相結合的過程中,對采集方案的執(zhí)行進行復查。總結計劃執(zhí)行的結果,明確措施對應的效果,厘清有效措施、無效措施,找出遺留問題和新問題;
返回Step 1:對總結檢查的結果進行處理,有效措施進行固化,無效措施改變策略,對于沒有解決的問題和新問題,分析誘因,轉到下一級循環(huán)中解決。
總結得出方案優(yōu)化過程詳見下頁表4。
對表4 的數(shù)據(jù)采集方案優(yōu)化策略進行解讀,得到如下結論(部分)供試驗人員參考:
表4 基于PDCA 戴明環(huán)理論的紅外經(jīng)緯儀測量系統(tǒng)數(shù)據(jù)采集方案設計優(yōu)化策略
1)應當在一定范圍內(nèi)增加基線長度,增大交會角,兼顧目標作用距離,在“基線長度允許區(qū)間n 作用距離允許區(qū)間”內(nèi)布設站點,此外,因臨時點位穩(wěn)固性差、地基下沉,易造成坐標變化,應盡量選取帶有深層地基結構的固定點位,對提升數(shù)據(jù)交會精度有良好作用。
2)長焦拍攝精度優(yōu)于短焦,短焦視場大易于跟蹤,這是一對矛盾因子,應通過調(diào)整紅外作用距離兼顧成像精度和跟蹤難度。此外,科學調(diào)整經(jīng)緯儀指向與彈道飛行投影路徑的夾角,規(guī)避側視點位,盡量選取后視觀測點位,是提升成像和跟蹤水平從而提高數(shù)據(jù)錄取精度的有效措施。
3)增強對分站操控人員、操作手技能的培養(yǎng),優(yōu)化人員配備。設備所屬單位應充分利用周、月、半年維護、進點調(diào)機和試前維護等機會,開展技能培訓,以“傳幫帶,結對子”的形式促進賡續(xù)和傳承,并加強人員持證上崗考核力度。此外,加強對試驗方案的推演和技術把關,將問題遏制在萌芽階段,是確保試驗順利開展的必要手段。
4)精細把控試驗細節(jié),與試驗指揮員密切溝通、協(xié)同。試前就重要信息如彈丸發(fā)光特性、飛行特點、科目想定、發(fā)射時機和安全區(qū)域等進行充分溝通,加強對試驗細節(jié)的精細把控,形成應急預案,知己知彼百戰(zhàn)不殆,不可因懼怕麻煩而草率。
5)影響試驗方案設計和數(shù)據(jù)錄取質(zhì)量的并不是單一或少量因子,往往是多重因素,且影響效果大多呈非線性,影響方向隨區(qū)間可變,還存在相互制約的矛盾因子。本文通過關聯(lián)規(guī)則挖掘找到14種影響因子,隨著數(shù)據(jù)再利用方法水平的提高,結論會在今后的研究中不斷得到豐富和完善。
為了驗證結論的有效性,組織某試驗場相關專家和參試人員對上述結論的進行了分析評議,并組織分站操作人員、操作手基于經(jīng)緯儀模擬跟蹤訓練器進行虛擬目標的模擬跟蹤和交會(正式試驗因其特殊性不可作為檢驗手段),借助平均絕對百分比誤差(MAPE)對預測效果進行評價,其計算公式如下]:
經(jīng)多次試驗計算平均值,紅外經(jīng)緯儀測量系統(tǒng)訓練過程中的目標捕獲率和采集精度分別提升了11.8%和2.1%。此外,與采用將光測系統(tǒng)平衡程度和特征點測量精度作為約束條件的經(jīng)緯儀布站優(yōu)化設計方法結果相比,數(shù)據(jù)交會精度提升了0.8%;與基于差異進化優(yōu)化算法的靶場測控方案優(yōu)化設計方法相比,數(shù)據(jù)交會精度提升了1.2%,通過對比,驗證了上述觀點的正確性和有效性。動態(tài)因果關系圖和方案優(yōu)化措施表可作為后續(xù)性能試驗、作戰(zhàn)試驗相關科目設計和改進的參考依據(jù),可為參試人員提升目標捕獲率和數(shù)據(jù)采集的精度提供思路和借鑒。
針對提升紅外經(jīng)緯儀測量系統(tǒng)彈道測試試驗目標捕獲率和測試精度問題,采用Apriori 關聯(lián)規(guī)則挖掘算法,對歷史試驗文本數(shù)據(jù)進行分析挖掘,得到數(shù)據(jù)采集方案頻繁關聯(lián)因子,并分析作用機理,繪制數(shù)據(jù)采集方案設計要素動態(tài)因果關系圖,并結合PDCA 戴明環(huán)對數(shù)據(jù)采集方案進行循環(huán)階躍式
優(yōu)化處理,驗證了方法的可行性和結論的有效性,可為彈道相機、光學經(jīng)緯儀等光學設施設備數(shù)據(jù)采集方案的制定提供一定的借鑒和參考,探索了基于關聯(lián)規(guī)則挖掘的試驗數(shù)據(jù)再利用方法。