• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于機器學(xué)習(xí)的軍用軟件過時淘汰評估方法研究

    2019-05-27 08:23:12宋太亮3鄭玉杰鄭雪松
    計算機測量與控制 2019年5期
    關(guān)鍵詞:建模矩陣樣本

    帥 勇,宋太亮3,鄭玉杰,鄭雪松,唐 浩

    (1.重慶賽寶工業(yè)技術(shù)研究院,重慶 401332; 2.重慶市電子信息產(chǎn)品可靠性工程技術(shù)研究中心,重慶 401132; 3.中國國防科技信息中心,北京 100142)

    0 引言

    隨著信息技術(shù)的快速發(fā)展和高技術(shù)戰(zhàn)爭作戰(zhàn)方式多樣化程度的不斷加劇,軟件在作戰(zhàn)、訓(xùn)練和管理等軍事活動中發(fā)揮著越來越重要的作用。軟件過時淘汰特性[1]是軟件的重要特性之一,是確定軟件生命終止的重要標志,在軟件的使用與維護過程中,發(fā)揮著與軟件可靠性、安全性、可行性等特性同等重要的作用。開展軟件過時淘汰研究,對于提升軟件的性能,充分發(fā)揮軟件的作用,具有重要的軍事價值和經(jīng)濟價值。然而,當(dāng)前軍方還沒有確定軟件過時淘汰的相關(guān)方法和措施,不利于有效控制軟件的成本和生命周期。

    論文針對軟件過時淘汰的原理和相關(guān)數(shù)據(jù)的基本特性,按照機器學(xué)習(xí)分析的基本思路建立軍用軟件過時淘汰評估模型。首先采集相關(guān)特征的數(shù)據(jù),使用MinMaxScaler算法對樣本數(shù)據(jù)進行預(yù)處理,然后利用主成分分析(Principe Component Analysis, PCA)模型進行特征提取和降維,消除數(shù)據(jù)中的噪音值并選擇重要的軍用軟件過時淘汰特征和數(shù)據(jù),使用改進的支持向量機(Support Vector Machine, SVM)模型進行分類和評估建模,最后使用混淆矩陣對評估結(jié)果進行判斷,證明模型的有效性和科學(xué)性。軟件過時淘汰評估機器學(xué)習(xí)建??傮w思路如圖1所示。

    圖1 軟件過時淘汰評估機器學(xué)習(xí)建??傮w思路

    1 軍用軟件過時淘汰技術(shù)相關(guān)研究

    美軍早在2014就開始了對軟件過時淘汰技術(shù)的研究,其報告《Software obsolescence in defence》[2]中指出,盡管已經(jīng)對軟件過時淘汰進行了各種分析和研究,并開發(fā)了用于降低軟件和組件成本的工具,但沒有開發(fā)用于評估軟件過時淘汰成本的框架。即使軟件功能完整,但如果無法使用,軟件也會被過時淘汰。如果不主動檢查和控制,將會造成巨大的成本負擔(dān)。

    當(dāng)前對于軟件過時淘汰的研究主要分為以下四個方面:

    一是對過時淘汰機理分析研究。如文獻[3]將軟件過時淘汰的原因歸納為平臺過時、技術(shù)過時和介質(zhì)過時,文獻[4]從正反兩方面論述了軟件過時淘汰的標志和未達到過時淘汰的標志,文獻[5-6]將軟件過時淘汰的原因解釋為技術(shù)過時、功能過時和后勤保障過時,并分析了軟件過時淘汰的重要性。

    二是過時淘汰分析與評估模型建立。如文獻[7]通過設(shè)計分析、技術(shù)開發(fā)分析和成本分析對是否需要軟件過時淘汰進行評估;文獻[6]提出使用軟件生命周期的瀑布圖,并將螺旋迭代和增量生命周期映射到CADMID生命周期圖中來評估軟件過時淘汰;文獻[1]采用模糊貝葉斯網(wǎng)路算法評估軟件過時淘汰的影響,并輔助管理者進行決策。

    三是過時淘汰對策分析。如文獻[8]開發(fā)了過時淘汰地圖軟件來確定軟件過時的范圍和驅(qū)動因素,用以監(jiān)控和管理軟件過時淘汰,減少過時淘汰并避免業(yè)務(wù)中斷;文獻[9]開發(fā)了一個軟件過時淘汰測試模塊接收器,用于判斷何種狀態(tài)下應(yīng)該進行軟件過時淘汰;文獻[10]指出應(yīng)對軟件過時淘汰的策略是確定舊版本產(chǎn)品的第三方供應(yīng)商支持、找到備用商業(yè)應(yīng)用程序以執(zhí)行該功能、考慮為有限數(shù)量的特定軟件應(yīng)用程序提供升級策略;文獻[2]以關(guān)鍵的成本動因為基礎(chǔ)制定一個判斷軟件過時淘汰的框架,以輔助管理者制定正確的軟件過時淘汰決策。

    四是過時淘汰理論與技術(shù)的行業(yè)應(yīng)用。如文獻[11]中,美國航空航天局采用低成本可擴展平臺和自適應(yīng)維護策略來解決航空航天軟件的過時淘汰問題;文獻[12]為了減輕石油和天然氣行業(yè)軟件過時的風(fēng)險,使用一種新框架來評估軟件類型,并識別和量化軟件過時淘汰的影響;文獻[13]針對航空航天企業(yè)在軟件過時淘汰上面臨的問題和挑戰(zhàn),提出一種航空航天工業(yè)軟件過時淘汰觸發(fā)圖,用以增強航空航天公司管理軟件應(yīng)用程序的綜合能力,避免業(yè)務(wù)中斷并優(yōu)化維護成本;文獻[14]針對衛(wèi)星地面控制軟件中常見的軟件過時及缺乏理想的功能和靈活性等問題,開發(fā)了基于衛(wèi)星地面控制軟件對象處理方法輪模型和處理軟件過時淘汰指導(dǎo)方針系統(tǒng),利用數(shù)據(jù)庫驅(qū)動的應(yīng)用程序以及對象過程方向和模塊化的概念,輔助衛(wèi)星運營商靈活地創(chuàng)建新功能,并使軟件開發(fā)人員能夠更快地發(fā)現(xiàn)錯誤并更有效地修復(fù)錯誤。

    以上對于軟件過時淘汰的研究大部分來源于軍方開展的工作,雖然解決了當(dāng)前存在的部分問題,但是仍然過度依賴于專家知識和機理分析,并限定在特定的行業(yè)中,其科學(xué)性、適用性和可行性較差。本文從數(shù)據(jù)的角度出發(fā),基于多個機器學(xué)習(xí)算法構(gòu)建綜合模型,對軟件過時淘汰相關(guān)特征數(shù)據(jù)進行處理,并且從中提取出其背后的因素,從而發(fā)現(xiàn)評估軍用軟件過時淘汰的方法,更具有科學(xué)性和適用性。

    2 機器學(xué)習(xí)建模

    2.1 預(yù)處理與縮放

    由于PCA和SVM模型對于樣本數(shù)據(jù)非常敏感,因此,對于采集的軟件過時淘汰相關(guān)特征數(shù)據(jù)進行預(yù)處理和縮放,可以使特征數(shù)據(jù)更加適用于PCA和SVM算法,提高算法的精度。

    對于定量的數(shù)據(jù),scikit-learn提供了四的數(shù)據(jù)預(yù)處理的方式,如表1所示。

    表1 數(shù)據(jù)預(yù)處理方法概述

    考慮到SVM和PCA算法的特性,論文采用MinMaxScaler函數(shù)對數(shù)據(jù)預(yù)處理與縮放,例如對維護費效值特征縮放后與縮放前數(shù)據(jù)比較如圖2、圖3所示。對于定性數(shù)據(jù),按照其定性表述的值,由人工確定在[0,1]之間取值。如對于特征“功能適應(yīng)性”,其評估值可能是包括“優(yōu)、良、中、差”四個等級,則定義其取值為0.9、0.7、0.5、0。

    圖2 縮放前數(shù)據(jù)

    圖3 縮放后數(shù)據(jù)

    2.2 基于PCA的特征提取與降維分析

    主成分分析是一種旋轉(zhuǎn)數(shù)據(jù)集的方法,旋轉(zhuǎn)后的特征在統(tǒng)計上不相關(guān),旋轉(zhuǎn)后根據(jù)新特征對解釋數(shù)據(jù)的重要性來選擇子集。[15]使用PCA保留一部分主成分來使用并進行降維,可以去除數(shù)據(jù)中的噪音,并找到影響軍用軟件過時淘汰的關(guān)鍵參數(shù)。主成分分析的基本思路如圖4至圖7所示。

    圖4 原始數(shù)據(jù)的主成分

    圖5 數(shù)據(jù)轉(zhuǎn)換后的主成分

    圖6 特征縮減后的主成分

    圖7 還原后的主成分

    2.3 基于改進SVM的分類和評估

    由于SVM在結(jié)構(gòu)、性能、學(xué)習(xí)速度、泛化能力、數(shù)據(jù)處理和維度免災(zāi)等方面具有顯著的優(yōu)勢,且可以推廣到更復(fù)雜的無法被輸入空間的超平面定義的模型的擴展,SVM模型已廣泛應(yīng)用于分類和回歸。[16]考慮到軍用軟件過時淘汰評估的結(jié)論是淘汰或不淘汰,因此可以將此類問題歸納為一個二分類問題進行處理,從而建立軟件過時淘汰的評估模型。

    SVM算法建模步驟如下[18]:

    第一步:構(gòu)建SVM估計函數(shù)。

    假設(shè)有一樣本集為{(y1,x1),(y2,x2),…,(yi,xi)},且y∈R。支持向量機線性方程表示如下,其估計函數(shù)為:

    f(x)=WTφ(x)+b

    (1)

    第二步:最優(yōu)問題的轉(zhuǎn)化。

    基于線性可分定理,利用ε不敏感損失函數(shù)將估計函數(shù)轉(zhuǎn)化為優(yōu)化問題:

    (2)

    (3)

    上式的約束條件為:

    第三步:采用對偶理論將上式轉(zhuǎn)化為二次規(guī)劃求解,則約束表達式的對偶式為:

    (4)

    其約束條件為:

    (5)

    第四步:通過二次規(guī)劃算法計算SVM模型。SVM模型為:

    (6)

    式中,K(xi,x)稱為核函數(shù),需要滿足Mercer條件,且需要滿足:

    Qij=K(xi,xj)=φ(xi)Tφ(xj)

    (7)

    論文采用徑向基函數(shù)(Radial Basis Function,RBF)作為SVM的核函數(shù),其計算方法見5-8。

    (8)

    SVM訓(xùn)練的優(yōu)化主要針對核函數(shù)、懲罰系數(shù)C和不敏感損失系數(shù)gamma。C和Gamma可通過粒子群優(yōu)化算法(particle swarm optimization,PSO)進行優(yōu)化,相關(guān)算法參見文獻[19]。通過對訓(xùn)練集的優(yōu)化,得到SVM的最佳參數(shù)組合,將該參數(shù)組合應(yīng)用到支持向量機分類模型中,計算出基于現(xiàn)有參數(shù)集的軍用軟件過時淘汰結(jié)果,并與實際的過時淘汰結(jié)果進行比較。

    2.4 基于混淆矩陣模型評估與驗證

    混淆矩陣是用N×N的矩陣形式來評估機器學(xué)習(xí)精度的一種方式。[15]對于二分類問題,混淆矩陣是一種最全面的表示方法,使用混淆矩陣輸出一個2×2的數(shù)據(jù),其中行對應(yīng)于真實的類別,列對應(yīng)于預(yù)測的類別?;煜仃囍鲗蔷€上的元素對應(yīng)于正確的分類,而其他元素則表示一個類別中有多少樣本被錯誤地劃分到其他類別中。觀察混淆矩陣,可以發(fā)現(xiàn)不同模型的問題,如較差的模型總是預(yù)測同一個類別,或者其真正例和真反例很少,而較好的模型其真正例和真反例更多,而假正例和假反例數(shù)量很少。

    混淆矩陣的評估方法包括精度、準確率、召回率和f-分數(shù)。[15]論文采用精度來評估混淆矩陣,其計算公式如下:

    (9)

    其中:TP表示被判定為負樣本,事實上也是負樣本的樣本數(shù);TN表示被判定為正樣本的樣本數(shù),事實上也是正樣本;FP表示被判定為正樣本,但事實上是負樣本的樣本數(shù);FN表示被判定為負樣本,但事實上是正樣本的樣本數(shù)。

    3 案例分析

    論文使用某裝甲機械化部隊裝備管理方面使用的34個軟件系統(tǒng)在2010~2015年間的過時淘汰相關(guān)特征數(shù)據(jù)及評估數(shù)據(jù)進行案例分析,并驗證模型的有效性,建模環(huán)境為python3.5,機器學(xué)習(xí)庫為scikit-learn,深度學(xué)習(xí)庫為TensorFlow。

    3.1 案例運算

    基于論文的建模思路,首先采集軟件過時淘汰數(shù)據(jù)集??紤]到軍用軟件過時淘汰的特性,為了減少專家決策對樣本數(shù)據(jù)的影響,論文的樣本特征采集使用基于文本挖掘[17]的特征獲取方法,采集公開發(fā)表的相關(guān)論文中涉及到軟件過時淘汰的20個高頻特征參數(shù),包括:維護費效值、硬件匹配度、滿負荷運轉(zhuǎn)率、軟件平臺兼容性、功能適應(yīng)度、客戶滿意度、環(huán)境適應(yīng)度、任務(wù)完成度、風(fēng)險管理能力、平均響應(yīng)時間、最長響應(yīng)時間、滿負荷每小時處理請求數(shù)目、功能實現(xiàn)程度、平均維護時間、平均維護金額、維護服務(wù)是是否提供、關(guān)鍵容錯率、自修復(fù)率、致命性故障間隔時間、平均無故障時間。依據(jù)上述特征參數(shù),獲取34個樣本軟件中上述特征對應(yīng)的數(shù)據(jù)并進行評估建模。

    步驟1:對于采集的樣本特征數(shù)據(jù),使用MinMaxScaler算法歸一化處理定量數(shù)據(jù)和定性數(shù)據(jù),使得所有樣本值都位于|0~1|之間。為了保證訓(xùn)練集、驗證集和測試集的獨立性和可信性,使用sklearn的train_test_split函數(shù)對數(shù)據(jù)集進行兩次劃,第一次將樣本數(shù)據(jù)集劃分訓(xùn)練集和測試集,第二次將訓(xùn)練集劃分為用于構(gòu)建模型的訓(xùn)練數(shù)據(jù)集和用于選擇模型參數(shù)的驗證數(shù)據(jù)集。

    步驟2:使用PCA進行建模,選擇與軍用軟件過時淘汰關(guān)聯(lián)性強的特征參數(shù),并以前兩個特征為例,生成對于訓(xùn)練數(shù)據(jù)的熱圖和特征間的關(guān)聯(lián)結(jié)果,如圖8所示。從圖中可以發(fā)現(xiàn),第一特征的值較大,距離1更近,這意味著其他測量值接近于1的可能性也較大,所有特征之間存在普遍的相關(guān)性;第二個主成分的值較小,距離0更近,說明該特征與其他特征的相關(guān)性不如特征1明顯。這種情況下,優(yōu)先選擇第一個主成分作為下一步SVM建模的特征參數(shù)。基于此規(guī)則進行降維,選擇特征相關(guān)性最強的8個特征參數(shù)進行下一步的評估建模,相關(guān)參數(shù)為維護費效值、環(huán)境適應(yīng)度、平均響應(yīng)時間、風(fēng)險管理能力、滿負荷每小時處理請求數(shù)目、自修復(fù)率、致命性故障間隔時間、平均無故障時間。

    圖8 基于PCA的特征系數(shù)可視化熱圖

    步驟3:使用SVM進行分類與評估,建立軟件過時淘汰評估模型。對于評估結(jié)果,以0.5為閾值?;谏鲜霭藗€特征對軟件的過時淘汰特性進行評估,當(dāng)某個軟件的評估值低于0.5時,認定其需要進行過時淘汰;當(dāng)其評估值大于等于0.5時,認定其不需要進行過時淘汰。

    利用SVM建立評估模型,首先使用PSO算法[14]對SVM的C和gamma進行化,并選擇典型的C和gamma進行熱圖比較,可以發(fā)現(xiàn),當(dāng)C=100,gamma=0.01時,訓(xùn)練精度最高,為0.97。SVM中C和gamma訓(xùn)練值比較如圖9所示。

    圖9 SVM中C和gamma訓(xùn)練值比較

    SVM模型使用最優(yōu)的C和gamma值對測試集進行運算,得到模型的評估值與真實值的比較結(jié)果,并使用KNN、樸素貝葉斯和邏輯回歸法進行運算并比較評估結(jié)果。使用混淆矩陣比較各算法混淆矩陣的訓(xùn)練精度和測試精度,結(jié)果如表2所示。

    表2 各模型訓(xùn)練精度與測試精度比較

    3.2 結(jié)果分析

    通過案例分析可以發(fā)現(xiàn),論文使用的機器學(xué)習(xí)綜合模型不僅可以在訓(xùn)練過程中達到最優(yōu)的效果,對于測試集的評估精度同樣有效,說明論文的機器學(xué)習(xí)模型具有較好的適應(yīng)性;同時,由于建模過程中沒有采用專家學(xué)習(xí)等主觀性較強的方法,保證了結(jié)論不受人為影響,體現(xiàn)了模型的科學(xué)性和客觀性。

    4 結(jié)論

    機器學(xué)習(xí)是從數(shù)據(jù)中提取知識,是統(tǒng)計學(xué)、人工智能和計算機學(xué)科的交叉研究領(lǐng)域。[15]針對機器學(xué)習(xí)算法的高效性和科學(xué)性,論文利用機器學(xué)習(xí)預(yù)處理與縮放、PCA、SVM等算法構(gòu)建軟件過時淘汰評估模型,并通過案例進行了分析建模,結(jié)果顯示機器學(xué)習(xí)模型具有更高的測試精度,更強的客觀性和科學(xué)性。

    猜你喜歡
    建模矩陣樣本
    用樣本估計總體復(fù)習(xí)點撥
    聯(lián)想等效,拓展建?!浴皫щ娦∏蛟诘刃鲋凶鰣A周運動”為例
    基于PSS/E的風(fēng)電場建模與動態(tài)分析
    電子制作(2018年17期)2018-09-28 01:56:44
    推動醫(yī)改的“直銷樣本”
    不對稱半橋變換器的建模與仿真
    隨機微分方程的樣本Lyapunov二次型估計
    初等行變換與初等列變換并用求逆矩陣
    村企共贏的樣本
    矩陣
    南都周刊(2015年4期)2015-09-10 07:22:44
    矩陣
    南都周刊(2015年3期)2015-09-10 07:22:44
    安塞县| 黄浦区| 惠安县| 资溪县| 囊谦县| 会泽县| 吴忠市| 谷城县| 牡丹江市| 黄冈市| 饶平县| 平远县| 临泽县| 汽车| 永定县| 郓城县| 邛崃市| 惠水县| 新宁县| 武陟县| 宜章县| 黄冈市| 广饶县| 闽清县| 金湖县| 大英县| 江油市| 德安县| 沙河市| 桃江县| 海阳市| 锡林浩特市| 呼和浩特市| 牟定县| 通许县| 甘孜县| 大化| 广安市| 随州市| 海兴县| 丽江市|