摘要: 為剔除混凝土侵徹深度試驗(yàn)數(shù)據(jù)異常點(diǎn),提出了一種融合先驗(yàn)知識(shí)的異常檢測(cè)算法。利用反向傳播(backpropagation, BP)神經(jīng)網(wǎng)絡(luò)模型擬合試驗(yàn)樣本數(shù)據(jù)的分布,結(jié)合偏差指標(biāo)篩選離群樣本點(diǎn),并通過(guò)經(jīng)驗(yàn)算法評(píng)價(jià)模型異常檢測(cè)性能。針對(duì)試驗(yàn)數(shù)據(jù)特點(diǎn)選擇全量梯度下降結(jié)合動(dòng)量?jī)?yōu)化方法,從而提高模型迭代訓(xùn)練的穩(wěn)定性和效率,并且在構(gòu)建模型過(guò)程中融合領(lǐng)域先驗(yàn)知識(shí)約束對(duì)樣本數(shù)據(jù)的擬合,使得模型在訓(xùn)練過(guò)程中能反映附加特征的影響。結(jié)果表明,BP神經(jīng)網(wǎng)絡(luò)模型適合于剛性彈對(duì)混凝土侵徹試驗(yàn)數(shù)據(jù)異常點(diǎn)的檢測(cè),加入合理的領(lǐng)域先驗(yàn)知識(shí)可有效提高模型的檢測(cè)精度。
關(guān)鍵詞: 混凝土侵徹;神經(jīng)網(wǎng)絡(luò);先驗(yàn)知識(shí);異常檢測(cè)
中圖分類號(hào): O385 國(guó)標(biāo)學(xué)科代碼: 13035 文獻(xiàn)標(biāo)志碼: A
彈丸對(duì)混凝土靶的侵徹貫穿過(guò)程往往伴隨著高壓、高應(yīng)變率和多物理場(chǎng)耦合,加之混凝土材料的非均勻性和其動(dòng)態(tài)力學(xué)性能的復(fù)雜性,使得該現(xiàn)象成為一個(gè)非線性的復(fù)雜問(wèn)題,傳統(tǒng)的科研三范式,即試驗(yàn)研究、理論分析和數(shù)值模擬在處理此類問(wèn)題時(shí)存在一定的局限性。隨著混凝土侵徹貫穿試驗(yàn)數(shù)據(jù)的積累和大數(shù)據(jù)技術(shù)的發(fā)展,第四科研范式,即數(shù)據(jù)驅(qū)動(dòng)型或數(shù)據(jù)密集型科研范式,提供了另一種可行的技術(shù)途徑[1],其主要依靠收集、分析和利用大量科研數(shù)據(jù)來(lái)發(fā)掘隱藏在數(shù)據(jù)背后的規(guī)律,以實(shí)現(xiàn)更準(zhǔn)確地預(yù)測(cè)并指導(dǎo)決策,已在多個(gè)沖擊爆炸毀傷效應(yīng)研究場(chǎng)景中得到成功應(yīng)用。Li 等[2] 將不同機(jī)器學(xué)習(xí)模型運(yùn)用于爆炸載荷預(yù)測(cè),對(duì)比分析了多個(gè)機(jī)器學(xué)習(xí)模型,發(fā)現(xiàn)Transformer 模型是預(yù)測(cè)爆炸載荷最有效的工具,其性能明顯優(yōu)于MLP (multi-layer perception) 等其他模型。Almustafa 等[3] 提出了一種基于隨機(jī)森林的機(jī)器學(xué)習(xí)模型來(lái)預(yù)測(cè)鋼筋混凝土板承受爆炸載荷時(shí)的結(jié)構(gòu)響應(yīng),發(fā)現(xiàn)機(jī)器學(xué)習(xí)模型可以有效預(yù)測(cè)爆炸載荷下鋼筋混凝土板的最大位移。Almustafa 等[4] 又利用420 條數(shù)據(jù)對(duì)爆炸載荷下鋼筋混凝土柱的最大位移進(jìn)行預(yù)測(cè),并提出了基于集成樹的機(jī)器學(xué)習(xí)模型,有效提升了預(yù)測(cè)性能。Zhao 等[5] 利用支持向量機(jī)算法、高斯過(guò)程回歸算法、隨機(jī)森林算法和反向傳播神經(jīng)網(wǎng)絡(luò)等4 種機(jī)器學(xué)習(xí)模型進(jìn)行了鋼筋混凝土板的最大位移預(yù)測(cè),盡管每種算法模型各有優(yōu)劣,但是這4 種模型預(yù)測(cè)效果都優(yōu)于現(xiàn)有的基于數(shù)值模擬和理論分析的方法。Neto 等[6] 采用機(jī)器學(xué)習(xí)方法評(píng)估局部爆炸載荷下軟鋼板的動(dòng)力響應(yīng),并結(jié)合試驗(yàn)數(shù)據(jù)和有限元模擬數(shù)據(jù)為訓(xùn)練神經(jīng)網(wǎng)絡(luò)提供了一個(gè)混合數(shù)據(jù)集,研究發(fā)現(xiàn),有限元模擬數(shù)據(jù)可解決試驗(yàn)數(shù)據(jù)不足的問(wèn)題,能夠顯著提高模型的預(yù)測(cè)精度。
數(shù)據(jù)質(zhì)量是數(shù)據(jù)驅(qū)動(dòng)模型有效性和準(zhǔn)確性的基礎(chǔ),缺乏可信數(shù)據(jù),數(shù)據(jù)驅(qū)動(dòng)模型無(wú)疑是空中樓閣。數(shù)據(jù)源中的異常點(diǎn)在數(shù)據(jù)處理過(guò)程中會(huì)將錯(cuò)誤的信息逐漸累積,最終造成錯(cuò)誤的挖掘結(jié)果。另外它還會(huì)降低數(shù)據(jù)挖掘算法的效率,也可能會(huì)在數(shù)據(jù)模型中引入非正態(tài)分布或其他的數(shù)據(jù)復(fù)雜性,從而很難甚至不可能找到準(zhǔn)確的數(shù)學(xué)模型[7]。而由于試驗(yàn)條件、量測(cè)技術(shù)、人為因素以及出于保密要求而加入的噪聲數(shù)據(jù)和虛假數(shù)據(jù)等,會(huì)導(dǎo)致原生數(shù)據(jù)中存在異常點(diǎn)。因此,為確保數(shù)據(jù)驅(qū)動(dòng)模型的準(zhǔn)確性,必須先對(duì)原生數(shù)據(jù)進(jìn)行異常值剔除操作。
神經(jīng)網(wǎng)絡(luò)模型是在回歸和分類問(wèn)題中被廣泛應(yīng)用的一類機(jī)器學(xué)習(xí)模型,它具有強(qiáng)大的非線性關(guān)系提取能力,可以自動(dòng)從輸入?yún)?shù)中學(xué)習(xí)到復(fù)雜的多維特征,并有效地?cái)M合數(shù)據(jù)樣本的分布,因此廣泛用于異常檢測(cè)任務(wù)[8]。相較于傳統(tǒng)的異常檢測(cè)方法,基于神經(jīng)網(wǎng)絡(luò)模型的異常檢測(cè)方法更適合于處理復(fù)雜多維、分布不均的混凝土侵徹深度試驗(yàn)數(shù)據(jù)。然而,由于數(shù)據(jù)數(shù)量有限、數(shù)據(jù)分布不均勻以及數(shù)據(jù)質(zhì)量不高等因素的影響,純依賴神經(jīng)網(wǎng)絡(luò)模型自動(dòng)擬合數(shù)據(jù)分布會(huì)導(dǎo)致預(yù)測(cè)效率降低、預(yù)測(cè)精度下降以及過(guò)擬合等問(wèn)題[9]。此外,神經(jīng)網(wǎng)絡(luò)模型由于可解釋性較差,從而造成模型魯棒性較差,一些微小的干擾就可能欺詐模型使其造成錯(cuò)誤的判斷[10]。而領(lǐng)域先驗(yàn)知識(shí)的加入,有利于提高神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)精度,增強(qiáng)模型的可解釋性以及魯棒性,使得模型更具有清晰的領(lǐng)域背景[9,11]。
在混凝土侵徹問(wèn)題研究中,基于理論分析和試驗(yàn)總結(jié),已經(jīng)積累了較豐富的先驗(yàn)知識(shí)。以剛性彈侵徹?zé)o限厚混凝土靶為例,空腔膨脹模型已經(jīng)得到了較廣泛的應(yīng)用,在可以獲取簡(jiǎn)化靶標(biāo)材料本構(gòu)模型的基礎(chǔ)上,空腔膨脹模型一般可給出彈體運(yùn)動(dòng)的封閉解[12],但高壓高應(yīng)變率下混凝土材料本構(gòu)模型的復(fù)雜性限制了空腔膨脹模型的應(yīng)用?;谠囼?yàn)數(shù)據(jù)和量綱分析,也建立了多個(gè)半經(jīng)驗(yàn)-半解析公式,它們一方面具有形式簡(jiǎn)單、便于求解的優(yōu)勢(shì),另一方面又結(jié)合理論分析和試驗(yàn)規(guī)律,給出了基礎(chǔ)物理量組合而成的無(wú)量綱數(shù),作為控制彈體侵徹深度的主要控制參數(shù),有效避免了純經(jīng)驗(yàn)方程基本物理概念不清晰、不便于推廣應(yīng)用等不足[13]。目前,剛性彈對(duì)無(wú)限厚混凝土靶侵徹深度半經(jīng)驗(yàn)-半解析模型主要有Chen 等[14]提出的兩參數(shù)模型和Li 等[15] 提出單參數(shù)模型以及文獻(xiàn)[16] 中建立的三參數(shù)模型等,這些組合參量形式簡(jiǎn)單、易于獲取,而且現(xiàn)有研究結(jié)果表明其能較真實(shí)地反映彈和靶的物理性能對(duì)侵徹過(guò)程的影響[17],因此可作為剛性彈對(duì)無(wú)限厚混凝土靶侵徹深度預(yù)測(cè)的先驗(yàn)知識(shí)。
某些特定領(lǐng)域,由于試驗(yàn)數(shù)據(jù)獲取困難、代價(jià)昂貴、實(shí)際試驗(yàn)過(guò)程中干擾因素較多,導(dǎo)致數(shù)據(jù)數(shù)量有限、分布不均勻甚至缺失以及數(shù)據(jù)噪聲和異常數(shù)據(jù)等,純依賴神經(jīng)網(wǎng)絡(luò)模型從原生數(shù)據(jù)中自動(dòng)擬合數(shù)據(jù)分布,可導(dǎo)致模型僅學(xué)習(xí)到局部分布規(guī)律和錯(cuò)誤知識(shí),會(huì)嚴(yán)重影響模型性能,甚至?xí)蛴?xùn)練樣本數(shù)據(jù)質(zhì)量問(wèn)題導(dǎo)致錯(cuò)誤的預(yù)測(cè)結(jié)果,也會(huì)降低模型的收斂速度。從機(jī)器學(xué)習(xí)角度來(lái)看,神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過(guò)程就是從樣本數(shù)據(jù)中學(xué)習(xí)擬合數(shù)據(jù)分布規(guī)律的過(guò)程,通過(guò)加入額外輸入分支的方式為模型賦予領(lǐng)域先驗(yàn)知識(shí)相當(dāng)于使模型提前掌握一定的數(shù)據(jù)分布規(guī)律,從而節(jié)省模型學(xué)習(xí)時(shí)間,提高模型收斂速度。本文中,通過(guò)集成相應(yīng)領(lǐng)域?qū)<抑R(shí)的形式為模型賦予先驗(yàn)知識(shí),將混凝土侵徹深度的物理模型、參數(shù)約束和參數(shù)間依賴關(guān)系等知識(shí)以額外輸入?yún)?shù)的形式提供給模型,以提升模型的性能,增強(qiáng)模型的魯棒性,同時(shí)提高模型收斂速度。
本文中,首先在傳統(tǒng)BP (back propagation) 神經(jīng)網(wǎng)絡(luò)模型的基礎(chǔ)上,加入不同專家先驗(yàn)知識(shí)提升模型性能,約束模型對(duì)試驗(yàn)數(shù)據(jù)分布的擬合,結(jié)合基于偏差的指標(biāo)剔除試驗(yàn)樣本異常點(diǎn);然后,利用經(jīng)驗(yàn)公式檢驗(yàn)?zāi)P彤惓z測(cè)的準(zhǔn)確率;最后,利用數(shù)值實(shí)驗(yàn)結(jié)果分析不同先驗(yàn)知識(shí)對(duì)數(shù)據(jù)異常檢測(cè)結(jié)果的影響,為爆炸沖擊試驗(yàn)數(shù)據(jù)異常檢測(cè)提供一種可靠高效的機(jī)器學(xué)習(xí)算法。