摘 要:風(fēng)洞試驗(yàn)方法和計(jì)算流體力學(xué)(CFD)數(shù)值模擬方法在飛行器的初步研制階段能夠?qū)τ陲w行器的氣動(dòng)性能提供精準(zhǔn)分析,其對(duì)于飛行器的氣動(dòng)外形優(yōu)化與設(shè)計(jì)起到了重要的作用。而風(fēng)洞試驗(yàn)與CFD方法不可避免地存在試驗(yàn)與計(jì)算成本較高等問(wèn)題。為實(shí)現(xiàn)對(duì)于飛行器氣動(dòng)性能的低成本及高效分析,本文對(duì)風(fēng)洞試驗(yàn)數(shù)據(jù)進(jìn)行了機(jī)器學(xué)習(xí)方法的預(yù)測(cè)分析研究,提出了一種基于多模型結(jié)合方法的數(shù)據(jù)融合模式,其原理是通過(guò)重復(fù)抽樣的方法多次獲取精度略低的CFD數(shù)據(jù)與精度較高的風(fēng)洞試驗(yàn)數(shù)據(jù)之間的映射關(guān)系,并通過(guò)基于均方誤差的加權(quán)方法對(duì)于多映射關(guān)系進(jìn)行結(jié)合從而輸出最終的預(yù)測(cè)結(jié)果。結(jié)果表明,基于重抽樣加權(quán)法的數(shù)據(jù)融合模式可以有效提升風(fēng)洞試驗(yàn)數(shù)據(jù)預(yù)測(cè)的精準(zhǔn)度與擬合度,輔助支撐風(fēng)洞試驗(yàn)人員進(jìn)行相關(guān)研究工作。
關(guān)鍵詞:數(shù)據(jù)融合; 重抽樣加權(quán)法; 風(fēng)洞試驗(yàn); CFD; 機(jī)器學(xué)習(xí)
中圖分類號(hào):V211.3 文獻(xiàn)標(biāo)識(shí)碼:A DOI:10.19452/j.issn1007-5453.2024.07.012
基金項(xiàng)目: 航空科學(xué)基金(2022Z006026004,2023M071027001)
在飛行器的初步研制階段,根據(jù)飛行器的氣動(dòng)外形需要開展相對(duì)應(yīng)的氣動(dòng)數(shù)值計(jì)算和氣動(dòng)特性評(píng)估,以規(guī)劃進(jìn)一步地優(yōu)化設(shè)計(jì)方案,因此對(duì)于飛行器氣動(dòng)外形進(jìn)行精準(zhǔn)且高效分析是必要的[1-3]。目前風(fēng)洞試驗(yàn)和計(jì)算流體力學(xué)(CFD)數(shù)值模擬是面向飛行器的氣動(dòng)特性分析的主要技術(shù)方法[4]。風(fēng)洞試驗(yàn)?zāi)軌驅(qū)︼w行器的氣動(dòng)外形開展精準(zhǔn)度較高的氣動(dòng)特性分析,但是存在成本高、試驗(yàn)周期過(guò)長(zhǎng)等問(wèn)題。CFD方法采用數(shù)值計(jì)算對(duì)于流體力學(xué)中的離散方程進(jìn)行求解,與風(fēng)洞試驗(yàn)相比,CFD方法在成本上有所下降,但是在精度上卻略低于風(fēng)洞試驗(yàn)結(jié)果[5-7]。
針對(duì)風(fēng)洞試驗(yàn)和CFD數(shù)值模擬存在的弊端,需要在合理發(fā)揮自身優(yōu)勢(shì)的基礎(chǔ)上,進(jìn)一步研發(fā)出一種既滿足低試驗(yàn)成本又能夠獲取高精度數(shù)據(jù)分析結(jié)果的方法。為此,一種基于多源氣動(dòng)數(shù)據(jù)融合的理念在國(guó)內(nèi)外被廣泛研究與應(yīng)用,其本質(zhì)是采用了一種能夠映射出低精度數(shù)據(jù)與高精度數(shù)據(jù)之間關(guān)系的代理模型,并實(shí)現(xiàn)對(duì)于高精度數(shù)據(jù)的精準(zhǔn)預(yù)測(cè)。目前為止,國(guó)內(nèi)外對(duì)于多源氣動(dòng)數(shù)據(jù)融合所開展的研究工作已經(jīng)取得了一些突破性的進(jìn)展,王文正等[8]首次提出了一種基于數(shù)學(xué)模型的多源氣動(dòng)數(shù)據(jù)融合準(zhǔn)則,并證明該方法的可行性;He Lei等[9]采用了一種深度神經(jīng)網(wǎng)絡(luò)算法(DNN)對(duì)于多源氣動(dòng)數(shù)據(jù)進(jìn)行預(yù)測(cè)分析,其提出的氣動(dòng)數(shù)據(jù)融合模型架構(gòu)發(fā)揮出了良好的預(yù)測(cè)效果;鄧晨等[10]提出了一種加權(quán)融合后的高斯過(guò)程回歸算法,并與地質(zhì)統(tǒng)計(jì)學(xué)中的協(xié)同克里金法(CoKriging)算法對(duì)多源氣動(dòng)數(shù)據(jù)進(jìn)行融合,結(jié)果表明CoKriging算法預(yù)測(cè)精度更高;王旭等[11]通過(guò)隨機(jī)森林算法中節(jié)點(diǎn)純凈度的特征選擇方法對(duì)變量特征進(jìn)行篩選,保留低精度數(shù)據(jù)變量特征及其他重要的變量特征,結(jié)果表明該方法具備良好的精準(zhǔn)度和擬合度;趙旋等[12]基于本征正交分解技術(shù)(POD)對(duì)于壓力分布信息進(jìn)行特征提取并生成POD系數(shù),對(duì)輸入?yún)?shù)與POD系數(shù)之間采用克里金(Kriging)模型進(jìn)行建模分析,并通過(guò)積分得到低精度數(shù)據(jù),最后通過(guò)Kriging模型獲取低精度數(shù)據(jù)與高精度數(shù)據(jù)之間的映射關(guān)系,結(jié)果表明該方法具有良好的精準(zhǔn)度和泛化能力。
上述文獻(xiàn)通過(guò)不同的代理模型有效獲取了高低精度數(shù)據(jù)之間的映射關(guān)系,提出的多源氣動(dòng)數(shù)據(jù)融合方法在預(yù)測(cè)精度上有所提升,但目前所涉及的方法均使用固定訓(xùn)練集與測(cè)試集的單次建模得到單一的高低精度數(shù)據(jù)之間的映射關(guān)系,當(dāng)數(shù)據(jù)較少時(shí),容易發(fā)生過(guò)擬合的情況,為進(jìn)一步提升預(yù)測(cè)結(jié)果的精準(zhǔn)度與擬合度,本文提出一種多模型結(jié)合的方法。根據(jù)辛欽(Khinchine’s)大數(shù)定律和中心極限定理,當(dāng)樣本之間是獨(dú)立分布時(shí),數(shù)量足夠多的樣本數(shù)據(jù)的平均值將近似等于總體數(shù)據(jù)的平均值[13-14]?;谏鲜鰯?shù)理推論,如若將代理模型在不同訓(xùn)練集下所得出的映射關(guān)系進(jìn)行均值或加權(quán)融合,最終預(yù)測(cè)結(jié)果將可能更加接近于真實(shí)值。因此,本文提出了一種基于重抽樣加權(quán)的多模型結(jié)合方法,將選取的每種代理模型通過(guò)重復(fù)抽樣法形成多個(gè)模型結(jié)果,從而獲取低精度數(shù)據(jù)與高精度數(shù)據(jù)之間的多映射關(guān)系,進(jìn)一步采用一種基于均方誤差的加權(quán)方法將多模型的映射關(guān)系進(jìn)行融合,最終所得出的結(jié)果與單次建模結(jié)果相比在精準(zhǔn)度和擬合度上均有所提升,結(jié)果證明了該方法的可行性和有效性。
1 代理模型選取
在多模型結(jié)合方法中,代理模型需要分別在低精度與高精度數(shù)據(jù)之間建立一種映射關(guān)系,映射關(guān)系的優(yōu)劣直接決定了最終數(shù)據(jù)融合方案的可行性,因此首先要解決的問(wèn)題是代理模型的選取。本文采用了基于正則化的多種線性回歸模型與決策樹擬合的多種非線性回歸模型,通過(guò)不同的代理模型對(duì)基于數(shù)據(jù)融合模式下的預(yù)測(cè)效果進(jìn)行驗(yàn)證與比較。本節(jié)將對(duì)參與試驗(yàn)中的代理模型進(jìn)行逐一解釋說(shuō)明。
1.1 基于正則化的線性回歸模型
在基于函數(shù)擬合的回歸模型中,最具有代表性的則是線性回歸模型,其通過(guò)在輸入變量和輸出變量之間構(gòu)建函數(shù)關(guān)系從而進(jìn)行預(yù)測(cè)分析。線性回歸算法具有易于實(shí)現(xiàn)、可解釋性高的特點(diǎn)[15]。但是在訓(xùn)練集較少時(shí),線性回歸方法會(huì)面臨模型過(guò)度擬合的問(wèn)題[16]。為了避免這種情況發(fā)生,對(duì)于線性回歸模型需要采取必要的正則化處理。正則化是機(jī)器學(xué)習(xí)中的一項(xiàng)優(yōu)化技術(shù),其具備增強(qiáng)模型泛化能力的特征。正則化通過(guò)在損失函數(shù)的基礎(chǔ)上加入懲罰項(xiàng)使得權(quán)重系數(shù)(回歸系數(shù))下降以降低模型復(fù)雜程度,可以在一定程度上避免過(guò)度擬合并減少模型的方差[17]。基于正則化的線性回歸方法主要有Lasso回歸法、Ridge回歸法、ElasticNet回歸法,三種方法通過(guò)采用不同的懲罰項(xiàng)表達(dá)方式進(jìn)行正則化處理[18-20]。
1.2 基于決策樹的集成回歸模型
決策樹是一種基于樹形結(jié)構(gòu)的機(jī)器學(xué)習(xí)模型,由決策節(jié)點(diǎn)、分支和葉節(jié)點(diǎn)組合而成。其中決策節(jié)點(diǎn)表示數(shù)據(jù)集的特征,分支表示決策規(guī)則,每個(gè)葉節(jié)點(diǎn)表示決策輸出結(jié)果。決策樹具有可解釋性高的優(yōu)勢(shì),其可視化的樹狀結(jié)構(gòu)易于理解和分析[22]。同時(shí),決策樹具有非參數(shù)化的特征,因此不需要考慮數(shù)據(jù)預(yù)處理階段中的數(shù)據(jù)轉(zhuǎn)換和缺失值填補(bǔ)等問(wèn)題[23]。然而,有時(shí)決策樹算法會(huì)根據(jù)訓(xùn)練集的情況產(chǎn)生深度較大的復(fù)雜結(jié)構(gòu)從而導(dǎo)致模型出現(xiàn)過(guò)度擬合的問(wèn)題[24]。針對(duì)此類問(wèn)題,基于決策樹的集成方法通過(guò)將多個(gè)決策樹進(jìn)行融合,一定程度上能夠緩解模型過(guò)度擬合的弊端[25]。Random Forest方法和AdaBoost方法作為決策樹的集成模型中具有代表性的算法,本文對(duì)兩種算法分別進(jìn)行應(yīng)用。
1.2.1 Random Forest方法
Random Forest方法通過(guò)有放回的隨機(jī)抽樣方式提取多個(gè)訓(xùn)練集從而形成多個(gè)決策樹模型,對(duì)于每個(gè)決策樹模型分別根據(jù)信息增益或基尼系數(shù)進(jìn)行有效分裂,最終將多個(gè)決策樹組合成為隨機(jī)森林,如若是分類問(wèn)題,則通過(guò)投票方式?jīng)Q定預(yù)測(cè)結(jié)果;如若是回歸問(wèn)題,則通常通過(guò)均值方式獲取預(yù)測(cè)結(jié)果。Random Forest方法結(jié)合多個(gè)決策樹的結(jié)果,不僅在精準(zhǔn)度上有所提升,也一定程度上避免了模型過(guò)度擬和的問(wèn)題[26]。與有放回的隨機(jī)抽樣方式提取訓(xùn)練集不同的是,本文采用一種無(wú)放回的子樣本抽樣方式進(jìn)行訓(xùn)練集選取,文獻(xiàn)[27]中證明了該方法的可行性。
1.2.2 AdaBoost方法
AdaBoost方法與Random Forest方法具有相同的優(yōu)勢(shì),其在精準(zhǔn)度上有所提升且可以緩解模型過(guò)度擬和的問(wèn)題。兩者的區(qū)別是,AdaBoost方法的決策樹之間相對(duì)依賴,而Random Forest方法生成的決策樹之間則相對(duì)獨(dú)立[29]。
2 重抽樣加權(quán)法
多模型結(jié)合方法需要進(jìn)一步解決的問(wèn)題在于如何通過(guò)代理模型進(jìn)行多次訓(xùn)練建模,并對(duì)于多模型的預(yù)測(cè)結(jié)果進(jìn)行有效結(jié)合。本文將采用重復(fù)抽樣法(RSM)形成多模型結(jié)構(gòu),重復(fù)抽樣法是統(tǒng)計(jì)學(xué)方法中常用于通過(guò)樣本來(lái)評(píng)估總體的方法,其原理是將樣本數(shù)據(jù)進(jìn)行多次無(wú)放回的隨機(jī)抽樣,并將抽樣到的樣本組成訓(xùn)練集、將未抽樣到的樣本組成檢驗(yàn)集,并基于不同的訓(xùn)練集分別建立模型從而形成多模型[30]。在多模型的基礎(chǔ)上,進(jìn)一步對(duì)每個(gè)模型分配對(duì)應(yīng)的權(quán)重來(lái)得到最終的預(yù)測(cè)結(jié)果。其中最直接的方法則是采用重抽樣平均法,通過(guò)將重復(fù)抽樣方法產(chǎn)生的模型賦予相同權(quán)重的方式從而結(jié)合得出最終結(jié)果。
圖1展示了基于重抽樣方法的數(shù)據(jù)融合流程,其核心原理是通過(guò)建立CFD數(shù)據(jù)與風(fēng)洞試驗(yàn)數(shù)據(jù)之間的線性和非線性的映射關(guān)系,以重抽樣加權(quán)方法進(jìn)行映射結(jié)果結(jié)合,形成一種合并多種映射關(guān)系的數(shù)據(jù)融合方法。
重抽樣加權(quán)方法的步驟可以分解為:首先,將數(shù)據(jù)集劃分為訓(xùn)練集與測(cè)試集。其次,通過(guò)重復(fù)抽樣法在訓(xùn)練集中抽取部分樣本點(diǎn)作為新的訓(xùn)練集,剩余樣本點(diǎn)作為新的驗(yàn)證集。再次,使用代理模型對(duì)于新的訓(xùn)練集進(jìn)行建模,通過(guò)驗(yàn)證集獲取預(yù)測(cè)結(jié)果的均方誤差,并記錄建模后的模型信息和獲取的均方誤差。最后,使用多次建模得到的模型信息分別對(duì)測(cè)試集進(jìn)行預(yù)測(cè),并基于均方誤差的加權(quán)方法將多模型的預(yù)測(cè)結(jié)果進(jìn)行結(jié)合。
3 試驗(yàn)流程和結(jié)果
3.1 數(shù)據(jù)集介紹
本次試驗(yàn)采用的數(shù)據(jù)集為某飛翼標(biāo)模在不同馬赫數(shù)Ma、迎角α和側(cè)滑角β下通過(guò)風(fēng)洞試驗(yàn)與CFD計(jì)算分別得出的升力系數(shù)CL與阻力系數(shù)CD。數(shù)據(jù)集中馬赫數(shù)的取值范圍為Ma ={0.6, 0.8, 1.0, 1.2, 2.0}、迎角的取值范圍為α={-2°, 0°, 2°, 4°, 6°, 8°, 10°, 12°, 14°, 16°, 18°, 20°}、側(cè)滑角的取值范圍為β={0°, 3°, 5°},本次試驗(yàn)數(shù)據(jù)集共選取了79個(gè)狀態(tài)點(diǎn)。圖2和圖3分別展示了試驗(yàn)數(shù)據(jù)集中不同迎角下的Ma=0.6、β=0的風(fēng)洞試驗(yàn)與CFD計(jì)算的升阻力系數(shù)對(duì)比圖,圖中黃色方形點(diǎn)表示CFD計(jì)算得到的升阻力系數(shù)。藍(lán)色圓形點(diǎn)表示的是風(fēng)洞試驗(yàn)得到的升阻力系數(shù),從圖2和圖3可以看出,升力系數(shù)的試驗(yàn)段一直持續(xù)上升,其試驗(yàn)數(shù)據(jù)非線性特征不明顯,在迎角12°以后的非線性較為明顯。阻力系數(shù)的試驗(yàn)段在不同迎角下呈現(xiàn)出先略微下降、之后持續(xù)上升趨勢(shì),組成了非線性試驗(yàn)段。
3.2 試驗(yàn)流程概述
首先,試驗(yàn)使用單次建模分析的方式通過(guò)代理模型分別進(jìn)行單源氣動(dòng)數(shù)據(jù)預(yù)測(cè)和多源氣動(dòng)數(shù)據(jù)預(yù)測(cè)。在單源氣動(dòng)數(shù)據(jù)預(yù)測(cè)中,代理模型將馬赫數(shù)、迎角和側(cè)滑角作為輸入,以風(fēng)洞試驗(yàn)中升力系數(shù)與阻力系數(shù)作為輸出進(jìn)行預(yù)測(cè)分析。在多源氣動(dòng)數(shù)據(jù)預(yù)測(cè)中,代理模型將在原特征變量的基礎(chǔ)上引入CFD計(jì)算出的升力或阻力系數(shù)從而建立CFD數(shù)據(jù)(低精度數(shù)據(jù))與風(fēng)洞試驗(yàn)數(shù)據(jù)(高精度數(shù)據(jù))之間的映射關(guān)系,試驗(yàn)將進(jìn)一步比較單源氣動(dòng)數(shù)據(jù)預(yù)測(cè)和多源氣動(dòng)數(shù)據(jù)預(yù)測(cè)的精準(zhǔn)度和擬合度。
其次,試驗(yàn)將采用多模型加權(quán)結(jié)合方法對(duì)于多源氣動(dòng)數(shù)據(jù)再次進(jìn)行預(yù)測(cè)分析,比較使用普通建模分析、重抽樣平均法、重抽樣加權(quán)法的預(yù)測(cè)結(jié)果的精準(zhǔn)度與擬合度。本次試驗(yàn)基于某開發(fā)環(huán)境下開展,在對(duì)于升阻力系數(shù)的預(yù)測(cè)分析中,采用不同迎角下固定馬赫數(shù)與側(cè)滑角的試驗(yàn)段作為測(cè)試集,訓(xùn)練集與測(cè)試集的比例近似為8.5∶1.5。
3.3 試驗(yàn)結(jié)果分析
試驗(yàn)首先通過(guò)代理模型對(duì)于單源氣動(dòng)數(shù)據(jù)預(yù)測(cè)和多源氣動(dòng)數(shù)據(jù)預(yù)測(cè)分別進(jìn)行建模分析與結(jié)果評(píng)估,試驗(yàn)的評(píng)估方法采用平均絕對(duì)誤差(MAE)、均方根誤差(RMSE)來(lái)判斷模型結(jié)果的精準(zhǔn)度,預(yù)測(cè)結(jié)果的誤差值越接近于0,則表明精準(zhǔn)度越高;采用確定系數(shù)(R2)來(lái)判斷模型預(yù)測(cè)值與真實(shí)值之間的擬和程度,R2值越接近1,說(shuō)明模型擬合度越高。
表1展示了各代理模型在數(shù)據(jù)融合前后的升力系數(shù)預(yù)測(cè)的評(píng)估結(jié)果對(duì)比,表中1的*符號(hào)表示代理模型在數(shù)據(jù)融合后的預(yù)測(cè)結(jié)果。從表1中的結(jié)果來(lái)看,數(shù)據(jù)融合后的代理模型對(duì)預(yù)測(cè)升力系數(shù)在精準(zhǔn)度和擬合度上都有所提升,其中,基于正則化的線性回歸方法相比于基于決策樹的集成模型在融合后預(yù)測(cè)效果提升更為明顯,但基于決策樹的集成模型在預(yù)測(cè)升力系數(shù)上的效果更佳,其中隨機(jī)森林模型在融合后的精準(zhǔn)度和擬合度達(dá)到了最優(yōu)。
表2展示了各代理模型在數(shù)據(jù)融合前后的阻力系數(shù)預(yù)測(cè)的評(píng)估結(jié)果對(duì)比。表2中的*符號(hào)表示代理模型在數(shù)據(jù)融合后的預(yù)測(cè)結(jié)果。由于阻力系數(shù)在不同迎角下呈現(xiàn)為明顯的非線性試驗(yàn)段,因此正則化的線性回歸方法并不適用于阻力系數(shù)的預(yù)測(cè)分析,這里采用基于決策樹的非線性集成模型對(duì)于阻力系數(shù)進(jìn)行預(yù)測(cè),其融合后的預(yù)測(cè)結(jié)果在精準(zhǔn)度和擬和度上都有所提升,其中隨機(jī)森林模型在融合后的精準(zhǔn)度和擬合度達(dá)到了最優(yōu)。
從表1和表2能夠綜合得出,多源氣動(dòng)數(shù)據(jù)預(yù)測(cè)相較于單源氣動(dòng)數(shù)據(jù)預(yù)測(cè)在精準(zhǔn)度和擬合度上都有所提高,從而說(shuō)明數(shù)據(jù)融合理念的有效性。其中,Random Forest方法相較于其他代理模型在氣動(dòng)數(shù)據(jù)預(yù)測(cè)中的效果最為顯著。
表3中展示了基于多源數(shù)據(jù)融合下的多模型結(jié)合法的升力預(yù)測(cè)評(píng)估結(jié)果對(duì)比,表中RSA符號(hào)表示重抽樣平均法、RSW表示重抽樣加權(quán)法。同時(shí),試驗(yàn)采取的重復(fù)抽樣的迭代次數(shù)為1000次,但AdaBoost作為一種集成方法無(wú)需過(guò)大的迭代次數(shù),因此試驗(yàn)為AdaBoost算法設(shè)置的迭代次數(shù)為500次。重抽樣平均法下的決策樹算法從本質(zhì)上與Random Forest方法中無(wú)放回的子樣本抽樣法相同,因此Random Forest在表1中的普通建模方法(RF*)和表3中的重抽樣平均法(RFRSA)的預(yù)測(cè)結(jié)果保持一致。表3中采用重抽樣加權(quán)法下的決策樹算法為Random Forest方法(RFRSW)的一種創(chuàng)新形式。
從表1和表3中對(duì)比能夠得出,基于多源數(shù)據(jù)融合下的重抽樣平均法的精準(zhǔn)度與擬合度均略高于表1中的普通建模方法,而重抽樣加權(quán)法與重抽樣平均法相比,預(yù)測(cè)效果再次得到提升,其中AdaBoost模型在應(yīng)用重抽樣加權(quán)法后的精準(zhǔn)度和擬合度達(dá)到了最優(yōu)。
表4中展示了基于多源數(shù)據(jù)融合下的多模型結(jié)合法的阻力預(yù)測(cè)評(píng)估結(jié)果對(duì)比。與表2對(duì)應(yīng),對(duì)于阻力系數(shù)的非線性段預(yù)測(cè)采用基于決策樹的非線性集成模型,基于多源數(shù)據(jù)融合下的多模型平均法在精準(zhǔn)度與擬合度上與表2的普通建模方法相比有所提升,重抽樣加權(quán)法與重抽樣平均法相比在預(yù)測(cè)效果上得到再次提升,其中隨機(jī)森林模型在應(yīng)用重抽樣加權(quán)法后的精準(zhǔn)度和擬合度達(dá)到了最優(yōu)。
從表3和表4能夠綜合得出,在多源氣動(dòng)數(shù)據(jù)預(yù)測(cè)下的多模型結(jié)合法有著良好的性能,其中相比于重抽樣平均法,重抽樣法的效果更為顯著,證明了重抽樣加權(quán)法能夠在傳統(tǒng)數(shù)據(jù)融合方法的基礎(chǔ)上再次提升預(yù)測(cè)結(jié)果的精準(zhǔn)度與擬合度。
圖4和圖5分別采用自助抽樣法下的最優(yōu)代理模型對(duì)測(cè)試集中的升阻力系數(shù)進(jìn)行預(yù)測(cè),并與風(fēng)洞試驗(yàn)、CFD計(jì)算結(jié)果進(jìn)行對(duì)比。圖中黃色曲線代表CFD計(jì)算數(shù)據(jù)、綠色曲線代表風(fēng)洞試驗(yàn)數(shù)據(jù)、藍(lán)色曲線代表機(jī)器學(xué)習(xí)預(yù)測(cè)數(shù)據(jù)。從圖5中能夠看出,通過(guò)重抽樣加權(quán)法下代理模型的預(yù)測(cè)結(jié)果與風(fēng)洞試驗(yàn)結(jié)果整體呈現(xiàn)出良好的擬合效果。由此可見,通過(guò)重抽樣加權(quán)法獲取到CFD數(shù)據(jù)與風(fēng)洞試驗(yàn)數(shù)據(jù)的多映射關(guān)系能夠?qū)τ陲L(fēng)洞試驗(yàn)結(jié)果實(shí)現(xiàn)精準(zhǔn)預(yù)測(cè)。
4 結(jié)論
針對(duì)風(fēng)洞試驗(yàn)方法和CFD方法對(duì)于氣動(dòng)力特性分析存在很多局限性問(wèn)題,本文采用基于數(shù)據(jù)融合下的多模型結(jié)合方法對(duì)于氣動(dòng)力的預(yù)測(cè)分析,得到的結(jié)論如下:
(1)通過(guò)比較在多種代理模型下單源氣動(dòng)數(shù)據(jù)預(yù)測(cè)和多源氣動(dòng)數(shù)據(jù)預(yù)測(cè),試驗(yàn)表明多源氣動(dòng)數(shù)據(jù)預(yù)測(cè)具有更高的精準(zhǔn)度與擬合度,證明了多源氣動(dòng)數(shù)據(jù)融合方法的可行性與有效性。
(2)基于多源數(shù)據(jù)融合下通過(guò)對(duì)比多模型結(jié)合法與單次建模方法的預(yù)測(cè)結(jié)果,試驗(yàn)表明多模型結(jié)合法有著更高的精準(zhǔn)度與擬合度。同時(shí),在多模型結(jié)合法中重抽樣加權(quán)法的預(yù)測(cè)效果比重抽樣平均法更為顯著,證明了基于多源數(shù)據(jù)融合下重抽樣加權(quán)法的可行性與有效性。
參考文獻(xiàn)
[1]王丹.飛行器氣動(dòng)外形優(yōu)化設(shè)計(jì)方法研究與應(yīng)用[D].西安:西北工業(yè)大學(xué), 2015. Wang Dan. Research and application of aerodynamic configura‐tion optimization design method for aircraft [D]. Xi’an: North‐west Polytechnical University, 2015.(in Chinese)
[2]劉濟(jì)民, 顏仙榮, 張朝陽(yáng), 等.高超聲速飛機(jī)氣動(dòng)外形概念設(shè)計(jì)[J].航空科學(xué)技術(shù), 2022, 33(7): 15-22. Liu Jimin, Yan Xianrong, Zhang Chaoyang, et al. Conceptual de‐sign of aerodynamic shape for hypersonic aircraft [J]. Aeronauti‐cal Science & Technology, 2022, 33(7): 15-22.(in Chinese)
[3]項(xiàng)松, 趙倫, 陳虹霖, 等.一種無(wú)人機(jī)旋翼設(shè)計(jì)方法[J].航空科學(xué)技術(shù), 2022, 33(4): 1-6. Xiang Song, Zhao Lun, Chen Honglin,et al. A design method for unmanned aerial vehicle rotor [J]. Aeronautical Science & Technology, 2022, 33(4): 1-6.(in Chinese)
[4]劉小波, 陸韻, 張?chǎng)危?等.基于風(fēng)洞試驗(yàn)和CFD計(jì)算的折疊翼氣動(dòng)特性研究[J].空天防御, 2021, 4(1):77-82 Liu Xiaobo, Lu Yun, Zhang Xin, et al. Research on aerodynamic characteristics of folding wings based on wind tunnel test and CFD calculation [J]. Aerospace Defense, 2021,4(1): 77-82.(in Chinese)
[5]DeSpirito J. CFD aerodynamic characterization of 155mm pro‐jectile at high angles-of-a42zYXvVofhyynKZAF/14+w==ttack[C].35th AIAA Applied Aerody‐namics Conference, 2017: 3397.
[6]Antoniou N, Montazeri H, Wigo H, et al. CFD and wind-tunnel analysis of outdoor ventilation in a real compact heterogeneous urban area: Evaluation using “air delay”[J]. Building and Environment, 2017, 126: 355-372.
[7]Blocken B, Stathopoulos T, Van Beeck J. Pedestrian-level wind conditions around buildings: Review of wind-tunnel and CFD techniques and their accuracy for wind comfort assessment[J]. Building and Environment, 2016, 100: 50-81.
[8]王文正, 桂業(yè)偉, 何開鋒, 等.基于數(shù)學(xué)模型的氣動(dòng)力數(shù)據(jù)融合研究[J].空氣動(dòng)力學(xué)學(xué)報(bào), 2009, 27(5): 524-528. Wang Wenzheng, Gui Yewei, He Kaifeng, et al. Research on aerodynamic data fusion based on mathematical model [J]. Journal of Aerodynamics, 2009, 27 (5): 524-528.(in Chinese)
[9]He Lei, Qian Weiqi, Zhao Tun, et al. Multi-fidelity aerodynam‐ic data fusion with a deep neural network modeling method[J]. Entropy, 2020, 22(9): 1022.
[10]鄧晨, 陳功, 王文正, 等.基于不確定度和氣動(dòng)模型的氣動(dòng)數(shù)據(jù)融合算法[J].空氣動(dòng)力學(xué)學(xué)報(bào), 2022, 40(4): 117-123. Deng Chen, Chen Gong, Wang Wenzheng, et al. Aerodynamic da‐ta fusion algorithm based on uncertainty and aerodynamic model[J]. Journal of Aerodynamics, 2022,40(4): 117-123.(in Chinese)
[11]王旭, 寧晨伽, 王文正, 等.面向飛行試驗(yàn)的多源氣動(dòng)數(shù)據(jù)智能融合方法[J].空氣動(dòng)力學(xué)學(xué)報(bào), 2023, 41(2): 12-20. Wang Xu, Ning Chenjia, Wang Wenzheng, et al. Intelligent fusion method of multi-source aerodynamic data for flight test[J]. Journal of Aerodynamics, 2023, 41(2): 12-20.(in Chinese)
[12]趙旋,張偉偉,鄧子辰.融入壓力分布信息的氣動(dòng)力建模方法[J].力學(xué)學(xué)報(bào),2022,54(9):2616-2626. Zhao Xuan, Zhang Weiwei, Deng Zichen. Aerodynamic model‐ing method incorporating pressure distribution information [J]. Chinese Journal of Theoretical and Applied Mechanics, 2022,54 (9): 2616-2626.(in Chinese)
[13]Rosenblatt M. A central limit theorem and a strong mixing condition[J]. Proceedings of the National Academy of Sciences, 1956, 42(1): 43-47.
[14]Hsu P L, Robbins H. Complete convergence and the law of large numbers[J]. Proceedings of the National Academy of Sciences, 1947, 33(2): 25-31.
[15]Weisberg S. Applied linear regression[M]. Hoboken: John Wiley & Sons, 2005.
[16]Hawkins D M. The problem of overfitting[J]. Journal of Chemi‐cal Information and Computer Sciences, 2004, 44(1): 1-12.
[17]Thrampoulidis C, Oymak S, Hassibi B. Regularized linear regression: A precise analysis of the estimation error[C]. Conference on Learning Theory. PMLR, 2015: 1683-1709.
[18]Ranstam J, Cook J A. LASSO regression[J]. Journal of British Surgery, 2018, 105(10): 1348-1348.
[19]McDonald G C. Ridge regression[J]. Wiley Interdisciplinary Reviews: Computational Statistics, 2009, 1(1): 93-100.
[20]Zou H, Hastie T. Regularization and variable selection via the elastic net[J]. Journal of the Royal Statistical Society: Series B(Statistical Methodology), 2005, 67(2): 301-320.
[21]Ogutu J O, Schulz-Streeck T, Piepho H P. Genomic selection using regularized linear regression models: ridge regression, lasso, elastic net and their extensions[C].BMC Proceedings of BioMed Central, 2012, 6(2): 1-6.
[22]Myles A J, Feudale R N, Liu Y, et al. An introduction to decision tree modeling[J]. Journal of Chemometrics: A Journal of the Chemometrics Society, 2004, 18(6): 275-285.
[23]Zhao Yongheng, Zhang Yanxia. Comparison of decision tree methods for finding active objects[J]. Advances in Space Research, 2008, 41(12): 1955-1959.
[24]Schaffer C. Overfitting avoidance as bias[J]. Machine Learning, 1993, 10(2): 153-178.
[25]Banf162b3f3ff170e2e12f66a330eff6f398ield R E, Hall L O, Bowyer K W, et al. A comparison of de‐cision tree ensemble creation techniques[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2006, 29(1): 173-180.
[26]Belgiu M, Dr?gu? L. Random forest in remote sensing: A review of applications and future directions[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2016, 114: 24-31.
[27]Strobl C, Boulesteix A L, Zeileis A, et al. Bias in random forest variable importance measures: Illustrations, sources and a solution[J]. BMC Bioinformatics, 2007, 8(1): 1-21.
[28]Schapire R E. Explaining adaboost[M].Berlin: Springer, 2013.
[29]Cao Ying, Miao Qiguang, Liu Jiachen, et al. Advance and prospects of AdaBoost algorithm[J]. Acta Automatica Sinica, 2013, 39(6): 745-758.
[30]Soivio A, Nynolm K, Westman K. A technique for repeated sampling of the blood of individual resting fish[J]. Journal of Experimental Biology, 1975, 63(1): 207-217.
Multi-Fidelity Data Fusion Method for Aircraft based on Resampling and Weighting
Cui Rongfeng, Wang Xiangyun, Liu Zhe, Li Hongyan, Guo Chengpeng
Aviation Key Laboratory of Science and Technology on Aerodynamics of High Speed and High Reynolds Number,AVIC Aerodynamics Research Institute, Shenyang 110034, China
Abstract: The wind tunnel test method and CFD simulation method can provide accurate analysis for the aerodynamic performance in the initial development stage of the aircraft, which plays an important role in the optimization of the aerodynamic shape of the aircraft. However, wind tunnel tests and CFD methods inevitably have the problem of high costs. In order to achieve low cost and efficient analysis on aircraft aerodynamic performance, this paper uses machine learning methods to analyze wind tunnel test data and aims to obtain the relationship between the CFD data with lower accuracy and the wind tunnel test data with higher accuracy through repeated sampling and combine the multiple relationship through the weighted method based on mean square error to obtain the final prediction. The results show that the data fusion mode based on repeated sampling and weighting method can effectively improve the accuracy and goodness of fit of wind tunnel test data prediction.The results demonstrate that the data fusion model based on resampling and weighting can effectively enhance the precision and reliability of wind tunnel test data prediction and assist wind tunnel test personnel to handle relevant research work.
Key Words: data fusion; repeated sampling and weighting method; wind tunnel test; CFD; machine learning