• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      粗精選策略二進(jìn)制灰狼優(yōu)化算法用于紅外光譜特征選擇

      2023-10-09 10:21:42李忠兵蔣川東梁海波段洪名
      光譜學(xué)與光譜分析 2023年10期
      關(guān)鍵詞:灰狼狼群二進(jìn)制

      李忠兵,蔣川東,梁海波,段洪名,龐 微

      1. 油氣藏地質(zhì)及開發(fā)工程國家重點實驗室(西南石油大學(xué)),四川 成都 610500 2. 西南石油大學(xué)電氣信息學(xué)院,四川 成都 610500 3. 西南石油大學(xué)機電工程學(xué)院,四川 成都 610500

      引 言

      紅外光譜作為一種無損、低成本、快捷的分析檢測技術(shù),已被廣泛用于食品檢測、生物制藥及油氣勘探光譜等領(lǐng)域[1]。紅外光譜中包含有大量冗余信息[2],在建立定量或定性分析模型之前,需要進(jìn)行一定的光譜預(yù)處理以及特征提取,提高模型的預(yù)測能力和穩(wěn)健性[3]。

      隨著化學(xué)計量學(xué)的不斷發(fā)展完善,以自然界生物的一些生活習(xí)性為參考的算法,如遺傳算法(GA)[4]、粒子群優(yōu)化算法(PSO)[5]、灰狼優(yōu)化算法(GWO)[6-7]等,已成為目前特征提取研究的熱點。此類算法的最大特點是通過生物的遺傳、信息共享、等級制度等手段來較好地保留變量間的組合優(yōu)勢,但計算量大,模型易受到適應(yīng)度函數(shù)的影響。

      群體智能優(yōu)化算法中的灰狼優(yōu)化(grey wolf optimizer,GWO)是Mirjalili受大灰狼捕食策略的啟發(fā),于2014年提出的一種元啟發(fā)式算法[8],主要模擬了自然界中灰狼搜索、包圍和攻擊獵物的習(xí)性以及群狼作戰(zhàn)的能力。相比于其他啟發(fā)式算法過多的參數(shù)設(shè)置,GWO算法只需要預(yù)設(shè)狼群數(shù)量和迭代次數(shù)兩個參數(shù),并且模型結(jié)構(gòu)簡單,收斂較快,在求解優(yōu)化問題上具有很好的局部搜索能力和求解精度,受到研究者的廣泛關(guān)注[9-12]。但是原始的GWO算法適用于連續(xù)的目標(biāo)函數(shù),對于特征提取的離散應(yīng)用不足,因此Emary等[13]于2016年提出一種二進(jìn)制灰狼優(yōu)化(bGWO)算法,使其能夠滿足二進(jìn)制空間上的特征提取要求。卞?;鄣萚14]將灰狼優(yōu)化算法用于玉米光譜的特征提取,實驗論證了模型受狼群數(shù)量和迭代次數(shù)的影響,并驗證了模型的有效性與推廣的可能;江瀟瀟[6]等提出了非線性自適應(yīng)收斂因子提高bGWO算法的全局和局部搜索能力,與二進(jìn)制粒子群算法(bPSO)做了對比,仿真驗證了模型對于目標(biāo)跟蹤節(jié)點選擇任務(wù)的精度和實時性;Sallam等[15]提出了新的變異策略改進(jìn)灰狼優(yōu)化算法,并與模擬退火算法結(jié)合,在32個數(shù)據(jù)集上驗證了所提算法分類的準(zhǔn)確率;El-Shahat等[16]提出了兩階段變異的思想改進(jìn)灰狼優(yōu)化算法的迭代過程,命名為TMGWO,在35個數(shù)據(jù)集上與其他智能算法作了比較,驗證了模型的優(yōu)越性。

      目前應(yīng)用二進(jìn)制灰狼優(yōu)化算法對紅外光譜數(shù)據(jù)進(jìn)行特征提取并實現(xiàn)定性分析的研究已有大量報道,而用于紅外光譜定量分析的研究還相對較少,尤其是針對同系有機物氣體的紅外光譜。本研究使用粗精選策略及非線性收斂因子來改進(jìn)二進(jìn)制灰狼優(yōu)化算法,以光譜定量分析模型返回的交叉驗證均方根誤差(RMSECV)平均值作為適應(yīng)度函數(shù),采用α狼設(shè)計了快速收斂策略,在所采集的烷烴氣體紅外光譜數(shù)據(jù)集上討論了狼群數(shù)量對模型的影響以及模型的快速尋優(yōu)能力,并與bGWO和bPSO算法作了比較驗證了本研究中模型的精度。

      1 實驗部分

      1.1 紅外光譜數(shù)據(jù)集

      待測實驗樣品由滿足國家標(biāo)準(zhǔn)GB/T5274.1—2018濃度為5%的正丁烷、10%的異丁烷、4%的異戊烷和100%的甲烷、乙烷、丙烷、二氧化碳的標(biāo)氣(中國大連,大連大特)作為樣氣,以氮氣作為背景氣,輸入到LFIX-7000混合配氣系統(tǒng)(中國成都,萊峰,混合誤差為標(biāo)準(zhǔn)氣體濃度的±1%,1%=10 000 ppm)進(jìn)行混合配比形成?;旌吓錃庀到y(tǒng)輸出的樣品氣體以1 000 mL·min-1的流量經(jīng)MD-070-24F-4091119-02干燥管(Perma Pure-US)除濕后進(jìn)入容積為400 mL、有效光程長為4.8 m的PMG10030光程池(中國上海,熒颯),光程池外部套有恒溫裝置,由溫度控制單元控制該恒溫裝置使光程池內(nèi)部溫度恒定在27.5 ℃。通過計算機控制紅外光譜儀Bruker ALPHA Ⅱ(德國)采集得到波數(shù)區(qū)間為2 000~6 500 cm-1,波數(shù)分辨率為1 cm-1的紅外光譜數(shù)據(jù),共359組數(shù)據(jù),紅外光譜曲線如圖1所示。其中橫軸表示波數(shù),縱軸表示紅外吸光度。

      圖1 七組分?jǐn)?shù)據(jù)集中359個混合樣品的原始紅外光譜Fig.1 The original infrared spectra of 359 mixed samples in seven-component data set

      實驗得到的紅外光譜數(shù)據(jù)集是在氮氣(N2)背景下,由甲烷(C1)、乙烷(C2)、丙烷(C3)、正丁烷(nC4)、異丁烷(iC4)、異戊烷(iC5)和二氧化碳(CO2)七組分氣體采用隨機方式按式(1)要求配比的混合氣體的實驗數(shù)據(jù)集。其中C1、C2、C3、CO2濃度范圍為0~100%,nC4、iC4、iC5濃度范圍為0~3%。

      (1)

      式(1)中,n為組分個數(shù),ci為目標(biāo)濃度,λi為標(biāo)氣濃度。

      1.2 評價指標(biāo)

      定量分析模型均采用均方根誤差(RMSEP)、決定系數(shù)(R2)和相對預(yù)測偏差(RPD)作為評價指標(biāo),計算公式分別如式(2)、式(3)和式(4)所示

      (2)

      (3)

      (4)

      2 算法原理

      2.1 灰狼優(yōu)化算法

      灰狼優(yōu)化算法借鑒了狼群的金字塔等級制度和捕食獵物的生活習(xí)性。其中第一層頭狼為α狼,被視為優(yōu)化問題的最優(yōu)解;第二和第三層為β狼和δ狼,起到承上啟下的作用,被視為次優(yōu)解;最底層的是ω狼,必須聽命于前三層狼群的引導(dǎo),完成靠近、包圍和獵食等行為,最終達(dá)到捕食獵物的目的,即找到全局最優(yōu)解。根據(jù)灰狼靠近獵物的行為建立的數(shù)學(xué)模型為式(5)和式(6)

      (5)

      (6)

      (7)

      (8)

      (9)

      然而,由于未知的環(huán)境下不可能事先知道獵物的位置信息,因此建立數(shù)學(xué)模型時認(rèn)為α狼、β狼和δ狼對獵物位置有更好的判斷,以這三頭狼的位置信息來引導(dǎo)剩余狼群的位置更新,進(jìn)而完成包圍和獵食的行為,其公式表示為

      (10)

      (11)

      (12)

      2.2 粗精選策略二進(jìn)制灰狼優(yōu)化算法

      在二進(jìn)制空間中,灰狼狀態(tài)只能選擇或不選擇特征之間相互轉(zhuǎn)化,因此需要可行的映射函數(shù)將其轉(zhuǎn)化到二進(jìn)制空間。采用式(13)和式(14)將sigmoid函數(shù)的連續(xù)搜索空間轉(zhuǎn)換為二進(jìn)制搜索空間,來確定最終是否選擇該波長位置作為特征波長,見式(13)和式(14):

      (13)

      (14)

      在原始GWO中,位置更新方程中三只領(lǐng)頭狼為每只狼生成一個新位置雖具有良好的搜索獵物能力,但由于一直基于全局進(jìn)行尋優(yōu),導(dǎo)致這種方式的GWO算法收斂緩慢,并且迭代結(jié)束不一定能夠獲取到可行的解。因此提出粗精選策略二進(jìn)制灰狼優(yōu)化(RSBGWO)算法,并采用非線性收斂因子,以便加快收斂速度并保持優(yōu)秀的全局尋優(yōu)能力。粗精選策略二進(jìn)制灰狼優(yōu)化算法流程如圖2所示。

      圖2 粗精選策略二進(jìn)制灰狼優(yōu)化算法流程圖Fig.2 Flow chart of binary grey wolf optimization algorithm for rough selection and fine selection strategy

      首先,初始化灰狼數(shù)量為N,并為每只灰狼生成一個元素為0或1的隨機向量用于確定每只狼的初始特征變量,以此來獲得狼群對于全局探索更充分的位置信息。每只狼表示一個可能的解決方案,并且其維度等于原始數(shù)據(jù)的維度。粗選階段,基于每只灰狼的初始特征變量建立相應(yīng)的MLR模型,找到最小的三個RMSECV值所在的狼作為α、β、δ狼的初始位置。根據(jù)式(12)進(jìn)行全局第一次迭代,更新所有灰狼的特征變量。根據(jù)各自新的特征變量建立MLR模型,同樣找到最小的三個RMSECV值所在的狼更新α、β、δ狼的位置。

      為了加快收斂速度,區(qū)別于原始GWO算法,使α狼未選中的特征變量不參與迭代更新過程,本文構(gòu)造了式(15)進(jìn)行狼群位置信息的更新:

      (15)

      式(15)中,S為α狼所選特征變量位置信息,由元素0、1組成,1表示該位置特征為α狼選中特征,0表示未選中。

      精選階段,只在α狼所選特征變量位置的基礎(chǔ)上,結(jié)合β和δ狼對應(yīng)α所選特征變量的位置信息,根據(jù)式(15)更新所有灰狼的特征變量,并根據(jù)各自新的特征變量建立的MLR模型,找到最小的三個RMSECV值。與更新前的三個RMSECV值進(jìn)行比較,若更小,則更新α、β、δ狼的位置。重復(fù)上述過程直到迭代結(jié)束或者滿足定量分析精度ε結(jié)束。

      粗精選策略會使迭代中α狼選擇的特征變量逐漸減少,所建立的新MLR模型返回的RMSECV值也逐漸減小,以此找到最合適的全局特征變量來建立最優(yōu)的定量分析模型。

      迭代過程中,為了提高算法的搜索速度,在有限次數(shù)迭代中找到最優(yōu)解,以非線性自適應(yīng)收斂因子來替代原算法中的線性收斂因子,如式(16)所示:

      (16)

      3 結(jié)果與討論

      首先對原始數(shù)據(jù)進(jìn)行預(yù)處理并剔除部分異常數(shù)據(jù),采用KS算法[17]先將數(shù)據(jù)集按照9∶1的比例劃分為初始訓(xùn)練集和測試集。使用K-fold交叉驗證[18]將初始訓(xùn)練集進(jìn)一步分為訓(xùn)練集和驗證集,循環(huán)建模10次并以10次定量分析模型的RMSECV平均值作為適應(yīng)度函數(shù)值進(jìn)行模型迭代,選取具有最小RMSECV值的特征波長,建立最優(yōu)定量分析模型。所有實驗只對混合氣體中的C1、C2、C3、CO2組分進(jìn)行了建模分析,均視nC4、iC4、iC5為干擾組分。

      3.1 RSBGWO模型訓(xùn)練

      當(dāng)光譜數(shù)據(jù)維度較大時,直接進(jìn)行定量建模需要很長的時間,對模型精度也有很大影響。采用RSBGWO算法降低光譜數(shù)據(jù)的維度,并合理地選擇狼群數(shù)量,可以有效提高建模速度。

      圖3為不同狼群數(shù)量對于甲烷尋優(yōu)過程及結(jié)果的影響??梢钥闯隼侨簲?shù)量對算法的尋優(yōu)能力有很大影響,對于C1,在相同的迭代次數(shù)下達(dá)到最小的RMSECV值與設(shè)置的狼群數(shù)量多或少并非正相關(guān)關(guān)系,較少的狼群數(shù)量反而可能會達(dá)到最小的RMSECV值。當(dāng)狼群中灰狼數(shù)量為20時,對應(yīng)的RMSECV值已經(jīng)低于混合配氣系統(tǒng)誤差(標(biāo)準(zhǔn)氣體濃度的±1%)。當(dāng)?shù)螖?shù)超過200,灰狼數(shù)量為20時,MLR模型獲得了最小的RMSECV值。因此,C1灰狼數(shù)量可以設(shè)置為20。通過實驗,C2、C3和CO2的灰狼數(shù)量分別設(shè)置為20、40、20。

      圖3 不同狼群數(shù)量對于甲烷尋優(yōu)過程及結(jié)果的影響Fig.3 Effects of different wolf populations on optimization process and results

      為了驗證模型的穩(wěn)定性,對各物質(zhì)在最優(yōu)狼群數(shù)量下分別做了10次重復(fù)實驗,圖4為C1的10次重復(fù)實驗迭代尋優(yōu)結(jié)果。

      圖4 最優(yōu)狼群數(shù)量進(jìn)行的10次重復(fù)實驗Fig.4 10 repeated experiments with the optimal number of wolves

      由于尋優(yōu)過程的隨機性,盡管狼群數(shù)量相同,每次實驗獲得最小RMSECV值的迭代次數(shù)不盡相同,而且有一定程度的差異,而RMSECV和RMSEP的平均值都在配氣系統(tǒng)的儀器誤差(標(biāo)準(zhǔn)氣體濃度的±1%)以內(nèi),均具有不錯的定量分析效果。說明該算法能夠穩(wěn)定有效地提取光譜特征,進(jìn)而建立定量分析模型。

      圖5為C1迭代過程中α狼所選特征變量數(shù)隨著迭代次數(shù)改變的關(guān)系。迭代開始前的特征數(shù)量即初始化隨機生成的α狼的特征數(shù)量,粗選階段α狼所選特征數(shù)量變化不大,但該階段α狼所選特征變量包含有更多光譜特征信息,減少了隨機初始化生成的α狼中的干擾信息;進(jìn)入精選階段,α狼特征數(shù)量快速減少,且RMSECV值逐漸降低,并趨于穩(wěn)定。由此說明,RSBGWO算法具有快速降低數(shù)據(jù)維度的能力,并選擇最優(yōu)波長點,用于建立高精度的定量分析模型。

      圖5 迭代過程中α狼所選特征數(shù)量的變化曲線Fig.5 The change curve of the number of features selected by the alpha wolf in the iterative process

      3.2 定量分析效果評價

      為了分析RSBGWO算法的效果,分別建立了未經(jīng)特征提取的MLR和PLS模型,三種不同特征提取方法(bGWO、bPSO、RSBGWO)下建立的MLR模型,以及結(jié)合RSBGWO算法建立的MLR和PLS定量分析模型。

      表1統(tǒng)計了10次RSBGWO-MLR重復(fù)實驗的RMSECV值及模型預(yù)測的R2、RMSEP和RPD的值??梢钥闯?10次重復(fù)實驗建立的MLR模型均具有較好的預(yù)測效果,其中C1、C2、C3和CO2的平均R2均超過了0.996,平均RMSEP分別為8 266.575 9、3 896.020 2、8 770.961 2和7 546.636 8 ppm,平均RPD分別為17.522 8、28.758 2、19.484 8、35.283 2。但由于所選特征位置和特征數(shù)量不同,預(yù)測效果又各有不同,其預(yù)測效果表現(xiàn)為CO2>C2>C3>C1。

      表1 10次重復(fù)實驗的RMSECV、RMSEP、R2和RPD的值Table 1 Values of RMSECV,RMSEP,R2 and RPD for 10 repetitions

      其中,C1、C2、C3和CO2的最優(yōu)預(yù)測效果分別為在第4、第2、第8、第4次實驗中獲得,圖6(a—d)分別為C1、C2、C3和CO2的最優(yōu)預(yù)測效果。

      圖6 各物質(zhì)測試集預(yù)測結(jié)果(a):甲烷;(b):乙烷;(c):丙烷;(d):二氧化碳Fig.6 Prediction results of each substance test set(a):Methane;(b):Ethane;(c):Propane;(d):Carbon dioxide

      研究表明,即使在nC4、iC4、iC5同系有機物組分的干擾作用下,其預(yù)測均方根誤差均值均低于配氣系統(tǒng)的固有誤差10 000 ppm(標(biāo)準(zhǔn)氣體濃度的±1%)。因此所提出的RSBGWO算法可以有效地提取紅外光譜特征,用于建立高精度定量分析模型。

      表2統(tǒng)計了不同定量分析模型的評價指標(biāo)。

      表2 不同算法下的模型評價指標(biāo)Table 2 Model evaluation indexes under different algorithms

      續(xù)表2

      (1)比較MLR與RSBGWO-MLR分析結(jié)果可知,C1、C2、C3和CO2四種組分用于RSBGWO-MLR定量分析模型的特征數(shù)量分別為30、27、23、31,相較于MLR全譜建模,特征數(shù)量均降低了160倍以上,而且定量分析精度RMSEP值分別從46 211.527 0、25 600.385 5、24 661.625 4和26 934.704 1 ppm提高到6 538.635 3、3 061.679 9、5 661.422 5和5 913.747 0 ppm,RPD值則分別從2.971 9、4.382 6、5.402 2、9.637 9增加到21.451 3、35.686 1、27.933 5、43.343 5。結(jié)合本策略的RSBGWO-MLR具有優(yōu)秀的特征提取能力,顯著地提高了定量分析模型的預(yù)測精度。

      (2)比較bGWO-MLR、bPSO-MLR與RSBGWO-MLR分析結(jié)果可知,相同實驗條件下RSBGWO算法所提取的C1、C2、C3和CO2特征數(shù)量,相較于bGWO和bPSO算法分別降低了30、29、30和25倍以上;三種模型在測試集上的RMSEP值均表現(xiàn)為RSBGWO-MLR?bGWO-MLRbPSO-MLR。本工作提出的RSBGWO算法,相對于bGWO算法、bPSO算法,具有更加優(yōu)秀的特征提取能力。

      (3)比較MLR與RSBGWO-MLR、PLS與RSBGWO-PLS的分析結(jié)果,C1、C2、C3和CO2四種組分RSBGWO-MLR與RSBGWO-PLS定量分析模型的RMSEP值分別為6 538.635 3與6 892.976 5 ppm、3 061.679 9與4 049.337 7 ppm、5 661.422 5與9 013.185 8、5 913.747 0與7 284.305 2 ppm,定量分析精度遠(yuǎn)高于全譜建模的MLR模型與PLS模型。在nC4、iC4、iC5組分的干擾作用下,采用RSBGWO算法提取的特征建立不同的定量分析模型,其預(yù)測均方根誤差均低于配氣系統(tǒng)的固有誤差10 000 ppm(標(biāo)準(zhǔn)氣體濃度的±1%)。本研究提出的RSBGWO算法可以有效地提取紅外光譜特征,有助于提高不同定量分析模型的預(yù)測效果,降低對定量分析模型的依賴性。

      4 結(jié) 論

      為了提高烷烴紅外光譜定量分析的性能,基于粗精選策略,引入了非線性迭代因子,并以平均交叉驗證均方根誤差(RMSECV)作為適應(yīng)度評價指標(biāo)改進(jìn)了二進(jìn)制灰狼優(yōu)化算法,優(yōu)化了其對原始紅外光譜數(shù)據(jù)的特征提取能力。與元啟發(fā)式算法中的bGWO和bPSO算法的對比實驗結(jié)果表明,所提出的RSBGWO算法可以提取到更少、更有效的特征變量,進(jìn)一步提高了定量分析模型的預(yù)測精度。應(yīng)用所提算法建立的MLR和PLS模型盡管精度上有一定差異,但測試集的RMSEP值均低于烷烴氣體紅外光譜采集時所使用的配氣系統(tǒng)的儀器誤差,取得了不錯的定量分析效果。

      通過模擬灰狼種群在覓食過程中的位置更新策略來剔除干擾的光譜數(shù)據(jù),從而尋找最優(yōu)特征子集的方法能夠有效應(yīng)對烷烴類物質(zhì)紅外吸收交叉敏感性強導(dǎo)致的定量分析模型性能提升難的問題。對促進(jìn)光譜檢測技術(shù)在油氣勘探、生物制藥和食品化工等領(lǐng)域中的應(yīng)用具有重要實際意義,對其他含同系物的紅外光譜分析也具有一定的參考價值。

      猜你喜歡
      灰狼狼群二進(jìn)制
      用二進(jìn)制解一道高中數(shù)學(xué)聯(lián)賽數(shù)論題
      有趣的進(jìn)度
      二進(jìn)制在競賽題中的應(yīng)用
      德國老人 用40年融入狼群
      樂活老年(2019年5期)2019-07-25 01:18:18
      谷谷雞和小灰狼
      小太陽畫報(2019年1期)2019-06-11 10:29:48
      灰狼的大大噴嚏
      狼群之爭
      灰狼和老虎
      快樂語文(2016年15期)2016-11-07 09:46:31
      《重返狼群》
      灰狼的幸福
      讀寫算(中)(2015年6期)2015-02-27 08:47:14
      揭东县| 乐平市| 岑溪市| 历史| 黔西县| 临沂市| 广平县| 浦北县| 阿克苏市| 郓城县| 德江县| 克什克腾旗| 百色市| 东乡县| 霸州市| 湖州市| 襄樊市| 中阳县| 宁陕县| 墨脱县| 鸡泽县| 连城县| 康马县| 阜阳市| 新巴尔虎右旗| 华安县| 双桥区| 安塞县| 海宁市| 乌兰浩特市| 睢宁县| 津南区| 咸阳市| 罗江县| 玛多县| 南召县| 新丰县| 尚义县| 安溪县| 长岛县| 南皮县|