摘 要:針對(duì)主動(dòng)配電網(wǎng)風(fēng)險(xiǎn)初始特征子集存在冗余故障特征變量和非強(qiáng)相關(guān)變量的問(wèn)題,提出一種基于VarianceThreshold-GARFECV的特征選擇方法。所提方法結(jié)合方差閾值和基于遺傳算法的遞歸特征消除交叉驗(yàn)證(RFECV)技術(shù),能夠有效選擇出最優(yōu)的特征集合。實(shí)驗(yàn)結(jié)果表明,所提方法可以對(duì)配電網(wǎng)故障風(fēng)險(xiǎn)初始特征集合進(jìn)行篩選和選擇,剔除關(guān)聯(lián)性弱和冗余的特征變量,從而達(dá)到降低配電網(wǎng)數(shù)據(jù)的復(fù)雜性、避免過(guò)擬合、增加模型的可解釋性的目的,具有較高的準(zhǔn)確率和穩(wěn)定性。
關(guān)鍵詞:特征選擇; 態(tài)勢(shì)感知; 風(fēng)險(xiǎn)預(yù)測(cè); VarianceThreshold
中圖分類號(hào):TM74 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):2095-8188(2024)06-0064-06
DOI:10.16628/j.cnki.2095-8188.2024.06.010
Feature Selection Method Based on VarianceThreshold-GARFECV
MA Jiachen1, GAO Song2, WANG Lei2
(1.School of Electrical Engineering,Northeast Electric Power University, Jilin 132012, China;
2.State Grid Jilin Electric Power Research Institute, Changchun 130021, China)
Abstract:In view of the existence of redundant fault characteristic variables and non-strongly correlated variables in the initial feature subset of active distribution network risk, a feature selection method based on VarianceThreshold-GARFECV is proposed. The proposed method combines the variance threshold and the recursive feature cancellation cross-validation(RFECV) technology based on genetic algorithm, which can effectively select the optimal feature set. Experimental results show that the proposed method can screen and select the initial feature set of distribution network fault risk, and eliminate the characteristic variables with weak correlation and redundancy, so as to reduce the complexity of distribution network data, avoid overfitting, and increase the interpretability of the model, with high accuracy and stability.
Key words:feature selection; situational awareness; risk prediction; VarianceThreshold
0 引 言
隨著大數(shù)據(jù)時(shí)代的來(lái)臨和人工智能技術(shù)的快速發(fā)展,包含海量數(shù)據(jù)的特征集的預(yù)處理成為許多領(lǐng)域研究的熱點(diǎn)。對(duì)特征數(shù)據(jù)進(jìn)行降維操作不僅能降低數(shù)據(jù)的維度,而且能提高算法的性能。特征選擇的主要目的是通過(guò)特征選擇算法從原始特征集中選出評(píng)估標(biāo)準(zhǔn)最佳的特征子集,以便研究人員更好地對(duì)任務(wù)進(jìn)行分類與回歸,從而提高算法的泛化能力[1]。特征選擇的優(yōu)勢(shì)在于其可以壓縮學(xué)習(xí)算法搜索的空間、減少特征集合的數(shù)量。除此之外,特征選擇不僅能提高數(shù)據(jù)分類的精確度和效率,而且可以提升學(xué)習(xí)模型的速度[2]。傳統(tǒng)的特征選取方法僅適用于常規(guī)的特征選取,而近年來(lái)基于數(shù)理特征的評(píng)價(jià)度量、搜索技術(shù)、統(tǒng)計(jì)等多個(gè)領(lǐng)域的交叉融合,使得越來(lái)越多的算法被應(yīng)用于特征選取,并已有較多的研究成果。在此基礎(chǔ)上,結(jié)合實(shí)際,引進(jìn)多種手段對(duì)傳統(tǒng)算法進(jìn)行更新。另外,特征子集必須具備進(jìn)行全局搜索的能力,因此在尋找最佳特征子集時(shí),必須引入其他的算法[1]。
國(guó)內(nèi)外學(xué)者開展大量的研究工作,提出一些關(guān)于特征選擇的方法。文獻(xiàn)[3]提出改進(jìn)灰狼優(yōu)化多階段特征選擇與特征提取算法,以提高灰狼優(yōu)化的尋優(yōu)性能。文獻(xiàn)[4]提出基于多特征選擇方法和K最近鄰算法的高壓斷路器操作機(jī)構(gòu)故障診斷方法。文獻(xiàn)[5]針對(duì)傳統(tǒng)蚱蜢優(yōu)化算法(GOA)收斂速度慢、尋優(yōu)精度低,提出融合學(xué)習(xí)自動(dòng)機(jī)和折射對(duì)立學(xué)習(xí)的混沌蚱蜢優(yōu)化算法(LRGOA)。文獻(xiàn)[6]針對(duì)烏鴉搜索算法(CSA)易陷入局部最優(yōu)解且收斂速度較慢,采用logistic混沌映射、反向?qū)W習(xí)方法和差分進(jìn)化3種算子,結(jié)合CSA提出一種特征選擇算法BICSA來(lái)選取最優(yōu)特征子集。雖然上述方法的使用可以篩選出最優(yōu)特征子集,但是結(jié)果存在一定的偏向性及局限性,導(dǎo)致特征選擇結(jié)果存在冗余或遺漏關(guān)鍵特征、計(jì)算量大、模型結(jié)構(gòu)復(fù)雜及診斷精度不高等問(wèn)題。VarianceThreshold-GARFECV方法是一種結(jié)合了方差閾值和遞歸特征消除交叉驗(yàn)證(RFECV)的特征選擇方法。該方法主要用于特征選擇,有助于提高模型的性能和減少過(guò)擬合。本文以主動(dòng)配電網(wǎng)風(fēng)險(xiǎn)預(yù)測(cè)數(shù)據(jù)為研究對(duì)象,從配電網(wǎng)提取的故障數(shù)據(jù)中提取出故障特征,剔除關(guān)聯(lián)性弱和冗余的特征變量,從而降低配電網(wǎng)數(shù)據(jù)的復(fù)雜性、避免過(guò)擬合、增加模型的可解釋性,綜合確定各故障特征重要度[7]。 1 RFECV特征選擇方法
特征選擇是從數(shù)據(jù)集中選擇最具代表性和重要性的特征子集并對(duì)其進(jìn)行評(píng)價(jià),以此構(gòu)建模型相關(guān)最優(yōu)特征子集的過(guò)程[8]。特征選擇流程如圖1所示。主要包括特征構(gòu)建與特征提取、生成特征子集、評(píng)價(jià)函數(shù)、搜索停止條件、輸出最優(yōu)特征子集5個(gè)步驟[9]。其中,評(píng)價(jià)函數(shù)用于評(píng)價(jià)生成的候選特征子集,根據(jù)評(píng)價(jià)結(jié)果選擇最優(yōu)的特征子集[10];搜索停止條件決定了迭代過(guò)程何時(shí)停止,不滿足搜索停止條件繼續(xù)進(jìn)行迭代,滿足則終止迭代,輸出最優(yōu)特征子集[11]。
RFECV是一種特征選擇算法,可以自動(dòng)選擇最佳特征子集,以提高模型的性能和泛化能力。RFECV結(jié)合了遞歸特征消除和交叉驗(yàn)證的思想,可以有效解決特征選擇中的過(guò)擬合和欠擬合問(wèn)題。首先,RFECV算法使用遞歸特征消除(RFE)算法來(lái)逐步減少特征集合的數(shù)量,直到找到最佳的特征子集。在每一輪迭代中,RFECV算法使用1個(gè)模型來(lái)評(píng)估每個(gè)特征的重要性,并刪除最不重要的特征。然后,RFECV算法使用交叉驗(yàn)證來(lái)評(píng)估每個(gè)特征子集的性能,并選擇最佳的特征子集。
目前常用的特征選擇方法主要有過(guò)濾法(Filter)、嵌入法(Embedded)和包裝法(Wrapper)3種[12]。
1.1 過(guò)濾法
過(guò)濾法根據(jù)某些指標(biāo)對(duì)每個(gè)特征進(jìn)行評(píng)估,然后根據(jù)評(píng)估結(jié)果對(duì)特征進(jìn)行排序,直接過(guò)濾掉與目標(biāo)無(wú)關(guān)或冗余的特征。過(guò)濾法是一種無(wú)須學(xué)習(xí)的方法,一般用來(lái)快速預(yù)處理數(shù)據(jù)。最常用的過(guò)濾方法包括:① 基于方差的過(guò)濾方法;② 基于互信息的過(guò)濾方法,該方法捕捉每個(gè)特征和標(biāo)簽變量之間的互信息,從而提供更多關(guān)于標(biāo)簽變量的信息;③ 基于卡方的過(guò)濾方法;④ 基于相關(guān)性的過(guò)濾方法。
1.2 嵌入法
嵌入法是一種將特征選擇過(guò)程與模型訓(xùn)練過(guò)程融為一體,在模型訓(xùn)練過(guò)程中直接將特征的重要性作為模型訓(xùn)練的一部分進(jìn)行特征選擇的方法[13]。嵌入法能夠自動(dòng)學(xué)習(xí)到不同特征之間的相互作用,并考慮特征與目標(biāo)變量之間的相關(guān)性。嵌入法框架如圖2所示。
1.3 包裝法
包裝法與嵌入法相似,都是同時(shí)進(jìn)行特征選擇和算法訓(xùn)練的方法。但不同的是,包裝法將特征子集視為搜索的節(jié)點(diǎn),使用一個(gè)具有特定目標(biāo)函數(shù)的學(xué)習(xí)算法計(jì)算每個(gè)子集的評(píng)估指標(biāo),最終選擇評(píng)估指標(biāo)最優(yōu)的特征子集。包裝法框架如圖3所示。常用的包裝法包括RFE、向前/向后搜索、特征挑選法。
綜上所述,特征選擇是主動(dòng)配電網(wǎng)風(fēng)險(xiǎn)預(yù)測(cè)中必不可少的步驟,每種方法都有其優(yōu)缺點(diǎn),選擇最合適的方法可以提高模型的準(zhǔn)確性、可解釋性和可泛化性。
2 VarianceThreshold-GARFECV算法
雖然生成的風(fēng)險(xiǎn)初始特征數(shù)據(jù)集合十分龐大,但就維度來(lái)說(shuō)所需計(jì)算量不是很大,且主動(dòng)配電網(wǎng)具有故障機(jī)理復(fù)雜、故障因果性弱的特點(diǎn),若單純使用過(guò)濾法可能無(wú)法捕捉特征之間的復(fù)雜關(guān)系;雖然嵌入法更加精確到模型的效用本身,彌補(bǔ)了過(guò)濾法的缺陷,但當(dāng)大量特征都對(duì)模型有貢獻(xiàn)且貢獻(xiàn)度不一致時(shí),尤其是對(duì)于配電網(wǎng)故障風(fēng)險(xiǎn)特征這種數(shù)據(jù),嵌入法很難界定一個(gè)有效的臨界值。因此,本文選擇包裝法作為特征選擇的主要算法,其既可以捕獲特征與標(biāo)簽變量之間的復(fù)雜關(guān)系,又可以捕獲其他2種方法可能遺漏的特征之間的相互作用關(guān)系。目前常用的包裝法算法有3種:完全搜索、啟發(fā)式搜索和隨機(jī)搜索[14]。常用的包裝法算法如表1所示。
本文初始風(fēng)險(xiǎn)特征集合含有35個(gè)維度,相應(yīng)的時(shí)間復(fù)雜度有34 359 738 373個(gè),對(duì)所有時(shí)間復(fù)雜度進(jìn)行完全搜索不僅消耗內(nèi)存,而且不利于工程應(yīng)用;由于隨機(jī)性參數(shù)的不確定性,目前并沒(méi)有優(yōu)秀且高效的方法來(lái)設(shè)置參數(shù),故隨機(jī)搜索算法也不適合;啟發(fā)式搜索算法可通過(guò)增加或剔除特征來(lái)優(yōu)化評(píng)價(jià)函數(shù),通過(guò)迭代搜索和調(diào)整特征集合,最終達(dá)到最優(yōu)解。因此本文采用方差過(guò)濾與基于遺傳算法改進(jìn)交叉驗(yàn)證遞歸特征消除結(jié)合的特征選擇算法VarianceThreshold-GARFECV選出配電網(wǎng)故障風(fēng)險(xiǎn)最優(yōu)特征子集。VarianceThreshold-GARFECV算法流程圖如圖4所示。具體步驟如下。
(1) VarianceThreshold過(guò)濾。將初始數(shù)據(jù)特征集合進(jìn)行方差過(guò)濾,消除方差閾值較小的特征,達(dá)到提升后續(xù)RFECV算法效率的目的。
(2) 初始化種群。將過(guò)濾后的訓(xùn)練集進(jìn)行初始化,隨機(jī)生成1組個(gè)體并將其作為初始種群,每個(gè)個(gè)體表示1個(gè)特征集合,其中每個(gè)特征的取值為0或1(1表示該特征被選中,0表示該特征未被選中)。
(3) 基于適應(yīng)度值選擇。采用交叉驗(yàn)證的方式計(jì)算每個(gè)個(gè)體的適應(yīng)度值。將數(shù)據(jù)集劃分為k個(gè)折疊,在k-1個(gè)折疊上訓(xùn)練模型,并在剩余的折疊上進(jìn)行測(cè)試,這個(gè)過(guò)程重復(fù)k次,然后計(jì)算平均準(zhǔn)確度。再采用輪盤賭選擇的方法從種群中挑選一定數(shù)目的個(gè)體,并根據(jù)其準(zhǔn)確度值從種群中選出分值最高的個(gè)體作為父體,反復(fù)循環(huán),直至完成所有個(gè)體選擇。
(4) 遺傳操作。隨機(jī)選擇2個(gè)父體,在一個(gè)隨機(jī)位置上將2個(gè)個(gè)體的特征序列交叉,從而生成2個(gè)新的個(gè)體,并隨機(jī)翻轉(zhuǎn)個(gè)體中某些特征值,產(chǎn)生新一代種群,重復(fù)步驟(3),種群中的個(gè)體會(huì)趨于所選特征數(shù)中的最優(yōu)解,達(dá)到最小適應(yīng)度閾值后,停止迭代,在遺傳操作的每一代中,選取適應(yīng)度最高的個(gè)體組成候選故障風(fēng)險(xiǎn)特征子集。
(5) RFECV特征選擇。在候選故障風(fēng)險(xiǎn)特征子集上訓(xùn)練模型,選擇支持向量機(jī)(SVM)作為RFECV的監(jiān)督學(xué)習(xí)估計(jì)器。以SVM的分類準(zhǔn)確率作為評(píng)價(jià)指標(biāo),采用交叉驗(yàn)證的方式,對(duì)部分特征進(jìn)行RFE計(jì)算,并在所有CV上保留評(píng)價(jià)指標(biāo)得分的平均值。通過(guò)特征平均值排序確定并刪除不重要的特征,在新的特征集合上再次訓(xùn)練模型,不斷重復(fù),直到模型達(dá)到最優(yōu)值。
上述步驟中,評(píng)價(jià)函數(shù)用于評(píng)估每個(gè)特征的重要性,通過(guò)評(píng)價(jià)權(quán)值剔除配電網(wǎng)故障特征之間的冗余性高、非強(qiáng)相關(guān)變量[15]。同時(shí),配電網(wǎng)故障特征變量是離散型和連續(xù)型數(shù)據(jù)的混合,需要一個(gè)評(píng)價(jià)函數(shù)來(lái)量化他們之間的相關(guān)性。本文選用準(zhǔn)確率作為特征子集評(píng)價(jià)算法,通過(guò)計(jì)算特征子集的評(píng)價(jià)值選取配電網(wǎng)故障特征最優(yōu)子集。
在二分類問(wèn)題中,準(zhǔn)確率[16]可表示為
式中:Accuracy1——準(zhǔn)確率;
TP——將正確標(biāo)簽預(yù)測(cè)為真的數(shù)目;
TN——將錯(cuò)誤標(biāo)簽預(yù)測(cè)為假的數(shù)目;
FN——將正確標(biāo)簽預(yù)測(cè)為假的數(shù)目;
FP——將錯(cuò)誤標(biāo)簽預(yù)測(cè)為真的數(shù)目。
在多分類問(wèn)題中,準(zhǔn)確率可以表示為
式中:n——類別數(shù)量;
Cij——將真實(shí)類別為i的樣本預(yù)測(cè)為類別j的樣本數(shù)量。
在多標(biāo)簽分類問(wèn)題中,準(zhǔn)確率可表示為
式中:m——標(biāo)簽數(shù)量;
yi——第i個(gè)樣本的真實(shí)標(biāo)簽;
?i——第i個(gè)樣本的預(yù)測(cè)標(biāo)簽;
I——指標(biāo)函數(shù)(當(dāng)yi=?i時(shí)為1,否則為0)。
通過(guò)式(3)可計(jì)算出候選故障特征子集的評(píng)價(jià)值,當(dāng)滿足評(píng)價(jià)值排名要求時(shí)停止計(jì)算,剔除排名靠后的特征,生成配電網(wǎng)最優(yōu)故障風(fēng)險(xiǎn)特征子集。
3 結(jié)果與分析
本文采用某城市2005年1月至2020年6月的信息管理系統(tǒng)數(shù)據(jù)進(jìn)行預(yù)測(cè)分析,共收集故障數(shù)據(jù)5 910條。經(jīng)過(guò)數(shù)據(jù)預(yù)處理、簡(jiǎn)化數(shù)據(jù)集、剔除與配電網(wǎng)故障風(fēng)險(xiǎn)預(yù)測(cè)無(wú)關(guān)數(shù)據(jù),最終獲得了966條且每條具有35個(gè)故障特征的樣本數(shù)據(jù)。故障特征樣本分布(部分)如圖5所示。
首先,對(duì)初始數(shù)據(jù)所提取的35個(gè)故障特征初始集合進(jìn)行VarianceThreshold-GARFECV算法初步特征選擇,將方差閾值較小即對(duì)預(yù)測(cè)結(jié)果幾乎沒(méi)有影響的特征刪除。初步特征選擇結(jié)果如表2所示。
從運(yùn)行結(jié)果來(lái)看,初步特征選擇刪除了設(shè)備自身影響因素中的絕緣導(dǎo)線平均投運(yùn)時(shí)間數(shù)據(jù)、分?jǐn)嚯娎|平均投運(yùn)時(shí)間數(shù)據(jù)、電纜線長(zhǎng)度數(shù)據(jù)、變壓器平均投運(yùn)時(shí)間數(shù)據(jù)、負(fù)荷開關(guān)平均投運(yùn)時(shí)間數(shù)據(jù),運(yùn)行影響因素中的配變?nèi)萘?,設(shè)備故障數(shù)據(jù)中的饋線名稱、饋線類型、停電范圍等,這些刪除的特征本身對(duì)于主動(dòng)配電網(wǎng)故障風(fēng)險(xiǎn)無(wú)關(guān)緊要,符合日常經(jīng)驗(yàn)判斷,具有較強(qiáng)的實(shí)用性。同時(shí),初步特征選擇降低了特征集的復(fù)雜度,模型明顯會(huì)隨著特征的減少變得輕量,大大縮短了后續(xù)算法遍歷特征的時(shí)間[17]。
其次,對(duì)過(guò)濾后的特征集進(jìn)行GARFECV特征選擇。此步驟中,要確定RFECV中的重要參數(shù)min_features_to_select,對(duì)于這個(gè)超參數(shù),很難保證一次設(shè)置合理,如果設(shè)置偏高,易造成特征冗余;設(shè)置偏低,可能會(huì)剔除相對(duì)重要的特征。故采用獲取各特征交叉驗(yàn)證得分情況依次選擇最小特征數(shù)量。超參數(shù)選擇曲線如圖6所示。
由圖6可知,當(dāng)選擇故障風(fēng)險(xiǎn)特征個(gè)數(shù)為6時(shí),交叉驗(yàn)證得分已達(dá)到0.996 212 12,但對(duì)于主動(dòng)配電網(wǎng)風(fēng)險(xiǎn)預(yù)測(cè)來(lái)說(shuō),選擇min_features_to_select=6仍會(huì)漏掉重要特征,使風(fēng)險(xiǎn)預(yù)測(cè)結(jié)果沒(méi)有信服力。由圖6可見(jiàn),當(dāng)選擇故障風(fēng)險(xiǎn)特征超過(guò)20個(gè)時(shí),交叉驗(yàn)證得分降至0.878 787 88,說(shuō)明特征含有大量冗余,降低了分類準(zhǔn)確度;同時(shí)在數(shù)據(jù)分析中通常選擇具有大轉(zhuǎn)折點(diǎn)時(shí)的特征數(shù)量,故本文選擇交叉驗(yàn)證得分為0.992 424 24的20個(gè)特征作為最小特征選擇數(shù),保證生成的故障特征最優(yōu)子集具有合理性。
然后,進(jìn)行遺傳迭代操作。每次迭代生成1個(gè)新的故障特征種群,當(dāng)交叉驗(yàn)證得分在90%以上停止迭代,并從種群中挑選適應(yīng)度最高的個(gè)體作為候選故障特征變量。通過(guò)RFECV進(jìn)行特征選擇,在候選故障特征變量中挑選SVM準(zhǔn)確率排名較高的變量,輸出為故障特征最優(yōu)子集。故障特征變量選擇后排名如圖7所示。
根據(jù)算法模型原理,特征排名是選擇故障特征最優(yōu)子集的關(guān)鍵參數(shù),特征排名數(shù)值越高說(shuō)明特征冗余度高,越早被剔除;特征排名數(shù)值越低,則證明該故障特征變量與故障發(fā)生強(qiáng)相關(guān)且冗余性低,可以作為配電網(wǎng)故障特征最優(yōu)子集的特征變量[18]。由圖7可知,被剔除篩選的冗余性高、關(guān)聯(lián)性弱的特征有地區(qū)特征數(shù)據(jù)、星期數(shù)據(jù)、平均氣溫?cái)?shù)據(jù)、分支線路平均投運(yùn)時(shí)間數(shù)據(jù)、分支線路數(shù)量數(shù)據(jù)、架空線長(zhǎng)度數(shù)據(jù)及變壓器數(shù)量數(shù)據(jù)7個(gè)特征變量。配電網(wǎng)故障特征選擇結(jié)果如表3所示。
從特征選擇的結(jié)果來(lái)看,最優(yōu)特征子集的評(píng)價(jià)值較高,說(shuō)明最優(yōu)特征子集和配電網(wǎng)風(fēng)險(xiǎn)預(yù)測(cè)數(shù)據(jù)高度相關(guān)。同時(shí),外部故障影響因素和運(yùn)行影響因素得以保留,因?yàn)檫@2個(gè)故障類別代表了智能配電網(wǎng)故障的時(shí)間特征、天氣特征、地域特征、運(yùn)行特征等,各特征與配電網(wǎng)故障強(qiáng)相關(guān)且相對(duì)獨(dú)立,只是剔除了和其他特征變量重復(fù)的地區(qū)特征數(shù)據(jù)、星期數(shù)據(jù)、平均氣溫?cái)?shù)據(jù)、配變?nèi)萘?個(gè)冗余數(shù)據(jù)。設(shè)備自身因素有大量冗余無(wú)關(guān)的特征變量,經(jīng)特征選擇后其被有效剔除,同時(shí)滿足了風(fēng)險(xiǎn)等級(jí)所需的設(shè)備故障數(shù)據(jù)要求,說(shuō)明了本文提出的VarianceThreshold-GARFECV算法的有效性和合理性。配電網(wǎng)故障風(fēng)險(xiǎn)最優(yōu)特征子集如表4所示。
4 結(jié) 語(yǔ)
本文采用基于VarianceThreshold-GARFECV的特征選擇方法對(duì)主動(dòng)配電網(wǎng)故障風(fēng)險(xiǎn)數(shù)據(jù)進(jìn)行最優(yōu)選擇,通過(guò)本文算法的啟發(fā)式搜索選出冗余無(wú)用性低、故障特征與風(fēng)險(xiǎn)標(biāo)簽相關(guān)性高的故障風(fēng)險(xiǎn)最優(yōu)特征子集。對(duì)某地級(jí)市的實(shí)例分析說(shuō)明,本文提出的主動(dòng)配電網(wǎng)態(tài)勢(shì)理解方法合理有效,本文篩選出的最優(yōu)特征子集為主動(dòng)配電網(wǎng)風(fēng)險(xiǎn)預(yù)測(cè)模型奠定了扎實(shí)的數(shù)據(jù)基礎(chǔ)。
【參 考 文 獻(xiàn)】
[1]施啟軍,潘峰,龍福海,等.特征選擇方法研究綜述[J].微電子學(xué)與計(jì)算機(jī),2022,39(3):1-8.
[2]朱紅萍,鞏青歌,雷戰(zhàn)波.基于遺傳算法的入侵檢測(cè)特征選擇[J].計(jì)算機(jī)應(yīng)用研究,2012,29(4):1417-1419,1426.
[3]劉泓鑠,王詩(shī)瑤,周靈鴿,等.基于改進(jìn)灰狼優(yōu)化的文本聚類多階段特征選擇算法[J].計(jì)算機(jī)應(yīng)用與軟件,2023,40(3):316-324.
[4]李邦彥,齊偉強(qiáng),楊兆靜,等.基于多特征選擇方法的高壓斷路器故障診斷[J].高壓電器,2020,56(6):218-224.
[5]李雯婷,韓迪,葉符明.基于改進(jìn)蚱蜢優(yōu)化算法的特征選擇機(jī)制[J].計(jì)算機(jī)工程與設(shè)計(jì),2022,43(11):3168-3176.
[6]廉杰,姚鑫,李占山.用于特征選擇的烏鴉搜索算法的研究與改進(jìn)[J].軟件學(xué)報(bào),2022,33(11):3903-3916.
[7]肖一兵.基于數(shù)據(jù)挖掘技術(shù)的配電網(wǎng)故障預(yù)測(cè)研究[J].設(shè)備管理與維修,2018(17):35-36.
[8]姚旭,王曉丹,張玉璽,等.特征選擇方法綜述[J].控制與決策,2012,27(2):161-166,192.
[9]李思寧. 基于行為序列的威脅評(píng)估技術(shù)研究與實(shí)現(xiàn)[D].成都:電子科技大學(xué),2020.
[10]安洋.基于傳感器的行為識(shí)別關(guān)鍵問(wèn)題研究[D].西安:西安理工大學(xué),2017.
[11]吳俊.基于啟發(fā)式優(yōu)化的特征選擇方法研究及應(yīng)用[D].杭州:浙江理工大學(xué),2020.
[12]李郅琴,杜建強(qiáng),聶斌,等.特征選擇方法綜述[J].計(jì)算機(jī)工程與應(yīng)用,2019,55(24):10-19.
[13]汪佳宇.基于混合樣本的服務(wù)機(jī)器人云端故障診斷方法研究[D].濟(jì)南:山東大學(xué),2020.
[14]周傳華,柳智才,丁敬安,等.基于filter+wrapper模式的特征選擇算法[J].計(jì)算機(jī)應(yīng)用研究,2019,36(7):1975-1979,2010.
[15]彭和平,莫文雄,王勇,等.基于配電大數(shù)據(jù)的配電網(wǎng)故障停電影響因素靈敏度分析[J].電力信息與通信技術(shù),2021,19(8):61-68.
[16]姚登舉,楊靜,詹曉娟.基于隨機(jī)森林的特征選擇算法[J].吉林大學(xué)學(xué)報(bào)(工學(xué)版),2014,44(1):137-141.
[17]張培林,李勝.基于小波包變換和GA-PLS算法的故障特征選擇方法[J].振動(dòng).測(cè)試與診斷,2014,34(2):385-391,403.
[18]王云會(huì),鄭強(qiáng)仁,郭淼,等.分布式電源接入配電網(wǎng)的控制策略及消納能力評(píng)估研究[J].電器與能效管理技術(shù),2022(4):83-87.
收稿日期:20240304