摘" 要:金融欺詐嚴(yán)重威脅金融市場(chǎng)穩(wěn)定,而現(xiàn)有的反欺詐手段存在單一性和低效率的問(wèn)題。為此,文章基于集成學(xué)習(xí)方法構(gòu)建了金融交易欺詐識(shí)別模型,旨在提升欺詐識(shí)別效果。研究中采用裝袋法(Bagging)和提升法(Boosting)構(gòu)建了4個(gè)基礎(chǔ)模型,并通過(guò)優(yōu)化參數(shù)篩選出2個(gè)效果較好的模型。隨后,利用堆疊法(Stacking)對(duì)這2個(gè)模型進(jìn)行融合訓(xùn)練,進(jìn)一步提高了模型的識(shí)別率。實(shí)驗(yàn)結(jié)果表明,融合模型在金融交易欺詐識(shí)別中具有顯著優(yōu)勢(shì)。與基礎(chǔ)模型相比,其在不同數(shù)據(jù)集上的準(zhǔn)確率更高,尤其在處理復(fù)雜欺詐模式和新型手段時(shí),展現(xiàn)出更高的準(zhǔn)確性和穩(wěn)定性。這種改進(jìn)的模型方法為金融決策者和相關(guān)部門(mén)提供了有效的決策支持,有助于提升金融市場(chǎng)的安全性。
關(guān)鍵詞:集成學(xué)習(xí);金融欺詐;Boosting;Stacking
中圖分類號(hào):TP181;F830" 文獻(xiàn)標(biāo)識(shí)碼:A" 文章編號(hào):2096-4706(2025)04-0173-06
Research on Financial Transaction Fraud Identification Based on Ensemble Learning
ZHENG Deming1, LI Sijia2, PAN Yankai2, ZHENG Jianlong1
(1.Graduate School, China People's Police University, Langfang" 065000, China;
2.Smart Policing College, China People's Police University, Langfang" 065000, China)
Abstract: Financial fraud seriously threatens the stability of financial markets, and the existing anti-fraud methods have the problems of singleness and inefficiency. Therefore, this paper constructs a financial transaction fraud recognition model based on the Ensemble Learning method, aiming to improve the fraud recognition effect. In the research, four basic models are constructed by Bagging and Boosting, and two models with better effects are selected by optimizing parameters. Subsequently, the Stacking method is used to conduct fusion training for the two models, which further improves the recognition rate of the model. The experimental results show that the fusion model has significant advantages in financial transaction fraud identification. Compared with the basic model, it has higher accuracy with different datasets, especially in dealing with complex fraud patterns and new means, showing higher accuracy and stability. This improved model method provides effective decision support for financial decision makers and relevant departments, and helps to improve the security of financial markets.
Keywords: Ensemble Learning; financial fraud; Boosting; Stacking
0" 引" 言
隨著金融科技的迅猛發(fā)展,金融交易活動(dòng)日益便捷和多樣化,但這也為金融詐騙行為提供了更為廣闊的舞臺(tái),使得金融交易欺詐檢測(cè)成為金融業(yè)和金融監(jiān)管機(jī)構(gòu)面臨的重大挑戰(zhàn)。頻繁發(fā)生的新型金融欺詐事件,嚴(yán)重破壞了金融市場(chǎng)的秩序,阻礙了社會(huì)經(jīng)濟(jì)的健康發(fā)展[1]。2022年3月的政府工作報(bào)告中明確指出,加強(qiáng)風(fēng)險(xiǎn)預(yù)警、防控機(jī)制和能力建設(shè)的必要性[2]。盡管傳統(tǒng)的金融欺詐檢測(cè)方法已經(jīng)取得了一定的成效,但隨著詐騙手段的不斷升級(jí),產(chǎn)生了包括對(duì)新型欺詐模式識(shí)別不足、誤報(bào)率高和適應(yīng)性差等的許多問(wèn)題。集成學(xué)習(xí)通過(guò)結(jié)合多個(gè)學(xué)習(xí)器來(lái)提高識(shí)別精度,在金融詐騙檢測(cè)中表現(xiàn)出顯著優(yōu)越。與單一模型比,其能處理噪聲和不平衡問(wèn)題,增強(qiáng)泛化能力,并保持較高的穩(wěn)健性。因此,本文基于集成學(xué)習(xí)方法,研究金融交易欺詐識(shí)別,優(yōu)化模型選擇,為金融欺詐檢測(cè)注入新活力,輔助投資者決策,提供金融行業(yè)未來(lái)發(fā)展理論依據(jù)。
近年來(lái),集成學(xué)習(xí)被廣泛應(yīng)用于各個(gè)領(lǐng)域。許多學(xué)者利用集成學(xué)習(xí)方法來(lái)有針對(duì)性地提升所需模型性能。陳靜[3]提出一種基于Stacking相異模型融合的異常行為檢測(cè)方法。歐陽(yáng)瀟琴改進(jìn)AdaBoost算法,提高分類速度和降低計(jì)算成本[4]。王軍利用蟻群優(yōu)化算法選擇性集成構(gòu)建數(shù)據(jù)流分類模型[5]。徐曉楊改進(jìn)極限學(xué)習(xí)機(jī)(ELM)優(yōu)化輸出權(quán)值矩陣計(jì)算[6]。王進(jìn)提出DNA微陣列數(shù)據(jù)分類的多分類器選擇性集成方法[7]。張燕平基于Q統(tǒng)計(jì)提出決策樹(shù)選擇性集成學(xué)習(xí)方法[8]。Zhang構(gòu)建基于干擾因素的SVM集成學(xué)習(xí)模型[9]。Feng提出集成學(xué)習(xí)和專家知識(shí)的特征選擇方法[10]。Ijeh設(shè)計(jì)基于決策樹(shù)的網(wǎng)絡(luò)攻擊檢測(cè)方法[11]。Wang[12]改進(jìn)啟發(fā)式-棧式集成學(xué)習(xí)提高華法林劑量預(yù)測(cè)準(zhǔn)確性。Moon提出新型異常檢測(cè)集成學(xué)習(xí)方法[13]。Huang基于集成學(xué)習(xí)的特征選擇方法融合不同特征選擇技術(shù)[14]。Nadia提出多模態(tài)優(yōu)化(MMO)技術(shù)結(jié)合螢火蟲(chóng)算法和互信息評(píng)估[15]。Parthasarathy提出基于CART和BIRCH的推薦系統(tǒng)模型提高精確度和F1值[16]。這些研究為集成學(xué)習(xí)在金融欺詐檢測(cè)中的應(yīng)用奠定了基礎(chǔ)。
集成學(xué)習(xí)的改進(jìn)與發(fā)展使將其運(yùn)用在交易欺詐檢測(cè)成為可能。因此,本文通過(guò)構(gòu)建集成學(xué)習(xí)模型,探究最優(yōu)模型用于金融交易欺詐識(shí)別。為可能引起公共關(guān)注的金融欺詐事件提出參考意見(jiàn),為經(jīng)濟(jì)危機(jī)管理和社會(huì)平穩(wěn)提供科學(xué)依據(jù)。
1" 數(shù)據(jù)來(lái)源與處理
本文采用Kaggle平臺(tái)上的金融欺詐數(shù)據(jù)集,該數(shù)據(jù)集由PaySim模擬器生成,模擬真實(shí)交易的同時(shí)保護(hù)隱私。數(shù)據(jù)集基于非洲國(guó)家真實(shí)交易記錄,由跨國(guó)金融交易服務(wù)公司提供,包含常規(guī)金融活動(dòng)和欺詐交易案例。本文僅選取了其中一個(gè)交易日的數(shù)據(jù)進(jìn)行分析,共涉及574 255筆交易記錄,數(shù)據(jù)由10個(gè)不同類型的列組成,部分?jǐn)?shù)據(jù)如表1所示。
2" 數(shù)據(jù)集劃分和采樣
將數(shù)據(jù)集劃分為訓(xùn)練集和測(cè)試集,并將測(cè)試集占比設(shè)置為20%,這種劃分方式能確保模型在訓(xùn)練時(shí)有足夠的數(shù)據(jù)進(jìn)行學(xué)習(xí),也能在測(cè)試時(shí)也能獲得足夠多的獨(dú)立樣本來(lái)評(píng)估模型的泛化能力。通過(guò)設(shè)置stratify參數(shù)為標(biāo)簽列,保證了訓(xùn)練集和測(cè)試集中正常金融交易與金融詐騙交易的比例與原始數(shù)據(jù)集一致。此外,模型還設(shè)置隨機(jī)種子,確保了數(shù)據(jù)劃分的一致性和實(shí)驗(yàn)的可重復(fù)性。
3" 隨機(jī)森林模型構(gòu)建與實(shí)驗(yàn)分析
隨機(jī)森林模型是裝袋法中的一種經(jīng)典模型,通過(guò)組合多個(gè)決策樹(shù)的預(yù)測(cè)結(jié)果,增強(qiáng)模型的整體泛化性能和預(yù)測(cè)準(zhǔn)確性。在本文中,隨機(jī)森林模型是基于sklearn.ensemble中的RandomForestClassifier構(gòu)建的。
在模型構(gòu)建過(guò)程中,本文設(shè)定基學(xué)習(xí)器(決策樹(shù))的個(gè)數(shù)設(shè)定為20,以保證模型有足夠的多樣性。同時(shí),通過(guò)設(shè)置了隨機(jī)種子為5,保證實(shí)驗(yàn)的可重復(fù)性。針對(duì)數(shù)據(jù)集中存在的類別不平衡的問(wèn)題,采用了class_weight='balanced'策略,讓模型在訓(xùn)練時(shí)對(duì)不同類別的樣本給予不同的權(quán)重,從而提高少數(shù)類樣本的識(shí)別率。經(jīng)過(guò)訓(xùn)練后,利用訓(xùn)練好的隨機(jī)森林模型對(duì)測(cè)試集進(jìn)行預(yù)測(cè),并計(jì)算了混淆矩陣來(lái)評(píng)估模型的性能?;煜仃囍庇^地展示了模型在各類別上的分類效果,包括真正例(TP)、假正例(FP)、真反例(TN)和假反例(FN)的數(shù)量。
為了更直觀地展示混淆矩陣,繪制了混淆矩陣熱力圖,如圖1所示。
根據(jù)混淆矩陣的結(jié)果,可以看到模型在負(fù)類(標(biāo)簽為0)上的表現(xiàn)非常出色,幾乎達(dá)到了完美的分類效果,真反例(TN)高達(dá)114 796,假反例(FN)僅有28。然而,在正類(標(biāo)簽為1)上,模型的表現(xiàn)稍顯不足,雖然真正例(TP)有26,但假正例(FP)也有1個(gè),導(dǎo)致了較低的召回率(Recall)。
表2展示隨機(jī)森林模型評(píng)價(jià)指標(biāo)。模型分類精度達(dá)1.00,但正類精確率雖然較高,召回率只有(0.48),漏報(bào)率較高。F1值較低,反映出模型在正類綜合性能不佳。盡管隨機(jī)森林模型在負(fù)類樣本的分類上表現(xiàn)出色,但在正類樣本上的性能表現(xiàn)還不是很好。
4" CART決策樹(shù)模型構(gòu)建與實(shí)驗(yàn)分析
為進(jìn)一步實(shí)現(xiàn)目標(biāo),本文還采用了CART決策樹(shù)模型對(duì)數(shù)據(jù)進(jìn)行分類。本文利用sklearn.tree中的DecisionTreeClassifier類創(chuàng)建了CART決策樹(shù)分類器。在模型創(chuàng)建過(guò)程中,選擇基尼不純度作為劃分標(biāo)準(zhǔn),并設(shè)置類別權(quán)重平衡,以應(yīng)對(duì)數(shù)據(jù)集類別不平衡問(wèn)題。確保模型訓(xùn)練關(guān)注各樣本,避免偏向多數(shù)類,提升少數(shù)類識(shí)別率。
在模型構(gòu)建完成后,使用訓(xùn)練數(shù)據(jù)對(duì)模型進(jìn)行了擬合。通過(guò)遞歸地將訓(xùn)練數(shù)據(jù)劃分為不同的子集,并在每個(gè)子集上做出預(yù)測(cè),模型逐漸學(xué)會(huì)了如何根據(jù)輸入特征進(jìn)行分類。然后,使用訓(xùn)練好的模型對(duì)測(cè)試數(shù)據(jù)進(jìn)行了預(yù)測(cè)。并做出混淆矩陣熱力圖和模型評(píng)價(jià)指標(biāo)圖,如圖2和如表3所示。
從混淆矩陣的結(jié)果來(lái)看,模型在負(fù)類(標(biāo)簽為0)上的表現(xiàn)非常出色,真反例(TN)高達(dá)114 777,假反例(FN)僅有20個(gè),這表明模型對(duì)負(fù)類樣本的識(shí)別能力很強(qiáng)。然而,在正類(標(biāo)簽為1)上,模型的表現(xiàn)略顯不足,雖然真正例(TP)有34個(gè),但假正例(FP)也有20個(gè),導(dǎo)致正類的精確率(Precision)和召回率(Recall)均僅為0.63。
表3為CART決策樹(shù)模型的評(píng)價(jià)指標(biāo)表。分類指標(biāo)顯出,模型的整體精度(Accuracy)很高,達(dá)到了1.00,但這主要得益于負(fù)類樣本的準(zhǔn)確分類。對(duì)于正類樣本,盡管模型雖然能夠識(shí)別出部分真正例,但同時(shí)也存在較多的誤分類情況,導(dǎo)致精確率和召回率均較低。
5" XGBoost模型構(gòu)建與實(shí)驗(yàn)分析
5.1" XGBoost模型構(gòu)建
XGBoost是一種基于決策樹(shù)的集成機(jī)器學(xué)習(xí)算法,它利用梯度提升框架對(duì)交易數(shù)據(jù)進(jìn)行學(xué)習(xí)和預(yù)測(cè)。在本文研究中,我們首先建立了一個(gè)XGBoost分類器,其中包含100個(gè)基學(xué)習(xí)器,即模型將融合100棵決策樹(shù)進(jìn)行訓(xùn)練。將學(xué)習(xí)率設(shè)定為0.3,該參數(shù)決定了各個(gè)樹(shù)對(duì)最終結(jié)果的影響程度??紤]到金融欺詐數(shù)據(jù)的不平衡性,本文采用了binary:logistic作為目標(biāo)函數(shù),并通過(guò)scale_pos_weight參數(shù)給予少數(shù)類(欺詐類)更高的權(quán)重,以此來(lái)彌補(bǔ)正樣本相對(duì)于負(fù)樣本數(shù)量的不足。
在模型訓(xùn)練過(guò)程中,本文使用訓(xùn)練集x_train和y_train來(lái)訓(xùn)練XGBoost分類器。通過(guò)模型擬合訓(xùn)練數(shù)據(jù),XGBoost能夠?qū)W習(xí)到數(shù)據(jù)的復(fù)雜結(jié)構(gòu)和交易之間的關(guān)系。隨后,模型在測(cè)試集x_test上進(jìn)行預(yù)測(cè),生成預(yù)測(cè)結(jié)果y_pred_xgbt。
模型訓(xùn)練完成后,本文利用測(cè)試集對(duì)模型進(jìn)行了評(píng)估,并輸出了混淆矩陣。同時(shí)繪制了XGBoost模型混淆矩陣熱力圖和模型評(píng)價(jià)指標(biāo)圖,如圖3所示。
從混淆矩陣的結(jié)果來(lái)看,模型對(duì)于類別0即非欺詐交易,表現(xiàn)出極高的識(shí)別能力,精確率、召回率和F1分?jǐn)?shù)均達(dá)到1.00。對(duì)于類別1即欺詐交易,盡管數(shù)據(jù)集中的正例較少,模型仍然實(shí)現(xiàn)了0.68的精確率和0.78的召回率,F(xiàn)1分?jǐn)?shù)為0.72。這表明模型在保持低誤報(bào)率的同時(shí),能夠較好地識(shí)別出欺詐交易。通過(guò)上述分析發(fā)現(xiàn),基于XGBoost的集成學(xué)習(xí)模型的識(shí)別效果最佳。
5.2" XGBoost模型的優(yōu)化
在XGBoost模型的調(diào)參過(guò)程中,本文借助采用網(wǎng)格搜索(GridSearchCV)來(lái)尋找最優(yōu)參數(shù)組合。首先,定義了參數(shù)網(wǎng)格param_grid,其中包含了n_estimators(樹(shù)的數(shù)量)和scale_pos_weight(正樣本權(quán)重)的候選值。本文重點(diǎn)關(guān)注這兩個(gè)候選值,通過(guò)手動(dòng)輸入?yún)?shù)范圍,網(wǎng)格搜索會(huì)自動(dòng)遍歷所有可能的參數(shù)組合,并基于F1分?jǐn)?shù)評(píng)估每個(gè)組合的性能,最終輸出最佳參數(shù)和對(duì)應(yīng)的分?jǐn)?shù)。通過(guò)多組參數(shù)實(shí)驗(yàn),將其性能優(yōu)化。最終確定在選擇參數(shù)n_estimators=5,和scale_pos_weight=25時(shí),模型表現(xiàn)良好,對(duì)金融詐騙交易(少數(shù)類)的召回率達(dá)到了85.2%,各項(xiàng)指標(biāo)展示如圖4所示。
為了進(jìn)一步提升模型性能,將基學(xué)習(xí)器的數(shù)量增加到1 000,增加迭代空間以緩慢學(xué)習(xí)數(shù)據(jù)中的復(fù)雜模式。然而,基學(xué)習(xí)器數(shù)量的增加往往會(huì)伴隨著過(guò)擬合風(fēng)險(xiǎn),因此我們將學(xué)習(xí)率降低至0.01,以增強(qiáng)模型的泛化能力并確保學(xué)習(xí)過(guò)程的穩(wěn)定性。同時(shí),設(shè)置樹(shù)的最大深度為6,以平衡模型復(fù)雜性和性能。較小深度限制學(xué)習(xí)能力,避免過(guò)擬合。此外,將子樣本和特征列比例設(shè)為0.8,每次迭代隨機(jī)選擇80%樣本和特征訓(xùn)練樹(shù),從而增加模型多樣性并提高其穩(wěn)定性和準(zhǔn)確性。
XGBoost模型升級(jí),還調(diào)高了scale_pos_weight以應(yīng)對(duì)數(shù)據(jù)不平衡問(wèn)題,進(jìn)一步聚焦金融欺詐識(shí)別。同時(shí),引入早停機(jī)制,連續(xù)10輪無(wú)改善即停止訓(xùn)練,以減少計(jì)算成本并防過(guò)擬合。
改進(jìn)后的XGBoost模型在精確率上有了顯著提升從0.47增加到0.60。召回率保持在0.85,表示模型依舊能夠識(shí)別絕大多數(shù)正樣本。這兩個(gè)方面的提升也使得F1分?jǐn)?shù)增加到了0.70,表明改進(jìn)后的模型在保持較高召回率的同時(shí),提高了識(shí)別正樣本的準(zhǔn)確性,更加有效地平衡了分類的精確度和召回率,如圖5所示。
6" 融合模型構(gòu)建與實(shí)驗(yàn)分析
本文采用Stacking集成學(xué)習(xí)技術(shù),將不同基模型的決策能力結(jié)合起來(lái),形成一個(gè)更加強(qiáng)大的預(yù)測(cè)器。本文的融合模型使用了兩種基學(xué)習(xí)器:XGBoost和CART決策樹(shù),以及一個(gè)作為元學(xué)習(xí)器的邏輯回歸模型。
具體操作為配置XGBoost的參數(shù),包括200個(gè)樹(shù)模型的數(shù)量,0.3的學(xué)習(xí)速率,以及針對(duì)二分類目標(biāo)的binary:logistic為目標(biāo)函數(shù)。同時(shí),為了對(duì)抗數(shù)據(jù)集中可能存在的類別不平衡,本文設(shè)定了scale_pos_weight參數(shù)。
另一方面,CART決策樹(shù)以其簡(jiǎn)單直觀和對(duì)數(shù)據(jù)中非線性關(guān)系的捕捉能力而被選中。決策樹(shù)的gini準(zhǔn)則用于測(cè)量分割的純度,而class_weight參數(shù)設(shè)置為balanced,以自動(dòng)調(diào)整權(quán)重,這對(duì)抗數(shù)據(jù)集中的類別不平衡同樣至關(guān)重要。
本文最終選擇邏輯回歸為元學(xué)習(xí)器。這些模型被集成在一個(gè)StackingClassifier中,其中estimators參數(shù)包含了所選的基學(xué)習(xí)器,它們的預(yù)測(cè)結(jié)果將作為新特征提供給邏輯回歸模型進(jìn)行最終的預(yù)測(cè)。StackingClassifier的stack_method參數(shù)設(shè)為auto,允許模型自動(dòng)選擇每個(gè)基模型的堆疊方法,而n_jobs參數(shù)設(shè)置為-1,以利用所有可用的CPU核心進(jìn)行模型訓(xùn)練,以加速訓(xùn)練過(guò)程。
對(duì)于類別0即非欺詐交易,精確率、召回率和F1分?jǐn)?shù)均為1.00。這一結(jié)果凸顯了模型在識(shí)別正常金融交易的強(qiáng)大能力。對(duì)于類別1即欺詐交易,模型精確率達(dá)到0.85,召回率達(dá)到0.81,而F1分?jǐn)?shù)達(dá)到了0.83。這表明Stacking模型能夠有效地識(shí)別出絕大多數(shù)欺詐交易,并且保持較低的誤報(bào)率。圖6為Stacking融合模型混淆矩陣,表4為融合模型評(píng)價(jià)指標(biāo)表。
7" 實(shí)驗(yàn)結(jié)果對(duì)比分析
在金融交易欺詐識(shí)別領(lǐng)域,召回率和F1值常被用來(lái)評(píng)價(jià)模型性能。召回率衡量模型識(shí)別欺詐案例比例,與金融機(jī)構(gòu)防欺詐能力密切相關(guān);F1值綜合精確率和召回率,能夠更全面地評(píng)估不平衡數(shù)據(jù)集模型表現(xiàn)。本文比較五種集成學(xué)習(xí)模型在這兩方面的性能,如圖7所示。
基于上述分析綜合考慮召回率和F1值,在單個(gè)基礎(chǔ)集成學(xué)習(xí)模型中,XGBoost模型表現(xiàn)出最優(yōu)的識(shí)別效果。而Stacking融合模型在上述金融交易欺詐識(shí)別的集成學(xué)習(xí)研究中呈現(xiàn)出最佳的性能。它能保持較高的召回率,也有著較好的精確率與F1值,表明了其在識(shí)別金融欺詐交易的同時(shí),減少了誤判的可能性。綜上所述,Stacking融合模型在研究中顯示出了最佳性能,并且是最有應(yīng)用前景的模型。
8" 結(jié)" 論
本文基于集成學(xué)習(xí)的方法,構(gòu)建了多個(gè)金融交易欺詐識(shí)別模型,包括隨機(jī)森林、CART、XGBoost以及XGBoost提升后模型和Stacking融合模型。通過(guò)對(duì)這些模型進(jìn)行實(shí)驗(yàn)分析,比較了它們的性能差異,并找出了適合金融交易欺詐識(shí)別的模型。
本文的研究和實(shí)驗(yàn)分析嘗試將集成學(xué)習(xí)方法應(yīng)用在警務(wù)實(shí),借助先進(jìn)的金融交易欺詐識(shí)別技術(shù),以對(duì)于提升警務(wù)實(shí)戰(zhàn)能力。金融交易欺詐識(shí)別技術(shù)在集成學(xué)習(xí)方面的發(fā)展將為警務(wù)實(shí)戰(zhàn)提供有力支持,也應(yīng)加強(qiáng)與金融機(jī)構(gòu)、科技公司等的合作,共同建立金融交易欺詐信息共享平臺(tái),實(shí)現(xiàn)數(shù)據(jù)的互通有無(wú)。這將有利于警務(wù)部門(mén)更全面地掌握金融交易欺詐的情況,制定更有針對(duì)性的打擊策略。從而助力我們構(gòu)建一個(gè)更加安全、穩(wěn)定的金融和社會(huì)環(huán)境。
參考文獻(xiàn):
[1] XU J,CHEN D Y,CHAU M. Identifying Features for Detecting Fraudulent Loan Requests on P2P Platforms [C]//2016 IEEE Conference on Intelligence and Security Informatics (ISI).Tucson:IEEE,2016:79-84.
[2] 夏平凡.面向數(shù)字金融欺詐的智能風(fēng)險(xiǎn)預(yù)測(cè)方法研究 [D].合肥:合肥工業(yè)大學(xué),2022.
[3] 陳靜,王銘海,江灝,等.Stacking相異模型融合的實(shí)驗(yàn)室異常用電行為檢測(cè) [J].實(shí)驗(yàn)室研究與探索,2024,43(1):231-237.
[4] 歐陽(yáng)瀟琴,王秋華.基于改進(jìn)權(quán)值更新和選擇性集成的AdaBoost算法 [J].軟件導(dǎo)刊,2020,19(4):257-262.
[5] 王軍,劉三民,劉濤.基于蟻群優(yōu)化的選擇性集成數(shù)據(jù)流分類方法 [J].長(zhǎng)江大學(xué)學(xué)報(bào):自科版,2017,14(5):37-43+85-86.
[6] 徐曉楊,紀(jì)志成.選擇性集成極限學(xué)習(xí)機(jī)分類器建模研究 [J].計(jì)算機(jī)應(yīng)用與軟件,2016,33(9):279-283.
[7] 王進(jìn),冉仟元,丁凌,等.Bagging選擇性集成演化硬件DNA微陣列數(shù)據(jù)分類方法 [J].高技術(shù)通訊,2013,23(12):1236-1241.
[8] 張燕平,曹振田,趙姝,等.一種新的決策樹(shù)選擇性集成學(xué)習(xí)方法 [J].計(jì)算機(jī)工程與應(yīng)用,2010,46(17):41-44.
[9] ZHANG D,JIAO L C,BAI X,et al. A Robust Semi-Supervised SVM Via Ensemble Learning [J].Applied Soft Computing,2018,65:632-643.
[10] FENG X,ZHAO Y L,ZHANG M,et al. Ensemble Learning-Based Stability Improvement Method for Feature Selection Towards Performance Prediction [J].Journal of Manufacturing Systems,2024,74:55-67.
[11] IJEH V,MORSI W G. Smart Grid Cyberattack Types Classification: A Fine Tree Bagging-based Ensemble Learning Approach with Feature Selection [J/OL].Sustainable Energy,Grids and Networks,2024,38:101291[2024-08-20].https://www.sciencedirect.com/science/article/abs/pii/S2352467724000201?via%3Dihub.
[12] WANG M Y,QIAN Y Y,YANG Y D,et al. Improved Stacking Ensemble Learning Based on Feature Selection to Accurately Predict Warfarin Dose [J/OL].Frontiers in Cardiovascular Medicine,2024,10:1320938(2021-01-19).https://doi.org/10.3389/fcvm.2023.1320938.
[13] MOON J H,YU J H,SOHN K A. An Ensemble Approach to Anomaly Detection Using High- and Low-variance Principal Components [J/OL].Computers and Electrical Engineering,2022,99:107773[2024-08-26].https://www.sciencedirect.com/science/article/abs/pii/S0045790622000714?via%3Dihub.
[14] HUANG D,LIU Z G,WU D. Research on Ensemble Learning-Based Feature Selection Method for Time-Series Prediction [J/OL].Applied Sciences,2023,14(1):40(2023-12-20).https://doi.org/10.3390/app14010040.
[15] NADIA N,MORTEZA R,MAHDI E. A New Evolutionary Ensemble Learning of Multimodal Feature Selection from Microarray Data [J].Neural Processing Letters,2023,55(5):6753-6780.
[16] PARTHASARATHY G,DEVI S S. Ensemble Learning Based Collaborative Filtering with Instance Selection and Enhanced Clustering [J].Computers, Materials amp; Continua,2022,71(2):2419-2434.
作者簡(jiǎn)介:鄭德銘(1998—),男,漢族,福建莆田人,碩士研究生,研究方向:數(shù)據(jù)警務(wù)技術(shù);李思佳(1987—),女,漢族,江西南昌人,講師,碩士生導(dǎo)師,博士,研究方向:網(wǎng)絡(luò)輿情、大數(shù)據(jù)分析;潘彥愷(2002—),男,漢族,湖南常德人,本科在讀,研究方向:數(shù)據(jù)警務(wù)技術(shù);鄭健龍(2001—),男,漢族,浙江義烏人,碩士研究生在讀,研究方向:數(shù)據(jù)警務(wù)技術(shù)。
收稿日期:2024-10-02
基金項(xiàng)目:河北省社會(huì)科學(xué)基金項(xiàng)目(HB22SH011)