一、前言
隨著大數(shù)據(jù)時代的到來,高維數(shù)據(jù)挖掘在眾多領(lǐng)域的重要性日益凸顯。BP神經(jīng)網(wǎng)絡(luò)作為模式識別的重要工具,在高維數(shù)據(jù)挖掘中扮演著關(guān)鍵角色。然而,傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)存在訓(xùn)練速度慢、易陷入局部最優(yōu)等缺陷,限制了其在高維數(shù)據(jù)挖掘中的應(yīng)用效果。為提升BP神經(jīng)網(wǎng)絡(luò)在高維數(shù)據(jù)挖掘模式識別中的精度,本文提出了一種基于遺傳算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)模型,并通過實例研究驗證了其有效性和實用性。
到得到輸出層的預(yù)測結(jié)果。根據(jù)輸出誤差,通過鏈?zhǔn)椒▌t計算每個神經(jīng)元的梯度,并更新網(wǎng)絡(luò)中的權(quán)重和偏置。這個過程重復(fù)進(jìn)行,直到模型的損失函數(shù)最小化,訓(xùn)練完成[2]。
輸出ai(1)可以通過以下公式計算:
常用的成本函數(shù)是均方誤差,其公式為:
二、BP神經(jīng)網(wǎng)絡(luò)算法
BP(BackPropagation,反向傳播)神經(jīng)網(wǎng)絡(luò)算法是一種常用的監(jiān)督學(xué)習(xí)算法,廣泛應(yīng)用于模式識別、數(shù)據(jù)挖掘等領(lǐng)域,由輸人層、隱藏層和輸出層組成,每一層由多個神經(jīng)元構(gòu)成。首先,輸入層接收外部數(shù)據(jù)并傳遞給隱藏層[。輸出層將網(wǎng)絡(luò)的最終結(jié)果反饋給系統(tǒng)。
如圖1所示,輸入數(shù)據(jù)通過神經(jīng)網(wǎng)絡(luò)層層傳遞,最終產(chǎn)生預(yù)測輸出。此過程中,計算每一層的激活值,直BP神經(jīng)網(wǎng)絡(luò)的優(yōu)點在于其能夠通過調(diào)整權(quán)重來擬合復(fù)雜的非線性關(guān)系,適應(yīng)性強,能夠處理多種類型的數(shù)據(jù)。然而,BP算法也存在一些缺點(如容易陷入局部最優(yōu)解、訓(xùn)練過程計算量大、訓(xùn)練速度較慢等問題)。盡管如此,通過優(yōu)化算法(如引入動量、改進(jìn)激活函數(shù)等),BP神經(jīng)網(wǎng)絡(luò)在很多實際問題中依然表現(xiàn)出色。
三、基于BP神經(jīng)網(wǎng)絡(luò)優(yōu)化算法的高維數(shù)據(jù)挖掘模式設(shè)計
(一)輸入層
在基于BP神經(jīng)網(wǎng)絡(luò)優(yōu)化算法的高維數(shù)據(jù)挖掘模式設(shè)計中,在高速銑削工件表面粗糙度預(yù)測模型中,輸入層的神經(jīng)元數(shù)目通常由實驗所需的特征數(shù)決定[3。例如,若需要將工件的速度、進(jìn)給量、切削深度等多個參數(shù)作為輸入特征,則輸入層的神經(jīng)元數(shù)目將與這些參數(shù)數(shù)量相等。每個輸入節(jié)點的值將代表不同的工況信息,這些信息將在后續(xù)的網(wǎng)絡(luò)層中被進(jìn)一步處理,以產(chǎn)生預(yù)測結(jié)果。激活函數(shù)可以選擇Sigmoid函數(shù)、ReLU函數(shù)等,成本函數(shù)可以選擇均方誤差(MSE)、交叉熵等。
分形維數(shù)的估計可以通過計算不同尺寸8的盒子數(shù)量N8來獲得。分形維數(shù)的估計通常使用盒子計數(shù)法,通過計算覆蓋目標(biāo)圖形所需的最小盒子數(shù)量ParseError:KaTeX parse error:Expected ∵ ,got 'EOF'at end of input:N_{來估算。具體方法是選擇不同尺寸的盒子,然后計算能夠覆蓋圖形的盒子數(shù)量。隨著盒子尺寸的減小,所需的盒子數(shù)量會增加。根據(jù)盒子數(shù)量與盒子尺寸之間的關(guān)系,可以通過最小二乘法擬合得到分形維數(shù),該方法常用于分析復(fù)雜的自然現(xiàn)象或圖形,如海岸線、云朵形態(tài)等,能夠揭示這些圖形的自相似性和復(fù)雜性。
分形維數(shù)的計算公式為:
通常,8的取值范圍可以從圖像尺寸的某個比例開始。例如, 1 % 到 10 % 的圖像尺寸。對于每個δ值,計算Nδ,并繪制Nδ對δ的平方(即Nδvs )的圖表。如果圖像的分形維數(shù)D是常數(shù),那么這個圖表應(yīng)該顯示出一條直線,其斜率將等于
(二)隱含層
如圖2所示,隱含層是BP神經(jīng)網(wǎng)絡(luò)中連接輸入層和輸出層的關(guān)鍵部分,負(fù)責(zé)對輸入數(shù)據(jù)進(jìn)行非線性映射和特征提取。在高維數(shù)據(jù)挖掘模式中,隱含層的設(shè)計對于模型的表現(xiàn)至關(guān)重要。通常,隱含層的神經(jīng)元數(shù)目是根據(jù)問題的復(fù)雜性、輸入特征的數(shù)量以及網(wǎng)絡(luò)的訓(xùn)練效果來確定的。在高速銑削工件表面粗糙度預(yù)測模型中,隱含層的神經(jīng)元數(shù)量需要根據(jù)實驗數(shù)據(jù)和預(yù)測精度來調(diào)節(jié)。較少的隱含層可能無法捕捉到數(shù)據(jù)中的復(fù)雜模式,而過多的隱含層則可能導(dǎo)致過擬合。為了優(yōu)化性能,可以采用交叉驗證等方法來選擇合適的隱含層大小。隱含層通過激活函數(shù)實現(xiàn)神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)數(shù)據(jù)中的復(fù)雜關(guān)系[4]。合理的隱含層設(shè)計有助于提高預(yù)測精度和模型的泛化能力。
(三)輸出層
輸出層是BP神經(jīng)系統(tǒng)對于隱含層信息進(jìn)行預(yù)測分析的一大結(jié)構(gòu),主要是作用于隱含層的功能結(jié)構(gòu)改變。在高維數(shù)據(jù)挖掘模式中,輸出層的設(shè)計直接影響到模型的最終表現(xiàn)。根據(jù)任務(wù)的不同,輸出層的結(jié)構(gòu)會有所差異,主要體現(xiàn)在神經(jīng)元的數(shù)量和激活函數(shù)的選擇上。對于回歸問題,如高速銑削工件表面粗糙度預(yù)測,輸出層通常包含一個神經(jīng)元,輸出為一個連續(xù)值。此時,輸出層的激活函數(shù)常選用線性函數(shù),以確保網(wǎng)絡(luò)能夠輸出任意實數(shù)值。如果是分類問題,輸出層的神經(jīng)元數(shù)量將與類別數(shù)相等,常采用Softmax或Sigmoid函數(shù)來輸出類別概率。在高維數(shù)據(jù)挖掘中,由于數(shù)據(jù)的復(fù)雜性和多樣性,輸出層的權(quán)重和偏置需要通過訓(xùn)練進(jìn)行優(yōu)化。訓(xùn)練過程中,神經(jīng)網(wǎng)絡(luò)不斷調(diào)整輸出層的參數(shù),使得預(yù)測值與實際值之間的誤差最小化。通常使用均方誤差(MSE)或交叉熵作為損失函數(shù),指導(dǎo)網(wǎng)絡(luò)優(yōu)化參數(shù)[5]
為了提高輸出層的精度和穩(wěn)定性,可以結(jié)合正則化方法防止過擬合。合理的輸出層設(shè)計不僅能提高模型的預(yù)測準(zhǔn)確性,還能增強其在不同數(shù)據(jù)集上的泛化能力。通過不斷優(yōu)化輸出層結(jié)構(gòu),可以在高維數(shù)據(jù)挖掘中取得更為優(yōu)秀的預(yù)測結(jié)果。
四、BP神經(jīng)網(wǎng)絡(luò)優(yōu)化算法的高維數(shù)據(jù)挖掘模式識別精度提升實例研究
(一)參數(shù)選取
從表1的數(shù)據(jù)可以看出,試驗中的各項參數(shù)對表面粗糙度有顯著影響。主軸轉(zhuǎn)速、進(jìn)給速度、切削深度、切削行距和刀具傾角等因素相互作用,導(dǎo)致表面粗糙度在不同試驗次數(shù)中有所波動。一般而言,較高的主軸轉(zhuǎn)速和適中的進(jìn)給速度會獲得較低的表面粗糙度,而較大的切削深度和切削行距則可能導(dǎo)致表面粗糙度增加。刀具傾角對表面質(zhì)量的影響也顯而易見,較大的傾角往往會帶來較高的粗糙度。
(二)學(xué)習(xí)率優(yōu)化效果
如圖3所示,大進(jìn)化的迭代次數(shù)設(shè)定為100次,初始種群大小為50個個體。在進(jìn)化過程中,每個個體的基因通過選擇、交叉和變異進(jìn)行更新,以適應(yīng)環(huán)境變化。變異的發(fā)生概率被設(shè)定為一定值,以保證種群多樣性,并防止早期收斂。通過反復(fù)進(jìn)化優(yōu)化,可以提升種群的整體適應(yīng)度,進(jìn)而實現(xiàn)問題求解的最優(yōu)或近似最優(yōu)解。引導(dǎo)遺傳算法在優(yōu)化過程中不斷迭代搜索最佳學(xué)習(xí)
最佳值:0.00192504平均值:0.279887 最佳值:0.0144129平均值:0.28236404 0.4 XB 中書 4 4 寸 品西B 4 值 0.2 最適應(yīng)度0.2 ×最佳適應(yīng)度 應(yīng) ×適 V平均適應(yīng)度 適m0 20 40 60 80 100 0 20 40 60 80 100進(jìn)化次數(shù) 進(jìn)化次數(shù)學(xué)習(xí)率優(yōu)化結(jié)果 學(xué)習(xí)率優(yōu)化結(jié)果0.6值0.5 040 長態(tài) 01 1學(xué)習(xí)率 學(xué)習(xí)率(a)預(yù)報誤差改變量準(zhǔn)則為10(-6) (b)預(yù)報誤差改變量準(zhǔn)則為10(-1)
率值[。通過MATLAB仿真,可以觀察到不同預(yù)報誤差的改變量與學(xué)習(xí)率優(yōu)化過程之間的關(guān)系,并能夠得到優(yōu)化后的學(xué)習(xí)率,從而提高神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)效率和預(yù)測精度。最終,優(yōu)化結(jié)果顯示了遺傳算法在解決學(xué)習(xí)率選擇問題上的優(yōu)勢。
(三)表面粗糙度預(yù)測結(jié)果和實驗結(jié)果的對比
從表2的對比結(jié)果來看,預(yù)測結(jié)果與實驗結(jié)果之間的絕對誤差和相對誤差都較小,表明預(yù)測模型的準(zhǔn)確性較高。在工況5和工況10的預(yù)測中,預(yù)測表面粗糙度與實驗結(jié)果之間的絕對誤差分別為 和
差異較小,表明模型的預(yù)測具有較高的可靠性。相對誤差分別為 0 . 0 0 4 % 和 0 . 0 0 6 % ,也顯示了預(yù)測值與實際值之間的吻合程度非常高??傮w而言,預(yù)測結(jié)果和實驗結(jié)果非常接近,表明該預(yù)測方法在表面粗糙度預(yù)測方面具有較好的應(yīng)用潛力,并且可以有效指導(dǎo)實際加工過程中的參數(shù)選擇[7]。根據(jù)實驗數(shù)據(jù)分析,預(yù)測結(jié)果與實際數(shù)據(jù)相比,絕對誤差較小,相對誤差也在合理范圍內(nèi)。
五、結(jié)語
通過遺傳算法對BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)率進(jìn)行優(yōu)化,有效提升了高維數(shù)據(jù)挖掘模式識別的精度。實驗證明,優(yōu)化后的模型在預(yù)測高速銑削工件表面粗糙度方面具有更高的準(zhǔn)確性和穩(wěn)定性。具有一定的理論價值和實際應(yīng)用潛力。未來,可進(jìn)一步探索更多優(yōu)化算法,以提升神經(jīng)網(wǎng)絡(luò)在復(fù)雜高維數(shù)據(jù)挖掘任務(wù)中的性能。
參考文獻(xiàn)
[1]王震.基于深度學(xué)習(xí)的復(fù)雜背景下農(nóng)業(yè)污染氣體識別算法研究[D].北京:中國農(nóng)業(yè)科學(xué)院,2023.
[2]許海櫻.基于顏色和膠絲拉力建立鹽杜仲質(zhì)量評價新方法及炮制增效作用研究[D].武漢:湖北中醫(yī)藥大學(xué),2023
[3]吳仕勇.基于數(shù)值計算方法的BP神經(jīng)網(wǎng)絡(luò)及遺傳算法的優(yōu)化研究[D].昆明:云南師范大學(xué),2006
[4]張輝.基于BP神經(jīng)網(wǎng)絡(luò)的遙感影像分類研究[D].濟(jì)南:山東師范大學(xué),2013.
[5]陸春元,焦洪宇,卜王輝.基于通道信息不平衡度的多元經(jīng)驗?zāi)B(tài)分解方法[J].機(jī)電工程,2024,41(02):280-288.
[6]梁磊,符杰林.基于改進(jìn)生成式對抗網(wǎng)絡(luò)的OAM-FSO通信系統(tǒng)自適應(yīng)解調(diào)[J].計算機(jī)應(yīng)用與軟件,2023,40(08):142-147.
[7]王薪宇.基于高光譜數(shù)據(jù)的土壤速氮含量反演模型比較[J]測繪與空間地理信息,2023,46(03):201-204.
作者單位:遵義醫(yī)科大學(xué)醫(yī)學(xué)與科技學(xué)院
責(zé)任編輯:王穎振楊惠娟