中圖分類號:TP393 文獻標(biāo)識碼:A 文章編號:1674-0033(2025)04-0039-08
Abstract:Inview of thedifferences in the recognitionabilitiesof BP neural networksand RBF networks in pixel-level data sample patern recognition,an improved BP neural network (adopting an adaptive learning rate and an additional momentum method) was constructed and compared with an RBF neural network. Three sets of experiments were designed: adding 5%~50% random noise,partially occluding letters,and introducing specific contour noise.The recognition performance was analyzed using confusion matrices.The results show that in the presence of random noise below 30% ,the recognition rates of both networksreach 100% .When the noise increases to 40% ,the recognition rate of the improved BP neural network drops to 84.61% ,while the RBF neural network still maintains 100% .Inthe face of partial occlusion,both networks perform well;however,under the interference of contour noise,therecognition rate of the RBF neural network (84.62%) issignificantly higher than that of the improved BP neural network (65.38% ).The results confirm that the RBF network has stronger generalization ability in complex noise scenarios and provides a better option for low- dimensional data recognition.
Key words:BP neural network; RBF neural network; pattern recognition
人工神經(jīng)網(wǎng)絡(luò)于20世紀80年代蓬勃興起, 式的差異,神經(jīng)網(wǎng)絡(luò)衍生出眾多類型。其中,BP迅速成為人工智能領(lǐng)域的研究焦點。根據(jù)連接方 (反向傳播)神經(jīng)網(wǎng)絡(luò)(Backpropagation Neural
Network)作為核心分支,憑借強大的非線性函數(shù)映射能力,在諸多領(lǐng)域展現(xiàn)出卓越的應(yīng)用價值。有關(guān)數(shù)字與字母識別的研究較多,如,CHEN等3將種群極值優(yōu)化的競爭進化算法與分數(shù)階梯度下降機制相結(jié)合,構(gòu)建出自適應(yīng)分數(shù)階BP神經(jīng)網(wǎng)絡(luò)PEO-FOBP,用于手寫體數(shù)字識別。LIU等4通過灰度化、二值化、平滑去噪等圖像預(yù)處理手段,實現(xiàn)了 85.88% 的識別準(zhǔn)確率。張鳳南運用主成分分析(PCA)處理特征向量,并對比最小距離法、K近鄰法及BP神經(jīng)網(wǎng)絡(luò)的數(shù)字識別效果。嚴雯怡借助PCA降維與特征加權(quán)融合策略,將MNIST手寫數(shù)字識別正確率提升至 96.8% 。RBF(徑向基函數(shù))神經(jīng)網(wǎng)絡(luò)(RadialBasis FunctionNeuralNetwork)是用于解決插值問題。后來,引入了自適應(yīng)學(xué)習(xí)的算法,應(yīng)用范圍擴展。RBF神經(jīng)網(wǎng)絡(luò)具有快速的訓(xùn)練速度和良好的泛化能力,在函數(shù)逼近、時間序列預(yù)測[等領(lǐng)域得到了廣泛應(yīng)用。例如,齊晴設(shè)計了混合優(yōu)化的RBF神經(jīng)網(wǎng)絡(luò)車牌字符識別模型,并與CNN模型進行對比。魏巍等[13提出基于單形進化的RBF神經(jīng)網(wǎng)絡(luò)訓(xùn)練算法。盡管上述改進算法均致力于提升識別準(zhǔn)確率,但不可避免地需要在模型復(fù)雜度、訓(xùn)練效率、計算資源消耗及泛化性能之間進行權(quán)衡。本文通過三組對比試驗,系統(tǒng)探究改進BP神經(jīng)網(wǎng)絡(luò)與RBF神經(jīng)網(wǎng)絡(luò)在識別任務(wù)中的性能差異:第一組試驗通過添加不同強度的噪聲,利用混淆矩陣分析[4網(wǎng)絡(luò)的抗噪識別能力;第二組試驗研究網(wǎng)絡(luò)對部分遮擋字母的識別效果;第三組試驗則定義特定噪聲矩陣,模擬實際圖像識別中的噪聲干擾場景,評估網(wǎng)絡(luò)的魯棒性。
1改進BP神經(jīng)網(wǎng)絡(luò)和RBF神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)
1.1改進BP神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)
1.1.1BP神經(jīng)網(wǎng)絡(luò)模型
BP神經(jīng)網(wǎng)絡(luò)是一種前向反饋神經(jīng)網(wǎng)絡(luò),輸入信息通過網(wǎng)絡(luò)從輸入層向輸出層正向傳播,而誤差則通過反向傳播算法修正各層的權(quán)值和偏差。BP神經(jīng)網(wǎng)絡(luò)的優(yōu)勢在于監(jiān)督學(xué)習(xí)能力,需依賴帶標(biāo)簽的訓(xùn)練數(shù)據(jù),通過誤差反向傳播自動調(diào)節(jié)權(quán)值。BP神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)包含輸入層、隱含層和輸出層。輸入層輸入向量的維數(shù)直接決定輸入節(jié)點的個數(shù)。隱含層層數(shù)需根據(jù)任務(wù)復(fù)雜度確定,通常為一層或兩層。隱含層功能類似大腦神經(jīng)元網(wǎng)絡(luò),其節(jié)點(神經(jīng)元)數(shù)量可通過經(jīng)驗公式(如Kolmogorov定理)或試驗調(diào)試確定,與輸入向量維數(shù)、樣本數(shù)量等因素相關(guān)。輸出層的節(jié)點數(shù)量由待分類的樣本類別數(shù)決定(如二分類任務(wù)設(shè)為2個節(jié)點,多分類任務(wù)設(shè)為類別數(shù)節(jié)點)。如圖1所示為一個含一層隱含層的BP神經(jīng)網(wǎng)絡(luò)模型。 P 為輸入樣本向量; W1 為輸入層到隱含層的權(quán)值矩陣; B1 為輸入層神經(jīng)元的偏差向量; F1 為輸入層向量經(jīng)加權(quán)求和后,作為隱含層的輸入;W2 為隱含層到輸出層的權(quán)值矩陣; B2 為輸出層神經(jīng)元的偏差向量; F2 為輸出層的計算結(jié)果(分類概率或回歸值)。
1.1.2改進BP神經(jīng)網(wǎng)絡(luò)
改進的BP神經(jīng)網(wǎng)絡(luò)采用自適應(yīng)學(xué)習(xí)速率和附加動量法。學(xué)習(xí)速率是BP神經(jīng)網(wǎng)絡(luò)的關(guān)鍵參數(shù),直接決定網(wǎng)絡(luò)權(quán)重步長變更的大小。學(xué)習(xí)速率設(shè)置過大,網(wǎng)絡(luò)陷入震蕩難以收斂。若設(shè)置過小,則導(dǎo)致網(wǎng)絡(luò)收斂過長。傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)采用固定學(xué)習(xí)速率,難以讓網(wǎng)絡(luò)保持較好的性能。自適應(yīng)學(xué)習(xí)速率能夠根據(jù)權(quán)值的變化進行動態(tài)調(diào)整速率。其準(zhǔn)則是:檢查修正的權(quán)值是否使得誤差函數(shù)減少了,若是,說明學(xué)習(xí)速率選小了,需要增加;否則,就減小學(xué)習(xí)速率的值。
式(1)描述了學(xué)習(xí)速率在 Φt 時刻的變化規(guī)則。當(dāng) t+1 時刻的誤差平方和 (SSE(t+1)) 小于 Φt 時刻 (SSE(t)) 時, t+1 時刻的學(xué)習(xí)速率 η(t+1) 將調(diào)整為 χt 時刻學(xué)習(xí)速率的1.05倍,即變?yōu)?1.05η(t) 。式(1)中的系數(shù)1.05和0.7可以根據(jù)具體情況進行調(diào)整。
附加動量法是在傳統(tǒng)的BP算法上,添加了動量變化項更新權(quán)值。動量變化項考慮了上一次權(quán)值更新的方向(正或負)和大小,這使得權(quán)重的更新不僅依賴于當(dāng)前網(wǎng)絡(luò)的梯度信息,也依賴于之前權(quán)重的更新趨勢。
其中, η 為學(xué)習(xí)速率, α 為動量系數(shù)(通常在0和1之間), Δω(t+1) 為權(quán)值的改變量, Δω(t) 為上次權(quán)
值的改變量, E 為誤差平方和。
1.2RBF神經(jīng)網(wǎng)絡(luò)模型
RBF神經(jīng)網(wǎng)絡(luò)和BP神經(jīng)網(wǎng)絡(luò)一樣,同為前饋神經(jīng)網(wǎng)絡(luò),均由輸入層、隱含層、輸出層構(gòu)成。RBF神經(jīng)網(wǎng)絡(luò)的隱含層只能為一層(BP神經(jīng)網(wǎng)絡(luò)的隱含層可為一層或多層),這是其與BP神經(jīng)網(wǎng)絡(luò)的顯著區(qū)別。RBF神經(jīng)網(wǎng)絡(luò)的隱含層的激活函數(shù)是徑向基函數(shù)(高斯函數(shù))。徑向基函數(shù)可以把低維空間中線性不可分的向量映射成高維空間線性可分的向量,這構(gòu)成了RBF神經(jīng)網(wǎng)絡(luò)的核心優(yōu)勢。RBF的輸出層一般采用線性函數(shù)。相對于BP神經(jīng)網(wǎng)絡(luò),RBF神經(jīng)網(wǎng)絡(luò)模型較為簡潔,訓(xùn)練效率更高。圖2展示了一個RBF神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu),其中 x1,x2,…,xn 為一個樣本輸入變量,h1,h2,…,hm 是隱含層的 Ωm 個神經(jīng)元。當(dāng)輸入變量進入網(wǎng)絡(luò)后,它們會通過權(quán)值加和傳遞到隱含層。隱含層中的神經(jīng)元利用高斯函數(shù)對加權(quán)后的輸入進行處理,處理結(jié)果再經(jīng)由輸出層的線性函數(shù)進行加權(quán),最終形成輸出向量 Y 。
2BP神經(jīng)網(wǎng)絡(luò)和RBF神經(jīng)網(wǎng)絡(luò)的異同
2.1隱含層不同
BP神經(jīng)網(wǎng)絡(luò)的隱含層神經(jīng)元的激活函數(shù)采用Sigmoid和Tanh函數(shù),這些激活函數(shù)能夠?qū)⑤斎胂蛄坑成涞揭粋€特定的區(qū)間范圍內(nèi)。BP神經(jīng)網(wǎng)絡(luò)可以對非線性映射關(guān)系進行全局逼近。
RBF神經(jīng)網(wǎng)絡(luò)的隱含層神經(jīng)元采用的是徑向基函數(shù)作為網(wǎng)絡(luò)的激活函數(shù),該函數(shù)的輸入是網(wǎng)絡(luò)輸入向量與隱含層神經(jīng)元中心向量之間的距離。隱含層可以把低維數(shù)空間的向量映射到高維空間的向量,這樣做的好處是向量在低維數(shù)空間不能區(qū)分,到高維數(shù)空間就可以區(qū)分了。徑向基函數(shù)的引入,使得RBF神經(jīng)網(wǎng)絡(luò)比BP神經(jīng)網(wǎng)絡(luò)在識別方面更具有優(yōu)勢。
其中, i=1,2,…,n,x 表示一個 n 維的輸入向量, ci 表示第 i 個基函數(shù)的中心的值,基函數(shù)的個數(shù)和輸入向量的維數(shù)相同。 |x-ci|2 表示向量 x 與 n 個基函數(shù)的距離。高斯函數(shù) Ri(x) 表示向量 x 在某一個基函數(shù)中心點處取得的最大值。
2.2訓(xùn)練方法及求解方法的不同
BP神經(jīng)網(wǎng)絡(luò)與RBF神經(jīng)網(wǎng)絡(luò)的區(qū)別主要在于訓(xùn)練方法、問題求解上的不同。BP神經(jīng)網(wǎng)絡(luò)中tansig或Sigmoid等曲線的所有參數(shù),在網(wǎng)絡(luò)訓(xùn)練的過程中通過誤差反向傳播確定。RBF神經(jīng)網(wǎng)絡(luò)的控制徑向基內(nèi)層參數(shù)要人為輸入,而徑向基外層的參數(shù)需要通過對網(wǎng)絡(luò)訓(xùn)練得到。BP神經(jīng)網(wǎng)絡(luò)一般采用梯度下降法或Levenberg-Marquardt(LM)法訓(xùn)練權(quán)值。RBF網(wǎng)絡(luò)的一般算法有精確求解、k-means求解和最小二乘法(OLS)求解。
2.3隱含層神經(jīng)元個數(shù)確定的方法不同
BP網(wǎng)絡(luò)隱含層的節(jié)點個數(shù)需要設(shè)定,一般根據(jù)經(jīng)驗公式推導(dǎo)得到,如經(jīng)驗公式:
隱含層節(jié)點數(shù) 樣本量/ (α× (輸入層節(jié)點數(shù) + 輸出層節(jié)點數(shù)))或
隱含層節(jié)點數(shù)=
√輸入層節(jié)點數(shù) ?° 輸出層節(jié)點數(shù) +α 。
而RBF神經(jīng)網(wǎng)絡(luò)的徑向基神經(jīng)元的個數(shù),由訓(xùn)練算法決定。如,當(dāng)RBF神經(jīng)網(wǎng)絡(luò)需要精確求解時,徑向基神經(jīng)元個數(shù)可取樣本個數(shù)。當(dāng)使用OLS算法求解時,徑向基神經(jīng)元個數(shù)可采用向RBF神經(jīng)網(wǎng)絡(luò)中逐個添加的方式,直到滿足設(shè)置的誤差要求。從這方面來看,RBF神經(jīng)網(wǎng)絡(luò)在確定隱含層神經(jīng)元個數(shù)時更為簡便,無需像BP神經(jīng)網(wǎng)絡(luò)那樣通過經(jīng)驗公式去考慮隱含層節(jié)點數(shù)。本文采用徑向基神經(jīng)元數(shù)量等于樣本數(shù)量的方式,進行精確求解。
2.4精度不同
為了提高BP神經(jīng)網(wǎng)絡(luò)的精度,通常會采用各種優(yōu)化方法,這些方法既包括對網(wǎng)絡(luò)本身的優(yōu)化,也涵蓋了對數(shù)據(jù)的優(yōu)化。RBF神經(jīng)網(wǎng)絡(luò)的顯著優(yōu)勢在于理論上可通過無限增加隱藏層神經(jīng)元數(shù)量對任意連續(xù)函數(shù)零誤差逼近,但是,為避免過擬合,模型通常不追求絕對的零誤差。
3BP神經(jīng)網(wǎng)絡(luò)和RBF神經(jīng)網(wǎng)絡(luò)識別能力的比較
本文使用的標(biāo)準(zhǔn)字母表示由0和1構(gòu)成的數(shù)字矩陣,其大小為 35×1 ,即每個標(biāo)準(zhǔn)英文字母
對應(yīng)一個35維的列向量。圖3展示了部分標(biāo)準(zhǔn)
字母矩陣的示例。
3.1BP神經(jīng)網(wǎng)絡(luò)和RBF神經(jīng)網(wǎng)絡(luò)對不同強度噪聲字母識別的情況
3.1.1標(biāo)準(zhǔn)英文字母加噪情況
本組試驗對標(biāo)準(zhǔn)英文字母樣本分別施加了強度為 5% , 10% , 20% , 30% , 40% 及 50% 的噪聲。噪聲的產(chǎn)生方法是先生成隨機噪聲矩陣,再將其分別乘以0.05,0.1,0.2,0.3,0.4,0.5等系數(shù),以精確控制噪聲的強度。圖4直觀地展示了字母‘Y’在不同噪聲強度下的受擾圖像效果。
3.1.2BP神經(jīng)網(wǎng)絡(luò)的模擬試驗
1)BP神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)
BP神經(jīng)網(wǎng)絡(luò)使用35維的標(biāo)準(zhǔn)英文字母數(shù)據(jù)進行構(gòu)建的。在訓(xùn)練階段,輸入數(shù)據(jù)為未加噪聲及分別添加 5% , 10% , 15% 噪聲的英文字母。而在測試階段,則添加了 20%,30%,40%,50% 品聲的英文字母作為待識別樣本。這意味著網(wǎng)絡(luò)使用含有較低強度噪聲的圖像進行訓(xùn)練,進而評估其在高強度噪聲條件下的識別性能。隱含層神經(jīng)元數(shù)量的確定公式為:
√ 輸入層節(jié)點數(shù) × 輸出層節(jié)點數(shù) +α= 其中,35為輸入層節(jié)點數(shù),26為輸出層節(jié)點數(shù), ∝ 為調(diào)節(jié)因子,其值通常較小。這個調(diào)節(jié)因子的引入,使得計算出的隱含層神經(jīng)元數(shù)量允許存在一定的偏差。
表1展示了不同隱含層神經(jīng)元數(shù)量下BP神經(jīng)網(wǎng)絡(luò)的相對誤差。相對誤差的計算公式為:
相對誤差 (真實值-預(yù)測值)/數(shù)據(jù)總數(shù)。
從表1可以看出,當(dāng)隱含層神經(jīng)元數(shù)量為9時,相對誤差達到了0,表明網(wǎng)絡(luò)在此配置下達到了最優(yōu)狀態(tài)。
圖5展示了BP神經(jīng)網(wǎng)絡(luò)的各項訓(xùn)練指標(biāo)。從圖 5(a) 可以看出,當(dāng)采用附加動量法和自適應(yīng)學(xué)習(xí)速率時,網(wǎng)絡(luò)的最大誤差為0.104。盡管設(shè)定的目標(biāo)誤差為0.1,實際達到的誤差也為0.1,但網(wǎng)絡(luò)的性能仍表現(xiàn)良好?;貧w系數(shù) R=0.99978 該值表明BP神經(jīng)網(wǎng)絡(luò)的預(yù)測值與真實值之間存在極強的正線性相關(guān)性。
2)BP神經(jīng)網(wǎng)絡(luò)的混淆矩陣
混淆矩陣(ConfusionMatrix),又稱誤差矩陣或可能性矩陣,是評估分類模型(BP神經(jīng)網(wǎng)絡(luò)、RBF神經(jīng)網(wǎng)絡(luò)作為分類器)性能的可視化工具?;煜仃囘m用于有監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)的網(wǎng)絡(luò),在無監(jiān)督學(xué)習(xí)網(wǎng)絡(luò)中被稱為匹配矩陣?;煜仃囃ㄟ^對比預(yù)測類和真實類的標(biāo)簽,直觀呈現(xiàn)分類結(jié)果的分布情況。其中,混淆矩陣的每一列代表預(yù)測類的類別,列的總數(shù)表示網(wǎng)絡(luò)預(yù)測為該類別的總數(shù)目;每一行代表真實類的類別,每一行的總數(shù)表示網(wǎng)絡(luò)預(yù)測為該類別的總數(shù)目。矩陣中的每個數(shù)值表示真實數(shù)據(jù)被預(yù)測為對應(yīng)類別的樣本數(shù)目。
從圖6可以看出,只有兩個字母實例被錯誤地預(yù)測為其他類別,其余字母實例均被準(zhǔn)確預(yù)測為其真實類別。例如,混淆短陣中第三行第九列的“1\"表示有1個實際屬于第三類的實例被錯誤預(yù)測為第九類;第六行第十八列的\"1\"則
為第十八類。
3.1.3RBF神經(jīng)網(wǎng)絡(luò)的模擬試驗
1)RBF神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)
RBF神經(jīng)網(wǎng)絡(luò)的建立同樣以這些標(biāo)準(zhǔn)英文字母作為輸入變量,輸出變量為26維的單位矩陣,對應(yīng)26個英文字母的類別。為進行對比試驗,訓(xùn)練數(shù)據(jù)采用了未添加噪聲、以及分別添加 5% ,10% 15% 噪聲的英文字母樣本;待識別(或測試)數(shù)據(jù)使用了添加 20% , 30% , 40% , 50% 噪聲的英文字母樣本。本文選用newrbe函數(shù)創(chuàng)建RBF神經(jīng)網(wǎng)絡(luò)。該函數(shù)創(chuàng)建網(wǎng)絡(luò)的速度非???,但缺點是,隨著輸入向量維數(shù)的增大,網(wǎng)絡(luò)處理數(shù)據(jù)的速度會顯著變慢。在本文中,網(wǎng)絡(luò)的輸入向量維數(shù)為104,屬于中等規(guī)模,因此數(shù)據(jù)量不算特別大。
表2展示了RBF神經(jīng)網(wǎng)絡(luò)的擴展系數(shù)(spread)及在不同擴展系數(shù)下的網(wǎng)絡(luò)平均絕對誤差。平均絕對誤差的計算公式為:
平均絕對誤差=∑(測試值-真實值)總個數(shù)
從表2可以看出,在所測試的各個擴展系數(shù)下,網(wǎng)絡(luò)的平均絕對誤差都為0。根據(jù)該表數(shù)據(jù),徑向基函數(shù)的擴展系數(shù)選定為spread 1=2 。
圖7展示了所構(gòu)建的RBF(徑向基函數(shù))神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)。從圖7可以清晰看到,該模型采用了RBF神經(jīng)網(wǎng)絡(luò)典型的結(jié)構(gòu):其隱含層神經(jīng)元以高斯函數(shù)(GaussianFunction)作為徑向基函數(shù),輸出層采用線性函數(shù)(LinearFunction)計算。“徑向基函數(shù)隱含層 + 線性輸出層\"的設(shè)計是RBF神經(jīng)網(wǎng)絡(luò)區(qū)別于其他網(wǎng)絡(luò)模型的顯著特征。同時,該RBF神經(jīng)網(wǎng)絡(luò)的輸入層維度設(shè)置為35維,與輸入數(shù)據(jù)(標(biāo)準(zhǔn)英文字母為35維)相匹配。其輸出層設(shè)計為26維,對應(yīng)于需要區(qū)分的26個英文字母類別。這種輸入和輸出維度的配置,使得網(wǎng)絡(luò)能夠接收字母圖像特征,并輸出每個字母類別的識別結(jié)果或概率。
2)RBF神經(jīng)網(wǎng)絡(luò)的性能
圖8展示了RBF神經(jīng)網(wǎng)絡(luò)在訓(xùn)練集和測試集的識別正確率。從圖8中可以清晰看到,該RBF神經(jīng)網(wǎng)絡(luò)處理訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)時均表現(xiàn)優(yōu)異,能完全正確識別所有樣本。這表明,無論是訓(xùn)練集還是用于評估泛化能力的測試集,該網(wǎng)絡(luò)的識別正確率都達到了 100% 。這一結(jié)果有力證明了該RBF神經(jīng)網(wǎng)絡(luò)模型針對給定任務(wù)具有極高的識別精度和良好的泛化能力。
圖9展示了RBF神經(jīng)網(wǎng)絡(luò)在訓(xùn)練集和測試集上的識別混淆矩陣。從圖9可以看出,訓(xùn)練集和測試集的混淆矩陣,所有非零值都集中在矩陣的主對角線上。這表明,該RBF神經(jīng)網(wǎng)絡(luò)能對所有輸入的樣本(包括訓(xùn)練樣本和測試樣本)進行完全正確的識別,未出現(xiàn)任何分類錯誤。
表3展示BP神經(jīng)網(wǎng)絡(luò)和RBF神經(jīng)網(wǎng)絡(luò)在隨機噪聲強度增強情況下的正確識別的情況。由表3可知,在隨機噪聲強度較低(小于或等于40% 時,兩個網(wǎng)絡(luò)均表現(xiàn)出色,能實現(xiàn)對所有樣本的完全正確識別。然而,當(dāng)噪聲強度繼續(xù)增加,達到 50% 時,兩個網(wǎng)絡(luò)的識別性能開始出現(xiàn)分化。此時,BP神經(jīng)網(wǎng)絡(luò)的識別正確率有所下降,降至 84.61% ,表明其對較強噪聲的魯棒性相對較弱。相比之下,RBF神經(jīng)網(wǎng)絡(luò)抗噪能力更強,識別正確率依然穩(wěn)定地保持在 100% ,未受噪聲增加的影響。
3.2BP神經(jīng)網(wǎng)絡(luò)和RBF神經(jīng)網(wǎng)絡(luò)對部分遮擋的英文字母的識別
在這組試驗中,通過分別遮擋標(biāo)準(zhǔn)英文字母的不同部位來測試所建立的BP神經(jīng)網(wǎng)絡(luò)和RBF神經(jīng)網(wǎng)絡(luò)的識別性能。具體而言,遮擋操作選取字母的左上、中部和右下這三個典型區(qū)域。將經(jīng)過不同部位遮擋處理的字母樣本分別輸入到這兩個網(wǎng)絡(luò)進行識別。為了更直觀地說明,圖10將以字母“A\"為例,展示其被遮擋后的幾種情況。
在將這些帶有遮擋的字母樣本輸入BP神經(jīng)網(wǎng)絡(luò)和RBF神經(jīng)網(wǎng)絡(luò)進行識別時,兩個網(wǎng)絡(luò)均表現(xiàn)出強大的魯棒性,能夠?qū)λ袦y試樣本實現(xiàn)完全正確的識別,沒有發(fā)生任何分類錯誤。表4展示了這兩個網(wǎng)絡(luò)在識別左上、中部、右下不同部位被遮擋的字母時的具體表現(xiàn)和識別結(jié)果。
從表4可以看出,BP神經(jīng)網(wǎng)絡(luò)和RBF神經(jīng)網(wǎng)絡(luò)識別正確率均達到 100% ,這一結(jié)果不僅體現(xiàn)了BP及RBF神經(jīng)網(wǎng)絡(luò)的出色的性能,更證明了它們在面對字母樣本局部遮擋時具備高度的魯棒性和強大的泛化能力。具體而言,對于左上、中部、右下不同部位遮擋處理的字母樣本,兩個網(wǎng)絡(luò)能完全、準(zhǔn)確的識別,未出現(xiàn)任何錯誤。這充分驗證了所選網(wǎng)絡(luò)模型在處理實際應(yīng)用中可能遇到的圖像不完整性問題時的有效性。
3.3BP神經(jīng)網(wǎng)絡(luò)和RBF神經(jīng)網(wǎng)絡(luò)對加固定邊廓噪聲的識別
3.3.1字母加噪
CNN網(wǎng)絡(luò)的卷積核對噪聲圖像具有多種過濾功能。不同的卷積核能夠提取圖像的不同特征,且效果各異。本文引入一個特定的邊廓噪聲矩陣,用于對標(biāo)準(zhǔn)英文字母邊廓的各個部分進行加噪處理。該邊廓噪聲矩陣定義為:
噪聲矩陣的示意如圖11所示。由圖11可見,該噪聲矩陣主要作用于字母的邊廓部分,因此,將這種噪聲稱為\"邊廓噪聲”。圖11展示了字母“Y\"加入邊廓噪聲后的變化情況。
3.3.2BP神經(jīng)網(wǎng)絡(luò)和RBF神經(jīng)對邊廓噪聲的識別
本組試驗旨在評估標(biāo)準(zhǔn)英文字母所建立的BP神經(jīng)網(wǎng)絡(luò)和RBF神經(jīng)網(wǎng)絡(luò),在識別加入邊廓噪聲的字母矩陣時的性能。其中,RBF神經(jīng)網(wǎng)絡(luò)使用newrbe函數(shù)創(chuàng)建。表5展示了兩個網(wǎng)絡(luò)對含邊廓噪聲樣本的識別結(jié)果。
由表5可見,當(dāng)字母樣本受到強度較大邊廓噪聲干擾時,BP神經(jīng)網(wǎng)絡(luò)和RBF神經(jīng)網(wǎng)絡(luò)的識別性能都受到了顯著的負面影響,未完全正確識別。盡管如此,對比兩者的具體表現(xiàn)仍存在差異??傮w而言,RBF神經(jīng)網(wǎng)絡(luò)在較強的噪聲干擾下的整體性能優(yōu)于BP神經(jīng)網(wǎng)絡(luò),識別正確率更高,顯示出更強的魯棒性。
從三組試驗的總體結(jié)果來看,BP神經(jīng)網(wǎng)絡(luò)和RBF神經(jīng)網(wǎng)絡(luò)均展現(xiàn)出較強的識別能力。在加入不同強度隨機噪聲字母的識別任務(wù)中,兩個網(wǎng)絡(luò)在面對強度為 10%,20%,30%,40%| 的噪聲時,均能實現(xiàn) 100% 的正確識別。然而,當(dāng)噪聲強度增至 50% 時,改進BP神經(jīng)網(wǎng)絡(luò)開始出現(xiàn)錯誤識別,而RBF神經(jīng)網(wǎng)絡(luò)則仍能完全正確識別所有字母。這主要得益于RBF神經(jīng)網(wǎng)絡(luò)采用的徑向基函數(shù)(高斯函數(shù)),該核函數(shù)能將低維度的輸入向量映射到高維空間,從而將原本在低維空間中線性不可分的數(shù)據(jù)轉(zhuǎn)化為高維空間中的線性可分數(shù)據(jù),增強網(wǎng)絡(luò)的分類能力。
針對改進BP神經(jīng)網(wǎng)絡(luò)和RBF神經(jīng)網(wǎng)絡(luò)對部分遮擋英文字母的識別結(jié)果分析發(fā)現(xiàn),兩個網(wǎng)絡(luò)的性能表現(xiàn)相近。究其原因,部分遮擋相對于標(biāo)準(zhǔn)字母而言,引入的變化幅度較小,對于數(shù)據(jù)擾動不大的情況,兩個網(wǎng)絡(luò)均能有效應(yīng)對并正確識別,這進一步證明了它們均具備良好的識別性能和一定的魯棒性。
在處理加入邊廓噪聲的字母樣本時,兩個網(wǎng)絡(luò)的識別正確率較低。但值得注意的是,RBF神經(jīng)網(wǎng)絡(luò)在此條件下的性能明顯優(yōu)于改進BP神經(jīng)網(wǎng)絡(luò)。這同樣與其網(wǎng)絡(luò)結(jié)構(gòu)有關(guān)—RBF神經(jīng)網(wǎng)絡(luò)通常采用高斯函數(shù)作為徑向基函數(shù)(核函數(shù)),該函數(shù)形式賦予了網(wǎng)絡(luò)良好的局部逼近能力和對特定噪聲模式的適應(yīng)性,從而在此類任務(wù)中表現(xiàn)優(yōu)異。
4結(jié)論
BP神經(jīng)網(wǎng)絡(luò)和RBF神經(jīng)網(wǎng)絡(luò)是兩種常見的神經(jīng)網(wǎng)絡(luò)類型,常因其結(jié)構(gòu)相對簡潔、識別性能良好而受到關(guān)注。本研究采用了改進BP神經(jīng)網(wǎng)絡(luò),該網(wǎng)絡(luò)相較于傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)展現(xiàn)出更優(yōu)的性能。然而,在對比改進BP神經(jīng)網(wǎng)絡(luò)和RBF神經(jīng)網(wǎng)絡(luò)處理各種噪聲字母樣本時的表現(xiàn),結(jié)果顯示RBF神經(jīng)網(wǎng)絡(luò)的整體性能更優(yōu)。這主要歸因于RBF神經(jīng)網(wǎng)絡(luò)本身的特性:其采用高斯函數(shù)作為其徑向基函數(shù)(通常是隱含層神經(jīng)元的激活函數(shù)),這種設(shè)計不僅有助于加快學(xué)習(xí)速度,而且有助于避免或減少網(wǎng)絡(luò)陷入局部極小值問題的風(fēng)險,從而提升網(wǎng)絡(luò)的泛化能力和魯棒性。
參考文獻:
[1]陶泓丞.流形上非線性相關(guān)系數(shù)的特征與仿真分析[D].南京:南京理工大學(xué),2023:7-55.
[2]陳震峰,吳明,孫衛(wèi)華.基于高階累積量和BP神經(jīng)網(wǎng)絡(luò)的數(shù)字調(diào)制識別[J].艦船電子工程,2024,44(1):60-62.
[3] CHENMR, CHEN B P, ZENG GQ, et al. An adaptivefractional-order BP neural network based on extremaloptimizationfor handwrittendigitsrecognition[J].Neurocomputing,2020,391:260-272.
[4]LIU JH,HONG J.Design of handwritten numeralrecognition system based on BP neural network[J].JournalofPhysics:Conference Series,2025,1:2021.
[5]張鳳南.智能手寫體數(shù)字識別的研究與實現(xiàn)[J].電腦編程技巧與維護,2022(8):134-136.
[6]嚴雯怡.BP神經(jīng)網(wǎng)絡(luò)中圖像識別的噪聲增益[D].南京:南京郵電大學(xué),2023:6-47.
[7]周怡紅.基于徑向基函數(shù)的非線性模型遞推參數(shù)估計[D]無錫:江南大學(xué),2023:9-103.
[8]何云薇.RBF插值鞍點問題的迭代解法[D].武漢:武漢大學(xué),2024:4-45.
[9]安蕓帙,崔明建,韓一寧,等.考慮數(shù)據(jù)隱私保護自適應(yīng)聯(lián)邦學(xué)習(xí)的分布式光伏有功可調(diào)節(jié)能力評估方法[J/OL]中國電機工程學(xué)報,1-14[2025-05-16].http://kns.cnki.net/kcms/detail/11.2107.TM.20250423.1556.002.html.
[10]鄭素佩,宋學(xué)力,封建湖.關(guān)于函數(shù)逼近法理論的一點認識[J].高等數(shù)學(xué)研究,2024,27(4):90-94,104.
[11]沈瑜,李江怪,梁棟,等.特征選擇的高效時間序列預(yù)測模型[J/OL].哈爾濱工業(yè)大學(xué)學(xué)報,1-14[2025-05-16].http://kns.cnki.net/kcms/detail/23.1235.T.20250321.1430.002.html.
[12]齊晴.基于改進RBF及CNN神經(jīng)網(wǎng)絡(luò)的車牌識別研究[D].秦皇島:燕山大學(xué),2018:9-50.
[13]魏巍,全海燕.基于單形進化的徑向基網(wǎng)絡(luò)訓(xùn)練算法[J]應(yīng)用科學(xué)學(xué)報,2019,37(4):459-468.
[14]曹敏,尹尚先,李書乾,等.基于混淆矩陣的帶壓開采底板突水危險性評價研究[JOL]煤炭科學(xué)技術(shù),1-13[2025-05-16].http://kns.cnki.net/kcms/detail/11.2402.td.20240923.1810.001.html.
[15]劉偉吉,馮嘉豪,祝效華,等基于動量自適應(yīng)學(xué)習(xí)率PSO-BP神經(jīng)網(wǎng)絡(luò)的鉆速預(yù)測模型研究[J.科學(xué)技術(shù)與工程,2023,23(24):10264-10272.
[16]張貫航.基于MNIST數(shù)據(jù)集的激活函數(shù)比較研究[J].軟件,2023,44(9):165-168.
(責(zé)任編輯:李堆淑)