夏磊 李水艷
摘 要:徑向基函數(shù)能夠有效的對散亂數(shù)據(jù)進行差值和逼近,因此在信號和圖形處理等領(lǐng)域應用廣泛,例如信號重構(gòu)。針對從含有噪音的散亂數(shù)據(jù)中逼近原始數(shù)據(jù),提出了一種基于最小二乘的變分模型,該模型由包含L2范數(shù)的擬合項和光滑項構(gòu)成,光滑項通過三角網(wǎng)格上的拉普拉斯平滑方法來實現(xiàn)對函數(shù)梯度的約束,并應用最小二乘法求解該模型。最后通過數(shù)值實驗對噪音數(shù)據(jù)進行逼近和誤差分析來驗證此方法的有效性。
關(guān)鍵詞:散亂數(shù)據(jù);逼近;徑向基函數(shù);最小二乘
中圖分類號:TN911.7????? 文獻標識碼:A
Approximation of Noisy Scattered Data Based on Least Square RBF
XIA Lei,LI Shui-yan
(College of science, Hohai University, Nanjing ,Jiangsu 211100,China)
Abstract:
Radial Basis Function (RBF) is widely used in signal and graph processing because it can effectively perform difference and approximation to scattered data, such as signal reconstruction. Aiming at approximating the original data from scattered data with noise, a variational model based on radial basis function is proposed. The model is composed of fitting terms and smooth terms containingL2-norm, and the least square method is applied to solve the model. Finally, numerical experiments are carried out to approximate the noise data and the error between the approximate data and the original data is given to verify the effectiveness of this method.
Key words:scattered data;approximation; RBF; least square
研究如何從觀測得到的含有噪音的散亂數(shù)據(jù)逼近原始信號是信號處理的重要任務之一。信號逼近技術(shù)已廣泛應用于地形建模、曲面重建和偏微分方程數(shù)值求解、機器學習、人臉識別和計算機仿真等領(lǐng)域[1-3]。由于采樣、傳輸、存儲或軟件處理等原因,通常觀測得到的數(shù)據(jù)含有高斯、泊松、各種未知類型的噪音,如何從這些帶有噪音的數(shù)據(jù)中逼近原始信號是一個應用廣泛,且具有挑戰(zhàn)的問題[4-6]。
在過去的幾十年里 ,徑向基函數(shù)已經(jīng)非常成功地用于從分散的數(shù)據(jù)重建函數(shù)[7-9],這一成功主要基于以下事實:
(1)徑向基函數(shù)可用于任何空間維度。
(2)它們適用于任意分散的數(shù)據(jù),沒有任何規(guī)律性。
(3)它們允許任意平滑的內(nèi)插,內(nèi)插具有簡單的結(jié)構(gòu)。
但是當散亂數(shù)據(jù)含有噪音時,噪音對重建函數(shù)f有全局的影響。
徑向基函數(shù)空間易于計算和存儲,并且?guī)缀蹩梢员平魏芜B續(xù)的函數(shù).給定一個函數(shù)φ,對x∈Rs,所有形如φ‖x-c‖2及其線性組合張成的函數(shù)空間,稱為由函數(shù)φ導出的徑向基函數(shù)空間.徑向基函數(shù)是由一元函數(shù)經(jīng)過有限次平移、伸縮的線性組合而張成的,具有計算格式簡單、計算工作量小巧等優(yōu)點。
基于最小二乘的正則化方法在變分模型中得到廣泛使用,Evgeniou[10]等人使用了正則化的方法用于懲罰最小二乘擬合,Von Golitschek和Schumaker[11]也用同樣的方法來平滑樣條函數(shù)。最小二乘擬合方法對于降低噪音上有良好的效果,正則化方法在信號逼近、曲面重建等領(lǐng)域發(fā)揮了重要的作用。
文中主要研究如何從含有噪音的散亂點中重建原始信號,并且分析實驗結(jié)果。主要思想是在徑向基函數(shù)空間∑Ni=1ciφ‖x-xi‖2上求解逼近原始函數(shù)f。為此,提出基于RBF的最小二乘優(yōu)化模型,該模型的正則項是函數(shù)梯度的L2范數(shù),通過網(wǎng)格上的拉普拉斯平滑方法來實現(xiàn)對函數(shù)梯度的約束。
1 理論基礎(chǔ)
1.1 徑向基函數(shù)逼近
徑向基函數(shù)有著極其強烈的應用背景,徑向基函數(shù)插值有很好的逼近效果,當徑向基函數(shù)是正定時,它的線性組合凡乎可以逼近所有的連續(xù)函數(shù)。徑向基函數(shù)的表示和計算方法都非常地簡單(根據(jù)己知的一元函數(shù)表示),可以減少到達最優(yōu)值所需計算函數(shù)值的次數(shù),加快尋找全局最優(yōu)點的速度。
3 數(shù)值實驗
分別應用函數(shù):
f1x,y=xe(-x2-y2)
f2(x,y)=sin 32πxcos 2πy
f3(x,y)=peaks(x,y)
進行三組仿真實驗,以驗證模型2及其對應算法的有效性。
第一組實驗,設f*1(x,y)為未知連續(xù)信號,在Ω=(-2,2)2上隨機選取200個含噪音散亂點{xif(xi)}200i=1,得到散亂點的值fi=f*i+0.01ηi,其中ηi服從標準正態(tài)分布N(0,1),選用的徑向基函數(shù)為Multi-quadrich函數(shù)。第二組設f*2(x,y)為未知連續(xù)信號,在Ω=(0,1)2上隨機選取200個含噪音散亂點{xi,f(xi)}200i=1。第三組實驗設f*3(x,y)為未知連續(xù)信號,在Ω=(-1,1)2上隨機選取50個含噪音散亂點{xi,f(xi)}50i=1。
實驗基本步驟為:①隨機獲取原始曲面的散亂數(shù)據(jù)點;②對原始曲面上的散亂數(shù)據(jù)點添加高斯噪聲;③通過本文模型和算法確定徑向基函數(shù)的系數(shù),然后反求逼近后的函數(shù)并畫出網(wǎng)格曲面.最后,計算出所有等間距網(wǎng)格點上的原函數(shù)值與逼近后的函數(shù)值之間的均方差,計算結(jié)果如表1所示。
圖2-圖5為實驗結(jié)果數(shù)據(jù),通過圖3與圖5對比可知:本文模型在去噪的同時能夠有效的逼近散亂點的原始曲面;圖4為應用傳統(tǒng)RBF方法[18]對含噪音數(shù)據(jù)逼近的結(jié)果,傳統(tǒng)RBF方法詳見文獻18中的模型11,通過圖4與圖5對比可知:對于含噪的音散亂點,與傳統(tǒng)的徑向基函數(shù)逼近方法相比該模型有更好的去噪和逼近能力,得到的曲面光順性也較好。
表1中的均方差1為利用傳統(tǒng)RBF逼近方法確定的所有等間距網(wǎng)格點的原函數(shù)值與逼近后的函數(shù)值的均方差;均方差2為利用模型確定的所有等間距網(wǎng)格點的原函數(shù)值與逼近后的函數(shù)值的均方差;由表1可知:本文提出的模型方法相比于傳統(tǒng)的徑向基函數(shù)逼近方法有著更好逼近能力。
4 結(jié) 論
討論了當散亂點含有未知噪音時,用L2范數(shù)擬合的模型與算法。借助徑向基函數(shù)插值和正則化的方法,用最小二乘法求解該模型。最后通過三組實驗對比及誤差分析來驗證該模型的有效性。
在下一步的工作中,如何進一步提高逼近效果和算法效率;如何使模型具備對不連續(xù)函數(shù)的良好逼近能力,如果考慮將在模型中加入
L1范數(shù)約束,實驗效果是否會更好,這些問題有待進一步研究。
參考文獻
[1] 蘭鳳崇,陳吉清,林建國.散亂點曲面擬合及在車身曲面中的應用[J].機械工程學報,2005, 41(11):213-216.
[2] GAO W, SUN X, WU Z, et al. Multivariate Monte Carlo approximation based on scattered data[J]. SIAM Journal on Scientific Computing, 2020, 42(4): A2262-A2280.
[3] 任同群,趙悅含,龔春忠,等.自由曲面測量的三維散亂點云無約束配準[J].光學精密工程,2013,21(5):1234-1243.
[4] 楊建斌,陶薪竹. 基于小波框架方法的信號重構(gòu)[J]. 高校應用數(shù)學學報,2019,34(3):364-372.
[5] YANG J,STAHL D,SHEN Z. An analysis of wavelet frame based scattered data reconstruction[J]. Applied and Computational Harmonic Analysis,2017,42(3):480-507.
[6] 馮建周,孔令富.基于網(wǎng)格的散亂點曲面重構(gòu)技術(shù)[J].計算機工程,2009,35(18):19-21.
[7] 李樂慶,康寶生.基于RBF的散亂點曲面重構(gòu)[J].西北大學學報(自然科學版),2011,41(2):221-225.
[8] 魏義坤,楊威,劉靜.關(guān)于徑向基函數(shù)插值方法及其應用[J].沈陽大學學報,2008,21(1):7-9.
[9] 吳宗敏.徑向基函數(shù)、散亂數(shù)據(jù)擬合與無網(wǎng)格偏微分方程數(shù)值解[J].工程數(shù)學學報,2002,19(2):1-12.
[10]EVGENIOU T, PONTIL M, POGGIO T. Regularization networks and support vector machines[J]. Advances in Computational Mathematics, 2000, 13(1): 1.
[11]VON GOLITSCHEK M, SCHUMAKER L. Penalized least squares fitting[J]. Serdica Mathematical Journal, 2002, 28(4): 329-348.
[12]吳宗敏.函數(shù)的徑向基表示[J].數(shù)學進展,1998,27(3):202-208.
[13]XU Q, LIU Z. Scattered data interpolation and approximation with truncated exponential radial basis function[J]. Mathematics, 2019, 7(11): 1101-1101.
[14]FENG R, SONG L. Rational quasi-interpolation approximation of scattered data in R 3[J]. Numerical Mathematics-Theory? Methods? and Applications, 2018, 11(1): 169-186.
[15]韓旭里,莊陳堅,劉新儒.基于徑向基函數(shù)與B樣條的散亂數(shù)據(jù)擬合方法[J].計算技術(shù)與自動化,2007,26(1):63-65,69.
[16]龍輝平,習勝豐,侯新華.實驗數(shù)據(jù)的最小二乘擬合算法與分析[J].計算技術(shù)與自動化,2008,27(3):20-23.
[17]王洪申,張家振,張小鵬.三角網(wǎng)格模型骨架提取算法[J].計算技術(shù)與自動化,2020,39(2):145-149.
[18]MAJDISOVA Z, SKALA V. Radial basis function approximations: comparison and applications[J]. Applied Mathematical Modelling, 2017, 51: 728-743.