崔汝麥,司守奎
(1.威海職業(yè)學(xué)院,山東 威海 264210;2.海軍航空工程學(xué)院 基礎(chǔ)部,山東 煙臺(tái) 264001)
隨著信息科學(xué)與各種測(cè)量技術(shù)的發(fā)展,在氣象、醫(yī)學(xué)和探礦等領(lǐng)域產(chǎn)生了海量的數(shù)據(jù)。由于缺乏有效分析手段,常常要舍棄龐大數(shù)據(jù)群中的大部分?jǐn)?shù)據(jù)。人們迫切希望對(duì)數(shù)據(jù)進(jìn)行更高層次的分析,揭示其隱藏的重要信息,以便更好地利用它們。數(shù)據(jù)可視化就是順應(yīng)這一趨勢(shì)而發(fā)展起來(lái)的,對(duì)原始數(shù)據(jù)信息進(jìn)行可視化處理后,抽象繁雜的數(shù)據(jù)變得直觀簡(jiǎn)單、生動(dòng)有趣[1]。
本文研究的問(wèn)題源于一個(gè)實(shí)際問(wèn)題。該問(wèn)題提供了來(lái)自某空間區(qū)域8個(gè)水平截面上各對(duì)應(yīng)點(diǎn)某物理量的實(shí)際測(cè)量數(shù)據(jù)。
要求直觀分析出該物理量在這一空間區(qū)域的分布情況,具體要求如下:
1)提供該物理量在各截面的分布情況;
2)提供該物理量在整個(gè)空間區(qū)域的分布情況。
參考數(shù)據(jù)如表1所示,其中,500p,…,1200p分別代表8個(gè)水平截面的z坐標(biāo)值,每個(gè)水平截面下有3組數(shù)據(jù),分別表示測(cè)量點(diǎn)的x坐標(biāo)、y坐標(biāo)和測(cè)點(diǎn)處的某物理量的觀測(cè)值。
表1 問(wèn)題的數(shù)據(jù)
根據(jù)所給的數(shù)據(jù)分布情況,通過(guò)平移與旋轉(zhuǎn)對(duì)研究區(qū)域的數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,并對(duì)該區(qū)域進(jìn)行網(wǎng)格劃分。再進(jìn)行二維插值運(yùn)算,計(jì)算出每個(gè)網(wǎng)格數(shù)據(jù),并對(duì) 8個(gè)截面進(jìn)行可視化顯示。最后進(jìn)行空間插值,獲得空間上的分布數(shù)據(jù),并將其顯示出來(lái)。
1)實(shí)測(cè)數(shù)據(jù)均可靠,沒(méi)有誤差;
2)實(shí)驗(yàn)數(shù)據(jù)采集廣泛,具有普遍性;
3)所測(cè)物理量是連續(xù)變化,不存在突變。
2.4.1 數(shù)據(jù)處理
問(wèn)題中8個(gè)水平截面上的實(shí)際測(cè)量數(shù)據(jù),實(shí)際上是在xy 平面上取若干個(gè)點(diǎn),然后分別測(cè)量這些點(diǎn)在8個(gè)水平截面上的值。這些點(diǎn)在xy 平面上的位置如圖1所示。
圖1 測(cè)量點(diǎn)的水平分布
從圖1中可以看出,這些點(diǎn)大致均勻分布在五條直線上,即所給數(shù)據(jù)是在這五個(gè)豎直截面上分別測(cè)量8個(gè)水平截面上的值。為了獲得物理量在各截面和整個(gè)空間區(qū)域的分布情況,顯然我們需要根據(jù)這些數(shù)據(jù)進(jìn)行插值。
如果直接在圖示范圍內(nèi)進(jìn)行插值計(jì)算,不僅計(jì)算量大,而且四個(gè)邊角上的插值誤差很大,實(shí)際意義不大。為獲得有效數(shù)據(jù)并減少計(jì)算量,我們可以先對(duì)坐標(biāo)軸進(jìn)行平移與旋轉(zhuǎn)處理,將這些測(cè)量點(diǎn)平移旋轉(zhuǎn)到一個(gè)較小的矩形區(qū)間,然后再進(jìn)行計(jì)算。
平移與旋轉(zhuǎn)變換之后測(cè)量點(diǎn)x軸上最大值與最小值的差值為1 080,而y軸上最大值與最小值的差值不到390,兩者比例為2.769,我們?cè)诒3衷瓬y(cè)量點(diǎn)的位置比例不變的情況下進(jìn)行位置數(shù)據(jù)標(biāo)準(zhǔn)化處理,相當(dāng)于將包括全部測(cè)量點(diǎn)的最小立體區(qū)域從原來(lái)坐標(biāo)系中取出,并保持長(zhǎng)寬比例2.769,然后重新建立坐標(biāo)系,這樣就減小了x軸和y軸上數(shù)值的量級(jí),簡(jiǎn)化了計(jì)算。
標(biāo)準(zhǔn)化計(jì)算公式為
式中:N為測(cè)量點(diǎn)的數(shù)量;K為x軸上劃分網(wǎng)格的數(shù)量;τ為測(cè)量區(qū)域矩形的長(zhǎng)寬比例;L表示取不大于L的最大整數(shù),取整主要是為了后面插值劃分網(wǎng)格的方便。
在選定的矩形中每條直線在橫向上都不能到達(dá)矩形區(qū)域邊線;如果直接進(jìn)行網(wǎng)格劃分并插值,將會(huì)出現(xiàn)在某些點(diǎn)的插值為不確定值,這就要縮小矩形再進(jìn)行網(wǎng)格劃分和插值,從而造成部分?jǐn)?shù)據(jù)丟失,而不能充分利用現(xiàn)有信息。所以我們先采用一維三次樣條插值,將缺少的點(diǎn)插值獲得再進(jìn)行后面的計(jì)算。插值補(bǔ)全處理之后的效果如圖2所示。
圖2 插值補(bǔ)全處理
2.4.2 網(wǎng)格細(xì)劃
針對(duì)原始數(shù)據(jù)點(diǎn)分散,數(shù)量不足等問(wèn)題,首先對(duì)所給空間進(jìn)行網(wǎng)格細(xì)劃,通過(guò)二維插值來(lái)獲得各網(wǎng)格點(diǎn)上的物理量值,提高數(shù)據(jù)密度,再進(jìn)行空間插值,可得到可視化圖。
將轉(zhuǎn)換后的較小立體區(qū)域劃分為200×72×70個(gè)小網(wǎng)格,然后分兩步進(jìn)行插值計(jì)算。
第一步:取出 8個(gè)截面中的一個(gè),根據(jù)原始數(shù)據(jù),采用三次樣條插值的方法,插值計(jì)算出該截面上200×72個(gè)網(wǎng)格上的數(shù)據(jù)。同樣對(duì)其他 7個(gè)截面進(jìn)行相同的計(jì)算,從而獲得200×72×8個(gè)網(wǎng)格上的數(shù)據(jù)。
第二步:取出一個(gè)豎直截面,其網(wǎng)格數(shù)為200×70;從上一步求出的數(shù)據(jù)中取出在該截面上的200×8個(gè)網(wǎng)格的數(shù)據(jù),同樣進(jìn)行三次樣條插值計(jì)算,插值計(jì)算出該截面上所有網(wǎng)格的數(shù)據(jù)。同樣對(duì)剩下的71個(gè)截面進(jìn)行相同的計(jì)算,從而獲得所有網(wǎng)格的數(shù)據(jù)。
通過(guò)插值,估計(jì)出某一點(diǎn)缺失的測(cè)量數(shù)據(jù),提高了數(shù)據(jù)密度;也使數(shù)據(jù)網(wǎng)格化,把非規(guī)則分布的空間數(shù)據(jù)內(nèi)插為規(guī)則分布的空間數(shù)據(jù)。
2.4.3 空間插值
空間插值[2-4]是指通過(guò)已知的數(shù)據(jù)點(diǎn)或已化為各個(gè)相對(duì)小一些區(qū)域內(nèi)的數(shù)據(jù)點(diǎn),計(jì)算出相關(guān)的其他未知點(diǎn)或相關(guān)區(qū)域內(nèi)所有點(diǎn)的方法。根據(jù)網(wǎng)格細(xì)劃所得的數(shù)據(jù),可以分別采用以下插值方法計(jì)算。
1)最近鄰點(diǎn)插值法充分利用了插值點(diǎn)與已知點(diǎn)之間的距離關(guān)系,反映了實(shí)際情況,但造成變量值的高估或低估,產(chǎn)生不光滑表面。
2)三線性插值法能緩解邊界不連續(xù)、改善表面不光滑的問(wèn)題,但使銳度明顯的邊緣變模糊。
3)三角網(wǎng)/線性插值法能充分利用已知點(diǎn)的信息,且表面光滑,但其等值線呈現(xiàn)鋸齒狀。
上述 3種插值方法各有優(yōu)缺點(diǎn)。經(jīng)充分比較運(yùn)算,可將最近鄰點(diǎn)插值法、三線性插值法和三角網(wǎng)/線性插值法以1∶2∶4的比例加權(quán)平均,設(shè)計(jì)出綜合插值法,能夠充分發(fā)揮 3種方法的優(yōu)點(diǎn)。以截面600p所給數(shù)據(jù)為例,此模型立體表面光滑,等值線[5]也較平滑,效果見圖3、圖4。
圖3 綜合插值法立體圖
圖4 綜合插值法等值線圖
根據(jù)本文設(shè)計(jì)的綜合插值法模型,可插值計(jì)算出所測(cè)物理量在各截面的分布情況,見圖5、圖6。從截面500p~900p的分布圖可以看出,該物理量的大值主要分布在矩形區(qū)的左上和左下角區(qū)域;而且隨著豎直方向值的增大,大值分布在朝下方移動(dòng)。而從截面1 000p~1 200p的分布圖可以看出,物理量的分布較為廣泛,但隨著豎直方向值的增大,物理量集中于研究區(qū)域左下方的分布情況更為明顯。
圖5 物理量在8個(gè)截面的分布圖
圖6 物理量在8個(gè)截面的分布等值線圖
依據(jù)網(wǎng)格細(xì)劃中提出的兩個(gè)步驟,采用綜合插值法計(jì)算出所有小網(wǎng)格的數(shù)據(jù)。使用Matlab[6-7]中的griddata3命令,獲得空間區(qū)域的分布情況,如圖7、8是其中的2個(gè)截面圖。圖7、8能較為明顯地看到物理量的大值集中分布情況,也證實(shí)了我們上面的分析。在實(shí)際應(yīng)用中,可根據(jù)要求具體分析某個(gè)截面的分布情況,從而為正確決策提供科學(xué)的支持。
圖7 空間區(qū)域的分布截面
圖8 空間區(qū)域的分布截面
本文針對(duì)分布不均勻、數(shù)據(jù)點(diǎn)不足的復(fù)雜數(shù)據(jù)建立了可視化處理的數(shù)學(xué)模型,為科研工作者進(jìn)行類似工作時(shí)提供了一定的參考依據(jù)。
本模型適應(yīng)性廣,但計(jì)算精度要依據(jù)數(shù)據(jù)的離散程度和網(wǎng)格劃分的細(xì)密程度兩個(gè)方面。其中,網(wǎng)格劃分越小,精度也就越高,但計(jì)算量就會(huì)大為增加,設(shè)計(jì)時(shí)要兼顧二者的平衡。其次,如果數(shù)據(jù)是均勻分布的離散數(shù)據(jù)或者能夠?qū)μ囟c(diǎn)測(cè)量后再進(jìn)行插值計(jì)算,可簡(jiǎn)化計(jì)算,提高精度。
[1]唐澤圣.三維數(shù)據(jù)場(chǎng)可視化[M].北京:清華大學(xué)出版社,1999.
[2]顏慧敏.空間插值技術(shù)的開發(fā)與實(shí)現(xiàn)[D].成都:西南石油學(xué)院,2005.
[3]葉其孝.大學(xué)生數(shù)學(xué)建模競(jìng)賽輔導(dǎo)教材[M].長(zhǎng)沙:湖南教育出版社,2001.
[4]蕭樹鐵.數(shù)學(xué)實(shí)驗(yàn)[M].北京:高等教育出版社,1999.
[5]王智剛,唐瑤,曾向紅,等.雷電災(zāi)害數(shù)據(jù)可視化分析系統(tǒng)研制[J].氣象,2009(5):23-30.
[6]張宜華.精通MATLAB5[M].北京:清華大學(xué)出版社,2000.
[7]王家文.MATLAB6.5 圖形圖像處理[M].北京:國(guó)防工業(yè)出版社,2004.