吳凱,梁勇,蔡永寧
(濟(jì)南市勘察測(cè)繪研究院,山東 濟(jì)南 250013)
點(diǎn)群目標(biāo)是空間分布分析的重要對(duì)象。在GIS中,單個(gè)的點(diǎn)狀目標(biāo),只有點(diǎn)位的坐標(biāo)和屬性信息,其形狀特征可以被忽略不考慮,而整個(gè)點(diǎn)群目標(biāo)則可能具有某些規(guī)律的分布特征[1]??臻g分布分析過程不考慮單個(gè)點(diǎn)狀目標(biāo)的大小、形狀,主要關(guān)心的是群體分布所隱含的空間結(jié)構(gòu)化信息。對(duì)點(diǎn)群目標(biāo)進(jìn)行研究分析,目的在于提取其空間分布的相關(guān)規(guī)律,根據(jù)空間域內(nèi)包容分布對(duì)象的能力,顧及相互間的影響作用確定最佳設(shè)施配置[2]。
在空間點(diǎn)群研究中使用地圖代數(shù)距離變換(點(diǎn)群聚類)方法,可將距離與空間度量的尺度聯(lián)系起來;可得到各種廣義空間距離概念的識(shí)別和生成方法;易于推廣到多種空間,而非僅限于基于數(shù)學(xué)平面的研究。點(diǎn)群空間分布軸線,在數(shù)學(xué)上可抽象為點(diǎn)群數(shù)據(jù)的線性空間分布特征,傳統(tǒng)點(diǎn)群分布軸線的計(jì)算,無法處理有迂回曲線,無法挖掘橢球面上的點(diǎn)群分布軸線,現(xiàn)將距離變換的思想應(yīng)用到點(diǎn)群空間分布軸線提取的研究中,對(duì)于點(diǎn)群數(shù)據(jù)復(fù)雜的線性條帶分布(是彎曲或迂回曲線類型),應(yīng)用基于距離變換的點(diǎn)群密度研究方法,提取分布軸線。
距離在空間分析中是一個(gè)非常廣義的概念。它不只是單一地代表兩點(diǎn)間的直線長(zhǎng)度,而是被賦予了空間概念下更加豐富的內(nèi)容。距離變換是將包含實(shí)體特征和空間背景的二值圖像轉(zhuǎn)變成距離圖像,即對(duì)二值圖像,將前景中的像素值轉(zhuǎn)化為該點(diǎn)到達(dá)最近背景點(diǎn)的距離。在變換后的距離圖像中,每一個(gè)像素值表示該像素離其最近的一個(gè)實(shí)體像素的距離,具體表現(xiàn)為每個(gè)實(shí)體的距離波不斷地向外空間擴(kuò)張,直到與鄰近實(shí)體的距離波相遇。
距離變換是計(jì)算并標(biāo)識(shí)空間點(diǎn)(對(duì)參照體)距離的變換或過程。距離變換是在確定特性的尺度下對(duì)全空間的度量。外距變換度量實(shí)體圖形外的空間,內(nèi)距變換度量實(shí)體圖形本身空間。它是對(duì)空間實(shí)體量度性質(zhì)的總體和全局的把握[2]。
距離變換特性有:
(1)各空間點(diǎn)距離數(shù)值上的唯一性。
各個(gè)空間點(diǎn)到唯一實(shí)體點(diǎn)的距離的平方是正確的;
各個(gè)空間點(diǎn)到唯一實(shí)體點(diǎn)的距離正確且唯一的;
當(dāng)空間中有N個(gè)實(shí)體點(diǎn)時(shí),任一個(gè)空間點(diǎn)將在變換中得到它與最近實(shí)體點(diǎn)的距離(平方);而當(dāng)有2個(gè)、3個(gè)或是若干個(gè)實(shí)體點(diǎn)到該空間點(diǎn)均為這個(gè)最小距離時(shí),則該點(diǎn)即成為距此2點(diǎn)、3點(diǎn)或是若干點(diǎn)的等距點(diǎn);
(2)平移不變性
指原點(diǎn)群中的點(diǎn),由于它們是由實(shí)體以及相互之間關(guān)系決定的,理論上與坐標(biāo)系關(guān)系不大。平移是不變的,具有平移不變性。
(3)局部更動(dòng)性
當(dāng)增加或減少新的實(shí)體點(diǎn)集時(shí),只與更動(dòng)“周圍”的實(shí)體及其空間有關(guān),這個(gè)“周圍”是:對(duì)更動(dòng)點(diǎn)集的點(diǎn)位產(chǎn)生更動(dòng)距離數(shù)值的實(shí)體以及面向更動(dòng)點(diǎn)集一方的空間,這是距離變換的動(dòng)態(tài)特性。
空間分布軸線是點(diǎn)群重要的分布特征信息,在地理空間中,對(duì)點(diǎn)群(如城市群、地震點(diǎn)群)提取其空間分布軸線,尤其在城市群研究中,通過提取的分布軸線研究其特征區(qū)域帶,對(duì)未來的經(jīng)濟(jì)建設(shè)布局和社會(huì)發(fā)展有著非常重要的決策參考價(jià)值[3]。
離散點(diǎn)群的空間分布趨勢(shì)或走向可以用點(diǎn)群空間分布軸線來表示。分布軸線是一條擬合的直線,可以用來描述離散點(diǎn)群的總體走向趨勢(shì)[4]。對(duì)于離散點(diǎn)群,可以擬合一條直線L(如圖1所示)或曲線,點(diǎn)群相對(duì)于L的距離反映了離散點(diǎn)群在點(diǎn)群走向上的離散程度,而L的走向則描述了點(diǎn)群的總體走向。
圖1 點(diǎn)群空間分布軸線
分布軸線的確定與點(diǎn)群相對(duì)于軸線的離散程度有關(guān),點(diǎn)群相對(duì)于軸線的離散程度可以用三種不同的距離來度量:垂直距離ev、水平距離eh、直交距離eo。
離散度,在點(diǎn)群分布特征研究中,是對(duì)分布中心和分布軸線的補(bǔ)充,反映分布對(duì)象聚集程度的重要的空間分布參數(shù)。當(dāng)不同的空間點(diǎn)群具有相同或近似的分布中心和空間分布密度的情況下,可以用不同的離散度來反映點(diǎn)群的空間分布特性,進(jìn)行補(bǔ)充說明。
設(shè)點(diǎn)的平面直角坐標(biāo)為(xi,yi),在點(diǎn)群分布軸線的研究中,直線方程表示如圖2所示:
圖2 分布軸線為直線
但在復(fù)雜的實(shí)際情況中,一般使用曲線形式擬合迂回型點(diǎn)群分布。通常采用一般二次曲線形式。二次曲線是一種非常重要的平面曲線,在平面直角坐標(biāo)系下,由式二元二次方程所表示的曲線:
a11x2+2a12xy+a22y2+2a13x+2a23y+a33=0
(1)
其中二次項(xiàng)系數(shù)a11、a12和a22不全為零。二次曲線中除了橢圓(包括圓)、拋物線和雙曲線外,還有其他的曲線。在此以拋物線擬合點(diǎn)群為例進(jìn)行說明。
在曲線擬合點(diǎn)群方法[5]中,點(diǎn)的平面直角坐標(biāo)為(xi,yi),其中pi為屬性值,拋物線方程設(shè)為:y=ax2+bx+c,屬性加權(quán)的殘差平方和表示為:
(2)
表達(dá)式中的分母∑pi為常數(shù),對(duì)方程的參數(shù)估計(jì)沒有影響,因此,通過表達(dá)式(3)來計(jì)算曲線方程的參數(shù)a,b,c:
(3)
使S取最小滿足殘差最小二乘,令
(4)
即可得:
(5)
解此方程組即可得到擬合分布軸線的拋物線方程。一般二次曲線對(duì)點(diǎn)群進(jìn)行擬合方法與此相同,通過滿足殘差最小二乘來計(jì)算方程參數(shù)。
對(duì)迂回型點(diǎn)群,首先生成點(diǎn)群分布密度圖,對(duì)點(diǎn)群密度圖提取密度值大于0的邊界區(qū)域,運(yùn)用距離變換的方法生成該邊界區(qū)域的中軸線;對(duì)點(diǎn)群密度圖生成等值線,得到等密度線分布圖,提取將所有點(diǎn)包含的最小密度線,對(duì)該距離變換線運(yùn)用距離變換思想生成中軸線。
在對(duì)包含所有點(diǎn)的最小密度線生成的中軸線基礎(chǔ)上,運(yùn)用最深線提取原理,提取點(diǎn)群分布軸線,其基本思路為:以最小密度線生成的中軸線為基線,作垂直于該中軸線的等間距的劃分線,對(duì)每一條劃分線在密度圖上生成剖面線,在剖面圖中的最大密度值處取點(diǎn),依次取所有劃分線在密度圖上經(jīng)過位置的最大值點(diǎn),將所有最大值點(diǎn)進(jìn)行連線即可得到點(diǎn)群的分布軸線,該方法能更好地描述點(diǎn)群分布,相對(duì)于最小密度線的中軸線,這種方法會(huì)偏向于點(diǎn)群集聚分布的地方,在該曲線型上能夠滿足所有點(diǎn)的偏差量最小二乘原則。
統(tǒng)計(jì)點(diǎn)群相對(duì)于點(diǎn)群分布軸線的離散度,可以得到點(diǎn)群相對(duì)于分布軸線的偏差量,即點(diǎn)群的離散信息;通過比較不用方法所得軸線偏差量,可以對(duì)不同方法所得分布軸線進(jìn)行評(píng)價(jià)。
具體的操作流程如圖3所示。
圖3 迂回型點(diǎn)群分布軸線提取流程
首先對(duì)空間點(diǎn)群數(shù)據(jù)求取分布密度圖,在此基礎(chǔ)上對(duì)點(diǎn)群密度圖提取密度值大于0的邊界區(qū)域以及包含所有點(diǎn)的最小密度等值線,運(yùn)用距離變換思想分別生成大于0邊界區(qū)域的中軸線、最小密度等值線區(qū)域的中軸線。實(shí)驗(yàn)結(jié)果如圖4所示。
圖4 區(qū)域中軸線提取
圖4(c)中,外圍大區(qū)域確定的為密度值大于0邊界區(qū)域;內(nèi)圍小區(qū)域?yàn)榘悬c(diǎn)的最小等密度線區(qū)域,應(yīng)用距離變換對(duì)兩種邊界區(qū)域提取中間線作為點(diǎn)群的擬合分布軸線分別如圖4(d)和(e),分布軸線1為大于0邊界區(qū)域的中軸線;分布軸線2為最小密度等值線區(qū)域的中軸線。
用最深線原理提取點(diǎn)群分布的軸線,即提密度最大值分布的軸線,如圖5所示。以最小密度線生成的中軸線(圖4(e)分布軸線2)為基線,作垂直于該中軸線的等間距的劃分線(圖5(a)),對(duì)每一條劃分線在密度圖上生成剖面線,在剖面圖中的最大密度值處取點(diǎn),依次取所有劃分線在密度圖上經(jīng)過位置的最大值點(diǎn)(圖5(b)),將所有最大值點(diǎn)進(jìn)行連線即可得到點(diǎn)群的分布軸線(圖5(c)分布軸線3)。
圖5 密度最大值分布軸線提取
對(duì)3種不同方法得到的分布軸線進(jìn)行距離變換,如圖6所示,得到其空間等距離線的示例圖。
圖6 不同分布軸線的距離變換圖
讀取點(diǎn)群在點(diǎn)群分布軸線距離圖上的值,即點(diǎn)群相對(duì)于分布軸線的偏差量,便可統(tǒng)計(jì)點(diǎn)群相對(duì)于點(diǎn)群分布軸線的離散度信息。本文該試驗(yàn)中選取點(diǎn)數(shù)較多,不對(duì)每個(gè)點(diǎn)的離散度進(jìn)行一一顯示,僅對(duì)所有點(diǎn)相對(duì)于不同分布軸線的離差和與離差平方和進(jìn)行統(tǒng)計(jì)分析。統(tǒng)計(jì)結(jié)果如表1所示。
不同分布軸線離散度對(duì)比 表1
通過對(duì)點(diǎn)群與不用方法所得分布軸線偏差量的對(duì)比分析,可以看出:由密度值大于0的邊界區(qū)域所得的中軸線,作為點(diǎn)群分布軸線,其偏差量最大;由包含所有點(diǎn)的最小等密度線所確定的中軸線,作為點(diǎn)群分布軸線,其偏差量適中,效果較好;由最深線原理方法生成的分布軸線偏差量最小,但因?yàn)閯澐志€不夠細(xì)密,所得軸線不夠光滑,提取的精度與線的劃分線加密間距有關(guān)。運(yùn)用此方法,可以通過對(duì)劃分線進(jìn)行加密,來得到精度較高的分布軸線。
對(duì)實(shí)驗(yàn)地震點(diǎn)群生成密度分布圖,運(yùn)用熱點(diǎn)分析原理,提取熱點(diǎn)區(qū)域,由熱點(diǎn)引導(dǎo)生成分布軸線。對(duì)分布軸線作一定范圍的緩沖區(qū),來與實(shí)際地震帶比較,分析該方法在地震帶識(shí)別中的應(yīng)用。
將距離變換思想方法應(yīng)用到地震帶識(shí)別實(shí)例中,本文對(duì)地球系統(tǒng)科學(xué)數(shù)據(jù)共享網(wǎng)中的近2000年來中國(guó)地震目錄集成數(shù)據(jù)[6,7]進(jìn)行抽取,選取部分地震數(shù)據(jù)進(jìn)行研究,因數(shù)據(jù)量較大,僅選取時(shí)間為1980年~2000年、震級(jí)大于3級(jí)、中國(guó)華北地區(qū)(34°~42°N,109°~118°E區(qū)域范圍)的地震點(diǎn)數(shù)據(jù),共684條記錄。地震點(diǎn)實(shí)驗(yàn)數(shù)據(jù)如圖7所示。
圖7 地震點(diǎn)實(shí)驗(yàn)數(shù)據(jù)
基于距離變換思想生成的空間點(diǎn)群分布的密度圖,對(duì)實(shí)驗(yàn)地震點(diǎn)群生成密度分布圖如圖8所示。
圖8 地震點(diǎn)數(shù)據(jù)分布密度圖
距離變換方法生成的點(diǎn)群密度圖,因沒有固定距離步長(zhǎng)滑動(dòng)問題,選取合理的影響范圍,生成的密度圖中的密集和稀疏區(qū)域間的過渡就會(huì)比較平滑,不會(huì)出現(xiàn)大量黑斑情況。數(shù)學(xué)形態(tài)學(xué)方法中,落入圓內(nèi)的點(diǎn)數(shù)設(shè)定對(duì)應(yīng)像素點(diǎn)的灰度值,對(duì)兩個(gè)像素點(diǎn)而言,灰度值相同,落入搜索圓內(nèi)的點(diǎn)數(shù)目相等,但沒有考慮同搜索圓內(nèi)點(diǎn)與點(diǎn)分布的差別,沒有體現(xiàn)點(diǎn)與點(diǎn)距離不同而造成的差異;而且分布密集區(qū)域內(nèi)可能有大量由低密度而產(chǎn)生的洞或黑斑;該方法使用受滑動(dòng)步長(zhǎng)的限制,密集和稀疏區(qū)域間的過渡通常也大都是不平滑的。
首先對(duì)實(shí)驗(yàn)點(diǎn)群數(shù)據(jù)生成點(diǎn)群分布密度圖,由于實(shí)際地震點(diǎn)數(shù)據(jù)的聚集情況不同,密度值差異明顯。根據(jù)研究需要確定等值線的間距,生成密度等值線。本文研究中生成密度圖的灰度值為0~88.66,為方便顯示,選取間距為5生成密度等值線。結(jié)果如圖9所示。
圖9 密度等值線
對(duì)區(qū)域內(nèi)的不同數(shù)值的等密度線進(jìn)行統(tǒng)計(jì),生成如圖10所示的等密度線數(shù)值與個(gè)數(shù)的變化關(guān)系示意圖,其中縱坐標(biāo)N為不含重疊區(qū)的等值線個(gè)數(shù),橫坐標(biāo)H為等密度線數(shù)值。由圖10,可以根據(jù)確定不同的等密度線數(shù)值,提取相應(yīng)不同個(gè)數(shù)的熱點(diǎn)區(qū)域。
圖10 等密度線個(gè)數(shù)統(tǒng)計(jì)
對(duì)密度圖生成等值線,間距根據(jù)研究需要可進(jìn)行調(diào)整。通過對(duì)等值線選取的控制,獲取不同的熱點(diǎn)區(qū)域(如圖11(a)所示),然后由獲取的熱點(diǎn)引導(dǎo)來獲取其分布的大致軸線(如圖11(b)所示)。
圖11熱點(diǎn)引導(dǎo)分布軸線生成示意圖
對(duì)有熱點(diǎn)引導(dǎo)獲取的分布軸線作緩沖區(qū)(11(d)所示),即可識(shí)別出研究區(qū)域可能的地震帶位置。集合地震專家劃分的華北地區(qū)的地震帶[8,9](郯廬地震帶、汾渭地震帶、內(nèi)蒙古地震帶、燕山地震帶、京津渤地震帶、華北平原地震帶)進(jìn)行比較,示意圖如圖12所示。
圖12結(jié)果分析圖
由圖12可知,僅對(duì)比研究區(qū)內(nèi)的地震帶識(shí)別情況,內(nèi)蒙古地震帶、汾渭地震帶、華北平原地震帶與熱點(diǎn)引導(dǎo)生成分布軸線的緩沖區(qū)結(jié)果較相近,所生成結(jié)果與燕山地震帶位置有偏差。專家在劃分地震帶時(shí)會(huì)考慮地震震級(jí)的大小,本文則主要是在距離尺度上研究地震的分布密度,并由熱點(diǎn)引導(dǎo)求取分布軸線,來識(shí)別地震帶分布。熱點(diǎn)引導(dǎo)生成分布軸線的緩沖區(qū)較好地表達(dá)了地震點(diǎn)的分布狀況,研究區(qū)684條地震記錄中有538個(gè)點(diǎn)落入作為識(shí)別地震帶的緩沖區(qū)內(nèi),較好地吻合了地震帶的特征。
對(duì)密度圖生成等值線,間距調(diào)整到較小時(shí),可以獲取更多細(xì)節(jié)特征。圖13為間距為1時(shí)用該方法獲得的熱點(diǎn),及由熱點(diǎn)引導(dǎo)得到的分布軸線,以該分布軸線相應(yīng)的緩沖區(qū)作為識(shí)別的地震帶,能識(shí)別出小型地震帶的分布位置。
圖13等值線間距為1時(shí)所得熱點(diǎn)及分布軸線
點(diǎn)群的空間分布形態(tài)具有多樣性,不同的點(diǎn)群具有不同的空間分布形態(tài)。通過分析其在空間中的集中趨勢(shì)可以獲取點(diǎn)群的集聚特征信息。點(diǎn)群空間分布軸線是一條擬合的直線或曲線,可以描述離散點(diǎn)群的總體走向。將距離變換的思想應(yīng)用到迂回型點(diǎn)群空間分布軸線提取的研究中,針對(duì)點(diǎn)群分布的特點(diǎn),獲取點(diǎn)群的分布軸線。在地理空間中,對(duì)實(shí)際點(diǎn)群,如迂回型或更加復(fù)雜的點(diǎn)群提取分布軸線,并結(jié)合軸線進(jìn)一步研究其特征分布區(qū)域,對(duì)城市建設(shè)的發(fā)展有著重要的參考意義和價(jià)值,這也是需要進(jìn)一步研究的重點(diǎn)。