姚亞麗
寧波市正源測繪有限公司 浙江 寧波 315000
空間數(shù)據(jù)是GIS研究的主要對象和內(nèi)容??臻g數(shù)據(jù)是指空間實(shí)體或時間信息,空間位置和專題特征的數(shù)據(jù)記錄中的現(xiàn)象??臻g數(shù)據(jù)質(zhì)量表達(dá)的三個基本要素是空間數(shù)據(jù)的準(zhǔn)確性,一致性和完整性??臻g數(shù)據(jù)質(zhì)量通常以誤差來衡量,增加數(shù)量精度是減少空間數(shù)據(jù)錯誤的根本途徑。GIS空間數(shù)據(jù)質(zhì)量研究與地理信息系統(tǒng)的最終運(yùn)作效果直接相關(guān),后者又與地理信息有關(guān)系統(tǒng)各種宏觀決策的正確制定和信息化進(jìn)程的推進(jìn)息息相關(guān)[1]。
時間間隔數(shù)據(jù)是空間數(shù)據(jù)庫中管理和處理的主要對象。它使用基于地球表面空間位置的自然社會和人類經(jīng)濟(jì)景觀數(shù)據(jù)作為圖形、圖像、文本、表單和數(shù)字。
在GIS中,空間數(shù)據(jù)主要包括:在已知坐標(biāo)系中的位置,即“where”的問題;實(shí)體之間的空間關(guān)系主要是指拓?fù)潢P(guān)系,這是對空間關(guān)系的一個明確定義。與幾何位置無關(guān)的屬性的數(shù)學(xué)方法和內(nèi)容。
空間數(shù)據(jù)通常具有三個基本特征:空間特征、時間特征和專題特征。
(1)空間特征:也稱為定位特征,指幾何特征,例如空間物體的位置,形狀,大小以及與鄰近物體的拓?fù)潢P(guān)系。人類對空間目標(biāo)的定位通常不是由存儲空間的坐標(biāo)決定的,而是由某個目標(biāo)與其他更為熟悉的目標(biāo)之間的空間位置關(guān)系決定的。這種關(guān)系通常也是一種拓?fù)潢P(guān)系。
(2)時間特征:也稱為縮放特征,意味著空間數(shù)據(jù)總是在特定的時間或時間段被采集或計算。因此,GIS數(shù)據(jù)是必須動態(tài)更新和維護(hù)的動態(tài)空間數(shù)據(jù)。
(3)主題特征:也稱為非定位特征,是指除空間和時間特征以外的其他空間現(xiàn)象特征,即事物或現(xiàn)象的“特征”是什么。它可以分為定性和定量兩種。前者是事物或現(xiàn)象的名稱、類型和特征,后者則包括數(shù)量、等級和地位[2]。
基于GIS的數(shù)據(jù)挖掘主要是空間數(shù)據(jù)和屬性數(shù)據(jù)的綜合挖掘模型。它是比通過查詢方法獲得的傳統(tǒng)知識更深層次的數(shù)據(jù)處理分析。目前,該領(lǐng)域的研究取得了一些成果。然而,在未來的發(fā)展中還有許多理論和方法需要進(jìn)一步研究。
基于GIS數(shù)據(jù)挖掘,由于其自身的領(lǐng)域知識,不僅增加了挖掘算法的搜索空間,而且增加了盲目搜索的可能性。因此,必須結(jié)合GIS數(shù)據(jù)和場自身的特點(diǎn)來改進(jìn)算法,提高算法效率,設(shè)計出更好的相關(guān)挖掘算法。
在挖掘基于GIS的隱式知識規(guī)則時,使用單一方法往往缺乏挖掘知識。因此,為了挖掘更多的GIS數(shù)據(jù),必須將多種開采技術(shù)與綜合開采模式并行使用,挖掘更有用的知識。
目前的GIS軟件和空間數(shù)據(jù)庫不能有效地支持?jǐn)?shù)據(jù)挖掘。相反,它會提取相關(guān)數(shù)據(jù),然后使用挖掘技術(shù)挖掘數(shù)據(jù)[3]。
空間數(shù)據(jù)質(zhì)量是指空間數(shù)據(jù)的可靠性和準(zhǔn)確性,通常由空間數(shù)據(jù)的誤差來衡量??臻g數(shù)據(jù)質(zhì)量控制基于空間數(shù)據(jù)的基本特征,可以概括為空間特征精度,時間特征精度和主題特征精度。
空間特征精度主要是指標(biāo)精度和關(guān)系精度。數(shù)學(xué)精度是空間數(shù)據(jù)精度的空間因素。它指的是GIS數(shù)據(jù)庫中描述的對象的坐標(biāo)數(shù)據(jù)與真實(shí)地面位置的接近程度,包括基本精度、平面精度、仰角精度、邊緣精度等。
時間特征的準(zhǔn)確性主要是指空間數(shù)據(jù)的現(xiàn)狀。它應(yīng)該反映數(shù)據(jù)表示的時間信息的正確性。例如,20世紀(jì)50年代的湖泊數(shù)據(jù)和20世紀(jì)90年代的湖泊數(shù)據(jù)有很大不同。
主題特征精度主要指空間數(shù)據(jù)的空間和時間精度,包括屬性精度和元數(shù)據(jù)精度[4]。
GIS空間數(shù)據(jù)質(zhì)量可以分為三個階段。第一階段是在20世紀(jì)六七十年代GIS誕生時,在開發(fā)地理信息系統(tǒng)作為數(shù)字地圖制作工具時,要注意地理信息系統(tǒng)的質(zhì)量。本研究主要運(yùn)用數(shù)理統(tǒng)計的原理對圖形和圖形操作進(jìn)行操作。分析質(zhì)量和精度;在第二階段,在20世紀(jì)80年代,GIS數(shù)據(jù)的質(zhì)量得到了真正的重視。研究主要集中在解釋過程中的空間數(shù)據(jù)誤差模型,圖像分類和誤差分析;第三階段,自20世紀(jì)90年代以來,越來越多的專家學(xué)者開始從事GIS空間數(shù)據(jù)質(zhì)量的研究和應(yīng)用?,F(xiàn)階段的研究開發(fā)非常迅速,取得了許多顯著成果。
空間數(shù)據(jù)質(zhì)量控制的含義主要是指在數(shù)據(jù)生產(chǎn)過程中可能引入錯誤的步驟和過程的控制,以達(dá)到保證數(shù)據(jù)質(zhì)量的目的。數(shù)據(jù)質(zhì)量控制是一個復(fù)雜的過程,反映在數(shù)據(jù)生產(chǎn)和處理的各個方面。為了控制數(shù)據(jù)質(zhì)量,從所有生成和傳播數(shù)據(jù)質(zhì)量的流程和鏈接開始。使用適當(dāng)?shù)姆椒▉頊p少錯誤。
空間數(shù)據(jù)質(zhì)量控制的常用方法有以下三種:
(1)元數(shù)據(jù)方法:數(shù)據(jù)集的元數(shù)據(jù)中包含了大量的有關(guān)數(shù)據(jù)質(zhì)量的信息,通過它檢查數(shù)據(jù)質(zhì)量,了解跟蹤元可以了解數(shù)據(jù)質(zhì)量的狀況和變化;
傳統(tǒng)的手工方法:將數(shù)字化數(shù)據(jù)與數(shù)據(jù)源進(jìn)行比較,圖形部分的檢查包括目視方法、繪制到透視圖上與原圖疊加比較,屬性部分的檢查采用與原屬性逐個對比或其他比較方法;
地理相關(guān)法:用空間數(shù)據(jù)的地理特征要素自身的相關(guān)性分析數(shù)據(jù)的質(zhì)量[5]。
綜上所述,隨著信息技術(shù)的不斷發(fā)展和進(jìn)步,GIS空間數(shù)據(jù)處理技術(shù)也將更加成熟,通過建立可靠的質(zhì)量控制系統(tǒng),大大提高了數(shù)據(jù)的處理能力。
[1] 毋河海,龔健雅.地理信息系統(tǒng)(GIS)空間數(shù)據(jù)結(jié)構(gòu)與處理技術(shù)[M].北京:測繪出版社,2016:297.
[2] 胡鵬,吳艷蘭,李圣權(quán),等.GIS遠(yuǎn)程教育[M].北京:高等教育出版社,2015:107.
[3] 徐衛(wèi),張艷玲.關(guān)于地理信息系統(tǒng)(GIS)數(shù)據(jù)精度與質(zhì)量探討[J].吉林地質(zhì),2016,23(3):98-101.
[4] 宋軍林.地圖對GIS空間數(shù)據(jù)誤差的影響初探[J].寶雞文理學(xué)院學(xué)報(自然科學(xué)版),2017,(3):70-72.
[5] 韓李濤,趙軍.空間數(shù)據(jù)質(zhì)量相關(guān)問題探討[J].東北測繪,2017,26(11):11-14.