王洋洋,孫 偉*,古麗米拉·克孜爾別克
(1.新疆農業(yè)大學 計算機與信息工程學院,新疆 烏魯木齊 830052)
時空數(shù)據(jù)模型研究進展
王洋洋1,孫 偉1*,古麗米拉·克孜爾別克1
(1.新疆農業(yè)大學 計算機與信息工程學院,新疆 烏魯木齊 830052)
對已有的時空數(shù)據(jù)模型進行了分析,介紹了有關學者對構建模型的見解和貢獻;闡述了具有代表性的時空數(shù)據(jù)模型的原理和特點,指出不同階段時空數(shù)據(jù)模型的研究成果和不足之處以及當前時空數(shù)據(jù)挖掘面臨的難題。
時空數(shù)據(jù)模型;研究成果;發(fā)展趨勢
也逐漸形成了海量的時空大數(shù)據(jù)[1]。時空數(shù)據(jù)具有增長速度快、數(shù)據(jù)量大、來源多樣、結構各異等特點,高效管理問題突出。時空數(shù)據(jù)模型是其中的一個關鍵技術;涉及許多學科,需要運用計算機、遙感、全球定位系統(tǒng)和地理信息系統(tǒng)等技術來分析時空數(shù)據(jù);可應用在國防、工業(yè)、社交網(wǎng)絡、醫(yī)療、交通、救災、氣象等領域。與此同時,在物聯(lián)網(wǎng)環(huán)境下,大量傳感器的應用,遙感集市云平臺的建立使得時空數(shù)據(jù)模型成為GIS研究中的一個重要方向[2]。數(shù)據(jù)挖掘技術的突破和海量時空數(shù)據(jù)的生產,為空間理論的驗證提供了一個新的視角[3]。
陳新保[4]等從時態(tài)GIS的核心內容出發(fā),闡述了時空數(shù)據(jù)模型間的關系和本質區(qū)別,為模型的擴展和新模型的研究提供了理論依據(jù)和參考,并就幾類具有代表性的模型進行了介紹;分析了側重狀態(tài)描述的時空數(shù)據(jù)模型、側重過程描述和因果分析的時空數(shù)據(jù)模型和側重時空對象及其關系描述的時空數(shù)據(jù)模型。劉大有[5]等對時空數(shù)據(jù)挖掘的研究現(xiàn)狀和面臨的主要問題進行了分析,對時空模式發(fā)現(xiàn)、時空聚類、時空異常檢測、時空預測和分類等方面進行了詳細說明,結合近年來數(shù)據(jù)挖掘領域的研究進展討論了各種研究方法的優(yōu)缺點。趙彬彬[6]等闡述了從數(shù)據(jù)挖掘到空間數(shù)據(jù)挖掘,再到時空數(shù)據(jù)挖掘的發(fā)展歷程,找出空間數(shù)據(jù)和傳統(tǒng)知識發(fā)現(xiàn)的異同,并討論了未來時空數(shù)據(jù)挖掘的研究熱點。在眾多數(shù)據(jù)模型中較為特殊的模型要數(shù)海洋時空過程數(shù)據(jù)模型[7],海洋現(xiàn)象時刻發(fā)生變化,與陸地的瞬時變化相比存在明顯的差異。
時空數(shù)據(jù)挖掘工作都還處于起步階段,且許多研究工作都是針對特定領域,缺乏廣泛性[8]。在理論研究方面不僅受到空間數(shù)據(jù)挖掘和時態(tài)數(shù)據(jù)挖掘研究的影響,還受到時空數(shù)據(jù)表示和存取方式的限制[9]。一些文獻中提到的更新方式都是同步更新,若在更新過程中出現(xiàn)錯誤,將無法進行回溯和修改[10]。
隨著大數(shù)據(jù)的到來,數(shù)據(jù)量急速膨脹,導致了人們對數(shù)據(jù)處理的困難,數(shù)據(jù)挖掘應運而生。除了數(shù)據(jù)挖掘的共性,空間數(shù)據(jù)挖掘還有自身特性,不僅包含位置和屬性數(shù)據(jù),還包含實體間的空間關系[11]。不同時期提出的數(shù)據(jù)模型在解決的科學問題方面都存在差異,表1給出了不同時空數(shù)據(jù)模型的研究成果和不足之處。由表1可知,不同階段發(fā)展起來的數(shù)據(jù)模型均能解決特定問題,但缺乏更完善的體系。
2.1 時間快照圖像序列模型
時間快照圖像序列模型是較為經(jīng)典的時空數(shù)據(jù)模型之一[12],通過使用經(jīng)過空間配準后的柵格圖像來表示真實世界在某個時刻的狀態(tài)。在數(shù)據(jù)庫中只記錄當前的數(shù)據(jù)狀態(tài),數(shù)據(jù)更新時,新數(shù)據(jù)會替換舊數(shù)據(jù),可將時間片段存儲起來,根據(jù)用戶需要對指定時間的片段進行回放。因數(shù)據(jù)未發(fā)生變化時也會進行存儲,故當數(shù)據(jù)量較大時,系統(tǒng)的處理效率會急劇下降。該模型還只是一種理論上的模型,開發(fā)價值不是很大。
2.2 時空復合模型
在與矢量基態(tài)修正模型相似的時空復合模型中[13],時空復合式把空間分割成具有相同時空過程的最大公共時空單元,較容易實現(xiàn)時空拓撲分析[14]。該模型保留了沿時間的空間拓撲關系,所有更新的特征都被加入到當前的數(shù)據(jù)集中,新的拓撲關系也會伴隨生成。但隨著時間的延續(xù),時空數(shù)據(jù)庫中的數(shù)據(jù)會逐漸增多,影響時空復合模型的查詢效率。
表1 時空數(shù)據(jù)模型對比分析
2.3 面向對象的時空數(shù)據(jù)模型
在靜態(tài)對象模型的基礎上擴展時態(tài)信息表達[15],其核心思想是把所考察的系統(tǒng)看成一個對象,提取它們之間的共性和相互作用方式并進行規(guī)范化,使得邏輯過程的建模變得簡單且容易實現(xiàn)[16]。該模型能夠較好地表達數(shù)據(jù)的時間、空間和語義屬性信息,反映要素對象之間的多層次關聯(lián)關系[17],有助于探索事物動態(tài)變化的內在規(guī)律[18]。面向對象的數(shù)據(jù)庫也將是未來數(shù)據(jù)庫的發(fā)展方向[19]。
2.4 時空立方體模型
1970年Hagerstrand提出了時空立方體模型,由兩 個空間維和一個時間維組成三維立方體[20],給定一 個時間位置值,即可從三維立方體中獲得相應的截面[14]。時空立方體單元是以規(guī)則的空間網(wǎng)格為底,相應的時間段為高組成的方形柱體,是數(shù)據(jù)存儲的基本單元[21]。當時空立方體單元中存儲的物理表或邏輯表超出數(shù)據(jù)存儲的上限時,數(shù)據(jù)的管理效率將會大幅下降,同時在時空立方體表達方面也較難實現(xiàn)。
2.5 基態(tài)修正模型
當狀態(tài)變化相對緩慢,為了降低數(shù)據(jù)冗余量,存儲時只記錄變化部分,可選擇基態(tài)修正模型,又稱為底層疊加模型[22]。每變化一次的快照可通過疊加每次變化內容獲得,每個對象只需存儲一次,記錄很小的數(shù)據(jù)量。雖然解決了數(shù)據(jù)冗余問題,但也增加了時空操作的復雜性[23]。該模型設使用最為頻繁的狀態(tài)為基態(tài),每當有狀態(tài)變換時,將前一狀態(tài)相對于最新狀態(tài)的變化部分存入歷史庫。存儲入庫的內容會被變更數(shù)據(jù)不斷修正[24]。該模型處理矢量數(shù)據(jù)的效率較低,但處理柵格數(shù)據(jù)較為合適。
2.6 快照增量時空模型
要素在其生命周期中,可發(fā)生多次空間幾何變化和屬性變化,空間幾何擁有正負號特性。每一時刻的快照信息為前一快照信息加上增量信息,表現(xiàn)為空間幾何標識符的集合。時空索引的節(jié)點包括空間幾何集和時間區(qū)間,其中空間幾何集共有3類,通過出現(xiàn)的集合和消亡的集合來表示增量。該索引機制將時間和空間作為同等重要的維,能對時間段和時間點進行快速查詢,兼顧了時間和空間的查詢效率[25]。
2.7 時空ER模型
ER模型常用于設計高性能的事務型處理系統(tǒng),主要是圍繞數(shù)據(jù)和數(shù)據(jù)之間的關系構建而成。在傳統(tǒng)的ER模型上引入新的符號結構來支持時空信息,將現(xiàn)實世界中的空間、時間、屬性信息相互關聯(lián),可為時空數(shù)據(jù)的建模提供便利條件,并對數(shù)據(jù)庫的設計提供有效的方法[26]。在用戶使用該終端時,為了理解查詢的結果,必須要先了解數(shù)據(jù)庫如此龐大的ER模型,這一點對用戶而言不易實現(xiàn)[27]。
2.8 基于事件的時空數(shù)據(jù)模型及其擴展
按時間順序把事件組成一個鏈,新發(fā)生的事件會依次加到整個事件的尾部。以時間順序來組織發(fā)生在特定地理位置上的變化。擴展后的模型主要適用于高級時態(tài)查詢,具有3個重要功能:解決對象標識問題,使更新機制更加靈活;被擴展的時間對象能夠清晰地反映時空模型中事件與狀態(tài)變化之間的因果關系;為了提高在事件、空間、屬性的查詢速率,在空間和屬性信息中可加入它們的事件對象標識,時間與空間信息是分離的[28]。
2.9 基于圖論的時空數(shù)據(jù)模型
尹章才[29]等基于圖論的時空數(shù)據(jù)模型研究顯式地表達與存儲時空實體與時空拓撲關系,避免了用快照序列進行數(shù)據(jù)的存儲與表達。圖論是一種研究具體事物間關系的抽象代數(shù),實現(xiàn)歷史數(shù)據(jù)與當前數(shù)據(jù)的分離,能夠描述在空間與時間上不連續(xù)變化的時空實體。數(shù)據(jù)結構簡易也有益于用戶對時間和空間數(shù)據(jù)的查詢與管理。
2.10 GSM數(shù)據(jù)模型
張恒才[30]等提出了GSM數(shù)據(jù)模型,實現(xiàn)了截取、擴展、投影和多維投影4種基礎操作,彌補了移動對象數(shù)據(jù)庫系統(tǒng)中地理空間及社交網(wǎng)絡數(shù)據(jù)管理的不足。該模型與PostgreSQL相比,穩(wěn)定性較高,在執(zhí)行效率方面,GSM模型操作符也要高于PostgreSQL實現(xiàn)方式,能夠有效防止關系數(shù)據(jù)庫中表鏈接造成的移動對象管理與查詢效率不高的問題。
通過對當前典型時空數(shù)據(jù)模型的歸納分析發(fā)現(xiàn),理論研究模型與實際應用還存在很大差距。典型表現(xiàn)就是理論研究的模型較多,而開發(fā)實現(xiàn)的應用原型較少;大部分數(shù)據(jù)模型只能表達某一時刻地理實體狀態(tài)的變化,卻不能描述與表達連續(xù)發(fā)生變化的地理實體,在森林火災和臺風預警方面欠缺時效性。因此,理論研究要與應用開發(fā)緊密結合才能取得更大的發(fā)展空間;通過結合已有數(shù)據(jù)模型,使其互補產生新的擴展模型;在解決實際問題的同時也要兼顧數(shù)據(jù)冗余等問題。
[1] 王勁峰,葛詠,李連發(fā),等.地理學時空數(shù)據(jù)分析方法[J].地理學報,2014(9)∶1 326-1 345
[2] 龔健雅,李小龍,吳華意.實時GIS時空數(shù)據(jù)模型[J].測繪學報,2014(3)∶226-232
[3] 王小兵,孫久運.地理信息系統(tǒng)綜述[J].地理空間信息, 2012,10(1)∶25-28
[4] 陳新保,朱建軍,陳建群.時空數(shù)據(jù)模型綜述[J].地理科學進展,2009(1)∶9-17
[5] 劉大有,陳慧靈,齊紅,等.時空數(shù)據(jù)挖掘研究進展[J].計算機研究與發(fā)展,2013(2)∶225-239
[6] 趙彬彬,李光強,鄧敏.時空數(shù)據(jù)挖掘綜述[J].測繪科學, 2010(2)∶62-65
[7] 薛存金,董慶.海洋時空過程數(shù)據(jù)模型及其原型系統(tǒng)構建研究[J].海洋通報,2012(6)∶667-674
[8] 王衛(wèi)民,葉秋菊,賀文麗,等.基于GIS的氣象時空數(shù)據(jù)挖掘和融合技術[J].電子科技,2014(2)∶130-133
[9] 陳捷,唐世渭,楊冬青,等.面向移動環(huán)境的時空數(shù)據(jù)挖掘研究現(xiàn)狀與展望[J].計算機工程與應用,2002(16)∶1-3
[10] 楊思吉.森林資源時空數(shù)據(jù)異步更新和回溯算法的研究[D].北京∶北京林業(yè)大學,2014
[11] 李德仁,王樹良,李德毅.空間數(shù)據(jù)挖掘理論與應用[M].第二版.北京∶科學出版社,2013
[12] 姜曉軼,周云軒.從空間到時間∶時空數(shù)據(jù)模型研究[J].吉林大學學報(地球科學版),2006(3)∶480-485
[13] 樊雅婷,楊建宇,朱德海.地籍管理中時空數(shù)據(jù)模型研究[J].測繪科學,2009(5)∶139-141
[14] 張保鋼,王潤生.時空復合數(shù)據(jù)庫模型及實現(xiàn)∶以規(guī)劃道路中線為例[J].測繪通報,2006(2)∶18-22
[15] 薛存金,謝炯.時空數(shù)據(jù)模型的研究現(xiàn)狀與展望[J].地理與地理信息科學,2010(1)∶1-6
[16] 佘江峰,馮學智,都金康.時空數(shù)據(jù)模型的研究進展評述[J].南京大學學報(自然科學版),2005(3)∶259-267
[17] 劉玉婷,李景文,傅瑋佳,等.基于Geodatabase的版本-對象時空數(shù)據(jù)組織方法[J].地理空間信息,2012,10(4)∶63-65
[18] 陳新保, LI Songnian,李黎,等.基于對象-事件-過程的時空數(shù)據(jù)模型及其應用[J].地理與地理信息科學,2013(3)∶10-16
[19] 沈敬偉,周廷剛,溫永寧,等.基于面向對象數(shù)據(jù)庫的空間數(shù)據(jù)管理[J].西南大學學報(自然科學版),2013(4)∶132-137
[20] 吳正升,胡艷,何志新.時空數(shù)據(jù)模型研究進展及其發(fā)展方向[J].測繪與空間地理信息,2009(6)∶15-17
[21] 胡繼華,程智鋒,詹承志,等.車輛監(jiān)控數(shù)據(jù)倉庫中時空立方體數(shù)據(jù)模型的設計與實現(xiàn)[J].武漢大學學報(信息科學版),2013(1)∶78-81
[22] 李婷,徐柱,盧彩霞,等.交通路況基態(tài)修正模型及其效率分析[J].地球信息科學學報,2012(6)∶712-718
[23] 齊慶超,曾永年,吳桂平,等.一種多基態(tài)修正時空數(shù)據(jù)模型改進的方法[J].測繪科學,2008(4)∶178-180
[24] 胡彥波,吳華瑞,朱華吉.農村土地調查時空數(shù)據(jù)模型構建及應用[J].江蘇農業(yè)科學,2014(9)∶387-391
[25] 尹章才,李霖.基于快照-增量的時空索引機制研究[J].測繪學報,2005(3)∶257-261
[26] 任家東,高偉,任東英.時空ER模型的設計[J].計算機工程,2003(12)∶77-79
[27] 唐九陽,陸昌輝,鄧蘇,等.ER模型與多維模型互相轉換的研究[J].計算機工程,2003(1)∶109-111
[28] 鄭扣根,余青怡,潘云鶴.基于事件對象的時空數(shù)據(jù)模型的擴展與實現(xiàn)[J].計算機工程與應用,2001(3)∶45-47
[29] 尹章才,李霖,艾自興.基于圖論的時空數(shù)據(jù)模型研究[J].測繪學報,2003(2)∶168-172
[30] 張恒才,陸鋒,陳潔.移動對象時空軌跡及社交關系一體化數(shù)據(jù)模型[J].武漢大學學報(信息科學版),2014(6)∶711-718
P208
B
1672-4623(2016)09-0029-03
10.3969/j.issn.1672-4623.2016.09.009目前對時空數(shù)據(jù)分析理論方法的研究日益增多,
王洋洋,碩士研究生,研究方向為時空數(shù)據(jù)挖掘,嵌入式。
2015-11-16。
項目來源:2014年庫爾勒科技合作資助項目(KRLKJHZXM);新疆維吾爾自治區(qū)研究生科研創(chuàng)新資助項目(XJGRI2015087)。(*為通訊作者,博士)