張江水,華一新,李 翔
(信息工程大學 地理空間信息學院,河南 鄭州 450001)
全空間信息系統(tǒng)是一種面向從微觀到宏觀的動態(tài)復雜世界的空間信息系統(tǒng)[1-3],主要解決現(xiàn)實世界中各類時空實體信息的接入、處理、描述、表達、管理、分析和應用等問題。與傳統(tǒng)的GIS相比,全空間信息系統(tǒng)主要具有全尺度、全類型、全動態(tài)、全屬性等特征[3]。它將研究的空間范疇拓展到了微觀和宏觀空間,描述的實體拓展到了各種有形和無形的實體,對實體的時空位置、性質(zhì)、關(guān)系、行為、認知特征進行全方位描述,并且所有特征的描述都是動態(tài)的。
為了能夠在全空間信息系統(tǒng)中更好地描述復雜的現(xiàn)實世界,文獻[3]提出了將多粒度時空對象數(shù)據(jù)模型作為全空間信息系統(tǒng)的基本模型,并建立了多粒度時空對象數(shù)據(jù)模型的描述框架,如圖1所示。
圖1 多粒度時空對象模型框架圖Fig.1 Description frame of spatio-temporal object model of multi-granularity
多粒度時空對象數(shù)據(jù)模型通過對模型框架中8個特征的描述,來實現(xiàn)對多粒度時空實體[2]的多粒度、多類型、多形態(tài)、多參照、多元關(guān)聯(lián)、多維動態(tài)、多能自主等特點的表達[3]。但是現(xiàn)實世界是無限復雜的,沒有任何信息系統(tǒng)可以對現(xiàn)實世界進行完全的描述和表達,必須對現(xiàn)實世界進行一定的化簡和抽象,從而最終得到所需的多粒度時空對象模型。這一化簡和抽象的過程即為多粒度時空對象建模[4]。
多粒度時空對象數(shù)據(jù)模型是全空間信息系統(tǒng)的核心,它決定了全空間信息系統(tǒng)的能力和功能。首先與傳統(tǒng)GIS的數(shù)據(jù)模型相比,多粒度時空對象數(shù)據(jù)模型具有多元、多粒度、多維度、多時態(tài)、多形態(tài)等特征。因此,全空間信息系統(tǒng)在構(gòu)建與之相適應的存取、檢索、管理等功能體系的同時,還需要兼顧對象關(guān)聯(lián)關(guān)系的維護、信息傳播管理、行為控制機制等傳統(tǒng)GIS很少涉足的領(lǐng)域;其次,圍繞多粒度時空對象數(shù)據(jù)模型特征的提取、應用、分析,全空間信息系統(tǒng)需要構(gòu)建一套新的時空計算與分析體系。最后,多粒度時空對象數(shù)據(jù)模型中很多特征的可視化都超出了傳統(tǒng)GIS研究的領(lǐng)域,全空間信息系統(tǒng)需要圍繞這些特征構(gòu)建新的多模態(tài)時空對象的可視化體系。
多粒度時空對象數(shù)據(jù)模型構(gòu)建的好壞將直接決定全空間信息系統(tǒng)解決實際問題的能力。全空間信息系統(tǒng)將研究范疇拓展到了微觀空間和宏觀空間現(xiàn)實世界,但是現(xiàn)實世界是無限豐富和復雜的,不可能在全空間信息系統(tǒng)中對現(xiàn)實世界進行完全的復制。全空間信息系統(tǒng)只能圍繞多粒度時空對象數(shù)據(jù)模型所能表達的特征進行相應的分析、處理和應用。因此,多粒度時空對象數(shù)據(jù)模型是否能夠真實、客觀、全面地對現(xiàn)實世界及其內(nèi)在規(guī)律進行抽象和表達,是全空間信息系統(tǒng)解決現(xiàn)實問題的關(guān)鍵。
建模即建立模型,是為了理解事物而對事物做出的一種抽象。多粒度時空對象建模就是為了實現(xiàn)對現(xiàn)實世界的抽象,建模者根據(jù)認知結(jié)果,將現(xiàn)實世界中的實體依照多粒度時空對象數(shù)據(jù)模型框架描述為數(shù)據(jù)模型的過程。因此多粒度時空對象建模從過程上講主要包括3個部分,即對現(xiàn)實世界的認知、認知結(jié)果的邏輯化和形成模型數(shù)據(jù)。建模的基本過程如圖2所示。
圖2 多粒度時空對象建?;具^程圖Fig.2 The modeling process of spatio-temporal object of multi-granularity
1)對客觀實體的認知與抽象
對客觀實體進行深入的研究是進行多粒度時空對象建模的起點。傳統(tǒng)GIS中的數(shù)據(jù)模型主要以描述現(xiàn)實世界的空間特征為主[5-6],這些特征大多是一些表面特征,認知難度不大。在多粒度時空對象建模中,除了要了解客觀實體的位置、形態(tài)等空間特征,還需要對關(guān)聯(lián)關(guān)系、組成結(jié)構(gòu)、行為、認知等內(nèi)在特征進行描述和建模。這就需要對建模對象進行更加深入和全面的分析與研究。
對客觀實體進行描述的各種已有數(shù)據(jù)是進行認知的基礎(chǔ)。這些數(shù)據(jù)從不同側(cè)面描述了客觀實體的主要特征。其中,大部分數(shù)據(jù)是傳統(tǒng)行業(yè)對客觀實體建模成果的歷史積累,比如傳統(tǒng)的GIS數(shù)據(jù)、地理實體數(shù)據(jù)等;也有一部分是對實體的直接描述,比如各種歷史的和實時的觀測數(shù)據(jù);還有一部分是前人對客觀實體特征的認知結(jié)果,比如通過時空大數(shù)據(jù)挖掘獲取的實體特征,以及通過建模者的觀察與交互所產(chǎn)生的數(shù)據(jù)等。
多粒度時空數(shù)據(jù)模型框架是進行認知與抽象的目標。對客觀實體的認知可以是多方面的,但是在多粒度時空對象建模過程中,應重點研究數(shù)據(jù)模型框架所規(guī)定的8個方面的特征,通過對這些特征的深入了解來構(gòu)建對客觀實體的認知體系。
2)多粒度時空對象數(shù)據(jù)模型的邏輯化
多粒度時空對象數(shù)據(jù)模型邏輯化的主要任務(wù)是將前期認知的成果,按照對象的方式進行組織和描述。其主要工作包括建立多粒度時空對象數(shù)據(jù)模型的邏輯結(jié)構(gòu)和描述方法,確定多粒度時空對象特征的規(guī)范化表達以及將認知結(jié)果按照相應的規(guī)范組織成與客觀實體相對應的多粒度時空對象數(shù)據(jù)模型。
3)生成多粒度時空對象數(shù)據(jù)
多粒度時空對象建模的最終成果是以數(shù)據(jù)形式保存的模型數(shù)據(jù)[7]。其成果形式主要分為兩類,一類是多粒度時空對象交換數(shù)據(jù),主要用于模型數(shù)據(jù)的生產(chǎn)與交流,對數(shù)據(jù)的定義更加接近于多粒度時空對象數(shù)據(jù)模型,便于人們對數(shù)據(jù)的解析與理解。另一類是全空間信息系統(tǒng)數(shù)據(jù)庫數(shù)據(jù),主要解決多粒度時空對象模型8個方面特征數(shù)據(jù)的高效存儲、更新、檢索等一系列問題。
1)兩者在建模理念上有著本質(zhì)的區(qū)別
傳統(tǒng)GIS來源于地圖,其建模理念也主要參照了地圖的建模方法,即從便于使用者空間認知的角度出發(fā),將地理實體抽象為易于圖形化表達的要素,大部分GIS軟件中的數(shù)據(jù)模型都是以此為核心擴展而來[8]。而多粒度時空對象建模則更加側(cè)重描述客觀實體本身,希望通過建模盡可能客觀的還原對象本身固有的特征,實現(xiàn)對客觀實體全方位的描述。
2)傳統(tǒng)GIS的建模過程是割裂的
比如傳統(tǒng)GIS中通常根據(jù)研究領(lǐng)域空間尺度的不同,會依次建立相應比例尺的數(shù)據(jù)模型,而不同比例之間描述的地理實體都是相互獨立的[9-11]。即使在同一比例尺下,不同種類的地理實體也會人為地分割在不同的圖層中,需要通過疊加分析等手段才能重新建立不同圖層要素之間的聯(lián)系。而多粒度時空對象建模是以對象為核心,不同的時空尺度下的數(shù)據(jù)只是同一對象特征描述。同時多粒度時空對象之間還存在著語義粒度上的關(guān)聯(lián),一個對象可以是更小粒度下子對象的組合體,也可以通過與其他對象組合,構(gòu)成更高粒度的對象。另外,創(chuàng)建對象之間的關(guān)聯(lián)關(guān)系也是多粒度時空對象建模的重要任務(wù)之一。在建模過程中,通過建模對象之間的關(guān)聯(lián)關(guān)系,從而形成多粒度時空對象復雜的關(guān)系網(wǎng)絡(luò)。
3)傳統(tǒng)GIS是一種靜態(tài)建模
傳統(tǒng)GIS的建模側(cè)重于對地理實體某一時刻靜態(tài)特征的描述[12]。即使在時空GIS中,也通常是對地理實體的位置、形態(tài)和屬性狀態(tài)變化過程的記錄。多粒度時空對象模型本質(zhì)上是一種動態(tài)模型,需要對客觀實體所有特征的變化進行建模。在建模的過程中,不僅需要記錄客觀實體的歷史變化信息,同時需要盡可能將觀測到的實體實時狀態(tài)數(shù)據(jù)鏈路建模到模型對象中,從而保證建模對象能夠動態(tài)地與現(xiàn)實世界保持一致。為了保持對象模型的動態(tài)特征,除了引入實時數(shù)據(jù)鏈路以外,還需要對客觀實體的行為與認知進行建模,使得對象模型能夠根據(jù)外部環(huán)境的變化進行自主動態(tài)的更新。
1)確定多粒度時空對象存儲模型與交換格式
多粒度時空對象建模的最終目標是將客觀實體以數(shù)據(jù)的方式進行描述,因此,確定描述對象模型的數(shù)據(jù)項、數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)格式等是多粒度時空對象建模首先需要解決的問題。多粒度時空對象的交換格式是采用便于人們理解的文件形式從結(jié)構(gòu)上對多粒度時空對象數(shù)據(jù)進行描述,它重點解決多粒度時空對象特征到數(shù)據(jù)項的映射以及基于數(shù)據(jù)的多粒度時空對象的共享與傳播。存儲模型是一種面向多粒度時空對象數(shù)據(jù)高效存儲管理與檢索的數(shù)據(jù)模型,它的重點是解決如何能夠高效地使用當前主流的數(shù)據(jù)庫技術(shù),實現(xiàn)多粒度時空對象的管理工作。交換格式是完成多粒度時空對象從概念模型向數(shù)據(jù)模型轉(zhuǎn)換的一個重要成果,而存儲模型通常會在交換格式的基礎(chǔ)上,針對數(shù)據(jù)存儲與訪問對數(shù)據(jù)進行優(yōu)化,形成更底層的物理數(shù)據(jù)模型。
2)建立多粒度時空對象建模規(guī)范和對象類模板庫
與傳統(tǒng)的GIS數(shù)據(jù)模型相比,多粒度時空對象數(shù)據(jù)模型更加復雜,建模的工作量也更大。比如它在時間、空間和語義上是多粒度的;它是一種動態(tài)模型,除了需要記錄對象的歷史生存軌跡以外還需要保持對象與現(xiàn)實世界的同步與更新;它是一種關(guān)聯(lián)模型,需要記錄不同對象之間的關(guān)聯(lián)關(guān)系,并能夠動態(tài)地維護這些關(guān)聯(lián)關(guān)系;它是一種智能化的模型,對象具有自己的行為和認知能力,能夠根據(jù)環(huán)境變量的改變通過認知和行為對對象特征進行調(diào)整。面對無限復雜和豐富的現(xiàn)實世界,我們無法為每一個客觀實體構(gòu)建相應的多粒度時空對象模型,因此,對模型構(gòu)建過程的規(guī)律進行總結(jié),形成與多種客觀實體類別相對應的建模規(guī)范或者相應的對象類模板庫,實現(xiàn)基于建模規(guī)范與類模板庫的自動化或半自動化的建模,是多粒度時空對象建模需要解決的一個主要問題。
3)開發(fā)多粒度時空對象建模工具
由于多粒度時空對象數(shù)據(jù)模型具有形態(tài)、行為、認知等多維特征,模型中這些特征的構(gòu)建需要進行大量復雜的工作。現(xiàn)存的各種數(shù)據(jù)源通常只能有限地描述模型特征的個別方面,通過對現(xiàn)有數(shù)據(jù)的自動化轉(zhuǎn)換通常只能生成數(shù)據(jù)模型的部分特征。而大量的模型特征需要通過一個功能強大的工具軟件由建模者以交互的方式進行指定和生成。另外,在建模的過程中會形成大量的建模規(guī)范和對象類模板,這些對象類模板和建模規(guī)范的生成、編輯和管理同樣需要相應的工具軟件來實現(xiàn)。使用建模規(guī)范和對象類模板,在大量的原始數(shù)據(jù)中抽象并形成模型的特征數(shù)據(jù)也是多粒度時空對象建模的一種重要方法,而對源數(shù)據(jù)的抽象、組合與計算同樣需要一個統(tǒng)一的工具軟件來實現(xiàn)。因此,開發(fā)一個功能強大的建模工具軟件是進行多粒度時空對象建模的關(guān)鍵問題。
多粒度時空對象建模的主要工作就是將對客觀實體的認知數(shù)據(jù)轉(zhuǎn)換為多粒度時空對象模型數(shù)據(jù)。這些數(shù)據(jù)包括各種現(xiàn)有的觀測數(shù)據(jù)和地理空間數(shù)據(jù),各種動態(tài)實時獲取的數(shù)據(jù)、各種建模者的主觀認知以及對這些認知進行總結(jié)和歸納的數(shù)據(jù),各種積累的時空大數(shù)據(jù)等。按照建模的數(shù)據(jù)源不同,可以將多粒度時空對象的建模方法歸納為以下5種,如圖3所示。
圖3 多粒度時空對象建模方法Fig.3 The modeling methods of spatio-temporal object of multi-granularity
經(jīng)過多年的發(fā)展和積累,目前已經(jīng)存在了海量的地理實體描述數(shù)據(jù)。因此,基于現(xiàn)有地理空間數(shù)據(jù)構(gòu)建多粒度時空對象數(shù)據(jù)模型是多粒度時空對象建模的重要內(nèi)容?,F(xiàn)有的地理空間數(shù)據(jù)內(nèi)容豐富,數(shù)據(jù)量大,但是面向多粒度時空對象建模也存在大量的問題。一方面,現(xiàn)有的地理空間數(shù)據(jù)大都是在相對固定的認知模式和建模要求下產(chǎn)生的,雖然數(shù)據(jù)量大,但大多是描述特定類別地理實體的位置、屬性、形態(tài)等特定特征;另一方面,現(xiàn)有的地理空間數(shù)據(jù)大都存在空間尺度割裂,實體間關(guān)聯(lián)描述少、沒有行為、認知、組成結(jié)構(gòu)等特征問題?;诂F(xiàn)有地理空間數(shù)據(jù)的建模主要分為3個過程:首先,通過數(shù)據(jù)處理與解析,將數(shù)據(jù)按照多粒度時空對象邏輯模型的要求進行數(shù)據(jù)結(jié)構(gòu)的重組,映射為初步的對象數(shù)據(jù);其次,根據(jù)應用需求按照多粒度時空對象模板對初步的對象及其特征項進行分解與信息重組,形成滿足建模要求的多粒度時空對象集合;最后在通過接入實時數(shù)據(jù)源、引進時空大數(shù)據(jù)挖掘以及可視化交互編輯的方式補充和完善模型的各個特征。
雖然現(xiàn)實中每個客觀實體都有各自獨特的特征,但是在進行多粒度時空對象數(shù)據(jù)模型的抽象過程中,仍然存在大量相同或者相似的規(guī)律。比如具有相同的形態(tài)特征、相近的行為模式、相似的組成結(jié)構(gòu)和屬性結(jié)構(gòu)等。對建模過程中相似的抽象規(guī)律進行總結(jié)就能夠形成該領(lǐng)域內(nèi)的建模規(guī)范。在建模規(guī)范的約束下,能夠?qū)ο鄳I(lǐng)域內(nèi)的客觀實體進行自動化或半自動化的快速建模。另一方面,也可以將具有大量相似特征的多粒度時空對象抽象為一個對象類模板。在進行多粒度時空對象建模時,對象的大部分特征都可以繼承自對象類模板,只需為對象獨有的特征賦值就能夠完成建模工作?;趯ο箢惸0搴徒R?guī)范的建模方法的核心就是對象類模板和建模規(guī)范的創(chuàng)建。圖4描述了對象類模板的創(chuàng)建過程:
圖4 對象類模板的創(chuàng)建過程Fig.4 The creating process of object class templates
在對象類模板池中記錄了所有已經(jīng)建成的對象類模板,通過對現(xiàn)有類模板的引用、繼承、組合和關(guān)聯(lián)可以形成面向具體業(yè)務(wù)的新的對象類模板,新生成的類模板同時也可以加入到模板池中,豐富對象類模板池的內(nèi)容。
可視化交互建模是在多粒度時空對象可視化的基礎(chǔ)上,通過交互的方式實現(xiàn)對其8個主要特征的交互式增加、編輯和修改。可視化交互建??梢灾苯由梢粋€多粒度時空對象,也可以對已經(jīng)生成的對象進行編輯和修改。可視化交互建模需要提供的功能包括:創(chuàng)建具體的時空參照并將其指定給多粒度時空對象;創(chuàng)建對象的屬性、位置、形態(tài)特征,指定對象屬性、位置、形態(tài)的數(shù)據(jù)源或?qū)@些特征進行交互式編輯;指定對象之間的關(guān)聯(lián)關(guān)系或者提供關(guān)聯(lián)關(guān)系生成的方法;指定對象的組成結(jié)構(gòu),提供對象進行組合與分解的方法;提供對象行為與認知特征的構(gòu)造方法,為對象創(chuàng)建具體的行為與認知特征,并能夠?qū)ζ溥M行編輯、修改和預覽。
動態(tài)實時數(shù)據(jù)主要包括各種類型傳感器采集的實時數(shù)據(jù)流以及業(yè)務(wù)系統(tǒng)收集、計算、分析所產(chǎn)生的一些實時數(shù)據(jù)。這些數(shù)據(jù)通常不能滿足構(gòu)建多粒度時空對象數(shù)據(jù)模型所有特征的條件。但是它們能夠及時更新數(shù)據(jù)模型中相應的特征值,是多粒度時空對象與現(xiàn)實世界同步的重要手段,是維持對象模型動態(tài)特征的主要數(shù)據(jù)源,是多粒度時空對象建模重要的補充。
通過動態(tài)實時數(shù)據(jù)源更新多粒度時空對象特征的過程如圖5所示。
圖5 通過動態(tài)實時數(shù)據(jù)源更新多粒度時空對象特征的流程Fig.5 The process of updating characteristics of spatio-temporal objects of multi-granularity through dynamic real-time data
實時數(shù)據(jù)流的接入可以通過業(yè)務(wù)部門的業(yè)務(wù)端協(xié)議轉(zhuǎn)換或者全空間信息系統(tǒng)端協(xié)議適配擴展的方式實現(xiàn),這里的協(xié)議主要是通信協(xié)議或者數(shù)據(jù)格式。數(shù)據(jù)流由業(yè)務(wù)部門主動推送、設(shè)施接入模塊主動輪詢獲取和通過監(jiān)聽數(shù)據(jù)存儲目錄等3種方式來獲取。獲取到的實時動態(tài)數(shù)據(jù)最終經(jīng)過協(xié)議適配轉(zhuǎn)換為標準化對象數(shù)據(jù)流,用于對象特征的更新。在進行多粒度時空對象建模的過程中,需要指定實時數(shù)據(jù)的獲取方式、協(xié)議適配方式以及標準化對象數(shù)據(jù)流對對象特征進行更新的具體方法。
當前是一個數(shù)據(jù)爆發(fā)的時代,寬帶化、移動互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、智能終端的普及與人工智能的興起,促使全球數(shù)據(jù)每兩年翻一番。時空大數(shù)據(jù)是其中大量的與時空位置有關(guān)的數(shù)據(jù)的統(tǒng)稱,是最重要的大數(shù)據(jù)之一。時空大數(shù)據(jù)除了具有一般大數(shù)據(jù)的特性外,還具有與對象行為對應的多源異構(gòu)和復雜性,與事件對應的時、空、尺度、對象動態(tài)演化、對事件的感知和預測特性[13]。對時空大數(shù)據(jù)的挖掘,能夠獲取客觀實體大量不易被認知和發(fā)現(xiàn)的重要特征,如隱含的屬性、行為、認知、關(guān)聯(lián)等。基于時空大數(shù)據(jù)挖掘的多粒度時空對象建模,主要是在構(gòu)建好的多粒度時空對象數(shù)據(jù)模型基礎(chǔ)上,通過時空大數(shù)據(jù)挖掘來更新和豐富數(shù)據(jù)模型的特征內(nèi)容。
多粒度時空對象數(shù)據(jù)模型是構(gòu)建全空間信息系統(tǒng)的核心和關(guān)鍵,多粒度時空對象建模的主要工作是將客觀實體按照多粒度時空對象模型框架的要求描述為相應的數(shù)據(jù)模型。由于多粒度時空對象模型具有多粒度、多類型、多形態(tài)、多參照、多元關(guān)聯(lián)、多維動態(tài)、多能自主等特點,為模型的構(gòu)建工作帶來了許多全新的挑戰(zhàn)。本文梳理了多粒度時空對象建模的基本內(nèi)容和基本方法,分析了建模過程中的主要問題,為全空間信息系統(tǒng)和多粒度時空對象建模工具研發(fā)工作的開展奠定了基礎(chǔ)。