王育紅,馮 鋒,左雨芳,孫 冉
(江蘇師范大學 地理測繪與城鄉(xiāng)規(guī)劃學院,江蘇 徐州 221116)
近年來,空間數(shù)據(jù)快速獲取與更新手段不斷豐富、大容量存儲技術日益成熟、高性能計算設備逐漸普及,各類空間數(shù)據(jù)及其關聯(lián)數(shù)據(jù)正以前所未有的速度急劇增長和持續(xù)積累,時空數(shù)據(jù)規(guī)模越來越龐大。這些新的發(fā)展成就,為充分考慮空間數(shù)據(jù)的時間特征,深入開展時空數(shù)據(jù)組織管理[1]、挖掘分析[2]、可視化[3]等方面的理論研究與應用實踐,有效促進知識決策服務型動態(tài)GIS的設計與實現(xiàn),奠定提供了堅實基礎與良好契機。
1987年,美國國家基金會圖形圖像專題討論組提出并闡述“科學計算可視化”(Visuali-zation in Scientific Computing,ViSC)概念,一般將其看作可視化科學與技術被系統(tǒng)研究的開端。該概念后來被簡化為“科學可視化”,甚至是“可視化”[4]。可視化的本意是“使之可見”,其根本目標是把由實驗或數(shù)值計算獲得的大量數(shù)據(jù)轉變成人的視覺可以感知的計算機圖形圖像,以幫助人們直接理解現(xiàn)象、發(fā)現(xiàn)規(guī)律和傳播知識。隨著研究的深入,目前可視化已建立形成了由科學可視化、數(shù)據(jù)可視化、信息可視化、知識可視化、可視化分析等分支組成的復雜技術體系。這些技術及應用之間又存在著區(qū)別、交叉和聯(lián)系[5-6]。
作為可視化研究與應用的一個重要組成分支,GIS時空數(shù)據(jù)可視化的基本形式是地圖。盡管地圖制圖相對于可視化是一門非常古老的學科,但將可視化理論與技術融入地圖制圖和GIS卻可為其注入新的動力,帶來根本性變革,該工作始于20世紀90年代初[7-8]。時空數(shù)據(jù)可視化技術的核心是為使用者提供直觀的、可交互的空間信息可視化環(huán)境,它已遠遠超出了傳統(tǒng)的符號化及視覺變量表示法的水平,而進入可交互地圖條件下的探索視覺效果和提高視覺功能的階段。經(jīng)過近三十年的不懈努力,時空數(shù)據(jù)可視化在理論模型、技術方法、開發(fā)類庫、軟件平臺等方面積累了許多有益成果,目前已呈現(xiàn)出并行化、多樣化、多維動態(tài)化的總體研究與應用趨勢[8-12]。
為克服傳統(tǒng)靜態(tài)GIS的不足,避免從底層編碼實現(xiàn)相應技術的困難,結合當前發(fā)展趨勢,本文選擇2020年10月發(fā)布的最新國產(chǎn)高性能GIS桌面軟件——GeoScene Pro 2.0(簡稱GeoScene),以曾廣為關注的湖北省新冠疫情數(shù)據(jù)為例,在設計建立時空數(shù)據(jù)庫的基礎上,詳細討論空間二維、三維環(huán)境下的動態(tài)可視化方法及相關技術細節(jié),以期為同類可視化問題提供高效、實用的解決方案與技術參考。
簡單地講,時空數(shù)據(jù)就是具有時間元素并隨時間變化而變化的空間數(shù)據(jù)。時空數(shù)據(jù)涉及各式各樣的數(shù)據(jù),不僅具有明顯的空間分布和屬性語義特征,而且具有數(shù)據(jù)量龐大、非線性以及時變等特點。根據(jù)變化的內容,可將時空數(shù)據(jù)分為3大類:僅空間變化的時空數(shù)據(jù)、僅屬性變化的時空數(shù)據(jù)以及空間屬性同時變化的時空數(shù)據(jù)。
無論哪種類型的時空數(shù)據(jù),GeoSence都以要素類(空間關系表)的形式加以組織管理,通過不同類型的字段來分別記錄實體現(xiàn)象的空間、屬性和時間數(shù)據(jù)。其中,時間/時戳數(shù)據(jù)有“單字段”和“雙字段”兩種記錄方式。“單字段”僅用來表示現(xiàn)象實體發(fā)生變化或者被觀測采集的時間,一般適用于變化或觀測周期相對固定的情況,如每隔3 h、1 d等;“雙字段”則分別用來表示現(xiàn)象實體發(fā)生變化或者被觀測采集的“開始”和“結束”時間,一般適用于現(xiàn)象實體持續(xù)存在時間或觀測周期不統(tǒng)一的情況。
文中所采用的湖北省新冠疫情時空數(shù)據(jù)屬于僅屬性變化的時空數(shù)據(jù),分別使用面狀和點狀兩個要素類加以管理。除了描述行政區(qū)空間特征的幾何形式不同之外,這兩個要素類并無其他不同。二者都以“單字段”方式記錄湖北省17個省轄市區(qū),從2020-01-23—2020-03-23,每天的新增病例、新增出院、新增死亡數(shù)據(jù)。表1給出了面狀要素類組織管理新冠疫情時空數(shù)據(jù)的基本結構與形式。
表1 新冠疫情時空數(shù)據(jù)基本結構和形式
上述時空數(shù)據(jù)的生成主要依據(jù)兩種來源的原始數(shù)據(jù)。一是來源于湖北省衛(wèi)健委在疫情期間每日發(fā)布的新冠疫情數(shù)據(jù);二是從中科院資源環(huán)境科學與數(shù)據(jù)中心獲得的中國地市行政邊界數(shù)據(jù)。圖1給出了對這些數(shù)據(jù)進行處理派生形成所需時空數(shù)據(jù)以及后續(xù)可視化的基本過程,本節(jié)主要討論處理生成環(huán)節(jié)。
圖1 湖北新冠疫情時空數(shù)據(jù)處理生成與可視化基本過程
1)每日新冠疫情數(shù)據(jù)的處理生成。在湖北省衛(wèi)健委官網(wǎng),按時間先后依次打開每日發(fā)布的新冠疫情情況網(wǎng)頁,從中解析提取17個省轄市區(qū)的新增病例、新增出院、新增死亡的數(shù)據(jù)。為提高輸入?yún)R總的效率,將所得數(shù)據(jù)按如表2所示形式記錄在Excel工作表中。在所需數(shù)據(jù)匯總結束后,使用Excel軟件對所得工作表的“武漢市”“黃石市”等17個數(shù)據(jù)列進行逆透視,然后再對包含3個疫情數(shù)據(jù)的數(shù)據(jù)列進行拆分,然后按表1所示內容重新命名所得工作表的相應字段,最后將該工作表導入到基于GeoDatabase[13]的疫情時空數(shù)據(jù)庫中。
表2 基于列的新冠疫情數(shù)據(jù)非結構化匯總表
2)行政區(qū)劃空間數(shù)據(jù)的處理生成。從所獲得的中國地市行政區(qū)劃空間數(shù)據(jù)Shape文件中,選擇提取湖北省轄的17個面狀行政區(qū)要素,并核對修改每個要素的名稱、代碼等數(shù)據(jù),使其與表1、表2相應內容保持一致。為滿足后期時空立方體可視化的要求,使用GeoScene自帶的“投影”工具,將該數(shù)據(jù)集所采用的CGS2000經(jīng)緯度地理坐標轉換為高斯投影平面坐標。最后,使用GeoScene自帶的“要素轉點”工具,以面狀行政區(qū)要素類為輸入,生成包含17個面狀要素對應中心點的要素類。
3)新冠疫情時空數(shù)據(jù)的處理生成。首先,使用GeoScene自帶的“添加連接”工具,通過共同的“政區(qū)名稱”字段,向“省轄行政區(qū)點要素”連接追加“新冠疫情屬性表”中的不同行政區(qū)隨時間變化的疫情數(shù)據(jù);然后,將這一需要動態(tài)連接擴展的臨時性數(shù)據(jù),導入到疫情時空數(shù)據(jù)庫,生成永久性“新冠疫情點狀時空數(shù)據(jù)”,以提高后期可視化的處理效率。接著,再按照類似過程生成“新冠疫情面狀時空數(shù)據(jù)”。
目前,GeoScene支持在多個視圖窗口環(huán)境中,以不同形式同時展示呈現(xiàn)時空數(shù)據(jù)所包含的全部或部分信息。例如,在某一時段內或某一時刻點上的某些要素的空間或屬性信息,等等。這些可視化可概括為地圖、場景、屬性表和統(tǒng)計圖4種主要形式。其中,地圖和場景分別以二維平面圖形和三維立體圖形的形式來展示要素的空間位置形狀及相應屬性信息;屬性表和統(tǒng)計圖則以二維表格文字和幾何圖形的形式來展示要素的屬性信息。
地圖是GeoScene最便捷的可視化方式,只需將包含時空或空間數(shù)據(jù)的要素類拖拽到地圖窗口,系統(tǒng)便會自動創(chuàng)建相應圖層對其加以展示。1幅地圖通常包含多個圖層。圖層是空間數(shù)據(jù)內容的圖形化展示與呈現(xiàn),它通過符號和標注來表達數(shù)據(jù)的特征和差異,同一內容的空間數(shù)據(jù)可以表示為不同形式的圖層,正所謂“內容與形式相分離”。在加載創(chuàng)建圖層后,一般需要調整設置圖層符號和標注的類型、大小、顏色、參考字段等屬性,以使其表達更明確、更豐富、更美觀。
針對數(shù)據(jù)記錄多、數(shù)值差別大的湖北省新冠疫情時空數(shù)據(jù),可采用GeoScene提供的分級色彩、分級符號、比例符號、點密度、統(tǒng)計圖表等方式來符號化相應圖層(見圖2),從而派生形成不同類型的疫情地圖與可視化效果。為避免因行政區(qū)空間位置形狀未變化造成的信息遮擋和冗余混亂,這些地圖僅選擇使用了2020-02-10的面狀疫情空間數(shù)據(jù)。
圖2 新冠疫情時空數(shù)據(jù)地圖可視化示例
場景也被稱為3D地圖。場景中既可以包含2D平面要素圖層,也可以包含具有高程(度)信息的真3D立體要素圖層。在默認情況下,文中所用疫情時空數(shù)據(jù)在場景中最初顯示為2D圖層,可通過3D符號化、按屬性拉伸、生成時空立方體三種方式將其轉化為3D圖層。圖3分別給出了點狀疫情數(shù)據(jù)采用上述方式在場景中的三維可視化表達效果。
圖3 新冠疫情時空數(shù)據(jù)場景可視化示例
其中,前兩幅圖只選擇使用了2020-02-10的點狀疫情數(shù)據(jù);后一幅圖所用數(shù)據(jù)則是使用“通過以定義位置創(chuàng)建時空立方體”工具,在再次連接行政區(qū)中心點與全部疫情點狀時空數(shù)據(jù)的基礎上,以5 d為間隔聚合統(tǒng)計生成的新增病例真三維時空立方體數(shù)據(jù)。該數(shù)據(jù)以netCDF[14-15]格式存儲,需要使用專門的處理工具將其轉換為3D要素圖層,才可以將其顯示在場景中。
屬性表是最接近時空數(shù)據(jù)原始邏輯組織結構的一種可視化形式。它以平面二維表的形式逐行展示時空數(shù)據(jù)所包含的要素記錄及相關屬性。如果需要,可以關閉隱藏屬性表相關屬性字段的顯示,也可以按圖層中所設置的時間起止范圍、屬性取值范圍、地圖窗口范圍等條件來過濾顯示僅在相應范圍內的要素記錄。
統(tǒng)計圖又稱統(tǒng)計圖表,是利用點、線、面、體等幾何圖形,表示數(shù)據(jù)間對比、結構、依存、分布等不同關系及其變動情況的各種工具的統(tǒng)稱。針對表格型數(shù)據(jù),目前GeoScene共提供了條形圖、散點圖、散點圖矩陣、直方圖、箱形圖、QQ(分位數(shù))圖、折線圖、剖面圖、數(shù)據(jù)時鐘、日歷熱點圖等10種類型的圖形可視化表達形式。其中,數(shù)據(jù)時鐘、日歷熱點圖則主要用來表達一般時態(tài)表格數(shù)據(jù)或矢量時空表格數(shù)據(jù)在整個或其中某一時段內的發(fā)生情況和變化趨勢。圖4分別給出了利用數(shù)據(jù)時鐘、日歷熱點圖對湖北省每日新增新冠病例匯總統(tǒng)計的可視化表達效果圖。
圖4 新冠疫情時空數(shù)據(jù)統(tǒng)計圖表可視化示例
與靜態(tài)可視化相比,動態(tài)可視化不僅可以豐富數(shù)據(jù)的表達維度,而且可以分析挖掘事物現(xiàn)象的時空格局、演化規(guī)律,甚至模擬預測其變化過程與發(fā)展趨勢。動態(tài)可視化的實質是從復雜的輸入數(shù)據(jù)中生成連續(xù)的動態(tài)圖像。目前,空間數(shù)據(jù)動態(tài)可視化一般采用動態(tài)地圖來實現(xiàn),其表達對象和目標可概況為兩種基本情景:一是通過“意動”符號增強靜態(tài)空間數(shù)據(jù)可視化的動態(tài)視覺效果與感受;二是基于“時戳”信息從時空數(shù)據(jù)集中動態(tài)提取并展示不同時刻或時段內的數(shù)據(jù)記錄,以刻畫模擬地理要素空間或屬性特征隨時間推移發(fā)生運動變化的過程[16]。
作為新一代GIS軟件平臺,GeoScene動態(tài)可視化能力大幅改善和提升,可通過時間滑塊、動畫視頻兩種方式,在地圖、場景、表格、統(tǒng)計圖表4種不同的視圖窗口中動態(tài)展示瀏覽、追蹤回放時空數(shù)據(jù)。
時間滑塊是GeoScene軟件系統(tǒng)的一個功能組件,可用來從時空數(shù)據(jù)集中動態(tài)提取、展示播放指定時段的數(shù)據(jù)記錄。如果要使用時間滑塊,必須先在地圖或場景中設置啟用引用空間數(shù)據(jù)集的對應圖層的時間屬性,并指定時間值的存儲方式及具體字段。當圖層啟用時間之后,時間滑塊會自動出現(xiàn)在包含該時態(tài)圖層的地圖或場景窗口中,系統(tǒng)主界面也會增加“時間”功能選項卡。
在“時間”功能選項卡中,可進一步設置時態(tài)圖層動態(tài)可視化的“開始結束”時間、跨度(時間窗大小)、播放速度等參數(shù),以幫助用戶獲得最佳的可視化效果。在利用時間滑塊進行動態(tài)回放過程中,如果打開了時態(tài)圖層的屬性表或基于該圖層創(chuàng)建的統(tǒng)計圖表,則屬性表或統(tǒng)計圖表的顯示內容將隨著地圖或場景顯示內容的變化而變化?;跁r間滑塊實現(xiàn)動態(tài)可視化的基本原理如圖5所示。
圖5 基于時間滑塊的動態(tài)可視化基本實現(xiàn)原理
作為重要的多媒體技術和表現(xiàn)形式,動畫和視頻具有很深的淵源。由于二者都是利用視覺延遲原理,沿時間軸依次更換顯示連續(xù)漸變的靜態(tài)圖像或圖形,從而產(chǎn)生動態(tài)視覺感受的媒體形式,因此,經(jīng)常被認為是同一個東西。但嚴格區(qū)分起來,二者還是有區(qū)別的。動畫是一門綜合藝術,其每幀圖像/圖形都是由人工設計或計算機產(chǎn)生的;而視頻是一種信號處理技術,其每幀圖像主要是通過實時攝取自然景象或者活動對象獲得的。簡單地講,動畫是一種表現(xiàn)形式,視頻是一種播放方式。
在GeoScene軟件系統(tǒng)中,動畫是指創(chuàng)建連續(xù)圖像集合并快速回放這些圖像以創(chuàng)建動態(tài)圖像的過程。連續(xù)圖像集合中的每個圖像被稱為關鍵幀。關鍵幀只能用來記錄地圖或場景窗口中相關圖層的顯示內容和狀態(tài)。用戶可通過手動逐項插入方式為動畫創(chuàng)建關鍵幀,也可以根據(jù)特定的工作流使用導入方法自動創(chuàng)建大量關鍵幀,如根據(jù)瀏覽書簽、時間滑塊步長等。
動畫不僅能按時間動態(tài)展示時空數(shù)據(jù),而且能以不同的視點、比例、范圍等參數(shù)動態(tài)切換展示一般靜態(tài)空間數(shù)據(jù)。與時間滑塊相比,通過動畫對時空數(shù)據(jù)進行動態(tài)可視化具有信息內容豐富、方便共享等優(yōu)勢。在設計動畫時,可根據(jù)需要在相應關鍵幀上添加放置文本、段落、圖像、圖形、版權、水印等信息;在設計創(chuàng)建完動畫之后,可以將其導出轉換為不同格式的視頻文件,以方便沒有GeoScene軟件系統(tǒng)的用戶瀏覽查看相應地圖或場景。
作為利用視覺通道幫助用戶發(fā)現(xiàn)數(shù)據(jù)特征、理解數(shù)據(jù)內涵、洞察數(shù)據(jù)規(guī)律的一種重要技術手段和高效人機界面,數(shù)據(jù)可視化一直是多個學科領域共同關注研究的熱點。文中在簡要梳理數(shù)據(jù)可視化概念和歷程的基礎上,從時空數(shù)據(jù)可視化發(fā)展趨勢及全球關注的新冠疫情出發(fā),詳細分析討論了最新國產(chǎn)GIS桌面軟件平臺——GeoScene系統(tǒng)環(huán)境下的時空數(shù)據(jù)庫組織管理、多維可視化形式以及動態(tài)可視化實施策略等內容。該研究進一步驗證了GeoScene在時空數(shù)據(jù)高效組織處理、二三維融合動態(tài)可視化等方面的卓越性能,可為解決同類可視化應用問題提供了實用的技術參考和靈活的方法選擇。針對目前疫情時空數(shù)據(jù)人工手動解譯獲取效率低、更新慢的不足,下一步將研究利用網(wǎng)絡爬蟲、中文分詞等技術加以解決。