孫成忠,郝振國,張靜華,陳國嶺,楊澤東
(中國測繪科學研究院 北京 100039)
我國的中藥資源區(qū)劃開始于20世紀90年代,是以第三次中藥資源普查工作成果為基礎進行的[1-2]。隨著計算機技術特別是地理信息技術的引入和發(fā)展,眾多學者在中藥資源區(qū)劃領域展開了研究,取得了可喜的成就[3-7]。2008年中國醫(yī)學科學研究院藥用植物研究所與中國測繪科學研究院共同研發(fā)的“中藥材產地適宜性分析系統(tǒng)地理信息系統(tǒng)”(TCMGIS),初步實現(xiàn)了基于生態(tài)因子對中藥材品種的產地適宜性分析,并基于此系統(tǒng)開展了不同種類藥材的適宜性區(qū)劃研究[4,8-14]。進入21世紀,中藥資源的產業(yè)規(guī)劃和可持續(xù)利用對中藥資源區(qū)劃提出了新的要求。
中藥資源作為自然資源,它的分布具有明顯地理特性[15]。中藥材的生長與其所處的地理環(huán)境有密切關系,如海拔、溫度、降水、日照、土壤等,這些生境因素在中藥資源自身中并不能體現(xiàn)出來,只有把中藥材資源與環(huán)境數(shù)據(jù)和空間地理數(shù)據(jù)結合起來,才能使中藥資源的空間表達更加具體,更具有直觀性和決策所需的可視性[16-17],才能發(fā)揮和挖掘中藥資源數(shù)據(jù)的實際用途,解決現(xiàn)有中藥資源數(shù)據(jù)具體應用的問題[18]。
近年來,地理信息系統(tǒng)(Geographic Information System,GIS)作為一門空間信息技術,在藥用植物資源調查、藥材蘊藏量估算、中藥材適宜性區(qū)劃等研究方面應用發(fā)展迅速[16]。GIS具有對地理空間數(shù)據(jù)進行采集、存儲、檢索、分析、模擬和顯示等一系列功能,這些功能可以很好解決中藥資源區(qū)劃的分析和顯示的統(tǒng)一管理問題[1]。GIS具有的信息集成、可視化表達、空間分析、查詢定位等技術特點可以為中藥資源區(qū)劃分析應用提供大數(shù)據(jù)管理、空間關系分析、時空信息動態(tài)可視化等能力。
本文利用GIS技術,通過集成最大信息熵等計算模型,設計并實現(xiàn)了中藥資源區(qū)劃分析系統(tǒng)。該系統(tǒng)綜合運用數(shù)據(jù)存儲技術、數(shù)據(jù)庫技術、地理信息技術等先進技術和設計思想對系統(tǒng)進行設計和開發(fā)。最終形成了以樣點采集數(shù)據(jù)為基礎,以道地藥材產區(qū)的生態(tài)因子數(shù)據(jù)為支撐,以中藥資源區(qū)劃的應用服務為導向,以多源、多主題數(shù)據(jù)的管理為核心,以地圖形式直觀展示中藥材資源區(qū)劃的地理分布的綜合區(qū)劃分析系統(tǒng)。
中藥資源區(qū)劃分析系統(tǒng)總體架構采用三層式結構,主要有軟硬件支撐層、數(shù)據(jù)層、應用服務層。軟硬件支撐層由計算機基礎支撐平臺提供,主要包含計算機基礎平臺系統(tǒng)、本地存儲設備,關系型數(shù)據(jù)庫、ArcSDE空間數(shù)據(jù)庫引擎等,主要作用是為上層提供數(shù)據(jù)存儲管理能力和各類數(shù)據(jù)訪問接口。數(shù)據(jù)層主要是系統(tǒng)管理的數(shù)據(jù)資源內容,主要由藥材點位數(shù)據(jù)、生境數(shù)據(jù)、基礎地理信息數(shù)據(jù)、輔助數(shù)據(jù)等數(shù)據(jù)組成,具體的數(shù)據(jù)存儲根據(jù)數(shù)據(jù)的種類與使用方式的不同可以由關系型數(shù)據(jù)庫、空間數(shù)據(jù)庫進行存儲。應用服務層主要包含了相應的數(shù)據(jù)查詢、區(qū)劃分析、地圖顯示等功能模塊,為區(qū)劃分析系統(tǒng)和其他應用系統(tǒng)提供數(shù)據(jù)應用服務。
整個系統(tǒng)依據(jù)相應的數(shù)據(jù)管理策略和信息安全體系構建,與存儲設備、存儲管理軟件結合,最終通過系統(tǒng)界面向用戶提供服務。系統(tǒng)總體架構圖如圖1所示。
中藥資源區(qū)劃分析系統(tǒng)基于空間數(shù)據(jù)庫構建,劃分為4個層次,如圖2所示。
(1)數(shù)據(jù)層存儲了整個平臺運行時的處理數(shù)據(jù)和控制數(shù)據(jù),為平臺運行提供基本的數(shù)據(jù)支撐,主要包含中藥采樣點數(shù)據(jù)庫、生境因子數(shù)據(jù)庫和中藥材元數(shù)據(jù)等數(shù)據(jù)。
(2)數(shù)據(jù)訪問層為應用組件提供各類數(shù)據(jù)訪問的接口,根據(jù)不同的數(shù)據(jù)存儲模式有空間數(shù)據(jù)引擎、關系數(shù)據(jù)庫訪問接口及文件系統(tǒng)訪問組件。生境因子數(shù)據(jù)庫及采樣數(shù)據(jù)庫中的空間據(jù)及屬性數(shù)據(jù)通過ArcSDE組件進行存儲和訪問,數(shù)據(jù)層中的其他數(shù)據(jù)則通過ADO.NET組件進行處理和訪問。
(3)組件層提供平臺區(qū)劃空間分析處理和產品制作所需的算法、功能和支撐組件。各類業(yè)務組件的集合,這些組件分別完成不同的功能,根據(jù)要求,包含:地圖顯示組件、數(shù)據(jù)庫管理組件、數(shù)據(jù)查詢組件、地圖管理組件、區(qū)劃分析組件和輔助工具組件等。其中系數(shù)據(jù)庫管理組件是平臺運行的基礎,提供藥材點位數(shù)據(jù)、環(huán)境因子空間數(shù)據(jù)、數(shù)據(jù)組織和交換、基礎數(shù)據(jù)處理等功能支持;區(qū)劃分析組件是平臺運行的核心,提供算法支持、數(shù)據(jù)分析、空間分析等核心運算;地圖顯示組件、數(shù)據(jù)查詢組件等是平臺為地圖空間顯示、數(shù)據(jù)查詢等提供功能支持。
圖1 系統(tǒng)總體架構圖
(4)應用層主要面向不同中藥材品種區(qū)劃進行分析展示,直接服務于用戶需求。應用層由相應的業(yè)務模塊開發(fā)構成,主要有:地圖管理模塊、地圖顯示模塊、區(qū)劃分析模塊、數(shù)據(jù)查詢模塊、格式轉化模塊、最大信息熵工具模塊等。
數(shù)據(jù)庫技術的發(fā)展,早已成為先進信息技術的重要組成部分,是現(xiàn)代計算機信息系統(tǒng)和計算機應用系統(tǒng)的基礎和核心[19]。因此在“中藥資源區(qū)劃系統(tǒng)”系統(tǒng)平臺中,數(shù)據(jù)庫的設計和構建是整個系統(tǒng)平臺建設的一部分,是系統(tǒng)進行空間分析與數(shù)據(jù)挖掘的前提。
中藥資源區(qū)劃分析系統(tǒng)主要涉及的生境因子數(shù)據(jù)、藥材采樣點數(shù)據(jù)與藥材種類數(shù)據(jù)。其中環(huán)境因子數(shù)據(jù)量較大、分類多、含有地理信息,而藥材采樣點數(shù)據(jù)與藥材種類數(shù)據(jù)量小,所以針對不同數(shù)據(jù)采用不同形式的數(shù)據(jù)庫進行存儲,主要存儲形式包括地理數(shù)據(jù)庫和非地理數(shù)據(jù)庫。
地理數(shù)據(jù)庫庫主要是存儲環(huán)境因子數(shù)據(jù),包括氣候類型數(shù)據(jù)、土壤類型數(shù)據(jù)、地形數(shù)據(jù)、植被數(shù)據(jù)等。非地理數(shù)據(jù)庫主要是存儲藥材種類與中藥采樣點的經緯度,采用Access數(shù)據(jù)庫存儲。
圖2 系統(tǒng)總體設計圖
在中藥資源區(qū)劃過程中,主要涉及到關鍵模型包括生態(tài)區(qū)劃模型、品質區(qū)劃模型和生產區(qū)劃模型。
(1)生態(tài)區(qū)劃模型
生態(tài)區(qū)劃主要研究中藥基原植物的空間分布區(qū)域范圍和差異性規(guī)律[20]。生態(tài)區(qū)劃是開展中藥資源區(qū)劃的基礎。在生態(tài)區(qū)劃模型中,首先根據(jù)實地采樣,文獻收集等方式,獲取中藥材分布的具體經緯度信息,形成模型分析的基礎數(shù)據(jù)。其次,基于點位數(shù)據(jù),在中藥資源區(qū)劃基礎數(shù)據(jù)庫的支持下,對中藥材的生態(tài)環(huán)境信息進行提取,明確中藥材分布區(qū)域的生態(tài)環(huán)境特征。最后利用采樣點的空間位置分布,依據(jù)最大信息熵計算模型,計算一定尺度區(qū)域上的物種分布概率值。生態(tài)區(qū)劃的計算結果受采樣點的數(shù)量、空間分布狀態(tài)、生境因子的選取等多重因素的影響,通過模型計算,最終將輸出帶有空間參考的物種分布概率計算結果。
(2)品質區(qū)劃分析模型
品質區(qū)劃主要研究不同地區(qū)中藥材有效成分的空間差異[2,20]。在品質區(qū)劃中,需要根據(jù)生長區(qū)劃計算結果及專家知識庫,選擇對中藥材品質形成具有重要影響的生境因素,在此基礎上,通過建立中藥材品質與生境因子之間的相關關系,針對不同藥材品種不同成分確定合理的因子權重。
為消除不同因子量綱對計算結果的影響,針對不同類別的環(huán)境因子數(shù)據(jù),采用不同的標準化方法,對歸一化后的結果,運用地理信息系統(tǒng)的柵格計算功能,形成品質區(qū)劃分析體系。計算模型如下:
其中:P為品質區(qū)劃模型計算結果;
Ai為第i個環(huán)境因子的權重;
Ri為第i個環(huán)境因子歸一化后的柵格值。
(3)生產區(qū)劃分析模型
生產區(qū)劃,主要研究區(qū)域之間中藥材生長能力的差異性分布規(guī)律[20]。生產區(qū)劃分析需要在生態(tài)區(qū)劃和品質區(qū)劃的基礎上,綜合社會經濟條件、自然生態(tài)條件等因素,通過柵格計算或矢量疊加等空間分析方法,整體分析交通、社會經濟、人力資源成本等因素對中藥材生產的影響。在生產區(qū)劃分析中,涉及到不同因素的綜合分類、柵格計算、矢量疊加、統(tǒng)計分析等空間分析技術。
(4)最大信息熵模型
隨著中藥資源區(qū)劃研究的不斷深入,綜合利用生態(tài)位模型和地理信息系統(tǒng)技術對中藥資源生態(tài)區(qū)劃進行分析是目前較為主流的方法。在相關生態(tài)模型中,最大信息熵模型(Maxent)被許多研究證實具有很強的適應性,在生態(tài)學中有著廣泛的應用。相關研究表明最大信息熵模型在對物種生境適宜性評價和分布預測中要優(yōu)于其他模型[23]。最大信息熵模型是基于最大熵原理,利用物種分布點與生境(氣候、土壤、植被和地形等因素)之間的非隨機關系,計算物種的概率分布。即在滿足已知約束的條件下,選擇熵最大的模型,利用物種存在的分布點和環(huán)境變量,來推算物種的生態(tài)需求,并模擬物種的潛在分布[24]。
中藥資源區(qū)劃涉及中藥學、生態(tài)學等多個領域,在分析過程中存在著生態(tài)因子篩選及指標值確定、數(shù)據(jù)標準化、分析結果重分類等關鍵技術[1]。針對上述難點,在系統(tǒng)設計中,主要設計方法如下:
(1)因子篩選及指標值確定
對于品質區(qū)劃和生產區(qū)劃而言,需要確定對其結果產生重要影響的因子。在系統(tǒng)中,通過最大信息熵模型的計算結果,系統(tǒng)可以自動讀取結果文件,自動選擇對區(qū)劃結果貢獻較大的因子,同時兼顧氣候、土壤等不同類型因素的要求,最終確定參與計算的因子指標。在自動選擇的基礎上,系統(tǒng)同時提供手動選擇功能,便于用戶根據(jù)經驗進行因子篩選。
合理確定不同類型因子的生態(tài)范圍值,對中藥材生態(tài)適宜性評價至關重要。通過相關模型,確定適宜性和品質區(qū)劃的評價因子后,需要根據(jù)采樣點確定藥材的最適宜的生境因子指標值。系統(tǒng)運用地理信息系統(tǒng)的空間分析和數(shù)據(jù)統(tǒng)計功能,根據(jù)點位坐標提取主要因子的數(shù)值,從而確定各因子的適宜范圍值。
(2)數(shù)據(jù)標準化
針對特定的中藥材,某一區(qū)域地理環(huán)境和生物環(huán)境的制約,在其耐性限度之內,該藥材就能夠自然分布,且以中心地帶為最多[7]。按照這一理論,系統(tǒng)采用基于適宜范圍區(qū)間的絕對偏差標準化方法,對因子數(shù)據(jù)進行標準化,從而消除量綱的影響。
(3)結果重分類
通過對生態(tài)位模型計算的結果進行適宜性分級,選取中藥資源的適宜性生長區(qū)域,本系統(tǒng)提供了自然斷點分級法、人工確定閾值等多種方法進行適宜性分級,用戶可以實現(xiàn)將中藥資源的生長區(qū)劃區(qū)域劃分為適宜生長區(qū)域、次適宜生長區(qū)域和不適宜生長區(qū)域等。
中藥資源區(qū)劃分析系統(tǒng)的建設涉及的核心開發(fā)技術有空間數(shù)據(jù)庫技術、組件式GIS開發(fā)技術、地理信息系統(tǒng)等技術。
(1)地理信息技術
中藥資源分布具有明顯的地理空間部分特征,地理信息技術為中藥資源空間分布研究提供技術支撐。地理信息系統(tǒng)技術不僅可以對中藥資源空間數(shù)據(jù)進行編碼、存儲、提取和分析,而且還可以將對中藥資源區(qū)劃各個層面的影響進行評價,從而得到綜合分析評價結果。在中藥資源區(qū)劃中,可以采用地理信息系統(tǒng)中的空間分析技術進行多因子分析評價,以圖形可視化方式表現(xiàn)中藥資源的空間分布規(guī)律。因此,在地理信息技術的支持下,中藥資源區(qū)劃分析系統(tǒng)形成了從生態(tài)區(qū)劃到生產區(qū)劃的全過程分析。
(2)空間數(shù)據(jù)庫技術
空間數(shù)據(jù)庫已經成功應用于越來越多的地理信息系統(tǒng)應用項目。采用關系數(shù)據(jù)庫或對象關系數(shù)據(jù)庫管理空間數(shù)據(jù),可以充分利用關系數(shù)據(jù)庫管理系統(tǒng)的數(shù)據(jù)管理功能,利用SQL語言對空間與非空間數(shù)據(jù)進行各項數(shù)據(jù)庫操作,同時可以利用關系數(shù)據(jù)庫的海量數(shù)據(jù)管理、事務處理、記錄鎖定、并發(fā)控制、數(shù)據(jù)倉庫等功能,使空間數(shù)據(jù)與非空間數(shù)據(jù)一體化集成[21]?!爸兴庂Y源區(qū)劃分析系統(tǒng)”利用成熟的ArcSDE結合關系型數(shù)據(jù)庫的空間數(shù)據(jù)管理模式,將空間數(shù)據(jù)存儲在關系型數(shù)據(jù)庫中,通過空間數(shù)據(jù)引擎以及應用服務器對空間數(shù)據(jù)進行有效管理,并通過專用開發(fā)包進行數(shù)據(jù)庫功能開發(fā),實現(xiàn)數(shù)據(jù)庫系統(tǒng)的集成管理。
(3)組件式GIS開發(fā)技術
組件式軟件是新一代GIS的重要基礎,COMGIS的出現(xiàn)為傳統(tǒng)GIS面臨的多種問題提供了全新的解決思路[22]。相對于傳統(tǒng)GIS,組件式GIS擺脫了二次開發(fā)語言的束縛,可以利用C#、Python等通用的計算機語言進行應用開發(fā),從而便于與其他系統(tǒng)集成,便于開發(fā)新系統(tǒng)和新應用。
“中藥資源區(qū)劃分析系統(tǒng)”采用全新的ArcGIS Engine10.2技術開發(fā),預處理系統(tǒng)、數(shù)據(jù)庫配置系統(tǒng)、管理系統(tǒng)都基于此進行開發(fā),系統(tǒng)完全脫離ArcGIS的桌面環(huán)境。ArcGISEngine由包含了大量的類庫,不同的類庫分別封裝不同的地理信息系統(tǒng)功能,包含了ArcObjects中的核心功能,是對ArcObjects中大部分接口、類庫進行封裝所構成的,集成了大量的GIS分析功能。
ArcGISEngine是基于COM的集合,可以被多種編程語言所調用,如VB、Java、C#等。中藥資源區(qū)劃分析系統(tǒng)是以Visual Studio2012為開發(fā)環(huán)境,在.NET平臺下,以C#語言為基礎,利用ArcGISEngine組件進行開發(fā),數(shù)據(jù)分析將更為靈活,系統(tǒng)功能更加完備,能根據(jù)不同采樣點的藥材品質進行生態(tài)主因子分析和相關性分析,分析中的多種分類方法更加完善,可以結合專家知識庫系統(tǒng)和根據(jù)建立的空間數(shù)據(jù)庫,對分析結果進行評估及因素權重的調整,從而提高了自動化程度。
本系統(tǒng)集成了由Steven Phillips等[25-26]基于最大熵原理開發(fā)的用于預測物種潛在地理分布的生態(tài)位模型軟件,從而實現(xiàn)了由環(huán)境因子數(shù)據(jù)庫和藥材采樣點來進行中藥資源的多類型區(qū)劃的全部工作。系統(tǒng)充分利用Java版的最大信息熵計算模型與ESRI的ArcGIS平臺相結合,采用C#語言開發(fā),使最大信息熵模型和軟件的相關功能融為一體,極大提高了軟件的自動化水平。系統(tǒng)界面設計如圖3所示。
在中藥資源區(qū)劃分析系統(tǒng)平臺上,生態(tài)區(qū)劃功能模塊從空間維度出發(fā),對藥材采樣點及調查區(qū)域進行可視化表達,借助專家知識、地理信息空間分析功能,將第三次資源普查數(shù)據(jù)、第四次中藥資源普查數(shù)據(jù)及自有數(shù)據(jù)與地理空間有機地結合在一起,可以直觀地顯示單一中藥材的空間分布區(qū)域,為藥材道地性研究及生態(tài)適宜性研究提供數(shù)據(jù)基礎。
在系統(tǒng)平臺的生態(tài)區(qū)劃功能中,首先利用已集成到平臺上的生態(tài)位模型模塊,通過最大信息熵模型計算單一品種藥材的潛在分布區(qū)。模型通過采集的藥材分布樣點和生境因子,確定特征空間,構建約束組合,以熵最大為條件選擇最優(yōu)分布。計算完成后,通過轉換模塊,對計算結果賦值空間參考,生成通用的柵格格式數(shù)據(jù)。為生態(tài)區(qū)劃分級、品質區(qū)劃分析及專題地圖生成奠定基礎。生態(tài)區(qū)劃分析結果如圖4所示。
圖4 連翹生態(tài)區(qū)劃圖
在系統(tǒng)平臺的品質區(qū)劃模塊中,系統(tǒng)可以根據(jù)生態(tài)位模型計算結果自動提取生境因子進行品質區(qū)劃分析,在此基礎上,利用地理信息空間分析方法,提取生境因子的適宜性指標。同時,為消除量綱對結果的影響,軟件模塊提供絕對偏差標準化的方法,對生境因子進行歸一化處理。
藥材的品質受許多因素決定,包括極端氣溫、極端降水等因素,因此,每種環(huán)境因子對藥材品質的形成影響程度也不同,需要對各個因子進行綜合評價。根據(jù)不同環(huán)境因子數(shù)值與藥材成分之間的相關性,系統(tǒng)平臺提供一種半定量的權重確定方法。除此之外,在該模塊中還提供交互式界面,可以讓使用人員根據(jù)需要手動填寫權重。最后,根據(jù)所選主要因子和權重,計算得到藥材品質的綜合評價結果,將該結果生成柵格格式數(shù)據(jù)并存入數(shù)據(jù)庫。同時可以將結果生成專題圖輸出,為藥材的人工種植提供數(shù)據(jù)參考。品質區(qū)劃分析結果如圖5所示。
對于傳統(tǒng)野生藥材來說,其主要受到氣候、土壤、植被等自然生態(tài)環(huán)境因素的影響。在系統(tǒng)平臺的生產區(qū)劃模塊中,以生態(tài)區(qū)劃和品質區(qū)劃為基礎,從中藥材生長的自然環(huán)境出發(fā),通過確定主要分級指標,將生態(tài)區(qū)劃和品質區(qū)劃按照一定的標準進行分類。在生產區(qū)劃分析模塊中,首先利用柵格重分類功能將生態(tài)區(qū)劃結果、品質區(qū)劃結果、社會經濟條件等柵格數(shù)據(jù)進行分級在此基礎上,利用生產區(qū)劃分析模塊中的柵格計算功能,進行空間計算,最終生產區(qū)劃計算結果以柵格格式存儲,從而為決策者提供中藥材生產布局信息。為定量化輸出不同行政區(qū)劃次適宜區(qū)和最適宜區(qū)面積,系統(tǒng)提供多種矢量空間分析的方法,便于對分析結果進行優(yōu)化。生產區(qū)分析結果如圖6所示。
“中藥資源區(qū)劃分析系統(tǒng)”旨在應用地理信息技術、最大信息熵和空間數(shù)據(jù)庫技術,以道地產區(qū)采樣點數(shù)據(jù)為依托,基于中藥材分布、品質進行區(qū)劃分析,為中藥資源保護利用和產業(yè)布局提供信息服務。系統(tǒng)的設計實現(xiàn)不僅可方便高效地分析預測中藥材資源的適宜生長區(qū)域,還可對數(shù)據(jù)進行空間化、可視化管理,并能將中藥材資源的生態(tài)信息與分布信息有機結合,實現(xiàn)中藥資源的分布、品質和生產等多類型區(qū)劃的自動分析,為中藥材資源的產業(yè)規(guī)劃和可持續(xù)利用提供準確的科學支撐,從而結束了依靠傳統(tǒng)經驗和單個氣候因子分析中藥材產地的做法。
利用本系統(tǒng)已經對幾十種藥材和部分省區(qū)的中藥資源產業(yè)規(guī)劃進行了分析,取得了很好的應用效果。通過驗證證明,中藥資源區(qū)劃分析系統(tǒng)充分提高了區(qū)劃分析的科學性和自動化水平,該系統(tǒng)實現(xiàn),將中藥資源區(qū)劃分析流程簡單化,方便用戶操作,從而能快速高效、以可視化的方式展示出預測結果,使用戶能夠快速分析中藥資源藥材品種的分布、品質和生產的適宜區(qū)域,為我國各地區(qū)中藥資源產業(yè)規(guī)劃和資 源可持續(xù)利用提供科學的技術方法。
圖5 連翹品質區(qū)劃圖
圖6 連翹生產區(qū)劃圖