王臘紅,陳家贏,2?,汪善勤,2,王天巍,2,譚黃元
(1. 華中農(nóng)業(yè)大學(xué)資源與環(huán)境學(xué)院,武漢 430070;2. 農(nóng)業(yè)農(nóng)村部長(zhǎng)江中下游耕地保育重點(diǎn)實(shí)驗(yàn)室,武漢 430070)
土壤分類是土壤科學(xué)的基礎(chǔ),是土壤科學(xué)發(fā)展水平的標(biāo)志,是信息交流的媒介,是土壤調(diào)查與制圖的前提,也是土壤科學(xué)應(yīng)用推廣的動(dòng)力。以診斷層和診斷特性為基礎(chǔ)的,定量化和標(biāo)準(zhǔn)化的土壤分類方案得到國(guó)內(nèi)外廣泛認(rèn)可,國(guó)際上主流的分類系統(tǒng)均采用定量化分類,如歐洲學(xué)派代表的世界土壤資源參比基礎(chǔ)(World Reference Base for Soil Resources,WRB)、美國(guó)土壤系統(tǒng)分類(Soil Taxonomy,ST)和聯(lián)合國(guó)糧食與農(nóng)業(yè)組織(Food and Agriculture Organization,F(xiàn)AO)的土壤圖圖例單元。我國(guó)土壤系統(tǒng)分類經(jīng)多年發(fā)展,形成《中國(guó)土壤系統(tǒng)分類檢索》(第三版)[1],分類定義了診斷現(xiàn)象、診斷特性和診斷層,并在此基礎(chǔ)上建立層次結(jié)構(gòu)分明的土壤類型檢索體系。中國(guó)土壤系統(tǒng)分類(CST)的不斷完善使得計(jì)算機(jī)實(shí)現(xiàn)土壤類型的自動(dòng)化檢索成為可能,從而推動(dòng)土壤學(xué)發(fā)展。Fisher和Balachandran[2]研發(fā)了用于教學(xué)的土壤類型檢索系統(tǒng),其主要針對(duì)土壤剖面和特征的類型檢索。Galbraith等[3]在人工智庫(kù)的基礎(chǔ)上,整合數(shù)據(jù)驅(qū)動(dòng)和目標(biāo)驅(qū)動(dòng)兩個(gè)推導(dǎo)過程,基于確定性檢索過程補(bǔ)充了專家知識(shí),一定程度上彌補(bǔ)了土壤類型檢索的數(shù)據(jù)缺失問題。鐘駿平等[4]首次在我國(guó)系統(tǒng)分類的基礎(chǔ)上,建立了基于診斷層和診斷特性的CST檢索系統(tǒng)。劉光等[5]采用數(shù)據(jù)庫(kù)管理、地理信息系統(tǒng)(Geographic Information System,GIS)、面向?qū)ο缶幊碳夹g(shù)、瀏覽器/服務(wù)器模式(Browser/Sever)和多層數(shù)據(jù)庫(kù)技術(shù)等研究方法,開發(fā)了基于Browser/ Sever體系的CST檢索系統(tǒng)。CST檢索系統(tǒng)要求輸入的土壤剖面特征信息全面且準(zhǔn)確,但在實(shí)際應(yīng)用中常因數(shù)據(jù)不完整而無法實(shí)施,現(xiàn)有的系統(tǒng)均補(bǔ)充專家知識(shí)或環(huán)境發(fā)生信息來輔助檢索過程,該類檢索為不確定過程。本文分析人工檢索過程基礎(chǔ)上,建立本體數(shù)據(jù)模型和通用邏輯謂詞來實(shí)現(xiàn)定量化的土壤類型檢索。
汪善勤等[6-7]將診斷層和診斷特性作為一種專家知識(shí),結(jié)合GIS等土壤發(fā)生環(huán)境信息,提出了土壤分類決策樹的構(gòu)造方式和推理方法。但該種土壤類型識(shí)別方式忽視了分類體系本身處于不斷完善中,導(dǎo)致專家知識(shí)更新困難。土壤類型邊界的更新是基于整個(gè)推理過程的更新,邱琳和李安波[8]基于CST的分類規(guī)則,利用規(guī)則引擎和RuleML規(guī)則描述語言降低檢索規(guī)則和運(yùn)行引擎之間的耦合。該研究實(shí)現(xiàn)了土壤類型自動(dòng)檢索的規(guī)則庫(kù)與推理過程分離,增強(qiáng)了土壤類型自動(dòng)檢索系統(tǒng)的可拓展性,降低其因分類規(guī)則變化而引起的維護(hù)和升級(jí)的難度。上述檢索系統(tǒng)的研究將土壤類型判別規(guī)則與數(shù)據(jù)分離開,能適應(yīng)土壤分類的不斷發(fā)展和更新。
此外,現(xiàn)有的檢索系統(tǒng)均依賴大量的土壤數(shù)據(jù),有效地組織與管理土壤數(shù)據(jù)是降低檢索系統(tǒng)復(fù)雜度的關(guān)鍵。為了保證數(shù)據(jù)的通用性,多家土壤學(xué)組織聯(lián)合制定了SoilML作為全球土壤數(shù)據(jù)交換的模型,針對(duì)SOTER數(shù)據(jù)庫(kù)而提出SoTerML數(shù)據(jù)交互規(guī)范[9]。澳大利亞定義了OzSoilML用于土壤和地形數(shù)據(jù)的交換[10]。ANZSoilML則是澳大利亞和新西蘭共同發(fā)布的兼容OGC地理信息服務(wù)規(guī)范的土壤和地形數(shù)據(jù)交換數(shù)據(jù)模型[11]。但這些土壤信息交換的抽象模型均將土壤類型作為土體的基本屬性特征,未將土壤類型的邊界作為土壤交換模型的組成部分。
綜上所述,基于CST的土壤類型自動(dòng)檢索的研究已經(jīng)取得了一定的成果并在不斷改進(jìn)中,但這些檢索模型均是以土壤特征為檢索對(duì)象,通過傳統(tǒng)計(jì)算機(jī)語言表達(dá)土壤特征的范圍以及土壤特征之間復(fù)雜的邏輯關(guān)系,檢索語言繁瑣且冗余。其次,土壤信息的載體依據(jù)土壤空間結(jié)構(gòu)可分為土壤層次(Horizon)、剖面(Profile)、單個(gè)土體(Pedon)和聚合土體(Polypedon),但現(xiàn)有的檢索模型忽略了這一特點(diǎn),并未將上述結(jié)構(gòu)區(qū)分開來,不利于土壤信息的管理,并增大了分類規(guī)則表達(dá)的復(fù)雜度。因此,本文以土壤發(fā)生學(xué),土壤地理學(xué)為理論基礎(chǔ)建立關(guān)于土壤實(shí)體的本體模型表達(dá)土壤的空間結(jié)構(gòu);總結(jié)歸納土壤特征值的特點(diǎn),建立土壤特征模型來統(tǒng)一土壤特征的類型,使得土壤特征在檢索規(guī)則中被規(guī)范化表達(dá);將CST檢索規(guī)則中土壤特征的條件約束以及特征之間的邏輯關(guān)系進(jìn)行封裝,將土壤類型與診斷對(duì)象視為規(guī)則邊界,建立關(guān)于土壤類型和診斷對(duì)象的本體模型,將檢索對(duì)象從土壤特征值的范圍匹配轉(zhuǎn)換為土壤實(shí)體與土壤類型、診斷對(duì)象之間隸屬關(guān)系的判別,并通過定義的謂詞邏輯來表達(dá)。這種判別方法使得規(guī)則表達(dá)的語言更為精簡(jiǎn)直觀,與傳統(tǒng)的條件嵌套語句相比更符合人類的認(rèn)知。
土壤是覆蓋地球表面的一層不連續(xù)疏松物質(zhì),因此具有空間結(jié)構(gòu)。土壤學(xué)中,土壤空間結(jié)構(gòu)分別從聚合土體、單個(gè)土體、剖面和土層進(jìn)行表達(dá),這四個(gè)基本概念同時(shí)具備空間上的邏輯關(guān)系。土壤剖面是指從地表向下挖掘至母質(zhì)層所裸露的一段垂直切面;土層是土壤剖面上表現(xiàn)出的水平層狀構(gòu)造,它反映了土壤形成過程中物質(zhì)的遷移、轉(zhuǎn)化和累積的特點(diǎn)[12];單個(gè)土體是土壤剖面的立體化形式,是體積最小的土壤三維實(shí)體[13];聚合土體是兩個(gè)以上的單個(gè)土體組成的群體,在土壤制圖上為最小制圖單位,在分類上則為基本分類單位。本文以土壤地理學(xué)與土壤分類學(xué)為理論基礎(chǔ),將土壤作為可解剖的實(shí)體,建立上述四種空間結(jié)構(gòu)的土壤本體模型。進(jìn)一步,明確結(jié)構(gòu)之間的邏輯關(guān)系并定義相應(yīng)的謂詞邏輯來表達(dá)這些關(guān)系。
本文在四種土壤空間結(jié)構(gòu)的基礎(chǔ)上抽象出土壤結(jié)構(gòu)的頂級(jí)本體概念——抽象土壤對(duì)象,該對(duì)象作為所有空間結(jié)構(gòu)本體概念實(shí)例化的基礎(chǔ),并包含土壤的特征屬性。土層根據(jù)其物質(zhì)組成進(jìn)一步劃分出土壤基質(zhì)、新生體、填充物和侵入體等實(shí)體對(duì)象。此外,模型還定義了地理信息類型和多媒體類型與單個(gè)土體關(guān)聯(lián),地理信息類描述土體的經(jīng)緯度、高程等空間信息;多媒體類描述土體周圍的自然景觀照等多媒體信息。
上述土壤空間結(jié)構(gòu)之間的關(guān)系包括繼承(泛化)、實(shí)現(xiàn)、聚合和組成(強(qiáng)聚合)。其中,四種基本土壤空間結(jié)構(gòu)均繼承自抽象土壤對(duì)象,且每個(gè)土壤結(jié)構(gòu)通過各自具體特征進(jìn)行實(shí)例化。組成關(guān)系在空間上表現(xiàn)為連續(xù)性,是一種強(qiáng)聚合,如:聚合土體必然由連續(xù)的單個(gè)土體組成,剖面由若干連續(xù)的土層組成。聚合關(guān)系則表現(xiàn)為較弱的依賴性,如土層中可能包含也可能不包含新生體。
本文基于土壤空間結(jié)構(gòu)之間的組成與聚合關(guān)系定義了一組一階謂詞INCLUDE與INCLUDED,語義上理解為“包含”與“被包含”。組成和聚合關(guān)系為一對(duì)多的映射,即INCLUDE返回被包含對(duì)象集合,INCLUDED返回一個(gè)包含對(duì)象。例如,INCLUDE(p)返回被剖面p(下文均以p代表剖面)包含的所有土層,INCLUDED(h)返回包含土層h(下文均以h代表土壤層次)的一個(gè)剖面。該組謂詞的定義使得檢索系統(tǒng)既在獨(dú)立表達(dá)土壤結(jié)構(gòu)概念的同時(shí)又實(shí)現(xiàn)了它們之間的組合關(guān)系。
此外,土壤實(shí)體的描述是建立在定量化的土壤特征的基礎(chǔ)之上,而土壤特征也依附于土壤實(shí)體而存在,因此本文通過一組二元一階謂詞GET_ATTRIBUTE(soil,attribute)和SET_ATTRIBUTE(soil,attribute)表達(dá)土壤實(shí)體與土壤特征的關(guān)系,其中soil為土壤實(shí)體,attribute為土壤特征,謂詞GET_ATTRIBUTE(soil,attribute)的語義為“獲取土壤實(shí)體對(duì)象的某一特征值”,其返回值為特征attribute的屬性值,謂詞HAS_ATTRIBUTE(soil,attribute)的語義為“判斷某一特征值是否屬于土壤實(shí)體對(duì)象”,其返回值為布爾值。
本文除了在空間結(jié)構(gòu)拓?fù)潢P(guān)系的描述中引入GML表達(dá)剖面、單個(gè)土體和聚合土體之間的空間關(guān)系,還定義了基于深度的土層位置關(guān)系RELATION(hi,hj),采用九交矩陣實(shí)現(xiàn)定量化描述。其定義為:設(shè)hi、hj是同一剖面中任意兩個(gè)土層,B表示土層的水平邊界,I表示土層的內(nèi)部,E表示土層的外部。若hi、hj交集為空,則值為0,非空則為1(式(1))。針對(duì)兩個(gè)土層之間的9種位置關(guān)系:上部非接觸、上部接觸、上部嵌入、下部非接觸、下部接觸、下部嵌入、包含、被包含以及重合,矩陣RELATION(hi,hj)具有9個(gè)有效值,并為每個(gè)矩陣值定義了相應(yīng)的二元一階謂詞表達(dá)其位置關(guān)系的語義:
ABOVE(hi,hj)、ABOVE_TOUTH(hi,hj)、TOP_INTERSECT(hi,hj)、BELOW(hi,hj)、BELOW_TOUCH(hi,hj)、BOTTOM_INTERSECT(hi,hj)、CONTAIN(hi,hj)、CONTAINED(hi,hj)、OVERLAP(hi,hj),謂詞的返回值為布爾型?;谕翆拥奈恢藐P(guān)系,模型能表現(xiàn)土壤特征隨深度的變化,反應(yīng)成土過程中物質(zhì)的遷移、轉(zhuǎn)化和累積的特點(diǎn)。
土壤分類是依據(jù)土壤性狀質(zhì)與量的差異,系統(tǒng)地劃分土壤類型及其相應(yīng)的分類級(jí)別,從而擬定土壤分類系統(tǒng)[14]。土壤系統(tǒng)分類的分類規(guī)則核心是土壤特征的定性與定量化描述,但土壤特征的類型并不是單一的,本文將其歸為兩大類:普通土壤特征和復(fù)合土壤特征。
普通土壤特征不具有子屬性,特征值單一;復(fù)合土壤特征則包含多個(gè)子屬性,特征值由其多個(gè)子屬性值組合而成。基于此,本文通過建立土壤特征模型來描述上述兩種類型的土壤特征,并定義了土壤特征的謂詞邏輯來表達(dá)類型之間的關(guān)系。土壤特征類型具有特征名稱、特征值和量綱三個(gè)元素,其中特征名稱和量綱為字符型,特征值的類型則抽象為一個(gè)頂級(jí)的特征值類型,并基于該類型派生兩個(gè)子類:普通值和復(fù)合值類型,分別描述普通土壤特征和復(fù)合土壤特征。特別地,本文定義了二元一階謂詞COMPOSITE_TO(c_attribute,attribute)表達(dá)復(fù)合特征類型與普通特征類型的組合關(guān)系,c_attribute為復(fù)合土壤特征名稱,attribute為c_attribute的子特征名稱,謂詞返回attribute的特征值。
普通土壤特征值類型即簡(jiǎn)單值類型,包括數(shù)值型、字符型和枚舉型等。數(shù)值型土壤特征的謂詞邏輯包括基本的四則運(yùn)算、不等式運(yùn)算、一元函數(shù)運(yùn)算、集合運(yùn)算等;字符型土壤特征的謂詞邏輯包括字符的連接、索引、截取、匹配、查找、大小寫轉(zhuǎn)換等;枚舉型的特征值描述是建立在數(shù)值型與字符型謂詞邏輯的基礎(chǔ)上,通過一組離散值來限定特征的值域范圍,且取值唯一。
復(fù)合土壤特征的謂詞邏輯是建立在普通土壤特征的謂詞邏輯的基礎(chǔ)上,進(jìn)一步處理多個(gè)屬性值之間的邏輯關(guān)系。復(fù)合土壤特征類型的典型實(shí)例包括土壤的機(jī)械組成與土壤顏色。
機(jī)械組成是土壤中各粒級(jí)占土壤重量的百分比組合,包括黏粒(<0.002 mm)、粉粒(0.002~0.05 mm)和砂粒(0.05~2 mm)。本文基于普通值類型定義了顆粒類型并派生三個(gè)子類:黏粒類型、砂粒類型和粉粒類型;在機(jī)械組成基礎(chǔ)上,根據(jù)不同的顆粒組成劃分的土壤質(zhì)地?;谕寥蕾|(zhì)地和土壤的機(jī)械組成之間存在映射關(guān)系,建立不同質(zhì)地之間的相互比較謂詞。針對(duì)CST土壤質(zhì)地劃分的12種類型,定義了12個(gè)枚舉值來限定12種質(zhì)地名稱,并通過一元一階謂詞DECIDED_TO(m)表達(dá)質(zhì)地(t,下文均以t代表質(zhì)地)與機(jī)械組成(m,下文均以m表示機(jī)械組成)的單向依賴關(guān)系,語義即根據(jù)機(jī)械組成獲得質(zhì)地類型,謂詞返回質(zhì)地的屬性值。同時(shí)在檢索過程中存在質(zhì)地類型之間的對(duì)比,如“CaCO3相當(dāng)物顆粒大小較壤質(zhì)更黏”。針對(duì)比較關(guān)系,定義三元一階謂詞TEXTURE_GREATER(h,t,particle),其中particle為枚舉型的顆粒級(jí)別列表,即[‘clay’,‘silt’,‘sand’],TEXTURE_GREATER(h,‘壤質(zhì)’,‘clay’)語義為“土層h的質(zhì)地較壤質(zhì)更黏”。該謂詞根據(jù)質(zhì)地劃分規(guī)則識(shí)別并返回一個(gè)存儲(chǔ)了較“壤質(zhì)”更黏的所有質(zhì)地類型的集合,然后判斷h的質(zhì)地是否屬于該集合中,最后返回一個(gè)布爾型表示結(jié)果的真假。
CST采用孟塞爾顏色系統(tǒng)描述土壤顏色,其是建立在色相、明度、彩度三個(gè)特征上的顏色立體[15]。與機(jī)械組成類似,孟塞爾顏色類型由孟塞爾色調(diào)類型、孟塞爾明度類型和孟塞爾彩度類型三種類型組合而成。土壤顏色的定量化描述可視為對(duì)顏色特征值范圍的匹配。其中,明度與彩度為數(shù)值型,其范圍的匹配即數(shù)值類型的不等式運(yùn)算。色調(diào)是一個(gè)被均分為40等分的圓盤且隨順時(shí)針方向具有一定的排列順序,因此色調(diào)的描述可視為角度值范圍的匹配。本文將所有色調(diào)賦予角度值,從5Y開始順時(shí)針方向遞增,相鄰色調(diào)之差為9度,即5Y=0,7.5Y=9,10R=18,以此類推。
針對(duì)上述顏色屬性的描述形式,本文定義了MUNSELL_VALUE(h,a,b)、MUNSELL_CHROMA(h,a,b)和MUNSELL_HUE(h,a,b)三個(gè)三元一階謂詞分別表達(dá)明度、彩度和色調(diào)的范疇匹配,其語義即判斷土層h的值是否在a~b的范圍內(nèi),返回值為布爾型。色調(diào)的定量化描述包括比較形式和范圍形式,MUNSELL_HUE(h,a,b)具有2種語義:MUNSELL_HUE(h,‘2.5YR’,‘5Y’)即判斷土層h色調(diào)是否在5Y~2.5YR范圍內(nèi),MUNSELL_HUE(hi,hj,‘5Y’)即判斷土層hi的色調(diào)是否在5Y與hj的色調(diào)值范圍內(nèi)。此外,CST中關(guān)于明度和彩度的描述除了兩個(gè)土層的對(duì)比之外,還存在同一土層中干態(tài)與潤(rùn)態(tài)對(duì)比的情況。本文定義了一元一階謂詞VALUE_MOISTURER(h)和CHROMA_ MOISTURER(h)表示土層h的明度與彩度的干潤(rùn)態(tài)比較,其語義即判別土層h的潤(rùn)態(tài)明度是否大于干態(tài)明度或潤(rùn)態(tài)彩度是否大于干態(tài)彩度,返回值為布爾型。
基于CST的本體模型是對(duì)CST分類體系的結(jié)構(gòu)化描述,它表達(dá)了診斷對(duì)象和土壤類型及其之間的邏輯關(guān)系,系統(tǒng)基于該模型建立了分類規(guī)則框架。土壤診斷層和診斷特性及其與各種成土因素空間變異的關(guān)系是土壤類型劃分的唯一標(biāo)準(zhǔn)[1],從土綱到亞類的所有土壤類型的劃分均依賴于診斷對(duì)象,在現(xiàn)有的檢索模型中其兩者存在高度耦合關(guān)系。因此,本文的CST本體模型將診斷對(duì)象與土壤類型剝離?;贑ST對(duì)象的頂級(jí)本體概念——抽象CST對(duì)象類型派生出診斷對(duì)象類型和土壤類型,土壤類型結(jié)構(gòu)化表達(dá)分類體系中土綱到亞類的所有土壤類別,診斷對(duì)象類型派生了診斷層類型、診斷特性類型和診斷現(xiàn)象類型,分別描述診斷層、診斷特性和診斷現(xiàn)象。在CST檢索系統(tǒng)中,土壤本體模型的實(shí)例作為被檢索對(duì)象,CST本體模型作為類型概念規(guī)則邊界,兩者通過兩個(gè)抽象類型(抽象土壤對(duì)象類型與抽象CST對(duì)象類型)之間的謂詞邏輯IS_INSTANCE(soil,cst)連接,其語義為:“土壤對(duì)象soil滿足CST對(duì)象cst的規(guī)則邊界”,返回值為布爾型。通過IS_INSTANCE建立土壤個(gè)體模型與CST類型模型之間的關(guān)系判別,表達(dá)了土壤個(gè)體與診斷對(duì)象,土壤類型之間的隸屬關(guān)系。
系統(tǒng)論思想表明,結(jié)構(gòu)必須依賴邊界定義,任何一項(xiàng)科學(xué)研究提出的假設(shè)均不是無中生有,均要建立在先前科學(xué)發(fā)現(xiàn)的基礎(chǔ)之上[16],土壤分類同樣如此。CST的土壤類型、診斷對(duì)象等概念是建立在其本身的特征屬性范圍的基礎(chǔ)之上,特征屬性的范圍實(shí)際上是對(duì)特征屬性變幅的規(guī)定,即特征邊界約束。每個(gè)特征屬性的邊界約束均可通過對(duì)應(yīng)的特征謂詞邏輯進(jìn)行表達(dá),如“酸性濕潤(rùn)淋溶土”中pH的邊界被約束為0~5.5,該謂詞邏輯基于不等式運(yùn)算和集合運(yùn)算表示為(pH≥0)∩(pH≤5.5),又如“紅色酸性濕潤(rùn)淋溶土”中孟塞爾色調(diào)的邊界為5R~5YR,用孟塞爾特征類型的謂詞邏輯表示為MUNSELL_ HUE(h,5Y,5YR)。
但CST中的范疇對(duì)象的邊界不是針對(duì)單個(gè)特征屬性的約束,是建立在一系列的特征約束集合之上。它是由一系列條件(即特征屬性的約束)通過組合和替代關(guān)系形成復(fù)合概念,采用邏輯運(yùn)算關(guān)系組織條件集合?;诖?,本文定義條件類型(Condition)規(guī)范表達(dá)CST的本體邊界。條件類型具有三個(gè)屬性:(1)‘description’:條件的文字描述;(2)‘sub_condition’:子條件,條件類型,它使得條件類型(Condition)形成嵌套結(jié)構(gòu);(3)邏輯綜合(synthesis):將土體在‘sub_condition’中的所有匹配結(jié)果根據(jù)組合與替代關(guān)系進(jìn)行組合,返回值為布爾型或?yàn)榭?,若判斷結(jié)果為空則說明土體中CST本體所必須的土壤特征值缺失;(4)‘result’:判斷結(jié)果,當(dāng)‘sub_condition’不為空時(shí)屬性值等于‘synthesis’的值,否則為單個(gè)條件的判斷結(jié)果。至此,CST中土壤類型和診斷類型的表達(dá)均是將其土壤特征的邊界表達(dá)為Condition類型。
CST檢索表現(xiàn)為一個(gè)樹狀結(jié)構(gòu)且檢索有一定的檢索順序,該順序使得土壤類型之間存在相應(yīng)的關(guān)系,如上下位關(guān)系、前置條件關(guān)系和后置條件關(guān)系。給定概念c1和c2,若c2的外延包含c1的外延,則認(rèn)為c1和c2具有上下位關(guān)系,稱c2為c1的上位概念(hypernym),c1為c2的下位概念(hyponym)[17],本文通過二元一階謂詞IS_A(c1,c2)描述上下位關(guān)系。例如“水耕人為土是一種人為土”,則“人為土”即為“水耕人為土”的上位概念,“水耕人為土”為“人為土”的下位概念。前置條件關(guān)系與后置條件關(guān)系表達(dá)基于同一上位概念的不同土壤類型之間的檢索順序,本文通過二元一階謂詞PRE_CONDITION(c1,c2)和POST_CONDITION(c1,c2)進(jìn)行描述。例如“人為土”類型發(fā)生的前提條件是不為“有機(jī)土”,即PRE_CONDITION(Histosols,Anthrosols)返回的布爾值為假。又如,當(dāng)土體滿足“人為土”后繼續(xù)分類,則結(jié)果一定不是“灰土”,即POST_CONDITION(Anthrosols,Spodosols )為假。
在檢索體系中,土壤實(shí)體作為輸入對(duì)象傳入CST類型中,并返回一個(gè)檢索結(jié)果。如土體作為被分類對(duì)象,在土壤類型中得到一個(gè)分類結(jié)果;剖面和土層作為被診斷對(duì)象,分別在診斷特性類型和診斷層類型中得到一個(gè)診斷結(jié)果;因此,土壤實(shí)體與CST類型之間存在一個(gè)實(shí)例與類型的映射關(guān)系。本文定義了謂詞IS_INSTANCE(c1,c2)來定義這種映射關(guān)系,其中c1表示土壤實(shí)體對(duì)象,c2表示CST類型,其語義為“c1是否為c2的實(shí)例”。當(dāng)執(zhí)行IS_INSTANCE(c1,c2)時(shí),c1根據(jù)c2的特征邊界(Condition),調(diào)用謂詞GET_ATTRIBUTE(c1,attribute)獲取對(duì)應(yīng)的特征值,并判斷該特征值是否在類型邊界內(nèi),結(jié)果返回Condition的‘result’值作為IS_INSTANCE(c1,c2)的結(jié)果。
遵照CST分類體系的樹形結(jié)構(gòu),本文從土綱到亞類通過廣度優(yōu)先的遍歷策略進(jìn)行檢索,當(dāng)土體在某個(gè)土壤類型中的判別結(jié)果為真,則停止在當(dāng)前級(jí)別的檢索并轉(zhuǎn)入該土壤類型的所有下位關(guān)系土壤類型中,按照前置條件與后置條件關(guān)系的順序繼續(xù)檢索,直至檢索到亞類結(jié)束。
檢索結(jié)果的結(jié)構(gòu)與CST體系的樹形結(jié)構(gòu)相同,其節(jié)點(diǎn)的顯示順序依照土體在CST體系中的檢索路徑。當(dāng)土體在土綱完成檢索后,首先在結(jié)果樹中返回一個(gè)根節(jié)點(diǎn),該節(jié)點(diǎn)存儲(chǔ)了檢索級(jí)別以及檢索結(jié)果,如“土綱判斷-人為土”?;诟?jié)點(diǎn),系統(tǒng)依次返回土體在人為土及其之前的所有土綱類型的判別結(jié)果,作為第一層子節(jié)點(diǎn),這些子節(jié)點(diǎn)是基于條件類型的對(duì)象,存儲(chǔ)了土壤類型的所有條件描述、邏輯關(guān)系及判別結(jié)果。在第一層子節(jié)點(diǎn)的最后,系統(tǒng)返回土體在亞綱的檢索結(jié)果,如“亞綱判斷-水耕人為土”,并將該節(jié)點(diǎn)作為父節(jié)點(diǎn),繼續(xù)派生亞綱中土壤類型的判別結(jié)果,以此類推直至亞類,示例如圖1。
本文基于土壤本體模型、CST本體模型和土壤特征模型及其謂詞邏輯,通過Python語言實(shí)現(xiàn)土壤類型檢索系統(tǒng),模擬檢索過程,并用湖北省的土系數(shù)據(jù)進(jìn)行系統(tǒng)測(cè)試。測(cè)試數(shù)據(jù)來自《中國(guó)土系志·湖北卷》[18],該書通過對(duì)調(diào)查的202個(gè)湖北省代表性單個(gè)土體的篩選和歸并,合計(jì)建立154個(gè)土系,分屬于5個(gè)土綱、8個(gè)亞綱、18個(gè)土類、30個(gè)亞類。本文將上述202個(gè)剖面的野外采樣數(shù)據(jù)及實(shí)驗(yàn)室土壤理化數(shù)據(jù)存儲(chǔ)于SQLite數(shù)據(jù)庫(kù)中,檢索過程和結(jié)果通過ETE3庫(kù)顯示。選取《中國(guó)土系志.湖北卷》中編號(hào)為42-140的代表性單個(gè)土體進(jìn)行測(cè)試,如圖1,其高級(jí)分類單元檢索結(jié)果為“普通簡(jiǎn)育水耕人為土”。不同節(jié)點(diǎn)使用不同符號(hào)表示當(dāng)前級(jí)別的檢索結(jié)果。
圖1 系統(tǒng)測(cè)試結(jié)果Fig. 1 Result of the system test
本文基于土壤地理學(xué)和CST分類知識(shí),從領(lǐng)域本體的角度分析土壤的空間結(jié)構(gòu)以及與診斷對(duì)象、土壤類型的隸屬關(guān)系,建立了土壤實(shí)體的本體模型、土壤類型和診斷對(duì)象的本體模型和土壤特征模型,使用Python語言完成了模型的定義??偨Y(jié)在CST檢索過程中存在的不同判斷比較等結(jié)構(gòu),提取土壤分類檢索中的基礎(chǔ)謂詞,定義相應(yīng)的關(guān)系謂詞表達(dá)模型內(nèi)部類型之間的邏輯關(guān)系,表達(dá)土壤實(shí)體與CST對(duì)象之間的隸屬關(guān)系,采用謂詞邏輯的表達(dá)方式來實(shí)現(xiàn)土壤類型的檢索,在本體概念的基礎(chǔ)上建立更加符合自然語義土壤系統(tǒng)分類檢索系統(tǒng)。
與其他已有的檢索模型相比,本文的檢索模型具有以下三方面的優(yōu)點(diǎn):首先,本文從土壤實(shí)體空間結(jié)構(gòu)的角度將土壤信息的載體區(qū)分為聚合土體、單個(gè)土體、剖面、土層和土壤基質(zhì)等結(jié)構(gòu),建立相互之間的組合關(guān)系,建立土壤個(gè)體類型判斷的表達(dá)方式,并能降低分類規(guī)則表達(dá)的復(fù)雜度。其次,模型在結(jié)構(gòu)上具有高內(nèi)聚低耦合的特性,將檢索規(guī)則與檢索框架剝離開來,能更好地支撐檢索體系的更新與擴(kuò)展;最后,從知識(shí)判別的角度來看,本文不再以土壤特征作為判別對(duì)象,而是將其封裝在土壤實(shí)體、診斷對(duì)象以及土壤類型之中,將判別對(duì)象提升至范疇的高度,通過邏輯謂詞直接表達(dá)對(duì)象之間的隸屬關(guān)系,即“是”或“不是”、“屬于”或“不屬于”,與傳統(tǒng)的條件嵌套語句相比,這種判別方式更符合人類的認(rèn)知。
雖然本文的檢索系統(tǒng)在模型構(gòu)建上已基本完備,但系統(tǒng)在實(shí)現(xiàn)過程中仍存在不足之處,主要包括以下兩方面:1)土壤特征的語義問題。土壤信息來源廣泛,獲取的方法也不同。例如鐵的測(cè)定方法,包括鄰菲羅啉比色法、原子吸收光譜法等。不同方法得到的土壤特征雖然名稱相同,但語義上存在差異,因此本文系統(tǒng)中所有的土壤特征需要通過建立語義字典進(jìn)行統(tǒng)一規(guī)范化表達(dá),其字典包含特征的唯一標(biāo)識(shí)(ID)、特征名稱(Name)、語義描述(Description)、獲取方法(Analysis method)和量綱(Unit)。2)形態(tài)學(xué)特征無法定量化的問題。如水耕表層中的“糊泥化(Puddling)”缺乏具體定義,無法定量化表達(dá)。此外,有些對(duì)屬性值變化描述過泛,如干旱正常鹽成土的條件中有“忽高”、“忽低”、“不規(guī)則”缺少具體的變化界限,檢索系統(tǒng)需要構(gòu)造多種謂詞表達(dá)式及其替代關(guān)系。
本文對(duì)土壤進(jìn)行確定性的類型識(shí)別,分類結(jié)果的準(zhǔn)確性依賴于土壤數(shù)據(jù)的精度。但在實(shí)際情況中土壤數(shù)據(jù)存在誤差,如野外觀測(cè)誤差、專家經(jīng)驗(yàn)性判斷、實(shí)驗(yàn)室分析的儀器誤差、人工誤差等。土壤數(shù)據(jù)的缺失也會(huì)影響檢索結(jié)果,因此在接下來的研究中可考慮添加補(bǔ)充替代信息,如用計(jì)量土壤學(xué)信息補(bǔ)充土壤形態(tài)學(xué)信息,借助RS和DEM信息補(bǔ)充土壤發(fā)生環(huán)境信息,通過現(xiàn)代傳感器手段,如X射線熒光光譜分析(X-Ray Fluorescence spectrum method,XRF)獲取的土壤重金屬作為輔助信息等。此外,還可加入不確定信息,如模糊信息、未知信息和隨機(jī)信息等,將系統(tǒng)擴(kuò)展為不確定性分類系統(tǒng),綜合統(tǒng)計(jì)學(xué)理論,實(shí)現(xiàn)對(duì)土壤類型的預(yù)測(cè)并給出相應(yīng)概率。