趙旖旎,陳建英,楊曙光,阮紹翔,高 丹
(1.西南民族大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,四川成都 610041;2.電子科技大學(xué)信息與軟件工程學(xué)院,四川 成都 610054)
當(dāng)前,農(nóng)技服務(wù)工作要么依托農(nóng)業(yè)專家的線上線下指導(dǎo),要么基于業(yè)務(wù)系統(tǒng)數(shù)據(jù)庫(kù)或?qū)iT(mén)的農(nóng)作物種植知識(shí)庫(kù)搭建的自動(dòng)應(yīng)答系統(tǒng). 相比之下,前者基本能滿足農(nóng)業(yè)種植個(gè)性化需求,但需要投入大量的人力物力,非借助政策或市場(chǎng)支持不能長(zhǎng)久;后者充分利用信息化技術(shù)實(shí)現(xiàn)了基于知識(shí)的農(nóng)作物種植自助服務(wù),其中,業(yè)務(wù)系統(tǒng)數(shù)據(jù)庫(kù)模式業(yè)務(wù)針對(duì)性強(qiáng),與農(nóng)作物種植技術(shù)相關(guān)的知識(shí)普遍較為分散,缺乏合理的組織與管理[1],在較高層次整合困難,因此,越來(lái)越多的自動(dòng)應(yīng)答系統(tǒng)更推崇知識(shí)庫(kù)模式.農(nóng)作物種植知識(shí)庫(kù)是農(nóng)作物領(lǐng)域知識(shí)的聚合體,為農(nóng)業(yè)生產(chǎn)者和經(jīng)營(yíng)者提供了多樣化的信息服務(wù)以及多元化的農(nóng)業(yè)技術(shù)支持[2-3],但在實(shí)際的應(yīng)用過(guò)程中仍然存在著地域、土壤、地理環(huán)境和氣候條件等差異性帶來(lái)的本地化問(wèn)題沒(méi)有得到妥善解決.
本文基于層次結(jié)構(gòu)的知識(shí)庫(kù)建模技術(shù),構(gòu)建通用的農(nóng)作物種植知識(shí)庫(kù),并為當(dāng)?shù)剞r(nóng)業(yè)專家提供修正知識(shí)庫(kù)的通道,以認(rèn)定采納或修正覆蓋的方式完成農(nóng)作物種植知識(shí)庫(kù)本地化過(guò)程,確保自動(dòng)應(yīng)答系統(tǒng)的本地技術(shù)指導(dǎo)有效性,提高農(nóng)技服務(wù)系統(tǒng)的服務(wù)質(zhì)量.
農(nóng)作物種植知識(shí)庫(kù)作為農(nóng)技服務(wù)應(yīng)用系統(tǒng)的重要組成部分,在提升為農(nóng)服務(wù)質(zhì)量的過(guò)程中發(fā)揮著重要的作用.相關(guān)學(xué)者針對(duì)農(nóng)作物種植相關(guān)知識(shí)展開(kāi)研究并提出了基于層次結(jié)構(gòu)的知識(shí)庫(kù)模型架構(gòu)如圖1所示[4-6].
圖1 通用農(nóng)作物種植知識(shí)庫(kù)模型架構(gòu)圖Fig.1 General crop planting knowledge Base Model Architecture Diagram
農(nóng)作物種植知識(shí)庫(kù)的構(gòu)建突出表現(xiàn)在知識(shí)獲取以及知識(shí)表示兩個(gè)方面[7].針對(duì)農(nóng)作物種植領(lǐng)域的零散知識(shí)對(duì)象,通過(guò)數(shù)據(jù)采集以及知識(shí)提取過(guò)程實(shí)現(xiàn)農(nóng)作物種植知識(shí)的獲取,采用知識(shí)表示技術(shù)完成通用農(nóng)作物種植知識(shí)庫(kù)的構(gòu)建,最后通過(guò)搭建交互接口實(shí)現(xiàn)為用戶提供知識(shí)瀏覽、知識(shí)檢索、知識(shí)共享等服務(wù)的功能.
通用農(nóng)作物種植知識(shí)庫(kù)對(duì)農(nóng)業(yè)信息資源的高效利用起到較好的推動(dòng)作用,但在實(shí)際的應(yīng)用過(guò)程中仍然存在著一些問(wèn)題:(1)大量與農(nóng)作物種植技術(shù)相關(guān)的信息缺乏有效的分類、定義和描述[8];(2)地域差異導(dǎo)致同一種農(nóng)作物存在不同的種植方法,本地化服務(wù)的欠缺嚴(yán)重影響了農(nóng)技自動(dòng)應(yīng)答系統(tǒng)的實(shí)用性;(3)未能積極引入當(dāng)?shù)亟?jīng)驗(yàn)豐富的專家對(duì)知識(shí)庫(kù)進(jìn)行修正與更新.為此,本文提出一種考慮了地域維度的農(nóng)作物種植知識(shí)庫(kù)本地化建模技術(shù),用以改善現(xiàn)有農(nóng)作物知識(shí)庫(kù)個(gè)性化問(wèn)題.
結(jié)合本地化農(nóng)作物種植知識(shí)庫(kù)的地域性及共享性構(gòu)建原則,設(shè)計(jì)了一個(gè)基于開(kāi)放式結(jié)構(gòu)的層次化農(nóng)作物種植知識(shí)庫(kù)模型架構(gòu),從上到下共有5 層:用戶層、服務(wù)層、業(yè)務(wù)邏輯層、處理層以及數(shù)據(jù)層. 如圖2所示:
圖2 農(nóng)作物種植知識(shí)庫(kù)本地化模型架構(gòu)圖Fig.2 Architecture diagram of localization model for crop planting knowledge base
用戶層位于知識(shí)庫(kù)的最頂層,是本地專家修正及更新知識(shí)的入口層.服務(wù)層是知識(shí)庫(kù)模型實(shí)現(xiàn)為用戶提供農(nóng)作物種植知識(shí)服務(wù)的功能層.業(yè)務(wù)邏輯層是實(shí)現(xiàn)知識(shí)表示與知識(shí)管理的功能層,也是構(gòu)建知識(shí)庫(kù)的核心層.處理層的知識(shí)來(lái)源為數(shù)據(jù)層,通過(guò)對(duì)知識(shí)進(jìn)行一系列處理完成對(duì)知識(shí)的存儲(chǔ)與更新.數(shù)據(jù)層是知識(shí)庫(kù)模型的基礎(chǔ)資源層,借助數(shù)據(jù)采集,數(shù)據(jù)清洗,數(shù)據(jù)融合等數(shù)據(jù)挖掘技術(shù)形成[9].五層結(jié)構(gòu)層層遞進(jìn)共同構(gòu)成了農(nóng)作物種植知識(shí)庫(kù)本地化模型,使得農(nóng)作物種植知識(shí)庫(kù)本地化模型具有開(kāi)放性、延展性、獨(dú)立性和交互性等特征.
根據(jù)農(nóng)作物種植知識(shí)庫(kù)本地化模型架構(gòu),自底向上的具體構(gòu)建步驟是首先根據(jù)知識(shí)分類挖掘大量與農(nóng)業(yè)相關(guān)的網(wǎng)站,利用Web 挖掘技術(shù)以及人工獲取方式從海量農(nóng)業(yè)數(shù)據(jù)中獲取知識(shí)并注入知識(shí)庫(kù)中,通過(guò)業(yè)務(wù)邏輯層對(duì)知識(shí)進(jìn)行合理表示及管理,最后通過(guò)為應(yīng)用系統(tǒng)提供接口更好的實(shí)現(xiàn)本地化服務(wù)功能.
合理分類知識(shí)是構(gòu)建本地化農(nóng)作物種植知識(shí)庫(kù)模型的必要條件. 為了實(shí)現(xiàn)本地化技術(shù)指導(dǎo),必須結(jié)合特定地區(qū)的地理環(huán)境以及氣候條件,因此,可將地域性作為分類農(nóng)作物種植知識(shí)的首要屬性.考慮到農(nóng)業(yè)信息具有一定的橫向無(wú)序性,借助知識(shí)標(biāo)引技術(shù)將農(nóng)作物種植本地知識(shí)庫(kù)分為品種知識(shí)、地區(qū)知識(shí)、種植技術(shù)知識(shí)和本地專家經(jīng)驗(yàn)知識(shí)4 個(gè)模塊.
知識(shí)獲取是指在確定知識(shí)范圍的條件下自動(dòng)或半自動(dòng)的從信息源獲取結(jié)構(gòu)化信息[10],它是構(gòu)造知識(shí)庫(kù)的基礎(chǔ).完成知識(shí)獲取的關(guān)鍵技術(shù)及過(guò)程如下:
圖3 知識(shí)獲取過(guò)程Fig.3 Knowledge acquisition process
(1)知識(shí)抽?。焊鶕?jù)農(nóng)作物種植知識(shí)庫(kù)本地化模型的知識(shí)分類,把蘊(yùn)含于信息源的知識(shí)采用Web 挖掘技術(shù)經(jīng)過(guò)識(shí)別、分析、理解、篩選、歸納整理等過(guò)程抽取潛在的有價(jià)值的知識(shí).主要用到的方法是實(shí)體名提取與語(yǔ)義類抽取.其中實(shí)體名提取的主要任務(wù)是從垂直站點(diǎn)中提取目標(biāo)知識(shí),利用命名實(shí)體識(shí)別技術(shù)從相關(guān)網(wǎng)頁(yè)及自然語(yǔ)言句子中進(jìn)行知識(shí)提取.語(yǔ)義類抽取的任務(wù)是通過(guò)從文本中抽取信息來(lái)建立實(shí)體和語(yǔ)義的關(guān)聯(lián)關(guān)系.
(2)知識(shí)轉(zhuǎn)換:將抽取的農(nóng)作物種植領(lǐng)域中的顯性知識(shí)及隱性知識(shí)完成從網(wǎng)頁(yè)及文檔到知識(shí)的轉(zhuǎn)換.
(3)知識(shí)存儲(chǔ):通過(guò)編譯將模型所表示的知識(shí)注入到知識(shí)庫(kù)中.
(4)知識(shí)檢驗(yàn):通過(guò)對(duì)注入的知識(shí)進(jìn)行檢驗(yàn)確保知識(shí)庫(kù)的正確性.
知識(shí)表示是將領(lǐng)域知識(shí)和專家經(jīng)驗(yàn)等有效地表示成計(jì)算機(jī)能夠工作和運(yùn)行的形式[11]. 通過(guò)發(fā)現(xiàn)知識(shí)與表達(dá)之間的映射把事實(shí)、規(guī)則、概念編碼為合適的數(shù)據(jù)結(jié)構(gòu)并用計(jì)算機(jī)可以理解的語(yǔ)言將農(nóng)作物種植領(lǐng)域知識(shí)形式化、結(jié)構(gòu)化.
目前常用的知識(shí)表示方法主要有邏輯表示法、產(chǎn)生式表示法、框架表示法、面向?qū)ο蟮谋硎痉椒ā⒄Z(yǔ)義網(wǎng)絡(luò)表示法以及本體表示法等[12]. 為了突出本地化特征,我們采用了由“框架”表示法、“規(guī)則架+規(guī)則體”構(gòu)成的綜合知識(shí)表示方法. 該知識(shí)表示方法是以“框架”表示為主體,將“規(guī)則架+規(guī)則體”表示的規(guī)則嵌入到框架中更好的達(dá)到相互融合相互調(diào)用的目的.
框架(Frame)是儲(chǔ)存事物所有知識(shí)的一種復(fù)雜的數(shù)據(jù)結(jié)構(gòu)[13].“框架”表示法通常采用的是“節(jié)點(diǎn)-槽-值”的表示結(jié)構(gòu),主要用于描述復(fù)雜事物內(nèi)部結(jié)構(gòu)以及復(fù)雜事物之間的類屬關(guān)系.采用“框架”表示法能夠?qū)⑺搶?duì)象的屬性通過(guò)實(shí)體或?qū)嶓w集的形式表示出來(lái).框架的存儲(chǔ)結(jié)構(gòu)如下表1 所示,其中rule 欄中存儲(chǔ)的是“規(guī)則架+規(guī)則體”表示中所定義的規(guī)則.
表1 “框架”表示法的存儲(chǔ)結(jié)構(gòu)Table 1 Storage structure of "frame" representation
“規(guī)則架+規(guī)則體”的知識(shí)表示方法是產(chǎn)生式規(guī)則表示的最新發(fā)展,通常用于表示具有因果關(guān)系的知識(shí)[14],由規(guī)則架和規(guī)則體兩層形成一個(gè)規(guī)則組,其中一個(gè)規(guī)則組相當(dāng)于一個(gè)子問(wèn)題. 其基本表示形式是:IF P THEN Q,其中 P 是前提條件,Q 是結(jié)論[15].形式化表示為:
規(guī)則架(n):
IFP1,P2,P3…,PnTHENQ1,Q2,Q3,…,Qn
規(guī)則體:
IF(P1=A)∩(P2= B)∩(P3= C)…THEN Q(q1,q2,q3,…,qn)
可信度:
CF(Q,P)
其中規(guī)則架(n)中的n 指的是規(guī)則架編號(hào). 規(guī)則體中的A,B,C… 是變量因素,其值可表示前提條件P范圍內(nèi)的因素,規(guī)則體中的前提條件之間可表示為“與”的關(guān)系.可信度是指根據(jù)前提條件得出結(jié)論為真的可相信程度,其取值范圍為[ 0,1],其值由當(dāng)?shù)貦?quán)威農(nóng)業(yè)專家給出.
農(nóng)作物種植知識(shí)庫(kù)本地化模型構(gòu)建中規(guī)則架的前提條件由種植品種和種植地區(qū)組成,結(jié)論為具體種植技術(shù).規(guī)則體表示的是規(guī)則架中具體屬性值的推導(dǎo).形式化表示為:
規(guī)則架前提::= <種植品種,種植地區(qū)>
規(guī)則架結(jié)論::= <種植技術(shù)>
規(guī)則體前提::= <種植品種名稱,種植地區(qū)名稱(氣候條件,土壤條件,環(huán)境因素,其他影響種植因素)>
規(guī)則體結(jié)論::= <本地化種植技術(shù)>
規(guī)則組法能夠?qū)⑼愔R(shí)如種植技術(shù)領(lǐng)域的知識(shí)集中于同一個(gè)規(guī)則組中,將“框架”表示法表示的描述型知識(shí)與過(guò)程型知識(shí)及邏輯型知識(shí)三者集成于一體,采用具有層次結(jié)構(gòu)描述的規(guī)則組形式將本地化種植技術(shù)這一子問(wèn)題更清晰的表達(dá)出來(lái),使推理更具有邏輯性.
知識(shí)管理通過(guò)對(duì)農(nóng)作物種植知識(shí)庫(kù)本地化模型中海量且繁雜的數(shù)據(jù)進(jìn)行有效管理,從而提高知識(shí)庫(kù)存取知識(shí)的效率.知識(shí)管理時(shí)序圖如下圖4 所示.
圖4 知識(shí)管理時(shí)序圖Fig.4 Knowledge management sequence diagram
下面以農(nóng)作物櫻桃的知識(shí)表示為例,構(gòu)建四川省涼山彝族自治州冕寧縣櫻桃的種植技術(shù)知識(shí)庫(kù),加以說(shuō)明上述知識(shí)庫(kù)模型的實(shí)用性.首先通過(guò)網(wǎng)絡(luò)采集以及人工獲取方式獲取冕寧縣相關(guān)數(shù)據(jù)、櫻桃種植相關(guān)數(shù)據(jù)以及冕寧縣農(nóng)業(yè)專家種植櫻桃的經(jīng)驗(yàn)知識(shí),借助數(shù)據(jù)處理技術(shù)使用MySQL 8.0 存儲(chǔ)知識(shí)和管理規(guī)則知識(shí),然后通過(guò)知識(shí)表示技術(shù)以及知識(shí)管理工作構(gòu)建冕寧縣櫻桃種植知識(shí)庫(kù).冕寧縣農(nóng)作物櫻桃的種植技術(shù)知識(shí)表示如下:
規(guī)則架(RS):IF 種植品種,種植地區(qū) THEN 播種季節(jié),播種方式,播種深度,施肥量,栽培密度,栽培深度
規(guī)則體(RB):
IF 種植品種 = 櫻桃 THEN
播種季節(jié) = 春季∨秋季
播種方式 = 條播∨精量播種
播種深度 = 3 ~6 cm
施肥量 = 尿素加硼砂再加六百倍的磷酸二氫鉀
種植密度 = 土地瘠薄地10 ~15 公分 ∨ 土地平坦肥沃地15 ~20 公分
種植深度 = 秋播4 ~6 公分 ∨ 春播1.5 ~4公分
IF(種植地區(qū) = 冕寧縣)∧(種植品種 = 櫻桃)THEN
播種季節(jié) = 春季
播種方式 = 條播
播種深度 = 3 cm
施肥量 = 0.3%尿素、0.1 -0.2%硼砂、0.2 -0.4%鉀混合液
種植密度 = 播幅寬五公分,行距二十公分
種植深度 = 3 公分
冕寧縣櫻桃種植知識(shí)庫(kù)的工作原理是根據(jù)冕寧縣自身的地理環(huán)境,氣候條件、土壤類型等因素并結(jié)合農(nóng)作物櫻桃自身的種植特性推導(dǎo)出櫻桃在冕寧縣的具體種植技術(shù),并向冕寧縣的農(nóng)戶提供櫻桃種植技術(shù)服務(wù),切實(shí)解決農(nóng)技指導(dǎo)本地化服務(wù)問(wèn)題. 冕寧縣櫻桃種植知識(shí)庫(kù)工作原理如圖5 所示.
圖5 冕寧縣櫻桃種植知識(shí)庫(kù)工作原理圖Fig.5 Schematic diagram of cherry planting knowledge base in Mianning County
本文通過(guò)發(fā)現(xiàn)并且整合現(xiàn)有的農(nóng)作物種植技術(shù)信息資源,結(jié)合本地種植經(jīng)驗(yàn)和當(dāng)?shù)剞r(nóng)業(yè)專家知識(shí),提出了一種基于開(kāi)放式結(jié)構(gòu)的層次化農(nóng)作物種植知識(shí)庫(kù)模型,并將大數(shù)據(jù)時(shí)代下的數(shù)據(jù)挖掘技術(shù)和農(nóng)業(yè)種植實(shí)際問(wèn)題相結(jié)合,采用知識(shí)庫(kù)建模技術(shù)構(gòu)建了基于本地化的農(nóng)作物種植知識(shí)庫(kù),并對(duì)構(gòu)建過(guò)程中的關(guān)鍵技術(shù)進(jìn)行了研究.研究成果可復(fù)用于特定地域的農(nóng)技指導(dǎo)相關(guān)應(yīng)用系統(tǒng)的研發(fā),并且具有廣泛的應(yīng)用價(jià)值,能夠?qū)崒?shí)在在的解決農(nóng)民耕作過(guò)程中的技術(shù)指導(dǎo)本地化需求,對(duì)解決三農(nóng)問(wèn)題具有重要的現(xiàn)實(shí)意義.
西南民族大學(xué)學(xué)報(bào)(自然科學(xué)版)2020年2期