摘 要: 針對多源、異構(gòu)農(nóng)業(yè)農(nóng)村數(shù)據(jù)資源難以有效相互理解和共享利用的問題,提出了一種基于本體論的數(shù)據(jù)組織方法。從村級數(shù)據(jù)資源組織和共享的角度出發(fā),探討構(gòu)建所需本體的方法路徑。基于案例試驗,闡述了如何將本體應(yīng)用于村級數(shù)據(jù)資源的組織、共享,以及將基于規(guī)則的本體推理應(yīng)用于村級數(shù)據(jù)資源開發(fā)利用,最后提出了本體在農(nóng)業(yè)農(nóng)村數(shù)據(jù)資源管理、共享、挖掘中的應(yīng)用場景展望。
關(guān)鍵詞:本體;村級數(shù)據(jù)資源;數(shù)據(jù)共享;本體推理
中圖分類號:S126 文獻(xiàn)標(biāo)識碼:A 文章編號:2095-1795(2023)07-0029-06
DOI:10.19998/j.cnki.2095-1795.2023.07.005
0 引言
隨著信息技術(shù)在農(nóng)業(yè)農(nóng)村經(jīng)濟(jì)社會發(fā)展中的應(yīng)用推進(jìn),農(nóng)業(yè)農(nóng)村數(shù)據(jù)資源整合共享的重要性日益顯現(xiàn)?!稊?shù)字鄉(xiāng)村發(fā)展戰(zhàn)略綱要》《數(shù)字農(nóng)業(yè)農(nóng)村發(fā)展規(guī)劃(2019—2025 年)》等文件均指出,要推進(jìn)數(shù)據(jù)融合、挖掘與應(yīng)用,推動農(nóng)業(yè)農(nóng)村基礎(chǔ)數(shù)據(jù)整合共享。未來越來越多的多源、異構(gòu)的數(shù)據(jù)匯聚后,如何有效地理解、組織和應(yīng)用,是當(dāng)前面臨的一個難題。本研究應(yīng)用計算機(jī)科學(xué)領(lǐng)域的本體論探討解決方案。
本體是共享概念模型的明確形式化規(guī)范說明,是用人和計算機(jī)都可以識別的術(shù)語及關(guān)系描述某一領(lǐng)域內(nèi)的實體、概念、屬性,以及概念實體之間的相互關(guān)系[1]。通過本體形式化、規(guī)范化的表示,不同的數(shù)據(jù)設(shè)計者和使用者可以對數(shù)據(jù)的表達(dá)和使用方式達(dá)成共識,實現(xiàn)知識融合和數(shù)據(jù)融合。WACHE H 等[2] 提出了利用本體將不同異構(gòu)的數(shù)據(jù)源中的數(shù)據(jù)/信息有效整合。這種方法在生物信息學(xué)和生物醫(yī)藥學(xué)領(lǐng)域已得到大量的實踐,在大數(shù)據(jù)整合與復(fù)用的過程中發(fā)揮著日益重要的作用[3]。另外,在交通異構(gòu)數(shù)據(jù)集成、政務(wù)異構(gòu)數(shù)據(jù)集成等領(lǐng)域也有相關(guān)研究[4-5]。在農(nóng)業(yè)領(lǐng)域,聯(lián)合國糧農(nóng)組織(FAO)自2001 年開始建設(shè)農(nóng)業(yè)本體論服務(wù)(AOS)項目,在多語種農(nóng)業(yè)敘詞表的基礎(chǔ)上構(gòu)建農(nóng)業(yè)本體。本體在農(nóng)業(yè)信息分類、信息庫和知識庫構(gòu)建、智能搜索引擎研發(fā)及信息協(xié)同服務(wù)等方面具有廣泛的應(yīng)用前景[6]。已開展的研究主要應(yīng)用在農(nóng)業(yè)科研文獻(xiàn)檢索、農(nóng)業(yè)生產(chǎn)知識服務(wù)系統(tǒng)、農(nóng)業(yè)知識庫構(gòu)建[7-11]。