李揚
摘 要:機器學(xué)習(xí)是研究機器如何來模擬人類學(xué)習(xí)的一門學(xué)科,通過識別現(xiàn)有知識來獲取新的知識,達到溫故而知新的效果。該文介紹了機器學(xué)習(xí)在農(nóng)業(yè)各領(lǐng)域的應(yīng)用現(xiàn)狀,并對其在農(nóng)業(yè)生產(chǎn)上的應(yīng)用前景進行了展望,以期推動機器學(xué)習(xí)在農(nóng)業(yè)領(lǐng)域更廣泛的應(yīng)用。
關(guān)鍵詞:機器學(xué)習(xí);農(nóng)業(yè)領(lǐng)域;應(yīng)用現(xiàn)狀;前景
中圖分類號 TP181文獻標(biāo)識碼 A文章編號 1007-7731(2021)01-0164-03
Application Status and Prospect of Machine Learning in Agriculture
LI Yang
(College of Information Engineering, Tarim University, Alar 843300,China)
Abstract: Machine learning is a discipline that studies how machines simulate human learning, and acquires new knowledge by identifying existing knowledge, so as to gain new knowledge through reviewing the past. In this paper, the application status of machine learning in various fields of agriculture is introduced, and the application prospect of machine learning in agricultural production is prospected, in order to promote the wider application of machine learning in agricultural field.
Key words: Machine learning;Agricultural field;Status;Prospect
經(jīng)濟發(fā)展滯后,第二、三產(chǎn)業(yè)不發(fā)達,都不會對全球發(fā)展造成重大影響,但第一產(chǎn)業(yè)的發(fā)展落后一定會出現(xiàn)饑餓危機[1],因此農(nóng)業(yè)對全球經(jīng)濟發(fā)展至關(guān)重要,消除饑餓是全球經(jīng)濟發(fā)展的前提,也是世界可持續(xù)發(fā)展的難題。學(xué)習(xí)是人類具備的一種重要智能行為,而機器學(xué)習(xí)是研究機器如何來模擬人類學(xué)習(xí)的一門學(xué)科,通過識別現(xiàn)有知識來獲取新的知識,達到溫故而知新的效果。機器學(xué)習(xí)促進了人工智能的發(fā)展,人工智能的迅速發(fā)展又反過來為機器學(xué)習(xí)帶來了大量的數(shù)據(jù)訓(xùn)練集。農(nóng)業(yè)發(fā)展是世界發(fā)展的基礎(chǔ),當(dāng)今各行各業(yè)飛速發(fā)展,農(nóng)業(yè)更要與時俱進,與時代的前沿科技相結(jié)合。由此可見,農(nóng)業(yè)與機器學(xué)習(xí)技術(shù)的結(jié)合將是大勢所趨。
1 機器學(xué)習(xí)
1.1 概念 機器學(xué)習(xí)就是在已知經(jīng)驗基礎(chǔ)上建立一個自動學(xué)習(xí)機,學(xué)習(xí)機能夠在這些經(jīng)驗中獲得新的知識,以解決新的問題。根據(jù)SAS的定義,機器學(xué)習(xí)是人工智能的核心,屬于一種數(shù)據(jù)分析的途徑,數(shù)據(jù)分析結(jié)束后進行半自動建?;蜃詣咏?,其宗旨就是減少人類干預(yù),機器自行運行、自行分析、自行學(xué)習(xí)、自行解決問題[2]。機器學(xué)習(xí)中包含了大量的學(xué)習(xí)算法,不同的算法都有各自的優(yōu)缺點,在各領(lǐng)域應(yīng)用的優(yōu)勢也不同,因此機器學(xué)習(xí)在眾多領(lǐng)域都有廣泛的應(yīng)用。
1.2 歷史 機器學(xué)習(xí)起始于神經(jīng)心理學(xué)研究[3],由赫布理論開啟機器學(xué)習(xí)的篇章[4],主要研究遞歸神經(jīng)網(wǎng)絡(luò)中節(jié)點之間的相關(guān)性。機器學(xué)習(xí)的發(fā)展歷程可以分為5個階段:第1階段是1936—1957年。1936年Fisher發(fā)明了線性判別分析,當(dāng)時還沒有機器學(xué)習(xí)的概念。線性判別分析是一種數(shù)據(jù)降維算法,它通過線性變換將向量投影到低維空間中,保證投影后同一種類型的樣本差異很小,不同類型的樣本盡量不同。貝葉斯分類器起步于20世紀(jì)50年代,是基于貝葉斯決策理論建立起來的。該階段的機器學(xué)習(xí)屬于摸索階段。第2階段是1958—1966年。1958年出現(xiàn)了logistic回歸、感知器模型。logistic回歸直接預(yù)測出一個樣本屬于正樣本的概率,感知器模型可看作是人工神經(jīng)網(wǎng)絡(luò)的前身。在這個階段,機器可以使用符號來描述概念,各種概念假設(shè)被提出。該階段的機器學(xué)習(xí)屬于平靜階段。第3階段是1967—1985年。1967年kNN算法誕生,這是一種基于模板匹配思想的算法,簡單有效,至今仍在被使用。該階段的機器學(xué)習(xí)屬于復(fù)興階段。第4階段是1986—2005年。1986年誕生了用于訓(xùn)練多層神經(jīng)網(wǎng)絡(luò)的真正意義上的反向傳播算法,這是目前深度學(xué)習(xí)中仍被使用的訓(xùn)練算法,奠定了神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)。該階段的機器學(xué)習(xí)屬于成型階段。第5階段是2006年至今。該階段的標(biāo)志是2006年深度學(xué)習(xí)算法的出現(xiàn),使得機器學(xué)習(xí)成為各領(lǐng)域的寵兒,深度網(wǎng)絡(luò)更是成為最熱門的算法。該階段的機器學(xué)習(xí)屬于發(fā)展階段。
2 機器學(xué)習(xí)在農(nóng)業(yè)領(lǐng)域的應(yīng)用
機器學(xué)習(xí)是我國農(nóng)業(yè)進入智能化必不可缺的關(guān)鍵,它是人工智能的核心,可以運用到農(nóng)業(yè)全產(chǎn)業(yè)鏈中,提高整個農(nóng)業(yè)鏈條的速率,還能預(yù)測農(nóng)產(chǎn)品產(chǎn)量[5]。
2.1 在現(xiàn)代農(nóng)業(yè)氣象上的應(yīng)用 農(nóng)業(yè)氣象工作中非常重要的一項數(shù)據(jù)任務(wù)就是制作土地覆蓋和繪制農(nóng)作物類型圖[6]。近年來,完成制圖任務(wù)最熱門的應(yīng)用技術(shù)就是集成學(xué)習(xí)和深度學(xué)習(xí)。對于復(fù)雜的地形地貌,深度學(xué)習(xí)和集成學(xué)習(xí)在處理分類方面具有更大優(yōu)勢。Yang[7]的研究表明,與其他機器學(xué)習(xí)方法相比,神經(jīng)學(xué)習(xí)對土地覆蓋和農(nóng)作物分類具有明顯優(yōu)勢。
雜草的檢測也是機器學(xué)習(xí)在農(nóng)業(yè)氣象方面的重要應(yīng)用。有農(nóng)業(yè)專家認(rèn)為,雜草才是造成農(nóng)作物減產(chǎn)的根本原因。不論這個理論是否正確,雜草確實是影響農(nóng)作物產(chǎn)量的重要原因,而使用機器學(xué)習(xí)和遙感技術(shù)相結(jié)合,利用機器視覺來識別雜草,從而進行雜草檢測,可以大大減少除草藥劑量,縮短人工時長,提高食品安全性。Karimi[8]通過機器學(xué)習(xí)實現(xiàn)了對玉米田間雜草的識別。但總體而言,目前機器學(xué)習(xí)在國內(nèi)農(nóng)業(yè)氣象方面的應(yīng)用還相對落后,相關(guān)科研成就直到2015年之后才有所報道。
2.2 在農(nóng)作物產(chǎn)物檢測方面的應(yīng)用 機器學(xué)習(xí)在農(nóng)作物產(chǎn)物檢測方面的應(yīng)用主要是對果實的檢測,通過機器視覺和人工智能實現(xiàn)對果實的自動檢測。張磊等[9]運用Faster-RCNN檢測模型對桃子、蘋果、橙子3種水果進行檢測,設(shè)置了4個場景的測試,即稀疏型、密集型、遠景拍攝、遮擋重疊,準(zhǔn)確率達90%以上。該技術(shù)與采摘機器人配合,實現(xiàn)了對果實好壞的有效分辨及高效率采摘。但由于果園等田間地況復(fù)雜,因此仍需繼續(xù)提高魯棒性,以提高模型性能。
2.3 在土壤屬性檢測方面的應(yīng)用 了解一個地區(qū)土地的土壤屬性,測定該土地的pH、SSC、SOM等指標(biāo)信息,科學(xué)合理分析這塊土地應(yīng)該做什么,是否適合種植農(nóng)作物,這對于農(nóng)業(yè)生產(chǎn)規(guī)劃至關(guān)重要。傳統(tǒng)的土壤采樣范圍過大,耗時耗力,且精度不高,而使用遙感技術(shù)和人工智能技術(shù)測定土壤屬性,可以極大縮短測定時間,提高工作效率。相關(guān)應(yīng)用也屢見不鮮,如ZHU[10]等運用solm模型測定美國蒙大拿州的土壤屬性;張振華等[11]使用Cubist和Bagging 3模型對新疆渭干河—庫車河綠洲干旱區(qū)進行了預(yù)測,發(fā)現(xiàn)其結(jié)果符合實際,且精準(zhǔn)度較高。
2.4 在育種方面的應(yīng)用 機器學(xué)習(xí)可以利用農(nóng)作物的基因表現(xiàn),預(yù)測篩選出優(yōu)良基因組合的農(nóng)作物,而這些農(nóng)作物往往具有較好的生產(chǎn)價值及耐旱、高產(chǎn)、抗蟲等優(yōu)良特性。同時,機器學(xué)習(xí)還可縮短農(nóng)作物的育種周期。在“3000份亞洲水稻基因組研究”科研項目中,發(fā)表于《Nature》的《3010份亞洲栽培稻基因組研究》主要探究了亞洲水稻的出現(xiàn)及其基因異變的結(jié)構(gòu)。該成果為世界水稻研究作出了重大貢獻,揭示了水稻基因組的遺傳多樣性,為后續(xù)研究提供了理論基礎(chǔ),推動了世界水稻研究進程。
2.5 在智能化農(nóng)業(yè)方面的應(yīng)用 現(xiàn)今炙手可熱的無人化管理技術(shù),其核心就是人工智能。而人工智能核心就是機器學(xué)習(xí)。利用機器學(xué)習(xí)可以科學(xué)計算出一塊土地的肥料、水分、農(nóng)藥等的合理投放量,避免資源浪費或投放不足。同時,機器學(xué)習(xí)還可與各種傳感器進行搭配,收集農(nóng)業(yè)數(shù)據(jù),使農(nóng)業(yè)專家系統(tǒng)變得更加智能化。利用傳感器收集到的信息還可以快速分析農(nóng)作物目前面臨的情況及其生長所需的最適條件,為其創(chuàng)造最優(yōu)生長環(huán)境,最大程度避免影響農(nóng)作物生長的問題出現(xiàn)。
2.6 在病蟲害防治方面的應(yīng)用 對于病蟲害預(yù)防而言,傳統(tǒng)的人工診斷反應(yīng)慢、精準(zhǔn)度低,而以機器學(xué)習(xí)為核心的人工智能可以在第一時間發(fā)出警告;同時,農(nóng)業(yè)專家系統(tǒng)具有豐富的數(shù)據(jù)信息,可以快速準(zhǔn)確判斷出蟲害種類,針對性進行防治,將病蟲害對農(nóng)作物造成的傷害控制在較小的范圍內(nèi)[12]。
3 機器學(xué)習(xí)在農(nóng)業(yè)生產(chǎn)上的局限性
一方面,機器學(xué)習(xí)依賴數(shù)據(jù),而我國的智慧農(nóng)業(yè)發(fā)展較晚,收集的數(shù)據(jù)不夠全面,因此會一定程度上影響機器學(xué)習(xí)各種算法作出判斷的準(zhǔn)確性。另一方面,機器學(xué)習(xí)在農(nóng)業(yè)上收集數(shù)據(jù)的復(fù)雜程度較高,投入較大,因此需要的成本較高。農(nóng)業(yè)屬于投入大、收入薄類型的產(chǎn)業(yè),需要大量資本的投入和國家的大力扶持,因此機器學(xué)習(xí)在農(nóng)業(yè)生產(chǎn)上的應(yīng)用還存在諸多局限性。
4 機器學(xué)習(xí)在農(nóng)業(yè)發(fā)展方面的展望
在全民大數(shù)據(jù)時代,大數(shù)據(jù)空前發(fā)展,以機器學(xué)習(xí)為核心的人工智能也得到了快速發(fā)展,推動機器學(xué)習(xí)在農(nóng)業(yè)生產(chǎn)上的應(yīng)用已刻不容緩,但同時也要結(jié)合實際,尊重機器學(xué)習(xí)的發(fā)展規(guī)律及農(nóng)業(yè)領(lǐng)域的自身需求,不可盲目發(fā)展。在大田環(huán)境下建設(shè)高質(zhì)量的數(shù)據(jù)資源庫,雖然前期成本較高,但會極大提高管理效率,對推進無人化管理具有重要作用,也將逐漸成為農(nóng)業(yè)大數(shù)據(jù)技術(shù)體系的標(biāo)準(zhǔn)旗桿。我國從事農(nóng)作物種植的主體多數(shù)文化程度不高,農(nóng)業(yè)專業(yè)知識匱乏,因此農(nóng)業(yè)專家系統(tǒng)就顯得尤為重要?;谥R學(xué)習(xí)的機器學(xué)習(xí),模型的訓(xùn)練就是新知識的推理過程。農(nóng)業(yè)是一個基于專業(yè)知識和實踐經(jīng)驗的領(lǐng)域,具有充足數(shù)據(jù)庫的農(nóng)業(yè)專家系統(tǒng)可以為農(nóng)業(yè)發(fā)展作出積極的貢獻。
參考文獻
[1]Gollin D, Parente S,Rogerson R. The role of agriculture in development[J]. American Economic Review, 2002, 92(2):160-164.
[2]Wayne Thompson, Hui Li,Alison Bolen. Artificial intelligence,machine learning, deep learning and beyond Understanding AI technologies and how they lead to smart applications[J/OL].[2019-03-12].https://www.sas.com/zh_cn/insights/articles/big -data/artificial-intelligence-machine-learning-deep-learning-and-beyond.html.
[3]陳嘉博.機器學(xué)習(xí)算法研究及前景展望[J].信息通信,2017(6):5-6.
[4]夏天.機器學(xué)習(xí)及其算法與應(yīng)用研究[J].電腦知識與技術(shù),2017,13(15):156-157.
[5]王婷,崔運鵬,王健,等.認(rèn)知計算及其在農(nóng)業(yè)領(lǐng)域的應(yīng)用研究[J].農(nóng)業(yè)圖書報,2019,31(4):4-18.
[6]李穎,陳懷亮.機器學(xué)習(xí)技術(shù)在現(xiàn)代農(nóng)業(yè)氣象中的應(yīng)用[J].應(yīng)用氣象報,2020,31(3):257-266.
[7]Yang J, Zhao Y Q, Chan J C. Learning and transferring deep joint spectral-spatial features for hyper spectral classification[J].IEEE Trans Geo Sci Remote Sens,2017, 55(8):4729-4742.
[8]Karimi Y, Prasher S O,Patel R M, et al.Application of sup-port vector machine technology for weed and nitrogen stress detection in corn[J]. Computers and Electronics in Agriculture, 2006, 51(1/2):99-109.
[9]張磊,姜軍生,李昕昱,等.基于快速卷積神經(jīng)網(wǎng)絡(luò)的果園果實檢測試驗研究[J].中國農(nóng)機化學(xué)報,2020,41(10):183-190,210.
[10]ZHU A X, BAND L, VERTESSY R, et al. Derivation of soil properties using a soil 1and inference model (SoLIM)[J].Soil Science Society of America Journal, 1997, 61(2):523-533.
[11]張振華,丁建麗,王敬哲,等.集成土壤-環(huán)境關(guān)系與機器學(xué)習(xí)的干旱區(qū)土壤屬性數(shù)字制圖[J].中國農(nóng)業(yè)科學(xué):2020,53(3):563-573.
[12]裘炯良,周力沛,鄭劍寧,等.機器學(xué)習(xí)技術(shù)與病媒生物種屬鑒定[J].中華衛(wèi)生殺蟲藥械,2017(5):436-439.
(責(zé)編:徐世紅)