牟文芊
摘要: 機(jī)器學(xué)習(xí)是人工智能的核心內(nèi)容之一,其應(yīng)用已經(jīng)滲透到了人類社會(huì)的各個(gè)領(lǐng)域。本文闡述了機(jī)器學(xué)習(xí)的基本概念和基本原理,介紹了幾種常用的機(jī)器學(xué)習(xí)方法的基本概念和基本原理。在此基礎(chǔ)上,以農(nóng)業(yè)為背景,介紹了機(jī)器學(xué)習(xí)技術(shù)在現(xiàn)代農(nóng)業(yè)中的應(yīng)用。
【關(guān)鍵詞】現(xiàn)代農(nóng)業(yè) 機(jī)器學(xué)習(xí) 人工智能
1 引言
農(nóng)業(yè)農(nóng)村發(fā)展關(guān)系到我國(guó)實(shí)現(xiàn)小康社會(huì)的戰(zhàn)略目標(biāo)能否如期實(shí)現(xiàn),而現(xiàn)代農(nóng)業(yè)則是推動(dòng)農(nóng)業(yè)農(nóng)村發(fā)展的關(guān)鍵要素。機(jī)器學(xué)習(xí)是人工智能研究的核心之一,將機(jī)器學(xué)習(xí)應(yīng)用于現(xiàn)代農(nóng)業(yè)生產(chǎn)中,能夠有效地推動(dòng)現(xiàn)代農(nóng)業(yè)的發(fā)展,推進(jìn)實(shí)現(xiàn)農(nóng)業(yè)生產(chǎn)自動(dòng)化和智能化,提高農(nóng)業(yè)生產(chǎn)的效率。
2 機(jī)器學(xué)習(xí)
機(jī)器學(xué)習(xí)是讓計(jì)算機(jī)模擬人的學(xué)習(xí)活動(dòng),獲取新知識(shí)、不斷改善性能和實(shí)現(xiàn)自身完善的智能方法。機(jī)器學(xué)習(xí)方法分為有監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí)。
2.1 有監(jiān)督學(xué)習(xí)
有監(jiān)督學(xué)習(xí)首先利用有標(biāo)號(hào)的樣本進(jìn)行訓(xùn)練,構(gòu)建相應(yīng)的學(xué)習(xí)模型。再利用該模型對(duì)未知樣本數(shù)據(jù)進(jìn)行分類和預(yù)測(cè)。這個(gè)學(xué)習(xí)過(guò)程與人類認(rèn)識(shí)事物的過(guò)程非常相似。
2.2 無(wú)監(jiān)督學(xué)習(xí)
無(wú)監(jiān)督學(xué)習(xí)是通過(guò)對(duì)無(wú)標(biāo)簽樣本進(jìn)行的學(xué)習(xí),即事先并不需要知道樣本的類別,而是通過(guò)某種方法,按照相似度的大小進(jìn)行分類。這種學(xué)習(xí)方法直接對(duì)數(shù)據(jù)進(jìn)行建模,并不需要任何訓(xùn)練樣本。
2.3 半監(jiān)督學(xué)習(xí)
半監(jiān)督學(xué)習(xí)是有監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí)的結(jié)合,是利用有類標(biāo)號(hào)的數(shù)據(jù)和無(wú)類標(biāo)號(hào)的數(shù)據(jù)進(jìn)行學(xué)習(xí)的過(guò)程。其特點(diǎn)是利用少量有標(biāo)號(hào)樣本和大量無(wú)標(biāo)號(hào)樣本進(jìn)行機(jī)器學(xué)習(xí)。現(xiàn)實(shí)世界尤其是現(xiàn)代農(nóng)業(yè)中通常存在大量的未標(biāo)注樣本,但有標(biāo)記樣本則比較少,面對(duì)大量的無(wú)標(biāo)號(hào)樣本的標(biāo)注,費(fèi)時(shí)、費(fèi)力和成本較高。因此半監(jiān)督學(xué)習(xí)的研究對(duì)于實(shí)際應(yīng)用是非常有意義的。
下面介紹幾種常用的機(jī)器學(xué)習(xí)算法。
2.1 決策樹(shù)
決策樹(shù)( Decision Tree,DT)是一種常見(jiàn)的歸納學(xué)習(xí),能夠從一組無(wú)規(guī)則的事例中推理出決策樹(shù)的表示形式,常用來(lái)構(gòu)建或設(shè)計(jì)分類器和預(yù)測(cè)模型,對(duì)未知數(shù)據(jù)進(jìn)行分類或預(yù)測(cè)等。
決策樹(shù)算法包括兩個(gè)步驟:
(1)利用訓(xùn)練樣本數(shù)據(jù)來(lái)創(chuàng)建決策樹(shù)模型;
(2)利用創(chuàng)建的決策樹(shù)模型對(duì)新數(shù)據(jù)進(jìn)行分類。創(chuàng)建決策樹(shù)的流程如圖1所示,其中S表示訓(xùn)練樣本集,A表示分類樣本集合,N表示葉節(jié)點(diǎn)。
2.2 人工神經(jīng)網(wǎng)絡(luò)
人工神經(jīng)網(wǎng)絡(luò)( Artificial NeuralNetwork,ANN)是一種模仿自然界神經(jīng)網(wǎng)絡(luò)的功能和結(jié)構(gòu),通過(guò)調(diào)整內(nèi)部大量人工神經(jīng)元之間相互連接的權(quán)重,對(duì)信息進(jìn)行處理的數(shù)學(xué)模型。人工神經(jīng)元結(jié)構(gòu)由輸入向量、激活函數(shù)及輸出向量三部分組成。輸入向量X= {xo0,x1.. xn}與對(duì)應(yīng)的權(quán)值向量w= {w0,W1…Wn}分別相乘,再取和作為輸入值(
),w和x倒過(guò)來(lái)在激活函數(shù)的作用下輸出對(duì)應(yīng)的f(∑xi.wi+b),其中b為激活函數(shù)的閩值,人工神經(jīng)元的結(jié)構(gòu)如圖2所示。目前ANN已經(jīng)廣泛應(yīng)用于信息處理、預(yù)測(cè)分析等領(lǐng)域。
2.3 支持向量機(jī)
支持向量機(jī)是一種建立在統(tǒng)計(jì)學(xué)習(xí)理論基礎(chǔ)上的一種機(jī)器學(xué)習(xí)算法。這種算法在解決有限樣本、非線性、高維的模式分類等問(wèn)題中表現(xiàn)出許多獨(dú)特的優(yōu)勢(shì)。在深度學(xué)習(xí)的熱潮來(lái)臨之前,支持向量機(jī)一直在機(jī)器學(xué)習(xí)領(lǐng)域占有重要的地位。
支持向量機(jī)通過(guò)非線性映射,把樣本空間映射到更高維的特征空間中,使非線性可分問(wèn)題轉(zhuǎn)化為在特征空間中的線性可分。在一般情況下,升維使計(jì)算變得更加困難,但是支持向量機(jī)應(yīng)用核函數(shù)展開(kāi)定理解決了這個(gè)難題。如圖3所示,支持向量機(jī)使用一個(gè)超平面把訓(xùn)練集中兩類樣本分開(kāi),即兩類點(diǎn)分別在超平面的兩側(cè)。作為一種有效的機(jī)器學(xué)習(xí)工具,支持向量機(jī)廣泛地應(yīng)用于各個(gè)領(lǐng)域。
2.4 聚類
聚類是將數(shù)據(jù)集中的所有樣本根據(jù)相似度的大小進(jìn)行劃分,形成兩個(gè)或多個(gè)類的過(guò)程。聚類沒(méi)有訓(xùn)練過(guò)程,即聚類不需要樣本有標(biāo)號(hào),而分類需要有標(biāo)號(hào)的樣本進(jìn)行訓(xùn)練。常用的聚類算法是基于層次和基于劃分的聚類?;趯哟蔚木垲愔饕校浩胶獾鳒p聚類法、基于密度的聚類方法和使用代表點(diǎn)的聚類方法等;基于劃分的聚類方法主要有:K均值聚類算法、K中心點(diǎn)算法和隨機(jī)搜索聚類算法等。聚類算法常用于數(shù)據(jù)挖掘和模式識(shí)別中。其中K均值聚類算法最為常用,它采用距離作為相似性的評(píng)價(jià)指標(biāo),即認(rèn)為兩個(gè)樣本的距離越近,其相似度就越大。圖4為K均值聚類算法流程。
2.5 深度學(xué)習(xí)
深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)分支,它是在人工神經(jīng)網(wǎng)絡(luò)基礎(chǔ)上發(fā)展起來(lái)的,最早由加拿大多倫多大學(xué)辛頓教授于2006年提出。深度學(xué)習(xí)中的“深度”,是相對(duì)于支持向量機(jī)和多層感知機(jī)等“淺層學(xué)習(xí)”方法而言的。深度學(xué)習(xí)與“淺層學(xué)習(xí)”相比,非線性操作的層級(jí)數(shù)更多。它通過(guò)對(duì)原始輸入進(jìn)行逐層特征變換,能夠自動(dòng)地學(xué)習(xí)得到輸入數(shù)據(jù)特征的表示,因此在分類問(wèn)題上取得了更好的效果。常用的深度學(xué)習(xí)方法有CNN和自動(dòng)編碼器等。目前深度學(xué)習(xí)已經(jīng)在圖像識(shí)別和語(yǔ)音識(shí)別中的應(yīng)用取得了突破性的進(jìn)展。2012年,Hinton團(tuán)隊(duì)在ImageNet圖片分類大賽中,使用深度學(xué)習(xí)技術(shù)取得了冠軍。
3 機(jī)器學(xué)習(xí)技術(shù)在現(xiàn)代農(nóng)業(yè)中的應(yīng)用
機(jī)器學(xué)習(xí)技術(shù)在現(xiàn)代農(nóng)業(yè)中正在發(fā)揮著積極的重要作用,本文主要從5個(gè)方面闡述如下。
3.1 作物育種
作物育種是一種通過(guò)改良作物的遺傳特性,來(lái)培育高產(chǎn)優(yōu)質(zhì)品種的技術(shù)。農(nóng)業(yè)育種專家通過(guò)尋找優(yōu)良性狀來(lái)提高農(nóng)作物產(chǎn)量,更高效地利用水分、養(yǎng)分,適應(yīng)氣候變化和抵御病蟲(chóng)害,實(shí)現(xiàn)農(nóng)業(yè)作物的高產(chǎn)和穩(wěn)產(chǎn)等。植株遺傳優(yōu)良性狀的關(guān)鍵在于必須找到其對(duì)應(yīng)的基因序列。機(jī)器學(xué)習(xí)技術(shù)能夠分析以往的農(nóng)田數(shù)據(jù),包括農(nóng)作物在不同氣候條件下的表現(xiàn)和某種特定表型的遺傳性等,挖掘出其中的關(guān)聯(lián)規(guī)則,然后搭建概率模型,預(yù)測(cè)哪些基因最有可能參與植物的某種優(yōu)良性狀的表達(dá),幫助育種專家進(jìn)行合理的育種實(shí)驗(yàn)。機(jī)器學(xué)習(xí)技術(shù)應(yīng)用于作物育種,不僅提高了育種的效率,而且能夠幫助育種專家對(duì)更多的變量進(jìn)行評(píng)估,提高了育種的準(zhǔn)確率。
3.2 農(nóng)作物病害識(shí)別
病害是導(dǎo)致農(nóng)作物減產(chǎn)的重要因素之一,傳統(tǒng)的農(nóng)作物病害識(shí)別方法基本上是依靠相關(guān)專家的專業(yè)知識(shí)和工作經(jīng)驗(yàn)進(jìn)行識(shí)別,費(fèi)時(shí)費(fèi)力,效率較低,并且容易產(chǎn)生人為誤差,嚴(yán)重影響農(nóng)作物病害防治工作的高效性。深度學(xué)習(xí)通過(guò)訓(xùn)練大量農(nóng)作物病害圖像,能夠從中自動(dòng)學(xué)習(xí)每種病害特征的表示,并建立相應(yīng)的預(yù)測(cè)模型。農(nóng)戶將遙感衛(wèi)星和無(wú)人機(jī)等拍下的農(nóng)田影像資料以及智能手機(jī)拍攝的照片上傳到云平臺(tái)后,模型能夠自動(dòng)確定其所屬的病害類別,不僅提高了檢測(cè)的效率,而且實(shí)現(xiàn)了更精準(zhǔn)的病害診斷,減少了因失誤造成的資源浪費(fèi)。
3.3 農(nóng)作物蟲(chóng)害預(yù)測(cè)
蟲(chóng)害是危害農(nóng)產(chǎn)物產(chǎn)量和品質(zhì)的重要因素,我國(guó)農(nóng)作物蟲(chóng)害種類多、影響范圍廣,防治不及時(shí)易爆發(fā),對(duì)作物生產(chǎn)造成了嚴(yán)重影響。對(duì)蟲(chóng)害發(fā)生程度進(jìn)行準(zhǔn)確的預(yù)測(cè),在我國(guó)的農(nóng)作物安全生產(chǎn)中具有重要的地位。只有準(zhǔn)確預(yù)測(cè)農(nóng)作物蟲(chóng)害的發(fā)生才能為各類農(nóng)業(yè)政策的制定提供有效參考,及時(shí)地采取預(yù)防措施,做到早防早治,降低造成的經(jīng)濟(jì)損失。通過(guò)對(duì)蟲(chóng)害發(fā)生程度與空氣氣溫、土壤濕度、天氣狀況和農(nóng)藥施用量等多個(gè)外部環(huán)境因子建立回歸模型,掌握其發(fā)生規(guī)律,能夠有效對(duì)未來(lái)蟲(chóng)害發(fā)生程度進(jìn)行預(yù)報(bào)。目前,馬爾科夫鏈、支持向量回歸、神經(jīng)網(wǎng)絡(luò)和深度回歸等己被廣泛地應(yīng)用于蟲(chóng)害發(fā)生的預(yù)測(cè)中。
3.3 灌溉用水分析
在確保農(nóng)作物生長(zhǎng)所需用水量的前提下,減少因水量不足或過(guò)多所導(dǎo)致農(nóng)作物旱澇情況的發(fā)生,保證農(nóng)作物高產(chǎn)穩(wěn)產(chǎn),是現(xiàn)代農(nóng)業(yè)灌溉中急需解決的問(wèn)題之一。利用機(jī)器學(xué)習(xí)技術(shù)對(duì)農(nóng)作物用水需求量、蒸發(fā)蒸騰量和水文氣象指數(shù)等數(shù)據(jù)進(jìn)行挖掘分析,構(gòu)建智能灌溉控制系統(tǒng),為農(nóng)作物提供最有效的灌溉策略。智能灌溉系統(tǒng)可利用物聯(lián)網(wǎng)技術(shù)在監(jiān)測(cè)控制區(qū)域部署無(wú)線網(wǎng)絡(luò)、傳感器節(jié)點(diǎn)和灌溉設(shè)備,通過(guò)感知土壤水分,對(duì)土壤質(zhì)量實(shí)時(shí)監(jiān)測(cè),來(lái)設(shè)置科學(xué)合理的灌溉水量,針對(duì)不同環(huán)境靈活選擇不同的灌溉模式,在保證農(nóng)作物生長(zhǎng)的同時(shí),也節(jié)約了灌溉用水。
3.4 農(nóng)業(yè)專家系統(tǒng)
農(nóng)業(yè)專家系統(tǒng)是應(yīng)用機(jī)器學(xué)習(xí)等人工智能技術(shù),用計(jì)算機(jī)模擬農(nóng)業(yè)專家的智能,通過(guò)各種算法進(jìn)行推理和判斷,為農(nóng)業(yè)中面臨的各種問(wèn)題提供決策幫助。它是傳播各類農(nóng)業(yè)知識(shí)和農(nóng)業(yè)科技的一種途徑。農(nóng)業(yè)專家系統(tǒng)的研制已經(jīng)成為我國(guó)農(nóng)業(yè)信息技術(shù)研究的熱點(diǎn)。
3.5 農(nóng)產(chǎn)品電商
農(nóng)產(chǎn)品電商是現(xiàn)代農(nóng)業(yè)新型商業(yè)運(yùn)作方式,集買(mǎi)賣(mài)、線上交易、電子支付及各類綜合服務(wù)為一體,解決了農(nóng)產(chǎn)品市場(chǎng)流通渠道窄、供應(yīng)鏈信息不對(duì)稱等問(wèn)題,給農(nóng)產(chǎn)品零售業(yè)帶來(lái)了新的商機(jī)。
農(nóng)產(chǎn)品的電商平臺(tái)積累了海量的文本數(shù)據(jù)和圖像數(shù)據(jù),如商品描述、用戶評(píng)論和用戶咨詢等各種商品的圖像等等。這些數(shù)據(jù)不僅反映了產(chǎn)品特性,也蘊(yùn)含了用戶的需求以及使用反饋。通過(guò)機(jī)器學(xué)習(xí)和深度學(xué)習(xí)算法,可以精細(xì)化定位產(chǎn)品與服務(wù)的不足。例如:可以利用機(jī)器學(xué)習(xí)中的推薦算法,能夠從農(nóng)產(chǎn)品電商平臺(tái)大數(shù)據(jù)中提取用戶和產(chǎn)品等各類數(shù)據(jù),分析各類用戶的消費(fèi)興趣、消費(fèi)行為和習(xí)慣,挖掘用戶潛在消費(fèi)意向和可能的潛在用戶,提高農(nóng)產(chǎn)品交易成功率,營(yíng)造良好的消費(fèi)生態(tài)環(huán)境。
4 結(jié)束語(yǔ)
農(nóng)業(yè)農(nóng)村是國(guó)之根本,其現(xiàn)代化的發(fā)展水平是我國(guó)綜合實(shí)力的體現(xiàn)。在新時(shí)代下,機(jī)器學(xué)習(xí)、人工智能和芯片技術(shù)等新一代信息技術(shù)為現(xiàn)代農(nóng)業(yè)發(fā)展注入新的生機(jī)活力。未來(lái)機(jī)器學(xué)習(xí)新技術(shù)將快速滲透、融入農(nóng)業(yè)產(chǎn)業(yè)中,現(xiàn)代化農(nóng)業(yè)的發(fā)展將迎來(lái)新的機(jī)遇。
參考文獻(xiàn)
[1]毛林,王坤,成維莉,人工智能技術(shù)在現(xiàn)代農(nóng)業(yè)生產(chǎn)中的應(yīng)用[J].農(nóng)業(yè)網(wǎng)絡(luò)信息,2018 (05):14 -18.
[2]陳凱,朱鈺,機(jī)器學(xué)習(xí)及其相關(guān)算法綜述[J].統(tǒng)計(jì)與信息論壇,2007 (05):105-112.
[3]季桂樹(shù),陳沛玲,宋航.決策樹(shù)分類算法研究綜述[J].科技廣場(chǎng),2007 (01):9-12.
[4]付文博,孫濤,梁藉,閆寶偉,范福新,深度學(xué)習(xí)原理及應(yīng)用綜述[J].計(jì)算機(jī)科學(xué),2018, 45 (Sl): 11-15+4 0.
[5]許少尉,陳思宇.基于深度學(xué)習(xí)的圖像分類方法[J].電子技術(shù)應(yīng)用,2018, 44 (06):116-119.
[6]王秀美,牟少敏,時(shí)愛(ài)菊,浩慶波.局部支持向量回歸在小麥蚜蟲(chóng)預(yù)測(cè)中的研究與應(yīng)用[J],山東農(nóng)業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版), 2016, 47 (01): 52-56.
[7]李磊.隨機(jī)森林及數(shù)據(jù)可視化在棉蚜等級(jí)預(yù)測(cè)中的應(yīng)用研究[D].山東農(nóng)業(yè)大學(xué),2017.
[8]韓毅,基于物聯(lián)網(wǎng)的設(shè)施農(nóng)業(yè)溫室大棚智能控制系統(tǒng)研究[D].太原理工大學(xué),2016.
[9]降惠,李杰,農(nóng)業(yè)專家系統(tǒng)應(yīng)用現(xiàn)狀與前景展望[J].山西農(nóng)業(yè)科舉.2012. 40 (01):76-78.