沈美,于翔
摘 要:鑒于無線傳輸技術的推廣和應用,文章以無人機為載體,以水稻紋枯病為例,通過支持向量機、AdaBoost等機器學習算法,重點研究并實現(xiàn)了基于機器學習的農田無人機農作物病害圖像自動尋的系統(tǒng),并對該系統(tǒng)進行深層次探索和功能分析。
關鍵詞:機器學習;支持向量機;AdaBoost;無人機;農作物病害;水稻紋枯病
1 農作物病蟲害現(xiàn)狀
我國農業(yè)正在從傳統(tǒng)型農業(yè)向精細型農業(yè)發(fā)展。精細農業(yè)的中心思想是在農事勞動和農業(yè)生產生活中,依靠先進的科學技術手段,快速、準確地采集盡可能多的農田信息,以達到減少投入的同時增加產出、提高投入物利用率、降低環(huán)境污染程度的目標[1]。
作為影響農作物最終產量的重要關鍵因素之一—農作物病蟲害的田間調查、檢測、識別及病蟲害危害狀況進行分級、監(jiān)測,卻長期依賴專業(yè)的植保人才,導致作物病蟲害識別診斷的主觀性強、工作量大、成本高、誤差大、時效差、對專業(yè)知識要求較高,已經遠不能滿足我國現(xiàn)階段對現(xiàn)代農業(yè)快速發(fā)展的需求[2]。因此,采用無損測試技術,即在不破壞植物組織結構的基礎上,利用各種手段對作物的生長、病害危害狀況進行監(jiān)測,以便及時采取措施治理或合理安排計劃[3]。從而實現(xiàn)對病害進行早期預警,對控制病蟲害大范圍蔓延、保護作物產量有深遠研究作用及社會意義[4]。
本文利用無人機(Unmanned Aerial Vehicle,UAV)便利、高效的特點,通過其攜帶的攝像頭對水稻田間進行高速飛掠采樣,利用機器視覺、機器學習等先進技術對水稻紋枯病病害圖像進行識別、尋的,從而完成基于機器視覺的水稻紋枯病的早期預警、診斷及病蟲害分級判斷,為在相關條件成熟的情況下實現(xiàn)精準噴灑、施藥打下堅實的技術基礎,從而實現(xiàn)基于機器學習的水稻紋枯病無人機平臺自動尋的。該研究結果能對其他類似農作物病蟲害的無人機自動尋的以及精準施藥技術起到借鑒作用。
2 機器學習在農作物無人機圖像尋的中的應用
機器學習是一門多領域交叉學科,主要研究計算機怎樣模擬或實現(xiàn)人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的性能,是目前人工智能中最具智能特征、最前沿的研究領域之一[5]。歷經多年的發(fā)展,源于人工神經網絡的研究,包含多個隱藏層的、多層感知器的、機器學習中的一種—深度學習,通過組合低層特征形成更加抽象的高層表示屬性類別或特征,模仿人腦的機制來解釋數(shù)據(jù),例如圖像、聲音和文本等,在很多方面收獲了突破性進展,本文主要通過支持向量機(Support Vector Machine,SVM)與Adaboost兩種機器學習算法,應用于無人機,對水稻紋枯病病害圖像的尋的有極大幫助。
2.1 支持向量機
支持向量機是Cortes和Vapnik于1995年首創(chuàng)的,在解決小樣本、非線性及高維模式識別中表現(xiàn)出許多特有的優(yōu)勢,并能夠推廣應用到函數(shù)擬合等其他機器學習問題中[7]。
SVM理論來自于數(shù)據(jù)二值分類問題的處理:假定在可分數(shù)據(jù)中由多個可以區(qū)分正負樣本的超平面(Hyperplane)組成超平面集,在可分數(shù)據(jù)中尋找一個滿足分類要求的最優(yōu)分割超平面(Optimal Separating Hyperplane,OSH),使得在保證分類精度的同時最大化OSH兩側的間隔[8]。
假定空間中存在包含正負兩類的自變量xi∈R,i=1,…l及因變量y,滿足y∈{1,﹣1}。假定存在一個分類超平面可以區(qū)分這兩類正負樣本,超平面上的點xi滿足ω·xi+b=0,其中ω為超平面的法向量,|b|/||ω||為超平面到原點的垂線距離,||ω||為ω的范數(shù)。
給出一組數(shù)據(jù){(xi,yi)},i=1,…l滿足
滿足上式且在超平面H1和超平面H2上的樣本點xi可分別表示為x+和x-。將上述兩式整合可得到
超平面H1和超平面H2可分別表示為
在超平面H1和H2上的點到原點的最短垂線距離分別是|1-b|/||ω||和|﹣1-b|/||ω||。因此,超平面間的間隔Margin為:
2.2 Adaboost算法
Schapire和Freund于1997年第一次提出Adaboost算法,將多個弱分類器有機地結合在一起,通過多次迭代,對訓練樣本的權重不斷更新定義,隨后通過投票機制進行分類。隨著迭代次數(shù)的增加,Adaboost算法會將分類的重點逐漸放在一些難區(qū)分的樣本上,通過這種機制,最后實現(xiàn)整體識別準確率的提高。
Adaboost算法過程如下[9]:首先,將把數(shù)據(jù)分成訓練集和測試集兩部分,隨后輸入訓練集,對訓練樣本權重進行初始化,D1代表數(shù)據(jù)集的權重集合,N代表樣本的個數(shù),ω代表每個樣本的權重(一般初始的權重都設為1/N),其公式如下:
將清洗后的數(shù)據(jù)集輸入算法中,并建立一對多(One Against All,OAA)一對一(One Against One,OAO)分類器,分別用于訓練和測試;
在每一次迭代過程后,根據(jù)如下公式計算弱分類器的錯誤率em:
在迭代m次之后,根據(jù)弱分類器的錯誤率確定每一個弱分類器在最終分類集合中的比例系數(shù)am:
每次迭代后,根據(jù)下面兩個公式來更新OAA分類器所有的權重:
輸入測試集,調用OAO分類器下式:
最后得到分類器:
3 利用SVM與Adaboost分類器實現(xiàn)無人機水稻紋枯病尋的
3.1 利用SVM與Adaboost分類器實現(xiàn)無人機水稻紋枯病尋的技術路線
在無人機施工過程中,如果利用無人機實現(xiàn)基于機器視覺的精準尋的,就必須將正常葉片、病害葉片及土地等噪聲分開,這也是無人機植保中的關鍵問題之一。因此,構造一個具有較高精度的分類器,從而實現(xiàn)病害葉片的檢出及對正常葉片、泥土、雜草圖像等噪聲的分類,為基于機器視覺的無人機尋的提供精準目標就成為實現(xiàn)無人機精準尋的一種解決思路。本文提出利用Adaboost及SVM建立兩級級聯(lián)分類器,從而實現(xiàn)新型的、高效的、具有計算復雜度小、分類精度高等優(yōu)點的二級級聯(lián)分類器來解決該問題。
本文通過研究不同局部特征對紋枯病和非紋枯病檢測的影響,創(chuàng)造性地提出在水稻基部紋枯病識別研究中利用兩層分類器來對紋枯病進行檢測與識別,其技術路線如圖1所示。
圖1 利用SVM與Adaboost分類器實現(xiàn)無人機
水稻紋枯病尋的技術路線
首先,在第一層利用水稻基部圖像的顏色特征,通過圖像預處理等手段對具有水稻紋枯病變的葉片圖像進行處理,隨后利用Adaboost分類器進行初步分類、建立正負樣本,初步實現(xiàn)水稻紋枯病的檢測。然后,通過顏色特征、方向梯度直方圖(Histogram of Oriented Gridients,HOG)特征及局部二值模式(Local Binary Patterns,LBP)特征組合成新的特征組,并利用SVM對第一層檢測結果進行非目標的精細排除,進一步去除泥點、枯葉、雜草、水滴、反光等噪聲,減少誤差,并實現(xiàn)對水稻植株紋枯病的自動檢出。
3.2 基于Adaboost分類器的無人機尋的
針對同樣的訓練集病害圖像特征值,通過Adaboost算法訓練出多個不同的弱分類器,然后對分類器輸出的結果設定一個閾值,通過大量的實驗,設定該閾值為1,通過該閾值來區(qū)分正、負樣本。如下式所示:
其中x為樣本的數(shù)據(jù),hj(x)為對應于第j張病害圖像的病害特征值,βj為判定閾值,在本文中確定為1。
基于顏色分量的級聯(lián)分類器構成設計思路如圖2所示。
圖2 基于顏色分量的級聯(lián)分類器構成
本實驗過程中存在著數(shù)量極為龐大的顏色特征描述值,若通過計算所有的特征來完成識別的過程,其計算量是十分龐大的。本文設計了基于顏色分量的級聯(lián)分類器,針對彩色圖像的3個顏色通道,首先賦予所有樣本每個顏色通道相同的權重。然后,分別進行計算,得到樣本每個顏色通道分類的錯誤率。最后,調整并重新分配樣本的權重,從而提高錯誤樣本顏色分量分類的權重,實現(xiàn)對錯誤樣本在下一輪訓練中的重視程度。多次對樣本進行迭代訓練后,實現(xiàn)利用Adaboost算法來對每個顏色通道進行弱分類,并通過閾值組合成強分類器,最終解決該問題,
4 結語
通過Adaboost算法的不斷迭代運算,首先將彩色圖像的3個通道顏色特征值單獨拿出來進行分別計算,然后,利用大量的實驗確定閾值為1,實現(xiàn)弱分類器的第一次分類,進行過程中,當錯誤率達到了預想值時,迭代的過程就可以結束了。隨后,將Adaboost算法分類出的結果輸送給SVM,構建出第二個分類器,通過對多個弱分類器的級聯(lián)實現(xiàn)無人機對水稻紋枯病病害圖片的強分類,最終實現(xiàn)水稻紋枯病病害的精準檢出,從而實現(xiàn)無人機對水稻紋枯病病害圖片的自動尋的。
本研究使用5個級別測試150個樣本,對區(qū)分不同危害程度的水稻紋枯病測試了準確率。根據(jù)結果可以看出,2級病株中有一株誤判,偏大,正確率80%;3級病株有一株誤判,偏大,正確率89%;4級中全部都檢測無誤,正確率100%;5級中有一株誤判,偏小,正確率80%??傮w來講,其正確率在可接受范圍內。分析發(fā)生誤判的原因,有以下幾點:
(1)在發(fā)病初期,如2級病株的植株基部病狀太輕,不易檢出,且有多個暗綠色斑點,無法分辨是否為噪聲,從而產生誤判,并導致樣本的計算百分比不準確。
(2)在水稻發(fā)病的過程中,樣本有時并不能很好地反映發(fā)病情況,在很大程度上會影響判別效果。
(3)在實時檢測中,攝像頭需要平行地面且盡可能靠近作物采集病斑,并且從側面以固定的角度、傾斜方向采集整株高度,采樣時因采樣角度不對而產生誤差。
作者簡介:沈美(1978— ),女,青海樂都人,副教授,碩士;研究方向:人工智能,神經網絡。
[參考文獻]
[1]張心雨.低密度下評估稻飛虱智能識別系統(tǒng)的有效性[D].南京:南京農業(yè)大學,2016.
[2]柴阿麗.基于計算機視覺和光譜分析技術的蔬菜葉部病害診斷研究[D].北京:中國農業(yè)科學院,2011.
[3]唐晏.基于無人機采集圖像的植被識別方法研究[D].成都:成都理工大學,2014.
[4]黃向陽.低密度下評估稻飛虱智能識別系統(tǒng)的有效性[D].南京:南京農業(yè)大學,2016.
[5]王曉麗.無人機精準作業(yè)決策方法研究[D].北京:中國民航大學,2017.
[6]張松.基于SVM和AdaBoost的多分類算法研究[D].濟南:山東師范大學,2019.
[7]任浩,葉亮,李月,等.基于多級SVM分類的語音情感識別算法[J].計算機應用研究,2017(6):1682-1684.
[8]金純,陳光勇.基于優(yōu)化的LSTSVM的多模態(tài)生理信號情感識別[J].電子技術應用,2018(3):112-116.
[9]劉巖,李幼軍,陳萌.基于EMD和SVM的抑郁癥靜息態(tài)腦電信號分類研究[J].山東大學學報(工學版),2017(47):26.
Research and implementation of unmanned aerial vehicle search for crop diseases based on machine vision: taking rice sheath blight as an example
Shen Mei, Yu Xiang
(Information and Intelligent Engineering School, Nantong College of Science and Technology, Nantong 226007, China)
Abstract:In view of the popularization and application of wireless transmission technology, this paper takes unmanned aerial vehicle as the carrier, takes rice sheath blight as an example, through the support vector machine, AdaBoost and other machine learning algorithms, focuses on the research and implementation of the system of agricultural unmanned aerial vehicle. Based on machine learning to automatically find the crop disease image, and makes a deep exploration and functional analysis of the system.
Key words:machine learning; support vector machine; AdaBoost; unmanned aerial vehicle; crop disease; rice sheath blight