楊中杰,包永紅,王立中
(內(nèi)蒙古農(nóng)業(yè)大學(xué)計(jì)算機(jī)技術(shù)與信息管理系,內(nèi)蒙古 包頭 014109)
農(nóng)業(yè)是一個(gè)國(guó)家或地區(qū)的經(jīng)濟(jì)發(fā)展關(guān)鍵因素[1]。農(nóng)業(yè)種植區(qū)的施肥不均勻?qū)е峦寥婪柿彤a(chǎn)量不均。因此本文提出對(duì)該農(nóng)業(yè)生態(tài)種植區(qū)進(jìn)行監(jiān)測(cè)[2],在不同地區(qū)內(nèi)的土壤設(shè)立若干固定的監(jiān)測(cè)點(diǎn)對(duì)其采樣收集,測(cè)評(píng)土壤的整體養(yǎng)分肥力。若能進(jìn)行長(zhǎng)期監(jiān)測(cè),可有效推動(dòng)種植業(yè)的信息化和現(xiàn)代化,為我國(guó)農(nóng)業(yè)可持續(xù)發(fā)展戰(zhàn)略作出貢獻(xiàn)。
楊莓[3]等人利用遙感技術(shù)獲得監(jiān)測(cè)區(qū)域的遙感圖像,結(jié)合最小距離法、馬氏距離法、最小距離法來(lái)監(jiān)測(cè)種植區(qū)的施肥均勻性,該方法在監(jiān)測(cè)之間沒(méi)有進(jìn)行光譜角度匹配,存在種植面積估算結(jié)果準(zhǔn)確率低的問(wèn)題。黃云[4]等人利用Sentinel-2影像獲得監(jiān)測(cè)區(qū)域的遙感圖像,結(jié)合人工目譯解釋和分割網(wǎng)絡(luò)對(duì)種植區(qū)域的施肥均勻性進(jìn)行監(jiān)測(cè),該方法獲得的遙感圖像不清晰,導(dǎo)致施肥均勻性監(jiān)測(cè)結(jié)果與實(shí)際不符。蔣怡[5]等人采用Landsat-8和Sentinel-2A影像獲取監(jiān)測(cè)區(qū)域遙感圖像,結(jié)合最大似然法最小距離法、馬氏距離法、支持向量化等方法對(duì)種植區(qū)的施肥均勻性進(jìn)行監(jiān)測(cè),該方法存在種植位置識(shí)別精度低的問(wèn)題。
為解決上述方法存在的問(wèn)題,提出基于遙感圖像的復(fù)雜種植區(qū)施肥均勻性監(jiān)測(cè)方法。
1)光譜角度匹配
基于遙感圖像的復(fù)雜種植區(qū)域施肥均勻性監(jiān)測(cè)方法通過(guò)光譜角度匹配方法對(duì)像元在植被指數(shù)時(shí)間序列數(shù)據(jù)集中對(duì)應(yīng)的時(shí)間序列曲線進(jìn)行計(jì)算[6],進(jìn)而得到兩條曲線之間的夾角值θi
θi=arccos ·[Xi·Y/|Xi|·|Y|]
(1)
式中,Xi代表第i個(gè)像元對(duì)應(yīng)的時(shí)間序列曲線,Y代表與之相對(duì)比的參考曲線。
根據(jù)上述分析,將上式轉(zhuǎn)化為下式
(2)
式中,xij為第i個(gè)像元構(gòu)成的序列曲線中存在的第j個(gè)向量點(diǎn),yj為參考曲線中存在的第j個(gè)向量點(diǎn),n代表向量的維數(shù),也被稱作為時(shí)間節(jié)點(diǎn)數(shù)。
2)閾值選擇
由上述計(jì)算獲得的光譜夾角值可獲得Rule遙感圖像的閾值[7]。一個(gè)樣本相對(duì)應(yīng)的植被指數(shù)時(shí)間序列曲線作為一個(gè)向量,通過(guò)式(3)得出樣本和時(shí)間序列曲線的夾角弧度,即樣本點(diǎn)k的植被指數(shù)時(shí)間曲線Xk與Y之間的夾角θk
θk=arccos(Xk·Y)/|Xk|·|Y|
(3)
計(jì)算出樣本點(diǎn)所對(duì)應(yīng)的夾角,再計(jì)算所有夾角的平均值δ及所有夾角的標(biāo)準(zhǔn)差σ
(5)
式中,m代表樣本點(diǎn)的個(gè)數(shù),夾角的平均值δ和夾角標(biāo)準(zhǔn)差σ相加就是閾值ε,計(jì)算如下
ε=σ+δ
(6)
3)種植面積提取
基于上述計(jì)算出的閾值數(shù)據(jù),得到時(shí)間序列曲線與樣本的夾角平均值和標(biāo)準(zhǔn)差,分別為δNEVI和σNDVI,還可以得到整個(gè)種植區(qū)時(shí)間序列參考曲線與樣本點(diǎn)的夾角平均值和標(biāo)準(zhǔn)差,分別為δEVI和σEVI。
(7)
通過(guò)標(biāo)準(zhǔn)差σ和平均值δ計(jì)算得到研究區(qū)域作物面積對(duì)應(yīng)的閾值ε,在NDVI時(shí)間序列數(shù)據(jù)集和EBI時(shí)間序列集的基礎(chǔ)上獲得Rule影像的閾值εNDVI、εEVI,其計(jì)算公式分別如下
(8)
比較閾值ε和光譜夾角值θi,如果光譜夾角值θi小于閾值ε,就將目標(biāo)地物設(shè)置在第i個(gè)像元。利用閾值εNDVI在NDVI時(shí)間序列數(shù)據(jù)集基礎(chǔ)上獲得的Rule圖像,提取目標(biāo)像元;利用閾值εEVI結(jié)合EVI時(shí)間序列數(shù)據(jù)集獲得的Rule圖像,提取目標(biāo)像元,通過(guò)這兩組數(shù)據(jù)得到種植區(qū)施肥面積提取結(jié)果[8]。
基于遙感圖像的復(fù)雜種植區(qū)域施肥均勻性監(jiān)測(cè)方法進(jìn)行監(jiān)測(cè)的主要過(guò)程如下:
1)在獲得種植區(qū)遙感圖像的基礎(chǔ)上進(jìn)行全色數(shù)據(jù)與多光譜融合[9]。
2)針對(duì)融合后的遙感圖像,通過(guò)主成分分析方法提取其第一主成分單色圖I;
3)將分水嶺方法[10]引入施肥均勻性監(jiān)測(cè)過(guò)程中,分割處理第一主成分單色圖I,提取超像素對(duì)象;
4)構(gòu)建監(jiān)測(cè)區(qū)域特征組,包括輪廓特征相似度、亮度特征相似度和紋理特征相似度;
5)通過(guò)特征組在隨機(jī)森林原理的基礎(chǔ)上完成施肥均勻性監(jiān)測(cè)。
基于遙感圖像的復(fù)雜種植區(qū)域施肥均勻性監(jiān)測(cè)方法的監(jiān)測(cè)流程如圖1所示。
圖1 施肥均勻性監(jiān)測(cè)流程圖
1)圖像分割
將“超像素”概念引入?yún)^(qū)域種植遙感圖像處理過(guò)程中。采用分水嶺分割算法得到“超像素”圖像。
為了使分割程度近似,來(lái)驗(yàn)證超像素與人工手動(dòng)分割結(jié)果的一致性,基于遙感圖像的復(fù)雜種植區(qū)域施肥均勻性監(jiān)測(cè)方法采用基于輪廓測(cè)量的方法。設(shè)置分割參數(shù),當(dāng)閾值T取值為3時(shí),遙感圖像的分割效果為最佳狀態(tài)。當(dāng)k增多時(shí)(k代表超像素的數(shù)目),要處理的數(shù)據(jù)也隨之增多,進(jìn)而影響了遙感圖像分割的效率,在施肥均勻性監(jiān)測(cè)過(guò)程中,基于遙感圖像的復(fù)雜種植區(qū)域施肥均勻性監(jiān)測(cè)方法將超像素?cái)?shù)目k設(shè)置為1273,可有效的完成種植區(qū)域遙感圖像的分割處理。
2)特征集構(gòu)建
①紋理相似度
計(jì)算超像素區(qū)域直方圖之間的χ2距離(又稱卡方距離),公式如下
(9)
式中,T(q,s)代表兩個(gè)超像素區(qū)域的紋理相似度,q代表整體所有的超像素對(duì)象,s代表人工分割的面積,dT(q,s)代表為人工分割結(jié)果面積s與超像素對(duì)象q紋理直方圖之間的χ2距離,Psame代表人工分割區(qū)域內(nèi)存在超像素,Pdiff代表人工分割區(qū)域外存在超像素。
所有超像素對(duì)象在人工分割的種植施肥區(qū)域內(nèi)的紋理相似度的和為:T內(nèi)=∑T(q,s);所有超像素對(duì)象在人工分割的種植施肥區(qū)域外的紋理相似度的和為:T外=∑T(q,s)。
如果其中有若干超像素與分割目標(biāo)距離極為接近,則取其相似度的平均值即可。
②亮度相似度
不同區(qū)域亮度值對(duì)應(yīng)的直方圖可通過(guò)亮度描述算子進(jìn)行反映。求出各個(gè)區(qū)域直方圖之間的χ2距離,并歸一化處理其對(duì)數(shù)。
所有超像素對(duì)象在人工分割的種植施肥區(qū)域內(nèi)的亮度相似度的和為B內(nèi);所有超像素對(duì)象在人工分割的種植施肥區(qū)域外的亮度相似度的和為B外。
③輪廓能量
為了降低陰影圖像漸變區(qū)域?qū)^(qū)域邊界的不利影響,決定采用方向能量方法,更準(zhǔn)確地檢測(cè)出該復(fù)雜邊界。
計(jì)算方向能量的公式如下
OEθ=(I·f1,θ)2+(I·f2,θ)2
(10)
式中,OEθ代表每個(gè)像素的方向能量,*代表兩者之間的卷積運(yùn)算。當(dāng)方向角度θ取值為0時(shí),方向能量的最大取值為OE0。,通過(guò)旋轉(zhuǎn)f1和f2(其中,f1是f高斯函數(shù)求導(dǎo),f2是f1在過(guò)濾的基礎(chǔ)上計(jì)算出的邊緣對(duì)比度),如果,OEθ相鄰的所有像素點(diǎn)在一個(gè)方向尺度下的值小于或等于OEθ,那么方向能量就是最大值,如果,OEθ相鄰的所有像素點(diǎn)在一個(gè)方向尺度下的值大于OEθ,那么最大值為OE0。
在區(qū)間[0,1]內(nèi)通過(guò)非線性變換設(shè)置可能性數(shù)值Pcon
(11)
式中,為了降低σ?guī)?lái)的噪聲影響遙感圖像的清晰度,本文根據(jù)噪聲類型、強(qiáng)度和遙感圖像目標(biāo)等數(shù)據(jù),決定將σ取值為0.04。
所有超像素不在分割區(qū)域內(nèi)而是在邊緣上的Pcon和為E外邊緣,所有超像素在分割區(qū)域內(nèi)Pcon和為E內(nèi)。
3)種植區(qū)域施肥均勻性監(jiān)測(cè)
基于遙感圖像的復(fù)雜種植區(qū)域施肥均勻性監(jiān)測(cè)方法通過(guò)隨機(jī)森林方法[11]實(shí)現(xiàn)施肥均勻性監(jiān)測(cè)。
拔靴法,又叫bagging法,是隨機(jī)森林分類法的主要中心思想。步驟為:從原有的數(shù)據(jù)集中抽取若干具有差異的樣本,按樣本特征進(jìn)行隨機(jī)分類,構(gòu)建完整的分類樹(shù)。詳細(xì)過(guò)程如下示:
1)在抽取超像素樣本的同時(shí)隨機(jī)放回一個(gè)超像素樣本。k代表超像素樣本的總個(gè)數(shù),假設(shè)抽取500次,則N=500。重復(fù)這個(gè)步驟,將得到ntree個(gè)超像素樣本的集合。
由于準(zhǔn)確率會(huì)隨著生成的樣本集合數(shù)量的增加而增加,然而,相關(guān)的處理數(shù)據(jù)也隨之增加了。所以,為了平衡此二者的關(guān)系,根據(jù)遙感圖像數(shù)據(jù)決定將ntree選取為100,即ntree=100。
2)構(gòu)建決策樹(shù)
采用上文中構(gòu)建的6個(gè)特征屬性T內(nèi)、T外、B內(nèi)、B外和E內(nèi)、E外邊緣,繼續(xù)進(jìn)行構(gòu)造分類樹(shù)。
3)所有的樣本集合不斷重復(fù)上述前兩個(gè)步驟形成ntree個(gè)隨機(jī)分類森林。
4)若有其它剩余的樣本,則通過(guò)投票決定它們的特征。
使用拔靴法(Bagging法)在最原始的數(shù)據(jù)集中抽取若干個(gè)帶有差異的樣本集時(shí),每次規(guī)定定量抽取最原始樣本集中的63%,并將抽取出來(lái)的樣本稱作為袋外樣本(Out Of Bag,OOB)。
為確保上述隨機(jī)森林分類方法的有效性,決定隨意抽出一個(gè)特征,記為f,對(duì)其進(jìn)行測(cè)試,計(jì)算公式如下
(12)
復(fù)雜種植區(qū)域均勻性測(cè)度由所有決策樹(shù)重要程度平均值可得
(13)
為了驗(yàn)證基于遙感圖像的復(fù)雜種植區(qū)施肥均勻性的監(jiān)測(cè)方法的整體有效性,需要對(duì)其進(jìn)行下列有關(guān)測(cè)試。
種植面積估算是監(jiān)測(cè)種植區(qū)施肥均勻性的重要指標(biāo)。分別采用基于遙感圖像的復(fù)雜種植區(qū)域施肥均勻性監(jiān)測(cè)方法、文獻(xiàn)[3]方法和文獻(xiàn)[4]方法對(duì)種植面積進(jìn)行估算,估算結(jié)果如圖2所示。
圖2 不同方法的種植面積估算結(jié)果
圖2為不同方法的種植面積估算結(jié)果,根據(jù)圖2可知,采用所提方法對(duì)復(fù)雜種植區(qū)進(jìn)行面積估算后,基本與實(shí)際種植區(qū)面積接近,而采用文獻(xiàn)[3]方法和文獻(xiàn)[4]方法對(duì)復(fù)雜種植區(qū)進(jìn)行估算后,估算的種植面積與實(shí)際種植面積相差較大,對(duì)比上述方法的測(cè)試結(jié)果可知,通過(guò)所提方法1可得到較為接近實(shí)際種植區(qū)面積的數(shù)據(jù),表明所提方法的估算效果好,因?yàn)樗岱椒ü浪惴N植面積之前,采用光譜角度匹配方法獲取了種植區(qū)域的像元,在此基礎(chǔ)上對(duì)種植面積進(jìn)行估算,提高了與實(shí)際面積相符的準(zhǔn)確率。
圖3 不同方法種植位置精度的比較
位置識(shí)別精度即計(jì)算識(shí)別正確種植位置在整個(gè)種植區(qū)所占的百分比。
(14)
式中,Kw代表復(fù)雜種植區(qū)的位置識(shí)別精度,pj代表通過(guò)隨機(jī)森林方法測(cè)量在整個(gè)種植區(qū)面積里第j個(gè)種植區(qū)所占的百分比,pj0代表第j個(gè)種植區(qū)的面積在大數(shù)據(jù)庫(kù)面積中所占的比重,Aj則代表第j個(gè)種植區(qū)的實(shí)際總共面積,n代表實(shí)驗(yàn)中所涉及的所有種植區(qū)的數(shù)目。
分析圖3中的數(shù)據(jù)結(jié)果可知,隨著復(fù)雜種植區(qū)數(shù)量的增加,所提方法、文獻(xiàn)[3]方法和文獻(xiàn)[4]方法的種植位置識(shí)別精度都不斷降低,但是在相同復(fù)雜種植區(qū)數(shù)量下,所提方法的識(shí)別精度均高于文獻(xiàn)[3]方法和文獻(xiàn)[4]方法的識(shí)別精度。
表1 不同方法的種植區(qū)施肥的均勻性測(cè)量結(jié)果
表1是上述方法的均勻性測(cè)量結(jié)果,根據(jù)表1中的數(shù)據(jù)可知,在多次對(duì)種植區(qū)施肥均勻性的測(cè)試過(guò)程中,所提方法得到的施肥均勻性數(shù)據(jù)較比文獻(xiàn)[3]方法和文獻(xiàn)[4]方法與實(shí)際數(shù)據(jù)更為接近,準(zhǔn)確率比文獻(xiàn)[3]方法和文獻(xiàn)[4]方法的準(zhǔn)確率高。
目前的施肥均勻性監(jiān)測(cè)方法存在估算結(jié)果準(zhǔn)確率低、種植位置識(shí)別精度低、施肥均勻性與實(shí)際數(shù)據(jù)不接近的問(wèn)題。提出基于遙感圖像的復(fù)雜種植區(qū)施肥均勻性監(jiān)測(cè)的方法。首先提取種植區(qū)的植被面積,獲得種植區(qū)的遙感圖像,再分類圖片特征,完成復(fù)雜種植區(qū)的遙感監(jiān)測(cè)。實(shí)驗(yàn)結(jié)果證明了所提方法解決了目前方法中精度較差問(wèn)題,為種植區(qū)產(chǎn)量信息化和農(nóng)業(yè)生產(chǎn)效率的提高奠定了基礎(chǔ)。