王守會(huì), 戴建國(guó), 李栓明, 張國(guó)順, 崔美娜
(石河子大學(xué)信息科學(xué)與技術(shù)學(xué)院/兵團(tuán)空間信息工程技術(shù)研究中心,新疆石河子 832000)
棉葉螨別稱棉紅蜘蛛,是世界性棉花害蟲,在國(guó)內(nèi)外各大棉區(qū)均有分布[1-3]。尤其在新疆,夏季高溫炎熱且干燥少雨,氣候條件適宜種植棉花的同時(shí)也給棉葉螨種群的生長(zhǎng)和繁殖提供了優(yōu)越條件,使棉葉螨成為新疆地區(qū)危害棉花的主要害蟲之一,其中被危害嚴(yán)重的棉田可造成30%以上的減產(chǎn)[4],給新疆棉花生產(chǎn)帶來(lái)了較大損失。如果能夠運(yùn)用科學(xué)有效的手段及時(shí)準(zhǔn)確地對(duì)棉葉螨的發(fā)生發(fā)展趨勢(shì)進(jìn)行預(yù)測(cè),實(shí)現(xiàn)災(zāi)前預(yù)防,對(duì)減少災(zāi)害損失具有十分重要的意義。
病蟲害的發(fā)生發(fā)展主要受氣候條件(如溫濕度、降水量等)影響?;诖耍S多學(xué)者基于氣象數(shù)據(jù)建立模型在病蟲害預(yù)測(cè)方面做了很多的研究工作,并取得了較好的研究成果[5-7]。其中在棉葉螨發(fā)生預(yù)測(cè)研究中,劉婧然等基于徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)(radical basis function,簡(jiǎn)稱RBF)利用平均氣溫、最低氣溫、相對(duì)濕度和降水量建立了新疆石河子地區(qū)棉葉螨發(fā)生程度預(yù)測(cè)模型[8]。吳昊等對(duì)棉紅蜘蛛的發(fā)生成因進(jìn)行了分析,并基于氣象因子分別建立了棉花苗期和伏秋期螨害等級(jí)預(yù)測(cè)模型,且預(yù)測(cè)結(jié)果均達(dá)到顯著水平[9]。因此,氣候條件是進(jìn)行螨害預(yù)測(cè)時(shí)須要考慮的關(guān)鍵因素。
除氣象因素外,病蟲害的發(fā)生發(fā)展還與農(nóng)田生境、作物長(zhǎng)勢(shì)等多種因素有關(guān)[10-11]。研究表明,當(dāng)作物受到病蟲害脅迫時(shí)其葉綠素含量、水分含量、細(xì)胞組織結(jié)構(gòu)等生理狀態(tài)會(huì)發(fā)生變化,并由此引起光譜特征呈現(xiàn)一定的變化規(guī)律[12-13],成為遙感監(jiān)測(cè)的依據(jù)。尤其近年來(lái),隨著衛(wèi)星遙感數(shù)據(jù)獲取及處理分析技術(shù)的不斷成熟,遙感逐漸成為大面積農(nóng)作物病蟲害監(jiān)測(cè)預(yù)測(cè)的有效手段,學(xué)者們對(duì)此開展了大量研究。
綜合分析,雖然氣象環(huán)境是導(dǎo)致螨害發(fā)生的主要因素,但作物的當(dāng)前生長(zhǎng)狀態(tài)和受害程度對(duì)螨害后續(xù)擴(kuò)散發(fā)展也有很大影響。因此,棉葉螨的發(fā)生發(fā)展受氣候環(huán)境和棉花當(dāng)前生理狀態(tài)2個(gè)方面的影響,將能夠反映作物生理指標(biāo)的遙感植被指數(shù)與氣象數(shù)據(jù)相結(jié)合用于螨害預(yù)測(cè)研究較為科學(xué)合理,該研究方法也逐漸成為研究趨勢(shì)[14-15]。鑒于此,以新疆生產(chǎn)建設(shè)兵團(tuán)第八師為研究區(qū)域,將棉花遙感生理監(jiān)測(cè)與氣象因子相結(jié)合用于預(yù)測(cè)研究大面積棉田螨害的發(fā)生發(fā)展趨勢(shì),為新疆棉花生產(chǎn)過程中棉葉螨的合理預(yù)防提供理論依據(jù),并為類似的應(yīng)用研究提供方法參考。
新疆生產(chǎn)建設(shè)兵團(tuán)第八師(含石河子市)地處天山北麓中段,準(zhǔn)噶爾盆地南緣,古爾班通古特大沙漠南緣(84°58′~86°24′E,43°26′~45°20′N,圖1),屬于典型的溫帶大陸性氣候,水資源較為豐富,冬季長(zhǎng)而嚴(yán)寒,夏季短而炎熱,年平均氣溫為7.5~8.2 ℃,年日照時(shí)數(shù)為2 318~2 732 h,無(wú)霜期為147~191 d,年降水量為180~270 mm,年蒸發(fā)量為1 000~1 500 mm。棉花為全師的主要經(jīng)濟(jì)作物,其播種面積每年在19萬(wàn)hm2左右。
1.2.1 遙感數(shù)據(jù)獲取及處理 所選用的遙感數(shù)據(jù)來(lái)源于美國(guó)國(guó)家航空航天局(national aeronautics and space administration,簡(jiǎn)稱NASA)于2013年發(fā)射的Landsat 8衛(wèi)星,該衛(wèi)星攜帶有陸地成像儀(operational land imager,簡(jiǎn)稱OLI)和熱紅外傳感器(thermal infrared sensor,簡(jiǎn)稱TIRS)2個(gè)傳感器。
OLI設(shè)有9個(gè)波段,包括可見光、近紅外和短波紅外波段,其中多光譜波段的空間分辨率為30 m,全色波段的空間分辨率為15 m,成像寬幅為185 km×185 km。影像的獲取時(shí)間為2017年6月27日和2017年7月13日共2景影像,影像清晰且覆蓋整個(gè)研究區(qū),能夠滿足研究需要。
首先對(duì)影像進(jìn)行輻射定標(biāo),將圖像的數(shù)字量化值(digital number,簡(jiǎn)稱DN)轉(zhuǎn)化為輻射亮度值,然后進(jìn)行大氣校正,以消除大氣和光照等因素對(duì)地物反射率的影響獲得真實(shí)地物反射率,最后對(duì)影像進(jìn)行裁剪得到研究區(qū)的遙感影像。
1.2.2 棉花種植區(qū)域提取 利用2017年6月27日研究區(qū)遙感影像采用監(jiān)督分類法對(duì)棉花的種植面積進(jìn)行提取。首先,以曹衛(wèi)彬等建立的農(nóng)作物及地塊類型解譯標(biāo)志為參考,結(jié)合近紅外波段合成的假彩色圖像對(duì)研究區(qū)內(nèi)的7種地物類型(棉花、玉米、葡萄、居民地、山體、裸地、水體)建立感興趣區(qū)作為訓(xùn)練樣本[16]。然后選擇監(jiān)督分類中的最大似然分類方法對(duì)研究區(qū)地物類型進(jìn)行分類,實(shí)現(xiàn)對(duì)棉花種植面積的提取。最后利用混淆矩陣對(duì)分類結(jié)果進(jìn)行精度評(píng)價(jià),總體精度為 97.24%,Kappa系數(shù)為0.95,分類效果較好,可以滿足后續(xù)研究需要。研究區(qū)地物類型以棉花為主,其他地物類型相對(duì)于棉花屬于極少數(shù),存在分類樣本不平衡現(xiàn)象,因此可取得較高分類精度。
1.2.3 遙感特征因子提取 利用2017年6月27日(蕾期)、7月13日(花期)的2景遙感影像分別計(jì)算病蟲害監(jiān)測(cè)研究中常用的7種植被指數(shù)[17-19],共獲得14種植被指數(shù)作為初選遙感特征因子。相關(guān)植被指數(shù)及其計(jì)算公式如表1所示。
表1 相關(guān)植被指數(shù)及其計(jì)算公式
1.2.4 氣象數(shù)據(jù)獲取與處理 為全面考慮氣象因素對(duì)棉葉螨發(fā)生發(fā)展的影響,共收集全師范圍內(nèi)11個(gè)氣象站點(diǎn)的氣象數(shù)據(jù)(數(shù)據(jù)來(lái)源于新疆氣象網(wǎng)),氣象站點(diǎn)分布如圖1所示。由于氣象站點(diǎn)空間分布離散,所收集的氣象數(shù)據(jù)屬于點(diǎn)狀數(shù)據(jù),而本研究需要獲取面狀連續(xù)的氣象數(shù)據(jù),因此使用ArcGIS 10.4.1軟件對(duì)11個(gè)氣象站點(diǎn)的氣象數(shù)據(jù)采用克里金(Kriging)插值方法進(jìn)行空間插值分析,從而得到空間連續(xù)的氣象信息。
1.2.5 氣象特征因子選取 根據(jù)氣象對(duì)棉葉螨的發(fā)生與作用規(guī)律,初選2016年11月、12月及2017年1月的平均溫度、最高溫度、最低溫度、平均相對(duì)濕度、地表溫度、5 cm地溫、2016年12至2017年1月累積降水量,2017年1月降水量及極度低溫,2月地表溫度、5 cm地溫,3—4月大于10 ℃積溫,3、4、5、6月平均溫度、平均相對(duì)濕度,4—6月累積降水量,5—6月累積降水量、溫濕系數(shù)、溫雨系數(shù),6月上旬、下旬降水量,5、6月的溫濕系數(shù)、溫雨系數(shù),7月平均溫度、最低溫度、降水量、溫濕系數(shù)、溫雨系數(shù)共47種數(shù)據(jù)作為氣象特征因子。
1.2.6 螨害實(shí)地調(diào)查數(shù)據(jù) 于2次衛(wèi)星過境時(shí)間段(2017年6月27日—7月13日)內(nèi)由人工進(jìn)行實(shí)地調(diào)查。考慮到Landsat 8影像的空間分辨率為30 m,因此以30 m×30 m為1個(gè)調(diào)查單元。在調(diào)查單元內(nèi)采用“Z”字形采樣法,每個(gè)單元調(diào)查8~10點(diǎn),每點(diǎn)調(diào)查10株棉花并記錄螨害的發(fā)生情況(發(fā)病、健康),最后根據(jù)紅葉株數(shù)和調(diào)查總株數(shù)計(jì)算紅葉株率,并按照紅葉株率進(jìn)行分級(jí)[27]。當(dāng)紅葉株率達(dá)到3級(jí)時(shí),則認(rèn)為達(dá)到防治要求,將該調(diào)查點(diǎn)標(biāo)記為螨害發(fā)生點(diǎn),否則標(biāo)記為健康點(diǎn),并使用全球定位系統(tǒng)(global positoning system,簡(jiǎn)稱GPS)記錄該點(diǎn)坐標(biāo),共調(diào)查106個(gè)采樣點(diǎn)。
首先,采用Relief算法[28]和泊松相關(guān)系數(shù)法(poisson correlation)相結(jié)合的方法對(duì)氣象與遙感共61個(gè)(47個(gè)氣象因子,14個(gè)植被指數(shù))初選特征因子進(jìn)行特征降維,獲取建模最佳特征;其次,分別使用3種方法(單一氣象因子、單一遙感植被指數(shù)、氣象因子與遙感植被指數(shù)相結(jié)合)建立預(yù)測(cè)模型;最后,對(duì)3種模型進(jìn)行精度評(píng)價(jià)和對(duì)比分析,從而獲取最佳的建模方法和預(yù)測(cè)模型,并對(duì)整個(gè)研究區(qū)進(jìn)行螨害預(yù)測(cè),生成螨害發(fā)生空間分布圖。技術(shù)路線如圖2所示。
1.3.1 特征降維 首先利用Relief算法計(jì)算61種初選特征因子的特征權(quán)重(圖3)。特征權(quán)重越大,表示該特征用于分類模型時(shí)的分類能力越強(qiáng),反之則表示該特征分類能力越弱。設(shè)置權(quán)重閾值為1 500,小于該閾值的特征將會(huì)被移除,最后剩余14種特征。其次,采用泊松相關(guān)系數(shù)法去除冗余特征,計(jì)算剩余兩兩特征之間的泊松相關(guān)系數(shù),并設(shè)置相關(guān)性閾值為0.85,超過該閾值則認(rèn)為2個(gè)特征之間相關(guān)性過高,存在信息冗余,將其中特征權(quán)重較小者進(jìn)行剔除。最終篩選得到6月27日GNDVI、MSR以及7月13日RVI、5—6月累積降水量、5月溫濕系數(shù)、4—6月累積降水量、6月上旬降水量共7種特征因子。
1.3.2 模型建立 螨害的發(fā)生與否屬于非線性二分類問題,Logistic回歸是解決二分類問題非常有效的方法之一,該算法能夠很好地解釋在一定條件下事件發(fā)生與否的概率[29]。因此,本研究采用Logistic回歸建立螨害預(yù)測(cè)模型。螨害發(fā)生與否的表示方法為發(fā)生記為1,未發(fā)生記為0。Logistic回歸模型為:
(1)
式中:β0為常數(shù)項(xiàng);β1、β2、…、βp為L(zhǎng)ogistic模型回歸系數(shù);x1、x2、…、xp表示p個(gè)自變量;P表示在p個(gè)自變量的作用下發(fā)生螨害的條件概率,P≥0.5表示發(fā)生螨害,P<0.5表示健康。
對(duì)公式(1)作Logit變換,Logistic回歸模型可以變成線性形式:
(2)
1.3.3 精度評(píng)價(jià) 將準(zhǔn)確率(Acc,公式3)、精確率(P,公式4)、召回率(R,公式5)和F1值(公式6)作為分類器的評(píng)價(jià)指標(biāo)。各種指標(biāo)的計(jì)算方法如下:
(3)
(4)
(5)
(6)
式中:TP表示將正類預(yù)測(cè)為正類數(shù);FN表示將正類預(yù)測(cè)為負(fù)類數(shù);FP表示將負(fù)類預(yù)測(cè)為正類數(shù);TN表示將負(fù)類預(yù)測(cè)為負(fù)類數(shù)。
分別使用單一氣象因子(2017年5—6月累積降水量、5月溫濕系數(shù)、4—6月累積降水量、6月上旬降水量,記為模型1)、單一遙感植被指數(shù)(6月27日GNDVI、MSR以及7月13日RVI,記為模型2)以及氣象因子與遙感植被指數(shù)相結(jié)合(全部7個(gè)特征,記為模型3)3種方法進(jìn)行Logistic回歸建模。其中,2/3的數(shù)據(jù)樣本用來(lái)建模,1/3用來(lái)精度驗(yàn)證。由表2可以看出,3種模型在測(cè)試集上的準(zhǔn)確率相較于訓(xùn)練集上的準(zhǔn)確率均有所下降,表明該分類模型的泛化能力有待提高,但對(duì)模型的錯(cuò)分漏分情況分析發(fā)現(xiàn),3種模型整體分類效果較好。通過計(jì)算測(cè)試集上的精確率、召回率、F1值并對(duì)比分析發(fā)現(xiàn),模型3分類效果最好,模型2次之,模型1效果最差。
表2 不同螨害預(yù)測(cè)模型分類結(jié)果對(duì)比
分別用3種預(yù)測(cè)模型對(duì)整個(gè)研究區(qū)的螨害情況進(jìn)行預(yù)測(cè)并生成分布圖,結(jié)果如圖4、圖5、圖6所示。
由圖4可知,螨害發(fā)生嚴(yán)重地區(qū)主要分布在142團(tuán)、144團(tuán)、134團(tuán)、133團(tuán)和石總場(chǎng),而在132團(tuán)、135團(tuán)、136團(tuán)、122團(tuán)、147團(tuán)和143團(tuán)部分發(fā)生且相對(duì)較輕,在150團(tuán)、149團(tuán)和148團(tuán)均無(wú)螨害發(fā)生。
由圖5可知,整個(gè)研究區(qū)均有螨害發(fā)生但整體發(fā)生相對(duì)較輕,無(wú)大面積螨害暴發(fā)區(qū)域。其中,在136團(tuán)、135團(tuán)、132團(tuán)、133團(tuán)、134團(tuán)和142團(tuán)附近相較于148團(tuán)、149團(tuán)、150團(tuán)和石總場(chǎng)附近螨害發(fā)生嚴(yán)重。
由圖6可知,螨害發(fā)生集中分布于142團(tuán)附近,在150團(tuán)、石總場(chǎng)、143團(tuán)和136團(tuán)螨害均有發(fā)生,但相對(duì)較輕,呈零星點(diǎn)狀分布。根據(jù)調(diào)查,2017年研究區(qū)棉葉螨發(fā)生情況整體呈“南重北輕”的趨勢(shì),其中142團(tuán)發(fā)生面積較大,石總場(chǎng)有一定面積發(fā)生,其他團(tuán)場(chǎng)均有輕微點(diǎn)片發(fā)生。將模型預(yù)測(cè)結(jié)果與實(shí)際情況分析比較可以看出,模型1和模型3的整體預(yù)測(cè)趨勢(shì)與實(shí)際情況較為相符,說明氣象環(huán)境的確在整體上對(duì)棉葉螨的發(fā)生起著重要作用,因此基于氣象因子的模型在大尺度上的預(yù)測(cè)效果比較好,這與前人的研究結(jié)果一致。但氣象隨空間變化緩慢,相鄰點(diǎn)差異很小,相比而言,遙感植被指數(shù)能夠反映空間上更細(xì)小的變化,具有更好的洞察能力。因此,對(duì)于螨害點(diǎn)片發(fā)生的情況,遙感模型的預(yù)測(cè)效果更好。而氣象與遙感結(jié)合的模型綜合了2類數(shù)據(jù)的優(yōu)勢(shì),既能反映空間上的變化趨勢(shì),也能對(duì)小范圍點(diǎn)片發(fā)生情況進(jìn)行較為準(zhǔn)確地預(yù)測(cè)。
氣象環(huán)境和作物生理狀況均為棉葉螨的生存環(huán)境,決定了其發(fā)生發(fā)展的趨勢(shì),因此,使用其中任何一種數(shù)據(jù)進(jìn)行建模均可以對(duì)螨害發(fā)生發(fā)展進(jìn)行預(yù)測(cè)。但結(jié)果表明,同時(shí)使用2種數(shù)據(jù)綜合考慮了影響螨害發(fā)生的2大因素,結(jié)合了二者的特點(diǎn)和優(yōu)勢(shì),因而所建模型具有更高的精度和更好的預(yù)測(cè)效果。
對(duì)于大尺度區(qū)域,氣象站點(diǎn)分布離散且不均勻,無(wú)法獲取研究區(qū)連續(xù)的氣象數(shù)據(jù)。因此,基于研究區(qū)內(nèi)及周圍11個(gè)氣象站點(diǎn)通過空間插值方法獲取空間分布連續(xù)的氣象數(shù)據(jù)用于解決該問題。在實(shí)際應(yīng)用時(shí),所采用的空間插值方法和參數(shù)的選擇會(huì)直接影響插值精度,如果選擇不當(dāng),會(huì)使插值效果不理想,將影響預(yù)測(cè)模型的準(zhǔn)確性。此外,越冬基數(shù)、棉花品種也是影響棉葉螨發(fā)生發(fā)展的關(guān)鍵因素,因此在后續(xù)的研究中應(yīng)盡可能將該部分因素進(jìn)行融合,以提高模型預(yù)測(cè)精度。
使用的遙感數(shù)據(jù)來(lái)源于Landsat 8衛(wèi)星。Landsat 8空間分辨率為30 m,即每個(gè)像元表示30 m×30 m范圍的棉田,由于范圍較大,使得完全健康區(qū)域和有輕微螨害發(fā)生區(qū)域之間的光譜差異大大降低。尤其在棉葉螨點(diǎn)片發(fā)生初期,健康采樣點(diǎn)和螨害點(diǎn)片發(fā)生采樣點(diǎn)之間的光譜差異更小,如果處理不當(dāng)會(huì)對(duì)模型造成干擾,為防止發(fā)生這種情況,將紅葉株率達(dá)到3級(jí)以上的采樣點(diǎn)認(rèn)為有螨害發(fā)生,這種處理方法勢(shì)必會(huì)對(duì)模型精度造成影響,導(dǎo)致螨害早期輕微發(fā)生的區(qū)域無(wú)法得到有效判別,因此,發(fā)病樣點(diǎn)的紅葉株率閾值該如何設(shè)定還須進(jìn)一步研究。如果能夠使用無(wú)人機(jī)進(jìn)行遙感監(jiān)測(cè),則會(huì)在很大程度上克服這個(gè)問題。
基于氣象遙感數(shù)據(jù)建立模型并對(duì)新疆生產(chǎn)建設(shè)兵團(tuán)第八師2017年7月棉葉螨進(jìn)行預(yù)測(cè),結(jié)果表明,將氣象數(shù)據(jù)和遙感數(shù)據(jù)相結(jié)合能夠?qū)γ奕~螨發(fā)生趨勢(shì)和分布情況進(jìn)行較好地預(yù)測(cè),該方法可以為新疆地區(qū)大尺度區(qū)域的棉葉螨預(yù)測(cè)預(yù)報(bào)和提前預(yù)防提供理論依據(jù),并為相關(guān)研究提供借鑒。