摘要:做好農(nóng)作物的病蟲(chóng)害預(yù)測(cè)工作具有一定的經(jīng)濟(jì)意義,也是農(nóng)業(yè)現(xiàn)代化的必要內(nèi)容之一。病蟲(chóng)害的發(fā)生受到多方面因素的綜合影響,這些因素所起的作用相互交織。新興的模糊測(cè)度與模糊積分理論能較好地分析多因素的交互作用。將模糊測(cè)度和Choquet積分應(yīng)用于蟲(chóng)害預(yù)測(cè),建立非線(xiàn)性害蟲(chóng)預(yù)測(cè)數(shù)學(xué)模型,并對(duì)不同地域的金紋細(xì)蛾(Lithocolletis ringoniella)數(shù)據(jù)進(jìn)行檢測(cè),結(jié)果表明該數(shù)學(xué)模型具有很好的預(yù)測(cè)效果。
關(guān)鍵詞:蟲(chóng)害預(yù)測(cè);金紋細(xì)蛾(Lithocolletis ringoniella);模糊測(cè)度;Choquet積分
中圖分類(lèi)號(hào):S436.62 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):0439-8114(2013)22-5485-03
中國(guó)是農(nóng)業(yè)大國(guó),如果發(fā)生大面積的嚴(yán)重農(nóng)作物和森林病蟲(chóng)害,會(huì)給社會(huì)帶來(lái)嚴(yán)重影響,做好病蟲(chóng)害防治對(duì)促進(jìn)農(nóng)業(yè)可持續(xù)發(fā)展意義重大。病蟲(chóng)害防治的一個(gè)重要環(huán)節(jié)就是做好預(yù)測(cè)工作,病蟲(chóng)害的預(yù)測(cè)被普遍認(rèn)為是農(nóng)業(yè)生產(chǎn)的基礎(chǔ)性工作[1-4]。
植物病蟲(chóng)害的發(fā)生常受生物和非生物因素綜合影響,害蟲(chóng)的生物學(xué)特征、環(huán)境溫度、濕度、天敵的數(shù)量、農(nóng)藥的使用等因素與蟲(chóng)害的發(fā)生有著復(fù)雜關(guān)系,同時(shí)蟲(chóng)害的發(fā)生是相互影響的。從數(shù)學(xué)角度看,蟲(chóng)害預(yù)測(cè)本質(zhì)就是一個(gè)多輸入的系統(tǒng)而輸入量是相互影響的,存在交互作用。隨著現(xiàn)代科技的發(fā)展,促生了一些新的基于統(tǒng)計(jì)信息的預(yù)測(cè)模型,提出了一種蟲(chóng)害預(yù)測(cè)數(shù)學(xué)模型——基于Choquet積分的非線(xiàn)性回歸。Choquet積分是模糊積分的一種,是經(jīng)典積分-勒貝格積分的推廣,其依據(jù)的模糊測(cè)度可以很好地表示多個(gè)影響因素間的交互作用,適用于蟲(chóng)害預(yù)測(cè)此類(lèi)問(wèn)題[5]。
1 模糊測(cè)度與Choquet積分
測(cè)度是測(cè)量在數(shù)學(xué)中的進(jìn)一步抽象。對(duì)于滿(mǎn)足加法原理的測(cè)度,數(shù)學(xué)中稱(chēng)為經(jīng)典測(cè)度或可加測(cè)度,不滿(mǎn)足加法原理的測(cè)度為模糊測(cè)度,也稱(chēng)為不可加測(cè)度。蟲(chóng)害預(yù)測(cè)主要為模糊測(cè)度[5]。
定義1:設(shè)X={x1,x3,…,xn}為非空有限集合,P(X)為X的冪集,即P(X)由X的所有子集構(gòu)成,若集函數(shù)μP(X)→(-∞,+∞)滿(mǎn)足μ(?覫)=0,則稱(chēng)μ為有符號(hào)模糊測(cè)度。
有符號(hào)模糊測(cè)度是不滿(mǎn)足加法原理的,體現(xiàn)為次可加性μ(A∪B)≤μ(A)+μ(B),A∩B=?覫和超可加性μ(A∪B)≥μ(A)+μ(B),A∩B=?覫。
有符號(hào)模糊測(cè)度恰恰可以用來(lái)表示蟲(chóng)害預(yù)測(cè)問(wèn)題中各影響因素間的交互作用。如μ({溫度})=0.1表示溫度這個(gè)因素對(duì)于蟲(chóng)害發(fā)生的重要度為0.1;μ({濕度})=0.2表示濕度這個(gè)因素對(duì)于蟲(chóng)害發(fā)生的重要度為0.2;μ({溫度,濕度})=0.38則表示溫度和濕度共同作用時(shí)的重要度為0.38,表明濕度和溫度對(duì)蟲(chóng)害共同作用時(shí)的重要度超過(guò)了各自作用時(shí)重要度之和,此種情況表明溫度和濕度之間存在積極交互作用。若出現(xiàn)μ({溫度})+μ({濕度})>μ({溫度,濕度}),則表明溫度和濕度之間存在消極交互作用。
定義2:設(shè)f為定義在非空有限集合X上的函數(shù),μ為定義在P(X)上的有符號(hào)模糊測(cè)度,則函數(shù)f關(guān)于有符號(hào)模糊測(cè)度的Choquet積分定義如下。
Choquet積分是非線(xiàn)性的,即Choquet積分不滿(mǎn)足下面的線(xiàn)性性質(zhì):(c)∫(kf+lg)dμ=k(c)∫fdμ+l(c)∫gdμ。其中f、g為被積函數(shù),k、l為常數(shù)。
在蟲(chóng)害預(yù)測(cè)中,Choquet積分起到了將各影響因素的值與各因素的重要性及其之間的交互作用進(jìn)行綜合的作用,而且這個(gè)過(guò)程是非線(xiàn)性的。例1為模擬一個(gè)簡(jiǎn)化的蟲(chóng)害預(yù)測(cè)。
例1:假設(shè)影響金紋細(xì)蛾(Lithocolletis ringoniella)的僅為3個(gè)因素:上一代金紋細(xì)蛾的密度x1、本代的平均溫度x2和平均濕度x3。3個(gè)因素組成集合X={x1,x2,x3}。各因素的重要度列于表1、各影響因素組成的被積函數(shù)f列于表2。
因?yàn)楸环e函數(shù)f不取負(fù)值,而且X為有限集合,所以有:
∫fdμ=(f(x3)-0)×μ({x1,x2,x3})+(f(x1)-f(x3))×μ({x1,x2})+(f(x2)-f(x1))×μ({x2})=0.42×1+(2.39-0.42)×0.7+(5.56-2.39)×0.2=2.433
Choquet積分預(yù)測(cè)的金紋細(xì)蛾的密度為2.433。
通過(guò)例1可以看出Choquet積分可以看作是有符號(hào)模糊測(cè)度μ的線(xiàn)性形式,這種特性決定了以后根據(jù)歷史數(shù)據(jù)確定有符號(hào)模糊測(cè)度μ時(shí),可以通過(guò)求解線(xiàn)性方程組得到,計(jì)算復(fù)雜度得到降低。
2 基于Choquet積分的非線(xiàn)性回歸模型
在生產(chǎn)實(shí)際中,經(jīng)常出現(xiàn)一些變量,它們相互聯(lián)系,相互依賴(lài),因而它們之間存在著一定的關(guān)系,一類(lèi)是確定性的關(guān)系,如長(zhǎng)方形的面積是長(zhǎng)與寬的乘積;一類(lèi)是非確定性的關(guān)系,如蟲(chóng)害的密度(因變量)與上代蟲(chóng)害的密度、溫度、濕度、天敵的數(shù)量之間有密切的關(guān)系,但是由于其復(fù)雜性以及人類(lèi)的知識(shí)有限性,蟲(chóng)害的密度與它們之間的關(guān)系是不能用準(zhǔn)確的函數(shù)關(guān)系來(lái)表達(dá)的。對(duì)于具有相關(guān)關(guān)系的變量,雖然不能找到它們之間的精確表達(dá)式,但是以大量試驗(yàn)或者觀察得到的數(shù)據(jù)為基礎(chǔ),可以發(fā)現(xiàn)它們之間存在一定的統(tǒng)計(jì)學(xué)規(guī)律性,就是數(shù)理統(tǒng)計(jì)中的回歸分析。線(xiàn)性回歸就是常用的一種回歸分析,運(yùn)用十分廣泛,因變量和自變量之間存在線(xiàn)性回歸的情形。線(xiàn)性回歸方程形式如下:
y=c+a1g(x1)+a2g(x2)+…+ang(xn)+N(0,σ2)(1)
其中,y為因變量,xi為影響y的因素,g(xi)為影響因素的值,也就是自變量因素,N(0,σ2)為服從正態(tài)分布的誤差項(xiàng),c與ai為回歸系數(shù)。
(1)式也可以看做經(jīng)典的黎曼積分:
y=c+∫gdμ+N(0,σ2) (2)
其中,μ({xi})= ai。
當(dāng)這些影響因素相互影響、交互作用時(shí),線(xiàn)性回歸方程就不合適了,可以用Choquet積分替換線(xiàn)性回歸方程(2)中的黎曼積分得到下面的非線(xiàn)性回歸方程[6]:
基于Choquet積分的非線(xiàn)性回歸系數(shù),可以利用遺傳算法來(lái)進(jìn)行確定[6]。遺傳算法只需要對(duì)由a1,a2,…,an,b1,b2,…,bn構(gòu)成的參數(shù)空間進(jìn)行搜索,而對(duì)于每種a1,a2,…,an,b1,b2,…,bn的可能取值,相應(yīng)的c和有符號(hào)測(cè)度μ都可通過(guò)解線(xiàn)性方程組得到。
3 驗(yàn)證與分析
為了驗(yàn)證基于Choquet積分的非線(xiàn)性回歸的有效性,在金紋細(xì)蛾的歷史數(shù)據(jù)上進(jìn)行了測(cè)試。金紋細(xì)蛾廣泛分布于遼寧、河北、河南、山東、山西、陜西、甘肅、安徽、江蘇等地,寄主有蘋(píng)果、海棠、山楂、梨、桃等,以為害蘋(píng)果為主,近些年有日趨嚴(yán)重之勢(shì),造成嚴(yán)重災(zāi)害,嚴(yán)重果園被害率100%。將從河北、山東、遼寧、河南、山西、寧夏、甘肅共7個(gè)省(區(qū))收集的2010年的金紋細(xì)蛾的數(shù)據(jù)整理成表3。金紋細(xì)蛾的寄生性天敵很多,其中以金紋細(xì)蛾跳小蜂數(shù)量最多,但是在果園內(nèi),由于農(nóng)藥的噴灑,使得金紋細(xì)蛾跳小蜂的數(shù)量很少,對(duì)金紋細(xì)蛾的作用不明顯,因此在收集數(shù)據(jù)時(shí)主要考慮了影響金紋細(xì)蛾的主要因素:上期蟲(chóng)害量、距離最近一次噴灑農(nóng)藥的時(shí)間(施藥時(shí)間)、平均溫度、月份(因金紋細(xì)蛾有很強(qiáng)的時(shí)間周期性)。數(shù)據(jù)的收集過(guò)程為每個(gè)果園5點(diǎn)取樣,每點(diǎn)選1棵樹(shù)作為當(dāng)年調(diào)查樹(shù)固定下來(lái)并編號(hào)調(diào)查樹(shù);每樹(shù)調(diào)查不少于100張葉片;蟲(chóng)害量以被金紋細(xì)蛾為害的葉片所占比例進(jìn)行標(biāo)識(shí)。
將基于Choquet積分的非線(xiàn)性回歸模型用于蘋(píng)果園的金紋細(xì)蛾預(yù)測(cè)時(shí),表3中的第2-5列就是回歸模型中的自變量,即X={上期蟲(chóng)害量、施藥時(shí)間、溫度、月份}。每一行的后面4個(gè)數(shù)構(gòu)成(3)式中的被積函數(shù)g,代入(3)式計(jì)算出相應(yīng)的y,并與同一行的第一個(gè)值,也就是本期實(shí)際蟲(chóng)害量進(jìn)行比較,兩者的差為誤差,將每一行的誤差取平方,再對(duì)所有行的誤差平方求和,為誤差平方和。以誤差平方和最小化為目標(biāo),用Matlab軟件中的遺傳算法工具箱對(duì)(3)式中的非線(xiàn)性回歸系數(shù)求得最優(yōu)值,代入(3)式,就得到了可以對(duì)未來(lái)的金紋細(xì)蛾進(jìn)行預(yù)測(cè)的回歸方程。
將收集到的金紋細(xì)蛾的數(shù)據(jù)進(jìn)行隨機(jī)劃分,一部分(70%)用來(lái)確定回歸系數(shù),為訓(xùn)練集;一部分(30%)用來(lái)測(cè)試檢驗(yàn)回歸方程,為測(cè)試集。并將該過(guò)程重復(fù)10次,其結(jié)果都類(lèi)似于圖1。
在對(duì)2010年的數(shù)據(jù)多次重復(fù)測(cè)試中,利用所介紹的方法,平均相對(duì)誤差是9%,最大相對(duì)誤差是19%,最小是0。通過(guò)對(duì)金紋細(xì)蛾的實(shí)際測(cè)試表明,基于Choquet積分的非線(xiàn)性回歸方法具有很好的預(yù)測(cè)效果。該方法可以充分考慮各影響因素間的交互作用,可以將該方法應(yīng)用于蟲(chóng)害的預(yù)測(cè)。
4 小結(jié)
影響蟲(chóng)害的因素很多,這些因素存在著交互作用。本研究提出了用模糊測(cè)度表示這些因素的交互作用,并基于Choquet積分建立了非線(xiàn)性回歸預(yù)測(cè)方法。在2010年金紋細(xì)蛾的數(shù)據(jù)上進(jìn)行的多次測(cè)試證明該預(yù)測(cè)方法具有很好的效果,可繼續(xù)研究將該方法推廣到其他蟲(chóng)害預(yù)測(cè)中。
參考文獻(xiàn):
[1] 程極益,蘇慶玲,張孝羲.多元模糊回歸在害蟲(chóng)測(cè)報(bào)上的應(yīng)用[J].昆蟲(chóng)知識(shí),1994,3(2):65-68.
[2] 彭瑩瓊,王映龍,唐建軍,等. B/S模式的水稻病蟲(chóng)害診斷專(zhuān)家系統(tǒng)研究[J].江西農(nóng)業(yè)大學(xué)學(xué)報(bào),2008,30(6):1157-1160.
[3] 許漢亮,管楚雄,林明江,等.甘蔗金龜子可持續(xù)控制技術(shù)研究[J].廣東農(nóng)業(yè)科學(xué),2012(2):65-68.
[4] 楊 漾,謝健文,胡月明,等.GIS技術(shù)在農(nóng)作物病蟲(chóng)害監(jiān)測(cè)預(yù)警系統(tǒng)中的應(yīng)用[J].廣東農(nóng)業(yè)科學(xué),2012(10):200-202.
[5] WANG Z Y, GEORGE J K. Fuzzy measure theory[M]. New York: Plenum Press, 1992.
[6] WANG Z Y, GUO H F. A new genetic algorithm for nonlinear multiregressions based on generalized Choquet integrals[A]. The 12th IEEE International Conference on Fuzzy Systems 2003(2)[C]. Louis:IEEE Press,2003.
(責(zé)任編輯 陳 焰)