李建宇,陳燕婷,傅建煒,史夢(mèng)竹,齊 心,尤民生
(1.福建省農(nóng)業(yè)科學(xué)院植物保護(hù)研究所,福建省作物有害生物監(jiān)測(cè)與治理重點(diǎn)實(shí)驗(yàn)室,福州 350013;2.福建省農(nóng)業(yè)科學(xué)院農(nóng)業(yè)質(zhì)量標(biāo)準(zhǔn)與檢測(cè)技術(shù)研究所,福州 350003;3.福建農(nóng)林大學(xué)應(yīng)用生態(tài)研究所,閩臺(tái)作物有害生物生態(tài)防控國(guó)家重點(diǎn)實(shí)驗(yàn)室,福州 350002;4.山東農(nóng)業(yè)大學(xué)植物保護(hù)學(xué)院,山東泰安 271018)
生命表是一個(gè)由種群所有個(gè)體的生存、發(fā)育和繁殖等數(shù)據(jù)組成的綜合數(shù)據(jù)集,是害蟲治理與生態(tài)學(xué)研究中最重要的工具之一(齊心等,2019;Chietal.,2020;Taghizadeh and Chi,2022)。早期普遍使用的傳統(tǒng)雌性特定年齡生命表(Euler,1760;Lotka,1907;Birch,1948;Carey,1993)由于未能描述齡期分化(即變態(tài)),且忽略了雄性個(gè)體對(duì)種群增長(zhǎng)與其對(duì)捕食、寄生和取食等效能的貢獻(xiàn),因而無(wú)法準(zhǔn)確預(yù)測(cè)種群的增長(zhǎng),同時(shí)也限制了生命表在生態(tài)學(xué)理論中的發(fā)展及其在害蟲防治中的實(shí)際應(yīng)用(Huang and Chi,2012)。相對(duì)而言,年齡-齡期兩性生命表(簡(jiǎn)稱“兩性生命表”)(Chi and Liu,1985;Chi,1988)在理論、數(shù)據(jù)分析以及實(shí)際應(yīng)用中不僅能較準(zhǔn)確地描述昆蟲種群的齡期分化與兩性差異,同時(shí)也能更好地應(yīng)用于種群預(yù)測(cè)和生物防治等研究。因?yàn)閮尚陨淼纳鲜鰞?yōu)點(diǎn),研究者能正確分析昆蟲不同齡期間與雌雄兩性間的各種差異,例如捕食率(或寄生率與取食量)差異、對(duì)藥劑敏感性的差異等對(duì)種群生命表的影響,這使得生命表理論得以進(jìn)一步發(fā)展,并能用于種群相互關(guān)系的研究。蒲蟄龍(1989)主編的《農(nóng)作物害蟲管理數(shù)學(xué)模型與應(yīng)用》已將Chi和Liu(1985)的兩性生命表論文翻譯并納入書中。普林斯頓大學(xué)出版社(Princeton University Press)出版的專著《Population Harvesting》(Getz and Haight,1989)也詳細(xì)介紹了Chi 和 Liu(1985)的兩性生命表理論。在國(guó)內(nèi),吳坤君等(1994)首次將兩性生命表用于粘蟲Mythimnaseparata的生命表研究,并指出其優(yōu)點(diǎn)。近年來(lái)國(guó)內(nèi)外學(xué)者普遍采用兩性生命表進(jìn)行相關(guān)研究(胡昌雄等,2021;Naeemetal.,2021;謝艷蘭等,2021;Amir-Maafietal.,2022;Iqbaletal.,2022)。自1990年后,為方便使用者運(yùn)用兩性生命表理論而創(chuàng)制并不斷更新的數(shù)據(jù)處理軟件TWOSEX-MSChart(Chi,2022),因?yàn)椴僮骱?jiǎn)便,多數(shù)研究人員均能快速掌握其使用方法,并且從軟件輸出的結(jié)果中獲取相關(guān)研究需要的數(shù)據(jù),用于理論的研究和實(shí)踐推廣應(yīng)用。然而,由于有許多研究人員對(duì)于兩性生命表軟件中所使用的生態(tài)學(xué)理論與數(shù)理統(tǒng)計(jì)理論的理解有限,造成在論文撰寫和應(yīng)用分析時(shí)出現(xiàn)不準(zhǔn)確甚至錯(cuò)誤的現(xiàn)象。本文詳細(xì)闡述兩性生命表所使用的自我重復(fù)取樣(bootstrap)技術(shù)與多項(xiàng)式定理(multinomial theorem)的原理和運(yùn)用,旨在幫助國(guó)內(nèi)昆蟲學(xué)和生態(tài)學(xué)的研究人員深入理解兩性生命表中的基本原理,更好地將其運(yùn)用于相關(guān)科研工作中,進(jìn)而提升科學(xué)研究水平。為了方便解釋bootstrap技術(shù)和多項(xiàng)式定理在兩性生命表應(yīng)用中的原理,更直觀地展示相關(guān)公式模擬的結(jié)果,本文選用本課題組未發(fā)表試驗(yàn)數(shù)據(jù)進(jìn)行相關(guān)模擬分析并作圖。
在科學(xué)研究中,為了對(duì)數(shù)據(jù)進(jìn)行數(shù)理統(tǒng)計(jì)分析,研究人員會(huì)在相同條件下進(jìn)行多次重復(fù)試驗(yàn),再計(jì)算各重復(fù)數(shù)據(jù)的均值與標(biāo)準(zhǔn)誤用于分析。常用統(tǒng)計(jì)方法均以正態(tài)分布為前提,但是大多數(shù)試驗(yàn)數(shù)據(jù)為非正態(tài)分布,如用50頭昆蟲研究繁殖力或壽命時(shí),其頻率分布(frequency distribution)一般是非正態(tài)分布(圖1)。
圖1 LC30濃度蟲螨腈處理后木瓜秀粉蚧的繁殖力(單雌產(chǎn)卵量)(A)和壽命(B)的頻率分布Fig.1 Frequency distribution of the fecundity (number of eggs laid per female)(A) and longevity (B) of Paracoccus marginatus after treatment with LC30 of chlorfenapyr
常用統(tǒng)計(jì)中用公式(1)~(3)計(jì)算50頭試蟲的平均壽命與標(biāo)準(zhǔn)誤,若其中有30頭雌蟲,則可用30頭雌蟲的繁殖率計(jì)算平均繁殖率與標(biāo)準(zhǔn)誤。
(1)
式中Xi為第i頭試蟲的壽命或繁殖率。
(2)
(3)
Bootstrap是一個(gè)很通用的工具,用來(lái)估計(jì)偏差、標(biāo)準(zhǔn)誤和置信區(qū)間。它是由Efron(1979)提出的一種統(tǒng)計(jì)方法,根據(jù)原始試驗(yàn)樣本重復(fù)抽取樣本信息,不需要數(shù)據(jù)分布假設(shè),即可對(duì)數(shù)據(jù)總體的分布特性進(jìn)行統(tǒng)計(jì)和推斷。Efron和Tibshirani(1993)較為系統(tǒng)地介紹了bootstrap技術(shù)的理論成果?!癇ootstrap”一詞來(lái)自短語(yǔ)“to pull oneself up by ones bootstraps”,這個(gè)短語(yǔ)源自西方童話故事“The Adventures of Baron Munchausen《吹牛大王歷險(xiǎn)記》”(Raspe,2017)。故事中的吹牛大王說(shuō)他有一次掉到了很深的湖底,最后他通過(guò)拎著自己的鞋帶將自己從湖底救出(Johnson,2001)。這個(gè)故事比喻不靠外界力量,只靠提升自己的性能,就能達(dá)到目標(biāo)。同樣地,統(tǒng)計(jì)學(xué)中的bootstrap技術(shù)完成了似乎不可能的事情,即利用自我重復(fù)取樣來(lái)估計(jì)未知概率統(tǒng)計(jì)量的統(tǒng)計(jì)特性。
昆蟲學(xué)、生物學(xué)與生態(tài)學(xué)等研究中有許多數(shù)據(jù)屬于非正態(tài)分布,常常無(wú)法確定其正態(tài)性,因此難以獲得正確的標(biāo)準(zhǔn)誤。此時(shí),研究人員只能采用增加大量樣本,或者采用數(shù)學(xué)方法對(duì)數(shù)據(jù)進(jìn)行正態(tài)化轉(zhuǎn)換,但是這些方法往往有其缺點(diǎn),或者得到的結(jié)果依然不是很理想。Bootstrap技術(shù)的出現(xiàn),則較好地解決這個(gè)問(wèn)題。目前bootstrap技術(shù)的方法和理論已在金融、經(jīng)濟(jì)、生物和醫(yī)學(xué)等領(lǐng)域廣泛應(yīng)用(MacKinnon,2002;趙亮等,2010;Amir-Maafietal.,2022)。
若以50粒卵開始做生命表研究,可以用50個(gè)個(gè)體的存活率與繁殖率計(jì)算內(nèi)稟增長(zhǎng)率、周限增長(zhǎng)率、凈增殖率和平均世代時(shí)間等。
兩性生命表中凈增殖率(R0)公式為
(4)
其中,k為齡期數(shù),sxj為新生個(gè)體存活到年齡x與齡期j的概率,fxj為個(gè)體在年齡x與齡期j時(shí)的平均繁殖率。若只考慮年齡時(shí),lx為新生個(gè)體存活到年齡x的概率,mx為個(gè)體在年齡x時(shí)的平均繁殖率。內(nèi)稟增長(zhǎng)率(r)計(jì)算公式為
(5)
用矩陣研究種群增長(zhǎng)時(shí),Lewis(1942)的種群周限增長(zhǎng)率(λ)計(jì)算公式為
λn+1-f0λn-s0f1λn-1-s0s1f2λn-2-…-s0s1…sn-2fn-1λ-s0s1…sn-1fn=0
(6)
其中,fx≥0,sx>0,sx為年齡x的個(gè)體存活到x+1的概率,fx為個(gè)體在年齡x時(shí)的平均繁殖率(Lewis原公式的起始年齡為1,公式6的起始年齡為0)。因?yàn)橹芟拊鲩L(zhǎng)率的公式較長(zhǎng),一般論文中只列出內(nèi)稟增長(zhǎng)率的公式,再用r與λ的關(guān)系式表示λ=er。在計(jì)算機(jī)普及之前,使用這兩個(gè)公式計(jì)算一個(gè)生命表的內(nèi)稟增長(zhǎng)率與周限增長(zhǎng)率已十分困難,因?yàn)楸仨毷褂胑與大數(shù)值的指數(shù),因此有許多學(xué)者發(fā)展各種簡(jiǎn)化方法,例如Howe(1953)以及Wyatt和White(1977)等。由于這些簡(jiǎn)化方法已被證明會(huì)導(dǎo)致錯(cuò)誤結(jié)果(Mirmohammadietal.,2009;Saskaetal.,2021),本文不再對(duì)這些簡(jiǎn)化方法的錯(cuò)誤進(jìn)行贅述。
由于50個(gè)個(gè)體的數(shù)據(jù)用一般統(tǒng)計(jì)方法計(jì)算只能得到一個(gè)內(nèi)稟增長(zhǎng)率、周限增長(zhǎng)率、凈增殖率和平均世代時(shí)間,無(wú)法計(jì)算標(biāo)準(zhǔn)誤。如果用一般方法里的重復(fù)概念,需要做多個(gè)重復(fù),即必須做多個(gè)生命表。因?yàn)樯硌芯啃枰罅康娜肆?、時(shí)間和空間,若用一般方法里的重復(fù)概念,將耗費(fèi)大量時(shí)間、人力和經(jīng)費(fèi),因此很少有人用“重復(fù)”的概念計(jì)算生命表各個(gè)參數(shù)的標(biāo)準(zhǔn)誤。為了解決此問(wèn)題,Meyer等(1986)介紹將jackknife與bootstrap技術(shù)用于計(jì)算種群增長(zhǎng)率的標(biāo)準(zhǔn)誤。這兩種方法的使用均須依賴計(jì)算機(jī)。早期由于個(gè)人計(jì)算機(jī)的性能較差,使用bootstrap技術(shù)計(jì)算種群增長(zhǎng)率的標(biāo)準(zhǔn)誤需要數(shù)日的時(shí)間,因此應(yīng)用較多的是jackknife方法(Chi and Getz,1988)。隨著計(jì)算機(jī)性能的提升,以及Huang和Chi(2013)證明jackknife方法并不適合用于生命表研究,bootstrap技術(shù)成為目前普遍采用的方法。
在使用bootstrap技術(shù)計(jì)算兩性生命表種群參數(shù)時(shí),從種群中隨機(jī)抽n個(gè)個(gè)體進(jìn)行歸還取樣,其中n通常就是生命表種群的起始個(gè)體數(shù)。因?yàn)槭菤w還取樣,每一個(gè)個(gè)體的數(shù)據(jù)可能被反復(fù)選取,也有些個(gè)體可能沒(méi)有被選到,其概念如圖2所示。
圖2 Bootstrap技術(shù)原理Fig.2 Principles of the bootstrap technique R0:凈增殖率Net reproductive rate;B:重復(fù)取樣數(shù)Number of re-samplings.
(7)
(8)
(9)
為了提高精確度與減少兩次bootstrap間的差異,必須選用較大的重復(fù)取樣數(shù)B值,理論上B值越大,模擬估算的方差和標(biāo)準(zhǔn)誤越準(zhǔn)確,而且每次bootstrap產(chǎn)生的方差較為穩(wěn)定。但是,B值的設(shè)定受計(jì)算機(jī)中央處理器(central processing unit,CPU)速度與內(nèi)存(random-access memory,RAM)容量的限制,設(shè)定的B值太大,計(jì)算機(jī)需要的運(yùn)行時(shí)間則較長(zhǎng),甚至過(guò)大的B值會(huì)導(dǎo)致計(jì)算機(jī)無(wú)法運(yùn)行。由于早年的計(jì)算機(jī)速度與內(nèi)存容量有限,Meyer等(1986)推薦的B值為500~1 000。圖3展示了使用1 000個(gè)和100 000個(gè)bootstrap重復(fù)獲得的數(shù)據(jù)頻率分布的差異。其中,圖3(A)和(B)為兩次1 000個(gè)bootstrap運(yùn)行結(jié)果,圖3(C)和(D)為兩次100 000個(gè)bootstrap運(yùn)行結(jié)果。顯然,1 000個(gè)bootstrap重復(fù)取樣的頻率分布已近似正態(tài),但在兩次運(yùn)行之間的頻率分布仍有明顯差異。在1980年代,bootstrap技術(shù)的應(yīng)用受到了計(jì)算機(jī)CPU和RAM的限制,用bootstrap模擬完成需花費(fèi)大約20 000 h(Hesterberg,2008)。但是,使用100 000次bootstrap技術(shù)已能產(chǎn)生一個(gè)可接受的正態(tài)分布(圖3:C,D),且兩次之間的差異較小,估計(jì)值的方差與標(biāo)準(zhǔn)誤較為穩(wěn)定。由于bootstrap是一個(gè)重復(fù)歸還取樣(sampling with replacement)的過(guò)程,當(dāng)n>10,B=100 000時(shí),每個(gè)bootstrap樣本都會(huì)產(chǎn)生不同的個(gè)體組合,種群參數(shù)的平均值、方差和標(biāo)準(zhǔn)誤都可能不同。因此,一般使用bootstrap時(shí),沒(méi)有所謂的最優(yōu)或最適當(dāng)B值。所需的bootstrap數(shù)量取決于生命表數(shù)據(jù)(個(gè)體數(shù)、齡期數(shù)、壽命和個(gè)體間的差異等),當(dāng)個(gè)體之間的差異越大,bootstrap的數(shù)量就應(yīng)該越高。通過(guò)反復(fù)的試驗(yàn),目前TWOSEX軟件預(yù)設(shè)的B值是100 000,這樣的設(shè)定對(duì)絕大多數(shù)的昆蟲生命表研究都能提供很好的結(jié)果。使用bootstrap技術(shù),通過(guò)100 000次取樣后,所得到的種群參數(shù)一般呈正態(tài)分布,且方差較小(Efron and Tibshirani,1993;Yuetal.,2013)。隨著計(jì)算機(jī)運(yùn)算速度的提升,100 000次bootstrap取樣在幾分鐘內(nèi)即可完成。自2013年以后,TWOSEX-MSChart軟件不再提供jackknife方法,僅提供bootstrap技術(shù)供研究人員使用。
圖3 Bootstrap 1 000次重復(fù)取樣(A,B)和100 000次重復(fù)取樣(C,D)獲得的蓮草直胸跳甲種群凈增殖率(R0)估計(jì)值的頻率分布Fig.3 Frequency distribution of bootstrap estimates of the net reproductive rate (R0) of Agasicles hygrophila by using 1 000 bootstrap re-samplings (A and B) and 100 000 bootstrap re-samplings (C and D)B:重復(fù)取樣數(shù)Number of re-samplings;n:個(gè)體數(shù)Number of individuals;m:平均值Mean;δ2:方差Variance;SE:標(biāo)準(zhǔn)誤Standard error.圖4同。The same for Fig.4.
Bootstrap技術(shù)不但可以用于估算種群參數(shù)的方差與標(biāo)準(zhǔn)誤,也可以用于一般統(tǒng)計(jì)值(TWOSEX軟件中的G.Gen.boot)。圖4為應(yīng)用bootstrap技術(shù)估算繁殖力和壽命的標(biāo)準(zhǔn)誤。從圖4可看出bootstrap技術(shù)估算的數(shù)據(jù)呈正態(tài)分布。因此,無(wú)論將bootstrap技術(shù)用于估算種群參數(shù)或一般統(tǒng)計(jì)值,其結(jié)果一般都符合中心極限定理(central limit theorem),也能準(zhǔn)確展示種群的變異性(齊心等,2019)。
圖4 LC30濃度蟲螨腈處理后木瓜秀粉蚧的平均繁殖力(A)和平均壽命(B)的頻率分布Fig.4 Frequency distribution of the mean fecundity (A) and mean longevity (B) of Paracoccus marginatus after treatment with LC30 of chlorfenapyr
在TWOSEX-MSChart軟件中paired bootstrap test檢驗(yàn)的結(jié)果有下列3種方式呈現(xiàn):(1)t置信區(qū)間(假設(shè)結(jié)果是正態(tài)分布);(2)Bootstrap percentile (百分位置信區(qū)間)(基于實(shí)際取樣結(jié)果);(3)P值基于bootstrap樣本中差異顯著的bootstrap樣本數(shù)。因?yàn)閠置信區(qū)間是基于正態(tài)分布的假設(shè),而bootstrap百分位置信區(qū)間是基于隨機(jī)取樣的,所以它們可能是不同的。雖然大多數(shù)生物學(xué)和生態(tài)學(xué)數(shù)據(jù)為非正態(tài)分布,但是當(dāng)B足夠大時(shí),bootstrap樣本平均值的分布一般是正態(tài)的。因此,需要大量的重復(fù)取樣(B=100 000)才能保證估算值的穩(wěn)定。如果bootstrap結(jié)果是正態(tài)分布的,則t置信區(qū)間與bootstrap置信區(qū)間將非常相近。一般而言,3種方法的顯著性檢驗(yàn)結(jié)果是一致的。只有在極端情況下才會(huì)出現(xiàn)不一致的結(jié)果。當(dāng)3種結(jié)果不一致時(shí),研究人員必須依據(jù)數(shù)據(jù)妥善判斷與解釋(Weietal.,2020)。
3.4.1孵化率:由于每次bootstrapping都會(huì)產(chǎn)生不同的結(jié)果,TWOSEX軟件將100 000個(gè)bootstrap樣本保存于一個(gè)純文字文件中。若要明確卵的孵化率是否會(huì)因雌蟲的年齡而發(fā)生變化,使用者可以將每頭雌蟲每日的“總產(chǎn)卵量”與“孵化卵量”分別制作成兩個(gè)生命表,然后選擇用相同的bootstrap樣本分析總產(chǎn)卵量和孵化卵量之間的關(guān)系,并估計(jì)整體孵化率(hatching rate)的標(biāo)準(zhǔn)誤。如果不使用相同的bootstrap樣本,總產(chǎn)卵量生命表的第x個(gè)bootstrap樣本的平均繁殖率可能低于孵化卵量生命表的第x個(gè)平均繁殖率,導(dǎo)致卵孵化率大于1,這是錯(cuò)誤的。此外,如果文件A包含每個(gè)個(gè)體每天的總產(chǎn)卵量,文件B包含每天的孵化卵量,如果文件B只有少數(shù)個(gè)孵化卵,那么研究者可能會(huì)面臨一個(gè)問(wèn)題,即文件B的樣本得到的R0=0。這時(shí),必須先用文件B運(yùn)行bootstrap,然后使用相同的bootstrap樣本運(yùn)行文件A。為了獲得準(zhǔn)確的結(jié)果,這些細(xì)節(jié)都是在使用bootstrap技術(shù)時(shí)需要考慮的。
圖5 采用相同bootstrap樣本計(jì)算轉(zhuǎn)換率(Qp)的標(biāo)準(zhǔn)誤原理Fig.5 Principles of calculating the standard error of transformation rate (Qp) by using the same bootstrap samples首先用害蟲的生命表數(shù)據(jù)計(jì)算凈增殖率(R0),然后用相同的bootstrap樣本計(jì)算天敵的凈捕食率(C0),因?yàn)闃颖鞠嗤?,就可以?jì)算天敵每產(chǎn)一個(gè)卵需要捕食害蟲的數(shù)量,從而計(jì)算轉(zhuǎn)換率(Qp)及其標(biāo)準(zhǔn)誤。Firstly,the net reproductive rate (R0) was calculated using the life table data of insect pest.The same bootstrap samples were used to calculate the net predation rate (C0) of natural enemy.Then the number of prey (insect pests) required for natural enemy to produce one egg could be calculated.Finally,the transformation rate (Qp) and its standard error could be calculated.
3.4.2生命表與捕食率:生命表是種群生態(tài)學(xué)最重要的基礎(chǔ)。生命表除了可以進(jìn)行精確的害蟲種群預(yù)測(cè)以外,也可以將生命表應(yīng)用于天敵大規(guī)模飼養(yǎng)、生物防治和害蟲管理等。這時(shí),就必須把生命表和捕食率結(jié)合起來(lái)以便正確用于生物防治。當(dāng)利用TWOSEX和CONSUME軟件結(jié)合進(jìn)行天敵種群增長(zhǎng)預(yù)測(cè)與捕食潛能分析時(shí),必須采用相同的bootstrap樣本正確估算轉(zhuǎn)換率(Qp)的標(biāo)準(zhǔn)誤。圖5顯示了采用相同bootstrap樣本計(jì)算轉(zhuǎn)換率(Qp)標(biāo)準(zhǔn)誤的原理,由于bootstrap技術(shù)采用的是重復(fù)隨機(jī)取樣,因此需要保存生命表分析中用于計(jì)算凈增殖率(R0)的100 000個(gè)bootstrap樣本,然后將其用于計(jì)算凈捕食率(C0)的分析。CONSUME軟件可以將生命表分析與捕食率正確地連接起來(lái),以估算轉(zhuǎn)換率(Qp=C0/R0)和周限捕食率(ω)及其標(biāo)準(zhǔn)誤。其中,Qp描述了繁殖和捕食率之間的關(guān)系(Chi and Yang,2003),即捕食者每產(chǎn)生一個(gè)子代需要捕食的獵物數(shù)。但是,高Qp值并不一定代表高捕食效能。自2013年以來(lái),TWOSEX-MSChart(Chi,2022)便提供了估算Qp標(biāo)準(zhǔn)誤的功能。
3.4.3利用bootstrap技術(shù)估算有翅蚜與無(wú)翅蚜對(duì)種群參數(shù)的貢獻(xiàn):若蚜蟲種群中同時(shí)存在有翅型與無(wú)翅型子代,可以參考?zg?k?e等(2018a,2018b)和Luo等(2022)計(jì)算兩種類型對(duì)內(nèi)稟增長(zhǎng)率與凈增殖率的貢獻(xiàn)。
(10)
=R0,AP+R0,AL
(11)
(12)
上式中R0,AP/R0與R0,AL/R0分別為無(wú)翅子代與有翅子代對(duì)凈增殖率的貢獻(xiàn)。
在大多數(shù)蚜蟲種類中,有翅蚜的比例會(huì)發(fā)生變化。例如,在春季,為了進(jìn)行季節(jié)性的擴(kuò)散,有翅蚜比例通常較高。同時(shí),由于各種環(huán)境因素也會(huì)影響有翅蚜的比例(Mehrparvaretal.,2013)。因此,在計(jì)算生命表參數(shù)時(shí),由于有翅蚜個(gè)體數(shù)量變化較大或者在種群中的比例較低,往往沒(méi)有將有翅蚜包括在內(nèi)(?zg?k?e and Atlhan,2004;Kaydanetal.,2006;Mirmohammadietal.,2009;Mehrparvaretal.,2013;Akk?prüetal.,2015)。然而,從生命表分析中排除有翅蚜意味著數(shù)據(jù)分析的不完整性和實(shí)驗(yàn)結(jié)果的不準(zhǔn)確。?zg?k?e等(2018a)和Luo等(2022)通過(guò)使用兩性生命表方法來(lái)計(jì)算有翅蚜和無(wú)翅蚜個(gè)體對(duì)種群的貢獻(xiàn),利用bootstrap技術(shù)估算了發(fā)育時(shí)間、繁殖力、壽命和種群參數(shù)的方差和標(biāo)準(zhǔn)誤,并進(jìn)行了自我重復(fù)取樣,以獲得穩(wěn)定的估算值。有翅蚜不僅使蚜蟲能夠快速擴(kuò)散,同時(shí)加速了蚜蟲在寄主之間傳播植物病毒。因此,通過(guò)兩性生命表的結(jié)果,準(zhǔn)確預(yù)測(cè)有翅蚜的發(fā)生高峰期,有利于蚜蟲的綜合治理。
Bootstrap技術(shù)的優(yōu)點(diǎn)除了上述的以外,bootstrap用于生命表研究時(shí),是以個(gè)體為取樣單位,每個(gè)bootstrap樣本包含n個(gè)個(gè)體的全部特性(包括發(fā)育歷期、壽命、雌性繁殖率和取食量等)。由于每個(gè)個(gè)體的上述各個(gè)特性之間不是相互獨(dú)立的,而是互相關(guān)聯(lián)的,使用bootstrap技術(shù)才能正確地分析數(shù)據(jù)。以性比為例,性比是生命表研究中一項(xiàng)常用的統(tǒng)計(jì)參數(shù),在昆蟲種群發(fā)展中起關(guān)鍵作用。使用兩性生命表時(shí),bootstrap能包含性比的變化對(duì)種群的影響。因?yàn)閭鹘y(tǒng)雌性生命表完全忽略雄性,使用傳統(tǒng)雌性生命表時(shí),即使采用bootstrap技術(shù),也無(wú)法涵蓋性比對(duì)種群參數(shù)的影響。盡管傳統(tǒng)雌性生命表也考慮性比,但是一般性比并不能反映成蟲前期存活率的差異及其對(duì)種群繁殖力的影響,因此具有相同性別比例的兩個(gè)種群完全可能具有不同的適合度,所以使用傳統(tǒng)雌性生命表將會(huì)造成諸多問(wèn)題,具體可參考Huang和Chi(2011)。兩性生命表包含了所有個(gè)體,在原始數(shù)據(jù)分析中采用bootstrap自我重復(fù)取樣,所有bootstrap樣本可能包含不同數(shù)量的雌性、雄性和在成蟲前階段死亡的個(gè)體。因此,通過(guò)使用bootstrap技術(shù),兩性生命表可以正確分析包括性比的標(biāo)準(zhǔn)誤及其對(duì)種群參數(shù)的影響(Chenetal.,2018;Huangetal.,2018;Chietal.,2020)。Bootstrap技術(shù)雖有許多優(yōu)點(diǎn),但其仍有些缺點(diǎn)。例如:bootstrap技術(shù)完全依賴計(jì)算機(jī)仿真,由于其本質(zhì)為隨機(jī)取樣,每次結(jié)果均不同,必須用較大的重復(fù)取樣數(shù)以獲得較精確地估計(jì)值,但重復(fù)取樣數(shù)又受限于計(jì)算機(jī)CPU與內(nèi)存容量的限制;此外,當(dāng)bootstrap樣本中僅含雄性個(gè)體時(shí),bootstrap樣本無(wú)法計(jì)算內(nèi)稟增長(zhǎng)率,這也是bootstrap的缺點(diǎn)之一。對(duì)bootstrap技術(shù)擬深入學(xué)習(xí)者,可參考Canty等(2006)的論文。
任何技術(shù)的背后都需要科學(xué)理論的支撐,有些技術(shù)背后的科學(xué)理論迄今尚未被發(fā)現(xiàn),還有些技術(shù)的科學(xué)理論已經(jīng)被證明,但是因?yàn)樘y,理解的人不多。例如,原始人發(fā)明了“輪子”,但是人類有文字與數(shù)學(xué)后,才嘗試了解圓周率,又經(jīng)過(guò)了很久數(shù)學(xué)家才證明π為無(wú)理數(shù)。Bootstrap技術(shù)的理論基礎(chǔ)即數(shù)學(xué)中的多項(xiàng)式定理(multinomial theorem)(華羅庚,1957)與概率論(probability)。
為了計(jì)算bootstrapR0的理論概率或精確概率,Zhao等(2021)與Ding等(2021)首次將多項(xiàng)式定理應(yīng)用于生命表研究。多項(xiàng)式定理公式為:
(a1+a2+…+an)n=
(13)
(14)
(15)
因此,利用多項(xiàng)式定理,可以計(jì)算出任何特定的bootstrap生命表樣本的精確機(jī)率。
雖然利用多項(xiàng)式定理可以計(jì)算出所有可能的bootstrap生命表,對(duì)于使用100頭試蟲的生命表研究,有100100種取樣順序(即1.0×10200),不同個(gè)體組成的生命表總數(shù)為4.5274×1058個(gè),而對(duì)于使用50頭試蟲的生命表研究,有5050種取樣順序(即8.881784×1084),不同個(gè)體組成的生命表總數(shù)為5.0446×1028個(gè),對(duì)目前的個(gè)人計(jì)算機(jī)來(lái)說(shuō),仍然不可能完成所有不同組成的生命表及其機(jī)率的計(jì)算。由于bootstrap技術(shù)中的B值一般遠(yuǎn)小于Ln(亦即B?Ln),因此,任何一個(gè)bootstrap樣本只是用計(jì)算機(jī)模擬得到的多項(xiàng)式定理的一小部分。在這個(gè)計(jì)算過(guò)程中,當(dāng)B值較大(≥100 000)時(shí),bootstrap樣本的概率接近理論值(Dingetal.,2021;Taghizadehetal.,2022)。如果要利用多項(xiàng)式定理得到準(zhǔn)確的結(jié)果,就必須在超級(jí)計(jì)算機(jī)上進(jìn)行分析。
目前在兩性生命表研究中受制于個(gè)人計(jì)算機(jī)的運(yùn)算能力,一般只能用100 000個(gè)bootstrap樣本,但仍能獲得穩(wěn)定可信賴的參數(shù)。圖6為未進(jìn)行排序的100 000個(gè)bootstrap樣本的散點(diǎn)圖,顯示了采用bootstrap技術(shù)取樣的隨機(jī)性,當(dāng)對(duì)100 000個(gè)bootstrap樣本進(jìn)行排序,可以得到一條平滑的曲線(圖7)。由圖7中可以找到0.025與0.975的置信區(qū)間(confidence interval)。若計(jì)算每個(gè)R0出現(xiàn)的次數(shù),就可以做出頻率分布圖(圖8:A),100 000個(gè)bootstrap樣本的R0頻率分布接近正態(tài)分布。若把圖8(A)分組合并做成50個(gè)柱狀圖,就會(huì)呈現(xiàn)類似圖3或圖4的形狀。雖然圖3與圖4是一般統(tǒng)計(jì)教科書與一般研究人員期望的正態(tài)分布,而圖8(A)是數(shù)據(jù)的真實(shí)原貌。圖8(A)中,在第2.5百分位數(shù)(R0=44.94)、第50百分位數(shù)(R0=72.20)與第97.5百分位數(shù)(R0=104.16)的bootstrap生命表數(shù)量分別有13個(gè)(圖8:B)、51個(gè)(圖8:C)和6個(gè)(圖8:D);在100 000個(gè)bootstrap樣本中,這些值的概率分別為0.00013,0.00051和0.00006。利用多項(xiàng)式定理計(jì)算這些bootstrap生命表的理論概率分別為1.8415×10-5,210.9188×10-5和0.7356×10-5,它們理論的次數(shù)分別約為1.8415,210.9188和0.7356,它們的差異是由于模擬 100 000 次還是非常小的比例,距離真實(shí)的多項(xiàng)式定理的理論值還有相當(dāng)大的差距。種群的R0值為72.84,用t(1.96)計(jì)算得到的0.025和0.975置信區(qū)間分別為43.1574和102.5226。用t分布所計(jì)算的置信區(qū)間和實(shí)際取樣獲得的置信區(qū)間相當(dāng)一致。因此,通過(guò)多項(xiàng)式定理顯示bootstrap技術(shù)采用100 000次重復(fù)取樣能得到較穩(wěn)定和可靠的總體參數(shù)估計(jì)。由于昆蟲、螨類等群體的高度變異性,精確估計(jì)種群增長(zhǎng)潛力的不確定性對(duì)于害蟲防治非常重要,而1 000次或者較少的bootstrap重復(fù)取樣可能會(huì)錯(cuò)估置信區(qū)間(Ak?aetal.,2015),在種群生態(tài)學(xué)和害蟲管理研究的實(shí)際應(yīng)用中,這將導(dǎo)致害蟲防治的失敗。
圖6 Bootstrap 100 000次重復(fù)取樣獲得的未排序的凈增殖率(R0)Fig.6 Original bootstrap results of the net reproductive rate (R0) obtained by using the bootstrap technique with 100 000 re-samplings
圖7 Bootstrap 100 000次重復(fù)取樣獲得的凈增殖率(R0)排序后的結(jié)果Fig.7 Sorted result of the net reproductive rate (R0) obtained by using the bootstrap technique with 100 000 re-samplings
圖8 Bootstrap 100 000次重復(fù)取樣獲得的凈增殖率(R0)進(jìn)行分組后的分布頻率Fig.8 Frequency distribution of the net reproductive rate (R0) obtained by using the bootstrap technique with 100 000 re-samplings第2.5,50和97.5百分位的bootstrap R0對(duì)應(yīng)的生命表數(shù)量分別有13,51和6個(gè);B,C和D為這3個(gè)區(qū)域放大后的結(jié)果,粉色正方形框?yàn)槎囗?xiàng)式定理計(jì)算得到的生命表數(shù)量。The numbers of life tables corresponding to the bootstrap R0 at the 2.5th,50th and 97.5th percentiles were 13,51 and 6,respectively.B,C,and D are enlarged plots of these 3 regions.The pink squares in B,C,and D indicate the number of life tables calculated by using the multinomial theorem.
對(duì)需要兩性交配的昆蟲而言,若一個(gè)樣本中只包含雄性和在成蟲前已死亡的個(gè)體(N-type),就不能計(jì)算內(nèi)稟增長(zhǎng)率與周限增長(zhǎng)率,則為無(wú)效bootstrap樣本(ineffective bootstrap sample)。相同地,若一個(gè)樣本中只包含雌性和在成蟲前已死亡的個(gè)體,或一個(gè)樣本只包含在成蟲前已死亡的個(gè)體,都屬于無(wú)效樣本。當(dāng)無(wú)效樣本比例較高時(shí),若在生命表分析過(guò)程中僅接受有效的bootstrap樣本就會(huì)產(chǎn)生不現(xiàn)實(shí)的平均值、方差和標(biāo)準(zhǔn)誤。當(dāng)一個(gè)種群中因?yàn)槌上x前期死亡率較高,只有少數(shù)具有繁殖能力的雌性與雄性個(gè)體,無(wú)效樣本的影響就不能忽略。無(wú)效樣本也反映出種群的存活概率,這是值得深入研究的問(wèn)題。無(wú)效樣本的計(jì)算已包含在TWOSEX-MSChart中,并已實(shí)際用于研究(Fengetal.,2020),但因其理論較為復(fù)雜,將另文發(fā)表。
計(jì)算機(jī)模擬是理論推斷和實(shí)驗(yàn)研究之外的重要補(bǔ)充工具(Pool,1992)。Chi(2000)討論了計(jì)算機(jī)模擬的3個(gè)本質(zhì):理論、數(shù)據(jù)和程序。本文詳細(xì)闡述了bootstrap技術(shù)的原理及其在兩性生命表研究中的應(yīng)用。在實(shí)際應(yīng)用中,必須結(jié)合兩性生命表理論,通過(guò)收集更多的生命表數(shù)據(jù),妥善應(yīng)用bootstrap技術(shù)以及TWOSEX-MSChart,TIMING-MSChart和CONSUME-MSChart等兩性生命表分析軟件。
生態(tài)學(xué)是一門年輕的學(xué)科,有許多懸而未決的科學(xué)問(wèn)題亟待科學(xué)家解決。兩性生命表理論與軟件經(jīng)過(guò)三十余年的研究,已逐漸成熟。然而,在實(shí)際應(yīng)用上,仍有許多問(wèn)題有待解決。生命表研究與多數(shù)科學(xué)試驗(yàn)一樣,必須在可控制的條件下(溫度、濕度、光周期、寄主植物)取得能反映生物種群在這些條件下的可靠、可重復(fù)的數(shù)據(jù)。由于昆蟲種群在田間受環(huán)境和寄主的影響較大,使用這些在實(shí)驗(yàn)室控制條件下收集的生命表數(shù)據(jù)模擬野外變動(dòng)條件下的種群動(dòng)態(tài)時(shí),需要考慮實(shí)驗(yàn)室生命表與田間生命表的差異??梢酝ㄟ^(guò)調(diào)節(jié)繁殖率或存活率以獲得與田間種群動(dòng)態(tài)最相符的模擬結(jié)果。然而,由于野外取樣只能間隔數(shù)日調(diào)查一次,而且只能記錄一個(gè)生命階段和選取有限的樣本數(shù)量,因此田間取樣數(shù)據(jù)也不能100%反映真實(shí)的野外種群動(dòng)態(tài)。雖然有許多困難,應(yīng)用生命表理論來(lái)描述和預(yù)測(cè)田間種群動(dòng)態(tài)是非常重要的(Chietal.,2020)。基于年齡-齡期兩性生命表和多項(xiàng)式定理的bootstrap技術(shù)理論值得進(jìn)一步關(guān)注(Dingetal.,2021;Zhaoetal.,2021)。掌握多項(xiàng)式定理的理論與應(yīng)用知識(shí)不僅可以加深對(duì)bootstrap技術(shù)的理解,也有助于bootstrap技術(shù)在昆蟲學(xué)和生態(tài)學(xué)研究中的應(yīng)用。