段小偉
[摘 要]傳統(tǒng)的昆蟲分類學(xué)以定性分類為標(biāo)準(zhǔn),但是傳統(tǒng)分類對(duì)操作人員的經(jīng)驗(yàn)要求較高,近年來,隨著統(tǒng)計(jì)知識(shí)的普及以及相應(yīng)的軟件的開發(fā)和使用,使用定量特征結(jié)合數(shù)學(xué)統(tǒng)計(jì)已經(jīng)成為傳統(tǒng)分類學(xué)的一種輔助手段,使其越來越多的應(yīng)用于昆蟲數(shù)量性狀分類。本文主要闡述昆蟲形態(tài)學(xué)標(biāo)記中常見的幾種多元統(tǒng)計(jì)方法。
[關(guān)鍵詞]多元統(tǒng)計(jì);昆蟲;形態(tài)標(biāo)記
昆蟲形態(tài)學(xué)是昆蟲學(xué)發(fā)展史中最悠久的分支之一, 是研究昆蟲形態(tài)、結(jié)構(gòu)及其功能的科學(xué)。而昆蟲形態(tài)學(xué)標(biāo)記是利用可以直接觀察和測(cè)量昆蟲的外部形態(tài)特征、行為特征、生理代謝特征等作為遺傳標(biāo)記,是遺傳標(biāo)記的一種,可以用來研究物種間的關(guān)系、分類和鑒定。形態(tài)學(xué)標(biāo)記作為研究昆蟲物種種間關(guān)系和差異的一種方法,可以分為定性和定量兩個(gè)方面,定性是以昆蟲的外部形態(tài)、內(nèi)部結(jié)構(gòu)依據(jù),根據(jù)形態(tài)結(jié)構(gòu)和功能相一致的原理,對(duì)昆蟲進(jìn)行分類鑒別,然而在實(shí)際研究當(dāng)中,由于某些昆蟲的形態(tài)特征不穩(wěn)定、同種異型、異種同型以及近緣種形態(tài)結(jié)構(gòu)十分相似等問題導(dǎo)致我們所得到的結(jié)果往往不夠精確,最為主要的是,定性形態(tài)標(biāo)記難以排除環(huán)境對(duì)其數(shù)量性狀的影響,所以在某種情況下,需要使用定量的形態(tài)標(biāo)記,并利用相關(guān)的生物統(tǒng)計(jì)學(xué)知識(shí)與其結(jié)合進(jìn)行嚴(yán)密的分析。
統(tǒng)計(jì)學(xué)基本上包含基本統(tǒng)計(jì)和多元統(tǒng)計(jì)兩個(gè)大類。而多元統(tǒng)計(jì)又是在解決實(shí)際問題中有效的數(shù)據(jù)處理方法,包括聚類分析、因子分析、主成分分析、典型分析以及判別分析等方法。目前多元統(tǒng)計(jì)方法在生物上的應(yīng)用主要集中在群落分析和的研究上。例如周紅、張志南就曾使用聚類分析、主成分分析等統(tǒng)計(jì)方法在底棲群落生態(tài)學(xué)的研究中。但是在物種間的遺傳多樣性研究中也有逐漸發(fā)展的趨勢(shì),如母華強(qiáng)、張澤鈞等在四川藏鼠兔頭骨形態(tài)的種群分化的研究中,首先使用單因素方差分析隨后采用Bonferroni方法對(duì)有顯著差異的變量進(jìn)行多重比較得出“如果以顱全長作為衡量體型大小的指標(biāo),邛崍山系的藏鼠兔較涼山和岷山為小”的這一結(jié)論。再通過逐步判別分析分化從而得出“藏鼠兔頭骨樣本在山系間的差異主要來自于顴寬、眶間寬、鼻骨長等變量的影響”的結(jié)論。多元統(tǒng)計(jì)方法在昆蟲形態(tài)標(biāo)記中的應(yīng)用也得到了相應(yīng)的發(fā)展,如牙森·沙力高松等通過聚類分析和主成分分析對(duì)西藏飛蝗九個(gè)地理種群群居型形態(tài)特征進(jìn)行了一個(gè)數(shù)量分析;蔡小娜,黃大莊等利用蛾翅數(shù)學(xué)形態(tài)特征用于夜蛾分類和鑒定的可行性研究中,使用判別分析、聚類分析等統(tǒng)計(jì)方法;秦緒棟,竇廣民等對(duì)長白山林區(qū)21 種食蚜蠅的數(shù)值分類研究中采用聚類分析完成了對(duì)這21種食蚜蠅親緣關(guān)系的鑒定。通過以上的事例不難發(fā)現(xiàn),如今,多元統(tǒng)計(jì)方法和形態(tài)標(biāo)記的結(jié)合使用已經(jīng)成為了一種發(fā)展的趨勢(shì)。通過查閱文獻(xiàn)發(fā)現(xiàn),多元統(tǒng)計(jì)在昆蟲形態(tài)標(biāo)記中的應(yīng)用相對(duì)其在生物群落分析等研究中較為少見,而且,在昆蟲形態(tài)標(biāo)記的多數(shù)研究中,只使用單一的方法,本文以常見的多元統(tǒng)計(jì)方法闡述其在昆蟲形態(tài)標(biāo)記中的應(yīng)用。在昆蟲形態(tài)標(biāo)記中常用的多元統(tǒng)計(jì)方法主要包括多因素方差分析、回歸分析、聚類分析、判別分析、主成分分析與因子分析等方法,這些方法結(jié)合多元統(tǒng)計(jì)軟件的使用能夠有效的達(dá)到對(duì)昆蟲親緣關(guān)系的判斷以及分類。目前,在生物統(tǒng)計(jì)上經(jīng)常見到的統(tǒng)計(jì)軟件有STATISTICA、SPSS、R軟件等。關(guān)于統(tǒng)計(jì)軟件的介紹請(qǐng)參考相關(guān)文獻(xiàn)、書籍。
一、材料與方法
針對(duì)不同的昆蟲,根據(jù)其習(xí)性、生活環(huán)境在采集樣本的時(shí)候往往需要考慮相應(yīng)的采集、毒殺以及運(yùn)送的方法。使得到的昆蟲樣本盡可能的保持完整性,從而不使其研究價(jià)值打折。在采集到標(biāo)本之后還要做詳細(xì)的記錄如:采集日期(年、月、日)、采集地點(diǎn)(省、縣、鄉(xiāng))、采集人姓名等三項(xiàng)。除以上記載外還應(yīng)該注意采集時(shí)的環(huán)境,其寄主系植物或動(dòng)物,采集地點(diǎn)的海拔高度,采集方法,以及昆蟲的生活習(xí)性等等都可以寫在記錄本上,而在標(biāo)本上只要附一個(gè)相應(yīng)的號(hào)碼。 如有必要可以根據(jù)地理隔絕或分布點(diǎn)之間的距離進(jìn)行相應(yīng)的分組。根據(jù)其形態(tài)特征進(jìn)行初步鑒定。
形態(tài)指標(biāo)的選取主要依據(jù)傳統(tǒng)的分類特征,并結(jié)合標(biāo)本的觀察比較?;蛘吒鶕?jù)目前已有的測(cè)量標(biāo)準(zhǔn)進(jìn)行選取如Ruttner1988年提出的的蜜蜂形態(tài)特征測(cè)定標(biāo)準(zhǔn)、第四屆國際蝗蟲學(xué)會(huì)(1936) 所規(guī)定的測(cè)量標(biāo)準(zhǔn)等測(cè)定標(biāo)準(zhǔn)進(jìn)行選取。在選定形態(tài)指標(biāo)后,利用游標(biāo)卡尺進(jìn)行數(shù)據(jù)測(cè)量。
二、數(shù)據(jù)分析
1.多因素方差分析
多因素方差分析是檢驗(yàn)兩個(gè)或兩個(gè)以上的因素對(duì)一個(gè)因素之間的差異是否顯著的一種方法。是以方差分析的原理對(duì)分析模型進(jìn)行擴(kuò)展,是把全部觀測(cè)值之間所表現(xiàn)的變異(即總變異)分解為兩個(gè)或多個(gè)部分,除了一部分代表隨機(jī)誤差的作用外,其他部分分別代表各因素作用,通過一定方法的比較,了解某個(gè)因素對(duì)結(jié)果變量是否有明顯影響。常用的試驗(yàn)設(shè)計(jì)幾乎都可以用多因素方差分析,如隨機(jī)區(qū)組設(shè)計(jì)、裂區(qū)設(shè)計(jì)、交叉設(shè)計(jì)、析因設(shè)計(jì)等。
多因數(shù)方差分析在昆蟲形態(tài)學(xué)標(biāo)記中的應(yīng)用有著一定的地位,由于是分析兩個(gè)或兩個(gè)以上的因素對(duì)一個(gè)變量的影響,其分析方法與單因素方差分析相差并不大。從中能夠檢驗(yàn)組間或變量間的均數(shù)之間的差別是否具有統(tǒng)計(jì)學(xué)意義。也就是通過將總變異分解為由隨機(jī)誤差造成的變異(即組內(nèi)方差)與由均數(shù)差異造成的變異(即組間方差)兩個(gè)部分。如果后者大于前者,并且具有統(tǒng)計(jì)學(xué)意義,我們將拒絕無效假設(shè),接受備擇假設(shè):即總體中均數(shù)間存在差異。利用相應(yīng)的統(tǒng)計(jì)軟件還能獲得相關(guān)的分析,例如協(xié)方差、相關(guān)系數(shù)、半正態(tài)圖形等。使用時(shí)必須滿足多因素方差分析的假定: 每個(gè)總體服從正態(tài)分布,方差齊性及觀察值獨(dú)立。
在實(shí)際應(yīng)用中應(yīng)結(jié)合自己的需求做相應(yīng)的多元方差分析。在對(duì)于存在顯著性的變量,我們通常需要對(duì)其進(jìn)行“事后檢驗(yàn)”。
2.回歸分析
回歸分析是尋找兩個(gè)或兩個(gè)以上的變量之間的相互關(guān)系。包括只有一個(gè)自變量的一元線性回歸(一因一果)和有多個(gè)自變量的多元線性回歸(多因一果)。在昆蟲形態(tài)標(biāo)記中,我們通常需要了解所選取的形態(tài)指標(biāo)之間是否存在這相互關(guān)系,例如想要了解某種昆蟲的體長與脛節(jié)長、翅長之間的相互關(guān)系就要使用多元回歸分析,通過建立一個(gè)回歸方程從而進(jìn)行確定。
3.聚類分析
俗話說“物以類聚,人以群分”?!熬垲惙治觥鳖櫭剂x就是按照事物本身的特點(diǎn),通過對(duì)數(shù)據(jù)的測(cè)量和研究對(duì)事物分類的方法。確切的講是一類將數(shù)據(jù)所對(duì)應(yīng)的樣品或指標(biāo)進(jìn)行分類統(tǒng)計(jì)的一類方法,是以分析數(shù)據(jù)為基礎(chǔ),根據(jù)對(duì)數(shù)據(jù)的分析,通過數(shù)據(jù)之間的相似性或相異性,將這些具有相似性或相異性的數(shù)據(jù)看成是數(shù)據(jù)各自對(duì)應(yīng)的樣品或指標(biāo)之間的“距離”遠(yuǎn)近的一種度量,將“距離”近的歸入一類不同類之間的距離較遠(yuǎn),從而達(dá)到對(duì)樣品或指標(biāo)之間的分類的目的,這一類方法具有一個(gè)共同的特點(diǎn):事先不知道類別的個(gè)數(shù)和結(jié)構(gòu)。它們能合理地按樣本或指標(biāo)各自的特性來進(jìn)行合理的分類。通常在進(jìn)行聚類分析的一般原則是使同一類中的個(gè)體差異最小,不同類之間的個(gè)體差異最大。
目前,聚類分析有系統(tǒng)聚類結(jié)合(樹狀聚類)、快速聚類(K組平均數(shù)聚類)等方法。系統(tǒng)聚類是昆蟲形態(tài)標(biāo)記中運(yùn)用最多的一種方法,開始對(duì)所有的樣本或指標(biāo)進(jìn)行單獨(dú)分類,然后將距離最相似的兩個(gè)樣本或指標(biāo)合并成一類,重新計(jì)算新類和其他類的距離,再將距離相近的歸為一類,如此反復(fù)直至所有指標(biāo)合并成一類,最終用一張樹狀聚類圖描述。通過聚類圖,能夠很直觀的了解個(gè)體間的形態(tài)相似及分類情況,從而為以后對(duì)昆蟲親緣關(guān)系、物種鑒定等研究提供參考依據(jù)。
4.判別分析
判別分析是以判別個(gè)體所屬群體的一種統(tǒng)計(jì)方法。換句話說就是可以通過對(duì)個(gè)體某些變量的測(cè)定來判斷其是否屬于總體的一種方法,在昆蟲形態(tài)標(biāo)記中,可以通過這種方法對(duì)昆蟲進(jìn)行鑒定和分類,在相應(yīng)的統(tǒng)計(jì)軟件中,如Statistica,可以通過散點(diǎn)圖以及判別矩陣,直觀了解分類情況,最終通過建立判別方程和累積形成一個(gè)數(shù)據(jù)庫。
5.主成份分析與因子分析
主成分分析也是一種重要的多變量分析技術(shù),它將多個(gè)變量并有一定相關(guān)性的數(shù)據(jù)變換成為少數(shù)不相關(guān)的變量。從這里看,主成分和分類分析與因子分析類似,都是對(duì)原始數(shù)據(jù)降維,構(gòu)成少數(shù)不相關(guān)的變量,使其代表原變量對(duì)樣品或指標(biāo)進(jìn)行分析。兩者看似相同,但是它們又有明顯的區(qū)別。首先是基本概念不同:主成分分析法是將多個(gè)指標(biāo)轉(zhuǎn)化為少數(shù)彼此不相關(guān)的綜合指標(biāo)(即主成分)的統(tǒng)計(jì)方法。而因子分析法是主成分分析法的推廣和發(fā)展,它也是將具有錯(cuò)綜復(fù)雜關(guān)系的變量綜合為數(shù)量較少的幾個(gè)因子,再根據(jù)不同因子還可以對(duì)變量進(jìn)行分類,同時(shí)重塑原始變量與因子之間的相互關(guān)系。其次是原理不同:因子分析中是把變量表示成各因子的線性組合,而主成分分析中則是把主成分表示成個(gè)變量的線性組合;主成分分析中,當(dāng)給定的協(xié)方差矩陣或者相關(guān)矩陣的特征值是唯一的時(shí)候,的主成分一般是獨(dú)特的;而因子分析中因子不是獨(dú)特的,可以旋轉(zhuǎn)得到不同的因子;主成分分析的重點(diǎn)在于解釋個(gè)變量的總方差,而因子分析則把重點(diǎn)放在解釋各變量之間的協(xié)方差。最后是數(shù)據(jù)處理的過程同:主成分分析中不需要有假設(shè),因子分析則需要一些假設(shè)。因子分析的假設(shè)包括:各個(gè)共同因子之間不相關(guān),特殊因子之間也不相關(guān),共同因子和特殊因子之間也不相關(guān);在因子分析中,因子個(gè)數(shù)需要分析者指定,指定的因子數(shù)量不同而結(jié)果不同。在主成分分析中,成分的數(shù)量是一定的,一般有幾個(gè)變量就有幾個(gè)主成分。和主成分分析相比,由于因子分析可以使用旋轉(zhuǎn)技術(shù)幫助解釋因子,在解釋方面更加有優(yōu)勢(shì)??傊?dāng)需要尋找潛在的因子,并對(duì)這些因子進(jìn)行解釋的時(shí)候,更加傾向于使用因子分析,并且借助旋轉(zhuǎn)技術(shù)幫助更好解釋。而如果想把現(xiàn)有的變量變成少數(shù)幾個(gè)新的變量(新的變量幾乎帶有原來所有變量的信息)來進(jìn)入后續(xù)的分析,則可以使用主成分分析。當(dāng)然,這種情況也可以使用因子得分做到。所以這種區(qū)分不是絕對(duì)的。
總得來說,主成分分析主要是作為一種探索性的技術(shù),在分析者進(jìn)行多元數(shù)據(jù)分析之前,用主成分分析來分析數(shù)據(jù),讓自己對(duì)數(shù)據(jù)有一個(gè)大致的了解是非常重要的。主成分分析一般很少單獨(dú)使用,如:篩選數(shù)據(jù);、聚類分析、判別分析(比如當(dāng)變量很多,個(gè)案數(shù)不多,直接使用判別分析可能無解,這時(shí)候可以使用主成份分析對(duì)變量簡化)等等。
三、總結(jié)
通過查閱相關(guān)的文獻(xiàn)發(fā)現(xiàn),多元統(tǒng)計(jì)方法在動(dòng)物形態(tài)學(xué)、系統(tǒng)學(xué)和表觀遺傳研究中的具有重要作用,在昆蟲形態(tài)標(biāo)記的研究中主要集中在以上幾種多元統(tǒng)計(jì)方法。由于多元統(tǒng)計(jì)方法種類繁雜,為便于昆蟲形態(tài)標(biāo)記研究工作有效和順利的進(jìn)行,通過對(duì)以上多元統(tǒng)計(jì)方法的介紹,雖然在對(duì)某些統(tǒng)計(jì)方法只作簡略介紹,本文旨在介紹多元統(tǒng)計(jì)在昆蟲形態(tài)標(biāo)記中的應(yīng)用。然而在昆蟲形態(tài)標(biāo)記多數(shù)研究中,均采用的是單一的多元統(tǒng)計(jì)方法。再者,通過對(duì)以上多元統(tǒng)計(jì)方法的介紹以及在昆蟲形態(tài)標(biāo)記中對(duì)昆蟲形態(tài)指標(biāo)數(shù)據(jù)的測(cè)量能夠清楚的認(rèn)識(shí)到在各種統(tǒng)計(jì)方法里面對(duì)數(shù)據(jù)的處理的工作量是很大的,建議以多元統(tǒng)計(jì)軟件為工具利用多種統(tǒng)計(jì)方法相互配合、相互佐證,通過其形態(tài)數(shù)值的差異,從而達(dá)到對(duì)昆蟲進(jìn)行分類或判斷其親緣關(guān)系的的目的。結(jié)合多元統(tǒng)計(jì)軟件的使用,可以使得我們快速、簡便完善昆蟲的鑒定、分類、以及昆蟲間親緣關(guān)系的判斷等工作,能夠節(jié)省出更多的時(shí)間和精力,能夠在昆蟲的表觀遺傳多樣性研究中和保護(hù)中貢獻(xiàn)出一個(gè)有價(jià)值參考意見。至今,不斷有最新的多元統(tǒng)計(jì)方法的問世,但是這些方法在昆蟲形態(tài)標(biāo)記研究中的應(yīng)用,尚待用更多的經(jīng)驗(yàn)數(shù)據(jù)及應(yīng)用來加以驗(yàn)證和完善。
參考文獻(xiàn):
[1]忻介六, 楊慶爽, 胡成業(yè). 昆蟲形態(tài)分類學(xué)[M]. 上海: 復(fù)旦大學(xué)出版社, 1985: 1-2.
[2]查玉平, 駱啟桂. 現(xiàn)代技術(shù)在昆蟲分類中的應(yīng)用[J]. 江西林業(yè)科技, 2005(1):34-36.
[3]周紅, 張志南. 大型多元統(tǒng)計(jì)軟件PRIMER的方法原理及其在底棲群落生態(tài)學(xué)中的應(yīng)用 [J]. 青島海洋大學(xué)學(xué)報(bào)(自然科學(xué)版), 2003,33(1):58-64.
[4]母華強(qiáng), 張澤鈞, 張明春, 等. 四川藏鼠兔頭骨形態(tài)的種群分化[J]. 四川動(dòng)物, 2009,28(3):341-344.
[5]牙森, 沙力, 高松, 等. 西藏飛蝗九個(gè)地理種群群居型形態(tài)特征的數(shù)量分析[J]. 昆蟲知識(shí), 2010,47(6):1201-1207.
[6]蔡小娜, 黃大莊, 沈佐銳, 等. 蛾翅數(shù)學(xué)形態(tài)特征用于夜蛾分類和鑒定的可行性研究 [J]. 昆蟲學(xué)報(bào), 2012,55(5):596-605.
[7]秦緒棟, 竇廣民, 左江. 長白山林區(qū)21種食蚜蠅的數(shù)值分類研究[J]. 吉林林業(yè)科技, 2014(1):32-36.
[8]劉凌云, 鄭光美. 普通動(dòng)物學(xué)野外實(shí)習(xí)指導(dǎo)書[M]. 第二版. 北京: 高等教育出版社, 1999.
[9]喻浩.色季拉山鉤蝠蛾種群分化及其適生地地表節(jié)肢動(dòng)物群落[D].廣州:中山大學(xué),2013.