宋登蓉,張文英(長江大學農學院,湖北 荊州 434025)
主成分分析在作物科學研究中的應用
宋登蓉,張文英(長江大學農學院,湖北 荊州 434025)
綜述了主成分分析法在農作物產量性狀、品質性狀分析以及種質資源鑒定和抗逆性鑒定等方面的應用情況,指出了該分析方法今后在作物科學研究中的應用方向。
主成分分析;產量性狀;品質性狀;種質資源;抗逆鑒定
主成分分析是一種旨在利用降維,把多個指標轉化為少數幾個綜合指標的多元統計分析方法。在多指標的研究中,由于相關的指標個數太多,各個指標之間很可能存在一定的相關性,主成分分析就是通過線性變換,將各指標間相互重疊的信息通過少數幾個綜合的指標反映出來,使這些綜合的因子之間盡量相互獨立,而且能夠最真實地反應原指標的信息,從而達到簡化目的。這些新的變量按照方差依次遞減的順序排列,在數學變換中保持變量的總方差不變,使第一變量具有最大的方差,稱為第一主成分,第二變量的方差次大,并且和第一變量不相關,稱為第二主成分;依次類推,1個變量就有1個主成分。在主成分分析中,方差代表了性狀在主成分方向上的分散程度,方差越大,主成分在樣本數據分析中所起的作用越大。一般根據分析后方差累積貢獻率大于85%的原則提取主要的主成分因子。隨著計算機在各個領域的普及,主成分分析不僅普遍應用于現代經濟分析、環(huán)境評價和醫(yī)學診斷,還廣泛應用于農作物的產量性狀分析、品質性狀分析以及種質資源研究和抗逆性鑒定指標等的研究中。
近年來,主成分分析法較多地應用于大豆農藝性狀及產量性狀的研究中。李向華等[1]對89個中國春大豆品種的18個數量性狀進行了主成分分析。韓秉進等[2]對3個主栽大豆品種的農藝性狀進行主成分分析,找出了大豆產量的主導因子,提出在育種上需加強生物量大、3粒莢和4粒莢數多、結莢節(jié)位低的性狀選擇。王彩杰等[3]對不同生態(tài)類型的大豆品種的產量與主要性狀進行了相關與主成分分析。這些研究結果基本吻合,所得結論為大豆新品種的選育、品種改良提供了判斷依據。另外,主成分分析和聚類分析方法相結合可用于大豆品種的篩選。張玉革等[4]采用主成分和聚類分析方法研究了10個大豆品種在沈陽地區(qū)種植的適應性。
在水稻農藝性狀研究中,孔德偉等[5]運用主成分分析法考察了雜交水稻8個農藝性狀與產量的相互關系;通過主成分分析選取了充實度、剩余庫容、生物產量、單株產量4個因子,其中充實度因子的方差貢獻最大,說明穗重對產量影響最大,所以改良以穗重為代表的穗部性狀可以較為有效地改良產量組成系統,從而實現高產育種目標。王曙光等[6]通過對雜交中秈稻新組合的經濟性狀進行主成分分析,結論顯示高產育種中在適宜穗數的基礎上應注重選擇大穗型的組合,這與孔德偉等[5]及李培富等[7]對寧夏水稻品種主要農藝性狀分析的結果相似。
在小麥研究中,周竹青等[8]對長江中游麥區(qū)11個小麥品種的13個與粒重密切相關的農藝性狀和生理指標進行了主成分分析,將其綜合為4個獨立的新指標;并以主成分值為指標進行系統聚類分析,將11個品種分為3大類型,說明不同類型品種主成分值的大小和相互協調方式不同,直接導致品種粒重不同,為小麥育種和栽培實踐提供了理論依據。周麗艷等[9]選取國內外43個春小麥品種為試驗材料,通過主成分分析將11個農藝性狀簡化為彼此互不相關的5個主成分。
在棉花農藝性狀研究中,王沛政等[10]先后對不同來源陸地棉20個品種在新疆特定生態(tài)條件下的13個性狀和19份抗旱、耐鹽堿、矮稈陸地棉材料進行了主成分分析[11]。對不同來源陸地棉20個品種的分析結果表明:纖維品質因子、產量因子、單鈴重因子、衣分因子、第一果枝高度因子對變異的累積貢獻率達84.3%;抗旱、耐鹽堿、矮稈陸地棉材料的前6個因子貢獻率達86.5%,根據主成分值評價優(yōu)劣原則初選出了綜合性狀較好的材料。
在油菜農藝性狀研究中,段利云等[12]對不同來源的62份甘藍型油菜的9個主要農藝性狀進行主成分分析,篩選出角果數因子、角果長因子、一次分支部位因子、籽粒因子和一次分枝因子5個主成分,其對變異的累積貢獻率達88.53%;提出在油菜育種中應根據不同的育種目標加強對應主成分因子的選擇。
除了在上述主要作物的農藝性狀研究中應用廣泛外,主成分分析法在其他各類作物中均有所應用,如在花生[13]、甜高粱[14]、大麥[15]、紅麻[16]、亞麻[17]、黃瓜[18]、辣椒[19]等的農藝性狀研究中。
隨著人們對稻米品質要求的不斷提高,水稻品質育種在國內外育種工作中越來越受到重視。朱碧巖等[20]、楊澤敏等[21]、許良珠等[22]先后分別對水稻的主要品質性狀進行了主成分分析,結果一致表明:整精米率、膠稠度、堊白度和堿解值為鑒定稻米品質的主要性狀因子,而且它們的變異幅度較大并具有較大的優(yōu)中選優(yōu)的潛力。姜秀英等[23]對遼寧省水稻區(qū)域試驗中中熟、中晚熟品種的品質性狀進行了主成分分析和聚類分析,結果表明:前6個主成分的累積貢獻率達90%以上;遼寧主要稻區(qū)水稻新品種在品質育種上仍應以降低堊白粒率和堊白度為重點。馬靜等[24]對寧夏育成的粳稻品種(系)的主要指標進行相關及主成分分析,得到了5個主要因子;認為因寧夏粳稻稻米品質性狀相關性和5個主因子的貢獻率不同,建議注重堊白粒率和蒸煮品質的選擇,以提高寧夏水稻品質育種效率。張玉榮等[25]通過測定大米的理化特性、蒸煮特性及質構特性等16項指標,利用主成分分析法分別構建了粳型米飯與秈型米飯的食味品質預測評價模型,并利用感官評價法對該模型進行了驗證,從而為大米食味品質的客觀評價探索了一條新途徑。
在小麥品質性狀育種改良研究中,薛香等[26]對小麥13個淀粉和蛋白質品質性狀進行主成分分析,將其簡化為5個主成分因子,認為在品質性狀育種改良過程中,第一、第二和第四主成分適當增大有利于對強勁小麥品質的改良,第三主成分適當增大時有利于弱勁小麥性狀選擇和品質改良。
在棉花纖維品質性狀研究中,許崇志等[27]對49個陸地棉品種主要纖維品質性狀進行主成分分析,確定了3個反映棉花纖維性狀的主成分及其主成分函數式。薛春善等[28]為了探討棉花纖維品質的基本動態(tài)與總體特征,對黃河流域區(qū)試的17個雜交春棉品種材料的纖維品質性狀進行了相關及主成分分析。
韓繼祥等[29]采用主成分分析,把甘藍型油菜49個雜交組合的12個主要農藝性狀和品質性狀歸納為5個主成分因子,根據各主成分遺傳貢獻率的大小,以主成分為單位選育高產、優(yōu)質油菜品種。
殷冬梅等[30]對花生含油量、蛋白質、油酸等主要品質性狀進行主成分分析和聚類分析,主成分分析表明,將10個品質性狀綜合成為4個主成分因子,可代表花生品質80.73%的原始數據信息量。利用主成分分析和聚類分析進行花生品質的綜合評價,可避免單一指標的片面性和不穩(wěn)定性,為花生親本的利用和品質育種提供重要的科學依據。此外,在對大豆[31]、玉米[32]、黃瓜[33]、番茄[34]、小豆[35]、杧果[36]等品質性狀的研究分析中也應用了主成分分析法。另外,還有基于主成分分析法構建芝麻油[37]、白茶[38]、蘋果酒[39]等的香氣質量評價模型的報道,評價結果與傳統的感官評價法結果具有很好的一致性。
莊萍萍等[40]為了從波斯小麥中發(fā)掘優(yōu)異基因資源,拓寬小麥遺傳基礎,對來自多個國家(地區(qū))的波斯小麥進行了農藝性狀相關性及主成分分析。張曉杰等[41]以576份中國花生全套核心種質為材料,對26個表型性狀進行了主成分和相關性分析,從主成分分析結果看前5個主成分對變異的累積貢獻率達72.67%,葉寬、種子寬、百果重、百果仁重對花生種植資源主成分1影響較大,表明在花生種植資源鑒定中,這些性狀占重要地位。王建林等[42]、孟霞等[45]對西藏野生油菜種質資源進行了主成分分析和聚類分析。張禮鳳等[44]、張恒斌等[45]應用主成分分析法分別對山東、新疆大豆種質資源的形態(tài)多樣性和遺傳多樣性進行了分析研究。Prashanth等[46]在對印度秈型栽培稻和地方性水稻品種的遺傳多樣性研究中也應用了主成分分析法。其次,在蔬菜、水果,如茄子[47]、芒果[48]等的種質資源研究中也有應用主成分分析的報道。
主成分分析法在作物抗逆性的鑒定研究中也有所應用。通過主成分分析對與作物抗逆性有關的形態(tài)指標、生理指標進行分析,將其歸為幾個主要的綜合指標,以優(yōu)化抗逆性鑒定指標體系。
朱宗河等[49]利用主成分分析、回歸分析及聚類分析對甘藍型油菜進行耐旱性綜合評價,篩選耐旱種質資源;主成分分析結果將花前和花后干旱脅迫各15個單項指標綜合成為6個相互獨立的綜合指標。馮方劍等[50]和朱永波等[51]分別對抗旱性不同的棉花品種和不同基因型玉米品種進行苗期抗旱性試驗,通過苗期水分脅迫,測定了與抗旱性有關的生理生化指標,通過主成分分析:將32個棉花品種的7個相互關聯的單項指標綜合成為3個獨立的綜合指標;篩選出內在水分利用效率(WUE)、過氧化物酶(POD)、葉綠素含量等生理生化指標作為玉米品種苗期重要的抗旱性評價指標,在抗旱性鑒定中加以利用。張明生等[52]對水分脅迫下甘薯形態(tài)、生長勢、生理生化和產量性狀等與品種抗旱性關系密切的指標進行了主成分分析。潘相文等[53]以收獲期10項指標的相對抗旱系數為基礎,應用主成分分析方法對黑龍江省202份大豆基因型進行了抗旱性評價研究。為了篩選出可用于鑒定番茄耐弱光性的量化指標,對番茄的耐弱光性進行較系統的綜合評價,徐心誠[54]對番茄9個生理生化指標耐弱光系數進行了相關分析和主成分分析。
大多數農作物如棉花、水稻、小麥、油菜、玉米、大豆等的產量、品質都是由多個農藝性狀共同作用的結果,且各性狀因素對產量、品質的影響不盡相同。在育種工作中僅對單一性狀指標進行選擇時很難做出準確合理的選擇;在種質資源材料的評選中,由于性狀多、受評群體大且各性狀間存在著許多有利和不利的相關性,如果僅僅依靠經驗,根據其表型直觀評選,就會增加人為的主觀性,也會對評選工作帶來很大難度。通過主成分分析將主要性狀轉化為較少的幾個主成分,由于這幾個主成分提供了原性狀85%以上的信息,且是綜合的、相對獨立的指標體系,因而所得結果更直觀,便于進一步分析[40]。將主成分分析用于作物農藝性狀的評價和篩選,既能把握綜合性狀表現,又能簡化選擇程序,且更科學。不過,主成分分析法也有其局限性,對于評選綜合性狀優(yōu)良的種質是可行的,但對于評選指定的單一或少量性狀則不太適用。
在國內,主成分分析法在棉花、水稻、小麥、大豆等的農藝性狀、品質性狀分析及種質資源評選鑒定中應用較普遍,而在油菜、玉米等的研究中還應用得比較少。且主成分分析多與聚類分析等多元統計分析方法結合使用,為育種中性狀指標選擇、品種區(qū)域適應性選擇及在品種分類上等都提供了一定的依據。同時,在作物抗逆性鑒定指標(包括形態(tài)指標和生理指標等)的研究中主成分分析法也有應用,其中應用在作物抗旱性研究中的報道較多[49-53],在其他抗逆研究中的應用報道鮮為少見。在國外的研究報道中,澳大利亞的Mahmood和Ross在區(qū)別小麥與2種雜草幼苗形態(tài)的研究中應用了主成分分析法[55]。Wu等[56]在大豆耐鹽性研究中發(fā)現鹽敏感和耐鹽大豆品種之間的代謝產物組成有明顯差異,并利用主成分分析對其次生代謝產物進行分析,結果表明使用其次生代謝產物(如大豆異黃酮,皂甙)來區(qū)分密切相關的大豆基因型是有可能的。另外,有報道稱,在大豆葉面積指數的測定方法中,基于多波段光譜信息的使用,主成分分析與神經網絡信息處理系統相結合的測定方法是效果最好的[57]。
因此,在今后的研究中,主成分分析可以更加廣泛地應用于作物抗逆性研究中;在作物遺傳多樣性的研究中,可以將主成分分析與基因組學方法結合起來使用。
[1]李向華,常汝鎮(zhèn).中國春大豆品種聚類分析及主成分分析[J].作物學報,1998,24(3):325-331.
[2]韓秉進,潘相文,金 劍,等.大豆農藝及產量性狀的主成分分析[J].大豆科學,2008,27(1):67-75.
[3]王彩潔,李連華,李 偉,等.大豆品種產量與主要性狀的主成分分析[J].山東農業(yè)科學,2008,(1):5-6.
[4]張玉革,胡緒彬.基于主成分和聚類分析的大豆品種生物學性狀的比較研究[J].大豆科學,2004,23(3):178-182.
[5]孔德偉,陳德全,周良強,等.雜交水稻幾個重要農藝及產量性狀的主成分分析[J].中國農學通報,2005,21(8):117-119.
[6]王曙光,謝成林,謝仁康,等.雜交中秈稻產量與主要經濟性狀關系的分析[J].中國稻米,2009,(2):11-14.
[7]李培富,楊淑琴,張彥紅,等.寧夏水稻品種主要農藝性狀分析[J].西北農業(yè)學報,2007,16(2):33-36.
[8]周竹青,朱旭彤,王維金.影響小麥粒重的農藝性狀,生理指標的主成分分析[J].生物數學學報,2002,17(1):92-96.
[9]周麗艷,郭振清,馬玉玲,等.春小麥品種農藝性狀的主成分分析與聚類分析[J].麥類作物學報,2001,31(6):1057-1062.
[10]王沛政,陳愛民,阿布來提,等.不同來源陸地棉數量性狀主成分及聚類分析[J].西北農業(yè)學報,1999,(4):50-52.
[11]王沛政,煙 杉,高 翔.抗旱、耐鹽堿、矮稈陸地棉數量性狀的遺傳相關及主成份分析[J].棉花學報,2002,12(3):154-157.
[12]段利云,王通強,陽標仁,等.甘藍型油菜主要農藝性狀的主成分和聚類分析[J].山地農業(yè)生物學報,2007,26(5):381-385.
[13]陳四龍,李玉榮,程增書,等.花生品種(系)生物學性狀的主成分分析和聚類分析[J].花生學報,2007,36(2):28-34.
[14]馮國郡,葉 凱,涂振東,等.甜高粱主要農藝性狀相關性和主成分分析[J].新疆農業(yè)科學,2010,47(8):1552-1557.
[15]普曉英,曾亞文,楊樹明,等.啤酒大麥新品系產量性狀與品質性狀的相關與主成分分析[J].大麥與谷類科學,2009,(1):6-9.
[16]洪建基,祁建民,王曉飛,等.紅麻產量與品質性狀的相關及其主成分分析[J].福建農林大學學報(自然科學版),2008,37(6):561-564.
[17]王利民,張建平,米 君,等.國外引進油用亞麻品種資源農藝性狀分析與評價[J].中國油料作物學報,2011,33(4):356-361.
[18]鐘金仙,羅 英.黃瓜品種主要農藝性狀相關與主成分分析[J].中國農學通報,2012,28(4):131-134.
[19]李 晴,韓玉珠,張廣臣.辣椒品種主要農藝性狀的相關性和主成分分析[J].長江蔬菜,2010,(6):29-33.
[20]朱碧巖,賈志寬.水稻品質性狀遺傳參數的分析[J].西北農林科技大學學報(自然科學版),1990,(3):71-75.
[21]楊澤敏,胡孔峰,雷振山,等.晚粳稻米品質性狀的綜合分析[J].吉林農業(yè)大學學報,2002,24(4):30-34,39.
[22]許良珠,陳木蓮,吳元奇,等.不同播期早秈稻米品質性狀的變異及主成分分析[J].廣東農業(yè)科學,2005,(3):18-21.
[23]姜秀英,于永梅,王 錚,等.遼寧省主要稻區(qū)水稻新品種品質性狀的主成分及聚類分析[J].安徽農學通報,2009,15(7):106-108.
[24]馬 靜,孫建昌,安永平,等.寧夏育成粳稻品種(系)品質相關性及主成分分析[J].種子,2011,(10):89-91.
[25]張玉榮,張秀華,周顯青,等.主成分分析法綜合評價大米的食味品質[J].河南工業(yè)大學學報,2008,29(5):1-5,9.
[26]薛 香,郜慶爐,楊忠強.小麥品質性狀的主成分分析[J].中國農學通報,2011,27(7):38-41.
[27]許崇志,李 青.陸地棉纖維品質性狀的主成分分析[J].新疆農業(yè)科學,2006,43(2):121-124.
[28]薛春善,尹景本.多元統計分析棉花品質性狀的研究[J].安徽農業(yè)科學,2008,36(13):5247-5248,5534.
[29]韓繼祥,劉后利.甘藍型油菜雜種主要農藝性狀和品質性狀的主成分分析[J].華中農業(yè)大學學報,1993,12(5):427-432.
[30]殷冬梅,張幸果,王 允.花生主要品質性狀的主成分分析與綜合評價[J].植物遺傳資源學報,2011,12(4):507-512,518.
[31]寧海龍,李文霞,王繼安.黑龍江省大豆蛋白質油分及蛋白質組分類型[J].作物學報,2003,29(4):551-556.
[32]宋江峰,李大婧,劉春泉,等.甜糯玉米軟罐頭主要揮發(fā)性物質主成分分析和聚類分析[J].中國農業(yè)科學,2010,43(10):2122-2131.
[33]徐 強,劉進生,陳學好,等.加工類型黃瓜品質性狀的主成分及聚類分析[J].揚州大學學報(農業(yè)與生命科學版),2003,24(4):78-81.
[34]陳 賢,龔元圣,楊 德.3種測度結合的分組主成分法在番茄果實商品性綜合評價上的應用[J].中國農學通報,2008,24(1):335-339.
[35]武曉娟,薛文通,張 惠.不同品種紅小豆的品質評價研究[J].中國糧油學報[J].2011,26(9):20-24.
[36]石勝友,武紅霞,王松標,等.杧果種質果實品質性狀多樣性分析[J].園藝學報,2011,38(5):840-848.
[37]李萍萍,魏 芳,董緒燕,等.基于主成分分析法的芝麻油香氣質量評價模型的構建[J].中國油脂,2009,34(10):75-79.
[38]郭 麗,蔡良綏,林 智,等.基于主成分分析法的白茶香氣質量評價模型構建[J].熱帶作物學報,2010,31(9):1606-1610.
[39]岳田利,彭幫柱,袁亞宏,等.基于主成分分析法的蘋果酒香氣質量評價模型的構建[J].農業(yè)工程學報,2007,23(6):223-226.
[40]莊萍萍,李 偉,魏育明,等.波斯小麥農藝性狀相關性及主成分分析[J].麥類作物學報,2006,26(4):11-14.
[41]張曉杰,姜慧芳,任小平,等.中國花生核心種質的主成分分析及相關分析[J].中國油料作物學報,2009,31(3):398-304.
[42]王建林,何 燕,欒運芳,等.西藏野生油菜形態(tài)及生態(tài)特征多元統計分析[J].作物研究,2006,(3):223-226.
[43]孟 霞,卓 嘎,旦 巴,等.西藏野生油菜種質資源植株形態(tài)性狀多樣性分析[J].中國農學通報,2010,26(16):309-314.
[44]張禮鳳,李 偉,王彩杰,等.山東大豆種質資源形態(tài)多樣性分析[J].植物遺傳資源學報,2006,7(4):450-454.
[45]張恒斌,劉勝利,戰(zhàn) 勇,等.新疆大豆品種資源遺傳多樣性分析[J].新疆農業(yè)科學,2010,47(7):1387-1390.
[46]Prashanth S R,Parani M,Mohanty B P,et al.Genetic diversity in cultivars and landraces ofOryzasativasubsp.indica as revealed by AFLP markers[J].Genome,2002,45:451-9.
[47]趙德新,孫志強,任子君,等.茄子形態(tài)學性狀主成分分析及聚類分析[J].河南農業(yè)大學學報,2009,43(4):393-397.
[48]李國鵬,張林輝,解德宏,等.怒江干熱河谷芒果種質資源主成分分析[J].貴州農業(yè)科學,2010,38(11):29-30.
[49]朱宗河,鄭文寅,張學昆.甘藍型油菜耐旱相關性狀的主成分分析及綜合評價[J].中國農業(yè)科學,2011,44(9):1775-1787.
[50]馮方劍,宋 敏,陳全家,等.棉花苗期抗旱相關指標的主成分分析及綜合評價[J].新疆農業(yè)大學學報,2011,34(3):211-217.
[51]朱永波,張仁和,卜令鐸,等.玉米苗期抗旱性鑒定指標的研究[J].西北農業(yè)學報,2008,17(3):143-146.
[52]張明生,張麗霞,戚金亮,等.甘薯品種抗旱適應性的主成分分析[J].貴州農業(yè)科學,2006,34(1):11-14.
[53]潘相文,李文濱,李艷華,等.主成分分析在大豆抗旱性評價上的應用[J].大豆科學,2006,25(4):379-384.
[54]徐心誠.主成分分析法對番茄品種耐光性的綜合評價[J].中國農學通報,2012,28(4):135-140.
[55]Golzarian M R,Frick R A .Classification of images of wheat,ryegrass and brome grass species at early growth stages using principal component analysis[J].Plant Methods,2011,7:28.
[56]Wu W,Zhang Q,Zhu Y,et al.Comparative metabolic profiling reveals secondary metabolites correlated with soybean salt tolerance[J].J Agric Food Chem,2008,56:11132-11138.
[57]楊 飛,張 柏,宋開山,等.大豆葉面積指數的高光譜估算方法比較[J].光譜學與光譜分析,2008,28(12):2951-2955.
S11+4
A
1673-1409(2012)05-S008-04
2012-04-11
湖北省教育廳優(yōu)秀中青年人才項目(Q20101318)。
宋登蓉(1989-),女,湖北恩施人,研究方向為作物分子育種。
張文英,E-mailwyzhang2006@gmail.com。
10.3969/j.issn.1673-1409(S).2012.05.003