王笑娟 孟泉山 肖杰
摘要 利用神經(jīng)網(wǎng)絡(luò)模型研究了品種產(chǎn)量與其他性狀的關(guān)系,發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)模型在不同次訓(xùn)練結(jié)果中的平均絕對(duì)誤差和平均絕對(duì)相對(duì)誤差的變異系數(shù)較小,但在不同次訓(xùn)練結(jié)果中的各個(gè)自變量相對(duì)重要性的變異系數(shù)較大。因此,神經(jīng)網(wǎng)絡(luò)較適合用于產(chǎn)量的預(yù)測(cè),在用于研究各個(gè)性狀對(duì)產(chǎn)量的相對(duì)重要性時(shí),應(yīng)采取多次重復(fù)求平均值的方法,以減少分析結(jié)果的誤差。在所有的性狀中,穗粗、穗長(zhǎng)對(duì)產(chǎn)量的相對(duì)重要性最大,隨后是百粒重、株高和生育期等。同時(shí),還分析了使產(chǎn)量最大時(shí)各個(gè)性狀的最佳組合。該研究結(jié)果對(duì)黃淮海地區(qū)玉米育種目標(biāo)的制定具有一定的參考價(jià)值。
關(guān)鍵詞 玉米;性狀;神經(jīng)網(wǎng)絡(luò)模型
中圖分類號(hào) S126 文獻(xiàn)標(biāo)識(shí)碼 A
文章編號(hào) 0517-6611(2019)08-0228-03
doi:10.3969/j.issn.0517-6611.2019.08.060
Abstract In order to solve the problems of low level of information and lack of depth mining of experimental data in maize breeding, the relation of yield and other characters was conducted in this study by using neural network model. It was showed that the CV (the coefficient of variation) of the mean absolute error and the mean absolute relative error was small, and the CV of relative importance of each independent variable was larger. Therefore, the neural network model was suitable for production forecast. When applying in the researches on relative importance of each trait to yield, we should calculate the average by repetition, in order to to reduce the error of results. Among all the traits, ear diameter and ear length showed the greatest relative importance to yield, followed with 100grain weight, plant height and growth period. Meanwhile, the optimal combination of the traits for the maximum yield was studied. The research results had certain reference value for the formulation of maize breeding targets in Huanghuaihai Area.
Key words Maize;Trait;Neural network model
神經(jīng)網(wǎng)絡(luò)模型是一個(gè)簡(jiǎn)單通用的可模擬復(fù)雜非線性關(guān)系的計(jì)算機(jī)模型,只需要訓(xùn)練樣木,不需要建?;蛉魏渭俣ǎ蚨鴱浹a(bǔ)了傳統(tǒng)的回歸模型缺乏對(duì)非線性問(wèn)題研究能力的問(wèn)題,并在很多領(lǐng)域得到廣泛的應(yīng)用。提高產(chǎn)量是作物育種的首要目標(biāo)。在玉米育種中,了解產(chǎn)量及其相關(guān)性狀之間的關(guān)系是十分必要的。但各種相關(guān)性狀對(duì)產(chǎn)量的貢獻(xiàn)大小不一,因子間還存在著復(fù)雜的相互聯(lián)系和影響,這就給育種工作帶來(lái)了許多困難。研究人員從利用相關(guān)、回歸、通徑、灰色關(guān)聯(lián)等不同方法對(duì)影響玉米產(chǎn)量的因素和性狀進(jìn)行了探討[1-3],但由于所在地區(qū)或所用玉米品種的不同,以及研究方法的不同,研究結(jié)果很不一致。同時(shí),目前在其他領(lǐng)域逐步得到廣泛應(yīng)用的計(jì)算機(jī)神經(jīng)網(wǎng)絡(luò)等分析方法,在玉米育種試驗(yàn)數(shù)據(jù)的分析中應(yīng)用不夠。為了解決目前玉米育種試驗(yàn)數(shù)據(jù)得不到有效分析的實(shí)際問(wèn)題,該研究將應(yīng)用各種計(jì)算機(jī)模型對(duì)玉米品種產(chǎn)量與其他性狀之間的關(guān)系進(jìn)行模擬,探討不同性狀對(duì)產(chǎn)量的相對(duì)重要性,以及在最高產(chǎn)量水平下各種性狀的最佳組合,以期為玉米育種目標(biāo)和育種策略的制定提供指導(dǎo)和幫助。
1 材料與方法
1.1 試驗(yàn)數(shù)據(jù)
試驗(yàn)數(shù)據(jù)為2015年黃淮海地區(qū)26個(gè)試驗(yàn)點(diǎn)的玉米區(qū)試的各種性狀數(shù)據(jù)資料,包括來(lái)自不同育種單位的80個(gè)玉米品種。品種的選取兼顧了不同的育種單位和不同種質(zhì)基礎(chǔ),試驗(yàn)點(diǎn)則涵蓋了黃淮海地區(qū)的各種生態(tài)類型,因此試驗(yàn)材料和種植地點(diǎn)都具有較好的代表性。數(shù)據(jù)共計(jì)1 420組,每組包括生育期性狀,株高、穗位等植株性狀,倒折株數(shù)、空稈株數(shù)、病指數(shù)等抗逆性性狀,以及穗粗、穗長(zhǎng)、禿尖、穗行數(shù)、百粒重和產(chǎn)量等相關(guān)性狀。
1.2 分析方法
以產(chǎn)量為因變量,其他性狀為協(xié)變量,利用SPSS 22.0進(jìn)行多層感知器神經(jīng)網(wǎng)絡(luò)模型的分析。由于各個(gè)性狀的原始數(shù)據(jù)的量綱和級(jí)別不同,首先要進(jìn)行標(biāo)準(zhǔn)化處理。多層感知器神經(jīng)網(wǎng)絡(luò)模型的實(shí)際應(yīng)用效果受訓(xùn)練樣本數(shù)量、模型結(jié)構(gòu)等因素影響較大。因此,首先還要進(jìn)行隱藏層數(shù)和訓(xùn)練樣本/檢驗(yàn)樣本比例的優(yōu)選。隱藏層數(shù)一般設(shè)置為1或2層,訓(xùn)練樣本/檢驗(yàn)樣本的比例設(shè)置9∶1、8∶2、7∶3、6∶4、5∶5、4∶6、3∶7、2∶8、1∶9共9個(gè)處理。由于神經(jīng)網(wǎng)絡(luò)存在多解問(wèn)題,因此有必要對(duì)不同次訓(xùn)練結(jié)果之間預(yù)測(cè)精度的變異性以及各個(gè)自變量相對(duì)重要性的變異性進(jìn)行研究。最后分析不同性狀對(duì)產(chǎn)量的相對(duì)重要性,以及在最高產(chǎn)量水平下各種性狀的最佳組合。
2 結(jié)果與分析
2.1 神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)的優(yōu)選
隱藏層數(shù)和訓(xùn)練與檢驗(yàn)樣本分區(qū)比率對(duì)預(yù)測(cè)誤差的影響見(jiàn)圖1。從圖1可以看出,當(dāng)訓(xùn)練與檢驗(yàn)樣本分區(qū)比率≥7∶3時(shí),預(yù)測(cè)誤差較小,而且此時(shí)隱藏層數(shù)對(duì)預(yù)測(cè)誤差影響不大。若訓(xùn)練與檢驗(yàn)樣本分區(qū)比率<7∶3,隨著比率的減小,誤差逐漸增大,而且此時(shí)2層隱藏層比1層隱藏層的預(yù)測(cè)誤差要大??梢?jiàn),訓(xùn)練分區(qū)樣本的數(shù)量較少會(huì)影響訓(xùn)練的效果。因此,該試驗(yàn)選用訓(xùn)練、檢驗(yàn)和預(yù)測(cè)樣本分區(qū)比率為5∶2∶3和1層隱藏層的網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行模擬。建立的多重傳感器神經(jīng)網(wǎng)絡(luò)模型含有1個(gè)隱藏層,輸入層有10個(gè)神經(jīng)元節(jié)點(diǎn),即自變量個(gè)數(shù),輸出層有1個(gè)節(jié)點(diǎn),隱藏層自動(dòng)設(shè)置7個(gè)節(jié)點(diǎn),構(gòu)成一個(gè)10-7-1的神經(jīng)網(wǎng)絡(luò)模型。模型的基本情況見(jiàn)表1,系統(tǒng)自動(dòng)生成的各個(gè)節(jié)點(diǎn)的權(quán)重系數(shù)見(jiàn)表2。
2.2 不同次訓(xùn)練結(jié)果的變異度分析
模擬結(jié)果中預(yù)測(cè)誤差和自變量重要性的變異度比較見(jiàn)表3。從表3可以看出,不同次訓(xùn)練結(jié)果的平均絕對(duì)誤差和平均絕對(duì)相對(duì)誤差的變異系數(shù)較小,但不同次訓(xùn)練結(jié)果中各個(gè)自變量相對(duì)重要性的變異系數(shù)較大。因此,神經(jīng)網(wǎng)絡(luò)較適合用于進(jìn)行產(chǎn)量的預(yù)測(cè),在用于研究各個(gè)性狀對(duì)產(chǎn)量的相對(duì)重要性時(shí),應(yīng)采取多次重復(fù)求平均值的方法,以減少分析結(jié)果的誤差。
2.3 各個(gè)性狀的相對(duì)重要性
神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)的各種性狀的相對(duì)重要性見(jiàn)圖2。從圖2可以看出,穗粗和穗長(zhǎng)的相對(duì)重要性最高,其次是百粒重、株高和生育期,穗位和倒折株數(shù)的相對(duì)重要性中等,而禿尖、傾斜株數(shù)、病指數(shù)和穗行數(shù)的相對(duì)重要性較低。
2.4 各個(gè)性狀的最佳組合
3種模型的預(yù)測(cè)結(jié)果中,產(chǎn)量最大時(shí)各個(gè)性狀的最佳組合的結(jié)果基本一致,除了禿尖、倒折株數(shù)和空桿株數(shù)等性狀的變異系數(shù)較大之外,其他性狀的變異系數(shù)均較小,而這3個(gè)性狀的取值都很小。產(chǎn)量最大時(shí)的各個(gè)性狀的取值分別為生育期103 d左右、株高300 cm左右、穗位120 cm左右、倒折株數(shù)2~3株、空桿株數(shù)接近0株、穗粗5.6 cm、穗長(zhǎng)20 cm、禿尖0.5 cm、穗行數(shù)16行、百粒重39 cm、病指數(shù)1.0。在該合下,預(yù)測(cè)的最高產(chǎn)量為9 750 kg/hm2左右。
3 結(jié)論與討論
神經(jīng)網(wǎng)絡(luò)模型是近年來(lái)發(fā)展起來(lái)的一種變量關(guān)系模擬和預(yù)測(cè)方法,由于它具有良好的非線性映射能力和很強(qiáng)的自學(xué)習(xí)適應(yīng)能力,因而為解決未知不確定性非線性關(guān)系問(wèn)題提供了有效的方法[4]。這些模型對(duì)育種家確定不同環(huán)境下的育種目標(biāo)、比較不同育種方法的優(yōu)劣、設(shè)計(jì)育種的選擇方案和優(yōu)化策略開(kāi)展分子輔助選擇育種研究提供了強(qiáng)有力的輔助工具。然而,作物育種學(xué)是一門(mén)實(shí)踐科學(xué),育種方法的研究來(lái)源于育種實(shí)踐的需要。在以后的研究中,計(jì)算機(jī)模擬應(yīng)與育種實(shí)踐緊密結(jié)合,不斷發(fā)現(xiàn)并解決育種工作中存在的問(wèn)題,才能真正為育種家服務(wù)。
玉米產(chǎn)量除受自然環(huán)境影響外,遺傳因素也具有很重要地位,在玉米育種工作中,通過(guò)研究主要農(nóng)藝性狀及其與產(chǎn)量的相互關(guān)系,找出影響產(chǎn)量的主要因素,可以為優(yōu)良雜交種的選育提供選擇依據(jù)[5]。玉米產(chǎn)量是各農(nóng)藝性狀綜合作用的結(jié)果,影響產(chǎn)量的因素很多,有些與產(chǎn)量關(guān)系密切,而有些作用較小[6-7]。對(duì)玉米雜交種主要農(nóng)藝性狀的遺傳相關(guān)及其與產(chǎn)量的關(guān)系已有很多報(bào)道,前人大多利用各自不同的育種材料,基于一種方法進(jìn)行研究,因此結(jié)果各不相同[8-9]。該研究發(fā)現(xiàn),在所有的性狀中,穗粗、穗長(zhǎng)對(duì)產(chǎn)量的相對(duì)重要性最大,隨后是百粒重、株高和生育期等,這與張澤民等[10] 、丁山等[11]和卓德眾等[12]的研究結(jié)果基本一致。其次,研究還發(fā)現(xiàn),產(chǎn)量最大時(shí)各個(gè)性狀的最佳組合為生育期103 d左右、株高300 cm左右、穗位120 cm左右、倒折株數(shù)2~3株、空桿株數(shù)接近0株、穗粗5.6 cm、穗長(zhǎng)20 cm、禿尖0.5 cm、穗行數(shù)16行、百粒重39 cm、病指數(shù)1.0等,這較符合玉米育種目標(biāo)的常規(guī)認(rèn)識(shí)和思路。劉帆等[13]、陳發(fā)波等[14]、閆海霞等[15]的結(jié)果與該研究也基本一致。針對(duì)特定的原始材料和黃淮海地區(qū)特殊的生態(tài)條件,對(duì)該玉米育種項(xiàng)目和黃淮海地區(qū)的玉米育種目標(biāo)和育種策略的制定具有一定的參考價(jià)值。
參考文獻(xiàn)
[1] 魯珊,肖荷霞,毛彩云,等.玉米雜交種主要農(nóng)藝性狀的相關(guān)和通徑分析[J].安徽農(nóng)業(yè)科學(xué),2017,45(21):26-27,58.
[2] 史新海,李可敬,孫為森,等.山東省不同年代玉米雜交種主要農(nóng)藝性狀演變規(guī)律的研究[J].玉米科學(xué),2000,8(2):33-35.
[3] 李曉花,林永明,謝淑芳,等.玉米產(chǎn)量與主要農(nóng)藝性狀的灰色關(guān)聯(lián)度分析[J].云南農(nóng)業(yè)科技,2016(1):13-15.
[4] 焦李成,楊淑媛,劉芳,等.神經(jīng)網(wǎng)絡(luò)七十年:回顧與展望[J].計(jì)算機(jī)學(xué)報(bào),2016,39(8):1697-1716.
[5] 佟屏亞.中國(guó)玉米生產(chǎn)的發(fā)展方向——質(zhì)疑“超級(jí)玉米”“超高產(chǎn)”[J].農(nóng)業(yè)科技通訊,2005(8):11-13.
[6] 崔俊明.新編玉米育種學(xué)[M].北京:中國(guó)農(nóng)業(yè)科學(xué)技術(shù)出版社,2007:12-57.
[7] 周得寶,王娟,王五洲,等.夏玉米品系(種)的產(chǎn)量比較及主要農(nóng)藝性狀的關(guān)聯(lián)度分析[J].安徽農(nóng)業(yè)科學(xué),2017,45(26):48-51,78.
[8] 何文昭.玉米產(chǎn)量和主要農(nóng)藝性狀雜種優(yōu)勢(shì)遺傳分析[D].北京:中國(guó)農(nóng)業(yè)科學(xué)院,2017.
[9] 史新海,趙格.山東省緊湊型玉米雜交種主要農(nóng)藝性狀對(duì)產(chǎn)量的影響及其演變規(guī)律的研究[J].玉米科學(xué),2003,11(2):59-61,85.
[10] 張澤民,劉豐明,李雪英.河南省1963~1993年玉米雜交種籽粒產(chǎn)量及其組成性狀的遺傳增益[J].作物學(xué)報(bào),1998,24(2):182-186.
[11] 丁山,郭去,宋軍,等.玉米主要性狀與產(chǎn)量的回歸模型及相關(guān)分析[J].西南農(nóng)業(yè)學(xué)報(bào),2008,21(5):1226-1230.
[12] 卓德眾,劉啟華,郭紅甫.灰色關(guān)聯(lián)度分析法在玉米育種中的應(yīng)用[J].玉米科學(xué),1996,4(3):31-34.
[13] 劉帆,石海春,余學(xué)杰.玉米果穗主要性狀與產(chǎn)量間的相關(guān)與通徑分析[J].玉米科學(xué),2005,13(3):17-20.
[14] 陳發(fā)波,楊克誠(chéng),榮廷昭,等.西南及四川區(qū)試玉米組合主要性狀分析及育種對(duì)策探討[J].玉米科學(xué),2007,15(4):41-45.
[15] 閆海霞,柳家友,吳偉華,等.含非洲血緣玉米雜交種主要穗部性狀與單株產(chǎn)量的相關(guān)及通徑分析[J].雜糧作物,2007,27(6):379-381.