王楚彪,楊 艷,白衛(wèi)國(guó),林 彥,謝耀堅(jiān),盧萬鴻*,羅建中
1.國(guó)家林業(yè)和草原局桉樹研究開發(fā)中心遺傳育種研究室,廣東 湛江 524022 2.南京林業(yè)大學(xué)林學(xué)院,江蘇 南京 210037 3.湛江科技學(xué)院經(jīng)濟(jì)與金融學(xué)院,廣東 湛江 524094 4.廣西國(guó)有東門林場(chǎng),廣西 崇左 532199
粗皮桉天然分布于新幾內(nèi)亞島南部和澳大利亞昆士蘭州北部,其不同種源的生物學(xué)特征和生長(zhǎng)適應(yīng)性均具有很大的遺傳差異[1]。在炎熱潮濕的熱帶地區(qū),粗皮桉良好的抗病蟲害能力使其逐漸取代金合歡屬(Acacia)樹種,成為地區(qū)重要的造林樹種[2]。巴西、東南亞等國(guó)對(duì)粗皮桉進(jìn)行了大量的引種和高世代改良[3]。國(guó)內(nèi)系統(tǒng)的粗皮桉引種改良始于20世紀(jì)80年代,并于2011年在兩廣多地建立了其高世代育種群體[4]。粗皮桉在國(guó)內(nèi)主要作為雜交親本用于開發(fā)桉樹優(yōu)良無性系,并針對(duì)其開展速生、抗病蟲害等雜交育種理論研究。
摸清育種群體的遺傳親緣關(guān)系是推動(dòng)粗皮桉群體世代改良的基礎(chǔ)工作。目前常用的表型數(shù)據(jù)分析方法很難精確估算家系的遺傳和環(huán)境分量。DNA生物信息學(xué)分析專業(yè)要求高,程序復(fù)雜且成本高。鑒于此,本研究計(jì)劃通過對(duì)比基于DNA分析的遺傳距離和基于NIRs分析的光譜距離間的關(guān)系,探索近紅外光譜技術(shù)用于粗皮桉群體遺傳基礎(chǔ)分析的精度和可行性。
研究對(duì)象為粗皮桉育種群體試驗(yàn)中的23個(gè)天然種源(表1)。遺傳材料基本涵蓋了粗皮桉的天然原生地,即澳大利亞昆士蘭州(QLD, AUS)北部和新幾內(nèi)亞島(New Guinea Island)南部(印度尼西亞(Indonesia)和巴布亞新幾內(nèi)亞(Papua New Guinea, PNG))。兩地被大洋分隔,最近的海岸線距離約為150 km。在粗皮桉大田群體試驗(yàn)中,每家系采集10~15片新鮮葉樣,每個(gè)種源采樣8~12個(gè)家系代表該種源。葉樣盡快置于-30 ℃冰箱,用于后續(xù)遺傳分析及NIRs信息采集。
表1 粗皮桉23個(gè)天然種源信息
手持式近紅外儀Phazir Rx(1624)(Polychromix, Thermo Scientific, USA)用于葉樣NIRs的采集。Phazir Rx波長(zhǎng)范圍為1 600~2 400 nm,分辨率12 nm,單次掃描獲得100維向量數(shù)據(jù),自帶背景校正,內(nèi)置可編程的MEMS技術(shù)微衍射光柵。
1.3.1 光譜采集
光譜采集樣本與DNA分析樣本完全對(duì)應(yīng),每個(gè)家系選擇4~6片外形健康的葉片,置于ClassicLine干燥箱(BINDER,德國(guó)),設(shè)置60 ℃,72 h,以至絕干。用中藥打粉機(jī)粉碎后裝入透明自封口塑料袋。用Phazir Rx(1624)隔袋掃描5次,其均值代表該樣品的近紅外NIRs信息[5],每個(gè)種源共獲得8~12條NIRs。
1.3.2 NIRs數(shù)據(jù)的預(yù)處理和分析
經(jīng)不同的預(yù)處理效果對(duì)比后,本研究對(duì)NIRs原始數(shù)據(jù)進(jìn)行Savitzky-Golay平滑的二階導(dǎo)數(shù)預(yù)處理[6-7]。采用全交互式內(nèi)部交叉驗(yàn)證算法,建立目標(biāo)種源的主成分分析(PCA)模型,通過簇類獨(dú)立軟模式(SIMCA)判別分析,統(tǒng)計(jì)對(duì)比種源到目標(biāo)種源模型間的NIRs光譜距離?;贜IRs歐氏距離(Euclidean distance)按全鏈接算法(Complete linkage),對(duì)測(cè)試種源進(jìn)行層級(jí)聚類(Hierarchical clustering)。根據(jù)樣本NIRs數(shù)據(jù)PCA的因子得分圖分析種源間的遺傳親緣關(guān)系及其遺傳變異。NIRs數(shù)據(jù)的預(yù)處理和分析均由The Unscrambler x10.4(CAMO, Oslo, Norway)實(shí)現(xiàn)。
1.3.3 樣本遺傳距離計(jì)算
通過全基因組重測(cè)序(Whole Genome Resequencing)方法獲得粗皮桉種源各家系的DNA信息,根據(jù)Kimura提出的核苷酸序列差異原理,使用Mega-X軟件估算粗皮桉種源間的遺傳距離[8-9]。
粗皮桉新幾內(nèi)亞島7個(gè)種源間的平均遺傳距離為0.186,昆士蘭州16個(gè)種源間的平均為0.157(數(shù)據(jù)冗余,未列出)。表2為新幾內(nèi)亞島與昆士蘭州2大區(qū)域種源間的遺傳距離。數(shù)據(jù)顯示,2大區(qū)域種源間的最小、最大及平均遺傳距離分別為0.229,0.370和0.295,明顯大于區(qū)域內(nèi)種源間的遺傳距離。新幾內(nèi)亞島種源A20659,S16120,S16121和S16122與昆士蘭州各種源間的遺傳距離均超過了0.300。2大區(qū)域內(nèi)和區(qū)域間種源間遺傳距離的差異,說明區(qū)域分隔(海洋)明顯拉大了粗皮桉種源間的遺傳親緣關(guān)系。
表2 粗皮桉新幾內(nèi)亞島種源與昆士蘭州種源間的遺傳距離
利用NIRs光譜距離可以從不同角度解析、印證樣本間的內(nèi)在遺傳差異。表3為粗皮桉新幾內(nèi)亞島種源與昆士蘭州種源間的NIRs光譜歐式距離。數(shù)據(jù)顯示,2大區(qū)域種源間NIRs平均光譜距離大小與其遺傳距離的大小趨勢(shì)基本一致,如種源S16120與昆士蘭州種源間的平均遺傳距離最大(0.370),兩者之間的平均光譜距離(0.220)也明顯大于其他種源間的光譜距離。偶有例外,S16122與昆士蘭州種源間的平均光譜距離就與其遺傳距離的大小關(guān)系相悖。種源A17854與昆士蘭州種源間的NIRs光譜距離偏大可能與其有效樣本偏少有關(guān)。
表3 粗皮桉新幾內(nèi)亞島種源與昆士蘭州種源間的NIRs歐氏距離
因?qū)嶋H值太小,表中所列光譜距離為實(shí)際數(shù)值放大100倍后的結(jié)果。
圖1中粗皮桉天然種源的NIRs層級(jí)聚類顯示,23個(gè)種源的聚類效果在一定程度上印證了其遺傳距離、光譜距離的差異。巴布亞新幾內(nèi)亞島的S16120,S16121和S16122與昆士蘭州種源間的遺傳距離和光譜距離均大于其他種源間的兩類距離,也基本顯示了與昆士蘭州種源的分別聚類。但23個(gè)種源并沒有完全按照巴布亞新幾內(nèi)亞島和昆士蘭州2大地域分別聚類,來自巴布亞新幾內(nèi)亞的種源A18197,A17854,A18199及A20659與多數(shù)來自昆士蘭州的種源聚在了一起。這或與幾個(gè)種源的海拔較低(<50 m),且兩大地域間的地理距離比較接近,地域間存在花粉、種子或傳粉媒介等某種形式的基因交流有關(guān)。
圖1 粗皮桉23個(gè)種源基于葉樣NIRs歐氏距離的層級(jí)聚類
由于巴布亞新幾內(nèi)亞島種源與昆士蘭種源間的遺傳距離普遍較大,因此,主要列舉了2大區(qū)域種源間的PCA主因子得分聚類結(jié)果。圖2中巴布亞新幾內(nèi)亞島內(nèi)種源S16120與A18199間(a),及S16120與昆士蘭州種源A18750間(b)相同主因子的因子得分顯示,不僅不同地理區(qū)域的種源可以清晰聚類(S16120與A18750),同一地理來源的種源也可以清晰地區(qū)分(S16120與A18199)。對(duì)比種源間的遺傳距離大小及其PCA主因子的得分圖,遺傳距離小的種源間其因子得分有可能將其清晰地區(qū)分;而遺傳距離大的種源間,其因子得分有可能存在嚴(yán)重的重疊,這可能與種源內(nèi)家系間的遺傳變異較大有關(guān)。研究中大多數(shù)種源間的PCA主因子得分都顯示出清晰的聚類,為免冗余,未一一展示。
圖2顯示種源S16120與B10(c)和S14339(d)不能清晰區(qū)分,這與它們之間具有較大的遺傳距離不符,可能是種源B10和S14339內(nèi)家系間存在較大的遺傳變異,從其非常分散的因子得分圖也能看出。另外,圖2各種源因子得分的聚集度各不相同,B10和S14339的得分比較分散,而S16120,A18199和A18750的得分則相對(duì)集中,影響了種源間的相互區(qū)分。從遺傳角度也反映了種源內(nèi)家系間的遺傳變異信息,分散可能表明其遺傳變異大,集中則表示遺傳變異小。
圖2 粗皮桉種源間的PCA因子得分圖(部分)
圖3 種源S16120與A17861的PCA分析中第一主因子不同波段的載荷(其他種源間因子載荷與此相似)
對(duì)比粗皮桉天然種源間的遺傳距離與其NIRs光譜距離間的關(guān)系發(fā)現(xiàn),種源遺傳距離與其光譜距離間普遍存在正相關(guān)關(guān)系,但個(gè)別種源間的遺傳距離與其光譜距離呈負(fù)相關(guān)。種源NIRs聚類結(jié)果與地理距離間的關(guān)系也非完全對(duì)應(yīng),這印證了粗皮桉群體不同地域間的基因交流對(duì)其遺傳親緣關(guān)系有較大的影響。NIRs數(shù)據(jù)的PCA聚類顯示,遺傳或光譜距離大的種源間存在嚴(yán)重重疊,而遺傳或光譜距離小的種源樣本反而會(huì)清晰聚類,這既表明了NIRs信息的敏感性,也在一定程度反映了粗皮桉各種源內(nèi)存在不同水平的遺傳變異。