陳興彬,何龍燕,2,肖復(fù)明,婁永峰,徐海寧,孫世武
(1. 江西省林業(yè)科學(xué)院 江西省植物生物技術(shù)重點(diǎn)實(shí)驗(yàn)室,江西 南昌 330013;2. 廈門(mén)市江平生物基質(zhì)技術(shù)股份有限公司,福建 廈門(mén) 361000;3. 青原區(qū)白云山林場(chǎng),江西 吉安 343000)
分子標(biāo)記是以DNA 序列變異為基礎(chǔ)的遺傳標(biāo)記,能在分子水平上反映個(gè)體間的差異。簡(jiǎn)單重復(fù)序列(SSR)在真核生物基因組中分布廣泛,具有高度的多態(tài)性。與其它分子標(biāo)記相比,SSR 標(biāo)記具有可靠性強(qiáng)、共顯性遺傳、信息含量高、操作簡(jiǎn)單等特點(diǎn),廣泛用于譜系地理學(xué)和遺傳多樣性分析等方面[1-2]。根據(jù)來(lái)源不同,SSR 標(biāo)記可分為基于基因組開(kāi)發(fā)的g-SSR 和基于表達(dá)序列標(biāo)簽開(kāi)發(fā)的EST-SSR,開(kāi)發(fā)g-SSR 操作繁瑣,難度高,效率低。EST-SSR 標(biāo)記源于基因的轉(zhuǎn)錄區(qū),與gSSR 標(biāo)記相比,免去了文庫(kù)構(gòu)建,開(kāi)發(fā)時(shí)間短,無(wú)效等位基因頻率低,種間通用性更好[3-4]。同時(shí),由于ESTSSR 是基因轉(zhuǎn)錄本的一部分,因此可作為功能基因直接鑒定的重要依據(jù)[5]。目前,基于轉(zhuǎn)錄組數(shù)據(jù),火炬松Pinus taeda[6]、桉樹(shù)Eucalyptus[7-8]、橡膠樹(shù)Hevea brasiliensis[9]、日本落葉松Larix kaempferi[10]等樹(shù)種已開(kāi)發(fā)了大量多態(tài)性EST-SSR 標(biāo)記。
杉木Cunninghamia lanceolata是我國(guó)南方重要的速生用材樹(shù)種,廣泛分布于我國(guó)亞熱帶地區(qū)。由于長(zhǎng)期自然和人工選擇以及分布區(qū)內(nèi)氣候、土壤和地形地貌差異導(dǎo)致的生殖隔離等,杉木種源間存在顯著的遺傳差異。陳山紅心杉是具有江西地方特色的杉木優(yōu)良種源,其近髓心的木質(zhì)部為高比例的油亮的栗褐色,紅心香溢,材質(zhì)優(yōu)良,堅(jiān)韌耐腐[11],是工藝建筑和室內(nèi)裝潢極為寶貴的天然材料,且在浙江、福建、四川等地栽植表現(xiàn)良好[12-13]。在杉木遺傳改良研究方面,各省區(qū)均開(kāi)展了各具特色的資源收集、種子園營(yíng)建、無(wú)性系篩選等工作,然而,杉木尚無(wú)全基因組序列信息,同時(shí)分子標(biāo)記開(kāi)發(fā)滯后,僅開(kāi)發(fā)出少量分子標(biāo)記[14-18]。分子標(biāo)記數(shù)量不足,嚴(yán)重制約了杉木基因定位、關(guān)聯(lián)分析等工作的開(kāi)展。本研究在分析陳山紅心杉轉(zhuǎn)錄組數(shù)據(jù)基礎(chǔ)上開(kāi)發(fā)EST-SSR標(biāo)記,旨在豐富可用于杉木遺傳分析的分子標(biāo)記數(shù)量,同時(shí)利用開(kāi)發(fā)的EST-SSR 標(biāo)記對(duì)陳山紅心杉二代種子園進(jìn)行遺傳變異評(píng)價(jià),以便了解該種子園的遺傳基礎(chǔ),為其高效管理提供參考信息。
以課題組培室培養(yǎng)的紅心杉優(yōu)良基因型C25作為轉(zhuǎn)錄組測(cè)序的材料,隨機(jī)挑選3 株C25 組培苗,取頂端約2 cm 長(zhǎng)莖段進(jìn)行液氮速凍,隨后放到-80 ℃冰箱保存?zhèn)溆谩?/p>
選取江西省安福縣武功山林場(chǎng)收集的5 個(gè)杉木種源(江西安福、湖南會(huì)同、廣西融水、浙江龍泉和福建建甌)的10 個(gè)杉木單株進(jìn)行引物初篩。SSR 群體擴(kuò)增所用材料取自江西省青原區(qū)白云山林場(chǎng)陳山紅心杉二代種子園,共計(jì)32 個(gè)無(wú)性系。取當(dāng)年生嫩葉,液氮速凍后保存于-80 ℃冰箱備用。采用改良的CTAB 法提取基因組總DNA。
組培苗莖段在液氮中迅速研磨成粉末,等量混勻后提取總RNA。在Illumina HiSeq 2000 高通量測(cè)序平臺(tái)上對(duì)總RNA 進(jìn)行測(cè)序,獲得測(cè)序序列(reads)。采用Trinity 軟件對(duì)reads 進(jìn)行拼接,得到transcript 片段。利用Corset[19]進(jìn)行層次聚類(lèi),得到unigene。
采用MISA 軟件(http://pgrc.ipk- gatersleben.de/misa/)對(duì)unigene 序列中的1 ~6 核苷酸重復(fù)類(lèi)型SSR 位點(diǎn)進(jìn)行檢索,各重復(fù)序列長(zhǎng)度均≥18 bp,1 ~6 核苷酸類(lèi)型最小重復(fù)數(shù)分別為10、9、6、5、5 和 4 次。
隨機(jī)挑選150 個(gè)EST-SSR 位點(diǎn),用Primer3.0對(duì)進(jìn)行引物設(shè)計(jì),引物設(shè)計(jì)遵循以下原則:引物長(zhǎng) 度 為 18 ~ 25 bp;Tm 值 為 52.0 ~ 60.0 ℃,上下游引物Tm 值在5 ℃以?xún)?nèi);(G+C)含量為40%~60%;引物擴(kuò)增長(zhǎng)度在100 ~300 bp 之間。由生工生物工程(上海)股份有限公司合成引物。
用合成的引物擴(kuò)增5 個(gè)杉木種源的10 個(gè)杉木DNA 樣品,8%非變性聚丙烯酰胺凝膠電泳篩選多態(tài)性引物。PCR 反應(yīng)體系和擴(kuò)增程序同落葉松標(biāo)記開(kāi)發(fā)的相關(guān)方法[20]。對(duì)自行開(kāi)發(fā)得到的EST-SSR和檢索文獻(xiàn)得到的3 對(duì)SSR 標(biāo)記的正向序列進(jìn)行5′熒光修飾。用熒光修飾的引物對(duì)陳山紅心杉二代種子園32 個(gè)無(wú)性系基因組DNA 進(jìn)行PCR 擴(kuò)增,并進(jìn)行毛細(xì)管電泳檢測(cè)。熒光修飾和毛細(xì)管電泳檢測(cè)交由北京睿博興科生物技術(shù)有限公司完成。
利用Gene Marker 2.2.0 軟件分析各毛細(xì)管電泳結(jié)果,得到各無(wú)性系的基因型數(shù)據(jù);利用POPGENE version 1.32 軟件計(jì)算等位基因數(shù)(Na)、有效等位基因數(shù)(Ne)、Shannon 多樣性指數(shù)(I)、觀察雜合度(Ho)、期望雜合度(He);由CERVUS3.0 軟件得出多態(tài)性信息含量(PIC);采用NTSYS-pcV2.1[21]軟件計(jì)算無(wú)性系間的遺傳相似系數(shù),選用UPGMA 法進(jìn)行聚類(lèi)分析。
紅心杉葉片轉(zhuǎn)錄組測(cè)序共獲得99 122 394 個(gè)reads 片段,包含 14.87 Gb 序列信息,GC 含量平均值為43.40%,堿基Q30 為90.44%,說(shuō)明測(cè)序質(zhì)量非??煽俊2捎肨rinity 拼接得到201 234個(gè)transcript 片段,序列信息為146 288 475 bp(146.29 Mb), 平 均 長(zhǎng) 度 為 727 bp,N50 為1 270 bp。對(duì)不同長(zhǎng)度transcript 進(jìn)行統(tǒng)計(jì),長(zhǎng)度為200 ~ 500 bp 的 transcript 最多,有 127 065 個(gè),占總體的63.14%(表1)。對(duì)序列進(jìn)行組裝,共獲得76 597 個(gè)unigene,序列信息為104 182 562 bp(104.18 Mb),序列大小為201 ~17 690 bp,平均長(zhǎng)983 bp,N50 為1 963 bp,表明數(shù)據(jù)組裝質(zhì)量較高。其中,≥1 000 bp 的unigene 最多,有37 687 個(gè),占總體的49.20%;其次為500 ~1 000 bp的unigene,占總體的29.79%(表1)。
對(duì)76 597 個(gè)unigene 進(jìn)行SSR 位點(diǎn)搜索,共檢測(cè)到8 072 個(gè)SSR 位點(diǎn),分布頻率(與總非重復(fù)序列數(shù)量之比)為10.54%,平均密度為12.88 kb。SSR 重復(fù)類(lèi)型豐富,各重復(fù)類(lèi)型所占比例變化較大(表2)。其中單核苷酸型位點(diǎn)最多,有5 352 個(gè),占總數(shù)的66.30%,其次為三核苷酸類(lèi)型,為1 411個(gè),占總數(shù)的17.48%,五核苷酸、六核苷酸類(lèi)型數(shù)量最少。2 ~6 核苷酸重復(fù)類(lèi)型和復(fù)合型的平均密度為38.30 kb,平均長(zhǎng)度分別為13.73、16.29、20.56、25.00、32.84 和 62.97 bp。2 720 個(gè) ESTSSR 位點(diǎn)中共包含250 種重復(fù)基序,復(fù)合型和四核苷酸類(lèi)型重復(fù)基序種類(lèi)最多,分別為159 和32個(gè)。AT/TA 重復(fù)基序出現(xiàn)頻率最高(548 次),占總EST-SSR 位點(diǎn)數(shù)的6.79%,其次是AG/TC(156次),占總EST-SSR 位點(diǎn)數(shù)的1.93%。AGA/TCT和AAG/TTC 是主要的三堿基重復(fù)序列,分別占總位點(diǎn)數(shù)的1.45%和1.44%。
表1 紅心杉轉(zhuǎn)錄組transcript 和unigene 數(shù)據(jù)組裝統(tǒng)計(jì)Table 1 Data assembly for transcript and unigene in the transcriptome of red-heart Chinese fir
表2 EST-SSR 重復(fù)基序的分布特征Table 2 Distribution of the SSR motifs in transcriptome of red-heart Chinese fir
以來(lái)自5 個(gè)種源的10 個(gè)杉木DNA 為模板擴(kuò)增隨機(jī)選擇的150 對(duì)SSR 引物,通過(guò)8%非變性聚丙烯酰胺凝膠電泳共篩選出11 對(duì)與預(yù)期產(chǎn)物片段相符的多態(tài)性引物,圖1 為引物H8 的聚丙烯酰胺凝膠電泳圖。表3 列出了11 個(gè)多態(tài)SSR 引物的相關(guān)信息。
圖1 引物H8 在10 份杉木中的擴(kuò)增結(jié)果Fig. 1 DNA fragments amplified by SSR primer H8 in 10 Chinese fir
用篩選出11 個(gè)EST-SSR 標(biāo)記和來(lái)自文獻(xiàn)[13]的 3 個(gè) EST-SSR 標(biāo) 記(LX-13、LX-18、LX-55)對(duì)陳山紅心杉二代種子園32 個(gè)杉木無(wú)性系進(jìn)行遺傳多樣性分析(表4)。圖2 為引物H33 擴(kuò)增的熒光電泳圖。開(kāi)發(fā)的11 對(duì)引物中,有4 對(duì)引物的PIC 大于0.5,說(shuō)明這4 對(duì)引物為高信息含量的引物。14 對(duì)引物共擴(kuò)增得到62 個(gè)等位基因,等位基因范圍為3 ~7 個(gè),平均等位基因數(shù)是4.4 個(gè),其中,引物H245、LX-18 等位基因數(shù)最多,為7 個(gè),H7、H8、H33、H193、LX-13 等位基因數(shù)最少,均為3 個(gè)。有效等位基因范圍為1.814 4 ~3.457 1,平均有效等位基因是2.4 個(gè)。位點(diǎn)多態(tài)信息含量(PIC)變動(dòng)幅度為0.373 0 ~0.660 0,平均為0.492 0。平均觀察雜合度和期望雜合度分別為0.533 5 和0.563 8,計(jì)算得出固定指數(shù)F為0.054,說(shuō)明存在純合子過(guò)量現(xiàn)象,但不明顯。Shannon 多樣性指數(shù)為1.003 4,說(shuō)明紅心杉二代種子園的遺傳多樣性較高。
遺傳相似系數(shù)分析表明,紅心杉二代種子園無(wú)性系間的遺傳相似系數(shù)變化范圍較大,在0.240 0~0.977 8 之間,平均值為0.589 3。無(wú)性系SS1 和SS25 遺傳相似系數(shù)最近,無(wú)性系SS9 和SS13 遺傳相似系數(shù)最遠(yuǎn)。依據(jù)遺傳相似系數(shù)對(duì)紅心杉二代種子園無(wú)性系群體進(jìn)行聚類(lèi)分析,在閾值0.62處可將32 個(gè)無(wú)性系劃分為6 個(gè)亞群體(圖3),亞群體內(nèi)個(gè)體數(shù)量差異較大,無(wú)性系最多的亞群包含21 個(gè)無(wú)性系,無(wú)性系SS9 和SS10 單獨(dú)成群,與其它群無(wú)性系親緣關(guān)系較遠(yuǎn)。
表3 紅心杉11 對(duì)EST-SSR 的引物序列、重復(fù)基序、片段大小和退火溫度Table 3 The sequence of forward and reverse primers, repeat motif, expected size and annealing temperature of the 11 EST-SSR developed in red-heart Chinese fir
圖2 引物H76 在紅心杉二代種子園無(wú)性系個(gè)體中的熒光電泳Fig. 2 Fluorescence electrophoresis by H76 in two clones of the second generation orchard of red-heart Chinese fir
表4 紅心杉二代種子園遺傳多樣性的SSR 分析Table 4 Genetic diversity estimates for the second generation orchard of red-heart Chinese fir by SSR markers
圖3 基于遺傳距離的紅心杉二代種子園無(wú)性系的聚類(lèi)Fig. 3 A dendrogram of based on gentic distance for the second generation orchard clones of red-heart Chinese fir
Illumina 高通量測(cè)序適合于沒(méi)有參考基因組的物種展開(kāi)轉(zhuǎn)錄組研究[22],Q30 值是測(cè)序質(zhì)量的指標(biāo),Q30 在80%以上就認(rèn)為測(cè)序質(zhì)量非??煽縖23],N50 值反映組裝質(zhì)量,N50 越大說(shuō)明組裝得到的長(zhǎng)片段就越多,組裝效果就越好[24]。本研究通過(guò)Illumina 高通量測(cè)序得到14.87 Gb 序列信息,GC 含量平均值為43.40%,堿基Q30 為90.44%,組裝得到76 597 個(gè)unigene,unigene 平均長(zhǎng)度為983 bp,N50 為1 963 bp。說(shuō)明此次測(cè)序的質(zhì)量和組裝的質(zhì)量均較高,可以滿(mǎn)足轉(zhuǎn)錄組數(shù)據(jù)分析的要求。
從陳山紅心杉76 597 個(gè)unigene 中共檢測(cè)到8 072 個(gè) SSR 位點(diǎn),2 ~ 6 核苷酸重復(fù)類(lèi)型 SSR 位點(diǎn)分布頻率為3.28%,平均密度為41.47 kb。就SSR位點(diǎn)分布頻率而言,紅心杉與火炬松(4.32%)[25]、馬尾松Pinus massoniana(3.62%)[26]、紅松Pinus koraiensis(4.24%)[27]和日本落葉松(3.58%)[20]相當(dāng),但小于楊樹(shù)Populus的SSR 位點(diǎn)分布頻率(14.83%)[28]。物種差異、數(shù)據(jù)庫(kù)大小、SSR 搜索條件及組織處理方式等均會(huì)對(duì)SSR 分布頻率和分布密度產(chǎn)生影響[29],為客觀地比較不同轉(zhuǎn)錄組數(shù)據(jù),亟需統(tǒng)一SSR 搜索條件。紅心杉轉(zhuǎn)錄組中,除單核苷酸重復(fù)外,以三核苷酸重復(fù)最多,占SSR 總數(shù)的17.48%。在榧樹(shù)Torreya grandis[30]、桉樹(shù)[31]等的研究中,也發(fā)現(xiàn)三核苷酸重復(fù)比重最大,這可能與密碼子的選擇性有關(guān)。而茶樹(shù)Camellia sinensis[32]、云南金花茶Camellia fascicularisH.T.Chang[33]、橡膠樹(shù)[34]等則以二核苷酸重復(fù)最多。因此,為提高引物篩選效率,在設(shè)計(jì)SSR 引物時(shí),應(yīng)重點(diǎn)設(shè)計(jì)出現(xiàn)頻率較高的重復(fù)類(lèi)型。本研究還發(fā)現(xiàn)重復(fù)基序類(lèi)型AT/TA 的SSR位點(diǎn)最多,同樣的在干旱脅迫處理的杉木轉(zhuǎn)錄組中,占主導(dǎo)到位的也是AT/TA 類(lèi)型(占總ESTSSR 的19.01%)[16],說(shuō)明SSR 位點(diǎn)基序類(lèi)型具有物種特異性。
本研究基于多個(gè)杉木地理種源樣本篩選出的11 對(duì)多態(tài)性EST-SSR,可用于不同產(chǎn)區(qū)杉木的分子遺傳分析。其中4 對(duì)引物的PIC 大于0.5,為高信息含量的引物。紅心杉二代種子園的觀察雜合度、期望雜合度和Shannon 多樣性指數(shù)分別為0.533 5、0.563 8 和1.003 4,高于華北落葉松[35]一代無(wú)性系種子園的Shannon 多樣性指數(shù)0.712 7 和馬尾松[36]二代無(wú)性系種子園的Shannon 多樣性指數(shù)0.850。在杉木的遺傳多樣性研究中,歐陽(yáng)磊等[37]研究表明國(guó)家級(jí)杉木種質(zhì)資源庫(kù)第1 代種質(zhì)資源的觀察雜合度為0.430 0,Shannon 信息指數(shù)為0.980 0;徐陽(yáng)等[38]研究得出42 個(gè)杉木種源的觀測(cè)雜合度為0.284 5,Shannon 信息指數(shù)為0.518 2,均低于本研究結(jié)果,但略低于Duan 等[39-40]對(duì)廣西149 個(gè)紅心杉單株和6 個(gè)杉木種源700 個(gè)無(wú)性系的遺傳多樣性研究。其觀測(cè)雜合度和期望雜合度分別為0.562 0 和0.584 0,0.561 和0.604,這可能與其分析個(gè)體數(shù)量較多有關(guān)。因此,陳山紅心杉二代種子園遺傳多樣性相對(duì)較高,具有較大的育種潛力。
經(jīng)檢測(cè)紅心杉二代種子園無(wú)性系之間遺傳相似系數(shù)在0.240 0 ~0.977 8 之間,說(shuō)明這一群體有較寬的遺傳基礎(chǔ),在遺傳相似系數(shù)0.62 處可將32 個(gè)無(wú)性系劃分為6 個(gè)亞群體。通過(guò)分子標(biāo)記明確種子園無(wú)性系間的親緣關(guān)系,并結(jié)合無(wú)性系的表型性狀,可為無(wú)性系間的雜交育種、新建種子園無(wú)性系間的科學(xué)配置提供依據(jù)。
本研究利用陳山紅心杉轉(zhuǎn)錄組數(shù)據(jù)開(kāi)發(fā)ESTSSR標(biāo)記,共獲得11個(gè)多態(tài)性高、重復(fù)性好的標(biāo)記,豐富了杉木分子標(biāo)記庫(kù),可用于杉木種質(zhì)資源評(píng)價(jià)及分子標(biāo)記輔助育種等方面。利用SSR 標(biāo)記對(duì)陳山紅心杉二代種子園的遺傳多樣性分析表明,該種子園遺傳多樣性較高,遺傳基礎(chǔ)較寬,具有產(chǎn)生優(yōu)良子代的潛力。雖然SSR 標(biāo)記具有可靠性強(qiáng)、共顯性遺傳、操作簡(jiǎn)單的特點(diǎn),但也存在引物設(shè)計(jì)篩選費(fèi)時(shí)、篩選成功率低(本研究為7.3%)、標(biāo)記數(shù)量有限等缺點(diǎn),難以滿(mǎn)足短期內(nèi)區(qū)分大量樣本的需要。SNP 是第3 代分子標(biāo)記,與SSR 標(biāo)記相比,具有數(shù)量更多、分布更廣泛、遺傳穩(wěn)定性更高、易于快速高通量進(jìn)行基因分型等優(yōu)點(diǎn)。隨著SNP 標(biāo)記檢測(cè)成本的逐漸降低,高通量的SNP 標(biāo)記在群體擴(kuò)增、遺傳圖譜構(gòu)建方面具有非常廣闊的應(yīng)用前景。因此,開(kāi)發(fā)合適的SNP 標(biāo)記可作為今后杉木分子標(biāo)記研究的重點(diǎn)。