付彥榮 劉鳳欒 李碩 田代科 董麗
(北京林業(yè)大學,北京,100083)(上海辰山植物園)(北京林業(yè)大學)
蓮隸屬蓮科(Nymphaeaceae)蓮屬(NelumboAdans.),是重要的水生植物之一,具有觀賞、文化、經濟、生態(tài)等多種價值,具有極強的開發(fā)和應用價值。蓮屬僅有亞洲蓮(N.nuciferaGaertn.)、美洲蓮(N.luteaWilld.)2個種。其中,亞洲蓮的花為粉紅或白色,主要分布于亞洲和澳大利亞北部;而美洲蓮的花為淡黃色,主要分布于北美洲、中美洲[1-2]。蓮屬擁有豐富的種質資源,除了一批古老品種和人工培育而成的數百個栽培品種[2],還包括通過亞美雜交蓮品種。此外,還有一些古代蓮、野生蓮,廣泛分布于中國、日本、越南、印度、澳大利亞、美國等[3],是蓮遺傳信息的重要載體。
野生種質是物種遺傳多樣性的重要源泉和新品種培育的重要基礎。然而,因自然災害、人為干擾破壞等原因,中國的野生蓮資源和居群正不斷減少,部分面臨消失的風險[4-5]。掌握野生蓮的生存現狀,深入探究其遺傳多樣性和親緣關系,是進行科學保護和合理利用的前提。針對黑龍江的野生蓮、長江流域的野生蓮、泰國野生蓮、美洲蓮野生資源的遺傳多樣性已開展了相關研究[6-12],但白洋淀和微山湖作為中國北方地區(qū)的2個重要的野生蓮居群,盡管其少數個體常被作為研究樣本開展多樣性研究[13-15],但其居群的遺傳多樣性以及演化地位尚缺乏系統(tǒng)而深入的了解。
蓮基因組測序已經完成[16],但利用全基因組重測序技術開展蓮的群體遺傳學研究較少。簡化基因組是根據二代測序發(fā)展的,它通過特定手段獲得部分基因組的序列信息。其中,應用較為廣泛的有限制性酶切位點相關DNA測序技術(RAD-seq)、利用酶切技術降低基因組的復雜度、對酶切產生的限制性酶切位點相關DNA標記(RAD-tag)進行高通量測序,能夠開發(fā)大量的單核苷酸多態(tài)性(SNP)、簡單重復序列(SSR)標記,從而具有成本低、準確率高、不受參考基因組序列限制等優(yōu)點[17]。限制性酶切位點相關DNA測序技術已經應用于煙草[18]、靈寶杜鵑[19]、鵝掌楸[20]、苦草[21]等多種觀賞植物的遺傳多樣性研究,并取得了良好效果。本研究采用限制性酶切位點相關DNA測序技術,對白洋淀和微山湖居群野生蓮進行測序,通過遺傳多樣性和群體遺傳結構分析,明確其遺傳背景,為野生蓮資源保護和利用提供參考。
采集蓮樣本共127份(見表1),包含白洋淀野生蓮居群樣本60份、微山湖野生蓮居群樣本45份。具體采樣方法:首先,從居群不同方位選取相互距離大于500 m的采樣點,白洋淀居群選取12個、微山湖居群選取9個;然后,在每個采樣點內按間隔距離5 m以上采集15個樣本葉片,從中隨機選取5片進行測序。對照樣本共22份,其中:黑龍江、吉林、遼寧、內蒙、湖南、四川野生蓮樣本6份,古代蓮樣本4份,蓮栽培品種樣本5份,泰國、印度、越南、澳大利亞的野生蓮樣本5份,美洲蓮、亞美雜交蓮樣本各1份。生長季采集新鮮葉片,使用硅膠干燥后,室溫保存。
表1 供試蓮樣本信息
續(xù)(表1)
采用十六烷基三甲基溴化銨法提取蓮樣本葉片的基因組DNA,每個樣本取500 ng的DNA用于酶切、后序分析測定。使用HindⅢ+BfaⅠ兩種限制性內切酶對基因組DNA進行酶切,切膠回收220~450 bp的片段,將酶切后的DNA片段調整濃度后上機測序,測序平臺為因美納2 500高通量測序儀(Illumina HiSeq 2500;雙端測序,2×150 bp)。DNA的提取、酶切、測序由上海派森諾生物科技有限公司完成。
采用序列比對軟件(BWA Version:0.7.12-r1039)[22]aln程序,分別將經過過濾后的讀出序列數據映射至參考基因組序列中,比對的參數均按照BWA最大精確比對的默認參數,產生sam文件。利用皮卡德(Picard 1.107)軟件將比對得到的sam文件排序。采用皮卡德軟件包中的“標記重復”命令去除重復序列。如果多個雙端測序讀長比對后具有相同的染色體坐標,則僅保留分值最高的雙端測序讀長。
采用生物信息變異檢測工具(GATK v3.8)軟件包[23]進行單核苷酸多態(tài)性檢測。對已知的插入和缺失信息進行局部重新比對,檢測插入和缺失附近序列比對結果可靠性。采用一體式基因型檢測程序獲得樣本所有突變位點;利用選擇變異檢測程序獲取單核苷酸多態(tài)性突變信息。
采用序列多態(tài)性識別工具(Stacks)程序包中的群體命令進行群體遺傳多樣性分析,計算群體分化指數。采用分子進化遺傳分析軟件(MEGA 7.0)中的鄰接法(NJ)算法[24],分析蓮樣本的遺傳關系,構建系統(tǒng)發(fā)育樹。采用遺傳結構分析工具軟件(Structure)利用單核苷酸多態(tài)性信息分析群體的遺傳結構,設置K=2~10(即假設存在2~10個祖先群體),模型選擇混合模型,其余參數采用軟件的默認設置。從K=2到K=10,分別計算ΔK值,將最大者視為最佳分群數量。
116份樣本獲得了有效測序結果,包括白洋淀野生蓮樣本48份、微山湖野生蓮樣本36份、對照樣本22份。從116份樣本中,共得到961 398 496條讀出序列、總堿基數據量為136 968 251 581 bp;經過數據過濾后,共得到高質量序列919 915 896條、高質量堿基數據128 055 038 010 bp。經與參考基因組比對檢測單核苷酸多態(tài)性,共得到535 269個單核苷酸多態(tài)性。
微山湖野生蓮居群的讀出序列數、總堿基數據量、模糊堿基所占百分比(N)、鳥嘌呤和胞嘧啶(GC)堿基占比、堿基識別準確率在99%以上的堿基占比、堿基識別準確率在99.9%以上的堿基占比,在3個樣本組中均為最高,其次為對照組,白洋淀野生蓮居群的數值最低。
白洋淀居群和微山湖居群蓮樣本整體的遺傳分化指數為0.034 501 3;白洋淀居群和微山湖居群兩樣本組與對照樣本組的遺傳分化指數,分別為0.096 258 7、0.103 927 0,均高于兩居群間的遺傳分化指數值。表明2個居群間整體上的遺傳分化很小,而它們各自與對照組間的遺傳分化較大。
116份蓮樣本的系統(tǒng)發(fā)育樹(見圖1)包含10個分支,分別為:美洲蓮(No.64)和亞美雜交蓮‘Perry’s Giant Sunburst’(No.65)為1個分支;‘建選17’(No.66)和越南蓮(No.82)為1個分支;3個蓮栽培品種‘單灑錦’(No.74)、‘千瓣’(No.75)、‘中山紅臺’(No.76)各單獨為1個分支;白洋淀樣本(No.59)、白洋淀樣本(No.60)各單獨為1個分支;白洋淀樣本(No.56~58)和‘鄂蓮1號’(No.67)為1個分支;微山湖樣本(No.113~117)為1個分支;剩余98個樣本組成1個‘傘形’分支(見圖1b)。
白洋淀樣本(No.56~60)與對照藕蓮品種‘鄂蓮1號’(No.67),表明此采樣點是人為引種藕蓮品種的栽培區(qū)或者附近存在藕蓮品種栽培,受到外界遺傳干擾。微山湖樣本(No.113~117)分支,出現在大部分微山湖樣本和蓮栽培品種間(見圖1),說明此采樣點受到了外界干擾或者內部發(fā)生了基因分化。在98個樣本組成的‘傘形’分支中,包含了多數白洋淀樣本和微山湖樣本。黑龍江(No.69)、吉林(No.70)、遼寧(No.71)、內蒙古(No.68)的野生蓮,普蘭店古(No.61)、開封古(No.63)、濟寧古(No.62)3個古代蓮,日本大賀蓮(No.77),8個高緯度對照樣本散布于白洋淀和微山湖居群樣本之中;而四川(No.72)、湖南(No.73)野生蓮樣本,泰國蓮(No.78~79)、印度蓮(No.80)、澳大利亞蓮(No.81)蓮樣本,6個低緯度對照樣本單獨組成1個小分支(見圖1)。白洋淀和微山湖居群的多數樣本與所有14個野生蓮和古代蓮樣本(除了美洲蓮(No.64)、越南蓮(No.82)之外)組成1個‘傘形’分支,表明2個居群多數樣本的遺傳背景較為一致,且比較原始。
表2 蓮樣本測序結果
依據有效單核苷酸多態(tài)性位點分析蓮樣本的群體結構。當K=6時,ΔK達最大值,達到拐點,即所有蓮樣本有6種不同遺傳來源,不同樣本中各來源比例不同(見圖2)。遺傳分化主要發(fā)生在對照樣本之間。白洋淀和微山湖2個野生蓮居群各自有1個樣點(No.56~60、No.113~117)呈現不同外,其他樣本同為一種遺傳結構,遺傳來源高度一致。且此遺傳結構與4個古代蓮(No.61~63、No.77)和6個中國其他地區(qū)野生蓮(No.68~73)一致,說明白洋淀和微山湖主體居群的遺傳背景較為原始。白洋淀(No.56~60)和微山湖(No.113~117)的2個樣點例外,其遺傳結構與藕蓮品種(No.67)相似,表明受到人工引種藕蓮栽培的干擾。從花朵性狀看,2個樣點均為白花,與同居群大多數樣本的花色存在差異。此外,白洋淀樣本(No.37、No.40)和微山湖樣本(No.88、No.90~92),都含有藕蓮品種(No.67)和栽培品種(No.74~76)的低度基因滲入??傮w而言,蓮樣本的遺傳結構與其系統(tǒng)發(fā)育樹分類十分吻合,兩者相互進行了驗證。
本研究利用限制性酶切位點相關DNA測序技術,在蓮屬全基因組水平上開發(fā)出大規(guī)模單核苷酸多態(tài)性標記,檢測得到535 269個有效單核苷酸多態(tài)性標記。所有樣本的Q20和Q30比例分別為98.42%、95.70%,表明測序結果質量較高。利用這些有效單核苷酸多態(tài)性標記,分析了白洋淀和微山湖2個野生蓮居群的遺傳多樣性和遺傳結構,初步掌握了2個居群的遺傳背景和內部分化狀況,為制定保護策略等提供了參考。
遺傳分化指數(Fst)反映群體結構的變化,突變、遺傳漂變、自然選擇等作用,都會對其值產生影響。當Fst>0.25時,表明群體間的遺傳分化很大;0.15 a和b為系統(tǒng)發(fā)育樹的兩種表現形式;湖藍色分支部分,為98個樣本組成的‘傘形’分支。 ①每種顏色代表1個遺傳來源。②白洋淀和微山湖野生蓮居群多數樣本遺傳來源一致,樣點(No.56~60、No.113~117)遺傳結構與藕蓮品種(No.67)類似,樣本(No.37、No.40、No.88、No.90~92)等也有低度基因滲入。③白洋淀和微山湖野生蓮居群多數樣本的遺傳結構,與古代蓮樣本(No.61~63、No.77)、中國其他地區(qū)野生蓮樣本(No.68~73)一致。 從系統(tǒng)發(fā)育樹(見圖1)可知,白洋淀和微山湖野生蓮居群的多數樣本共同聚為1個傘狀分支,在分支內彼此并列存在,未呈現明顯的遺傳差別和先后進化關系。在此傘狀分支中,來自黑龍江、吉林、遼寧、內蒙古等地的野生蓮對照樣本,以及4個古代蓮對照樣本,均散布其中。這表明,中國北方野生蓮之間的親緣關系較為接近[14],也印證了野生蓮由古代蓮進化而來的推測[2]。尤其是微山湖居群的樣點(No.118~122),分別與普蘭店古(No.61)、開封古(No.63)2個古代蓮聚為2個小分支,表明此樣點的樣本比較原始;與之相似,白洋淀居群內的樣本(No.5)與濟寧古(No.62)也形成1個小分支。這些樣點資源應予重點關注和保護。來自湖南和四川的2個南方野生蓮對照,盡管也位于傘狀分支中,卻與泰國蓮(No.78~79)、印度蓮(No.80)、澳大利亞蓮(No.81)等樣本聚為1個小分支,表明它們之間的遺傳關系更為接近,而與中國北方野生蓮產生一定分化。 在游離于白洋淀居群和微山湖居群主體之外的樣本中,白洋淀居群的樣本(No.56~60)與藕蓮品種‘鄂蓮1號’(No.67)聚在一起,并與栽培品種‘中山紅臺’(No.76)、‘千瓣’(No.75)、‘單灑錦’(No.74)相鄰,結合花的形態(tài)特征,認為此樣點是人工種植的藕蓮品種。與此相似,微山湖居群的樣點(No.113~117)單獨聚為一支,且與黑龍江野生蓮(No.69)、白洋淀居群樣點(No.56~60)與‘鄂蓮1號’(No.67)組成的分支接近,由此判斷它們的來源同樣與人工種植的藕蓮品種有關。 白洋淀野生蓮樣本與微山湖野生蓮樣本的遺傳背景總體一致(見圖2),并與古代蓮樣本,以及黑龍江、吉林、遼寧、內蒙古、湖南、四川6個野生蓮樣本相同,該結果與由系統(tǒng)發(fā)育樹揭示的結果相統(tǒng)一。這進一步確定了白洋淀和微山湖野生蓮居群的遺傳背景總體上較為一致,且較為原始。 白洋淀和微山湖2個野生蓮居群,均有外來遺傳基因混入的現象。白洋淀野生蓮居群的樣本(No.56~60)和微山湖野生蓮居群樣本(No.113~117)均有明顯的基因滲入,其遺傳背景與藕蓮品種‘鄂蓮1號’非常相似?,F場調查發(fā)現,這些樣本的花色均為白花,與各居群內大多數樣本的紅花不同,由此判斷它們是人工引種的藕蓮品種,至少含有栽培品種的遺傳成分。可見,加強野生蓮生境和周邊環(huán)境保護,限制人為干擾,對保護野生蓮種質特有遺傳信息非常必要。 致謝:感謝北京植物園張會金先生和吳倩女士、山東省農業(yè)科學研究院李孝尊先生、遼寧職業(yè)學院王日新先生、杭州市水生植物學會陳煜初先生等協(xié)助采集部分試驗材料。3.2 白洋淀和微山湖野生蓮居群的系統(tǒng)發(fā)育
3.3 白洋淀和微山湖野生蓮居群的群體遺傳結構