張小燕,劉志香,廖保生,肖水明,徐 江**,盛 瑋
(1.淮北師范大學生命科學學院 淮北 235000;2.中國中醫(yī)科學院中藥研究所 北京 100700)
本草基因組學(herbgenomics)是利用組學技術研究中藥基原物種的遺傳信息及其調控網絡,闡明中藥防治人類疾病分子機制的學科,從基因組水平研究中藥及其對人體作用的前沿科學[1,2]。人參作為我國傳統(tǒng)名貴藥材,享有“百草之王”美譽。人參具有48條染色體(2n=4x=48)[3],由于基因組數據的缺乏嚴重制約了人參基礎研究和產業(yè)的開展。評價人參基因組的大小及復雜程度,將有助于確定適合人參全基因組測序的研究策略。目前多種方法可用于測定基因組大小,如物理圖譜法[4]、流式細胞術[5-7]和高通量測序技術[8,9]。流式細胞術是基因組預估常用的方法[10],可檢測單細胞倍性以及細胞核DNA含量[11,12],具有特異性好,靈敏度高,同時進行多參數檢測等優(yōu)點。新一代測序技術的迅速發(fā)展使其成為測定基因組大小的重要方法,具有通量高、速度快、單次運行能產生大量數據等優(yōu)點。
本研究聯(lián)合流式細胞術和高通量測序技術對人參基因組進行測定和評估,并把這兩種技術的測定結果進行相互驗證,旨在為人參全基因組測序方案的制定提供依據,為人參本草基因組學[1,2]的研究奠定基礎。
人參(Panax ginsengC.A.Mey)(實驗基地栽培株系IR826);大豆(Glycine max(L.)Merrill);粳稻(Oryza sativassp.Nipponbare)。
Accuri C6型流式細胞儀(美國BD公司),1-14K低溫冷凍離心機(美國Sigma公司);RXZ型智能人工氣候箱(寧波江南儀器廠);DK-8D型電熱恒溫水槽(上海森信實驗儀器有限公司);Illumina Hiseq X Ten(美國Illumina公司);Agilent Technologies 2100生物分析儀(美國 Agilent公司);Covaris M220 Focusedultrasonicator(美國Covaris公司)。
吐溫-20(Sigma-Aldrich,cat.No.SZBD2190V);碘化丙啶(BD Biosciences Pharmingen,cat.No.550825);RNaseA(TIANGEN,cat.No.K20822);Quick-Load 1kb Extend DNA Ladder(BioLabs,cat.No.0041602)。
水稻、大豆材料培養(yǎng):選取飽滿成熟完整的水稻和大豆種子,用去離子水沖洗種子3-5次,并浸泡過夜,將種子放在浸濕的有孔濾膜上,置于燒杯中室溫條件下培養(yǎng)一周。
人參愈傷組織培養(yǎng):切取人參幼嫩的葉片置于含有植物激素的MS培養(yǎng)基(1 mg·L-12,4-二氯苯氧乙酸,0.1 mg·L-1激動素)上,于12 h黑暗、12 h光照的20±2℃恒溫培養(yǎng)中培養(yǎng)。
水稻與大豆均取其幼嫩的葉各兩份,每份質量100 mg,人參取其愈傷組織各兩份,每份質量200 mg,將其置于冰浴的培養(yǎng)皿中,吸取2 mL Otto I緩沖液(0.1 mol·L-1檸檬酸,0.5%(v/v)吐溫-20,pH 2.0-3.0),用鋒利刀片迅速將葉片、愈傷組織切碎;用移液器反復吹打使其與緩沖液混合均勻,經40μm尼龍篩網(Corning,cat.No.352340)過濾,濾液置入2 mL的離心管,于4℃離心機中以5000 r·min-1離心3 min去除上清,加入1 mL預冷的Otto I緩沖液,重懸后,2600 r·min-1離心30 s,去上清,加入1 mL預冷的Otto I緩沖液,再次2600 r·min-1離心30 s去上清,加入900 μL的Otto I緩沖液,輕搖混勻,置于冰上待用。上機檢測前加入600 μL的Otto II緩沖液(0.4 mol·L-1磷酸二氫鈉,pH 8.0-9.0),加等體積的碘化丙啶(propidium iodide,PI)染料,避光染色15 min。
經PI染色的樣品,在高速液流下受到激光照射,發(fā)射產生熒光信號,其熒光信號的強弱與DNA含量成正比,可用于估測生物基因組大小。本實驗選取水稻和大豆為內參,根據公式:樣品基因組大小=(樣品平均峰值/內參平均峰值)×內參基因組大小,獲得待測樣品的基因組大小。再根據1 pg=0.978×109bp[13]計算得到待測樣品的相對DNA含量。
取人參愈傷組織,采用CTAB法提取人參基因組DNA,Qubit 2.0檢測濃度,瓊脂糖凝膠電泳檢測基因組完整性,檢測參數為膠濃度0.8%,電壓為120 V,電泳時間為30 min,選用1 kb Extend DNA Ladder作為參照。
對符合質量要求的DNA樣品構建shotgun文庫,首先基因組DNA片段化成約250-500 bp的片段,在片段兩端連接接頭序列,篩選去除接頭序列自連片段,而后采用瓊脂糖凝膠電泳進行片段的長度篩選,氫氧化鈉變性產生單鏈DNA片段,進行橋式PCR擴增。最后用Illumina Hiseq X Ten平臺進行雙末端PE 150測序,通過Skewer軟件(Version 0.2.2)過濾低質量數據后,得到的高質量數據用于后續(xù)的基因組大小、雜合度以及GC含量分析。
本實驗采用基于K-mer的分析方法估計人參基因組大小和雜合率,所得數據進行17-mer分析。假設從reads中逐堿基取出所有K-mer能夠遍歷整個基因組,且K-mer頻次分布服從泊松分布,即可從所有測序reads中逐堿基取K-mer,統(tǒng)計K-mer頻數分布,然后以K-mer及其出現(xiàn)的次數為橫坐標,以出現(xiàn)次數的片段總數占總片段的百分比為縱坐標作圖,計算獲得K-mer深度估計值,用于估計基因組大小。
本研究選用模式生物擬南芥基因組序列進行人參基因組雜合率評估。分別加入雜合率為1%,0.5%和0.1%的模擬數據進行擬合,將所得模擬數據分別進行17-mer分析。通過所測物種真實曲線的主峰和雜合峰與模擬數據線的對比,可判斷所測物種雜合率水平與最接近的模擬數據相近。
首先對水稻,大豆和人參進行單獨測定,比較分析了待測樣品水稻與大豆、大豆與人參、水稻大豆與人參測定的結果,確定了水稻、大豆與人參的基因組測定峰無重疊,保證了選取水稻和大豆作為內參的可靠性,可用于預測基因組大?。▓D1)。由表1可以看出,通過比較其峰均值,大豆基因組為水稻的2.25倍,由此預估得到大豆的基因組大小為0.89±0.02 Gb,其DNA相對含量為1.82±0.03 pg;人參基因組大小是大豆的3.71倍(表2),因此可得人參基因組大小為3.32±0.02 Gb,其DNA相對含量為6.79±0.05 pg。另外,水稻、大豆和人參峰均值進行比較,大豆基因組大小是水稻的2.40倍,人參是大豆的3.58倍(表3),由此可估測大豆基因組大小為0.95±0.01 Gb,相對DNA含量為1.95±0.02 pg,人參基因組大小為3.42±0.02 Gb,相對DNA含量為6.98±0.05 pg。
圖1 水稻、大豆,人參流式細胞儀測定結果
表1 流式細胞儀測定的樣品(大豆)和內參(水稻)峰均值
表2 流式細胞儀測定的樣品(人參)和內參(大豆)峰均值
表3 流式細胞儀測定的樣品(大豆,人參)和內參(水稻)峰均值
3.2.1 測序數據量統(tǒng)計
如表4所示,經高通量測序得到的原始數據為191.41 Gb,按照流式細胞所得人參基因組大小為3.42 Gb計算測序深度為55.97 X。過濾掉低質量數據后,得到的總數據量為183.82 Gb,測序深度為53.75 X。
3.2.2 17-mer分析和基因組大小預測
使用人參基因組過濾后有183.82 Gb的數據用于17-mer分析,Reads形成17-mer頻率深度分布圖,如圖2。橫、縱坐標分別表示17-mer出現(xiàn)的次數和出現(xiàn)的頻率。圖中在49 X深度和100 X深度位置分別有一個峰,其中49 X的位置為主峰,即基因組正常期望深度,100 X位置為重復峰位置。從表5可以看出,K-mer的總數為163927.97,可以通過公式:基因組大小=K-mer的總數/K-mer的期望深度,計算得到的人參基因組大小為3.35 Gb。
3.2.3 雜合率估計
選用擬南芥基因組作為訓練序列集,模擬1%,0.5%和0.1%雜合程度情況下17-mer的分布曲線,從而對人參的雜合度進行定性評估。由圖3研究結果可知,人參的雜合度與雜合度為0.1%的擬南芥模擬數據最接近,因此,可以認為人參的雜合率處于0.1%左右,其基因組雜合度較低。
流式細胞術是應用較多的基因組預測方法,已被成功的應用于五節(jié)芒[7]、毛竹[14]、山櫻花[15]等植物的基因組大小研究上,在樣品處理上,要求被檢測的植物樣本必須是完整的單細胞或細胞核懸液,因此,實驗操作中取材上優(yōu)先選取新鮮葉片或幼嫩葉片,置于冰上并充分切碎。高通量測序技術的迅速發(fā)展使其成為基因組評估的重要手段,利用K-mer分析的方法對基因組進行預估,其操作較為簡單,而且獲得除基因組外更多的物種信息,如物種的雜合率、重復序列、GC含量等[16]。然而,流式細胞儀在檢測植物樣品時由于植物細胞結構及次生代謝產物的影響,會對檢測結果造成一定的干擾[17]。高通量測序技術用于預測植物基因組大小,克服了內源性物質對植物基因組大小評估的影響[16,18]。因此對植物基因組大小的預測選取流式細胞術和K-mer分析相結合,以期獲得更好的結果。
本研究采用流式細胞術和K-mer分析的方法得到人參基因組大小分別為3.42 Gb和3.35 Gb?;蚪M雜合度評估顯示人參基因組有較低的雜合度,雜合率約為0.1%;但重復序列較高,因此對人參進行全基因組組裝,可使用BAC-by-BAC策略以及構建大片段文庫,跨越重復區(qū)。本研究結果有助于人參全基因組的de novo組裝和功能基因注釋等本草基因組學的研究。
表4 人參基因組數據量統(tǒng)計
圖2 17-mer分布曲線
圖3 17-mer雜合率估計圖
表5 17-mer分析數據統(tǒng)計
1 陳士林,宋經元.本草基因組學.中國中藥雜志,2016,21(41):3881-3889.
2 Chen S L,Song J Y,Sun C,et al.Herbal genomics:examining the biology of traditional medicines.Science,2015,347(6219):S27-S29.
4 Huang Z H,Xu J,Xiao S M,et al.Comparative optical genome analysis of two pangolin species:Manis pentadactyla and Manis javanica.Gigascience,2016,5(1):1-5.
5 王亞之,李秋實,陳士林,等.基于流式細胞分析技術的茯苓基因組大小測定.世界科學技術-中醫(yī)藥現(xiàn)代化,2010,12(3):452-456.
6 李秋實,徐江,朱英杰,等.基于流式細胞技術的靈芝基因組大小估測.菌物學報,2013,32(5):899-906.
7 鄧果特,劉清波,蔣建雄,等.五節(jié)芒基因組大小測定.植物遺傳資源學報,2013,14(2):339-341.
8 Chen S L,Xu J,Liu C,et al.Genome sequence of the model medicinal mushroom Ganoderma lucidum.Nat Commu,2012,3(2):913-921.
9 Xu H B,Song J Y,Luo H M,et al.Analysis of the Genome Sequence of the Medicinal Plant Salvia miltiorrhiza.Mol Plant,2016,9(6):949-952.
10 Dolezel J,Greilhuber J,Suda J.Estimation of nuclear DNA content in plants using flow cytometry.Nat Protoc,2007,2(9):2233-2244.
11 Miyashita T,Araki H,Hoshino Y.Ploidy distribution and DNA content variations of Lonicera caerulea(caprifoliaceae)in Japan.J Plant Res,2011,124(1):1-9.
12 Obidiegwu J,Rodriguez E,Eneobong E.Ploidy levels ofDioscorea alataL.germplasm determined by flow cytometry.Genet Resour Crop Evol,2010,57(3):351-356.
13 Bennett M D,Leitch I J.Genome Size Evolution in Plants.The evolution of the genome,2005:89-162.
14李潞濱,武靜宇,胡陶,等.毛竹基因組大小測定.植物學報,2008,25(5):574-578.
15李禎,伊賢貴,顧宇,等.山櫻花基因組大小的測定.南京林業(yè)大學學報(自然科學版),2014,38(S1):17-19.
16唐其,馬小軍,莫長明,等.羅漢果全基因組Survey分析.廣西植物,2015,35(6):786-791.
17汪艷,肖媛,劉偉,等.流式細胞儀檢測高等植物細胞核DNA含量的方法.植物科學學報,2015,33(1):126-131.
18 Zhang T Z,Hu Y,Jiang W K,et al.Sequencing of allotetraploid cotton(Gossypium hirsutumL.acc.TM-1)provides a resource for fiber improvement.Nat Biotechnol,2015,33(5):531-537.