,,,,
(1.浙江省林業(yè)科學(xué)研究院,浙江 杭州 310023;2.森林食品資源利用與質(zhì)量控制國(guó)家林業(yè)局重點(diǎn)實(shí)驗(yàn)室,浙江 杭州 310023)
薄殼山核桃Carya illinoinensis(Wangenh.) K.Koch是胡桃科山核桃屬植物,因其性狀優(yōu)良和核仁營(yíng)養(yǎng)價(jià)值高,在世界五大洲被廣泛引種栽培,是重要的世界性干果和油料作物[1-2]。薄殼山核桃是雌雄同株的風(fēng)媒花異交植物,按照雌雄花成熟期的先后,大致可分為雄先型和雌先型2 種類型[3]。不同品種在不同氣候條件下會(huì)存在花期不遇的問(wèn)題,這是影響薄殼山核桃穩(wěn)產(chǎn)和高產(chǎn)的重要原因之一。美國(guó)是薄殼山核桃的原產(chǎn)地之一,目前也是薄殼山核桃的中心產(chǎn)區(qū),其產(chǎn)量占全球產(chǎn)量的85%以上。美國(guó)現(xiàn)有1 000 多品種,在建園時(shí)往往可以根據(jù)當(dāng)?shù)氐臍夂蛱攸c(diǎn)進(jìn)行有效的雜交配置,壯年林干果產(chǎn)量可達(dá)1 500 kg/hm2以上。雖然我國(guó)引種薄殼山核桃已有100 多年的歷史,但是目前生產(chǎn)上常用的品種僅幾十個(gè)。多年的生產(chǎn)實(shí)踐結(jié)果證明我國(guó)不少地區(qū)是薄殼山核桃的適生區(qū),但是較多薄殼山核桃產(chǎn)區(qū)面臨產(chǎn)量低下和產(chǎn)量不穩(wěn)定的問(wèn)題,尤其是廣大亞熱帶地區(qū)。造成這一現(xiàn)象的原因有多個(gè)方面,比如實(shí)際使用的品種較為有限,再加上引種時(shí)存在錯(cuò)誤以及一些雜交后代定名混亂,難以進(jìn)行有效的親本選擇和親緣關(guān)系分析,更難以根據(jù)當(dāng)?shù)氐臍夂蛱攸c(diǎn)進(jìn)行有效的雜交配置。
目前,用于薄殼山核桃品種鑒定的分子標(biāo)記方法主要有RAPD[4-5]、SSR[6-9]、SRAP[10]、ISSR[11-12]和SNP[13]等。一般來(lái)說(shuō),SSR 和SNP 等標(biāo)記須進(jìn)行大量基因組或轉(zhuǎn)錄組的測(cè)序和分析[13-14],得到穩(wěn)定性和多態(tài)性較好的標(biāo)記的成本較高。在利用SSR引物對(duì)薄殼山核桃進(jìn)行品種鑒定時(shí),重復(fù)性檢測(cè)中也存在一些問(wèn)題[7],這主要是因?yàn)椋阂环矫姹ど胶颂腋叨入s合,基因組大且有較多重復(fù),導(dǎo)致SSR 引物存在一定的非特異性;另一方面,SSR 和SNP 這類標(biāo)記對(duì)檢測(cè)的要求較高,且檢測(cè)識(shí)別時(shí)存在一定的人為干擾。隨著測(cè)序技術(shù)的進(jìn)步以及越來(lái)越多的薄殼山核桃基因組數(shù)據(jù)的公布,利用品種間基因組數(shù)據(jù)的差異挖掘序列特異性標(biāo)記(sequence characterized amplified region,SCAR)是一個(gè)提高分子標(biāo)記的穩(wěn)定性和特異性的辦法。本研究中通過(guò)對(duì)不同薄殼山核桃品種葉片DNA 進(jìn)行簡(jiǎn)單基因組測(cè)序,尋找品種特異性的SCAR 標(biāo)記,旨在針對(duì)生產(chǎn)上常用品種從分子水平上開(kāi)發(fā)出穩(wěn)定、特異的DNA 指紋標(biāo)記,為輔助實(shí)現(xiàn)薄殼山核桃品種準(zhǔn)確快速鑒定和親緣關(guān)系分析提供參考。
薄殼山核桃樣品采集于建德薄殼山核桃基地,地理位置為119°32.86′E、29°33.76′N,海拔97.5 m。5月上旬,采摘植株新鮮嫩葉,冰浴運(yùn)輸,當(dāng)天保存于-20 ℃冰箱中備用。所涉及的品種見(jiàn)表1。其中,Ind23 和Ind24 為不同來(lái)源的同一品種,Ind23 為20 世紀(jì)80年代從美國(guó)德克薩斯州美國(guó)山核桃試驗(yàn)站引進(jìn),Ind24 為1999年從美國(guó)國(guó)家無(wú)性系種質(zhì)資源庫(kù)(National Clonal Germplasm Repository)引進(jìn)。“雄先”和“雌先”的判斷是根據(jù)不同性別花剛開(kāi)始成熟的時(shí)間,雄花是指花粉開(kāi)始散粉,雌花是指柱頭出現(xiàn)可授粉狀態(tài)[3]。
表1 薄殼山核桃試驗(yàn)品種及其生理特點(diǎn)Table 1 Experimental varieties and physiological characteristics of C.illinoensis
1.2.1 DNA 提取
葉片DNA 的提取采用新型快速植物基因組DNA 提取試劑盒(BioTeke,北京)。取各品種葉片樣品0.02 ~0.03 g,剪碎后放入2.0 mL 離心管內(nèi),加入直徑3 mm 碳化鎢研磨珠2 顆,用液氮冰凍5 ~10 min,再用MM400 研磨儀(萊馳,德國(guó))30 Hz 研磨2 min,然后按照試劑盒說(shuō)明書(shū)操作。提取好的DNA 經(jīng)1.0%的瓊脂糖凝膠電泳檢測(cè)完整性,然后用NanoDrop2000 超微量分光光度計(jì)檢測(cè)其質(zhì)量濃度,置于-20 ℃冰箱備用,使用前將DNA 質(zhì)量濃度稀釋標(biāo)定至20 ng/μL。
1.2.2 簡(jiǎn)化基因組測(cè)序和分析
簡(jiǎn)化基因組測(cè)序是基于RAD(restriction-siteassociated DNA sequencing)方法進(jìn)行的。具體步驟:提取高質(zhì)量DNA,使用多種限制性內(nèi)切酶對(duì)DNA樣品分別進(jìn)行酶切,根據(jù)酶切試驗(yàn)的結(jié)果選擇合適的酶,構(gòu)建長(zhǎng)度為300 ~500 bp 的pair-end 文庫(kù),用Illumina HiSeq PE150 測(cè)序文庫(kù),獲得每種樣品的簡(jiǎn)化基因組原始數(shù)據(jù)。
后續(xù)分析方法:1)對(duì)每種樣品中的Reads1(雙端PE 測(cè)序后前端的數(shù)據(jù),即含有EcoRI 酶切位點(diǎn)AATTC 的片段)進(jìn)行比對(duì)聚類;2)對(duì)每種樣品的序列聚類結(jié)果進(jìn)行內(nèi)部比對(duì),得到樣品內(nèi)部各序列位點(diǎn)信息;3)將不同樣品的序列互相進(jìn)行比對(duì),尋找個(gè)體之間堿基差異信息,并根據(jù)樣品信息尋找亞群特異的序列位點(diǎn);4)根據(jù)特異序列信息獲得雙端數(shù)據(jù)進(jìn)行組裝,得到亞群特異的基因組片段。
具體組裝方法:1)使用cap3 軟件(http://seq.cs.iastate.edu/cap3.html)將Reads1 與Reads2 進(jìn) 行局部組裝;將特異Taq(unique Tag)與最長(zhǎng)的組裝結(jié)果進(jìn)行連接(中間加入5 個(gè)“N”),獲得初步組裝結(jié)果;2)將某一樣品獲得的組裝Tag 與其他樣品的序列進(jìn)行blastn 比對(duì),過(guò)濾掉相似序列,比對(duì)使用的軟件為blastn,參數(shù)e-value 為1×10-5。另外,在設(shè)計(jì)引物前,為了增加引物擴(kuò)增的有效率,使 用MISA(http://pgrc.ipk-gatersleben.de/misa/)對(duì)組裝結(jié)果進(jìn)行SSR 預(yù)測(cè),剔除含有SSR 的組裝結(jié)果。
使用Vector NTI 9.0 軟件設(shè)計(jì)引物,各樣品特異片段的引物設(shè)計(jì)原則:引物長(zhǎng)度18 ~22 bp,解鏈溫度56 ~62 ℃,產(chǎn)物長(zhǎng)度150 ~300 bp。
1.2.3 SCAR 標(biāo)記開(kāi)發(fā)
對(duì)使用上述引物預(yù)測(cè)的片段進(jìn)一步開(kāi)展blast分析,挑選出與核桃(Juglans regia,現(xiàn)有全基因組數(shù)據(jù)中與薄殼山核桃最近物種)同源性最高的DNA 序列片段,作為后續(xù)SCAR 標(biāo)記開(kāi)發(fā)的候選序列。對(duì)這些序列進(jìn)行PCR 篩選,挑選出23 個(gè)品種中存在多態(tài)性的DNA 條帶,切膠回收純化這些條帶,并利用PCR 引物進(jìn)行兩端測(cè)序,測(cè)序結(jié)果經(jīng)Vector NTI 9.0 軟件中的ContigExpress 拼接,將重測(cè)序得到的序列與之前的基因組測(cè)序數(shù)據(jù)進(jìn)行比對(duì),補(bǔ)充這些序列中間的未知堿基(這些堿基之前以“NNN”表示),將得到的完整序列作為新的SCAR 標(biāo)記。
1.2.4 PCR 篩選
常規(guī)PCR 試驗(yàn)所用試劑為BioTeke PCR MasterMix(BioTeke,北京),整個(gè)反應(yīng)體系除引物和模板外,均按照試劑手冊(cè)要求操作。在15 μL體系中,引物用量為上游和下游引物(10 μmol/L)各0.6 μL,模板為2 μL。用于直接測(cè)序前,反應(yīng)體系擴(kuò)大到60 μL,模板為前面15 μL 產(chǎn)物稀釋1 000 倍?;旌隙鄬?duì)引物進(jìn)行PCR 反應(yīng)時(shí),適當(dāng)調(diào)整每對(duì)引物的量,至最佳擴(kuò)增效果,其他條件不變。所有PCR 反應(yīng)在Genepro Thermal Cycle(Bioer,杭州)PCR 儀上進(jìn)行,程序:94 ℃ 300 s,95 ℃ 10 s,56 ℃ 50 s,72 ℃ 40 s,共35 輪循環(huán);72 ℃,300 s。擴(kuò)增產(chǎn)物經(jīng)1.5%瓊脂糖凝膠電泳檢測(cè),排槍上樣各5 μL,泳道順序?qū)?yīng)樣品分別是Ind01,Ind13,Ind02,Ind14……。Marker為DL2000(Takara),條帶大小依次為2 000、1 000、750、500、250、100 bp,上樣量3 μL。EB染色和ChemiDoc(Biorad,北京)拍照。
1.2.5 親緣關(guān)系分析
在各品種中,所篩選較為穩(wěn)定的SCAR 標(biāo)記的有無(wú),分別以“1”“0”進(jìn)行記錄,然后使用NTSYS 2.2 軟件建立聚類分支樹(shù)狀圖。首先用similarity 程序組中的SimQual 計(jì)算形似系數(shù)矩陣,然后使用Clustering 程序組中的SHAN 進(jìn)行計(jì)算,聚類方法選用UPGMA,其他參數(shù)按默認(rèn)設(shè)置。
選取性狀差異較大的5 個(gè)品種的樣品進(jìn)行Illumina HiSeq PE150 測(cè)序,分別是Moore、Nacono、Van Deman、Davis 和Pawnee,測(cè)序結(jié)果見(jiàn)表2。一般情況下A 與T 數(shù)量相等,C 與G 數(shù)量相等,(A+T)/(C+G)的值則具有物種特異性。從表2可知,由于該簡(jiǎn)化基因組文庫(kù)是對(duì)酶切片段附近的序列進(jìn)行測(cè)序,所以堿基并不平衡,且頭部5 個(gè)堿基為固定的“AATTC”序列,薄殼山核桃(A+T)/(C+G)的值約為1.63。從堿基長(zhǎng)度質(zhì)量指標(biāo)Q20%和Q30%來(lái)看,該文庫(kù)堿基質(zhì)量良好,可用于后續(xù)分析。
表2 性狀差異較大的5 個(gè)薄殼山核桃品種樣品的高通量測(cè)序結(jié)果Table 2 Deep sequencing results of five C.illinoensis cultivars with different characteristics
測(cè)得的數(shù)據(jù)經(jīng)初步組裝、blast 分析、精確組裝和比較,得到各品種的特異序列。其中Ind23 特異序列數(shù)量最多,達(dá)1 080 條,而Ind03 最少,僅為553 條。分析這些片段的二級(jí)結(jié)構(gòu)、二聚體形成和堿基分布等,設(shè)計(jì)了1 133 對(duì)引物(表3)。再結(jié)合擴(kuò)增產(chǎn)物與核桃基因組序列的同源性,挑選其中473 對(duì)作為最終候選引物。
表3 性狀差異較大的5 個(gè)薄殼山核桃品種特征序列和引物搜索Table 3 Searching for characteristic sequences and primers of five C.illinoensis cultivars with different characteristics
PCR 篩選結(jié)果表明,絕大部分條帶在各品種間無(wú)差異,僅86 對(duì)引物在23 個(gè)品種中產(chǎn)生多態(tài)性,約占引物數(shù)量的1/5,其中80 對(duì)單一條帶可用于后續(xù)分析(圖1)。
圖1 80 對(duì)SCAR 引物在23 個(gè)薄殼山核桃品種中的多態(tài)性分布Fig.1 The polymorphism distribution of 80 SCAR markers among 23 cultivars
所開(kāi)發(fā)SCAR 標(biāo)記,大多數(shù)在多個(gè)品種中僅產(chǎn)生1 個(gè)條帶,其中有極少數(shù)可以特異性指示單一品種(圖2)。但是,也有少量引物在各品種中產(chǎn)生的條帶數(shù)量存在差異(圖3),這些較為復(fù)雜的多態(tài)性有待深入研究。將產(chǎn)生多態(tài)性的這些單一條帶進(jìn)行組合,獲得一系列可用于品種鑒定的引物組合(表4),這些引物的具體信息見(jiàn)表5。
圖2 薄殼山核桃品種特異性SCAR 標(biāo)記引物對(duì)及單一條帶Fig.2 Cultivar-specific primer pairs and their unique bands of SCAR markers
圖3 薄殼山核桃某些SCAR 標(biāo)記引物的多態(tài)性Fig.3 Polymorphism of some scar markers in C.illinoensis
利用80 對(duì)引物在各品種間的多態(tài)性,進(jìn)行24個(gè)薄殼山核桃品種的聚類分析,結(jié)果如圖4所示。由圖4可見(jiàn),聚類結(jié)果與實(shí)際的親緣關(guān)系有部分一致性,但也存在不一致的地方。例如,來(lái)自不同產(chǎn)地的Ind23 和Ind24 同為Pawnee 品種,聚在一起;Ind07(Choctaw)是Success×Mahan 的后代,Ind13(Dependable)是Jewett×Success 的后代,二者聚在一起,可能與其有較近的親緣關(guān)系有關(guān);Ind10(Barton)是Moore×Success 的后代,與Ind01(Moore)聚在一起。但是,Ind04(Forkert)是Success×Schley 的雜交后代,Ind07(Choctaw)是Success×Mahan 的雜交后代,同為Success 的雜交后代,二者在聚類關(guān)系上卻相差較遠(yuǎn),這可能是其遺傳組合的不同造成的,也可能是因?yàn)樗Y選SCAR 標(biāo)記較為有限,在分析親緣關(guān)系方面尚存在一定的局限性。
因?yàn)榉肿訕?biāo)記能夠從DNA 水平反映品種遺傳的本質(zhì),成為品種鑒定最為重要的依據(jù)之一。然而,因?yàn)槠贩N之間的遺傳差異較小,挖掘其多態(tài)性位點(diǎn)較為困難,特別是獲得穩(wěn)定的序列特異性標(biāo)記更為不易。利用簡(jiǎn)單基因組測(cè)序可以獲得大量的差異位點(diǎn)。薄殼山核桃品種繁多,本研究中通過(guò)對(duì)大量基因組測(cè)序數(shù)據(jù)的分析,再加上PCR的反復(fù)驗(yàn)證,獲得了一批可用于薄殼山核桃品種鑒定的SCAR 標(biāo)記。雖然后續(xù)PCR 篩選的工作量較大,但SCAR 標(biāo)記有其明顯的優(yōu)點(diǎn),比如可以通過(guò)普通的PCR 檢測(cè)條帶的有無(wú),使用成本較低。研究結(jié)果也表明,400 多對(duì)引物擴(kuò)增率雖然較高,但多態(tài)性比例并不高,因?yàn)檫@種簡(jiǎn)單基因組測(cè)序是通過(guò)酶切后進(jìn)行的,測(cè)序的信息主要來(lái)源于酶切位點(diǎn)附近,如果品種的差異點(diǎn)正好出現(xiàn)在酶切位點(diǎn)上,那么測(cè)序就會(huì)出現(xiàn)差異條帶,但事實(shí)上由此設(shè)計(jì)的引物能在所有品種中擴(kuò)增出相似的條帶,這也是該方法的局限性造成的。同時(shí),也可以利用簡(jiǎn)單基因組測(cè)序獲得大量的SNP 位點(diǎn),研究初期由于參考了核桃基因組數(shù)據(jù),未能得到可靠的SNP 數(shù)據(jù)。因此,現(xiàn)有這些測(cè)序數(shù)據(jù)有進(jìn)一步挖掘的潛力,比如利用薄殼山核桃品種87MX3-2.11 作為參考基因組[15],后續(xù)將進(jìn)一步分析SNP 位點(diǎn)。
表4 用于薄殼山核桃品種鑒定的特異SCAR 標(biāo)記組合舉例Table 4 The combination of specific SCAR markers for identification of pecan cultivars
表5 用于薄殼山核桃品種鑒定的特異SCAR 標(biāo)記引物的具體信息Table 5 Detailed information of primers with specific SCAR markers for identification of pecan cultivars
續(xù)表5Continuation of Table 5
但是,PCR 擴(kuò)增有時(shí)會(huì)出現(xiàn)一定的假陽(yáng)性,SCAR 引物也不例外,有時(shí)條帶較弱,經(jīng)多次重復(fù)才能擴(kuò)增。其關(guān)鍵是提取DNA 的質(zhì)量以及DNA的分裝等問(wèn)題。DNA 提取方式是影響DNA 質(zhì)量的重要因素,SSR 標(biāo)記的擴(kuò)增也是如此[16]。DNA的分裝也會(huì)影響標(biāo)記擴(kuò)增的穩(wěn)定性。通常情況下,較高濃度的DNA 須稀釋后用于后續(xù)的擴(kuò)增,而稀釋后經(jīng)常會(huì)面臨分裝的問(wèn)題,由于DNA 是大分子,分裝會(huì)帶來(lái)分配不均的問(wèn)題,有時(shí)會(huì)影響到試驗(yàn)的重復(fù)性。而這一問(wèn)題經(jīng)常被研究人員忽視。通過(guò)定量PCR 試驗(yàn)證實(shí),如果未較好地進(jìn)行分裝,那么即使是同一初始模板和同一引物分裝在不同PCR 管中也會(huì)有一定的擴(kuò)增差異。因此在分裝DNA 樣品時(shí),應(yīng)進(jìn)行必要的均質(zhì)化,如超聲波震蕩等,對(duì)標(biāo)記擴(kuò)增的一致性有重要的作用。另外,擴(kuò)增片段的大小也有重要影響,小片段更容易獲得具有一致性的擴(kuò)增結(jié)果。就鑒定的方便程度來(lái)說(shuō),可以通過(guò)大小片段的組合進(jìn)行混合引物PCR,但為了取得較為穩(wěn)定的檢測(cè)結(jié)果,應(yīng)測(cè)試各引物的不同濃度組合[17]。另外,在本研究中有些引物能產(chǎn)生多條特異性片段,其在品種鑒定中可能具有獨(dú)特的價(jià)值,但是鑒于其多態(tài)性較為復(fù)雜,本研究中暫未考慮,這些位點(diǎn)有待深入研究。
圖4 基于80 對(duì)引物的24 個(gè)薄殼山核桃樣品的聚類結(jié)果Fig.4 Cluster analysis of 24 C.illinoensis samples based on 80 pairs of primers
利用分子標(biāo)記進(jìn)行聚類分析,有助于分析品種間的親緣關(guān)系,對(duì)于后續(xù)的雜交親本選育具有重要意義。本研究中利用分離到的80 個(gè)SCAR 標(biāo)記對(duì)現(xiàn)有24 種樣品進(jìn)行分析,因?yàn)闃?biāo)記數(shù)量不夠多等原因,其結(jié)果存在與現(xiàn)有親緣關(guān)系不一致的問(wèn)題,而來(lái)自薄殼山核桃品種園的雜交品種較多,后續(xù)將采集更多的品種進(jìn)行類似的遺傳分析。