董 婧 逯曉萍,* 張坤明 薛春雷 張瑞霞
?
高丹草雜種及其親本轉(zhuǎn)錄組SNP及等位基因特異性表達(dá)分析
董 婧1逯曉萍1,*張坤明1薛春雷1張瑞霞2
1內(nèi)蒙古農(nóng)業(yè)大學(xué)農(nóng)學(xué)院, 內(nèi)蒙古呼和浩特 010019;2呼和浩特市種子管理站, 內(nèi)蒙古呼和浩特 010020
為探究高丹草雜種及其親本間單核苷酸變異與其雜種優(yōu)勢(shì)形成的關(guān)系, 以高丹草雜種及其親本的根、莖和葉組織為試驗(yàn)材料, 采用Illumina Hiseq 2000進(jìn)行轉(zhuǎn)錄組測(cè)序。對(duì)平均長(zhǎng)度達(dá)58 122 160 bp的各測(cè)序樣品序列信息進(jìn)行檢測(cè)后, 均檢測(cè)到不少于58 000個(gè)SNP位點(diǎn), 位于基因內(nèi)的SNP個(gè)數(shù)顯著多于位于基因間的SNP個(gè)數(shù), SNP發(fā)生頻率為1/741 bp, 平均轉(zhuǎn)換顛換比為1.00∶1.53。在所有變異類型中, C/T和G/A發(fā)生頻率最高。經(jīng)過篩選得到198 (21%)個(gè)極顯著偏向性等位基因表達(dá)偏向性SNP, 其中65%偏向父本白殼蘇丹草, 并且很多在白殼蘇丹草中具有高水平基因表達(dá)的轉(zhuǎn)錄本, 在高丹草雜種中的等位基因表達(dá)也偏向白殼蘇丹草。在3種組織中, 分別有79%、78%和82%轉(zhuǎn)錄本的2個(gè)親本等位基因表現(xiàn)出相對(duì)平衡的表達(dá)水平, 說明與順式作用相比, 反式作用可能更多地影響了等位基因的特異性表達(dá)。選擇6個(gè)極顯著偏向性等位基因表達(dá)偏向性SNP-unigene進(jìn)行qRT-PCR驗(yàn)證, 這些基因的差異基因表達(dá)模式與RNA-Seq分析結(jié)果一致。本研究采用Illumina 測(cè)序技術(shù)研究等位基因表達(dá), 為高丹草雜種優(yōu)勢(shì)分析提供了依據(jù), 也為其他飼草作物的相關(guān)研究提供了理論參考。
高丹草; 雜種優(yōu)勢(shì); 轉(zhuǎn)錄組; 單核苷酸多態(tài)性; 功能注釋
高粱()是一種古老的禾谷類作物, 具有抗旱、耐澇、耐鹽堿、適應(yīng)性強(qiáng)等特點(diǎn), 蘇丹草()是栽培最普遍的一年生禾本科牧草, 具有高度的適應(yīng)性、很強(qiáng)的再生性和抗旱能力, 其莖葉品質(zhì)優(yōu)良[1]。高丹草是高粱-蘇丹草雜交種的簡(jiǎn)稱, 它結(jié)合了高粱和蘇丹草的優(yōu)點(diǎn), 在畜牧業(yè)和漁業(yè)生產(chǎn)上具有廣闊的開發(fā)利用前景[2]。這種優(yōu)良的農(nóng)藝性狀表現(xiàn)可能是由2個(gè)親本基因組互作造成的, 但是具體的遺傳機(jī)制尚不清楚。
雜交是自然界中普遍存在的現(xiàn)象, 不僅可以對(duì)物種形成、適應(yīng)性進(jìn)化和生態(tài)創(chuàng)新產(chǎn)生重要作用, 而且可能出現(xiàn)大量的等位基因變異[3-7]。有研究表明, 融合這些等位基因變異可能導(dǎo)致新的基因行為方式的出現(xiàn), 從而產(chǎn)生雜種優(yōu)勢(shì)[8-11]。但是, 以往對(duì)于雜種優(yōu)勢(shì)機(jī)理的研究只針對(duì)雜種及親本基因的表達(dá)水平, 而對(duì)雜種中不同親本等位基因差異表達(dá)的研究較少。
SNP (single nucleotide polymorphisms)是指在基因組上由單個(gè)核苷酸變異形成的遺傳標(biāo)記, 其數(shù)量龐大[12]。通常雜交種中的等位基因特異性表達(dá)的研究方法有2種[13], 一是基于標(biāo)記多態(tài)性, 利用已知基因組變異獲得高質(zhì)量的等位基因表達(dá)結(jié)果[14-15]; 另外一種是利用SNP芯片同時(shí)獲得上萬個(gè)等位基因特異性表達(dá)位點(diǎn)[16-17]。然而, 這兩種方法都必須提前知道研究對(duì)象的基因組信息。隨著第二代高通量測(cè)序技術(shù)的發(fā)展, RNA-Seq技術(shù)逐漸被人們所熟悉并應(yīng)用到等位基因特異性表達(dá)的研究中[18]。RNA-Seq技術(shù)無須預(yù)知研究對(duì)象的基因組信息并且分辨率能夠達(dá)到單堿基水平。應(yīng)用這個(gè)方法能夠從全基因組水平無偏估計(jì)基因的調(diào)控, 而且能同時(shí)獲得轉(zhuǎn)錄豐度和等位基因表達(dá)偏向性的信息[19]。
本研究在高丹草遺傳圖譜構(gòu)建、產(chǎn)量性狀QTL定位、雜種表現(xiàn)遺傳模型以及差異表達(dá)基因分析與蛋白質(zhì)組學(xué)等[2,20-23]研究的基礎(chǔ)上, 比較和分析高丹草雜種中2個(gè)親本等位基因的特異性表達(dá), 旨在了解雜交種中雙親等位基因的不同作用以及可能對(duì)雜種優(yōu)勢(shì)的貢獻(xiàn), 進(jìn)一步闡明高丹草雜種優(yōu)勢(shì)的分子機(jī)制, 為高丹草雜種的遺傳改良提供依據(jù)。
以高丹草雜種(11A×白殼蘇丹草)一代、母本高粱11A和父本白殼蘇丹草的根、莖、葉為試材, 設(shè)置3個(gè)生物學(xué)重復(fù)(表1)。在三葉期, 分別取高丹草雜種及其親本的根、莖、葉樣品, 立即投入液氮冷凍, 于-80℃保存?zhèn)溆谩?/p>
利用TRIzol法提取高丹草雜種及其親本各組織的總RNA, 構(gòu)建高質(zhì)量文庫(kù)后, 使用Illumina Hiseq 2000測(cè)序儀測(cè)序。由于高丹草和蘇丹草均尚未完成基因組測(cè)序, 所以使用親本之中已完成基因組測(cè)序的高粱基因組(ftp://ftp.jgi-psf.org/pub/compgen/phy-t- o-z-o-m-e/v9.0/early_release/Sbicolor_v2.1/)作為參考進(jìn)行后續(xù)分析。利用TopHat 2[24]軟件在Clean Reads和高粱參考基因組之間比對(duì)。
表1 材料編號(hào)及名稱
在各樣品讀長(zhǎng)與參考基因組序列的TopHat2軟件比對(duì)數(shù)據(jù)的基礎(chǔ)上, 利用GATK軟件尋找測(cè)序樣品與參考基因組間的單堿基錯(cuò)配[25]。根據(jù)Nr注釋信息, 使用Blast 2 GO軟件[26]和WEGO (Web Gene Ont-o-l-o-gy Annotation Plot)軟件[27]得到unigene的GO (Gene Ontology)注釋信息和功能分類統(tǒng)計(jì)。利用蛋白數(shù)據(jù)庫(kù)KEGG (http://www.genome.jp/kegg/)進(jìn)一步得到unigene的pathway注釋[28]。通過blastx (e-value<10–5)將包含SNP位點(diǎn)的unigene比對(duì)到COG數(shù)據(jù)庫(kù), 從而獲得其COG分類注釋[29]。
本研究通過比較高丹草雜種及其親本3種組織所有同源基因測(cè)序讀長(zhǎng), 按照以下標(biāo)準(zhǔn)篩選單核苷酸多態(tài)性位點(diǎn): (1)所有SNP位點(diǎn)須在高丹草及其親本3種組織測(cè)序的3個(gè)重復(fù)中均出現(xiàn); (2)為確保等位基因特異性表達(dá)數(shù)據(jù)的可靠程度, 各SNP位點(diǎn)至少有300條reads的支持。在某SNP位點(diǎn), 兩親本reads中的堿基互不相同, 子代與親本之一堿基相同, 則認(rèn)為高丹草雜種中存在等位基因表達(dá)偏向性。符合上述標(biāo)準(zhǔn)的SNPs用于后續(xù)分析。如果雜交種中2個(gè)親本等位基因?qū)?yīng)的reads支持?jǐn)?shù)的比值偏離1.0, 則認(rèn)為雜交種中存在等位基因表達(dá)偏向性。采用卡方檢驗(yàn)方法統(tǒng)計(jì)分析。
從極顯著偏向性等位基因表達(dá)偏向性SNP- unigene中選擇6個(gè)基因進(jìn)行實(shí)時(shí)熒光定量PCR驗(yàn)證分析, 使用 E.Z.N.A.Plant RNA Maxi Kit抽提RNA。根據(jù)基因序列, 使用Primer Quest Tool (http:// sg.idtdna.com/ Primerquest/Home/Index)設(shè)計(jì)引物。第1鏈反轉(zhuǎn)錄使用PrimeScrip RT reagent Kit with gDNA Eraser (Perfect Real Time)第1鏈合成試劑(RR047A)。熒光定量檢測(cè)使用abmEva Green qPCR Master Mix-No Dye試劑盒。PCR反應(yīng)流程為95℃預(yù)變性1 min; 95℃變性10 s, 60℃退火30 s, 40個(gè)循環(huán)。以b-actin為內(nèi)參, 使用2–ΔΔCt法分析表達(dá)量。
根據(jù)堿基替換的不同方式, 可以將SNP位點(diǎn)分為轉(zhuǎn)換(Transition)和顛換(Transversion) 2種類型; 根據(jù)SNP位點(diǎn)的等位(Allele)數(shù)目, 可以將位點(diǎn)分為純合型(只有一個(gè)等位)和雜合型(兩個(gè)或多個(gè)等位)[30]。計(jì)算高丹草雜種及其親本中的SNP位點(diǎn)數(shù)目、轉(zhuǎn)換類型、顛換類型比例和雜合型SNP位點(diǎn)比例, 統(tǒng)計(jì)結(jié)果見表2。
表2 SNP位點(diǎn)統(tǒng)計(jì)表
(續(xù)表2)
材料編號(hào)Material number總讀長(zhǎng)Total readsSNP數(shù)SNP number基因內(nèi)SNPGenic SNP基因間SNPIntergenic SNP轉(zhuǎn)換Transition (%)顛換Transversion (%)雜合型Heterozygosity (%) 1759 733 16095 72389 741598260.1739.8333.54 1872 158 58081 26775 641562660.3439.6629.79 1978 016 50895 20587 506769960.5039.5036.17 2053 568 21882 07977 412466760.4739.5330.25 2149 779 34273 90569 659424660.7539.2530.17 2259 151 35689 06882 884618460.3639.6438.21 2350 348 06675 27670 970430660.2339.7736.31 2451 025 42472 97868 695428360.4839.5236.28 2555 095 66881 94576 448549760.7539.2531.16 2657 676 61287 67382 696497760.3739.6331.16 2761 078 42478 86474 174469060.7439.2630.43
材料名稱及編號(hào)同上表1。
Name and number of the material are the same as there given in Table 1.
對(duì)平均長(zhǎng)度達(dá)58 122 160 bp的序列, 各測(cè)序樣品中均檢測(cè)到不少于58 000個(gè)SNP位點(diǎn), 位于基因內(nèi)的SNP個(gè)數(shù)顯著多于位于基因間的SNP個(gè)數(shù)。高丹草雜種及其親本轉(zhuǎn)錄組SNP發(fā)生頻率為1/741 bp, 即平均每741 bp就有1個(gè)SNP位點(diǎn)出現(xiàn)。另外, 各樣品中轉(zhuǎn)換類型的SNP均占所有SNP數(shù)目的60%以上, 明顯多于顛換類型的SNP個(gè)數(shù), 平均轉(zhuǎn)換顛換比為1.00︰1.53 (表2)。
由圖1可知, 在所有12種單核苷酸變異類型中, 發(fā)生頻率最高的前4種分別是C/T、G/A、A/G和T/C, 均大于40 000個(gè), 而其他8種單核苷酸變異C/G、G/C、C/A、G/T、T/G、A/C、A/T和T/A均在20 000以下。12種變異類型中以C/T類型頻率最高, 原因可能是CpG二核苷酸上甲基化的胞嘧啶殘基易脫去氨基而轉(zhuǎn)化成胸腺嘧啶[31]。
圖1 SNP類型統(tǒng)計(jì)
將SNP-unigene序列與GenBank中的非冗余蛋白數(shù)據(jù)庫(kù)Nr數(shù)據(jù)庫(kù)進(jìn)行相似性比對(duì)。其中, 比對(duì)效率最高的有24 515條unigene (79.12%)與數(shù)據(jù)庫(kù)中已知的高粱基因同源; 3806條unigene (12.28%)與數(shù)據(jù)庫(kù)中已知的玉米基因組同源; 1435條unigene (4.63%)與數(shù)據(jù)庫(kù)中已知的谷子基因組同源(圖2)。
圖2 SNP-unigene Nr比對(duì)結(jié)果
括號(hào)內(nèi)為該類型unigene數(shù)及其在所有unigene中所占比例。
Unigene number of this type and its proportion in all unigene are shown in parentheses.
能夠在COG中找到10 328條unigene相應(yīng)的注釋信息, 共獲得15 799個(gè)COG功能注釋, 可分為24類(圖3中A~Z表示), 并對(duì)其進(jìn)行數(shù)量統(tǒng)計(jì)。從分析統(tǒng)計(jì)結(jié)果可以看出, 這10 328條被注釋的unigene功能種類較為全面, 涉及大多數(shù)生命活動(dòng)過程或功能?!耙话愎δ茴A(yù)測(cè)類”是最大的一個(gè)分類, 包含3099 (19.05%)個(gè)unigene。其次是“轉(zhuǎn)錄”、“復(fù)制、重組和修復(fù)”、“信號(hào)轉(zhuǎn)導(dǎo)機(jī)制”和“翻譯、核糖體結(jié)構(gòu)和生物轉(zhuǎn)化”分別包含1521 (9.63%)、1430 (9.05%)、1309 (8.29%)和1099 (6.96%)條SNP-unigene?!昂私Y(jié)構(gòu)”分類中包含2 (0.01%)條SNP-unigene, 數(shù)量最少(圖3)。
圖3 SNP-unigene COG比對(duì)結(jié)果
為了分析雜種中的等位基因特異性表達(dá), 比較得到注釋的轉(zhuǎn)錄本外顯子區(qū)域的每個(gè)堿基并鑒定SNP, 經(jīng)過篩選后, 將9308個(gè)SNP用于后續(xù)分析。在本研究中, 如果在一個(gè)轉(zhuǎn)錄本中同時(shí)存在多個(gè)SNP, 并且其中2個(gè)SNP的表達(dá)偏向性不同, 則將該轉(zhuǎn)錄本信息直接刪除。為了保證分析的準(zhǔn)確性和可靠性, 本試驗(yàn)只將表現(xiàn)極顯著偏向性(<0.01)的SNP用于后續(xù)分析。圖4所示是198個(gè)極顯著偏向性等位基因表達(dá)偏向性SNP在3種不同組織中的表達(dá)情況。
在親本基因差異表達(dá)對(duì)高丹草雜種中的等位基因特異性表達(dá)方式的影響分析中, 將父本白殼蘇丹草與母本高粱11A的基因表達(dá)比值命名為P1/P2, 高丹草雜種中的親本等位基因表達(dá)比值命名為F1/P2。結(jié)果表明, 很多在白殼蘇丹草中具有高水平基因表達(dá)的轉(zhuǎn)錄本, 在高丹草雜種中的等位基因表達(dá)也偏向白殼蘇丹草(圖5)。
圖4 等位基因表達(dá)偏向性SNP
在198個(gè)SNPs中, 根、莖、葉組織中分別有79個(gè)(涉及58個(gè)基因)、53個(gè)(涉及38個(gè)基因)和66個(gè)(涉及49個(gè)基因)單核苷酸多態(tài)性位點(diǎn)具有等位基因表達(dá)偏向性。其中, 有10個(gè)SNPs (涉及8個(gè)轉(zhuǎn)錄本)在根、莖、葉中均有表現(xiàn)(表3)。
圖5 高丹草雜種中等位基因表達(dá)偏向性
表3 10個(gè)等位基因表達(dá)偏向性SNPs
GO功能分析將Sobic.001G191200轉(zhuǎn)錄本定位到蔗糖響應(yīng)機(jī)制(response to sucrose)、葡萄糖響應(yīng)機(jī)制(response to glucose)、果糖響應(yīng)機(jī)制(response to fructose)功能; Sobic.001G293800轉(zhuǎn)錄本定位到蛋白質(zhì)磷酸化(protein phosphorylation)、ATP結(jié)合(ATP binding)、葉綠體(chloroplast)等32種功能; Sobic.002G215700轉(zhuǎn)錄本定位到干旱響應(yīng)機(jī)制(response to desiccation)、醛脫氫酶活性(aldehyde dehydrogenase, NAD)、胞液(cytosol)等17種功能; Sobic.003G085700轉(zhuǎn)錄本定位到RNA加工(RNA processing)、基因表達(dá)調(diào)控 (regulation of gene expression)和核腔(nuclear lumen)等7種功能; Sobic.003G206800轉(zhuǎn)錄本定位到脂肪酸β氧化(fatty acid beta-oxidation )、激酶活性(kinase activity)等12種功能; Sobic.003G314500轉(zhuǎn)錄本定位到水解酶活性(hydrolase activity)、葉綠體被膜(chloroplast envelope )、有機(jī)物質(zhì)代謝過程(organic substance metabolic process )等5種功能; Sobic.004G225100轉(zhuǎn)錄本定位到葉綠體(chloroplast)、吲哚乙酸生物合成過程(indoleacetic acid biosynthetic process )、氰化物代謝過程(cyanide metabolic process)等20種功能; Sobic.004G253000轉(zhuǎn)錄本定位到胞膜界小泡(cytoplasmic membrane-bounded vesicle)功能。
KEGG代謝通量分析發(fā)現(xiàn)Sobic.001G293800轉(zhuǎn)錄本參與b錄淀粉酶代謝通路; Sobic.002G215700轉(zhuǎn)錄本參與醛脫氫酶家族7成員A1代謝通路; Sobic. 004G225100轉(zhuǎn)錄本參與腈水解酶代謝通路; Sobic. 004G253000轉(zhuǎn)錄本參與FAM32A (A)蛋白代謝。
從198個(gè)等位基因表達(dá)偏向性SNPs中隨機(jī)選擇6個(gè)基因進(jìn)行qRT-PCR驗(yàn)證分析, 4個(gè)基因在3種組織中表現(xiàn)相同的偏向性, 2個(gè)基因在3種組織中表現(xiàn)不同的偏向性, 均與RNA-Seq分析結(jié)果一致(圖6)。
本研究表明, Illumina 雙端測(cè)序技術(shù)是同時(shí)分析雜交種中基因表達(dá)水平和等位基因表達(dá)方式的一個(gè)強(qiáng)有力工具, 為深入研究雜種優(yōu)勢(shì)的分子機(jī)制提供了有價(jià)值的信息。在高丹草雜種及其親本之間的SNP類型中, CT和GA為數(shù)量最多的類型。研究表明, 胞嘧啶甲基化可能是造成這種現(xiàn)象的原因[32], 發(fā)生甲基化的胞嘧啶比沒有發(fā)生甲基化的胞嘧啶突變頻率高, 而且甲基化的胞嘧啶發(fā)生脫氨基作用產(chǎn)生胸腺嘧啶T的頻率高于其他自發(fā)突變的頻率[33-35]。
本研究在根、莖和葉組織中的9308個(gè)等位基因表達(dá)偏向性一致的SNP中, 僅有198個(gè)存在極顯著的等位基因表達(dá)偏向性, 約占21%。He等[36]發(fā)現(xiàn)在日本晴93-11及其雜交種中有398 (22.7%)個(gè)存在顯著的等位基因表達(dá)偏向性。在玉米[37]和楊樹[38]的基因中, 分別有73%和57%的基因表現(xiàn)出等位基因表達(dá)偏向性。翟蓉蓉等[39]發(fā)現(xiàn)在超級(jí)稻協(xié)優(yōu)9308及其親本中有480 (17%)個(gè)存在顯著的等位基因表達(dá)偏向性。本研究中, 至少在一個(gè)組織存在等位基因表達(dá)偏向性的145個(gè)轉(zhuǎn)錄本中, 根、莖和葉分別有62% (36)、66% (26)和65% (32)的轉(zhuǎn)錄本的等位基因表達(dá)偏向白殼蘇丹草, 這些轉(zhuǎn)錄本編碼多種重要功能蛋白。在3種組織中, 與高粱11A的等位基因相比, 白殼蘇丹草的等位基因更能維持它們?cè)诟叩げ蓦s種中的活性, 并且對(duì)雜種優(yōu)勢(shì)做出貢獻(xiàn)。白殼蘇丹草等位基因的功能多樣性也可能對(duì)高丹草雜種的優(yōu)良表型起作用。在上述145個(gè)轉(zhuǎn)錄本中, 49個(gè)轉(zhuǎn)錄本(約34%)的等位基因表達(dá)在不同組織表現(xiàn)出不同的偏向性, 說明雜交種中的等位基因表達(dá)具有組織特異性[38, 40]。
圖6 高丹草雜種及其親本3個(gè)組織中各基因表達(dá)量
順式作用元件或反式作用因子變異均可能引起等位基因的表達(dá)變異[41]。前者可能改變啟動(dòng)子強(qiáng)度、增強(qiáng)子活性或轉(zhuǎn)錄穩(wěn)定性, 而后者可能影響結(jié)構(gòu)、連接和轉(zhuǎn)錄因子[42]。順式和反式調(diào)控可以通過比較親本表達(dá)水平的比值和雜交種中親本等位基因特異性表達(dá)的比值來確定[38]。如果變異發(fā)生在順式作用元件, 那么親本表達(dá)水平的比值和雜交種中親本等位基因特異性表達(dá)的比值沒有差異。如果變異發(fā)生在反式作用因子, 由于雜交種中的兩個(gè)親本等位基因處于相同的亞細(xì)胞環(huán)境中, 雜交種中的雙親等位基因的表達(dá)沒有差異。本研究發(fā)現(xiàn), 在3種組織中,分別有79%和82%轉(zhuǎn)錄本的2個(gè)親本等位基因表現(xiàn)出穩(wěn)定的表達(dá)水平, 說明與順式作用相比, 反式作用可能更多地影響了等位基因的特異性表達(dá), 這些涉及抗性或者其他重要代謝反應(yīng)相關(guān)轉(zhuǎn)錄本的等位基因所受到的差異調(diào)控可能與高丹草雜種表現(xiàn)出的雜種優(yōu)勢(shì)有關(guān)。
共鑒定了9308個(gè)分布于整個(gè)基因組的高質(zhì)量的SNP位點(diǎn)。Illumina測(cè)序技術(shù)是分析高丹草雜種中基因表達(dá)水平和等位基因表達(dá)方式的一個(gè)強(qiáng)有力工具, 為深入研究雜種優(yōu)勢(shì)形成的分子機(jī)制提供了有價(jià)值的信息。DNA甲基化現(xiàn)象可能存在于高丹草雜種及其親本中; 與母本高粱11A相比, 父本白殼蘇丹草的等位基因更能維持在高丹草雜種中的表達(dá)并對(duì)雜種優(yōu)勢(shì)形成產(chǎn)生影響; 根、莖和葉組織的高丹草雜種中親本等位基因具有不同的表達(dá)方式, 具有組織特異性; 高丹草雜種中親本等位基因的差異表達(dá)多數(shù)由反式作用因子調(diào)控。
[1] 詹秋文, 錢章強(qiáng). 高粱與蘇丹草雜種優(yōu)勢(shì)利用的研究. 作物學(xué)報(bào), 2004, 30: 73–77Zhan Q W, Qian Z Q. Research of Sorghum-Sudan grass of heterosis utilization., 2004, 30: 73–77 (in Chinese with English abstract)
[2] Lu X P, Yun J F, Gao C P. Quantitative trait loci analysis of economically important traits in′hybrid., 2011, 9: 81–90
[3] Arnold M L. Natural hybridization and the evolution of domesticated, pest and disease organisms., 2004, 13: 997–1007
[4] Hegarty M J, Hiscock S J. Hybrid speciation in plants: new insights from molecular studies., 2004, 165: 411–423
[5] Rieseberg L H. Hybrid origins of plant species., 1997, 28: 359–389
[6] Rieseberg L H, Raymond O, Rosenthal D M. Major ecological transitions in wild sunflowers facilitated by hybridization., 2003, 301: 1211–1216
[7] 曹廷杰, 謝菁忠, 吳秋紅, 陳永興, 王振忠, 趙虹, 王西成, 詹克瑟, 徐如強(qiáng), 王際睿, 羅明成, 劉志勇. 河南省近年審定小麥品種基于系譜和SNP標(biāo)記的遺傳多樣性分析. 作物學(xué)報(bào), 2015, 41: 197–206 Cao Y J, Xie J Z, Wu Q H, Chen Y X, Wang Z H, Zhao H, Wang X C, Zhan K S, Xu R Q, Wang J R, Luo M C, Liu Z Y. Genetic diversity of registered wheat varieties in Henan province based on pedigree and single-nucleotide polymorphism., 2015, 41: 197–206 (in Chinese with English abstract)
[8] Birchler J A, Auger D L, Riddle N C. In search of the molecular basis of heterosis., 2003, 15: 2236–2239
[9] 曲存民, 盧坤, 劉水燕, 卜海東, 付福友, 王瑞, 徐新福, 李加納. 黃黑籽甘藍(lán)型油菜類黃酮途徑基因SNP位點(diǎn)檢測(cè)分析. 作物學(xué)報(bào), 2014, 40: 1914–1924 Qu C M, Lu K, Liu S Y, Bu H D, Fu F Y, Wang R, Xu X F, Li J N. SNP detection and analysis of genes for flavonoid pathway in yellow-and black-seededL., 2014, 40: 1914–1924 (in Chinese with English abstract)
[10] Springer N M, Stupar R M. Allelic variation and heterosis in maize: How do two halves make more than a whole?, 2007, 17: 264–275
[11] Stupar R M, Spirnger N M. Cis-transcriptional variation in maize inbred lines B73 and Mo17 leads to additive expression patterns in the F1hybrid., 2006, 173: 2199–2210
[12] 許家磊. 基于甘薯徐781和徐薯18轉(zhuǎn)錄組測(cè)序的SNP標(biāo)記開發(fā). 中國(guó)農(nóng)業(yè)科學(xué)院碩士學(xué)位論文, 北京, 2015 Xu J L. Development of SNP Markers Based on Transcriptome Sequencing of Xu 781 and Xushu 18 in Sweetpotato,(L.) Lam. MS Thesis of Chinese Academy of Agricultural Sciences, Beijing, China, 2015 (in Chinese with English abstract)
[13] Pastinen T. Genome-wide allele-specific analysis: insights into regulatory variation., 2010, 11: 533–538
[14] 石璇, 王茹媛, 唐君, 李宗蕓, 羅永海. 利用簡(jiǎn)化基因組技術(shù)分析甘薯種間單核苷酸多態(tài)性. 作物學(xué)報(bào), 2016, 42: 641–647 Shi X, Wang R Y, Tang J, Li Z Y, Luo Y H. Analysis of interspecific SNPs in sweetpotato using a reduced-representation genotyping technology., 2016, 42: 641–647 (in Chinese with English abstract)
[15] 劉峰, 謝玲玲, 弭寶彬, 歐陽嫻, 茆振川, 鄒學(xué)校, 謝丙炎. 辣椒轉(zhuǎn)錄組SNP挖掘及多態(tài)性分析. 園藝學(xué)報(bào), 2014, 41: 343–348 Liu F, Xie L L, Mi B B, Ouyang X, Mao Z C, Zou X X, Xie B Y. SNP mining in pepper transcriptome and the polymorphism analysis., 2014, 41: 343–348 (in Chinese with English abstract)
[16] Tirosh I, Reikhav S, Levy A A. A yeast hybrid provides insight into the evolution of gene expression., 2009, 324: 659–662
[17] Zhang X, Borevitz J O. Global analysis of allele-specific expression in Arabidopsis thaliana., 2009, 182: 943–954
[18] Zhai R, Feng Y, Wang H. Transcriptome analysis of rice root heterosis by RNA-Seq., 2013, 16: 19
[19] Zhang M, Li N, He W. Genome-wide screen of genes imprinted in sorghum endosperm, and the roles of allelic differential cytosine methylation., 2016, 85: 424–436
[20] 逯曉萍, 云錦鳳, 肖宇紅, 米福貴, 李美娜, 尹利. 高丹草(高粱×蘇丹草)產(chǎn)量及其構(gòu)成因素的QTL分析. 華北農(nóng)學(xué)報(bào), 2007, 22(4): 80–85 Lu X P, Yun J F, Xiao Y H, Mi F G, Li M N, Yin L. QTL localization and analysis on yield and related factors of Sorghum×Sudan grass., 2007, 22(4): 80–85 (in Chinese with English abstract)
[21] 逯曉萍, 劉丹丹, 王樹彥, 米福貴, 韓平安, 呂二鎖. 高丹草遺傳效應(yīng)與雜種表現(xiàn)預(yù)測(cè)模型. 作物學(xué)報(bào), 2014, 40: 466–475 Lu X P, Liu D D, Wang S Y, Mi F G, Han P A, Lyu E S. Genetic effects and heterosis prediction model of×grass., 2014, 40: 466–475 (in Chinese with English abstract)
[22] 董婧, 逯曉萍, 米福貴, 王樹彥, 何麗君, 韓平安, 薛春雷, 叢夢(mèng)露, 李俊偉. 高丹草雜種和親本葉片基因差異表達(dá)研究. 植物遺傳資源學(xué)報(bào), 2016, 17: 738–747 Dong J, Lu X P, Mi F G, Wang S Y, He L J, Han P A, Xue C L, Cong M L, Li J W. Relationship between differential gene expression patterns in leaves of the hybrids and their parents of., 2016, 17: 738–747 (in Chinese with English abstract)
[23] Han P A, Lu X P, Mi F G, Dong J, Xue C L, Li J K, Han B, Zhang X Y. Proteomic analysis of heterosis in the leaves of Sorghum-Sudan grass hybrids., 2016, 48: 161–173
[24] Kim D, Pertea G, Trapnell C. TopHat2: accurate alignment of transcriptomes in the presence of insertions, deletions and gene fusions., 2013, 14: R36
[25] McKenna A, Hanna M, Banks E. The Genome Analysis Toolkit: a MapReduce framework for analyzing next-generation DNA sequencing data., 2010, 20: 1297–1303
[26] Altschul S F, Madden T L, Zhang J. Gapped BLAST and PSI BLAST: a new generation of protein database search programs., 1997, 25: 3389–3402
[27] Ashburner M, Ball C A, Blake J A. Gene ontology: tool for the unification of biology., 2000, 25: 25–29
[28] Kanehisa M, Goto S, Kawashima S. The KEGG resource for deciphering the genome., 2004, 32: 277–280
[29] Tatusov R L, Galperin M Y, Natale D A. The COG database: a tool for genome scale analysis of protein functions and evolution., 2000, 28: 33–36
[30] 楊侃侃. 基于RNA-seq技術(shù)對(duì)西瓜果皮色澤差異表達(dá)基因的分析. 江西農(nóng)業(yè)大學(xué)碩士學(xué)位論文, 江西南昌, 2015 Yang K K. Analysis of Genes Differentially Expressed in Watermelon Rind Color Based on RNA-seq. MS Thesis of Jiangxi Agricultural University, Nanchang, China, 2015 (in Chinese with English abstract)
[31] 杜瑋南, 孫紅霞, 方德福. 單核苷酸多態(tài)性的研究進(jìn)展. 中國(guó)醫(yī)學(xué)科學(xué)院學(xué)報(bào), 2000, 22: 392–394 Du W N, Sun H X, Fang D F. The research development of single nucleotide polymorphism., 2000, 22: 392–394 (in Chinese with English abstract)
[32] Bransteitter R, Pham P, Scharff M D. Activation-induced cytidine deaminase deaminates deoxycytidine on single-stranded DNA but requires the action of RNase., 2003, 100: 4102–4107
[33] Chodavarapu R K, Feng S, Ding B. Transcriptome and methylome interactions in rice hybrids., 2012, 109: 12040–12045
[34] Morgan H D, Dean W, Coker H A. Activation-induced cytidine deaminase deaminates 5-methylcytosine in DNA and is expressed in pluripotent tissues: implications for epigenetic reprogramming., 2004, 279: 52353–52360
[35] Yebra M J, Bhagwat A S. A cytosine methyltransferase converts 5-methylcytosine in DNA to thymine., 1995, 34: 14752–14757
[36] He G M, Zhu X P, Elling A A. Global epigenetic and transcriptional trends among two rice subspecies and their reciprocal hybrids., 2010, 22: 17–33
[37] Guo M, Rupe M A, Zinselmeier C. Allelic variation of gene expression in maize hybrids., 2004, 16: 1707–1716
[38] Zhuang Y, Adams K L. Extensive allelic variation in gene expression in populus F1hybrids., 2007, 177: 1987–1996
[39] 翟榮榮. 超級(jí)稻協(xié)優(yōu)9308根系雜種優(yōu)勢(shì)的轉(zhuǎn)錄組分析. 中國(guó)農(nóng)業(yè)科學(xué)院博士學(xué)位論文, 北京, 2013 Zhai R R. Transcriptome Analysis of Root Heterosis in a Super Hybrid Rice Xieyou 9308 by RNA-Seq. PhD Dissertation of Chinese Academy of Agricultural Sciences, Beijing, China, 2013 (in Chinese with English abstract)
[40] Springer N M, Stupar R M. Allelic-specific expression patterns reveal biases and embryo-specific parent-of-origin effects in hybrid maize., 2007, 19: 2391–2402
[41] Wittkopp P J, Haerum B K, Clark A G. Evolutionary changes in cis and trans gene regulation., 2004, 430: 85–88
[42] Shen Y, Catchen J, Garcia T. Identification of transcriptome SNPs between Xiphophorus lines and species for assessing allele specific gene expression within F1interspecies hybrids., 2012, 155: 102–108
Analysis of SNP and Allele-specific Expression in Transcriptome of×and Their Parents
DONG Jing1, LU Xiao-Ping1,*, ZHANG Kun-Ming1, XUE Chun-Lei1, and ZHANG Rui-Xia2
1Agronomy College, Inner Mongolia Agricultural University, Huhhot 010019, Inner Mongolia, China;2Huhhot Seed Management Station, Huhhot 010020, Inner Mongolia, China
Taking root, stem and leaf tissues ofhybrids and their parents as test materials, Illumina Hiseq 2000 was used to analyze the transcriptome to explore the relationship between single nucleotide variation and heterosis in the hybrids ofand their parents. About 58 000 SNP loci were detected from the sequencing samples with an average length of 58 122 160 bp. The number of genic SNP was significantly more than that of intergenic SNP. The frequency of SNP was 1/741 bp, and the conversion ratio of the average conversion was 1.00:1.53. Among all the types of variation, C/T and G/A had the highest frequency. After screening, 198 (21%) extremely significant biased alleles were expressed in bias SNP, and 65% of them were biased towards paternal white shell, and many of the transcriptional copies with high level gene expression in the white shellwere also expressed in thehybrid. The two parental alleles with 79%, 78%, and 82% transcripts showed a stable level of expression in the three tissues. It is suggested that the trans-acting may affect the specific expression of the allele more than the-acting. Six highly-biased SNP-unigene alleles were selected for qRT-PCR validation. The differential gene expression pattern of these genes was consistent with that of RNA-Seq analysis. Illumina sequencing technology was used to study allelic expression in this study, provides a basis for heterosis analysis ofand also a theoretical reference for related studies of other forage crops.
; heterosis; transcriptomics; single nucleotide polymorphism; functional annotion
2017-12-21;
2018-07-20;
2018-07-25.
10.3724/SP.J.1006.2018.01809
通信作者(Corresponding author):逯曉萍, Email: lxp1960@163.com
Email: 984012971@qq.com
本研究由國(guó)家自然科學(xué)基金項(xiàng)目(31160302, 31460375)和呼和浩特市科技計(jì)劃項(xiàng)目(2012-重-計(jì)-8-2)資助。
This study was supported by the National Natural Science Foundation of China (31160302, 31460375) and the Science and Technology Plan Projects of Hohhot (2012-major-plans-8-2).
URL: http://kns.cnki.net/kcms/detail/11.1809.S.20180724.1631.006.html