杜曉芬 錢(qián)枰勵(lì) 唐楚楚 杜德杰 韓康妮 李禹欣 王智蘭 王 軍,*
(1山西農(nóng)業(yè)大學(xué)谷子研究所/山西省后稷實(shí)驗(yàn)室,山西 長(zhǎng)治 046011;2山西農(nóng)業(yè)大學(xué)農(nóng)學(xué)院,山西 太谷 030801;3中國(guó)農(nóng)業(yè)大學(xué)農(nóng)學(xué)院,北京 100193)
谷子(Setariaitalica)具有耗水少、抗旱耐瘠、營(yíng)養(yǎng)豐富均衡、糧飼兼用等特點(diǎn),是旱作生態(tài)農(nóng)業(yè)綠色發(fā)展的主栽作物[1]。隨著谷子參考基因組的公布[2-3],谷子基礎(chǔ)研究在近十年飛速發(fā)展,并逐漸發(fā)展為禾本科作物功能基因組研究的模式作物[4]。
分子標(biāo)記是作物遺傳研究的基礎(chǔ),其中,插入/缺失(insertion/deletion,InDel)多態(tài)性標(biāo)記是指等位基因的核苷酸序列在個(gè)體間因插入或缺失引起的長(zhǎng)度變異,具有分布廣、密度高、變異穩(wěn)定、重復(fù)性好、性價(jià)比高等優(yōu)點(diǎn)[5],廣泛應(yīng)用于種質(zhì)資源分析、遺傳多樣性分析、親緣關(guān)系鑒定、種質(zhì)鑒定、遺傳圖譜構(gòu)建、重要性狀QTL 定位與圖位克隆等方面。趙慶英等[6]對(duì)名優(yōu)谷子品種晉谷21 號(hào)進(jìn)行重測(cè)序,與參考基因組相比發(fā)現(xiàn)了169 037 個(gè)InDel 位點(diǎn),進(jìn)一步驗(yàn)證了68 個(gè)InDel 位點(diǎn),并開(kāi)發(fā)了一個(gè)晉谷21 號(hào)的特異InDel 標(biāo)記,為分子標(biāo)記輔助育種提供了分子標(biāo)記資源。Zhang 等[7]基于谷子品種SSR41 的重測(cè)序結(jié)果,開(kāi)發(fā)了156 個(gè)適合瓊脂糖凝膠電泳的InDel 標(biāo)記,并利用多態(tài)性InDel 標(biāo)記對(duì)谷子白葉鞘基因進(jìn)行了圖位克隆。王智蘭等[8]根據(jù)SiGRAS23開(kāi)發(fā)了一個(gè)與株高性狀緊密連鎖的InDel 標(biāo)記D8-1,可用于谷子種質(zhì)資源株高變異的篩選。張碩等[9]利用7 個(gè)InDel 標(biāo)記將谷子白條紋葉基因定位于20.13 Mb 內(nèi),為該基因的精細(xì)定位和克隆奠定了基礎(chǔ)。由此可見(jiàn),InDel標(biāo)記在谷子基礎(chǔ)研究方面發(fā)揮了重要的作用。
株高是谷子的重要農(nóng)藝性狀之一,主要通過(guò)調(diào)節(jié)株型和抗倒伏性影響谷子產(chǎn)量。前人遺傳分析結(jié)果表明,谷子株高是典型的數(shù)量性狀,由多基因控制[10]。近十年來(lái),研究人員定位了許多株高相關(guān)的數(shù)量性狀位點(diǎn)(quantitative trait loci,QTL)[11-16],這些QTL 在谷子的9條染色體上均有分布。同時(shí),前人精細(xì)定位和克隆了一些候選基因,例如編碼DELLA蛋白的SiD1和編碼細(xì)胞色素P450 蛋白的SiD2[17-18]。盡管如此,相比水稻、小麥等主要農(nóng)作物,谷子株高QTL 或基因的鑒定仍相對(duì)較少,這嚴(yán)重制約了谷子株高遺傳機(jī)理研究的進(jìn)展。
鑒于此,本研究對(duì)2 個(gè)株高存在極顯著差異的谷子品種(衡谷12號(hào)和長(zhǎng)農(nóng)35號(hào))進(jìn)行深度重測(cè)序,比較兩者之間的InDel差異,開(kāi)發(fā)InDel標(biāo)記,并利用多態(tài)性InDel標(biāo)記掃描“衡谷12號(hào)×長(zhǎng)農(nóng)35號(hào)” F2分離群體,構(gòu)建遺傳連鎖圖譜、定位株高QTL,進(jìn)一步在重組自交系群體中驗(yàn)證株高QTL,并對(duì)候選基因進(jìn)行預(yù)測(cè)。本研究旨在為谷子基礎(chǔ)研究提供一套好用的InDel標(biāo)記,同時(shí)為株高基因的克隆奠定基礎(chǔ)。
本研究中,用于株高QTL 定位的雜交組合的母本為衡谷12 號(hào),由河北農(nóng)林科學(xué)院旱作農(nóng)業(yè)研究所選育,具有矮稈、極早熟、分蘗性強(qiáng)等特點(diǎn)[19],父本長(zhǎng)農(nóng)35 號(hào)由山西農(nóng)業(yè)大學(xué)谷子研究所選育,屬于高稈、晚熟、無(wú)分蘗品種[20]。2016年,將衡谷12號(hào)和長(zhǎng)農(nóng)35號(hào)進(jìn)行雜交;2017年,鑒定F1植株;2018年,將F1自交獲得F2分離群體,在谷子成熟期調(diào)查株高,其中,雙親調(diào)查5株,取平均值作為性狀值,F(xiàn)2子代逐株掛牌調(diào)查株高。
采用單粒傳法,將F2分離群體繁殖到F6代。2022年,將雙親和重組自交系群體(recombinant inbred line,RIL,F(xiàn)6代共283個(gè)株系)種植2行,行長(zhǎng)2 m,株距0.33 m。在谷子成熟期調(diào)查株高,每個(gè)株系調(diào)查5株,以平均值作為性狀值。所有材料均種植于山西農(nóng)業(yè)大學(xué)谷子研究所試驗(yàn)田,田間管理、水肥等條件一致。
在谷子拔節(jié)期,分別采集新出葉片,液氮速凍后置于-80 ℃?zhèn)溆?。采用改良的十二烷基硫酸鈉(sodium dodecyl sulfate,SDS)法提取總DNA。SDS提取液配制:1 mol·L-1Tris-HCl(pH 值8.5)100 mL,0.5 mol·L-1乙二胺四乙酸(ethylene diamine tetraacetic acid,EDTA)(pH 值8.0)100 mL,5 mol·L-1NaCl 20 mL,20% SDS 100 mL,加去離子水定容至1 L。提取步驟為:將葉片放入研缽中加入液氮研磨成粉狀,轉(zhuǎn)移至2.0 mL 離心管中;加入SDS 提取液750 μL,混勻后置于65 ℃水浴鍋中1 h;加入750 μL苯酚/氯仿(1∶1),混勻15 min后,4 ℃,12 000 r·min-1離心15 min;吸取上清液600 μL,加等體積氯仿,混勻15 min 后,4 ℃,12 000 r·min-1離心15 min;吸取上清液450 μL,加0.6 倍體積的異丙醇混勻,靜置30 min;4 ℃,12 000 r·min-1離心10 min 后棄上清,用70%乙醇清洗2 次;室溫干燥后加入100 μL 的Tris-EDTA(TE)緩沖液備用。
分別在谷子孕穗期和開(kāi)花期,對(duì)衡谷12 號(hào)和長(zhǎng)農(nóng)35 號(hào)的倒二莖進(jìn)行取樣,液氮速凍研磨,參照RNAiso Plus 試劑(9108,北京寶日醫(yī)生物技術(shù)有限公司)說(shuō)明書(shū)提取總RNA,參照PrimeScript Ⅱ 1st strand cDNA synthesis kit 試劑盒(6210A,北京寶日醫(yī)生物技術(shù)有限公司)說(shuō)明書(shū)合成cDNA。
在苗期,分別隨機(jī)采集衡谷12號(hào)和長(zhǎng)農(nóng)35號(hào)的葉片,采用高效植物基因組DNA 提取試劑盒(DP350,北京天根生化科技有限公司)提取DNA,送至北京百邁客生物科技有限公司進(jìn)行重測(cè)序,重測(cè)序按照Illumina公司(美國(guó))提供的標(biāo)準(zhǔn)步驟執(zhí)行,簡(jiǎn)要流程為:對(duì)提取的基因組DNA 進(jìn)行質(zhì)檢,DNA 檢測(cè)合格后用超聲波將DNA片段化;對(duì)片段化的DNA進(jìn)行末端修復(fù)、3'端加A和連接測(cè)序接頭;用瓊脂糖凝膠電泳對(duì)片段大小進(jìn)行選擇,并進(jìn)行PCR 擴(kuò)增形成測(cè)序文庫(kù);對(duì)測(cè)序文庫(kù)進(jìn)行文庫(kù)質(zhì)檢,質(zhì)檢合格的文庫(kù)用Hiseq 2500 測(cè)序儀(Illumina公司,美國(guó))進(jìn)行測(cè)序。
測(cè)序得到的原始序列(raw reads)進(jìn)行過(guò)濾,獲得高質(zhì)量的序列(clean reads),過(guò)濾的標(biāo)準(zhǔn)為:去除帶接頭的reads;過(guò)濾N 含量超過(guò)10%的reads;去除質(zhì)量值低于10、堿基超過(guò)50%的reads。利用Burrows-Wheeler Transform 軟件[21]將獲得的clean reads 比對(duì)到谷子參考基因組豫谷1號(hào)上(Setariaitalicav2.2,https://phytozome.jgi.doe.gov/pz/portal.html#%21info?alias=Org_Sitalica_er)。使用Picard(https://sourceforge.net/projects/picard/)去掉重復(fù),Genome Analysis ToolKit 軟件[22]用于檢測(cè)單核苷酸多態(tài)性(single nucleotide polymorphisms,SNP)和InDel,并用SnpEff 軟件[23]對(duì)檢測(cè)到的SNP 和InDel 進(jìn)行注釋,Breakdancer(http://breakdancer.sourceforge.net/)用于檢測(cè)結(jié)構(gòu)變異(structral variation,SV),對(duì)于檢測(cè)到的SV,通過(guò)比對(duì)變異位點(diǎn)在參考基因組上的位置對(duì)其進(jìn)行注釋。
比較衡谷12號(hào)和長(zhǎng)農(nóng)35號(hào)差異InDel位點(diǎn),選擇衡谷12號(hào)和長(zhǎng)農(nóng)35號(hào)插入或缺失堿基數(shù)量差異大于等于3 bp且間隔大于5 kb的位點(diǎn)作為引物設(shè)計(jì)的目標(biāo)位點(diǎn)。分別提取目標(biāo)位點(diǎn)上下游側(cè)翼序列150 bp,整理成Fasta格式,利用BatchPrimer3 v2.0(https://probes.pw.usda.gov/batchprimer3/)批量設(shè)計(jì)引物,產(chǎn)物大小設(shè)置為100~300 bp,引物由南京金斯瑞生物科技股份有限公司合成。
PCR 反應(yīng)體系為10 μL:10×PCR buffer 1.0 μL,2 μmol·L-1上下游引物各1 μL,rTap DNA聚合酶0.1 μL,2.5 mmol·L-1dNTP 0.8 μL,模板DNA 1.0 μL,滅菌水5.1 μL。PCR 擴(kuò)增程序?yàn)椋?4 ℃預(yù)變性5 min,94 ℃變性30 s,58 ℃退火30 s,72 ℃延伸30 s,35個(gè)循環(huán);72 ℃終延伸10 min。PCR 擴(kuò)增產(chǎn)物利用8%聚丙烯酰胺凝膠電泳進(jìn)行分離,經(jīng)硝酸銀染色后,拍照記錄。
選擇能夠良好分型的多態(tài)性InDel標(biāo)記,分別掃描F2群體(120 個(gè)單株)和RIL 群體(283 個(gè)株系),對(duì)擴(kuò)增結(jié)果進(jìn)行統(tǒng)計(jì),其中與衡谷12號(hào)帶型一致的記為“A”,與長(zhǎng)農(nóng)35 號(hào)帶型一致的記為“B”,雜合帶型記為“H”,條帶缺失時(shí)記為“-”。采用JoinMap 4[24]構(gòu)建遺傳連鎖圖譜,選擇回歸算法(regression mapping)和Kosamb,s函數(shù),其他參數(shù)為默認(rèn)參數(shù)。采用WinQTLCart 2.5[25]對(duì)株高進(jìn)行QTL 定位,使用復(fù)合區(qū)間作圖(composite interval mapping,CIM)法,在P<0.05 條件下,進(jìn)行1 000 次排列測(cè)驗(yàn)(permutation test)確定QTL 的似然比的自然對(duì)數(shù)(likelihood of odd,LOD)閾值。QTL命名規(guī)則按照q+性狀簡(jiǎn)稱+染色體進(jìn)行命名,當(dāng)同一條染色體出現(xiàn)多個(gè)QTL,按照-1、-2、-3的順序命名。
利用Phytozome數(shù)據(jù)庫(kù)(https://phytozome-next.jgi.doe.gov/),以豫谷1 號(hào)為參考基因組,對(duì)定位區(qū)間的基因及其功能注釋進(jìn)行分析。同時(shí)根據(jù)衡谷12 號(hào)和長(zhǎng)農(nóng)35 號(hào)重測(cè)序數(shù)據(jù),分析定位區(qū)間內(nèi)編碼區(qū)發(fā)生突變的基因,預(yù)測(cè)候選基因。對(duì)預(yù)測(cè)的候選基因進(jìn)行克隆測(cè)序,采用DNAMAN 7 軟件對(duì)測(cè)序結(jié)果進(jìn)行比對(duì)分析。參考王智蘭等[8]的方法進(jìn)行候選基因的熒光實(shí)時(shí)定量表達(dá)分析。
利用SPSS 17 分析群體性狀的最大值、最小值、平均數(shù)、標(biāo)準(zhǔn)差、峰度、偏度以及進(jìn)行獨(dú)立樣本t檢驗(yàn)。利用GraphPad Prism 5進(jìn)行頻率分布分析和作圖。
衡谷12 號(hào)和長(zhǎng)農(nóng)35 號(hào)的clean data 為31.82 Gbp,Q30 達(dá)到88.38%,兩個(gè)樣品與參考基因組平均比對(duì)率為98.63%,平均覆蓋深度為34×,其中衡谷12 號(hào)的覆蓋深度為30×,長(zhǎng)農(nóng)35 號(hào)的覆蓋深度為38×。變異檢測(cè)結(jié)果表明,衡谷12 號(hào)中單核苷酸多態(tài)性(SNP)、插入/缺失(InDel)和結(jié)構(gòu)變異(SV)數(shù)量分別為524 486、103 442 和22 295 個(gè),長(zhǎng)農(nóng)35 號(hào)中SNP、InDel 和SV 數(shù)量分別為1 131 571、196 477 和24 509 個(gè)(圖1-A),比較而言,檢測(cè)到的SNP 數(shù)量最多,SV 數(shù)量最少,且長(zhǎng)農(nóng)35 號(hào)中這三種變異類(lèi)型都高于衡谷12 號(hào),同時(shí)發(fā)現(xiàn),長(zhǎng)農(nóng)35 號(hào)和衡谷12 號(hào)在相同位點(diǎn)共同檢測(cè)到SNP 變異位點(diǎn)和InDel 變異位點(diǎn)分別有259 259 和55 224 個(gè)(圖1-E、F)。
SNP 變異類(lèi)型分為堿基轉(zhuǎn)換(T/A 和C/G)和堿基顛換(A/C、G/T、C/T 和G/A),衡谷12 號(hào)中堿基顛換的數(shù)量占總變異類(lèi)型的87.7%,長(zhǎng)農(nóng)35 號(hào)中堿基顛換的數(shù)量占總變異類(lèi)型的88%,同時(shí)發(fā)現(xiàn),長(zhǎng)農(nóng)35號(hào)中的堿基轉(zhuǎn)換和堿基顛換的數(shù)量均高于衡谷12號(hào)(圖1-B)。
SV 變異類(lèi)型分為大片段插入(insertion,INS)、大片段缺失(deletion,DEL)、反轉(zhuǎn)(inversion,INV)、染色體內(nèi)易位(intra-chromosomal translocation,ITX)和染色體間易位(inter-chromosomal translocation,CTX)等,衡谷12 號(hào)和長(zhǎng)農(nóng)35 號(hào)的變異類(lèi)型主要是INS 和DEL,分別占總變異類(lèi)型的84.76%和79.17%(圖1-C)。
InDel變異類(lèi)型分為小片段插入(INS)和小片段缺失(DEL),分析表明,在衡谷12號(hào)和長(zhǎng)農(nóng)35號(hào)中,主要發(fā)生均為1 bp的INS或DEL,同時(shí)發(fā)現(xiàn)大于等于39 bp且小于等于50 bp的INS數(shù)量高于DEL數(shù)量(圖1-D)。
比對(duì)衡谷12 號(hào)和長(zhǎng)農(nóng)35 號(hào)中InDel 變異位點(diǎn),選擇兩者差異大于等于3 bp 且間隔大于5 kb 的位點(diǎn),最后篩選了3 961 個(gè)位點(diǎn),并設(shè)計(jì)引物。首先,篩選在雙親間具有多態(tài)性的標(biāo)記,初步獲得1 392 對(duì)多態(tài)性標(biāo)記,多態(tài)性率為35.14%,其中第3 染色體的多態(tài)性標(biāo)記最多,第4 染色體的多態(tài)性標(biāo)記最少(圖2-A)。然后,用F2群體的部分單株進(jìn)一步篩選,獲得591 個(gè)穩(wěn)定性好,且在后代群體中能夠良好分型的多態(tài)性標(biāo)記(圖2-B),為下一步遺傳圖譜構(gòu)建奠定了基礎(chǔ)。
圖2 InDel標(biāo)記的多態(tài)性分析Fig.2 Development and polymorphism analysis of InDel markers
利用591個(gè)InDel標(biāo)記對(duì)包含120個(gè)單株的F2群體進(jìn)行基因分型,采用JoinMap 4 進(jìn)行連鎖分析,最后獲得一張包括467 個(gè)InDel 標(biāo)記的谷子遺傳連鎖圖譜(電子附圖1),該圖譜總圖距448.45 cM,平均圖距0.96 cM,其中第4 和第8 染色體標(biāo)記數(shù)量最少(16 個(gè)),第3 染色體標(biāo)記數(shù)量最多(160 個(gè)),第1 染色體圖距最短(9.67 cM),第9染色體圖距最長(zhǎng)(105.22 cM)(表1)。
表1 “衡谷12號(hào)×長(zhǎng)農(nóng)35號(hào)” F2群體遺傳連鎖圖譜信息Table 1 Characteristics of the genetic map in F2 population of ‘Henggu12 × Changnong35’
對(duì)雙親及120 個(gè)F2子代株高進(jìn)行分析,發(fā)現(xiàn)雙親之間差異極顯著(P<0.01,圖3-A),株高在F2群體中呈雙向超親分離(表2),頻率分布結(jié)果顯示,株高呈雙峰分布(圖3-A)。
表2 雙親及群體株高統(tǒng)計(jì)分析Table 2 Phenotypic analysis of plant height in the parents,F(xiàn)2 population and RIL population /cm
圖3 “衡谷12號(hào)×長(zhǎng)農(nóng)35號(hào)” F2群體和RIL群體株高頻率分布直方圖Fig.3 Histogram of frequency distribution of plant height in F2 population and RIL population of ‘Henggu 12×Changnong 35’
利用WinQTLCart 2.5 對(duì)F2群體的株高進(jìn)行QTL定位,共檢測(cè)到4個(gè)QTL 位點(diǎn),除qPH5-1外,加性效應(yīng)均為負(fù)值,說(shuō)明來(lái)自父本長(zhǎng)農(nóng)35 號(hào)的等位位點(diǎn)對(duì)株高貢獻(xiàn)率大。在4 個(gè)QTL 中,第5 染色體檢測(cè)到2 個(gè)QTL,分別為qPH5-1和qPH5-2,其中qPH5-1可解釋表型變異率最大,為8.41%;第9 染色體檢測(cè)到2 個(gè)QTL,分別為qPH9-1和qPH9-2,其中qPH9-2可解釋表型變異率為16.47%,為主效QTL(表3)。
表3 “衡谷12號(hào)×長(zhǎng)農(nóng)35號(hào)” F2群體株高QTL定位Table 3 Putative QTL detected for plant height in F2 population of ‘Henggu12×Changnong35’
首先,對(duì)雙親和283 個(gè)株系的株高進(jìn)行分析,發(fā)現(xiàn)株高在RIL 群體中呈單向超親分離,變異范圍比F2群體小,但是變異系數(shù)比F2群體大(表2)。頻率分布結(jié)果顯示,與F2群體的結(jié)果相似,株高呈雙峰分布(圖3-B)。然后在RIL 群體中對(duì)F2群體中鑒定的效應(yīng)較大的QTL(qPH5-1和qPH9-2)進(jìn)行了驗(yàn)證。結(jié)果表明,在RIL 群體中,僅檢測(cè)到qPH9-2,LOD 值為93.6,加性效應(yīng)為-46.15,解釋表型貢獻(xiàn)率達(dá)91.06%(表4)。
表4 “衡谷12號(hào)×長(zhǎng)農(nóng)35號(hào)”重組自交系群體株高QTL定位Table 4 Putative QTL detected for plant height in RIL population of ‘Henggu12 × Changnong35’
利用Phytozome 數(shù)據(jù)庫(kù)分析qPH9-2定位區(qū)間(2 776 961~7 257 031 bp),該區(qū)間包含706 個(gè)基因,分析衡谷12號(hào)和長(zhǎng)農(nóng)35號(hào)在該區(qū)間的重測(cè)序結(jié)果,發(fā)現(xiàn)70個(gè)基因在編碼區(qū)、5'UTR和3'UTR發(fā)生突變。其中,27 個(gè)基因由于SNP 變異發(fā)生非同義突變,4 個(gè)基因由于InDel 變異發(fā)生移碼突變(電子附表1)。分析發(fā)生非同義突變的基因功能注釋,發(fā)現(xiàn)編碼bHLH 轉(zhuǎn)錄因子的基因Seita.9G080400,在其5'UTR 處和編碼區(qū)分別存在2 處SNP。由于轉(zhuǎn)錄因子在植物生長(zhǎng)發(fā)育中發(fā)揮重要作用,因此對(duì)其進(jìn)行了重點(diǎn)分析。
根據(jù)參考基因組Seita.9G080400的基因組序列,設(shè)計(jì)特異引物(電子附表2),分別對(duì)衡谷12 號(hào)和長(zhǎng)農(nóng)35 號(hào)進(jìn)行克隆測(cè)序,測(cè)序結(jié)果驗(yàn)證了其5'UTR 的2 處SNP(SNP1和SNP2)和第一外顯子的2處SNP(SNP3和SNP4),同時(shí)還發(fā)現(xiàn)在其第一內(nèi)含子、第二內(nèi)含子和第三內(nèi)含子分別存在1 處SNP(SNP5、SNP6 和SNP7)(電子附圖2)。外顯子中的SNP3在衡谷12中編碼纈氨酸(V),在長(zhǎng)農(nóng)35號(hào)中編碼丙氨酸(A);外顯子中的SNP4在衡谷12 中編碼組氨酸(H),在長(zhǎng)農(nóng)35 號(hào)中編碼天冬氨酸(D)(圖4-A)。表達(dá)分析結(jié)果表明,孕穗期莖中,Seita.9G080400相對(duì)表達(dá)量在衡谷12號(hào)中是長(zhǎng)農(nóng)35號(hào)的10倍;開(kāi)花期莖中,Seita.9G080400相對(duì)表達(dá)量在衡谷12號(hào)中是長(zhǎng)農(nóng)35號(hào)的42倍(圖4-B)。
圖4 Seita.9G080400序列分析和表達(dá)分析Fig.4 Sequences and expression level analysis of Seita.9G080400 between Henggu12 and Changnong35
隨著高通量測(cè)序技術(shù)的快速發(fā)展,基于重測(cè)序技術(shù),在全基因組水平發(fā)掘的分子標(biāo)記在作物中得到廣泛應(yīng)用。大量研究表明,InDel標(biāo)記是植物中的第二大類(lèi)多態(tài)性高的標(biāo)記,具有準(zhǔn)確性高、共顯性、易于基因分型等諸多優(yōu)點(diǎn)[5],已在遺傳圖譜構(gòu)建、重要性狀QTL定位、種質(zhì)資源分析與鑒定等方面廣泛應(yīng)用。谷子中相關(guān)文獻(xiàn)證實(shí),InDel標(biāo)記數(shù)量?jī)H次于SNP標(biāo)記[6-7,26-28]。例如,Li等[27]對(duì)312份谷子種質(zhì)進(jìn)行重測(cè)序,共鑒定了3 027 706 個(gè)SNP 和256 826 個(gè)InDel,Bai 等[28]在農(nóng)家種十里香中檢測(cè)到915 434 個(gè)SNP 和28 546 個(gè)InDel。本研究中,衡谷12 號(hào)中的SNP 和InDel 分別為524 486和103 442個(gè),長(zhǎng)農(nóng)35號(hào)中的SNP和InDel分別為1 131 571和196 477 個(gè)。由于測(cè)序深度和材料的不同,導(dǎo)致檢測(cè)到的SNP 和InDel 數(shù)量有所不同。本研究進(jìn)一步驗(yàn)證了InDel 標(biāo)記是一類(lèi)具有豐富多態(tài)性的標(biāo)記,此外,本研究鑒定的大量InDel位點(diǎn)為開(kāi)發(fā)標(biāo)記提供了分子基礎(chǔ)。
目前已有研究中,主要利用簡(jiǎn)單重復(fù)序列(simple sequence repeat,SSR)標(biāo)記[29-31]進(jìn)行種質(zhì)資源群體結(jié)構(gòu)分析[32]、圖位克?。?3]、優(yōu)異等位變異檢測(cè)[34],而InDel標(biāo)記應(yīng)用的相關(guān)報(bào)道較少。盡管谷子中InDel變異豐富,但對(duì)其進(jìn)行開(kāi)發(fā)并驗(yàn)證的標(biāo)記數(shù)量同樣相對(duì)較少,谷子中可用的InDel 標(biāo)記資源有限,因此在全基因組水平開(kāi)發(fā)InDel 標(biāo)記非常必要。趙慶英等[6]在晉谷21 中開(kāi)發(fā)驗(yàn)證了68 個(gè)InDel 標(biāo)記,Zhang 等[7]在SSR41中開(kāi)發(fā)驗(yàn)證了156個(gè)InDel標(biāo)記。本研究選擇了3 961 個(gè)在衡谷12 號(hào)和長(zhǎng)農(nóng)35 號(hào)之間有差異的InDel位點(diǎn),經(jīng)過(guò)初步篩選,獲得了1 392 個(gè)多態(tài)性InDel 標(biāo)記,多態(tài)性率為35.14%。與前人研究結(jié)果相比,本研究驗(yàn)證的InDel標(biāo)記數(shù)量較多,并能夠有效應(yīng)用于株高QTL定位。
數(shù)量性狀QTL 定位結(jié)果易受定位群體和環(huán)境條件影響,盡管初級(jí)定位群體(F2、F2:3和DH)表型數(shù)據(jù)不能重復(fù),但是一些大效應(yīng)的QTL 還是會(huì)被準(zhǔn)確定位。例如,水稻“綠色”基因DEP1的克隆,最初利用DH 群體檢測(cè)到控制水稻直立穗型的主效QTL(qPE9-1,貢獻(xiàn)率為41.72%)[35],隨后利用2 個(gè)F2群體及1 521 個(gè)F2子代將其精細(xì)定位并確定候選基因DEP1[36]。本研究利用開(kāi)發(fā)的多態(tài)性InDel 標(biāo)記,構(gòu)建了“衡谷12 號(hào)×長(zhǎng)農(nóng)35 號(hào)” F2群體的遺傳連鎖圖譜,初步定位了4 個(gè)株高QTL,并對(duì)其中2 個(gè)效應(yīng)值較大的QTL 在RIL 群體中進(jìn)行了驗(yàn)證,相比F2群體的定位結(jié)果,qPH9-2在RIL 群體中能重復(fù)檢測(cè)到,貢獻(xiàn)率達(dá)91.06%,且物理區(qū)間(2 776 961~7 257 031 bp)更小。前人在谷子第9染色體上相同區(qū)間也檢測(cè)到株高QTL(H9a:3 452 395~9 964 754 bp),貢獻(xiàn)率為7.6%~15.5%[12],暗示該區(qū)間存在控制株高的主效QTL。
bHLH 是植物中重要的一類(lèi)轉(zhuǎn)錄因子,參與植物生長(zhǎng)發(fā)育與形態(tài)建成。研究表明,小麥TabHLH123調(diào)控小麥根系發(fā)育,TabHLH123-6B與根重、千粒重和株高相關(guān)[37],TabHLH123-6A與根系構(gòu)型相關(guān)[38]。本研究中,Seita.9G080400編碼bHLH 轉(zhuǎn)錄因子,測(cè)序結(jié)果表明,在衡谷12 號(hào)和長(zhǎng)農(nóng)35 號(hào)中,其第一外顯子有2處SNP,導(dǎo)致氨基酸發(fā)生非同義突變。其中,SNP3在衡谷12 號(hào)中編碼纈氨酸,長(zhǎng)農(nóng)35 號(hào)中編碼丙氨酸,這兩種氨基酸都為疏水性氨基酸;SNP4 在衡谷12 號(hào)中編碼組氨酸,長(zhǎng)農(nóng)35 號(hào)中編碼天冬氨酸,由堿性氨基酸變?yōu)樗嵝园被?,這些氨基酸的改變是否影響蛋白的功能,需要進(jìn)一步驗(yàn)證。另外,在不同發(fā)育時(shí)期的莖中,Seita.9G080400相對(duì)表達(dá)量在衡谷12 號(hào)和長(zhǎng)農(nóng)35號(hào)之間存在極顯著差異。綜合以上結(jié)果,推測(cè)Seita.9G080400可能是控制株高的關(guān)鍵候選基因,但是仍然需要通過(guò)進(jìn)一步精細(xì)定位和功能鑒定進(jìn)行驗(yàn)證。
本研究利用2 個(gè)谷子品種的重測(cè)序數(shù)據(jù),在全基因組水平開(kāi)發(fā)了1 392 個(gè)分布于谷子9 條染色體的InDel 標(biāo)記。利用多態(tài)性InDel 標(biāo)記,構(gòu)建了一張包含467 個(gè)InDel 標(biāo)記的谷子遺傳連鎖圖譜,定位了1 個(gè)控制株高的主效QTL,預(yù)測(cè)了1 個(gè)關(guān)鍵候選基因,驗(yàn)證了InDel標(biāo)記的有效性和應(yīng)用性,為今后谷子種質(zhì)資源鑒定、群體結(jié)構(gòu)分析和親緣關(guān)系分析等提供了良好的分子標(biāo)記資源。
電子附表1 突變基因的信息Electronic Table S1 Information of mutant genes
電子附圖1 “衡谷12號(hào)×長(zhǎng)農(nóng)35號(hào)”F2群體InDel標(biāo)記連鎖遺傳圖Electronic Fig.S1 The genetic linkage map constructed using 467 InDel markers in F2 population derived from ‘Henggu12 ×Changnong35’