宋夏夏, 王利民, 張建平, 張?zhí)毂? 劉彩月, 龍艷*, 裴新梧
(1.中國農(nóng)業(yè)科學(xué)院生物技術(shù)研究所, 北京 100081; 2.甘肅省農(nóng)業(yè)科學(xué)院作物研究所, 蘭州 730070)
亞麻(LinumusitatissimumL.)屬于亞麻科亞麻屬,為一年生草本植物。亞麻一般可以分為纖維亞麻、油用亞麻和兼用亞麻。胡麻為油用亞麻,是我國華北和西北地區(qū)重要的油料作物和經(jīng)濟(jì)作物。隨著人們生活水平的提高,綠色健康的食用油越來越受歡迎。胡麻是α-亞麻酸含量較高的油料作物之一,其籽油中α-亞麻酸的含量約占總脂肪酸的50%,使得胡麻籽油在食品、飼料和工業(yè)應(yīng)用中具有重要價(jià)值[1-2]。α-亞麻酸是人體內(nèi)長不飽和脂肪酸EPA(eicosapentaenoic acid,二十碳五烯酸)、DPA(docosapentaenoic acid,二十二碳五烯酸)和DHA(docosahexaenoic acid,二十二碳六烯酸)的前體,具有降血脂、預(yù)防心血管疾病、抗炎抗癌和改善記憶力等保健功效[3-5]。同時(shí),胡麻籽還含有胡麻膠、木酚素、膳食纖維等對(duì)人體有益的物質(zhì)[6],在食品保健方面具有廣闊的開發(fā)前景。株高不僅影響胡麻產(chǎn)量和胡麻籽品質(zhì),還與植株倒伏性狀相關(guān),是一個(gè)由基因和環(huán)境共同作用的復(fù)雜數(shù)量性狀(quantitative trait loci,QTL)。因此,研究控制胡麻株高的QTL有助于了解胡麻生長的分子基礎(chǔ)和調(diào)控機(jī)理,為胡麻品種的性狀改良和產(chǎn)量提高奠定基礎(chǔ)??焖侔l(fā)展的高通量測序技術(shù)和有效的植物基因組參考序列為高分辨率性狀作圖和快速識(shí)別候選基因或診斷標(biāo)記提供了可能性。
QTL-seq技術(shù)充分利用BSA和高通量測序技術(shù),直接將具有差異性狀的基因池混合進(jìn)行高通量測序,獲得大量豐富的SNP標(biāo)記,計(jì)算每個(gè)SNP位點(diǎn)的SNP-index(該位點(diǎn)與參考序列不同的reads數(shù)占總reads數(shù)的比例),然后將兩個(gè)基因池每個(gè)位點(diǎn)的SNP-index相減得到差值ΔSNP-index,從而獲取全基因組范圍內(nèi)的ΔSNP-index圖譜。由于除目標(biāo)基因區(qū)域外的其他基因組區(qū)域理論上沒有差異,即ΔSNP-index接近于0,所以將ΔSNP-index顯著偏離0的位點(diǎn)作為候選位點(diǎn)。QTL-seq策略最先在水稻中提出,利用水稻F2和RIL群體成功定位了水稻中抗病及與幼苗活力相關(guān)的QTL[7]。Daware等[8]用QTL-seq結(jié)合SSR方法定位了調(diào)控水稻粒重的基因,構(gòu)建了水稻高密度SSR圖譜,包含3 791個(gè)標(biāo)記,總圖距為2 060 cM,標(biāo)記間平均距離為0.54 cM。通過生物信息學(xué)分析,將控制粒重的QTL粗定位在6條染色體上,共解釋31%的表型變異。而后結(jié)合QTL-seq和差異基因表達(dá)分析,縮小了一個(gè)粒重主效QTL的遺傳區(qū)間,成功定位了一個(gè)粒重主效基因。Shu等[9]研究了花椰菜和甘藍(lán)中控制開花時(shí)間的QTL。同時(shí),該方法已成功應(yīng)用于黃瓜早花QTL[10]、西紅柿重量和果實(shí)數(shù)QTL[11]、鷹嘴豆百粒重和根源特質(zhì)比相關(guān)QTL[12-14]以及木豆抗病性相關(guān)QTL[15]。
本研究以加拿大高含油量油用品種Macbeth和中國纖用品種黑亞14號(hào)為親本構(gòu)建的重組自交系(RIL F7)群體為材料,統(tǒng)計(jì)了該群體在不同時(shí)間不同地區(qū)的株高表型,利用QTL-seq方法對(duì)胡麻株高QTL進(jìn)行了定位分析和候選基因預(yù)測,并將候選株高基因轉(zhuǎn)入擬南芥中進(jìn)行基因功能驗(yàn)證。本研究不僅初步鑒定了胡麻中控制株高的功能基因,同時(shí)探索出利用QTL-seq方法快速有效定位并克隆胡麻數(shù)量性狀主效基因的方法。
供試材料為Macbeth(母本)、黑亞14號(hào)(父本)及得到的RIL F7群體,共155個(gè)株系,由甘肅省農(nóng)業(yè)科學(xué)院作物研究所提供。試驗(yàn)材料于2016年種植于中國農(nóng)業(yè)科學(xué)院河北廊坊試驗(yàn)基地,每行種植一個(gè)株系30株,行寬1 m,行距20 cm。親本及RIL群體各株系分別設(shè)置3個(gè)重復(fù)種植。種植期間進(jìn)行常規(guī)田間管理,待至成熟期時(shí)統(tǒng)計(jì)單株株高。
1.2.1株高統(tǒng)計(jì)和分析 在胡麻成熟期,測量和統(tǒng)計(jì)地面到植株頂端高度(cm)。每一個(gè)RIL株系以3株植株的株高均值作為表型值。結(jié)合該群體在甘肅蘭州、甘肅景泰和云南元謀3個(gè)不同環(huán)境的株高數(shù)據(jù)(甘肅省農(nóng)業(yè)科學(xué)院作物研究所提供),比較不同環(huán)境的各單株的株高表型。選取在四個(gè)環(huán)境均表現(xiàn)為高、低株的株系各15株分別作為高、低株混池備選單株。
1.2.2胡麻基因組DNA的提取 在苗期取2個(gè)親本及RIL群體所有單株的葉片,采用植物基因組DNA提取試劑盒(北京全式金生物技術(shù)有限公司)提取基因組DNA,用瓊脂糖凝膠電泳進(jìn)行完整性檢測。
1.2.3文庫構(gòu)建及測序 檢測合格的DNA加滅菌ddH2O稀釋,將濃度統(tǒng)一調(diào)整為100 ng·μL-1。將2個(gè)池的各15個(gè)株系單株DNA等體積混合,獲得高株基因池和低株基因池。采用TruSeq Library Construction Kit構(gòu)建親本和兩個(gè)基因池文庫,通過Illumina HiSeqTM PE 150進(jìn)行測序。文庫構(gòu)建完成后,先使用Qubit 2.0進(jìn)行初步定量,稀釋至1 ng·μL-1,隨后利用Agilent 2100對(duì)文庫的插入大小進(jìn)行檢測,符合預(yù)期后使用QPCR方法[16]對(duì)文庫的有效濃度(>2 nmol·L-1)進(jìn)行準(zhǔn)確定量,以保證文庫質(zhì)量。庫檢合格后進(jìn)行Illumina HiSeq TM PE150測序。
1.2.4生物信息分析 對(duì)測序得到的原始數(shù)據(jù)(raw data)進(jìn)行質(zhì)控得到可用數(shù)據(jù)(clean data);根據(jù)比對(duì)結(jié)果,進(jìn)行SNP、InDel的檢測及注釋,從而得到每個(gè)樣本的SNP數(shù)據(jù),初步確定株高候選基因。
1.2.5株高候選基因植物表達(dá)載體構(gòu)建 根據(jù)植物表達(dá)載體35s-redkan的多克隆位點(diǎn)AseⅠ和BamHⅠ兩側(cè)同源序列,設(shè)計(jì)帶有載體同源序列的引物(LuCWINV1-Fi:5’-ACGCGTAAGGGG-ATCCGGTGCACAATGGAATTTACCA;LuCWINV1-Ri:5’-CGGGTCTAGAGAATTCGGTTCACCATTCG-GGAGTATC)用于擴(kuò)增包含載體接頭的LuCWINV-1序列。采用Minibest Plant RNA Extraction試劑盒(TaKaRa)提取親本總RNA,反轉(zhuǎn)錄得到cDNA后進(jìn)行擴(kuò)增。擴(kuò)增體系:LuCWINV1-Fi/Ri引物各0.5 μL(10 μmol·L-1),模板2 μL,2×EasyTaqPCR SuperMix 25 μL,ddH2O 22 μL。反應(yīng)程序:94 ℃預(yù)變性3 min;94 ℃變性10 s,56 ℃退火5 s,72 ℃延伸5 min,35個(gè)循環(huán);72 ℃再延伸5 min,4 ℃保存。經(jīng)10 g·L-1瓊脂糖凝膠電泳檢測擴(kuò)增產(chǎn)物。PCR產(chǎn)物和酶切產(chǎn)物分別經(jīng)切膠純化后,以35s-redkan植物表達(dá)載體,用In-Fusion HD Cloning Kit連接并轉(zhuǎn)化大腸桿菌,用含有50 mg·L-1Kan的LB平板篩選陽性克隆。
1.2.6擬南芥的遺傳轉(zhuǎn)化 利用凍融法將構(gòu)建好的載體轉(zhuǎn)入農(nóng)桿菌EH105中,采用蘸花法進(jìn)行擬南芥的遺傳轉(zhuǎn)化[17]。構(gòu)建好的植物表達(dá)載體35S-Redkan-LuCWINV1-1Hei和35S-Redkan-LuCWINV1-1Mac具有紅光選擇標(biāo)記,在綠色光源下,用紅色眼鏡觀察收獲的轉(zhuǎn)基因種子會(huì)發(fā)出紅光。在擬南芥培養(yǎng)室中種植轉(zhuǎn)基因擬南芥陽性株系,觀察T3代純合株系的表型。當(dāng)擬南芥生長至株高不再增加時(shí),測量其株高。
結(jié)合甘肅蘭州和景泰及云南元謀的三個(gè)地區(qū)株高數(shù)據(jù),分析不同環(huán)境下的RIL群體株高分布情況。結(jié)果表明,在4個(gè)環(huán)境中,黑亞14號(hào)株高均比Macbeth高,且在4個(gè)環(huán)境中的RIL群體株高表型分布均為正態(tài)分布(圖1)。選取4個(gè)環(huán)境中均表現(xiàn)為高株和低株的胡麻株系各15株分別作為高/低單株池,用于胡麻株高QTL定位。
注:實(shí)心和空心箭頭分別為父本黑亞14號(hào)和母本Macbeth。
對(duì)胡麻RIL群體高、低株混池及父、母本進(jìn)行重測序,檢測變異位點(diǎn)。結(jié)果顯示,測序樣品在胡麻基因組上覆蓋率為84.62%~89.71%,測序平均覆蓋深度為13.15~15.39(表1)。據(jù)統(tǒng)計(jì),基因上發(fā)生SNP位點(diǎn)突變的總數(shù)量為362 347個(gè),其中SNP發(fā)生在基因上游的有29 492個(gè),發(fā)生在外顯子上的有45 418個(gè),發(fā)生在內(nèi)含子上的有44 616個(gè),發(fā)生在可變剪接區(qū)的有138個(gè),發(fā)生在基因下游的有27 319個(gè),發(fā)生在基因間隔區(qū)的有209 051個(gè)。發(fā)生在外顯子上的突變包括導(dǎo)致翻譯提前終止的有348個(gè),導(dǎo)致翻譯延后終止的有98個(gè),同義突變22 602個(gè)以及非同義突變22 370個(gè)(表2)。
表1 測序深度及覆蓋度
表2 SNP檢測及注釋結(jié)果
本研究將QTL-seq方法得到的結(jié)果與前期傳統(tǒng)QTL定位結(jié)果[18]結(jié)合起來分析發(fā)現(xiàn),位于14連鎖群上的主效QTL定位在scaffold 603上,同時(shí)在delta-SNP index上分析發(fā)現(xiàn)位于scaffold 603上的基因Lus10015614在其上游區(qū)(49 861 bp)存在SNP位點(diǎn),將該基因作為候選基因。
從phytozome數(shù)據(jù)庫中下載得到Lus10015614的基因組和cDNA序列。該基因序列與擬南芥At3g13790(Atwinv1)匹配度非常高(67%),擬南芥At3g13790為細(xì)胞壁轉(zhuǎn)化酶(cell wall invertase),將胡麻中l(wèi)us10015614.g命名為LuCWINV1-1。phytozome數(shù)據(jù)庫中LuCWINV1-1的基因長度為3 818 bp,編碼區(qū)長度為1 749 bp。設(shè)計(jì)引物在黑亞14(父本)和Macbeth(母本)的LuCWINV1的基因組和cDNA中擴(kuò)增,得到了和目標(biāo)大小相同的片段,測序后對(duì)序列進(jìn)行分析。
測序結(jié)果顯示,黑亞14號(hào)和Macbeth中該基因的長度均為3 818 bp,但是序列不完全一致,兩個(gè)親本的氨基酸序列共有2個(gè)氨基酸發(fā)生改變,導(dǎo)致Macbeth中第21位的谷氨酸和第523位異亮氨酸在黑亞14中分別為甘氨酸和丙氨酸。
為了研究LuCWINV1-1在胡麻中的表達(dá)模式,本研究選取不同時(shí)期和不同組織的RIL群體親本胡麻植株進(jìn)行熒光定量分析。胡麻在第3~7周為快速生長期,第7周處于快速生長期后期。結(jié)果顯示,生長2~6周的黑亞14號(hào)和Macbeth的葉片和莖中LuCWINV1-1的表達(dá)量處于較低水平,同時(shí)在這兩個(gè)品種之間沒有很大差異。在胡麻快速生長后期(第7周)和成熟期(第8和9周),LuCWINV1-1的表達(dá)量大幅增加。此外,黑亞14號(hào)在第9周時(shí)與之前相比葉中LuCWINV1-1的表達(dá)量顯著增加,但是不如Macbeth的葉片中同一時(shí)期的表達(dá)量高(圖2)。
圖2 黑亞14號(hào)和Macbeth不同組織不同時(shí)期LuCWINV1-1表達(dá)量
將胡麻黑亞14號(hào)和Macbeth中的LuCWINV1-1基因通過農(nóng)桿菌介導(dǎo)的蘸花法遺傳轉(zhuǎn)化擬南芥,獲得T3代純合轉(zhuǎn)基因株系,以野生型擬南芥為對(duì)照比較株高表型。
統(tǒng)計(jì)結(jié)果表明,與野生型擬南芥相比,4個(gè)LuCWINV1-1Mac轉(zhuǎn)基因株系(6F-1、6F-2、6F-4和6F-6)的株高表現(xiàn)為極顯著降低;4個(gè)LuCWINV1-1Hei轉(zhuǎn)基因株系(6M-10、6M-11、6M-12和6M-14)的株高表現(xiàn)為極顯著增加,1個(gè)LuCWINV1-1Hei轉(zhuǎn)基因株系(6M-13)表現(xiàn)為顯著增加(圖3,表3)。綜上所述,LuCWINV1-1對(duì)胡麻株高的解析具有重要意義,可用于后續(xù)研究。
表3 轉(zhuǎn)基因擬南芥和野生型株高統(tǒng)計(jì)
圖3 LuCWINV1-1Hei和LuCWINV1-1Mac轉(zhuǎn)基因株系表型
QTL-seq是植物中快速有效定位QTL的方法之一,隨著高通量測序技術(shù)的快速發(fā)展和測序價(jià)格的降低,近年來已成功應(yīng)用于多種植物中。胡麻為二倍體作物,基因組相對(duì)較小,但目前還沒有QTL-seq方法應(yīng)用于胡麻QTL研究的相關(guān)報(bào)道。本研究以胡麻RIL群體(Macbeth×黑亞14號(hào))為材料,利用QTL-seq成功檢測了控制胡麻株高性狀的QTL。在scaffold2096、scaffold2057和scaffold228等10個(gè)不同的scaffold上共檢測到10個(gè)與株高有關(guān)的QTL。本研究根據(jù)群體內(nèi)各株系的株高表型數(shù)據(jù)構(gòu)建兩個(gè)極端表型的混池,將QTL-seq方法應(yīng)用于胡麻QTL的定位研究中。由于作物數(shù)量性狀易受環(huán)境影響,本研究結(jié)合多年多點(diǎn)的表型數(shù)據(jù)進(jìn)行基因池的構(gòu)建,排除了環(huán)境的干擾,提高了QTL定位的精度。在利用測序QTL-seq尋找差異SNP位點(diǎn)時(shí),測序數(shù)據(jù)的深度及基因組覆蓋度為能否找到合適SNP位點(diǎn)的關(guān)鍵因素。平均測序深度達(dá)到10×以上,能有效找到合適的SNP位點(diǎn)。因此,在不同作物利用QTL-seq方法進(jìn)行SNP關(guān)聯(lián)位點(diǎn)分析時(shí)要根據(jù)基因組倍性、大小等因素來設(shè)計(jì)合適的測序倍數(shù)來進(jìn)行。本研究結(jié)果表明,QTL-seq應(yīng)用于胡麻QTL定位研究的可行性,為以后快速定位控制胡麻重要性狀的基因提供了基礎(chǔ)。
通過與擬南芥、水稻基因組序列進(jìn)行比較發(fā)現(xiàn),本研究定位的LuCWINV1-1屬于酸性轉(zhuǎn)化酶中的細(xì)胞壁轉(zhuǎn)化酶,包含細(xì)胞壁轉(zhuǎn)化酶基因保守的結(jié)構(gòu)域NDPNG、RDP和MWECP。胡麻RIL群體親本黑亞14號(hào)和Macbeth中的LuCWINV1-1氨基酸序列不同,這預(yù)示著等位基因功能的變化可能是由于氨基酸的改變?cè)斐傻摹M南芥轉(zhuǎn)基因植株株高表型也初步證明了這一推斷,來自于Macbeth的等位基因?qū)牒笾仓曛旮呙黠@低于由黑亞14號(hào)的等位基因?qū)牒笾仓甑闹旮摺T跀M南芥中也發(fā)現(xiàn),轉(zhuǎn)化酶家族與植株生長發(fā)育有關(guān),轉(zhuǎn)化酶的缺失會(huì)導(dǎo)致擬南芥生長發(fā)育速度減慢,根長變短,植株變矮,發(fā)芽和開花受到影響,植株生物量減少[19-23],本研究所鑒定的胡麻LuCWINV1-1基因具有潛在研究價(jià)值。