鞏文靚,康雪蒙,馬夢影,段海燕*,姜恭好*
(1.黑龍江大學(xué)生命科學(xué)學(xué)院,黑龍江哈爾濱150080;2.黑龍江大學(xué)農(nóng)業(yè)資源與環(huán)境學(xué)院,黑龍江哈爾濱150080)
亞麻(Linum usitatissimum.L)是亞麻科亞麻屬一年生草本植物,是在世界范圍內(nèi)廣泛栽培的經(jīng)濟作物,我國新疆、黑龍江、內(nèi)蒙古等多地均有種植。根據(jù)用途,可將亞麻分為油用亞麻、纖維用亞麻和油纖兼用三種。油用亞麻又稱胡麻,是我國五大油料作物之一。亞麻籽油中含有大量α-亞麻酸、亞油酸和木酚素等,目前越來越多地被應(yīng)用于醫(yī)療保健領(lǐng)域。亞麻纖維具有強韌、柔細、吸濕、透氣等優(yōu)良性狀,早在約3萬年前即被用于紡織[1-2]。在麻類紡織纖維貿(mào)易中,亞麻占比超過70%[3]。除食品、醫(yī)療保健和紡織外,亞麻在其他領(lǐng)域同樣具有很高的經(jīng)濟價值。亞麻餅粕中粗蛋白質(zhì)和總磷含量高,可作為家禽飼料使用[4];亞麻籽油可作為保濕劑和調(diào)理劑添加到護膚和護發(fā)產(chǎn)品中[5];亞麻屑可用作杏鮑菇的栽培主料,并能使出菇期縮短[6];亞麻對重金屬有較強的耐受能力和吸附能力,可用于重金屬污染土壤的修復(fù)治理[7]等。
隨著分子標(biāo)記技術(shù)的飛速發(fā)展,SSR、SNP、RFLP、SRAP等分子標(biāo)記越來越多地被應(yīng)用于亞麻遺傳連鎖圖譜的構(gòu)建和數(shù)量性狀位點(quantitative trait loci,QTL)定位中。亞麻的多數(shù)農(nóng)藝性狀,如品質(zhì)、產(chǎn)量、抗病性等,均由QTL控制,因此利用分子標(biāo)記快速高效地進行高密度遺傳連鎖圖譜構(gòu)建和重要農(nóng)藝性狀QTL定位逐漸成為亞麻育種研究中一個重要方向。此外,由于效率高、構(gòu)建群體所需時間短等優(yōu)點,利用全基因組關(guān)聯(lián)分析(genome-wide association study,GWAS)定位QTL也越來越受到研究者的青睞。至2015年,我國已成為亞麻籽第二進口國[8],亞麻纖維第一進口國[3],加快亞麻育種速度,豐富亞麻優(yōu)良種質(zhì)資源,將有助于緩解我國亞麻產(chǎn)需缺口不斷擴大的現(xiàn)狀。
遺傳連鎖圖譜(genetic linkagemap)是根據(jù)連鎖的遺傳標(biāo)記間的重組頻率確定其相對位置所得到的線性排列圖,是QTL定位的重要依據(jù),也是分子標(biāo)記輔助育種的有力工具之一。
用于構(gòu)建遺傳連鎖圖譜的群體分為暫時性分離群體和永久性分離群體兩大類。F2群體是暫時性分離群體中最為常用的作圖群體,因其省時省力的特性而被廣泛用于構(gòu)建遺傳圖譜。但F2群體中的雜合子要求研究者盡量使用共顯性標(biāo)記才能區(qū)分群體基因型,并且F2群體很難保持遺傳結(jié)構(gòu),這兩個缺點使得F2群體無法成為作圖群體的最佳選擇,因此研究者越來越傾向于使用雙單倍體(doubled haploid,DH)群體和重組自交系(recombinant inbreed lines,RIL)群體等永久性分離群體。盡管永久性群體遺傳結(jié)構(gòu)穩(wěn)定,但DH群體構(gòu)建過程復(fù)雜,RIL群體構(gòu)建耗時長,因此目前已有的亞麻遺傳圖譜仍有半數(shù)以上是基于F2群體構(gòu)建的(見表1)。
2000年,OH等[9]利用RFLP和RAPD標(biāo)記構(gòu)建了包含15個連鎖群、覆蓋總長度為1000 cm的遺傳圖譜。然而RAPD標(biāo)記的穩(wěn)定性和重復(fù)性不甚理想,因此近十年構(gòu)建的亞麻遺傳圖譜大多數(shù)使用數(shù)量豐富、可重復(fù)性好的SSR標(biāo)記。此外,高通量測序技術(shù),尤其是簡化基因組測序技術(shù)的發(fā)展為亞麻高密度遺傳圖譜的構(gòu)建帶來了極大便利。2017年,Yi等[10]基于SLAF-seq技術(shù)構(gòu)建出包含4145個SNP標(biāo)記和15個連鎖群、標(biāo)記間平均距離僅為0.64 cm的高密度遺傳圖譜。Wu等[11]在2018年利用SLAF標(biāo)簽進行遺傳圖譜構(gòu)建,得到總長度為1483.25 cm、標(biāo)記間距為0.63 cm的遺傳連鎖圖譜,是目前密度最高的亞麻遺傳連鎖圖譜。
表1 亞麻遺傳連鎖圖譜構(gòu)建情況Table 1 Construction of genetic linkagemaps of flax
續(xù)表1
油用亞麻主要農(nóng)藝性狀包括產(chǎn)量相關(guān)性狀,如種子產(chǎn)量、千粒重、單株果數(shù)、單株粒重、單果粒數(shù)等,以及亞麻籽品質(zhì)相關(guān)性狀,如粗脂肪、亞麻酸、亞油酸、硬脂酸、油酸等。Cloutier等[13]利用SSR標(biāo)記定位到與亞麻酸、亞油酸、碘值、棕櫚酸相關(guān)的QTL共7個,其中,與亞麻酸相關(guān)的2個QTL分別解釋了25%和約20%的表型變異;與亞油酸相關(guān)的2個QTL解釋了約54%的表型變異;與碘值相關(guān)的QTL有2個,分別解釋約29%和13%的表型變異;與棕櫚酸相關(guān)的1個QTL解釋表型變異率約為42%。姜碩[16]基于SRAP標(biāo)記檢測到4個與下部分枝相關(guān)的QTL,14個與上部分枝相關(guān)的QTL,以及與百粒重相關(guān)的8個微效QTL。Kumar等[19]定位到與粗脂肪、蛋白質(zhì)含量、亞麻酸、棕櫚酸相關(guān)QTL各1個;亞油酸、碘值相關(guān)QTL各2個;硬脂酸、油酸相關(guān)QTL各3個。除亞麻籽品質(zhì)性狀對應(yīng)QTL外,還鑒定到與產(chǎn)量、每果粒數(shù)、千粒重、成熟期性狀相關(guān)QTL各1個。Chandrawati等[20]檢測到1個分枝數(shù)相關(guān)QTL,解釋4.64%的表型變異;3個單株果數(shù)相關(guān)QTL,分別解釋6.92%、6.27%、1.49%的表型變異;1個單株粒重相關(guān)QTL,解釋表型變異率為10.3%;2個每果粒數(shù)相關(guān)QTL,分別解釋11.1%和12.75%表型變異;2個粗脂肪相關(guān)QTL,解釋表型變異率分別為0.84%和8.39%。Wu等[11]定位到3個與種子產(chǎn)量相關(guān)的QTL,解釋表型變異率為10.11%~19.33%。高鳳云[22]利用簡化基因組SLAF測序技術(shù)開發(fā)SNP標(biāo)記,檢測出與單株果數(shù)、果粒數(shù)、單株粒重、油酸相關(guān)QTL各1個;分枝數(shù)、硬脂酸相關(guān)QTL各2個;棕櫚酸相關(guān)QTL3個;亞麻酸、千粒重相關(guān)QTL各4個;亞油酸、粗脂肪相關(guān)QTL各5個。
纖維相關(guān)性狀主要包括株高、工藝長度、纖維含量、原莖重等。姜碩[16]利用復(fù)合作圖法檢測出1個與莖粗相關(guān)的微效基因;3個與株高相關(guān)的具有加性效應(yīng)的QTL;4個與工藝長度有關(guān)的QTL;3個與主莖原莖重相關(guān)的主效基因;3個表現(xiàn)出顯性效應(yīng)的與主莖纖維重相關(guān)的QTL;與纖維含量相關(guān)的3個主效基因和1個微效基因。Kumar等[19]定位到與原莖重和細胞壁相關(guān)的QTL各1個,對表型的解釋率分別為30%和14%。Chandrawati等[20]定位到2個與株高相關(guān)的QTL,其中1個解釋了15.23%的表型變異。高鳳云[22]檢測到3個與株高相關(guān)的QTL,包括1個加效基因和2個減效基因;此外還檢測到3個與工藝長度相關(guān)的QTL,包括2個加效基因和1個減效基因。宋夏夏[23]通過基因組重測序初步確定10個與株高相關(guān)的QTL,并通過結(jié)合傳統(tǒng)QTL定位方法,確定其中1個為株高主效基因。Wu等[11]對亞麻纖維相關(guān)的性狀進行QTL定位,分析得到1個與株高相關(guān)的QTL,解釋了18.77%的表型變異;1個與工藝長度相關(guān)的QTL,表型解釋率為11.17%;3個與原莖產(chǎn)量相關(guān)的QTL,解釋表型變異率范圍為10.91%~15.81%;2個與纖維產(chǎn)量相關(guān)的QTL,分別解釋19.09%和25.98%的表型變異;2個與纖維含量相關(guān)的QTL,分別解釋15.14%和13.27%的表型變異。Zhang等[21]構(gòu)建了一張整合圖譜,并利用其定位到與株高和工藝長度相關(guān)的共19個QTL,其中5個QTL為兩個性狀共用。
亞麻的主要病害包括銹病、白粉病、枯萎病、派斯莫病等10余種[24],其中大部分由真菌侵染所引起。這些病害可導(dǎo)致亞麻的品質(zhì)受損和產(chǎn)量降低,嚴(yán)重影響其經(jīng)濟效益,但關(guān)于亞麻抗病害的QTL定位研究相對較少。Spielmeyer等[12]定位到2個與枯萎病抗性相關(guān)的QTL,這也是亞麻最早定位到的QTL,其表型解釋率分別為38%和26%。Asgarinia等[18]利用SSR標(biāo)記構(gòu)建遺傳連鎖圖譜并定位到3個與抗白粉病相關(guān)的QTL,共解釋了97%的表型變異。
除上述重要農(nóng)藝性狀外,還有一些其他農(nóng)藝性狀相關(guān)QTL被定位。Cloutier等[13]鑒定出2個與種子顏色相關(guān)的QTL,其中,與亮度相關(guān)的QTL解釋了72%的表型變異,與黃色色度相關(guān)的QTL解釋了79%的表型變異。姜碩[16]定位到與初花日數(shù)相關(guān)的13個QTL,9個與花色相關(guān)的QTL,7個與裂果相關(guān)的QTL。Sudarshan等[25]定位到1個與花色和種皮顏色相關(guān)的基因“D”,并對其相關(guān)代謝機理進行了研究。
GWAS又稱關(guān)聯(lián)作圖,區(qū)別于傳統(tǒng)QTL原理,GWAS是基于連鎖不平衡的原理鑒定目標(biāo)性狀候選基因。隨著高通量測序技術(shù)不斷成熟、成本不斷下降,GWAS定位QTL的成本也不斷降低。GWAS通常選擇自然群體作為材料,因此相對傳統(tǒng)QTL定位要求的遺傳群體所需的構(gòu)建時間更短。此外,GWAS還具有效率高、精度高等優(yōu)點,因此越來越多的研究者傾向于利用GWAS來定位QTL。
近5年來,GWAS在亞麻的農(nóng)藝性狀QTL研究中也得到了應(yīng)用。Soto-Cerda等[26]2014年對390份加拿大亞麻核心種質(zhì)材料進行關(guān)聯(lián)作圖,確定了與6個農(nóng)藝性狀關(guān)聯(lián)的12個標(biāo)記位點,其中位于LG6的兩個標(biāo)記位點確定了與抗倒伏相關(guān)的1個QTL。隨后,Soto-Cerda等[27]又通過關(guān)聯(lián)作圖鑒定出與粗脂肪、硬脂酸、亞油酸、亞麻酸、碘值5個種子品質(zhì)性狀相關(guān)的9個QTL。2018年,Soto-Cerda等[28]利用200份亞麻種質(zhì)材料針對亞麻籽粘質(zhì)物含量(mucilage content,MC)和亞麻籽殼含量(hull content,HC)兩個性狀進行GWAS,利用GLM-PCA模型進行分析,鑒定出分別與兩個性狀相關(guān)聯(lián)的12個和17個SNP位點,確定了與MC相關(guān)的7個QTL和與HC相關(guān)的4個QTL,并參考擬南芥的相關(guān)基因信息預(yù)測了幾個候選基因。
Xie等[29]利用SLAF-seq技術(shù)對224份核心亞麻種質(zhì)進行GWAS,首先鑒定出與株高、工藝長度、分枝數(shù)、單株果數(shù)、千粒重相關(guān)的SNP位點共42個,并利用GLM和MLM模型在這些SNP位點的10 kb范圍內(nèi)篩選出15個候選基因,確定UGT和PL為株高的候選基因,GRAS和XTH為分枝數(shù)的候選基因,Contig1437和LU0019C12為單株果數(shù)的候選基因,PHO1為千粒重的候選基因。隨后又對13個農(nóng)藝性狀進行分析,利用EMMAX模型鑒定出與油6個農(nóng)藝性狀相關(guān)的16個SNP位點,并預(yù)測了棕櫚酸和亞油酸的候選基因;利用GLM模型檢測出與纖維相關(guān)性狀相關(guān)聯(lián)的幾個位點,預(yù)測了出麻率和株高的候選基因;利用轉(zhuǎn)錄組分析預(yù)測了粗脂肪和千粒重的候選基因[30]。此外,Xie等[31]還通過GWAS檢測到與亞麻籽脂肪酸含量相關(guān)的16個SNP位點,并結(jié)合RNA-seq分析和比對KEGG數(shù)據(jù)庫,在10個候選基因中篩選出包含在重要脂肪酸代謝途徑中的6個候選基因。
You等[32]利用GLM和MLM模型在260個亞麻品系中共鑒定出33個QTL,包括種子產(chǎn)量相關(guān)QTL 1個,粗脂肪相關(guān)QTL 8個,株高相關(guān)QTL 5個,棕櫚酸相關(guān)QTL 4個,碘值、亞油酸、亞麻酸相關(guān)QTL各3個,成熟期、硬脂酸相關(guān)QTL各2個,蛋白質(zhì)含量、油酸相關(guān)QTL各1個,其中粗脂肪、碘值、棕櫚酸、亞油酸、亞麻酸相關(guān)QTL解釋了48%~73%的表型變異。He等[33]對370份亞麻核心種質(zhì)材料進行GWAS分析,鑒定到67個與抗派斯莫病相關(guān)的QTL,解釋了總變異的32%~64%。伊六喜等[34]以269份亞麻種質(zhì)材料為GWAS分析對象,得到與木酚素含量相關(guān)的13個SNP位點,并預(yù)測了21個候選基因。
截至目前,已發(fā)表的亞麻遺傳連鎖圖譜已有十余張,其中不乏高密度遺傳圖譜,但多數(shù)圖譜是基于F2等臨時群體構(gòu)建的,在可靠性、可重復(fù)性以及檢測微效基因的能力方面存在一定的缺陷。因此今后的研究中,應(yīng)盡量采用RIL、DH等永久群體。此外,為滿足精細作圖的需求,研究中還應(yīng)增加次級作圖群體如殘留異質(zhì)系(residual heterozygous lines,RHLs)群體和近等基因系(near isogenic lines,NILs)群體的構(gòu)建。
利用GWAS定位作物QTL的方法相對于傳統(tǒng)QTL定位方法雖然有一定優(yōu)勢,但同時也存在假陽性等問題。對此,可采用傳統(tǒng)QTL作圖與GWAS結(jié)合的方式,或采用構(gòu)建同時具有連鎖分析和關(guān)聯(lián)作圖優(yōu)點的復(fù)雜群體如巢式關(guān)聯(lián)作圖(nested association mapping,NAM)群體等方式。
盡管亞麻相當(dāng)一部分性狀由QTL控制,但相對于水稻等作物來說,亞麻QTL的研究數(shù)量仍然較少。You等[35]整合了目前為止發(fā)表的13篇英文文獻中的297個亞麻QTL,并成功地將195個QTL映射到同一套假染色體上,這無疑為后續(xù)的QTL定位、功能分析以及相關(guān)育種工作提供了便利。目前鑒定的QTL中以油用亞麻性狀相關(guān)QTL為主,其次是纖維相關(guān)性狀QTL,與抗逆性相關(guān)的QTL較少,僅有與抗白粉病、抗派斯莫病、抗枯萎病相關(guān)的QTL,更多的抗逆性相關(guān)QTL以及其他重要農(nóng)藝性狀相關(guān)QTL仍有待于發(fā)掘。
此外,亞麻遺傳連鎖圖譜的構(gòu)建及后續(xù)QTL定位旨在加速優(yōu)化亞麻育種進程,但基于這些研究的后續(xù)應(yīng)用為數(shù)尚少。目前亞麻已定位到油用性狀、纖維相關(guān)性狀、抗病性狀等農(nóng)藝性狀的QTL,但相關(guān)的基因克隆、基因功能驗證及優(yōu)良基因遺傳轉(zhuǎn)化等工作仍需進一步研究。