王子玥,甄 艷,劉光欣,席夢利
(南京林業(yè)大學,南方現(xiàn)代林業(yè)協(xié)同創(chuàng)新中心,林木遺傳與生物技術省部共建教育部重點實驗室,江蘇 南京 210037)
真核生物的染色體由DNA分子繞組蛋白八聚體1.75圈形成的核小體結構進一步折疊形成[1]。通常情況下組蛋白八聚體上纏繞的DNA(core DNA)不能與轉錄因子(transcription factor, TF)結合,而位于核小體之間的DNA(linker DNA)因未與核心組蛋白纏繞而處于相對裸露狀態(tài)[2-3],這些裸露區(qū)域有利于TF結合,該區(qū)域被稱為可及性染色質(zhì)區(qū)域(accessibility chromatin regions, ACRs)或開放染色質(zhì)(open chromatin)。真核生物可及性染色質(zhì)區(qū)域占總基因組 DNA 序列的 2%~3%,且該區(qū)域超過 90%與轉錄因子的結合相關。染色質(zhì)這種允許其他調(diào)控因子結合的特性稱為染色質(zhì)可及性(chromatin accessibility)[4]。植物作為固著生物,可以通過形態(tài)、生理和生化過程的調(diào)控等多種方式來適應環(huán)境的變化[5],其中轉錄水平的調(diào)控是最主要的調(diào)控方式。只有當轉錄因子與相應的順式調(diào)控元件(cis-regulatory elements, CREs)相互作用才能有效調(diào)控轉錄,CREs一般包括啟動子、增強子、抑制子等[6]。因此,研究染色質(zhì)可及性區(qū)域?qū)D錄調(diào)控元件的鑒定、轉錄因子結合位點的識別及基因表達調(diào)控的解析等方面都具有重要意義。
染色質(zhì)可及性區(qū)域因其裸露特性,對DNase Ⅰ和Tn5轉座酶都表現(xiàn)出高度敏感性。研究者最初采用Southern 雜交技術鑒定DNase Ⅰ的高敏感位點(DNase Ⅰ hypersensitive sites, DHSs),但該技術費時費力,且只適用于分析單個酶切位點或短的DNA序列[7-8]。隨著高通量測序技術的發(fā)展及人們對染色質(zhì)可及性區(qū)域了解的增強,現(xiàn)已衍生出許多鑒定染色質(zhì)可及性的研究方法,主要包括脫氧核糖核酸酶Ⅰ超敏感位點測序(deoxyribonuclease Ⅰ hypersensitive site sequencing, DNase-seq)[9]、甲醛輔助性調(diào)控元件分離測序(formaldehyde-assisted isolation of regulatory elements followed by sequencing, FAIRE-seq)[10]、微球菌核酸酶輔助分離核小體測序 (micrococcal nuclease-assisted isolation of nucleosomes sequencing, MNase-seq)[11]、核小體定位和甲基化組測序 (nucleosome occupancy and methylome sequencing, NOMe-seq)[12]以及染色質(zhì)轉座酶可及性測序 (assay for transposase-accessible chromatin with high-throughput sequencing, ATAC-seq)[13]。根據(jù)獲取染色質(zhì)可及性區(qū)域的方式,可將這些方法分為兩類:第1類是直接對染色質(zhì)可及性區(qū)域進行測定,主要有DNase-seq、ATAC-seq和FAIRE-seq;第2類是通過定位核小體,從而間接測定可及性區(qū)域,包括MNase-seq和NOMe-seq。DNase-seq建庫較為煩瑣,且難以檢測到與染色質(zhì)結合時間較短的轉錄因子[14]。FAIRE-seq方法中甲醛與DNA交聯(lián)條件難以把握,MNase-seq受酶濃度和切割溫度影響較大,NOMe-seq則需要大量的測序讀數(shù)。這4種技術還有一個共同的局限性,即需要的細胞核數(shù)量均巨大(表1)。
表1 5種研究染色質(zhì)可及性方法的比較
2013年,Buenrostro 等[13]利用Tn5轉座酶開發(fā)的ATAC-seq具有所需細胞數(shù)量少、建庫簡便、重復性好等優(yōu)點。因此,該技術已成為進行真核生物全基因組染色質(zhì)可及性研究最有效的方法。利用該方法已經(jīng)在人類和動物中成功構建了全基因組的染色質(zhì)可及性圖譜,為揭示基因表達調(diào)控機制、識別轉錄因子及其同源轉錄因子結合位點奠定了堅實的基礎。然而,與動物細胞相比,植物細胞受到細胞壁和葉綠體的干擾,細胞核不易獲得,導致在植物上開展的染色質(zhì)可及性的研究嚴重滯后于動物。筆者主要概述了ATAC-seq技術在植物中的應用情況,展望了ATAC-seq在植物中的應用潛力,以推動ATAC-seq在植物表觀基因組學研究中的應用。
ATAC-seq利用DNA轉座子的原理[15],將帶有已知DNA序列標簽的Tn5轉座酶與DNA進行孵育,在“剪切和黏貼”機制下[16],將裸露的DNA片段在轉座酶的作用下置換出來,然后通過特異標簽引物構建測序文庫來鑒定全基因組ACRs或開放染色質(zhì)區(qū)域(圖1)。
圖1 ATAC-seq原理示意圖Fig.1 The schematic of ATAC-seq principle
染色質(zhì)可及ATAC-seq文庫的構建主要包括3個步驟:①核制備??刹捎靡旱心シɑ驒C械切割法,液氮研磨會導致組織完全破碎,易產(chǎn)生更多的組織碎片[17];若采用切割法,需要將所有的試劑及器皿冷卻到4 ℃,以最大限度保證核膜的完整性[18]。②轉座并純化。將提取的細胞核立即重懸于轉座酶反應混合物中以產(chǎn)生DNA片段,隨后利用試劑盒純化DNA。③PCR擴增及文庫構建。純化的DNA片段PCR擴增以構建文庫,文庫擴增所需的最佳循環(huán)數(shù),需要用qPCR確定[19],符合要求的文庫即可在高通量測序平臺上測序[20]。2016年,Lu等[21]首次將ATAC-seq應用到植物中,繪制了擬南芥(Arabidopsisthaliana)根部的染色質(zhì)圖譜。目前該方法已在水稻(Oryzasativa)、番茄(Solanumlycopersicum)、小麥(Triticumaestivum)和高粱(Sorghumbicolor)等植物中成功運用[22-25]。
與DNase-seq、FAIRE-seq、MNase-seq及NOMe-seq相比,ATAC-seq有3個優(yōu)點:① 所需的樣品量少,500~5 000個細胞就可以建庫測序,樣品量減少了將近1 000倍;② 實驗操作相對簡單,2~3 h就可以完成建庫工作;③ 結果可信度高,重復性好[26]。ATAC-seq技術也存在局限性,主要包括以下3個方面:首先是細胞器DNA對核基因組的干擾。對于植物來說,分離細胞核時會受到細胞器DNA的干擾,因為Tn5轉座酶作用于核外的遺傳物質(zhì)[21, 27-28],從而降低了核基因組的測序讀數(shù)比例,減少了可用于識別開放染色質(zhì)區(qū)域的信息量。其次,Tn5插入事件及PCR重復對實驗的影響[29]。ATAC-seq需采用PCR擴增構建文庫,然而無法準確識別相同的片段是由 PCR 擴增所產(chǎn)生,還是由不同的Tn5 插入在相同位置上所產(chǎn)生。若在后續(xù)的分析中這些相同的片段被認為是PCR 擴增所引起的重復片段而被去除,將會對染色質(zhì)可及性區(qū)域及轉錄因子足跡的鑒定造成影響。最后,細胞異質(zhì)性的限制。細胞是生物體最基本的結構和功能單位,各細胞的基因表達模式是不同的,由于分離單個細胞技術平臺的限制,常規(guī)測序獲得的是群體細胞平均染色質(zhì)的狀態(tài),忽略了細胞的異質(zhì)性。然而,一些重要生物學過程的發(fā)生往往是單個細胞在功能上產(chǎn)生了突變而導致的結果,因此在單細胞層面上研究染色質(zhì)可及性,對解析生物體發(fā)育、分化等基礎生物學問題尤為重要。
ATAC-seq技術雖然擺脫了像其他技術需要大量起始材料及長時間等條件的限制,但仍然有影響其準確性的因素[28],如細胞器DNA、PCR重復及細胞異質(zhì)性等。為解決這些問題,研究人員從3個方面提出了優(yōu)化方案。
細胞核是一種高度特化、復雜的細胞器[30],它既是遺傳信息庫,也是細胞代謝和遺傳的控制中心,獲得高質(zhì)量的細胞核是進行ATAC-seq實驗的基礎。不同細胞核提取方法采用的步驟相似,主要包括組織破碎、過濾、離心、溶解及密度梯度離心[31]。為了降低葉綠體和線粒體DNA對實驗的干擾,曲瑞紅[32]和Bajic等[19]均采用了蔗糖密度梯度離心來分離細胞核。不同的是前者利用酶解法釋放原生質(zhì)體,再通過梯度離心法收集細胞核。而后者先采用含有非離子表面活性劑的裂解緩沖液裂解細胞器,然后用sucrose sedimentation (crude)來純化細胞核。Deal等[33]開發(fā)了特定細胞類型標記的細胞核分離方法(isolation of nuclei tagged in specific cell types, INTACT),主要包括轉基因植物載體構建、生物素連接酶標記和磁珠分離純化3個步驟。Lu等[21]將熒光激活核分選(fluorescence-activated nuclei sorting, FANS)[34]技術引入到ATAC-seq中,確保了提取所得細胞核的完整性,且制備用于流式細胞術的樣品只需組織破碎、過濾、離心3個步驟[35](表2)。
表2 3種純化細胞核方法的比較
圖2 Crude、INTACT和 FANS 純化的擬南芥根尖細胞核的ATAC-seq 讀數(shù)[21, 23]Fig.2 ATAC-Seq reads from Crude, INTACT and FANS-Purified arabidopsis root tip nucleus
Sucrose sedimentation、INTACT及FANS 3種制備細胞核的方法,映射到細胞核基因組的讀數(shù)占比有顯著差異。Crude-ATAC-seq得到的結果約有52.52%映射到核基因組,47.48%映射到細胞器基因組;INTACT-ATAC-seq則有92.94%映射到核基因組,7.06%映射到細胞器基因組;FANS-ATAC-seq得到的結果則有78.70%映射到核基因組。因此,與Crude-ATAC-seq相比,F(xiàn)ANS-ATAC-seq和INTACT-ATAC-seq得到的測序讀數(shù)中細胞器基因組污染較少,數(shù)據(jù)利用率更高(圖2),且INTACT-ATAC-seq和FANS-ATAC-seq得到的結果與DNase-seq數(shù)據(jù)集相比,有很高的重疊率[23, 36]。此外,在擬南芥花序分生組織的側生器官建成細胞(lateral organ founder cells, LOFCs)中使用FANS-ATAC-seq檢測到的轉座酶高敏位點(transposase hypersensitive sites, THSs)和DHSs之間存在顯著的相關性[37-38],這些實驗結果均表明改進后的ATAC-seq可以得到高質(zhì)量的數(shù)據(jù)集。
Tn5轉座酶介導的ATAC-seq能夠優(yōu)先將測序接頭插入到“無核小體區(qū)域”以實現(xiàn)對染色質(zhì)可及性區(qū)域的捕獲。由于在建庫過程中需要進行PCR擴增,不同片段的擴增效率存在差異,會產(chǎn)生一些端點相同的重復片段,然而使用常規(guī)的ATAC-seq無法從這些重復片段中識別出獨立產(chǎn)生的相同Tn5插入片段[29],因此會丟失一些有用的片段從而影響染色質(zhì)可及性區(qū)域及轉錄因子足跡的鑒定。為了解決上述問題,Zhu等[29]將帶有TruSeq測序接頭的獨特分子標簽(unique molecular identifiers, UMIs)引入到標準的實驗流程中,建立了UMI-ATAC-seq 技術。該技術在PCR擴增之前給每個片段加上特有的標簽,經(jīng)過擴增測序后,只需把坐標一致并帶有相同標簽的片段當作PCR重復去掉即可。因此,UMI-ATAC-seq技術通過引入獨特分子標簽來挽回誤認為是PCR重復擴增而被去除的片段,而這些片段對于鑒定轉錄因子足跡有重要意義,研究發(fā)現(xiàn)基于獨特分子標簽去重的方法雖然只挽救了約6%的讀數(shù),但可以多鑒定出約50%的轉錄因子足跡,且這些足跡具有生物學意義[39]。此外,在構建單細胞轉錄組文庫時,也可以通過對每條轉錄本添加獨特分子標簽作為特定標記,進行基因表達定量分析,以解決cDNA擴增過程中PCR偏好問題[40]。與ATAC-seq相比,UMI-ATAC-seq具有成本低、實驗操作簡單等優(yōu)勢,能夠為精準識別染色質(zhì)可及性區(qū)域及轉錄因子足跡提供科學依據(jù),具有廣闊的應用前景。
傳統(tǒng)的組學通常是以整個器官或組織為整體進行測序,雖然可以在器官或組織水平上解析許多生物學問題,但掩蓋了細胞的異質(zhì)性[41]。隨著生物信息學分析方法及測序技術的迅速發(fā)展,衍生出單細胞ATAC-seq(single-cell ATAC-seq, scATAC-seq),研究人員可以在更精細的水平上揭示單個細胞分化過程中的染色質(zhì)可及性變化及基因轉錄活躍的部分。該技術目前已廣泛應用于生物學和醫(yī)學領域,并在植物學研究中顯示出巨大的潛力。Dorrity等[42]首次將scATAC-seq應用于植物領域并繪制了擬南芥根部的染色質(zhì)可及性圖譜,成功鑒定出擬南芥根部的主要細胞類型。另外,研究者發(fā)現(xiàn)在單細胞水平上進行多組學分析對于探究轉錄調(diào)控的潛在機制、建立順式調(diào)控元件與特定基因的調(diào)控關系及解釋復雜的生命現(xiàn)象等方面扮演重要的角色[39],相關研究表明細胞間異質(zhì)性的可及性區(qū)域與基因轉錄異質(zhì)性具有顯著相關性[43]。例如聯(lián)合scATAC-seq和單細胞轉錄組測序(single-cell RNA-seq, scRNA-seq)可以在單細胞水平上分析出所有活躍的調(diào)控序列,從而進一步研究其上游的轉錄因子。Famer等[44]為揭示染色質(zhì)可及性對基因表達的影響,整合了scRNA-seq和scATAC-seq的信息,發(fā)現(xiàn)擬南芥根組織細胞類型特異性標記基因表現(xiàn)出細胞類型特異性的染色質(zhì)可及性模式。近年來,研究人員開發(fā)了單細胞核染色質(zhì)可及性和mRNA測序技術(single-nucleus chromatin accessibility and mRNA expression sequencing, SNARE-seq)[45],該技術可以對單個細胞的轉錄組和染色質(zhì)可及性進行關聯(lián)測序。與單獨使用scRNA-seq和scATAC-seq相比,該方法能更準確且全面地描述單細胞的類型以及基因表達調(diào)控的差異。
目前,ATAC-seq技術在植物領域的研究應用主要集中在一些模式植物中,如擬南芥、水稻等,在落花生(Arachishypogaea)、黃花蒿(Artemisiaannua)、高粱及山葡萄(Vitisamurensis)等植物中也開展了少量相關研究。該技術主要應用于染色質(zhì)可及性圖譜繪制、抗逆機制解析、表觀修飾鑒定及調(diào)控元件識別等方面。
染色質(zhì)結構在確?;虮磉_的精確調(diào)控方面起著關鍵作用,而染色質(zhì)可及性在很大程度上決定了下游基因的表達變化,研究開放染色質(zhì)對于理解基因表達及轉錄因子調(diào)控網(wǎng)絡如何在植物中協(xié)調(diào)以促進分化、生長及發(fā)育至關重要。通過繪制染色質(zhì)可及性圖譜可以獲得與基因表達相關的染色質(zhì)特征、轉錄因子結合位點以及不同樣本間圖譜的動態(tài)變化。Zhou等[46]研究發(fā)現(xiàn),與青蒿素合成途徑相關的基因DBR2和CYP71AV1在青蒿腺毛中顯示出比在葉中更高的可及性,這為轉錄因子結合提供了場所,表明ACRs可能參與了相關基因的表達。Zhou等[22]對高粱葉片的ATAC-seq和RNA-seq數(shù)據(jù)進行綜合分析,得出表達水平較高的基因在轉錄起始位點(transcription start sites, TSSs)處為ACRs,因此推測富集在TSSs上的ACRs有助于基因轉錄的正調(diào)控。類似地,金晶[47]也證明了在水稻中基因表達越活躍染色質(zhì)開放水平越高這一現(xiàn)象。此外,可以通過分析不同細胞類型之間染色質(zhì)的可及性來推斷轉錄因子結合的差異,從而闡明細胞分化調(diào)控機制。Sijacic等[24]采用INTACT-ATAC-seq分別獲得了擬南芥莖頂端分生組織干細胞和葉肉細胞特異的ACRs,構建了兩個細胞類型特異性的轉錄因子調(diào)控網(wǎng)絡,發(fā)現(xiàn)與干細胞相關的轉錄因子參與了生長素介導的信號轉導,而與葉肉細胞相關的轉錄因子則控制葉片發(fā)育,結果表明不同類別的轉錄因子協(xié)同產(chǎn)生細胞類型特異性的轉錄組,并且在相應的細胞類型中優(yōu)先表達。Maher等[23]對擬南芥根毛和非根毛細胞特有的THSs進行深入分析,找到了特異的基序,并關聯(lián)到對應的轉錄因子,發(fā)現(xiàn)根毛細胞中表達量更高的轉錄因子MYB33和ABI5共同驅(qū)動了一個根毛細胞轉錄調(diào)控模式,并且靶向影響根毛細胞命運及應激反應的基因??傊?,染色質(zhì)的開放程度與基因表達調(diào)控密切相關,通過多組學的關聯(lián)分析可以從不同的分析思路獲取信息并互相補充驗證,有助于揭示基因調(diào)控的潛在機制[48]。
環(huán)境條件對植物的生長發(fā)育和生態(tài)分布有重要影響,植物已進化出多級調(diào)控機制來調(diào)控基因的表達,以提高其對低溫、干旱及病蟲害等逆境的適應。研究表明,一些轉錄因子和順式調(diào)控元件不僅可以調(diào)控基因的表達,還在抵御生物和非生物脅迫中有重要意義[49]。Ren等[50]利用ATAC-seq繪制了冷脅迫下葡萄的染色質(zhì)可及性圖譜,共鑒定出 CBF4、RAV1等9個TFs,這些轉錄因子采用不同的途徑對冷應激做出調(diào)控,同時還發(fā)現(xiàn)VaRAV1基因的過表達可以提高葡萄的耐寒性,為闡明冷響應過程中的信號轉導提供了理論參考。Wang等[51]通過結合ATAC-seq、RNA-seq和 Ribo-seq分析了茶(Camelliasinensis)在低溫脅迫下的染色質(zhì)可及性、轉錄和翻譯圖譜,以研究染色質(zhì)水平和翻譯水平上的調(diào)控機制。結果表明,茶在面臨低溫脅迫時轉錄和翻譯起協(xié)同作用,兩者之間的皮爾遜相關系數(shù)增加到0.68;其次,在低溫條件下,茶的染色質(zhì)可及性圖譜發(fā)生了明顯的變化,大部分THSs都位于遠端基因間區(qū)域,這表明遠程轉錄調(diào)控可能在茶對低溫脅迫的響應中發(fā)揮了重要作用。Sullivan等[36]利用染色質(zhì)可及性變化和轉錄因子足跡鑒定建立了擬南芥在響應高溫脅迫時的動態(tài)調(diào)控網(wǎng)絡,Wilkins等[52]、Lockhart[53]則更進一步將染色質(zhì)可及性與共表達數(shù)據(jù)和網(wǎng)絡推理算法結合,揭示干旱和高溫脅迫下水稻的環(huán)境與基因調(diào)控互作網(wǎng)絡(environmental gene regulatory influence networks, EGRINs),獲得了更豐富的信息。Ding等[54]采用ATAC-seq和RNA-seq在染色質(zhì)可及性和轉錄調(diào)控水平上研究了模式受體激活的免疫反應(PAMP-triggered immunity, PTI)和效應蛋白激活的免疫反應(effector-triggered immunity, ETI)之間的關系,解析了兩種免疫系統(tǒng)共激活轉錄變化的機制,發(fā)現(xiàn)兩種免疫系統(tǒng)聯(lián)合比PTI能更有效提高防御基因的表達,這與防御基因位點附近的染色質(zhì)可及性增強相關,該研究更好地解析了植物免疫激活過程中染色質(zhì)動態(tài)變化對基因表達調(diào)控的影響。
隨著植物表觀組學研究的不斷深入,研究人員已對植物基因組染色質(zhì)可及性和表觀遺傳修飾進行了探究,發(fā)現(xiàn)植物染色質(zhì)可及性區(qū)域和表觀遺傳修飾之間的動態(tài)相互作用在一定程度上影響染色質(zhì)可及性,從而在轉錄或翻譯水平上調(diào)控基因表達。為了研究染色質(zhì)可及性區(qū)域相關的表觀組學特征,通過將ATAC-seq數(shù)據(jù)與染色質(zhì)免疫共沉淀測序(chromatin immunoprecipitation followed by sequencing, ChIP-seq)數(shù)據(jù)進行整合,可以鑒定不同組蛋白修飾的ACRs,不同組蛋白或同一組蛋白的不同氨基酸殘基上的修飾決定染色質(zhì)處于活性或非活性狀態(tài)[55]。例如:H3K27me3作為一種組蛋白甲基化修飾,是調(diào)控ACRs下游基因表達的一個主要的非活性表觀遺傳標記,使下游基因沉默;而H3K4me3、H3K36me3和H3K56ac等組蛋白修飾是植物中保守的活性標記,位于活性基因轉錄起始位點且在調(diào)控基因表達方面更傾向于與ACRs呈正相關。其次,植物的染色質(zhì)可及性區(qū)域雖然缺乏5-甲基胞嘧啶(5-methylcytosine, 5mC)修飾,但染色質(zhì)可及性區(qū)域為相關表觀遺傳調(diào)控因子的招募提供了空間,從而在ACRs相關區(qū)域及其周圍進行表觀遺傳標記,以促進相關基因的DNA甲基化,研究表明,基因內(nèi)部具有ACRs 時,該基因的CG甲基化水平高于無ACRs的基因[22]。同時,DNA甲基腺嘌呤 (N6-methyldeoxyadenosine, 6mA)作為一種非典型的DNA甲基化修飾,在植物基因組中發(fā)揮著重要的生物學功能。在水稻中,位于啟動子中的6mA與基因沉默有關,但在基因內(nèi)部的6mA與基因活性相關[56],Zhou等[22]進一步證實6mA會與ACRs相互作用以促進基因表達。另有研究表明,參與高溫脅迫的關鍵基因HsfA1和HSP70的表達與6mA呈正相關[57],Liang等[58]發(fā)現(xiàn)水稻基因組中的ATAC信號與6mA修飾位點重疊。因此,推測染色質(zhì)可及性變化和6mA共同調(diào)控以應對高溫脅迫響應。此外,環(huán)境條件會誘導植物染色質(zhì)結構的改變進而影響調(diào)控蛋白與調(diào)控元件的結合[59],染色質(zhì)結構變化與DNA甲基化和組蛋白修飾一樣,均可以調(diào)節(jié)基因的表達。Jégu 等[60]利用ATAC-seq研究表明染色質(zhì)重塑復合物SWI/SNF的亞基BAF60調(diào)控擬南芥下胚軸發(fā)育相關基因的表達,在光照條件下,BAF60可以通過影響該基因的染色質(zhì)可及性,從而抑制了下胚軸伸長。
真核生物中基因的表達是通過調(diào)控蛋白與啟動子、增強子等其他順式調(diào)控元件的相互作用來實現(xiàn)的。其中,增強子(enhancer)是重要的順式調(diào)控元件,能夠有效增強基因的轉錄,其序列和活性的差異在種間和種內(nèi)的表型變異中起重要作用,但增強子與靶基因的距離和方向不確定,可能位于啟動子區(qū)域的上游、下游或者基因的內(nèi)部,因此增強子明顯比啟動子更難被定位[61-62]。已有大量研究顯示,使用增強子捕獲和QTL定位技術可以揭示增強子在基因組中的大致位置,但這些技術費時費力[63]。通常情況下,增強子與一些轉錄因子結合時,會將核小體去除,從而導致局部染色質(zhì)完全開放,因此可以利用ATAC-seq技術或DNase-seq技術檢測染色質(zhì)可及性區(qū)域進而預測增強子,目前基于染色質(zhì)構象已在擬南芥中開發(fā)出了全基因組預測增強子的方法[64]。Huang等[65]利用ATAC-seq技術在大豆(Glycinesoja)中發(fā)現(xiàn)遠端染色質(zhì)可及性區(qū)域(距離最近基因≥2 kb處)與先前在該物種中報道的Linc RNAs (long intergenic noncoding RNAs)位點重疊[66],而Linc RNAs通常被認為是增強子RNA(enhancer RNAs,eRNAs)[64, 67],這表明遠端染色質(zhì)可及性區(qū)域可能是潛在的增強子。Schwope等[68]利用ATAC-seq對葡萄中鑒定出的染色質(zhì)可及性區(qū)域進行了亞硫酸氫鹽測序,發(fā)現(xiàn)遠端染色質(zhì)可及性區(qū)域呈現(xiàn)低甲基化水平,還存在大量轉錄因子結合位點,這與Calo等[69]提出的增強子往往是低甲基化的觀點一致。Lu等[70]通過研究13種被子植物的染色質(zhì)可及性,表明所有植物中均存在遠端染色質(zhì)可及性區(qū)域,其所占比例與基因組大小呈正相關,且觀察到保守非編碼序列在遠端染色質(zhì)可及性區(qū)域中顯著富集。另外,Ricci等[71]使用ATAC-seq與多個染色質(zhì)分析技術相結合,證明了玉米基因組遠端ACRs存在大量的順式調(diào)控元件(cis-regulatory elements,CREs),并結合自轉錄活性調(diào)控區(qū)測序,結果顯示遠端調(diào)控元件CREs具有增強子活性,調(diào)控基因表達。此外,通過比較不同物種及不同發(fā)育階段的ATAC-seq數(shù)據(jù),可以更深入地探究調(diào)控序列的進化特征,Yan等[72]預測增強子在擬南芥花序發(fā)育的不同階段存在高度的特異性,其序列在十字花科植物中高度保守,Marand等[73]通過比較玉米(Zeamays)和擬南芥根部的發(fā)育軌跡,發(fā)現(xiàn)兩者韌皮部發(fā)育過程中的順式調(diào)控模式具有高度的保守性。
ATAC-seq技術自2013 年建立以來,便以材料需求量少、實驗操作簡便、重復性好等優(yōu)點成為真核生物研究表觀遺傳調(diào)控的重要技術手段,已在人類[74]及小鼠[75]等模式動物的基因組調(diào)控元件鑒定、轉錄因子結合位點識別及轉錄調(diào)控機制的解析等研究領域發(fā)揮了不可替代的作用,展現(xiàn)出廣闊的應用前景。相較于動物而言,ATAC-seq技術在植物中的研究應用還處于起步階段,相關研究主要集中在擬南芥和水稻等模式植物中。隨著高通量測序技術的不斷進步,以及ATAC-seq技術的進一步完善,該技術必將在植物表觀基因組學研究領域發(fā)揮重要作用。
獲得高質(zhì)量的細胞核是開展ATAC-seq實驗的基礎。植物細胞的細胞壁和葉綠體,常常會對細胞核的提取產(chǎn)生影響,使得植物高質(zhì)量細胞核的制備難度遠比動物的大。盡管研究者已對植物細胞核的制備進行了多種優(yōu)化,出現(xiàn)了Crude、INTACT及FANS[21, 23]等制備細胞核的方法,但這些研究均以擬南芥為實驗對象。從筆者提取楊樹(Populusspp.)細胞核的經(jīng)驗來看,在擬南芥、水稻、玉米等草本植物中適用的方法,在制備楊樹細胞核時還需要進一步優(yōu)化,才能取得較好的結果。因此,目前主要依據(jù)模式植物建立的細胞核制備方法要想成功應用到其他植物尤其是其他木本植物中,還需要根據(jù)不同植物材料的特點有針對性地進行優(yōu)化。
林木世代周期長、遺傳雜合度高、目標性狀受多基因調(diào)控,這增加了揭示林木目標性狀遺傳機制的難度,從而限制了林木目標性狀的遺傳改良進程。近年來,ATAC-seq已成功應用于茶和葡萄等木本植物的抗逆機制解析及順式調(diào)控元件識別[51, 68]??梢灶A見,隨著林木功能基因組學研究的深入及高通量測序技術的迅猛發(fā)展,ATAC-seq必將在解析木材性狀遺傳機制這個林木復雜性狀研究的熱點領域中發(fā)揮更重要的作用。