杜再慧,羅云波,朱龍佼,許文濤,2*
1.中國農業(yè)大學食品科學與營養(yǎng)工程學院,北京 100083;2.中國農業(yè)大學,農業(yè)農村部農業(yè)轉基因生物安全評價(食用)重點實驗室,北京 100083;
核酸的堿基序列、拓撲結構對于生命遺傳和生理功能都起著至關重要的作用。天然存在的核酸包括DNA和RNA。核酸是由核苷酸通過磷酸二酯鍵組成,而核苷酸是由含氮堿基、戊糖和磷酸構成。其中,堿基又分為嘧啶和嘌呤;構成DNA的戊糖是D-2-脫氧核糖,構成RNA的戊糖一般為D-核糖,某些RNA中的戊糖還有D-2-O-甲基核糖。因此,核酸的排列順序和結構是多種多樣的。1953年Watson和Crick[1]首次提出了DNA雙螺旋結構模型,標志著分子生物學時代的到來,也使得核酸成為領域內的研究熱點。對于核酸結構的定義,狹義上可分為3類:DNA的一級結構是指分子中脫氧核糖核苷酸的排列順序,即單個核苷酸通過磷酸二酯鍵連接起來(圖1)[2];DNA的二級結構是指脫氧核糖核苷酸鏈通過氫鍵與其他核苷酸鏈配對或分子內周期性折疊形成的螺旋結構,即雙螺旋結構和本文介紹的DNA特殊二級結構;DNA的三級結構是指雙螺旋的扭曲。最為常見的DNA二級結構為平行雙螺旋,它是由2條反向平行的DNA鏈構成,中間由A-T、C-G堿基通過氫鍵進行互補配對,并形成2個溝槽[1]。
圖1 DNA的一級結構[2]Fig.1 Primary structure of DNA[2]
目前已發(fā)現的DNA特殊二級結構包括發(fā)卡(hairpin)、十字形(cruciform)、雙螺旋(double helix)、三螺旋(triplex)、G-四聯(lián)體(G-quadruplex)、G-三聯(lián)體(G-triplex)和i-motif等[3-5]。這些DNA特殊二級結構在細胞進化過程中起著重要的作用,它們分布在人類基因組的各個位置,時常與細胞的生長周期、功能和人類疾病等相關。Mergny和Hélène[6]在1998年首次提出了G-quadruplex與小分子化合物作用后具有抑制端粒酶的作用,由此也引發(fā)了研究人員對DNA特殊二級結構及其功能的關注,重點研究其機理并將其應用到疾病的診斷與治療以及納米智能材料、納米分子機器、生物傳感器等的研發(fā)中。本文主要介紹了G-quadruplex、G-triplex和i-motif 這3種DNA特殊二級結構,包括其發(fā)展史、結構組成、特殊功能以及在生物傳感、納米材料、體內檢測等方面的應用。最后剖析了目前在DNA特殊二級結構的研究中存在的問題與不足,并對其今后的研究方向做出了展望,以期為DNA特殊二級結構在生物傳感、分子醫(yī)學等領域的應用提供理論支持。
G-quadruplex的研究進程與端粒是密不可分的,這是由于端粒的本質也是富含鳥嘌呤(G)的核酸序列。1962年Gellert等[7]通過X射線證明了4個鳥嘌呤(G)可以形成1個共平面的四聚體G-quartet,鳥嘌呤之間通過Hoogsteen氫鍵相互作用。又有研究人員通過X-射線衍射進一步證明了poly(G)形成的G-quartet中每個鳥嘌呤之間是通過2個Hoogsteen氫鍵結合,并且作用位點分別在堿基的O6和N7之間[8]。而環(huán)狀平面G-quartet之間通過π-π堆積可以形成G-quadruplex結構。20世紀80年代,Blackburn所在團隊證明端粒是真核細胞里線性染色體末端的一小段DNA重復序列,并與蛋白質復合為非轉錄DNA提供緩沖物,保護染色體免于融合和退化[9]。同時期,Henderson等[10]證明G-quadruplex在生物體中也具有重要作用。隨后,2009年,Cheng等[11]發(fā)現了G-quadruplex與氯高鐵血紅素(hemin)結合具有類過氧化物酶活性,可以催化H2O2和底物發(fā)生顏色反應,這又擴展了G-quadruplex的應用。2017年,Guo等[12]發(fā)現了一種耐高溫的G-quadruplex結構,它可以與hemin在高溫條件下結合,復合物具有過氧化物酶活性。這對于生物酶大多不耐高溫的已知規(guī)律是一個完善與補充。
G-quadruplex核酸序列的排列多種多樣,而且相同的核酸序列在不同的條件下也可以形成不同的拓撲結構,這決定了G-quadruplex結構的多態(tài)性和特異性。G-quadruplex的折疊方式有分子內折疊和分子間折疊(圖2),分子內折疊是由1條鏈形成的四重折疊,分子間折疊是由2條鏈或4條鏈的聚合形成的四重折疊[13]。當G-quadruplex形成分子內折疊時,由于核酸濃度的不同,G-quadruplex結構也可以在分子間折疊和分子內折疊相互轉換。根據G-quadruplex中鏈的走向還可以將其分成平行和反平行。圓二色譜顯示平行的G-quadruplex核苷酸鍵都是反式的,會在265 nm處出現陽性峰,在240 nm處出現陰性峰;反平行的G-quadruplex核苷酸鍵既有順式又有反式,會在295 nm處出現陽性峰,在260 nm處出現陰性峰[13]。
圖2 G-quadruplex的典型拓撲結構[13]Fig.2 Representative topologies of G-quadruplex structures[13]
G-quadruplex在生物傳感器中最主要的應用是作為輸出信號:①由于G-quadruplex具有類過氧化物酶活性,可以催化H2O2和底物發(fā)生顏色反應,因此可用作比色輸出信號;②較為常見的是G-quadruplex與一些小分子物質結合,作為熒光輸出信號;③G-quadruplex還可以和電化學分子結合,通過自身構象變化引起電化學分子的變化,進而作為電化學輸出信號。
G-quadruplex與氯高鐵血紅素(hemin)共孵育后具有類過氧化物酶活性,可以催化2,2′-聯(lián)氮-雙(3-乙基-苯并噻唑琳-6-磺酸)二胺鹽[2,2′-azino-bis(3-ethylbenzothiazoline-6-sulfonic acid)diammonium salt,ABTS2-]、3,3′,5,5′-四甲基聯(lián)苯胺(3,3′,5,5′-tetramethyl benzidine,TMB)等物質發(fā)生顏色變化,進而完成比色信號的輸出。如2018年Zhang等[17]采用等溫比色的方法對轉基因作物進行檢測(圖3),在轉基因作物(genetically modified crops,GMC)的CaMV 35S存在時,可以與富含G-quadruplex的發(fā)卡結構結合激發(fā)核酸外切酶(exonuclease Ⅲ,Exo Ⅲ)的活性,促使富G序列暴露出來,折疊形成具有類過氧化物酶活性的結構,從而催化ABTS2-顯色,在420 nm處會出現最大吸收峰。采用Cu2+介導的基于G-quadruplex的DNA核酶(DNAzymes)構建的無標記的L-組氨酸生物傳感器,同樣利用了G-四聯(lián)體催化ABTS2-的原理[18]。
N-甲基嗎啡啉(N-methylmorpholine,NMM)、四氫噻吩(tetrahydrothiophene,ThT)、噻唑橙(thiazole orange,TO)等小分子物質都可以與G-quadruplex結合發(fā)出熒光,進而完成熒光信號的輸出。如2013年Tong等[19]基于ThT與特定G-quadruplex的構象變化設計了一個無標記“turn-on”生物傳感器,用于檢測生物硫醇的含量。這主要基于ThT與G-quadruplex結合的激發(fā)波長為440 nm,發(fā)射波長為485 nm,而其他小分子物質與G-quadruplex結合的激發(fā)和發(fā)射各不相同。
此外,G-quadruplex還可以通過自身構象變化引起電化學分子的變化,進而完成電化學信號的輸出。2017年,Wang等[20]基于Cu2+-G-quadruplex DNAzyme的過氧化物酶活性完成了對焦磷酸酶(pyrophosphatase,PPase)的電化學檢測。由于焦磷酸酶可以催化Cu2+與焦磷酸鹽的復合物,使Cu2+可以完全游離出來,并與電極上的G-quadruplex折疊形成具有類過氧化物酶活性的物質,催化TMB顯色,并且可以根據H2O2反應產生的定量的電流信號,來完成對焦磷酸酶的檢測(圖4)。
端粒是DNA和蛋白質結合的混合物,其中端粒DNA結構是互補配對的雙螺旋DNA,但是在3′端有一段G單鏈懸垂區(qū)(G-overhang),這段單鏈在適宜條件下可以形成G-quadruplex。通過計算機預測,人類基因組中有300 000個序列單元(G≥3N1-7G≥3N1-7G≥3N1-7)有形成G-quadruplex結構的可能,但要進一步對體內G-quadruplex結構及位置進行表征則需要一些特異性探針。細胞可視化方法是一種使特定DNA結構可視化的方法,主要利用結構選擇探針進行實驗。由于抗體蛋白具有識別特定分子結構的精準特異性,常被用作選擇探針。G-quadruplex的第一個抗體是由Schaffitzel等[21]于2001年發(fā)現的,命名為scFV,接下來又相繼發(fā)現了BG4[22]、1H6[23]等抗體。利用G-quadruplex的抗體即可完成體內G-quadruplex結構和位置的表征。
注:UMB:無標記分子信標,unlabeled molecular beacon。圖3 G-quadruplex催化ABTS2-顯色檢測GMC的原理圖[17]Fig.3 Schematic of G-quadruplex catalyzed ABTS2- for detection GMC[17]
注:MCH:巰基乙醇,mercaptohexanol;SPGE:絲網印刷金電極,screen-printed gold electrode。圖4 G-quadruplex催化TMB顯色檢測焦磷酸酶電化學生物傳感器[20]Fig.4 Electrochemical biosensor based on G-quadruplex catalytic TMB for detection pyrophosphatase[20]
有研究表明,細胞每分裂一次,染色體末端的端粒就會縮短一部分,當端??s短到臨界長度,細胞開始凋亡[24]。但在癌細胞中存在一種特殊的DNA聚合酶,即端粒酶,它可以穩(wěn)定端粒長度使癌細胞永生化。而當端粒末端的G-overhang形成G-quadruplex時就可以抑制端粒酶的活性,甚至可以殺死癌細胞。因此,G-quadruplex可以作為抗癌藥物的靶點。為了促進G-quadruplex的形成,研究集中于可以與G-quadruplex穩(wěn)定結合的小分子,進而對癌癥的診斷治療起作用。Liu等[25]在單細胞水平上,利用末端脫氧核苷酸轉移酶(terminal deoxynucleotidyl transferase,TdT)激活G-quadruplex的合成,對凋亡細胞進行沒有標記的原位生物成像(圖5)。TdT是一種特殊的DNA聚合酶,在沒有模板存在的情況下,可以催化脫氧核糖的3’-OH端延伸。以凋亡細胞內的片段DNA作為TdT延伸的起始位點,形成大量的G-quadruplex,與特異性染料ThT結合,熒光信號增強,對凋亡細胞進行“turn-on”檢測。這種TdT激活G-quadruplex合成的實驗(TdT-activateddenovoG-quadruplex synthesis,TAGS)具有高特異性、高敏感性,可靈活的應用于多水平的生物系統(tǒng)。并且這種“混合-讀數”成像的方法避免了標記核酸以及清洗的步驟。更重要的是,G-quadruplex靶向熒光探針具有多樣性和功能性,具有較大的應用潛力。
圖5 利用TAGS分析進行細胞凋亡原位檢測的原理圖[25]Fig.5 Schematic presentation of in situ cell apoptosis detection utilizing TAGS assay[25]
2013年,Limongelli等[26]在探究結合金屬離子形成四螺旋體結構的凝血酶適體DNA[d(GGTTGGTGTGGTTGG),TBA]時,首次發(fā)現了一種不同于已發(fā)現的DNA二級結構,這種結構是TBA序列后面的“TTGG”核酸去掉形成的一種類似于G-quadruplex的G-triplex結構。G-triplex也有類似于G-quartet的共平面三聚體,是由3個鳥嘌呤堿基之間通過Hoogsteen氫鍵相連形成的G-triad,2個G-triad相互堆積形成G-triplex(圖6)。但G-triad需要在較為苛刻的條件(70 mmol/L KCl)下形成[28],一般沒有G-quadruplex穩(wěn)定。除了結構相似,G-triplex與G-quadruplex一樣都具有類過氧化物酶活性[29],這拓展了G-triplex的應用范圍。并且,2016年,Xu等[30]首次發(fā)現G-triplex與Cu2+結合可以催化Diels-Alder反應,進一步擴大了其應用范圍。
圖6 G-triad和G-triplex的結構[27]Fig.6 Structure of G-triad and G-triplex[27]
G-triplex結構受核酸分子擁擠程度、金屬離子濃度等的影響。金屬離子對G-triplex的穩(wěn)定能力的順序為Ca2+>K+>Mg2+>Na+[27]。Ca2+無論在稀溶液中還是在核酸分子擁擠溶液中,都會促使平行的G-triplex的形成。即便G-triplex在分子擁擠和Ca2+同時存在的情況下,它由2個G-triad形成的結構熔解溫度也比生理溫度低;而由3個G-triad形成的結構熔解溫度是非常高的,尤其是在K+或Ca2+和分子擁擠同時存在的情況下,這也暗示著G-triplex可以在生理條件下存在。K+和G-triplex結合是放熱反應;Ca2+和G-triplex結合是吸熱反應。值得特別注意的是,Ca2+對生理活動是非常重要的金屬離子,它對G-triplex起到穩(wěn)定作用,由此可以推測出G-triplex對人體的生命活動也發(fā)揮著重要作用。
2014年,Ma等[31]人工合成了一種化合物Ir(III),它可以與G-triplex結合發(fā)冷光,通過這種方式無標記定量檢測了綠豆芽核酸酶活性。最新的研究表明,假設G-triplex具有與G-quadruplex相似的化學結構及功能,則穩(wěn)定的G-triplex可以結合ThT作為高效的熒光探針[32]。與傳統(tǒng)的G-quadruplex相比,G-triplex探針更易控制和激發(fā)活性,所以可以將這個探針應用于生物傳感器,以提高檢測效率。
生物體內基因富含鳥嘌呤(G),根據堿基互補配對原則,其互補序列中必然富含胞嘧啶(C)。1993年,Gehring等[33]在研究DNA序列d(TCCCCC)在弱酸條件下的二級結構時,利用核磁共振首次提出了i-motif四聯(lián)體結構。它是一種插層結構,即2條胞嘧啶鏈利用C∶C+配對形成1個平行雙螺旋結構,和另外2條雙螺旋鏈頭尾交插。1994年,Manzini等[34]利用圓二色譜法證明(C3AT2)C3T形成了i-motif結構。由于i-motif結構需要在pH比較低的情況下形成,所以大部分關于i-motif結構的研究都只是在體外進行。2000年,Phan和Leroy[35]得到了人端粒DNA序列在溶液中形成的i-motif結構的晶體結構。
I-motif結構與G-quadruplex結構分類類似,通過i-motif形成的核酸鏈可以分為單體i-motif [d(CCCTAACCCTAACCCTAACCC)]、雙聚體i-motif [d(CCCTAACCC)]、四聚體i-motif [d(CCCTAA)],結構如圖7所示[36]。如果由1條鏈經分子間折疊構成單體i-motif結構時,會存在2種構型:5′E和3′E。當閉合的C∶C+堿基對在5′端時形成的結構叫做5′E,而在3′端時叫做3′E。而四聚體i-motif有S型、R型和T型之分,當溫度在15~50 ℃時,R型最穩(wěn)定,S型次之,T型最不穩(wěn)定。富C序列在pH 5的條件下折疊成i-motif結構,而在pH 8的條件下去折疊,在這種折疊和去折疊過程的時間尺度約在100 ms。RNA i-motif的結構不穩(wěn)定,是由于它比DNA i-motif結構缺少了1對2’-OH/2-’OH的排斥作用。i-motif結構通常受到溫度、pH、磷酸骨架結構、連續(xù)胞嘧啶的序列、loop區(qū)、分子擁擠環(huán)境以及羧基修飾的碳納米管或石墨烯量子點等條件的影響。
圖7 i-motif的結構[36]Fig.7 The structure of i-motif[36]
DNA分子被廣泛用作納米材料(2D/3D結構和連鎖組件)的原料,DNA納米結構可以通過DNA的可編程性進行功能化。其中多個的DNA單元,如G-quadruplex、i-motif被廣泛用于DNA納米技術,這些四聯(lián)體具有共同的特點,即根據核酸序列和外界條件的變化,它們的折疊類型也會發(fā)生相應的改變,這使得它們可以作為通用的DNA納米結構使用。Li和Famulok[37]通過調控pH控制i-motif結構的收縮和擴張,使得納米環(huán)自身收縮、兩兩相互作用或形成三聚環(huán)等,進而構建了不同的DNA納米環(huán)。這開辟了一種納米結構形成的新方式,后續(xù)也可應用于生物傳感器的構建。
雖然i-motif在體外形成插層結構已被證實,但是在人類基因組內,這種四聯(lián)體的DNA結構一直存在爭議。因此,Daniel Christ所在團隊通過篩選得到了1個i-motif結構的特異性抗體iMab,該抗體對i-motif結構具有高選擇性和高親和力,利用該抗體第一次直接可視化的證明了人類細胞核中存在i-motif結構,并論證了i-motif結構依賴于細胞循環(huán)周期和pH,i-motif插層結構可以在體內形成,這為i-motif結構在人類基因組的調控區(qū)域的形成提供了證據[38]。
目前,G-quadruplex、G-triplex、i-motif這3種DNA特殊二級結構不僅在體外適宜條件下得到了較為深入的研究,在體內的作用也經過了初步驗證。尤其是在端粒末端、原癌基因啟動子區(qū)域中G-quadruplex和i-motif的普遍存在,間接說明這些特殊的二級結構具有調控基因翻譯、轉錄以及作為抗癌藥物靶點等的功能。目前,對于這些DNA特殊二級結構的研究也主要集中在調節(jié)機制、體外檢測(如生物傳感器)、體內基因調控和癌癥的預防和治療上。雖然研究人員已經對它們的結構進行了全面的表征,并且證明了其具有在正常生理代謝中潛在的調控功能,但是由于堿基種類繁多,排列方式多樣,目前發(fā)現的具有特殊結構及功能的核酸序列也僅僅是眾多核酸中的一小部分,還有很多的具有功能的核酸序列及其特殊的二級結構有待開發(fā)利用。同時,隨著科技的進步、技術的創(chuàng)新,基于G-quadruplex、G-triplex、i-motif結構對相關基因進行調節(jié)與藥物的研發(fā)和遞送,特別是它們在生物傳感器中的應用,也會受到各相關研究領域的重視。