高俊平
(山東省濰坊科技學(xué)院賈思勰農(nóng)學(xué)院 濰坊 262700)
基因組步移(genomic walking)是指從第一個(gè)重組克隆插入片段的一端分離出一個(gè)片段作為探針,從文庫中篩選第二個(gè)重組克隆,該克隆含有與探針相重疊的序列。從第二個(gè)重組克隆再分離出末端小片段作為探針篩選第三個(gè)重組克隆,如此重復(fù),得到一個(gè)相鄰的片段。它是一種重要的分子生物學(xué)研究技術(shù),可以有效克隆已知片段側(cè)翼的未知序列。
迄今為止,基因組步移主要有兩種方法: 一是結(jié)合基因組文庫的基因組步移技術(shù),此方法適于長(zhǎng)距離步移,可以獲得某一特定染色體較長(zhǎng)連續(xù)區(qū)段的重疊基因組克隆群;另一個(gè)是以聚合酶鏈?zhǔn)椒磻?yīng)(polymerase chain reaction, PCR)擴(kuò)增為主要手段的基因組步移技術(shù),該方法產(chǎn)生的步移距離相對(duì)較短,但是操作簡(jiǎn)單,尤其適合于尋求已知片段旁側(cè)的未知序列。
基因組文庫是指生物體的全部DNA經(jīng)過合適的核酸內(nèi)切酶消化或機(jī)械切割以后,克隆到合適的載體分子中,所有這些插入了基因組DNA片段的載體分子的集合體,就包含了這個(gè)生物體的整個(gè)基因組信息,也就成為了此生物體的基因組文庫。它是基因組學(xué)研究的重要技術(shù)平臺(tái),目前構(gòu)建基因組文庫的方法主要有兩種: 物理剪切法和限制性內(nèi)切酶法[1]。
以基因組文庫為基礎(chǔ)進(jìn)行基因組步移的步驟大體如下: ①用與目的基因連鎖的分子標(biāo)記為探針篩選整個(gè)基因組文庫,鑒定出分子標(biāo)記所在的大片段克??;②再以該克隆為基因組步移的起點(diǎn),用外側(cè)克隆末端作為探針篩選基因組文庫,分離新的重疊克隆(陽性克隆);③多次重復(fù)上述步驟,逐漸逼近目的基因,構(gòu)建目的基因區(qū)域的重疊群;④通過亞克隆文庫獲得含有目的基因的小片段克隆,并對(duì)其進(jìn)行遺傳轉(zhuǎn)化和功能互補(bǔ)驗(yàn)證,從而最終確定目的基因的核酸序列。
隨著PCR技術(shù)的發(fā)明,以該技術(shù)為基礎(chǔ)發(fā)展了多種基因組步移方法,這些方法按原理可分為兩類: 一是依賴酶切連接介導(dǎo)的PCR法;二是不需要酶切連接的PCR法。
2.1 依賴酶切連接的PCR 此類方法首先對(duì)基因組DNA進(jìn)行酶切,然后把酶切產(chǎn)物連接成環(huán)或在酶切產(chǎn)物末端加上相應(yīng)的接頭。根據(jù)已知序列設(shè)計(jì)的特異引物和接頭上的錨定引物分別作為PCR反應(yīng)的正反向引物,以此來擴(kuò)增已知序列的上下游側(cè)翼序列。
2.1.1 反向PCR 反向PCR(inverse PCR, IPCR)的原理是對(duì)已知序列進(jìn)行限制性內(nèi)切酶位點(diǎn)分析,然后選取已知序列中沒有位點(diǎn)的限制性內(nèi)切酶,對(duì)基因組DNA進(jìn)行酶切并將酶切片段環(huán)化自連,然后根據(jù)已知序列設(shè)計(jì)反向引物,擴(kuò)增已知序列兩側(cè)的未知序列。IPCR的優(yōu)點(diǎn)是操作簡(jiǎn)單;缺點(diǎn)是環(huán)化過程難以控制,這是因?yàn)槊盖形稽c(diǎn)隨機(jī)分布,有可能產(chǎn)生較長(zhǎng)的片段,從而導(dǎo)致PCR擴(kuò)增效率下降。鑒于此,科研人員在此基礎(chǔ)上發(fā)展了橋連IPCR: 環(huán)化的過程中,在酶切位點(diǎn)之間特意加上一段橋連片段,從而能更有效地?cái)U(kuò)增側(cè)翼片段。Chen等[2]通過IPCR技術(shù)克隆了小麥花粉特異性基因TaPSG719的啟動(dòng)子序列。盡管IPCR應(yīng)用不多,但它開創(chuàng)了利用PCR技術(shù)進(jìn)行基因組步移的先河。以此為基礎(chǔ),大量應(yīng)用PCR技術(shù)進(jìn)行基因組步移的方法相繼涌現(xiàn)。
2.1.2 載體PCR 載體PCR(single specific primer PCR, SSP-PCR)是指把基因組DNA酶切片段連接到質(zhì)粒載體上,并用已知序列設(shè)計(jì)的特異引物和載體上的通用引物特異擴(kuò)增目標(biāo)片段的一種PCR技術(shù)。SSP-PCR實(shí)驗(yàn)設(shè)計(jì)簡(jiǎn)單,尤其適合于保存有cDNA或基因組文庫的實(shí)驗(yàn)室,但是其操作較繁瑣,特異性較低,產(chǎn)物仍需做進(jìn)一步的鑒定。Gowik等[3]運(yùn)用SSP-PCR技術(shù)成功克隆出了一種黃頂菊基因(ppcA1)的啟動(dòng)子序列。
2.1.3 連接單鏈接頭的PCR 單鏈接頭PCR(panhandle PCR, P-PCR)是連接單鏈接頭PCR的典型代表,因其關(guān)鍵環(huán)節(jié)形成一個(gè)鍋柄狀結(jié)構(gòu),故也稱鍋柄PCR。其原理為: 基因組DNA先用限制性內(nèi)切酶酶切,然后在酶切片段末端連接上含有自由端的單鏈寡核苷酸鏈(3′端與已知序列中部分片段完全反向互補(bǔ)),這樣含有連接片段的單鏈DNA在合適的溫度下會(huì)自身退火形成一個(gè)類似鍋柄結(jié)構(gòu)的環(huán),接下來用在已知序列內(nèi)呈線性排列的3個(gè)單引物進(jìn)行3次PCR擴(kuò)增,即得到目的片段。P-PCR的優(yōu)點(diǎn)是特異性較高,但由于單接頭連接效率低,會(huì)限制鍋柄結(jié)構(gòu)的形成。在此基礎(chǔ)上,科研人員對(duì)其進(jìn)行了改進(jìn),即在形成鍋柄之前在3′末端連接雙脫氧胞苷三磷酸(ddCTP),從而使引物錯(cuò)配的概率減少,特異性則相對(duì)增加。Shang等[4]運(yùn)用改良的P-PCR技術(shù)從靈芝中成功克隆出了羊毛固醇合酶基因的啟動(dòng)子序列。
2.1.4 連接雙鏈接頭的PCR 雙鏈接頭PCR法主要原理為: 用能夠產(chǎn)生黏性末端的限制性內(nèi)切酶切割基因組DNA,將酶切好的DNA片段和退火雙鏈接頭用T4連接酶連接起來,最后通過一條特異性引物和一條根據(jù)接頭序列設(shè)計(jì)的引物進(jìn)行PCR擴(kuò)增(有時(shí)需要進(jìn)行巢式PCR),即可獲得包含有側(cè)翼序列的片段。在實(shí)際運(yùn)用過程中,科研人員根據(jù)具體情況發(fā)展出捕捉PCR(capture PCR)、抑制PCR(suppression PCR)、T接頭連接的PCR(T-linker-specific ligation PCR, T-linker PCR)等多種步移方式。雙鏈接頭的PCR的優(yōu)點(diǎn)是特異較好,但由于要進(jìn)行基因組酶切,所以對(duì)基因組DNA的質(zhì)量要求較高,而且步驟較為繁瑣。筆者曾運(yùn)用雙鏈接頭的PCR成功克隆了日本沼蝦胰島素樣促雄性腺激素基因和胰島素樣促雄性腺激素結(jié)合蛋白基因的全基因組序列(含啟動(dòng)子區(qū)域和內(nèi)含子區(qū)域)[5]。
2.2 非依賴酶切連接的PCR 酶切介導(dǎo)的PCR步移技術(shù)無疑都會(huì)受到酶切位點(diǎn)的限制,因此研究者開發(fā)了非依賴酶切連接的PCR技術(shù),主要有以下幾種:
2.2.1 新Alu-PCR Alu因子是一類僅存在于靈長(zhǎng)類基因組中的短片段重復(fù)序列,平均大約每4 kb堿基就出現(xiàn)一次。研究者利用這一規(guī)律,發(fā)明了Alu-PCR。其原理是根據(jù)Alu的序列設(shè)計(jì)引物,來擴(kuò)增兩個(gè)Alu之間的片段區(qū)域。新Alu-PCR則是根據(jù)已知序列或是外源插入序列與Alu保守序列設(shè)計(jì)引物,擴(kuò)增所需的未知側(cè)翼序列。因Alu僅存在于靈長(zhǎng)類,這也大大限制了Alu-PCR在其他物種的應(yīng)用。
2.2.2 熱不對(duì)稱交錯(cuò)PCR 熱不對(duì)稱交錯(cuò)PCR(thermal asymmetric interlaced PCR, TAIL-PCR)是非酶連介導(dǎo)的PCR基因組步移技術(shù)的典型代表。其基本原理是根據(jù)已知序列區(qū)域設(shè)計(jì)三個(gè)具有高退火溫度、較長(zhǎng)的巢式特異引物,將它們分別和一個(gè)具有低退火溫度、較短的(16 nt)任意簡(jiǎn)并引物(arbitrary degenerate primer, AD)配合使用,根據(jù)引物的長(zhǎng)短和特異性差異設(shè)計(jì)不對(duì)稱循環(huán)溫度,并通過三級(jí)PCR反應(yīng)得到目的產(chǎn)物。TAIL-PCR技術(shù)簡(jiǎn)單方便,反應(yīng)高效靈敏,產(chǎn)物特異性高,多數(shù)情況下能夠獲得較為滿意的結(jié)果,因而應(yīng)用非常廣泛,幾乎適用于所有物種的基因組。例如,Song等[6]運(yùn)用此方法從沙冬青中成功分離克隆了肌醇半乳糖苷合酶基因的啟動(dòng)子序列。但不容忽視的是,TAIL-PCR也存在AD引物結(jié)合位點(diǎn)有限導(dǎo)致擴(kuò)增產(chǎn)物較短(一般情況小于1 kb)以及整體所需引物組合較多、反應(yīng)條件設(shè)置要求比較精細(xì)等問題。鑒于此,科研人員對(duì)其進(jìn)行了改進(jìn)并建立了高效熱不對(duì)稱交錯(cuò)PCR技術(shù)(hiTAIL-PCR)。改進(jìn)之處在于: 簡(jiǎn)并引物序列適當(dāng)增長(zhǎng)(LAD)為33~34 nt,而不是原來的16 nt,且LAD引物的5′端為用于第二輪PCR的基因特異引物SP2序列,這樣就保證了擴(kuò)增的特異性。因此,hiTAIL-PCR比TAIL-PCR擴(kuò)增成功率更高,產(chǎn)物也更長(zhǎng)(可達(dá)3 kb)[7]。
2.2.3 引物退火控制PCR 引物退火控制(DNA walking annealing control primer, DW-ACP)PCR策略的核心在于采用了復(fù)性控制引物(annealing control primer, ACP)。ACP有3部分組成,依次為: 3′端的目標(biāo)核心序列、中間的調(diào)節(jié)序列和5′端的非目標(biāo)尾部序列。目標(biāo)核心序列能和待擴(kuò)增區(qū)域的某一部位特異結(jié)合,但位置隨機(jī);非目標(biāo)尾部序列主要起到調(diào)節(jié)整條引物Tm的作用;調(diào)節(jié)序列是其中關(guān)鍵部分,它能促進(jìn)目標(biāo)核心序列與模板特異性結(jié)合而抑制非目標(biāo)尾部序列與模板的非特異性結(jié)合,從而阻礙非特異性擴(kuò)增。該方法程序較為簡(jiǎn)單,擴(kuò)增特異性高,不足之處在于: ACP引物受專利保護(hù),3′端的目標(biāo)核心序列尚未公開。Harreither等[8]運(yùn)用此方法從真菌中分離了纖維二糖脫氫酶基因組全長(zhǎng)序列。
雖然測(cè)序技術(shù)飛速發(fā)展,但當(dāng)前某一物種的全基因組測(cè)序價(jià)格仍然異常昂貴,因此,基因組步移仍舊是獲取基因組DNA序列的首選途徑。以上介紹的幾種技術(shù)是典型的基因組步移方法,每種方法都有其優(yōu)點(diǎn)和局限性。根據(jù)筆者的經(jīng)驗(yàn),在具體的實(shí)驗(yàn)實(shí)際操作中,可以通過幾種方式聯(lián)合起來進(jìn)行基因組步移,從而有效地獲取目的基因。同時(shí),隨著分子生物學(xué)和基因工程技術(shù)的發(fā)展,更高效基因組步移方法的出現(xiàn)指日可待。