張四鵬,李津
(天津醫(yī)科大學(xué)基礎(chǔ)醫(yī)學(xué)院細(xì)胞生物學(xué)系,天津 300070)
自身免疫性疾病是指人體的免疫系統(tǒng)錯(cuò)誤地攻擊自身的組織、器官,造成自身?yè)p傷。目前已經(jīng)發(fā)現(xiàn)了超過(guò)80 種自身免疫疾病,總發(fā)病率為3%~5%[1]。其中兒童自身免疫疾病嚴(yán)重影響了兒童的身心健康,對(duì)個(gè)人及家庭帶來(lái)了重大的經(jīng)濟(jì)負(fù)擔(dān)。兒童自身免疫疾病危險(xiǎn)因素復(fù)雜多樣,多項(xiàng)研究顯示遺傳因素對(duì)疾病的發(fā)生發(fā)展有重要的影響[2]。因此,開展遺傳學(xué)研究對(duì)于兒童自身免疫疾病的預(yù)防和精準(zhǔn)治療具有一定的指導(dǎo)作用。
近20 年來(lái),全基因組關(guān)聯(lián)分析(genome-wide association study,GWAS)聚焦于基因組的單核苷酸多態(tài)性(single nucleotide polymorphism,SNP),無(wú)偏地系統(tǒng)性地研究了與復(fù)雜疾病和性狀相關(guān)的遺傳位點(diǎn),取得了豐碩的成果,已有數(shù)千遺傳位點(diǎn)在文獻(xiàn)中報(bào)道[3]。但是關(guān)于這些位點(diǎn)的作用機(jī)制的研究卻很少[4]。
一項(xiàng)關(guān)于10 種兒童自身免疫疾病的研究報(bào)道了位于ANKRD30A 的內(nèi)含子區(qū)域的SNPrs7100025與幼年特發(fā)性關(guān)節(jié)炎(Juvenile idiopathic arthritis,JIA)顯著相關(guān)[5]。但是對(duì)于這一位點(diǎn)如何影響疾病的發(fā)生、發(fā)展缺少相應(yīng)的實(shí)驗(yàn)研究。因此,本研究聚焦于對(duì)ANKRD30A 的內(nèi)含子位點(diǎn)的功能研究,通過(guò)生物信息學(xué)分析和實(shí)驗(yàn)方法精細(xì)定位這一位點(diǎn)的因果變異,利用CRISPR/Cas9 技術(shù)構(gòu)建刪除因果變異所在基因組區(qū)域的單克隆細(xì)胞系,為后續(xù)機(jī)制研究奠定基礎(chǔ)。
1.1 材料 實(shí)驗(yàn)所用細(xì)胞人HEK293T 以及人Jurkat 細(xì)胞均購(gòu)自ATCC 細(xì)胞庫(kù),DMEM 培養(yǎng)基、1640培養(yǎng)基、胎牛血清、青霉素鏈霉素雙抗、胰酶均購(gòu)自美國(guó)Gibco 公司,使用的BsmbⅠ酶購(gòu)自NEB 公司,KpnⅠ、HindⅢ酶和T4 連接酶購(gòu)自Thermo 公司,Dual-Luciferase Reporter Assay System 試劑盒購(gòu)自promega 公司,PCR 酶和同源重組酶購(gòu)自諾維贊公司。
1.2 方法
1.2.1 精細(xì)定位因果變異 PICS 平臺(tái)(https://pubs.broadinstitute.org/pubs/finemapping/)是一個(gè)對(duì)GWAS遺傳位點(diǎn)進(jìn)行因果變異精細(xì)定位的在線分析網(wǎng)站[6]。該算法整合1 000 G 基因組數(shù)據(jù)中SNP 間的連鎖不平衡信息和各種免疫細(xì)胞中轉(zhuǎn)錄和順式調(diào)控元件,鑒定GWAS 遺傳位點(diǎn)最有可能導(dǎo)致疾病的因果變異,即PICS 概率(PICS_Probability)最高的SNP。使用此分析工具,輸入10p11.21 位點(diǎn)最相關(guān)的SNP(稱為index SNP)rs7100025 和疾病關(guān)聯(lián)強(qiáng)度P 值的負(fù)對(duì)數(shù)值-log10(P 值)=10.075 7。rs7100025與JIA 的關(guān)聯(lián)分析P 值=8.4E-11,所以其-log10(P值)=10.075 7。Ancestry 選擇EUR,可以得到這個(gè)位點(diǎn)的 SNPs 的 PICS 排序以及這些 SNPs 與rs7100025 之間的連鎖不平衡關(guān)系r2。
1.2.2 PheWAS 數(shù)據(jù) PheWAS(Phenome-wide Association Studies,全表型關(guān)聯(lián)研究)是對(duì)一個(gè)特定的SNP 在全表型組中找到與它關(guān)聯(lián)的表型的一種研究方法,與GWAS 相反,被稱為反向GWAS。在Open Targets Genetics 數(shù)據(jù)庫(kù)中[7-8],輸入rs7100025位點(diǎn),得到與該位點(diǎn)相關(guān)的疾病信息。
1.2.3 細(xì)胞培養(yǎng) HEK293T 細(xì)胞使用DMEM 完全培養(yǎng)基培養(yǎng)。DMEM 完全培養(yǎng)基由DMEM 空培加10%胎牛血清以及1%青霉素鏈霉素雙抗組成。Jurkat細(xì)胞使用1640 完全培養(yǎng)基培養(yǎng)。1640 完全培養(yǎng)基由1640 空培加10%胎牛血清以及1%青霉素/鏈霉素雙抗組成。兩種細(xì)胞均在37℃,5%CO2濃度的恒溫細(xì)胞培養(yǎng)箱中培養(yǎng)。
1.2.4 熒光素酶報(bào)告基因質(zhì)粒構(gòu)建 在rs7100025位點(diǎn)上下游各250 bp 設(shè)計(jì)引物??紤]到熒光素酶報(bào)告基因的方向效應(yīng),在其反方向上也同樣設(shè)計(jì)引物。引物序列見表1。以HEK293T 細(xì)胞的基因組DNA 為模板,用PCR 酶將其擴(kuò)增。PCR 程序?yàn)椋?5℃3 min,95℃15 s 58℃15 s 72℃1 min 35 個(gè)循環(huán),72℃5 min。使用的載體為PGL4.23,使用的酶切位點(diǎn)分別是HindⅢ和KpnⅠ。將PCR 產(chǎn)物和酶切產(chǎn)物同時(shí)跑膠純化,然后用同源重組酶將兩個(gè)產(chǎn)物進(jìn)行無(wú)縫連接,用DH5α 感受態(tài)細(xì)胞進(jìn)行轉(zhuǎn)化,鋪板。最后挑取單克隆進(jìn)行搖菌擴(kuò)增,選擇Sanger測(cè)序結(jié)果正確的質(zhì)粒進(jìn)行實(shí)驗(yàn)。
構(gòu)建rs7100025 次等位基因型(minor allele)即突變型的熒光素酶報(bào)告基因質(zhì)粒,使用的引物序列見表1。以構(gòu)建完成的野生型質(zhì)粒為模板,PCR 程序?yàn)椋?5℃3 min,95℃15 s 58℃15 s 72℃7 min 30個(gè)循環(huán),72℃5 min,PCR 產(chǎn)物用DpnⅠ酶37℃消化2 h,然后用DH5α 進(jìn)行轉(zhuǎn)化、鋪板,挑取單克隆測(cè)序,選取測(cè)序結(jié)果正確的質(zhì)粒進(jìn)行實(shí)驗(yàn)。構(gòu)建的突變型質(zhì)粒同樣經(jīng)過(guò)Sanger 測(cè)序驗(yàn)證。
表1 質(zhì)粒構(gòu)建引物序列Tab 1 Primer sequences for plasmid construction
1.2.5 熒光素酶報(bào)告基因?qū)嶒?yàn) 將得到的rs7100025 位點(diǎn)的4 個(gè)質(zhì)粒(野生型正向、野生型反向、突變型正向、突變型反向),各取500 ng 分別和50 ng PGL4.74 轉(zhuǎn)染6 孔板中生長(zhǎng)的HEK293T 細(xì)胞,同時(shí)使用500 ng 空載的PGL4.23 與50 ng PGL4.74 作為對(duì)照組。轉(zhuǎn)染試劑使用的是PEI。轉(zhuǎn)染的時(shí)候使用無(wú)血清培養(yǎng)基,6 h 后更換為完全培養(yǎng)基,48 h 后收細(xì)胞,并使用promega 公司的Dual-Luciferase Reporter Assay System 試劑盒以及GloMax 20/20 儀器檢測(cè)熒光強(qiáng)度。
1.2.6 rs7100025 位點(diǎn) gRNA 質(zhì)粒構(gòu)建 在rs7100025 位點(diǎn)上下游區(qū)域分別構(gòu)建sgRNA,sgRNA1 序列: 5′-GCTTCTACAAGTCTTTTTCG-3′,sgRNA2 序列:5′ -AGTGGGATTGCCATGTTATT -3′ ,sgRNA3 序列:5′-CAGTAATTATCTATCGAGTG-3′,sgRNA4 序列:5′-GTTTTGCATCGTAGTTACAC-3′。將這些sgRNA oligo 退火形成雙鏈,退火的條件為95℃10 min,緩慢降溫至室溫2 h,同時(shí)以lenti-cas9-V2 質(zhì)粒為載體,用BsmbⅠ55℃酶切2 h 回收。用T4連接酶將退火形成的sgRNA 雙鏈和回收后的載體片段連接,構(gòu)建質(zhì)粒,質(zhì)粒均經(jīng)Sanger 測(cè)序正確后使用。
1.2.7 rs7100025 位點(diǎn)敲除細(xì)胞系構(gòu)建 將4 個(gè)構(gòu)建好的rs7100025 位點(diǎn)sgRNA 質(zhì)粒各2.5 μg,與PAX2 質(zhì)粒6.5 μg,VSVG 質(zhì)粒3.5 μg,在空培中混勻,并緩慢加入等體積的混有80 μg PEI 的空培,輕輕混勻后靜置20 min,加入到空培培養(yǎng)的10 cm 培養(yǎng)皿的HEK293T 細(xì)胞中,6 h 后將空培換成完全培養(yǎng)基。收取其培養(yǎng)48 h 后產(chǎn)生的病毒液,感染Jurkat細(xì)胞24 h,然后換取新鮮的完全培養(yǎng)基,加入終濃度2 μg/mL 的嘌呤霉素培養(yǎng)3 d,然后更換為新鮮的完全培養(yǎng)基。培養(yǎng)2 d 后,收集部分細(xì)胞,提取基因組DNA,PCR 進(jìn)行基因型鑒定。PCR 條件:95℃3 min,95℃15 s 58℃15 s 72℃1 min 35 個(gè)循環(huán),72℃5 min。
1.2.8 rs7100025 位點(diǎn)敲除細(xì)胞系的單克隆的篩選 對(duì)經(jīng)鑒定產(chǎn)生rs7100025 位點(diǎn)敲除的細(xì)胞進(jìn)行單克隆篩選。將細(xì)胞稀釋到100 個(gè)/mL 的濃度后,在顯微鏡下將單個(gè)細(xì)胞挑取到96 孔板中,每天觀察細(xì)胞的生長(zhǎng)狀況,待細(xì)胞長(zhǎng)滿96 孔板后將其傳至24 孔板內(nèi),待細(xì)胞量足夠后,收取部分細(xì)胞提取基因組DNA,然后做基因型鑒定。將PCR 產(chǎn)物進(jìn)行瓊脂糖電泳實(shí)驗(yàn),選取有敲除的條帶進(jìn)行Sanger 測(cè)序。將測(cè)序結(jié)果顯示rs7100025 位點(diǎn)有敲除的單克隆細(xì)胞進(jìn)行傳代培養(yǎng)。
1.3 統(tǒng)計(jì)學(xué)處理 數(shù)據(jù)分析和作圖采用GraphPad Prism 7.0 軟件。兩組間比較采用t 檢驗(yàn),P<0.05 差異具有統(tǒng)計(jì)學(xué)意義。
2.1 生物信息學(xué)發(fā)現(xiàn)10p11.21 位點(diǎn)因果變異 表2 為PICS 值前5 的SNPs。rs7100025 的PICS 值為0.705 7,遠(yuǎn)遠(yuǎn)大于同一連鎖不平衡區(qū)域(Linkage disequilibrium,LD)的其他SNPs。
表2 10p11.21 位點(diǎn)的SNPs 為幼年特發(fā)性關(guān)節(jié)炎因果變異的PICS 后驗(yàn)概率Tab 2 PICS posterior probability of being causal variants in juvenile idiopathic arthritis for SNPs at 10p11.21 locus
2.2 SNPrs7100025 是一個(gè)多效性變異 針對(duì)rs7100025 位點(diǎn)的PheWAS 研究顯示,rs7100025 與眾多疾病有著密切的關(guān)系,例如典型的心臟病、免疫系統(tǒng)疾病,rs7100025 是一個(gè)多效性變異(pleiotropic variant),對(duì)許多疾病有著重要影響,見圖1。
圖1 rs7100025 位點(diǎn)PheWAS 結(jié)果圖Fig 1 The results of PheWAS at rs7100025
2.3 PGL4.23-rs7100025 質(zhì)粒構(gòu)建 將rs7100025位點(diǎn)附近一段500 bp 的序列克隆到PGL4.23 載體上,如圖2 所示,rs7100025 位點(diǎn)正向和反向序列的PCR 產(chǎn)物為545 bp,載體用Hind Ⅲ和KpnⅠ雙酶切之后的長(zhǎng)度為4 236 bp,通過(guò)同源重組技術(shù)將PCR 純化產(chǎn)物和載體純化產(chǎn)物連接。質(zhì)粒構(gòu)建成功后Sanger 測(cè)序無(wú)誤。
圖2 重組質(zhì)粒PGL4.23-rs7100025 的構(gòu)建Fig 2 Construction of recombinant plasmid PGL4.23-rs7100025
2.4 熒光素酶報(bào)告基因?qū)嶒?yàn)檢測(cè)rs7100025 位點(diǎn)的功能 雙熒光素酶報(bào)告基因?qū)嶒?yàn)顯示,正向插入包含G 等位基因和A 等位基因的rs7100025 序列可以提高熒光素酶報(bào)告質(zhì)粒轉(zhuǎn)錄活性,并且G 等位基因效果更加明顯;反向插入包含C 等位基因和T等位基因的rs7100025 序列對(duì)基因的調(diào)控與空載對(duì)照相比無(wú)明顯差異,見圖3。
圖3 熒光素酶報(bào)告基因?qū)嶒?yàn)檢測(cè)rs7100025 的轉(zhuǎn)錄調(diào)控功能Fig 3 Luciferase reporter gene assay detects the transcription regulatory activity of rs7100025
2.5 rs7100025 位點(diǎn)gRNA 質(zhì)粒構(gòu)建 Lenti-Cas9-V2 質(zhì)粒經(jīng)BsmbⅠ酶切之后的產(chǎn)物,瓊脂糖凝膠電泳回收12 988 bp 大小的條帶(圖4B),與退火形成的sgRNA 雙鏈用T4 連接酶連接,其中sgRNA 在基因組上的位置如圖4A 所示,構(gòu)建好的質(zhì)粒均經(jīng)過(guò)Sanger 測(cè)序驗(yàn)證正確。2.6 rs7100025 位點(diǎn)敲除的Jurkat 細(xì)胞系構(gòu)建 利用構(gòu)建的sgRNA 質(zhì)粒以及慢病毒介導(dǎo)的感染技術(shù),將rs7100025 位點(diǎn)在Jurkat 細(xì)胞系中進(jìn)行敲除,并經(jīng)過(guò)嘌呤霉素篩選,篩選出單克隆。單克隆細(xì)胞基因型鑒定的結(jié)果如圖所示(圖5A)。選取3 號(hào)單克隆做Sanger測(cè)序,測(cè)序結(jié)果如圖所示(圖5B)。Jurkat 細(xì)胞chr10:37303388 至chr10:37303844 的基因組DNA 序列(456 bp)被敲除。SNPrs7100025(chr10:37303610)就位于這段序列之中。因此,成功建立了幼年特發(fā)性關(guān)節(jié)炎10 號(hào)染色體上遺傳位點(diǎn)因果變異刪除的單克隆細(xì)胞。
圖4 rs7100025 位點(diǎn)敲除質(zhì)粒的構(gòu)建Fig 4 Construction of plasmids with rs7100025 genomic region being deleted
圖5 rs7100025 位點(diǎn)敲除的Jurkat 細(xì)胞系構(gòu)建Fig 5 Construction of Jurkat cell line with rs7100025 region being deleted
在過(guò)去十多年中,GWAS 已經(jīng)對(duì)人類基因組中數(shù)百萬(wàn)個(gè)遺傳變異進(jìn)行了基因型-表型關(guān)聯(lián)測(cè)試,研究SNP 與疾病的相關(guān)性,報(bào)道了眾多復(fù)雜疾病的遺傳位點(diǎn)[4,9]。GWAS 中所發(fā)現(xiàn)的遺傳位點(diǎn)具有以下3 個(gè)特點(diǎn)。
(1)GWAS 研究發(fā)現(xiàn)的indexSNP 不一定是因果變異。由于LD 的存在,遺傳變異通常會(huì)與染色體上的一些臨近變異高度連鎖。因此,當(dāng)一個(gè)區(qū)域中的一個(gè)或多個(gè)變異,對(duì)人類復(fù)雜特征或疾病產(chǎn)生因果效應(yīng)時(shí),該區(qū)域中的許多非因果變異也與疾病等表型呈現(xiàn)顯著相關(guān)性。目前已經(jīng)有許多統(tǒng)計(jì)方法和基因組功能注釋被廣泛應(yīng)用于確定因果變異[10-12],例如貝葉斯分析、ANNOVAR 注釋軟件、VEP 注釋軟件等等。本研究使用了自身免疫病致病變異的遺傳和表觀遺傳精細(xì)定位平臺(tái)進(jìn)行生物信息學(xué)分析確定了rs7100025 為10p11.21 位點(diǎn)最為可能的因果變異。
(2)無(wú)論是GWAS 的indexSNP 還是因果變異,大約93%的SNP 都位于基因組的非編碼區(qū),例如基因的內(nèi)含子和基因間的區(qū)域[13]。因此,GWASSNPs對(duì)疾病發(fā)生、發(fā)展的影響是通過(guò)其對(duì)靶基因的轉(zhuǎn)錄調(diào)控實(shí)現(xiàn)的。通過(guò)熒光酶素實(shí)驗(yàn)證明了rs7100025具有調(diào)控轉(zhuǎn)錄的能力。
(3)GWAS 位點(diǎn)所調(diào)控的靶基因不一定是距離其最近的基因。有可能是eQTL 基因或者Hi-C 基因[14],與GWAS 因果變異在基因組分布上有一定的距離。由于染色質(zhì)的高度折疊,GWAS 因果變異與靶基因的啟動(dòng)子區(qū)相反應(yīng),實(shí)現(xiàn)其對(duì)靶基因的遠(yuǎn)端調(diào)控作用。
由于基因組編輯的困難,GWAS 位點(diǎn)的功能研究遠(yuǎn)遠(yuǎn)落后于GWAS 的遺傳學(xué)發(fā)現(xiàn)。CRSPR/Cas9 技術(shù)的發(fā)明和應(yīng)用為進(jìn)行GWASSNP 的功能研究提供了新的方向。在腎癌易感性遺傳位點(diǎn)的功能研究中,研究者在人腎細(xì)胞癌細(xì)胞中敲除因果變異rs35252396,獲得了單克隆細(xì)胞。進(jìn)一步與野生型細(xì)胞相比,發(fā)現(xiàn)其所調(diào)控的靶基因及所影響的信號(hào)通路[15]。在另一項(xiàng)對(duì)多種自身免疫病的遺傳學(xué)研究中,作者利用CRISPR/Cas9 技術(shù)將rs558245864 位點(diǎn)敲除獲得了兩個(gè)雜合細(xì)胞系,并與野生型細(xì)胞系相比,發(fā)現(xiàn)這一位點(diǎn)對(duì)染色質(zhì)可及性及基因轉(zhuǎn)錄的影響[16]。因此,建立因果變異刪除的單克隆細(xì)胞系是對(duì)GWAS 位點(diǎn)進(jìn)行功能研究的重要環(huán)節(jié)。
GWAS 單一SNP 對(duì)疾病的作用力相對(duì)較小,體現(xiàn)為其OR 一般僅為1.1~1.2。此外,GWAS 位點(diǎn)的作用往往由多個(gè)變異共同驅(qū)動(dòng),對(duì)單個(gè)變異進(jìn)行編輯可能無(wú)法表現(xiàn)出足夠的作用力以產(chǎn)生相應(yīng)的細(xì)胞或生化水平的變化,因此對(duì)整個(gè)疾病遺傳位點(diǎn)的刪除可能是一種更為有效的研究策略[17-19]。同樣在技術(shù)上,對(duì)單一SNP 的編輯目前相對(duì)較難。因此在GWAS 位點(diǎn)的功能學(xué)研究中,往往對(duì)GWAS 位點(diǎn)進(jìn)行敲除。敲除的片段大小從幾十個(gè)堿基到幾百個(gè)堿基不等。當(dāng)然對(duì)單一SNP 編輯,更能精準(zhǔn)地研究這一SNP 的功能和作用。在一項(xiàng)關(guān)于5 種血管系統(tǒng)疾?。╲ascular diseases)的研究中,研究者在內(nèi)皮細(xì)胞和血管平滑肌細(xì)胞中特異性敲除了rs9349379 位點(diǎn)附近的88bp 區(qū)域,通過(guò)RNA-seq 實(shí)驗(yàn)發(fā)現(xiàn)這一缺失導(dǎo)致內(nèi)皮素-1(EDN1)基因的表達(dá)水平升高。然后再對(duì)rs9349379 位點(diǎn)進(jìn)行單堿基的編輯,得到rs9349379的次等位基因型(G/G)的細(xì)胞系,驗(yàn)證了EDN1 為rs9349379 位點(diǎn)的靶基因[20]。
利用CRSPR/Cas9 技術(shù)對(duì)免疫細(xì)胞進(jìn)行基因組編輯的實(shí)驗(yàn)存在著許多技術(shù)難點(diǎn)。與腫瘤細(xì)胞系的貼壁生長(zhǎng)不同,作為自身免疫疾病的研究模型Jurkat 細(xì)胞是懸浮細(xì)胞。對(duì)其進(jìn)行轉(zhuǎn)染效率低,因此采用了慢病毒感染的方法。通過(guò)獲得高滴度的病毒液來(lái)感染懸浮細(xì)胞,從而使懸浮細(xì)胞的基因組編輯成功進(jìn)行。應(yīng)用該技術(shù)成功敲除了Jurkat 細(xì)胞中rs7100025 所在的基因組區(qū)域,為尋找這一位點(diǎn)的靶基因以及后續(xù)的相關(guān)功能研究奠定了基礎(chǔ)。