趙海東,陳平博,韋燕佩,鄔明麗,易曉華,杜敏杰,魏澤輝*,孫秀柱*
(1.西北農(nóng)林科技大學(xué) 動物科技學(xué)院,陜西 楊凌 712100;2.成都中科奧格生物科技有限公司,四川 成都 610000)
基因編輯技術(shù)因其能夠定向改造動物基因組相關(guān)信息的強(qiáng)大功能受到研究者的追捧,其在建立疾病模型、培育新型轉(zhuǎn)基因動物品種和治療人類疾病等尖端科研領(lǐng)域具有劃時(shí)代的作用。隨著相關(guān)研究的不斷推進(jìn),基因編輯動物上存在的某些問題也逐漸引起了社會的關(guān)心與擔(dān)憂,其中對基因編輯動物“早衰”和“抵抗力低”等問題尤為重視。隨著基因編輯動物技術(shù)的日漸成熟和群體規(guī)模的不斷擴(kuò)大,對基因編輯動物環(huán)境適應(yīng)能力的研究顯得尤為重要,同時(shí)這也是基因編輯動物是否具有市場推廣價(jià)值的重要評價(jià)環(huán)節(jié)。
鋅指蛋白6(zinc finger BED-type containing 6,)基因是近年來新發(fā)現(xiàn)的一個重要的轉(zhuǎn)錄因子,該基因位于豬基因第一內(nèi)含子區(qū)段,其調(diào)控模式傾向于與宿主基因共用調(diào)控區(qū),本身僅含有一個外顯子,在哺乳動物當(dāng)中較為保守。同時(shí),基因在哺乳動物中具有能夠保守性調(diào)控IGF2(Insulin-like growth factor 2)的功能,通過結(jié)合內(nèi)含子區(qū)段的GCTCG序列調(diào)節(jié)表達(dá)的效率,提升豬產(chǎn)肉量,以期能夠創(chuàng)制一個高產(chǎn)肉豬新品種。潘登科通過CRISPER/Cas9技術(shù)獲得了基因敲除豬群體,并對其在肌肉發(fā)育、血液生化和心臟發(fā)育等方面進(jìn)行了相應(yīng)的研究。但其環(huán)境適應(yīng)能力和免疫機(jī)能是否健康、健全均未從分子層面加以明確。脾臟是哺乳動物集體重要的免疫器官,能夠作為免疫球蛋白的成熟器官參與機(jī)體免疫功能。因此,本研究擬通過對-SKO和WT組基因編輯豬脾臟組織進(jìn)行轉(zhuǎn)錄組測序,通過生物信息學(xué)方法對其分子層面的差異表達(dá)基因進(jìn)行分析,獲得基因編輯豬免疫功能是否正常的相關(guān)分子層面數(shù)據(jù)資料,以期為基因編輯動物安全性評價(jià)和環(huán)境適應(yīng)能力評價(jià)提供科學(xué)依據(jù)。
Trizol購自Takara公司。主要儀器有PCR儀(伯樂),凝膠成像系統(tǒng)(伯樂),微量分光光度計(jì)(賽默飛)。
試驗(yàn)用基因單等位基因敲除巴馬小型豬()4份脾臟組織樣本和半同胞野生型巴馬小型豬()3份脾臟組織樣本由成都中科奧格生物科技有限公司潘登科團(tuán)隊(duì)饋贈?;蚯贸i采用CRISPR/Cas9技術(shù)制備,在其外顯子區(qū)產(chǎn)生1 bp 缺失使得基因發(fā)生移碼突變達(dá)到對該基因的敲除,通過PCR擴(kuò)增結(jié)合sanger測序驗(yàn)證敲除位點(diǎn),使用正向引物為: 5'-GCTTTGTTAGCGTCTGATGCC-3',反向引物為:5'-AGGTTACAAATTGCCCGCCA-3'。
組織樣品收集并保存于液氮中,采用Trizol法對7個脾臟樣本進(jìn)行RNA提取,使用NanoDrop 1000和凝膠電泳對RNA的質(zhì)量進(jìn)行檢驗(yàn),RNA樣本檢驗(yàn)合格后,送上海生工生物科技有限公司進(jìn)行文庫構(gòu)建及測序。文庫構(gòu)建完成后對建成文庫的質(zhì)量進(jìn)行檢測,文庫質(zhì)量合格后,利用Illumina 1.9測序平臺對7個樣本進(jìn)行雙端150 bp高通量測序。
1.4.1 質(zhì)控與比對 對測序的原始數(shù)據(jù)通過FastQC進(jìn)行質(zhì)量評估,通過Trimmomatic進(jìn)行質(zhì)量剪切,得到相對準(zhǔn)確的有效數(shù)據(jù)。使用HISAT2將樣本有效數(shù)據(jù)比對到參考基因組上,統(tǒng)計(jì)Mapping信息。采用Qualimap根據(jù)比對結(jié)果進(jìn)行均一性分布檢查、基因組結(jié)構(gòu)分布等分析。利用BEDTools進(jìn)行基因覆蓋率統(tǒng)計(jì)分析和染色體上測序序列分布等分析。
1.4.2 表達(dá)差異分析 使用StringTie和已知的基因模型對測序所得數(shù)據(jù)進(jìn)行基因表達(dá)量的計(jì)算,對測序數(shù)據(jù)獲得的表達(dá)數(shù)量,考慮到基因長度、測序深度和樣本的不同,采用TPM (Transcripts Per Million)對基因表達(dá)量進(jìn)行估算。針對-SKO 組和對照組脾臟測序數(shù)據(jù),使用DESeq2進(jìn)行基因表達(dá)差異分析獲得表達(dá)具有顯著差異的基因集(<0.05),采用Z-score對差異表達(dá)數(shù)據(jù)進(jìn)行歸一化,采用hclust對差異表達(dá)數(shù)據(jù)進(jìn)行層級聚類,對獲得的結(jié)果使用pheatmap進(jìn)行可視化。獲取組間基因表達(dá)FDR值小于0.05的基因集,通過模塊表達(dá)分析對基因的表達(dá)模式進(jìn)行鑒定。
1.4.3 差異表達(dá)基因的KOG分類、GO分類和 KEGG富集分析 基于對-SKO型和WT型豬脾臟組織以FDR<0.05位條件獲得差異表達(dá)基因,利用topGO軟件對獲得的差異表達(dá)基因進(jìn)行GO注釋并進(jìn)行可視化,對獲得的差異表達(dá)基因使用clusterProfiler進(jìn)行KEGG通路和KOG分類富集分析與可視化。
通過Sanger測序驗(yàn)證敲除位點(diǎn)正確,存在1 bp缺失造成基因移碼(圖1)。針對-SKO 組和對照組脾臟進(jìn)行測序,每個樣本測序獲得6 Gb以上數(shù)據(jù),并使用FastQC對樣本的測序數(shù)據(jù)質(zhì)量進(jìn)行可視化評估,包括原始序列、過濾后序列、質(zhì)控率和Q30等數(shù)據(jù)(表1)。測序數(shù)據(jù)的過濾后數(shù)據(jù)比率和Q30數(shù)據(jù)比率均超過90%,滿足后續(xù)生物信息學(xué)分析需求。
圖1 ZBED6基因敲除位點(diǎn)sanger測序驗(yàn)證
表1 測序數(shù)據(jù)質(zhì)量控制
以TPM為對象篩選-SKO組和WT組,以<0.05為條件獲取顯著差異表達(dá)基因集,共獲得下調(diào)基因85個,上調(diào)基因62個,對獲得的結(jié)果使用pheatmap進(jìn)行可視化(圖2)。通過FDR值小于0.05對差異表達(dá)基因進(jìn)行校正,獲得上調(diào)基因5個,下調(diào)基因4個,分別是Interleukin 4 receptor()、Dephospho-CoA kinase domain containing()、Family with sequence similarity 91 member A1()、Zinc finger protein 140()、ATPase H+ transporting V1 subunit D()、Endonuclease V()、Zinc finger protein333 ()、Procollagen-lysine,2-oxoglutarate 5-dioxygenase 2()、--211859(novel gene)(表2)。對差異表達(dá)基因進(jìn)行模塊表達(dá)分析分為4個模塊,其中2個上調(diào)模塊和2個下調(diào)模塊(圖3)。上調(diào)模塊為Subcluster 2(和)和Subcluster 3(和),下調(diào)模塊為Subcluster 1(和)和Subcluster 2(和)(表3)。
表2 Q檢驗(yàn)差異表達(dá)基因
表3 差異表達(dá)基因模塊信息
圖2 差異基因表達(dá)量聚類熱圖
圖3 差異基因各模塊表達(dá)趨勢折線圖
對獲得的9個差異表達(dá)基因進(jìn)行比對和功能注釋。在GO分析體系中,對前20條GO富集進(jìn)行可視化,發(fā)現(xiàn)3個基因注釋于GO:0034641 : cellular nitrogen compou,2個基因注釋于GO:0051186 : cofactor metabolic process,2個基因注釋于GO:0006575 : cellular modified amino,但均未發(fā)現(xiàn)顯著富集GO功能(圖4)。在KEGG分析中,富集到20條通路,其中ssc00280:Valine, leucine and isoleucine degradation通路顯著性為0.09,ssc04530:Tight junction通路顯著性為0.16,未富集到顯著差異代謝通路信息(圖5)。通過對KOG富集分析發(fā)現(xiàn)Coenzyme transport and metabolism、General function prediction only、Function unknown和Posttranslational modification, protein turnover, chaperones被富集,但并未富集到顯著KOG信息(圖6)。
圖4 差異表達(dá)基因 GO 功能分類圖
圖5 差異表達(dá)基因 KEGG功能分類圖
圖6 差異表達(dá)基因 KOG 功能分類圖
隨著基因編輯動物育種群體和基因編輯動物實(shí)驗(yàn)?zāi)P腿后w的不斷擴(kuò)展,關(guān)于基因編輯動物安全評價(jià)的相關(guān)研究逐漸被重視。一方面,在基因編輯動物生產(chǎn)的長期實(shí)踐當(dāng)中,成功率極低,且基因編輯動物個體可能存在一定程度的異常風(fēng)險(xiǎn);另一方面,基因編輯動物群體在長期飼養(yǎng)過程中,其繁殖能力、體況外貌和健康指標(biāo)等均與野生型動物不存在明顯差異。一定程度上,基因編輯動物在經(jīng)過重編程的過程中有可能出現(xiàn)相當(dāng)大比例的“重啟失敗”現(xiàn)象,但在成功獲得健康基因編輯動物后,研究者對于其免疫機(jī)能和機(jī)體健康方面的研究則極少涉及。基因編輯操作對動物是否會產(chǎn)生潛在的免疫影響尚不得而知。
6基因作為一個近年來新發(fā)現(xiàn)的轉(zhuǎn)錄因子,是一個重要的瘦肉型家畜新品種創(chuàng)制靶標(biāo),眾多研究者通過基因編輯手段對其功能機(jī)制進(jìn)行闡明與驗(yàn)證。6基因的作用機(jī)制主要依賴于靶向結(jié)合2基因內(nèi)含子區(qū)GCTCG序列產(chǎn)生對IGF2及其下游通路的調(diào)控作用,進(jìn)而影響豬肌肉發(fā)育相關(guān)功能。一方面唐雨婷通過敲除6基因豬的模型研究發(fā)現(xiàn),敲除6基因能夠上調(diào)血液中IGF2的水平;另一方面Liu等通過編輯豬2基因上的6結(jié)合位點(diǎn)后發(fā)現(xiàn)其能夠直接促進(jìn)豬的肌肉發(fā)育水平。
脾臟是動物體重要的免疫器官,針對脾臟基因表達(dá)模式的研究將為基因編輯動物免疫功能是否較預(yù)期存在問題獲得相對具有說服力的數(shù)據(jù)支持。據(jù)此,本研究收集6基因敲除豬脾臟樣本,通過轉(zhuǎn)錄組測序手段,對其差異表達(dá)基因進(jìn)行相關(guān)生物信息學(xué)分析,共發(fā)現(xiàn)9個差異表達(dá)基因(FDR<0.05),其中上調(diào)基因5個,下調(diào)基因4個,分別是4、、911、140、61、、333、2、--211859,在同等飼養(yǎng)條件下,6-SKO組較其半同胞或全同胞WT型對照組差異表達(dá)基因數(shù)量極為有限,并未發(fā)現(xiàn)能夠顯著影響脾臟免疫機(jī)能的差異表達(dá)基因。
針對差異表達(dá)基因進(jìn)行分析。IL4R是一個重要的炎癥因子受體,其表達(dá)量上調(diào)表明基因編輯豬在可能處于一定程度上的應(yīng)激狀態(tài),但其并未產(chǎn)生其他相關(guān)因子的變化,這種變化仍需在后續(xù)大群體樣本中進(jìn)行檢測和持續(xù)關(guān)注。同時(shí)IL4具有肌肉發(fā)生相關(guān)功能,其受體的上調(diào)可能與脾臟組織因IGF2上調(diào)導(dǎo)致的生長發(fā)育變化應(yīng)答有關(guān)?;蚴谴竽X相關(guān)過程的調(diào)節(jié)因子,與帕金森病的發(fā)生具有一定的相關(guān)性,并未有研究發(fā)現(xiàn)其與動物免疫機(jī)能之間的關(guān)系。911作為一個超甲基化基因,其表達(dá)量的異??赡芘c克隆豬在重編程過程中表觀遺傳產(chǎn)生的某種特殊變化有關(guān),同時(shí)該基因功能與細(xì)胞增殖存在一定的相關(guān)性。140基因是鋅指蛋白家族的轉(zhuǎn)錄因子,其功能與骨髓增生異常存在一定的相關(guān)關(guān)系,但其在本研究中6基因敲除豬脾臟中表達(dá)下調(diào)的機(jī)制尚不明確。61基因與細(xì)胞自噬存在一定的相關(guān)性,是真核細(xì)胞廣泛存在的液泡型ATP酶的一個亞單位,對其抑制能夠起到抑制腫瘤細(xì)胞生長、侵襲和轉(zhuǎn)移的作用。Nakadera等發(fā)現(xiàn)61參與抑制mTOR可改善肝脂肪變性引起的自噬小泡酸化損傷。Wang等研究發(fā)現(xiàn)61參與TFEB介導(dǎo)的胰腺炎發(fā)生過程中的溶酶體自噬相關(guān)生物學(xué)功能。ENDOV是一種細(xì)胞內(nèi)DNA損傷保護(hù)因子,它能夠識別和切割含有次黃嘌呤的DNA,其切割位點(diǎn)為損傷堿基次黃嘌呤下游3′端的第二個磷酸二酯鍵,在嗜熱細(xì)菌基因組穩(wěn)定性中具有重要的作用,其在動物中可能具有較為相似的功能,該基因的下調(diào)可能與基因編輯動物DNA的穩(wěn)定性具有一定的關(guān)系,也可能參與部分細(xì)胞癌變的過程,但僅僅這一個基因的表達(dá)變化并不足以導(dǎo)致基因編輯豬遺傳穩(wěn)定性上的障礙。333基因也是鋅指蛋白家族的轉(zhuǎn)錄因子,具有ZFN家族保守性結(jié)構(gòu),尚未有文獻(xiàn)報(bào)道其相關(guān)功能,因此異常表達(dá)在6基因敲除豬脾臟中的意義尚不得而知。2基因與纖維化疾病之間存在顯著關(guān)系,其作為賴氨酸羥化酶2的編碼基因,直接參與器官纖維化的形成。該基因廣泛參與多種生物學(xué)功能,一定程度上該基因高表達(dá)組織具有一定的纖維化風(fēng)險(xiǎn),但在本研究中6基因敲除豬脾臟中2基因低表達(dá)的意義尚不明確。--211859基因作為一個新基因,其功能未見報(bào)道。在對差異表達(dá)基因的GO聚類、KEGG聚類和KOG聚類分析中均未發(fā)現(xiàn)顯著富集的生物學(xué)信息與功能,一定程度上表明在6基因敲除后,其脾臟代謝并未發(fā)生較大的變化,其免疫功能并未產(chǎn)生所擔(dān)心的基因編輯動物“免疫力差”等問題,但不可否認(rèn),本研究僅對6這一個基因編輯豬群體進(jìn)行檢測,其功能在基因編輯動物的大概念上是否適用尚需長期和擴(kuò)展觀測。
通過轉(zhuǎn)錄組測序技術(shù)對6-SKO和WT豬脾臟進(jìn)行鑒定,共發(fā)現(xiàn)9個差異表達(dá)基因(FDR<0.05),在GO分析、KEGG分析和KOG分析中均為發(fā)現(xiàn)明顯的能夠支持基因編輯豬免疫缺陷問題的相關(guān)證據(jù)。因此,6基因敲除豬在免疫功能上一定程度未發(fā)現(xiàn)明顯的因基因編輯相關(guān)操作所造成的“免疫功能障礙”相關(guān)問題,為開展基因編輯動物育種提供相應(yīng)的理論依據(jù)。