翟祥云,陳耀峰,李 輝,杜志強(qiáng)*
(1.東北農(nóng)業(yè)大學(xué) 動(dòng)物科學(xué)技術(shù)學(xué)院,黑龍江 哈爾濱 150030;2.農(nóng)業(yè)部雞遺傳育種重點(diǎn)實(shí)驗(yàn)室,黑龍江 哈爾濱 150030;3.黑龍江省教育廳動(dòng)物遺傳育種與繁殖重點(diǎn)實(shí)驗(yàn)室,黑龍江 哈爾濱 150030)
目前,肉雞育種的目標(biāo)不僅要提高肉雞的生長(zhǎng)速度,同時(shí)要降低肉雞腹部脂肪以提高雞肉品質(zhì),以滿足人們不斷提高的物質(zhì)生活水平?;虻淖饔貌皇枪铝⒌?,而是作為復(fù)雜網(wǎng)絡(luò)的一部分來(lái)執(zhí)行各種細(xì)胞過(guò)程。包括脂肪沉積在內(nèi)的許多脂肪相關(guān)問(wèn)題都是由基因失調(diào)引起的,導(dǎo)致網(wǎng)絡(luò)的攝動(dòng)(拓?fù)渥兓?[1-3]。雞腹部(內(nèi)臟)脂肪的動(dòng)態(tài)消化代謝、內(nèi)分泌協(xié)調(diào)和脂肪細(xì)胞生成等是受多轉(zhuǎn)錄基因調(diào)節(jié)的一個(gè)復(fù)雜過(guò)程,構(gòu)建目標(biāo)性狀驅(qū)動(dòng)的相關(guān)基因網(wǎng)絡(luò)是功能基因組學(xué)相關(guān)研究的主要問(wèn)題[4-5]。對(duì)基于同一組織里的所有基因存在同一個(gè)復(fù)雜網(wǎng)絡(luò)進(jìn)行分析研究,本試驗(yàn)擬采用differential sparsE regulatory network(DISCERN)算法對(duì)高低脂2組7周齡肉雞腹部脂肪的RNA測(cè)序轉(zhuǎn)錄組數(shù)據(jù)中的17 934個(gè)基因進(jìn)行一一打分,根據(jù)得分高低及相關(guān)文獻(xiàn)搜索推斷其與脂肪沉積性狀相關(guān)的重要程度,并篩選出影響肉雞腹部脂肪沉積的關(guān)鍵基因。
1.1 數(shù)據(jù)及來(lái)源數(shù)據(jù)來(lái)源于NCBI GEO Series Accession #GSE42980。文獻(xiàn)資料顯示,該肉雞來(lái)自法國(guó)努齊立國(guó)立農(nóng)學(xué)研究所家禽研究所(本文簡(jiǎn)稱法國(guó)肉雞),根據(jù)腹脂量進(jìn)行雙向選擇而得,根據(jù)基因型該肉雞分為高脂雞(fat line,F(xiàn)L)和低脂雞(lean line,LL)。隨機(jī)選取7周齡的FL和LL各4只,剝離腹部脂肪組織提取RNA,通過(guò)Illumina HiSeq 2000平臺(tái)進(jìn)行測(cè)序分析。該測(cè)序原始數(shù)據(jù)包含24個(gè)樣本,17 935個(gè)基因。
1.2 DISCERN算法采用DISCERN算法[1]對(duì)數(shù)據(jù)進(jìn)行分析,該方法是假設(shè)一個(gè)基因以2種方式在網(wǎng)絡(luò)中受到影響:一個(gè)基因影響其他基因的方式(圖1),例如,轉(zhuǎn)錄因子的驅(qū)動(dòng)突變可以影響細(xì)胞增殖途徑。一個(gè)基因受其他基因影響的方式,例如,當(dāng)一個(gè)突變基因(遺傳或表觀遺傳)獲得一套新的調(diào)控因子時(shí),就會(huì)在肉雞生長(zhǎng)和病變過(guò)程中發(fā)生 (圖2)。篩選導(dǎo)致基因網(wǎng)絡(luò)拓?fù)渥兓幕驅(qū)α私飧共恐痉肿訖C(jī)理和確定關(guān)鍵腹部脂肪靶點(diǎn)至關(guān)重要。本試驗(yàn)利用肉雞的高、低脂系存在基因調(diào)控網(wǎng)絡(luò)為出發(fā)點(diǎn),認(rèn)為存在一類這樣的基因:在2種不同的生理狀態(tài)下(如高脂和低脂),基因與其他基因的聯(lián)系方式發(fā)生了較大變化,這種與其他基因變化聯(lián)系較大的基因被稱為差異聯(lián)系基因(differentially linked genes,以下簡(jiǎn)稱DLGs)。
圖1 基因影響其他基因方式示意圖
圖2 基因受其他基因影響示意圖
其中,x1,…xp表示候選的調(diào)控因子,一組已知基因去調(diào)控其他基因,包括轉(zhuǎn)錄因子、染色質(zhì)修飾體或調(diào)控因子以及信號(hào)轉(zhuǎn)導(dǎo)基因。
線性模型能夠從包含數(shù)萬(wàn)個(gè)基因的全基因組表達(dá)數(shù)據(jù)中得到有效條件依賴性關(guān)系。一個(gè)零權(quán)重Wir表示調(diào)控基因r不會(huì)對(duì)目標(biāo)基因i的表達(dá)程度產(chǎn)生影響。稀疏誘導(dǎo)正則化可以幫助基因選擇一個(gè)候選調(diào)控因子的子集,這種線性模型比其他方法更具生物合理性并解決了高維數(shù)據(jù)中基因數(shù)遠(yuǎn)遠(yuǎn)大于樣本數(shù)的問(wèn)題。
為了確定任一給定基因的調(diào)控因子集,利用DISCERN懲罰回歸模型,將每個(gè)基因的回歸優(yōu)化問(wèn)題定義如下:
(2)
利用DISCERN方法來(lái)分析脂肪組織基因表達(dá)水平間的條件相關(guān)關(guān)系,評(píng)價(jià)肉雞的轉(zhuǎn)錄因子如何調(diào)控每個(gè)基因在高、低脂系脂肪組織中的基因調(diào)控網(wǎng)絡(luò)的位置和網(wǎng)絡(luò)結(jié)構(gòu)變化,計(jì)算相關(guān)得分(分值越高,網(wǎng)絡(luò)結(jié)構(gòu)變化越大),這種算法被定義為:
(4)
其中,ns是數(shù)據(jù)中狀態(tài)為s下的樣本數(shù),分子是預(yù)測(cè)基因i在高脂系(低脂系)的權(quán)重系數(shù)下低脂系(高脂系)表達(dá)水平的測(cè)量誤差,如果基因i在高脂系和低脂系之間有較大的權(quán)重系數(shù)差異,那么基因i有可能有一個(gè)高的DISCERN分?jǐn)?shù)。分母作為歸一化因子發(fā)揮著重要作用,最后得到的DISCERN值是一個(gè)相對(duì)表達(dá)量。
運(yùn)用DISCERN算法得到法國(guó)肉雞腹脂中所有基因的得分排序結(jié)果,共篩選到677個(gè)DLGs(以分值>15為篩選閾值)。根據(jù)相關(guān)文獻(xiàn)查閱及基因分子功能分析,挑選其中的14個(gè)重要基因,整理基因主要信息如表1。其中,HCN4是心臟的起搏基因,屬于HCN基因家族成員,可以編碼產(chǎn)生起搏電流,參與心臟活動(dòng)[6]。NPPC屬于利鈉肽家族成員,可以調(diào)節(jié)糖脂代謝[6];NPPC和受體結(jié)合,通過(guò)cGMP/PKG通路進(jìn)一步分解脂肪[7]。UCN3是CRF肽家族新成員,對(duì)CRFR2具有高親和性,被認(rèn)為是CRFR2的內(nèi)源配體。UCN3廣泛分布于動(dòng)物的各種組織,如在外周組織中,UCN3在消化道、肝臟等組織均有豐富表達(dá),尤其是胃組織,因此UCN3可能參與食欲控制和代謝調(diào)節(jié)[8]。FGF13屬于FGF家族成員,該家族是一個(gè)生長(zhǎng)因子大家族[9];FGF13又稱FHF2,參與脂肪前體細(xì)胞分化,已被多次報(bào)道可能與肌肉的生長(zhǎng)發(fā)育相關(guān)[9]。CERKL基因依靠與SIRT1的相互作用對(duì)自噬進(jìn)行調(diào)節(jié),自噬即自我降解途徑,在饑餓狀態(tài)下,通過(guò)自噬可從機(jī)體獲得能量,維持生存。自噬是一種分解機(jī)制,與脂肪沉積有密切聯(lián)系。SIRT1的磷酸化也受CERKL基因調(diào)節(jié),SIRT1是自噬乙?;c去乙酰化的主要調(diào)節(jié)蛋白[10]。GHRHR基因?qū)儆谏L(zhǎng)激素釋放激素受體,和藏雞或?yàn)o寧雞等其他品種肉雞相比,該基因在白羽肉雞中的基因表達(dá)量較高[11]。SLC38A5與谷氨酰胺轉(zhuǎn)運(yùn)及降解有關(guān),參與谷氨酰胺代謝[12]。GATA4是鋅指結(jié)構(gòu)域轉(zhuǎn)錄因子,可調(diào)控細(xì)胞分化和增殖;鋅指結(jié)構(gòu)域轉(zhuǎn)錄因子家族有6個(gè)成員,其中GATA2和GATA3具有抗成脂分化作用,能夠與C/EBPα和β結(jié)合,破壞其轉(zhuǎn)錄活性,這說(shuō)明GATA因子可以通過(guò)多種信號(hào)通路阻礙脂肪的生成[13]。PLAC8是胎盤特異蛋白8,又稱C15或onzin,該基因表達(dá)的蛋白富含半胱氨酸;PLAC8是一個(gè)誘導(dǎo)劑,通過(guò)C/EBPβ通路,促進(jìn)棕色脂肪分化,從而調(diào)節(jié)體溫和控制體質(zhì)量;PLAC8通過(guò)AKT及RAF-1-ERK2-C-MYC通路信號(hào)調(diào)控細(xì)胞增殖[14]。綜上,成功篩選出一批與脂肪沉積相關(guān)的候選基因。
表1 重要基因、得分及基因主要信息列表
本試驗(yàn)采用的DISCERN算法可以有效識(shí)別影響肉雞腹部脂肪沉積的關(guān)鍵基因,DISCERN算法用模型系數(shù)的絕對(duì)值函數(shù)作為先驗(yàn)值來(lái)壓縮模型系數(shù),兼有子集選擇和嶺回歸估計(jì)的優(yōu)點(diǎn)。采用DISCERN方法進(jìn)行變量選擇與未知參數(shù)估計(jì),可用于高維數(shù)據(jù)分析和解決多重共線性問(wèn)題[15-16]。
本試驗(yàn)對(duì)7周法國(guó)肉雞齡腹部脂肪轉(zhuǎn)錄組測(cè)序數(shù)據(jù)中的17 934個(gè)基因進(jìn)行打分篩選,對(duì)基因調(diào)控網(wǎng)絡(luò)進(jìn)行量化研究,旨在篩選出能夠較大程度影響網(wǎng)絡(luò)結(jié)構(gòu)差異,且具有重要生物學(xué)意義的基因,可以為篩選與目的性狀相關(guān)的重要候選基因以及預(yù)測(cè)新的基因功能提供依據(jù)。