唐 興, 王洪亮, 梁廣男, 劉雅莉, 段志貴
(1.衡陽師范學院生命科學與環(huán)境學院,湖南 衡陽 421008;2.衡陽師范學院南岳山區(qū)生物資源保護與利用湖南省重點實驗室,湖南 衡陽 421008;3.東華理工大學江西省質譜科學與儀器重點實驗室,江西 南昌 330013;4.湖南師范大學動物多肽藥物國家地方聯(lián)合工程實驗室,湖南 長沙 410081)
為了保護自己免受掠食者侵害,兩棲動物已進化出不同的形態(tài)、生理和行為特征[1].兩棲動物皮膚分泌物含有大量的活性多肽.這些多肽儲存在兩棲動物皮膚的顆粒腺體中,在受到壓力或受傷時可以高濃度釋放到皮膚分泌物中[2],它們能保護皮膚免受環(huán)境和致病性的傷害,并發(fā)揮許多其他生物學作用[3].
大量的研究證明,兩棲動物皮膚活性多肽具有潛在藥物治療作用.在過去的幾十年里,蛙和蟾蜍(兩棲類無尾目)皮膚分泌物中的生物活性多肽被廣泛研究,目前已發(fā)現(xiàn)約2 000個(超過100個家族)活性多肽[2-6].這些皮膚活性多肽功能各異,包括抗菌肽、神經肽、緩激肽、蛙皮素、速激肽、色氨肽、膽囊收縮素、阿片樣肽、蛋白酶抑制劑肽、抗氧化肽、凝集素、胰島素釋放肽、肥大細胞降解/組胺釋放肽、傷口愈合肽,免疫調節(jié)肽、神經元一氧化氮合酶抑制劑等[2].但是,蠑螈(兩棲類有尾目)的皮膚活性多肽鮮有報道[7-9].
藍尾蠑螈(Cynopscyanurus)屬于兩棲綱、有尾目、蠑螈科、蠑螈屬,分布于我國貴州和云南的海拔1800米以上地區(qū),多棲息于水塘、稻田水溝、沼澤地水坑,其捕食對象包括蚊、蠅蟲等有害昆蟲的幼蟲[10,11],因此藍尾蠑螈是一種具有重要的農業(yè)保護價值的兩棲動物.目前關于藍尾蠑螈的發(fā)育、繁殖生態(tài)、肢體再生等研究已有一些論文報道[10-12],但是未有對其皮膚的物質組成和功能進行研究報道.本研究首次對藍尾蠑螈皮膚進行轉錄組測序,并分析其轉錄組和活性多肽成分.
將錫箔紙包裹鐵制器具和研缽后在180 ℃下烘烤過夜以滅活RNA酶.雙蒸水及濾紙均滅菌處理.試驗所用槍頭、離心管、手套等均為RNase Free產品.用70%乙醇擦洗超凈臺后,將所有試驗用品在紫外燈下照射1 h.
藍尾蠑螈成體(圖1)購買于云南某養(yǎng)殖場,為人工繁殖的后代.取藍尾蠑螈成體1只,用雙蒸水清洗皮膚后用濾紙擦干.用眼科剪剪破藍尾蠑螈背部皮膚,再用鑷子撕下皮膚后立刻加入到液氮預冷的研缽中研磨約10 min至粉狀,再通過Trizol試劑盒提取藍尾蠑螈皮膚總RNA.
圖1 藍尾蠑螈
取適量皮膚總RNA以Agilent Bioanalyzer進行毛細管電泳以鑒定RNA樣品濃度、純度、完整性.RNA樣品達到以下要求即可符合cDNA文庫構建要求:RNA總量≥10 μg;RNA濃度≥200 ng·μL-1;RNA完整值≥7.0,28S∶18S濃度比≥1.0.
總RNA用DNaseⅠ處理后,采用Oligo(dt)—磁珠法分離mRNA.在mRNA中加入片段化試劑以形成mRNA短片段,并以其為模板合成第一條鏈cDNA,然后以雙鏈合成反應體系合成雙鏈cDNA.將雙鏈cDNA純化后加入EB緩沖液,再進行末端修復.雙鏈cDNA的3′末端添加腺嘌呤(A)并連接接頭,再選擇合適片段大小的雙鏈cDNA進行PCR擴增.cDNA文庫質檢合格后使用Illumina HiSeq 4000進行測序.
測序獲得的原始reads經過過濾后,獲得clean reads數(shù)據(jù).使用Trinity軟件對clean reads重疊序列連成更長的片段contig(重疊群),然后使用Tgicl軟件將來自同一轉錄本的不同contig進行聚類、去冗余、組裝,得到最長的unigene序列.
通過Blast(http://blast.ncbi.nlm.nih.gov/Blast.cgi)對所有unigene進行NT、NR、COG、KEGG、SwissProt注釋,使用Blast2GO(www.blast2go.com)以及NR注釋結果進行GO注釋,采用 InterProScan5[13]進行InterPro注釋.根據(jù)unigene的COG和GO注釋結果,統(tǒng)計了各自的功能分類.
多肽前體序列使用信號肽在線軟件SignalP-5.0 Server[14]識別多肽信號肽序列,再利用MEGA 6.0軟件將皮膚活性多肽與其同源多肽的氨基酸序列進行對比.
在本試驗中,藍尾蠑螈皮膚總RNA經過質檢后,其濃度為684 ng·μL-1,RNA總量為13.68 μg,RIN為7.6,rRNA的28S∶18S濃度比為1.2.藍尾蠑螈皮膚總RNA完全滿足cDNA文庫構建要求.
本試驗使用Illumina HiSeq 4000共測定了6.65 Gb數(shù)據(jù).測序的原始reads總數(shù)目為47.36 M,而過濾后clean reads數(shù)目為44.35 M(占原始reads總數(shù)93.64%).然后clean reads組裝成contig,再通過聚類去冗余和組裝得到75 462個unigene,其N50、GC含量、平均長度、總長度分別為1 617 bp、45.64 %、818 bp、61 801 999 bp.
所有unigene在NR、NT、GO、COG、KEGG、Swissprot、Interpro數(shù)據(jù)庫中完成注釋后,統(tǒng)計了注釋結果(表1).其中NR、Swissprot、KEGG數(shù)據(jù)庫的注釋unigene最多,均占unigene總數(shù)的30%以上(分別為42.31%、35.50%、32.74%).所有注釋的unigene去冗余后,共獲得34 850個非冗余注釋unigene,占unigene總數(shù)的46.18%.
表1 藍尾蠑螈皮膚轉錄組unigene的功能注釋統(tǒng)計
Unigene注釋結果的物種分布如圖2所示,注釋結果為兩棲類物種的unigene數(shù)目約占注釋總數(shù)的16%;注釋結果最多的兩棲類物種是熱帶爪蟾(Xenopustropicalis)和非洲爪蟾(Xenopuslaevis),注釋結果分別約占注釋總數(shù)的11%和4%;注釋結果為其他兩棲動物約占注釋總數(shù)的1%,其中一些注釋結果來源于蠑螈物種,如墨西哥鈍口螈、紅腹蠑螈、綠紅東美螈、東方蠑螈等.
圖2 藍尾蠑螈皮膚轉錄組unigene注釋結果的物種分布
將COG數(shù)據(jù)庫的注釋基因進行功能分類(圖3).共鑒定22 154個COG注釋項(25個COG類別).其中,“一般功能基因”(3 802個,占比為17.16%(3 802/22 154),下文同)的COG注釋項最多;其次是“翻譯、核糖體結構與生物發(fā)生”(2 180個,占比為9.84%)、“復制、重組和修復”(2 086個,占比為9.42%)、“轉錄”(1 745個,占比為7.88%)、“細胞周期控制、細胞分裂、染色體分裂”(1 390個,占比為6.27%)、“翻譯后修飾、蛋白質周換、分子伴侶”(1 309個,占比為5.91%)、“未知功能基因”(1 309個,占比為5.91%);而COG注釋項最少的類別是“核結構”(7個,占比為0.03%)以及“胞外結構”(39個,占比為0.18%).
1.翻譯、核糖體結構和生物發(fā)生;2.轉錄;3.信號轉導機制;4.次生代謝產物生物合成、運輸和分解代謝;5.RNA處理和修飾;6.復制、重組和修復;7.翻譯后修飾、蛋白質轉換、伴侶;8.核苷酸轉運和代謝;9.核結構;10.脂質運輸和代謝;11.細胞內運輸、分泌和囊泡運輸;12.無機離子轉運和代謝;13.一般功能蛋白;14.未知功能蛋白;15.胞外結構;16.能量生產和轉換;17.防御機制;18.細胞骨架;19.輔酶轉運和代謝;20.染色質結構和動力學;21.細胞壁/膜/包膜生物發(fā)生;22.細胞運動;23.細胞周期控制、細胞分裂、染色體分裂;24.糖類運輸和代謝;25.氨基酸轉運與代謝.
通過基因本體論(gene ontology, GO)數(shù)據(jù)庫對所有unigene進行功能分類(圖4),共獲得76 963個GO注釋項.其中,涉及生物過程的GO注釋項有38 192個(49.62%),涉及細胞成分的GO注釋項有27 409個(35.61%),涉及分子功能的GO注釋項有11 362個(14.76%).
1.行為;2.生物粘附;3.生物相;4.生物調節(jié);5.細胞聚集;6.細胞殺傷;7.細胞成分組織或生物發(fā)生;8.細胞過程;9.發(fā)育過程;10.生長;11.激素分泌;12.免疫系統(tǒng)過程;13.定位;14.運動;15.代謝過程;16.多細胞生物過程;17.多生物過程;18.生物過程的負調控;19.生物過程的正向調節(jié);20.生物過程的調節(jié);21.刺激反應;22.節(jié)律過程;23.信號傳遞;24.單組織過程;25.細胞;26.細胞連接;27.細胞組分;28.膠原三聚體;29.細胞外基質;30.細胞外基質組分;31.細胞外區(qū)域;32.細胞外區(qū)域組分;33.大分子復合物;34.膜;35.膜包腔;36.膜組分;37.細胞器;38.細胞器組分;39.突觸;40.突觸組分;41.抗氧化活性;42.結合;43.催化活性;44.通道調節(jié)活性;45.趨化活性;46.化學排斥活性;47.電子載體活性;48.酶調節(jié)活性;49.鳥苷酸交換因子活性;50.金屬伴侶活性;51.分子轉換器活性;52.核酸結合轉錄因子活性;53.蛋白質結合轉錄因子活性;54.蛋白質標簽;55.受體活性;56.受體調節(jié)活性;57.結構分子活性;58.翻譯調節(jié)活性;59.轉運體活性.
在藍尾蠑螈皮膚轉錄組學中鑒定到多種皮膚活性多肽.其中,膽囊收縮素、速激肽、防御素、降鈣素、蛋白激酶抑制劑與已知多肽序列進行比較,結果發(fā)現(xiàn)在其他物種中均存在相同的成熟肽序列(表2).
表2 其他物種中存在相同成熟肽序列的藍尾蠑螈皮膚活性多肽
另外,本次試驗還鑒定一些與已知多肽具有高同源性的活性多肽,包括神經肽FF和神經肽AF、胸腺肽β4、C型利鈉肽、降鈣素基因相關肽、cathelicidin類抗菌肽等,它們與已知多肽序列具有高度的序列相似性.下面將對這些高同源性的活性多肽進行詳細分析.
2.4.1 神經肽FF和神經肽AF 神經肽FF和神經肽AF最初被認為是一種抗阿片肽[15],能介導疼痛反應.后來的研究證明神經肽FF還具有一些其他作用,如調節(jié)神經內分泌系統(tǒng)、能量平衡、抗炎、疼痛傳遞和脂肪組織巨噬細胞的外周調節(jié)[16].而神經肽AF主要研究聚焦于動物攝食[17-19]和記憶[20].
本研究鑒定的藍尾蠑螈神經肽FF與來源于加蓬蚓螈(Geotrypetesseraphini)以及非洲爪蟾(Xenopuslaevis)的神經肽FF具有較高的序列相似性,僅N端氨基酸有差異(表3).藍尾蠑螈神經肽AF與3種兩棲類動物—非洲爪蟾、熱帶爪蟾(Xenopustropicalis)、美洲牛蛙(Lithobatescatesbeianus)的神經肽AF的序列相似性超過83%(表4).從表3和表4可以看出,神經肽FF家族和神經肽AF家族的成熟肽C端序列均高度保守,且C末端均具有酰胺化的苯丙氨酸(F)殘基.
表3 神經肽FF的成熟肽序列1)
表4 神經肽AF的成熟肽序列1)
2.4.2胸腺肽β4 胸腺肽β4是一種天然再生蛋白,具有血管生成和抗炎活性,并可在傷口處聚集大量血小板,在組織保護、修復和再生中起著重要作用[21-23].本次試驗鑒定的藍尾蠑螈胸腺素β4與兩種蚓螈—加蓬蚓螈和Microcaecilia屬蚓螈(Microcaeciliaunicolor)的胸腺素β4具有較高的序列相似性.它們均富含堿性氨基酸K以及酸性氨基酸E,而且它們的N端氨基酸序列在進化上相對保守(表5).
表5 胸腺肽β4的成熟肽序列1)
2.4.3 C型利鈉肽 C型利鈉肽不僅調節(jié)血管張力和血壓,而且還調節(jié)多種心血管效應[24].此外,研究結果也表明C型利鈉肽也參與了四肢骨骼發(fā)育的調節(jié)[25].將藍尾蠑螈C型利鈉肽前體與美洲牛蛙C型利鈉肽前體進行序列比較,結果發(fā)現(xiàn)它們在信號肽(signal peptide)和中間肽(propeptide)的序列相似性很低.它們的成熟肽序列含有一對二硫鍵,且序列相似性達到86%(表6).
表6 C型利鈉肽前體序列1)
2.4.4 降鈣素基因相關肽 降鈣素基因相關肽(calcitonin gene related peptide, CGRP)是一種高效血管舒張劑,對多種心血管疾病具有保護作用[26].此外,降鈣素基因相關肽的表達水平與軀體、內臟、神經病理性和炎癥性疼痛之間存在一定相關性[27].
將藍尾蠑螈CGRP前體與高山倭蛙(Nanoranaparkeri)CGRP前體進行序列比較,結果發(fā)現(xiàn)它們均存在成熟肽將兩段中間肽(中間肽1和中間肽2)隔開的序列結構,而且成熟肽序列高度相似(表7).兩種兩棲動物的CGRP前體的N端序列在進化上比C端更保守,且C末端均具有酰胺化的苯丙氨酸(F)殘基.
表7 降鈣素基因相關肽前體序列1)
2.4.5 cathelicidin類抗菌肽 在脊椎動物中均存在具有廣譜抗菌活性的cathelicidin類抗菌肽[28].從紅瘰疣螈皮膚中鑒定到一種cathelicidin,該多肽有助于蠑螈傷口愈合和皮膚再生.由于紅瘰疣螈cathelicidin僅含有12個氨基酸殘基,因此具有開發(fā)成為新型創(chuàng)傷愈合劑的潛力[29].
在分類學上,藍尾蠑螈屬于蠑螈科蠑螈屬,而紅瘰疣螈屬于蠑螈科疣螈屬.將兩種蠑螈的cathelicidin前體序列進行比較(表8),結果發(fā)現(xiàn)它們信號肽的序列相似性最高(95.0%),中間肽的序列相似性略低(83%);而成熟肽序列中均含有一對二硫鍵,但是兩者相似性最低(47%).由于兩種成熟肽相似性較低,因此下一步將深入比較研究兩種蠑螈cathelicidin的抗菌或傷口愈合活性.
表8 cathelicidin前體序列1)
兩棲動物的皮膚直接暴露于不同的環(huán)境中,其環(huán)境因素包括微生物、寄生蟲、捕食者、物理、化學因素等,它的特殊棲息地也是作為水陸進化之間的橋梁[2].因此,研究兩棲動物皮膚成分對闡明其生理學功能具有重要科學意義.
本研究首次揭示了藍尾蠑螈皮膚轉錄組和活性多肽成分.通過生物信息學分析,共獲得75 462個unigene.在功能數(shù)據(jù)庫注釋后得到34 850個非冗余注釋unigene,占unigene總數(shù)的46.18%,其中注釋結果為兩棲類物種的unigene數(shù)目約占注釋總數(shù)的16%.分別對GO和COG數(shù)據(jù)庫的注釋unigene進行功能分類.另外,從藍尾蠑螈皮膚轉錄組中鑒定到多種皮膚活性多肽,如膽囊收縮素、速激肽、防御素、降鈣素、蛋白激酶抑制劑、神經肽FF和神經肽AF、胸腺肽β4、C型利鈉肽、降鈣素基因相關肽、cathelicidin類抗菌肽等.下一步將合成或表達這些皮膚活性多肽并進行詳細的功能研究.