關蘊良
2022年3月有研究團隊發(fā)現(xiàn)了“銅死亡”,這種新的細胞程序性死亡(programmed cell death,PCD)形式有別于以前熟知的細胞凋亡、細胞焦亡和程序性壞死,它是一種新的倚賴金屬離子誘發(fā)蛋白毒性應激導致的細胞死亡[1]。上一次發(fā)現(xiàn)金屬離子可引發(fā)PCD是十年前的鐵死亡;但前者造成細胞死亡的機制是與其截然不同的細胞膜脂質過氧化損傷[2]。研究者們用上百例腫瘤細胞系篩選藥物為切入點,結合多種細胞死亡誘導劑和抑制劑探索發(fā)現(xiàn),銅死亡依賴于線粒體呼吸,銅離子載體利用氧化應激引起了腫瘤細胞的易感性;而這一過程中Fdx1和蛋白質脂?;倾~離子載體誘導細胞死亡的關鍵因子,且前者還是后者的上游調節(jié)因子[3]。目前,PCD與免疫性疾病[4]、發(fā)育障礙[5]和癌癥[6]等多種疾病的相關性已有很多報道。對這些疾病致病機制的探討以及藥物治療靶點的尋找,以PCD調控基因為切入點是生命科學領域常見且有效的科研角度。故本文從Fdx1入手,選擇網(wǎng)絡數(shù)據(jù)挖掘的形式,分析其蛋白的氨基酸結構,預測生物學功能,為后續(xù)銅死亡相關研究的科研設計提供理論支持。
1.1 一般資料 人Fdx1蛋白氨基酸序列由UniProt獲得,登錄號為P10109。
1.2 方法 分析人Fdx1蛋白結構和預測其功能所用的生物信息學數(shù)據(jù)庫、服務器及軟件包等資源信息。見表1。
表1 分析人Fdx1蛋白所用的生物信息學資源詳細信息
2.1 基本分析
2.1.1 理化性質:ProtParam分析人Fdx1蛋白氨基酸序列:長度為184 aa,分子質量約為19 kDa,理論等電點是5.51,分子式為C819H1341N251O275S9,含2 695個原子。消光系數(shù)為8730M-1cm-1(假設所有成對的半胱氨酸殘基都形成胱氨酸),半衰期為30 h(哺乳動物網(wǎng)織紅細胞,體外),脂肪系數(shù)為85.43,總平均親水性為-0.207,不穩(wěn)定系數(shù)為45.75(<40穩(wěn)定)。在組成的20種氨基酸中丙氨酸(A)和甘氨酸(G)所占的比例最高(均10.9%);色氨酸(W)最低(0.5%)。帶負電荷的氨基酸殘基(谷氨酸 + 天冬氨酸)有25個,帶正電荷的氨基酸殘基(賴氨酸+精氨酸)有20個。是PredictProtein對于人Fdx1蛋白氨基酸組成和比例的可視化呈現(xiàn)。見圖1。
圖1 人Fdx1蛋白中各氨基酸構成及含量比例圖;G:甘氨酸;A:丙氨酸;V:纈氨酸;L:亮氨酸;I:異亮氨酸;P:脯氨酸;F:苯丙氨酸;Y:酪氨酸;W:色氨酸;S:絲氨酸;T:蘇氨酸;C:半胱氨酸;M:蛋氨酸;N:天冬酰胺;Q:谷氨酰胺;D:天冬氨酸;E:谷氨酸;K:賴氨酸;R:精氨酸;H:組氨酸
2.1.2 親疏水性分析:將ProtScale每次運行計算和顯示的殘基數(shù)缺省值設為9,得到人Fdx1蛋白整個氨基酸序列的波峰值在第13位丙氨酸(A)處,評分為1.744分,是疏水性最強的點;波谷值在第62位絲氨酸處(S),評分-2.278,是親水性最強的點。以0分為中線整體比較(>0:疏水性;<0:親水性),人Fdx1蛋白親水區(qū)域多于疏水區(qū)域,屬親水性蛋白(與理化性質分析結果一致)。見圖2。
圖2 人Fdx1蛋白親疏水性分析結果
2.1.3 跨膜區(qū)分析:TMHMM 2.0預測人Fdx1蛋白質不具有跨膜結構。全部氨基酸序列均在膜外。見圖3。
圖3 人Fdx1蛋白跨膜區(qū)預測結果
2.1.4 信號肽預測:SignalP 5.0分析認為,人Fdx1蛋白含有信號肽序列的可能性為0.0003。即不含信號肽的可能性大。見圖4。
圖4 人Fdx1蛋白信號肽分析結果
2.1.5 亞細胞定位:Hum-mPLoc 3.0推測,在預測因子涵蓋的12個亞細胞位置中,人Fdx1蛋白唯一在線粒體基質定位的得分為正(2.343577分),其他部位均為負分,即其在線粒體基質的可能性最大。來自SwissBioPics數(shù)據(jù)庫的可視化圖中著淡黃色的線粒體,形象地印證了這一相同的預測結果。見圖5。
圖5 人Fdx1蛋白亞細胞定位示意圖
2.2 特征結構分析
2.2.1 結構域分析:在PFAM domains的Normal模式下運行SMART,可得出人Fdx1蛋白第72~157位存在1個高度保守的結構功能域——Fer2(E=5.8e-10)。見圖6。
圖6 人Fdx1蛋白結構功能域預測結果
2.2.2 模體結構:將MEME篩選數(shù)量設定為11。形象化的展示了人Fdx1蛋白具體的模體信息(不同顏色方塊代表不同模體,方塊大小代表模體長度,框圖內有每個模體具體的氨基酸序列構成)(P值均<0.05)。見圖7。
圖7 人Fdx1蛋白模體分析結果
2.3 空間結構預測
2.3.1 二級結構:SMOPA預測人Fdx1蛋白二級結構結果:主要類型為α-螺旋,有68個(占整個氨基酸序列的36.96%);其次為無規(guī)則卷曲,61個(33.15%);第三是延伸鏈,36個(19.57%);還有10.33%的β-折疊(19個)。見圖8。
圖8 人Fdx1蛋白二級結構預測結果;藍色:α-螺旋;綠色:β-折疊;黃色:無規(guī)則卷曲;紅色:延伸鏈
2.3.2 三級結構:先將人Fdx1蛋白序列與SWISS-MODEL數(shù)據(jù)庫中已有蛋白進行序列比對尋找到50條模板,再兼顧兩者序列的一致性、全球性模型質量估測值(global model quality estimate,GMQE)和全局得分等綜合排序,最終選擇到相似度最高的同源蛋白為模板建模,得到的人Fdx1蛋白三級結構(GMQE:0.59;全局得分:0.83 ± 0.05;模板:3p1m.2.A;序列同一性:100.00%)。見圖9。
圖9 預測人Fdx1蛋白的三級結構圖
2.3.3 四級結構:GeneCards推測Fdx1的四級結構與CYP11A1存在相互作用。并且Fdx1與蛋白結合且在蛋白功能發(fā)揮中必要的非蛋白質化合物——輔因子是[2Fe-2S]簇。
2.4 翻譯后修飾
2.4.1 磷酸化:NetPhos 3.1顯示人Fdx1蛋白整條氨基酸序列共含有22個磷酸化位點:其中絲氨酸磷酸化位點13個;蘇氨酸磷酸化位點8個;酪氨酸磷酸化位點1個。主要涉及包括蛋白激酶A/C、酪蛋白激酶Ⅰ和細胞分裂周期基因2等在內的多個特異性磷酸激酶。見圖10。
圖10 人Fdx1蛋白磷酸化位點預測結果圖
2.4.2 糖基化
2.4.2.1 N-糖基化:NetNGlyc 1.0分析人Fdx1蛋白氨基酸序列一共出現(xiàn)了6條N-糖基化位點。排除第40位和第96位陰性位點(均<0.5的閾值),剩余有第73、97、135和162位4條。見圖11,表2。
圖11 人Fdx1蛋白N-糖基化位點預測結果圖
表2 人Fdx1蛋白N-糖基化位點詳細信息
2.4.2.2 O-糖基化:NetOglyc4.0對人Fdx1蛋白中O-GalNAc(黏蛋白型)糖基化位點預測顯示,其氨基酸全序列有7個O-糖基化位點超過閾值0.5,分別在第30、34、46、50、52、56和61位。
2.4.3 甲基化:根據(jù)被甲基取代氨基上的氫原子數(shù)量,賴氨酸甲基化可分為單-(K.momo)、雙-(K.di)和三甲基化(K.tri);而精氨酸甲基化可分為單-(R.mono)、對稱雙- (R.s.di)、不對稱雙甲基化(R.a.di)。GPS-MSP 1.0預測人Fdx1蛋白甲基化位點的組成:精氨酸甲基化比例明顯多于賴氨酸甲基化。其氨基酸序列上的具體位置:兩大類氨基酸甲基化位點混合分布于氨基酸序列兩端且接近中段。見圖12。
圖12 人Fdx1蛋白甲基化位點預測情況
2.4.4 泛素化:在平衡準確度和特異性后(閾值皆為0.3),BDM-PUB 1.0對人Fdx1蛋白泛素化位點預測信息的總結表格。由此可見,人Fdx1蛋白分別在第82、84和182位點處出現(xiàn)泛素化修飾的可能性高。見表3。
表3 人Fdx1蛋白泛素化位點預測結果
2.4.5 蘇木化:GPS-SUMO 2.0預測人Fdx1蛋白小泛素相關修飾物(small ubiquitin related modifier,SUMO)(“蘇木”)位點完整信息。見表4。
表4 人Fdx1蛋白蘇木化位點預測結果
2.4.6 乙?;?/p>
2.4.6.1 Nα-末端乙?;?NetAcet 1.0預測人Fdx1蛋白有2處氨基酸殘基疑似存在乙?;稽c的可能性較高,但評分都<0.500分,還需要通過實驗驗證一下預測。
2.4.6.2 Nε-賴氨酸乙?;?將性能GPS-PAIL 1.0選擇設為最高嚴格性(均≥0.5),可得到結果:人Fdx1蛋白在4個氨基酸殘基處存在Nε-賴氨酸乙?;目赡苄院芨摺R姳?。
表5 人Fdx1蛋白Nε-賴氨酸乙?;稽c預測結果
2.4.7 脂質修飾:將GSP-Lipid 1.0程序閾值設為中等,系統(tǒng)發(fā)現(xiàn)人Fdx1蛋白有3處氨基酸殘基出現(xiàn)脂質修飾化的可能性較高。見表6。
表6 人Fdx1蛋白脂質修飾化位點預測結果
2.5 生物學功能
2.5.1 蛋白質相互作用:為盡可能排除其它因素的干擾,將STRING系統(tǒng)默認值調至最高可信度(0.9),設定一級關聯(lián)下互作蛋白數(shù)不超過10個。找到11個節(jié)點、22條邊、平均局部聚類系數(shù)為0.903,蛋白互作富集P值為0.000785。見圖13。
圖13 人Fdx1關聯(lián)蛋白的相互作用可視化圖;CYP11A1:膽固醇側鏈裂解酶;FdxR:還原型輔酶II;ISCU:鐵硫簇組裝酶;NFS1:半胱氨酸脫硫酶;CYCS:細胞色素c;AKR1B1:醛糖還原酶;FXN:共濟蛋白;LYRM4:含LYR基序的蛋白質4;HSCB:鐵硫簇共伴侶蛋白;STAR:立體定向急性調節(jié)蛋白;圖中各顏色線條關聯(lián)方式及關聯(lián)依據(jù):已知關聯(lián):—(專業(yè)數(shù)據(jù)庫);—(實驗確定);預測關聯(lián):—(基因相鄰);—(基因融合);—(基因共存);其他:—(文本挖掘);—(共表達);—(蛋白同源)
2.5.2 信號通路分析:根據(jù)運算,Reactome推測人Fdx1蛋白涉及二十幾種通路,與疾病和代謝的關系最為密切。每個有向無環(huán)的煙花分支都又能具體化成一個目標通路。 見圖14。
圖14 人Fdx1蛋白Reactome通路總覽圖
2.6 表達分析
2.6.1 正常組織:ProteomicsDB分析人Fdx1蛋白在血液&免疫、神經(jīng)和肌肉骨骼等6大類組織的蛋白表達情況。其中,表達前三位的分別是內臟系統(tǒng)的鼻腔呼吸上皮(log10 650 ppm)>內分泌系統(tǒng)的腎上腺(log10 206 ppm)>生殖系統(tǒng)的胎兒的睪丸(log10 174 ppm)。見圖15。
圖15 人Fdx1蛋白在正常組織中的表達情況
2.6.2 細胞株:MOPED分析人Fdx1在腫瘤細胞株中蛋白表達結果。表達最高的前3位依次是:腦癌里的U251細胞(log10 557 ppm)、腎癌里的RXF393細胞(log10 287 ppm)、黑色素瘤里的M14細胞(log10 255 ppm)。見圖16。
圖16 人Fdx1蛋白在細胞株中的表達情況
Fdx是含有由非血紅素鐵和無機硫組成的活性位點的電子載體蛋白。1962年在巴氏梭菌中一種不含血紅素的褐色蛋白中被分離,后又在菠菜葉綠體中發(fā)現(xiàn)[7]?,F(xiàn)已知廣泛存在于包括植物、原核生物和真核生物等各類生命體中。植物中Fdx參與光合作用、氫代謝和生物固氮等生物學過程[8-10]。原核生物和真核生物中Fdx的功能討論涉及電子傳遞、輔酶Q生物合成以及類固醇激素等方面[11-13]。人類有兩種同源物:Fdx1和Fdx2。前者主要在腎上腺皮質和髓質里高度表達;后者在中樞神經(jīng)系統(tǒng)中含量豐富[14]。二者皆有祖先高度保守的Fe-S簇功能:不僅參與Fe-S簇自身活動,還組裝Fe-S簇形成本身[15]。單獨對Fdx1的研究也有不少,如:(1)基因多態(tài)性與IgA腎病風險存在關聯(lián)[16]。(2)參與卵巢顆粒細胞的轉錄調控[17]。(3)影響肺腺癌的預后并介導其代謝[18]。最新的泛癌分析證實,Fdx1是可作為免疫治療的預測因子和預后的生物標志物[19]。已知游離銅離子是有毒的,大多數(shù)生物都進化出了包含伴侶蛋白在內的、高度專業(yè)化的銅轉運系統(tǒng)。目前對于銅離子如何在這些蛋白間移動的機械構造方面研究已有長足進展;但將銅轉運與細胞調節(jié)過程聯(lián)系起來的、高度復雜的網(wǎng)絡機制還有待挖掘。據(jù)此可知,Fdx1的分析對了解銅死亡的調控非常重要。
本研究利用ProtParam、SMART和SMOPA等數(shù)據(jù)挖掘軟件對人Fdx1蛋白的氨基酸序列進行了6類生物信息預測和分析。結果發(fā)現(xiàn):(1)基本分析:人Fdx1蛋白屬于較不穩(wěn)定的親水性蛋白;在中性溶液里帶負電,偏酸性;未預測到跨膜區(qū)和信號肽,說明不是分泌蛋白的可能性高,且發(fā)揮膜間信號轉導的作用低。氨基酸序列結構組成中含量最多的丙氨酸和甘氨酸皆為脂肪族氨基酸。故推測,人Fdx1蛋白參與脂質轉運或脂質代謝過程的可能性較大,已有論文證實這一生信推測[20]。建模分析人Fdx1蛋白亞細胞定位最大幾率是線粒體基質,這一結果不難理解銅死亡與線粒體呼吸的緊密關聯(lián)。(2)特征結構分析:人Fdx1蛋白發(fā)現(xiàn)了Fer2結構域,這說明其具有Fer2家族成員共有的分子活性,比如鐵離子存儲、鐵穩(wěn)態(tài)調控和電子傳遞等等[21]。(3)空間結構:①二級結構超一半為α-螺旋,說明人Fdx1蛋白多肽鏈機械強度較高,并且伸縮性較好。②通過同源建模法預測的三級結構,相較于X射線晶體衍射和NMR核磁共振等物理方法測定蛋白質三級結構更迅速、成本更低。③四級結構發(fā)現(xiàn),人Fdx1與CYP11A1互作強。已知后者編碼的膽固醇側鏈裂解酶是催化類固醇激素合成的首要限速步驟[22]。據(jù)此推測,Fdx1也可能參與機體的內分泌調節(jié)。(4)蛋白的翻譯后修飾。①人Fdx1蛋白絲氨酸、蘇氨酸和酪氨酸磷酸化修飾位點均有,預測對蛋白活性的調控與已有文獻報道[23]一致。②糖基化蛋白質組學認為,N-糖基化修飾在蛋白正確折疊、功能定位和胞內運輸中起到重要作用;O-GalNAc糖基化對黏蛋白凝膠化功能和屏障保護作用必不可少,在一些疾病的發(fā)生發(fā)展過程中也起著至關重要的作用[24]。人Fdx1蛋白二者均預測出不少的修飾位點,未來可以探索糖基化修飾與Fdx1相關腫瘤等其他疾病的關系。③精氨酸甲基化參與RNA剪接、翻譯與信號轉導等許多重要的生命過程[25]。從銅死亡機制研究知道人Fdx1與癌癥有關;但與其甲基化相關的輔助因子、是否串擾組蛋白甲基化等許多甲基化過程還亟待挖掘,為了更加精準的調節(jié)其轉錄活性,Fdx1蛋白甲基化是一個可開發(fā)的熱點。④乙?;?、泛素化、蘇木化在內的4種翻譯后修飾位點又陸續(xù)在人Fdx1上預測出來。這說明其對生命活動的機理、篩選疾病臨床標志物和鑒定藥物靶點等許多方面探索都具有重要價值。(5)預測出的互作蛋白分為幾類,對于基于基因相鄰/融合/共存預測的關聯(lián)蛋白等是未來可以開發(fā)的領域。(6)盡管Fdx1在人體正常組織和腫瘤細胞內都是低表達狀態(tài),但是已發(fā)現(xiàn)的集中表達部位和細胞都值得重點關注。
本文選擇生物信息學方法,分析了人Fdx1蛋白的氨基酸序列,預測出其可能具有的生物學功能。希望本文的結果能對以后銅死亡、PCD或者相關基礎課題的科研設計和疾病治療靶點尋找的方向提供理論參考。