羅 珺,劉友林,肖侑仙,趙詩文,王 偉
(1.大連海事大學,遼寧 大連 116026;2.大連圣亞海洋生物研究所,遼寧 大連 116023;3.大連海洋大學,遼寧 大連 116023)
海獅(Otarriinae)屬哺乳綱鰭足目海獅科[1],全世界均有分布,多數(shù)生活在寒帶海洋中。海獅以魚、烏賊、貝類等為食,繁殖時期到海島上產(chǎn)仔。大部分海獅的身體上都長有濃密的短毛,下面還有一層薄層的絨毛;但是各種海獅的毛色深淺并不一致,主要為黃褐色和褐色;海獅具有明顯的尾巴,但都較短;有的海獅種類頸部有長毛,類似獅子的鬃毛,得名海獅[2]。
非標記定量蛋白質組學數(shù)據(jù)前處理與其他組學及其他學科一樣,將數(shù)據(jù)處理成方便后續(xù)統(tǒng)計分析、數(shù)據(jù)挖掘的格式,數(shù)據(jù)前處理過程是連接搜庫軟件定性定量分析和生物學意義挖掘(如蛋白質間相互作用、通路富集等)分析的中間環(huán)節(jié),包括數(shù)據(jù)評估(穩(wěn)定性分析、缺失模式分析、變異分析、相關性分析、聚類分析)、數(shù)據(jù)清洗(低質量樣本清洗、異常樣本清洗)、數(shù)據(jù)增強(數(shù)據(jù)轉換、數(shù)據(jù)校正、缺失值填補)等。非標記定量蛋白組學數(shù)據(jù)經(jīng)過上述數(shù)據(jù)前處理過程后,后續(xù)經(jīng)差異表達分析等得出的結論具有足夠的可信度。非標記定量技術對液相色譜串聯(lián)質譜的重復性和穩(wěn)定性要求較高,不用借助成本較高的同位素標簽,試驗耗費少,前處理操作過程不繁瑣,這樣使樣品最接近原始狀態(tài),且不受樣品條件、樣品數(shù)的限制,可用于大規(guī)模樣品數(shù)量檢測[3]。
本研究根據(jù)大樣本非標記定量蛋白組學數(shù)據(jù)的特征,為這類數(shù)據(jù)選取了適用的數(shù)據(jù)前處理方法,包括數(shù)據(jù)質量評估方法、質譜定量蛋白組學領域經(jīng)典數(shù)據(jù)前處理方法及其他組學領域成熟的數(shù)據(jù)前處理方法、前處理效果評估方法等。最終經(jīng)過方法選取、編寫及整合,制作R工具包preprocessor。此工具包可助力研究者掌握試驗數(shù)據(jù)概況,從而選取適用的數(shù)據(jù)校正及缺失值填補等數(shù)據(jù)前處理方法,并最終控制大樣本非標記定量蛋白組學數(shù)據(jù)質量,使后續(xù)分析更加可行可信。本研究應用非標記定量蛋白組學方法鑒定毛皮海獅種間的蛋白差異,對差異蛋白進行GO富集分析、KEGG通路富集分析及差異蛋白的生物信息學分析,為病情診斷、預防及治療探索潛在的靶點,現(xiàn)報道如下。
非澳毛皮海獅(Non-Arctocephaluspusillus)、南美毛皮海獅(Arctocephalusaustralis)、智利毛皮海獅(Arctocephalusphilippi),均由大連圣亞海洋世界提供,并且所有毛皮海獅個體健康狀況均良好。
SDS裂解液、BCA試劑盒、質譜級水、乙腈、預制膠、PMSF(Amresco);DTT、EDTA·2Na、甲醇、蔗糖、醋酸銨、甘油、溴酚藍、TFA、IAA、十二水合磷酸氫二鈉、一水合磷酸二氫鈉、NaCl、Tris-HCl(pH值6.8,8.8)、APS、TEMED、Tris;甘氨酸、SDS、磷酸;丙酮、胰酶、TEAB、無水乙醇、異丙醇、甲酸(CNW);Tris-平衡酚。
磷酸鹽緩沖液(PBS):十二水合磷酸氫二鈉(Na2HPO4·12H2O)3.835 g,一水合磷酸二氫鈉(NaH2PO4·H2O)0.715 g,NaCl 1.051 g,加ddH2O定容至250 mL,待充分溶解之后調pH值至7.2。2×loading buffe儲存液(10 mL):5 mmol/L Tris-HCl 1.45 mL,甘油2 mL,10%SDS 3 mL,DTT 1 g,0.1%溴酚藍400 μL,加ddH2O定容至15 mL。二硫蘇糖醇溶液:稱取192.5 mg DTT,溶于50 mL去離子水中,混勻后分裝為200 μL/管,并于-20 ℃保存。碘乙酰胺溶液:快速稱取90 mg碘乙酰胺粉末,轉移到用錫紙包裹的15 mL離心管中,用3 mL去離子水混勻至溶解,定容到5 mL,避光保存。酚法抽提液:蔗糖2.2 g,NaCl 0.038 g,EDTA·2Na 0.163 g,DTT 0.02 g,0.5 mol/L Tris-HCl 2.5 mL,0.5 mol/L Tris-HCl 2.5 mL,然后加ddH2O定容至10 mL,充分溶解混勻。
以上試劑與用品均由大連圣亞海洋生物研究所采買和配制。
選取健康狀況良好的非澳毛皮海獅、南美毛皮海獅和智利毛皮海獅個體,分別剪取其胡須約2 g,取樣后置于-80 ℃冰箱冷凍保存。將冷凍的樣品取出,加入液氮,充分研磨。毛皮海獅胡須樣品信息見表1。
表1 毛皮海獅胡須樣品信息
取適量毛皮海獅胡須樣品粉末,置于2 mL離心管中,加入500 μL酚抽提取液、蛋白酶抑制劑(PMSF)調制終濃度為1 mmol/L。加入相同體積的酚-Tris-HCl飽和溶液,4 ℃混合30 min,并多次搖晃混勻。4 ℃離心10 min,并收集酚上層液。加入5倍體積的預冷0.1 mol/L醋酸銨-甲醇溶液,-20 ℃條件下進行沉淀。4 ℃離心10 min,收集沉淀。收集后的沉淀物加入5倍體積的甲醇進行清洗,混合。4 ℃離心10 min,收集沉淀。所獲取的上清液即為總蛋白溶液,用于蛋白濃度測定并分裝、儲存于-80 ℃冰箱,備用[4]。每種樣品均重復3次。
一般情況下,蛋白提取選用普通的蛋白裂解液、冰上裂解等。但是對于極易受環(huán)境影響的蛋白,選擇超強效蛋白裂解液,并且在低氧培養(yǎng)箱(37 ℃)中快速裂解效果更好。毛皮海獅胡須樣品蛋白濃度測定采用BCA蛋白濃度測定方法。BCA與硫酸銅等其他試劑組成的試劑混合在一起,即呈蘋果綠,為BCA試劑[5-6]。將待測毛皮海獅胡須樣品蛋白溶液加入96孔板,每個樣品設置3個復孔。首先于各孔內加入150 μL顯色液,37 ℃條件下反應30 min。然后利用酶標儀測定溶液吸光度值。再根據(jù)標準蛋白溶液的已知濃度和吸光度值繪制標準曲線,將待測樣品的吸光度值代入標準曲線,計算得到毛皮海獅胡須樣品蛋白濃度。
胰蛋白酶是蛋白質譜分析中應用最廣泛的蛋白酶,主要從豬或牛胰腺中獲得,易于純化,一般用其進行樣品的酶解[7]。當溶液中存在尿素或胍鹽時水解反應無法進行,因為胰蛋白酶自身作為一種蛋白質會變性,失去酶活性。因此,尿素或胍鹽必須通過離子交換或滲析去除或將濃度降低至1 mol/L以下。毛皮海獅胡須樣品蛋白酶解后肽段采用96孔板脫鹽。
采用聚丙烯酰胺凝膠電泳法對毛皮海獅胡須樣品總蛋白進行電泳,步驟為灌膠與上樣、電泳、染色、脫色。脫色后參照參考文獻[8]的方法用成像儀成像。
HPLC是在經(jīng)典的液相色譜法基礎上發(fā)展起來的,其以液體作為流動相,并采用顆粒極細的高效固定相的柱色譜分離技術。毛皮海獅胡須樣品總蛋白以300 nL/min的流速于分析柱上樣,進行梯度洗脫操作過程。其后質譜條件設定為全掃描,質核比范圍為350~650 m/z,對其中10個最高峰進行MS/MS掃描[9]。
毛皮海獅胡須樣品總蛋白LC-MS/MS原始文件導入Maxquant庫進行搜索,并進行非標定量分析[10]。根據(jù)峰形錯配情況,毛皮海獅胡須樣品總蛋白搜庫條件以假陽性率來控制。物種數(shù)據(jù)庫提供了目標序列信息,可以通過過濾掉反庫和常見污染蛋白庫來剔除不符合分析標準的空值。具體搜庫參數(shù)設置見表2。
表2 質譜檢索參數(shù)
利用數(shù)據(jù)庫檢索得到原始數(shù)據(jù),保留任意一組毛皮海獅胡須樣品總蛋白有表達值占比≥50%的蛋白。缺失值≤50%的蛋白用同組樣本均值填充,得到可信蛋白。對可信蛋白進行樣品相關性分析。
根據(jù)可信的表達定量數(shù)據(jù)計算毛皮海獅胡須樣品總蛋白之間的歐氏距離(euclidean distance),然后對樣品距離矩陣進行層次聚類,從而繪制出樣品歐氏距離的層次聚類樹狀圖[11-12]。
在利用非標記定量技術所得可信蛋白基礎上,選取兩個標準計算毛皮海獅胡須樣品總蛋白間的差異。使用Foldchange手段對毛皮海獅胡須樣品總蛋白中的某一蛋白在樣品間的表達水平變化倍數(shù)進行評估,利用t檢驗計算P值,以直觀展現(xiàn)毛皮海獅胡須樣品總蛋白間差異的顯著程度[13]。其中差異篩選條件為FC(Foldchange)為1.5倍且P值小于0.05,同時FC為0和FC為inf都屬于“有無”差異狀態(tài);通過對比3種毛皮海獅胡須樣品差異表達蛋白的統(tǒng)計情況,來展示毛皮海獅差異表達蛋白整體分布情況。
通過非標記定量技術得到毛皮海獅胡須樣品總蛋白差異表達蛋白,對毛皮海獅胡須樣品總蛋白差異蛋白進行富集分析,對其功能進行描述[14]。利用差異蛋白表達分析與GO富集分析結果繪制和弦圖。
毛皮海獅胡須蛋白標準品吸光度及濃度見表3。
表3 毛皮海獅胡須蛋白標準品吸光度及濃度
以OD562為橫坐標、毛皮海獅胡須標準蛋白濃度為縱坐標制作標準曲線圖,求出回歸方程,即標準曲線,結果見圖1。
圖1 毛皮海獅胡須樣品總蛋白蛋白定量標準曲線
毛皮海獅待測樣品吸光度及濃度見表4。
毛皮海獅胡須樣品SDS-PAGE測定結果見圖2,樣品蛋白條帶分布均勻,重復性好。
注:Marker為蛋白質Marker,起特異性標記作用。
毛皮海獅胡須樣品總蛋白經(jīng)LC-MS/MS檢測、搜庫后,蛋白定性定量統(tǒng)計結果見表5。
表5 基本鑒定結果統(tǒng)計
可信蛋白樣品的相關性分析結果見圖3。
注:圖中,上三角形(對角線的右上方),數(shù)字表示兩個樣品的相關性值,*表示顯著程度(*為P<0.05,**為P<0.01,***為P<0.001);下三角形(對角線的左下方),給出了兩個樣品表達值的散點圖,曲線為擬合趨勢,斜率越大兩樣品間相關性越強。
通過圖3可以看出,南美毛皮海獅胡須蛋白與智利毛皮海獅胡須蛋白樣品間斜率相近,兩者種間相關性趨于擬合,說明相關性強;同時發(fā)現(xiàn)非澳毛皮海獅與其他兩種毛皮海獅相關性相對較弱。通過樣品相關性圖中各樣品對角線視圖發(fā)現(xiàn),南美毛皮海獅和智利毛皮海獅胡須樣品總蛋白Z1自身表達量分布均勻,而非澳毛皮海獅分布相對不均勻。
智利毛皮海獅樣品Z1與南美毛皮海獅樣品N1具有相似的表達特征,而非澳毛皮海獅樣品F1歐氏距離與兩者相對較遠,表達特征不相近,見圖4。
注:每個分支末端表示一個樣品,聚在同一個分支內的樣品被認為是表達特征相似或接近的樣品,沒有聚到同一個分支的樣品可以認為是特征不相似或不接近的樣品,具體可以根據(jù)縱坐標的歐氏距離來衡量。
3種毛皮海獅胡須樣品差異表達蛋白見表6和圖5。
圖5 樣品差異蛋白統(tǒng)計圖
表6 樣品差異蛋白統(tǒng)計
根據(jù)毛皮海獅胡須樣品總蛋白差異蛋白統(tǒng)計圖可以看出:Z1與F1存在175種差異蛋白,其中41種蛋白質表達上調,134種蛋白質表達下調。Z1與N1共有70種差異蛋白,其中52種蛋白質表達上調,18種蛋白質表達下調。F1與N1共有162種差異蛋白,其中144種蛋白質表達上調,18種蛋白質表達下調。智利毛皮海獅胡須樣品總蛋白Z1與南美毛皮海獅胡須樣品總蛋白N1樣品蛋白差異不明顯,非澳毛皮海獅胡須樣品總蛋白F1與其他兩種毛皮海獅胡須樣品總蛋白差異明顯。
毛皮海獅胡須樣品總蛋白F1、N1、Z1間GO富集分析和弦圖,所選的GO term和相應差異蛋白列表之間的關系見圖6~8。
注:左面為蛋白、基因名,右面為所選GO term,紅色表示上調,藍色表示下調。
根據(jù)毛皮海獅胡須樣品總蛋白間GO富集分析和弦圖可以看出,智利毛皮海獅胡須樣品總蛋白Z1與南美毛皮海獅樣品N1樣品GO富集分析和弦圖差異不明顯,非澳毛皮海獅胡須樣品總蛋白蛋白F1與其他兩種毛皮海獅胡須樣品總蛋白GO富集分析和弦圖差異明顯。
目前,已經(jīng)有一系列配套的非標記定量分析軟件,其中包括GE公司開發(fā)的DeCyder MSTM軟件[15]及蛋白質組學定性定量算法Max Quant[10]。運用這些軟件對液相色譜串聯(lián)質譜數(shù)據(jù)非標記定量分析,是將質譜數(shù)據(jù)由譜峰形式轉化為直觀、類似雙向凝膠的圖譜,再比較不同樣本上相應肽段的強度,從而對肽段對應的蛋白進行相對定量[16]。因為其有很好的定量準確性和可信性,目前已經(jīng)逐漸成為蛋白組學領域內的標準解決方案。
通過皮毛海獅胡須樣品蛋白相關性分析、聚類樹狀圖分析、差異蛋白統(tǒng)計圖分析、GO富集結果分析發(fā)現(xiàn):智利毛皮海獅與南美毛皮海獅胡須蛋白相關性相對較強,間接表明二者有相對近緣關系;智利毛皮海獅樣品總蛋白Z1與南美毛皮海獅樣品總蛋白N1具有相似的表達特征,而非澳毛皮海獅樣品總蛋白F1歐氏距離與兩者相對較遠,表達特征不相近。智利毛皮海獅樣品可信蛋白表達定量與南美毛皮海獅胡須樣品接近。通過計算毛皮海獅胡須樣品間差異蛋白,評估毛皮海獅蛋白間的表達水平變化倍數(shù),經(jīng)檢驗計算毛皮海獅胡須蛋白樣品間差異的顯著程度,發(fā)現(xiàn)非澳毛皮海獅與南美毛皮海獅間差異表達蛋白較為顯著。結合可信蛋白樣品相關性分析結果,說明兩者親緣關系較遠。綜上,通過蛋白組學非標記定量技術可以初步判斷,智利毛皮海獅與南美毛皮海獅親緣關系較近,可能為毛皮海獅不同的亞種。非澳毛皮海獅與其他兩者毛皮海獅親緣關系較遠。結合外部形態(tài)特征差異,非澳毛皮海獅與其他兩種毛皮海獅間有相對明顯的遺傳差異,為海獅科海狗屬的種,南美毛皮海獅與智利毛皮海獅差異相對不顯著,可能為不同亞種。
綜上所述,針對目前毛皮海獅種群資源稀缺,本研究通過前期飼養(yǎng)試驗,摸索出一套毛皮海獅的健康飼養(yǎng)模式,同時基于非標記定量技術(label-free)對毛皮海獅進行蛋白組學研究,分析了其種間差異和近緣關系。所獲結果可為毛皮海獅的健康飼養(yǎng)提供數(shù)據(jù)參考,同時為毛皮海獅的遺傳學研究提供理論依據(jù)。另外,在毛皮海獅的整體飼養(yǎng)過程中,發(fā)現(xiàn)智利毛皮海獅與南美毛皮海獅外部形態(tài)、體色局部略有差異,行為習性也有差別,可能是在不同自然區(qū)域分布的不同亞種。因此利用蛋白分析組學、形態(tài)學和行為學等來鑒定毛皮海獅種間差異和遺傳多樣性的方法仍需要更為深入的研究。