吳曉淋 張濤 徐平 張亞莉 張振鵬**
(1)貴州大學(xué)醫(yī)學(xué)院,貴陽 550025;2)軍事科學(xué)院軍事醫(yī)學(xué)研究院生命組學(xué)研究所,蛋白質(zhì)組學(xué)國家重點實驗室,國家蛋白質(zhì)科學(xué)中心 (北京),北京蛋白質(zhì)組研究中心,北京 102206;3)中國醫(yī)學(xué)科學(xué)院蛋白組學(xué)與新藥研發(fā)創(chuàng)新單元,北京 102206)
頭發(fā)是人體的一類結(jié)構(gòu)復(fù)雜的表皮附屬物[1],主要成分為蛋白質(zhì)、水、脂類、色素和微量金屬元素[2]。蛋白質(zhì)占總量的60%~95%,其中角蛋白(keratin,KRT)與角蛋白相關(guān)蛋白(keratinassociated proteins,KAP)是最主要的蛋白質(zhì)種類。它們相互作用形成交聯(lián)結(jié)構(gòu),保證頭發(fā)的化學(xué)和機械穩(wěn)定性[3],使頭發(fā)具有較強的耐久性[4]。人體頭發(fā)的生長周期為2~7年,據(jù)估計,人體每天自然掉落的頭發(fā)數(shù)量約50~100根[5]。各種場景下發(fā)現(xiàn)的頭發(fā)痕跡,在考古學(xué)研究中的人類起源和遺傳演化及犯罪學(xué)研究中的身份鑒定和犯罪嫌疑人追蹤等具有重要意義[6]。
據(jù)文獻(xiàn)報道,可利用蛋白質(zhì)組學(xué)方法研究頭發(fā)蛋白質(zhì)組。Zhang等[7]提出基于凝膠法的蛋白質(zhì)組學(xué)方法,分析頭發(fā)樣本蛋白質(zhì),每個樣本分為10個組分,各組分鑒定到132~214種蛋白質(zhì)。Laatsch等[8]使用鳥槍法蛋白質(zhì)組學(xué)技術(shù)探索非裔美國人、高加索人、肯尼亞人和韓國人的頭發(fā)蛋白質(zhì)組,發(fā)現(xiàn)不同種族的人群具有各自獨特的頭發(fā)蛋白表達(dá)水平,主要體現(xiàn)在KRT和KAP兩類蛋白。Parker等[9]對歐美66名受試者頭發(fā)蛋白質(zhì)組表征,共鑒定到401種蛋白質(zhì),豐度最高的兩類是KRT和KAP等。此外,還有研究表明[10],人頭發(fā)中Ⅰ型和Ⅱ型角蛋白如KRT33b、KRT81、KRT83和KRT86等可區(qū)分人類的性別和種族。目前尚未有文獻(xiàn)報道使用頭發(fā)蛋白質(zhì)組學(xué)進(jìn)行個人特質(zhì)區(qū)分。
頭發(fā)蛋白質(zhì)高度交聯(lián)的結(jié)構(gòu)使得其結(jié)構(gòu)穩(wěn)定[11]、難以被外界因素破壞,蛋白質(zhì)提取量低。已發(fā)展出多種頭發(fā)蛋白質(zhì)的處理方法,包括高溫、高壓、酸、堿或酶等,可以將角蛋白分解成短肽或游離氨基酸[12]。傳統(tǒng)的頭發(fā)處理方法包括物理法和化學(xué)法兩大類。物理法是采用物理外力或條件,如超聲波、振蕩、滾珠研磨等,將頭發(fā)的結(jié)構(gòu)破壞,從而將蛋白質(zhì)釋放出來,其原理是超聲壓力波使頭發(fā)的蛋白質(zhì)分子振蕩并分解、裂解,或用滾珠研磨機或硅膠珠將頭發(fā)樣品壓碎和摩擦,使蛋白質(zhì)分子溶解。化學(xué)法是采用化學(xué)試劑的作用將頭發(fā)蛋白質(zhì)從組織中溶解出來。主要方法包括直接溶解法、酸性裂解法等。直接溶解法使用含有變性劑和蛋白酶抑制劑的緩沖液將頭發(fā)樣品放入高溫高壓的環(huán)境中,使蛋白質(zhì)分子從頭發(fā)釋放。酸性裂解法將頭發(fā)樣品放入酸性溶液并加熱,通過酸性環(huán)境的作用,使蛋白質(zhì)分子從頭發(fā)釋放[13]。
但是頭發(fā)特殊的角蛋白高度交聯(lián)結(jié)構(gòu),相對其他組織而言更難以提取,所需時間較長。使用單純的加熱或者震蕩方法對頭發(fā)蛋白質(zhì)的提取存在一定程度的缺失,導(dǎo)致鑒定量較少、覆蓋率較低等問題。且在文獻(xiàn)中需要高起始量的頭發(fā)(至少150根1 cm長度的頭發(fā))用于實驗,在實際應(yīng)用場景中難以滿足。因此,本研究采用混合法結(jié)合物理和化學(xué)法開發(fā)一種基于低起始頭發(fā)量的高效率頭發(fā)蛋白質(zhì)提取方法,提高提取效率。
本研究利用低頭發(fā)起始量(10根1 cm長度的頭發(fā)),系統(tǒng)性探索樣本處理方式對頭發(fā)蛋白質(zhì)的提取效率;在此基礎(chǔ)上探討頭發(fā)蛋白質(zhì)裂解緩沖液成分對蛋白質(zhì)提取的影響,改進(jìn)建立名為PLEE(PTM lab for protein extraction from hair with high efficiency)的頭發(fā)蛋白質(zhì)穩(wěn)定高效提取技術(shù)體系。通過PLEE法對7例樣本的頭發(fā)蛋白質(zhì)組學(xué)數(shù)據(jù)進(jìn)行分析,研究頭發(fā)在識別和區(qū)分不同個體特質(zhì)方面的可行性。
7例人頭發(fā)樣本(編號為P1至P7),在后頂點離頭皮1 cm處進(jìn)行采樣。其中1例進(jìn)行4次技術(shù)重復(fù)(P7為技術(shù)重復(fù)組,編號為P7-R1至P7-R4)。
1.2.1 頭發(fā)樣本預(yù)處理
將10根1 cm長度的頭發(fā)剪成約1 mm長度的碎段,加入1 ml 20%甲醇進(jìn)行清洗,渦旋30 s,離心1 min,更換20%甲醇再次清洗,重復(fù)3次,最后一次吸出上清,頭發(fā)在室溫下自然風(fēng)干后備用。
1.2.2 頭發(fā)樣本處理方法優(yōu)化
a. 玻璃勻漿研磨器法(GH):頭發(fā)樣品中加入240 μl SDS緩沖液(50 mmol/L Tris(pH=7.5),2% SDS和20 mmol/L DTT),使用玻璃勻漿器(Kimble,Manzanillo,Mexicos)研磨,直到?jīng)]有可見的纖維顆粒,將裂解液體系轉(zhuǎn)移到EP管中。
b. 液氮加硅珠研磨法(LN-BH):頭發(fā)樣品用研缽在液氮中研磨頭發(fā)碎段,將頭發(fā)碎段放入EP管中,加入240 μl SDS緩沖液,1/3底部的二氧化硅珠(BioSpec,Bartlesville,USA),渦旋提取蛋白質(zhì)30 s,并在冰上靜置30 s,重復(fù)5次。
c. 室溫震蕩提取方法(RTO):頭發(fā)樣品中加入240 μl 尿素緩沖液(50 mmol/L Tris(pH=7.5),7 mol/L尿素,2 mol/L硫脲和40 mmol/L DTT),室溫下1 200 r/min的條件下振蕩18 h。
d. 液氮研磨加加熱法(LN-H95):頭發(fā)樣品用研缽在液氮中研磨,將頭發(fā)碎段放入EP管中,加入240 μl尿素緩沖液,在95℃下加熱5 min。
e. 加熱震蕩法(SH65):頭發(fā)樣品中加入240 μl SDS緩沖液,65℃下,1 200 r/min的條件下振蕩12 h。
f. 高溫加熱震蕩法(H-90-SH-65):頭發(fā)樣品中加入120 μl SDS緩沖液,90℃加熱5 h。4℃,17 000g離心,收集上清液作為餾分1(F1)。隨后,將120 μl的SDS緩沖液加入到剩余的頭發(fā)沉淀中,65℃,1 200 r/min下振蕩12 h。4℃,17 000g離心,收集上清液作為餾分2(F2)。F1和F2的混合物被保存為H-90-SH-65法蛋白質(zhì)組樣品的完整蛋白質(zhì)。
基于高溫加熱震蕩法(H-90+SH-65)法,分別使用SDS 緩沖液和尿素緩沖液進(jìn)行提取,對裂解液進(jìn)行探索。
SDS緩沖液:50 mmol/L Tris(pH=7.5),2%SDS和20 mmol/L DTT。
尿素緩沖液:50 mmol/L Tris(pH=7.5),7 mol/L尿素,2 mol/L硫脲和40 mmol/L DTT。
使用SDS-PAGE電泳檢測頭發(fā)蛋白質(zhì)提取質(zhì)量,考馬斯亮藍(lán)染色液染色2 h,脫色至背景無色。掃描膠片,使用ScanⅠmage分析,計算灰度值,確定蛋白質(zhì)的濃度及裂解的蛋白質(zhì)質(zhì)量。
各取50 μg蛋白質(zhì)樣品進(jìn)行蛋白質(zhì)酶切。每份樣品加終濃度10 mmol/L DTT,80℃金屬浴還原反應(yīng)10 min后,加40 mmol/L碘乙酰胺(ⅠAM),室溫避光烷基化反應(yīng)30 min。使用SDS-PAGE膠分離,考馬斯亮藍(lán)染色及脫色。將各條帶切為大約1 mm3的膠粒。加入適量脫色液(30%乙腈(acetonitrile,ACN),50 mmol/L NH4HCO3)振蕩30 min,換脫色液繼續(xù)振蕩,直至膠粒無色。加入適量ACN脫水,更換ACN,重復(fù)以上步驟直至膠粒為白色硬顆粒,最后使用真空干燥機蒸干膠粒。取出干燥的膠粒置于冰上,加酶解緩沖液(50 mmol/L NH4HCO3,13.3 mg/L胰蛋白酶(trypsin),6.7 mg/L Lys-C),冰上溶脹40 min,補加酶解緩沖液至沒過膠粒。將酶解體系置于37℃恒溫箱反應(yīng)12~16 h。
酶解后,每管加100 μl抽提液(5%甲酸(formic acid,F(xiàn)A),50% ACN),13 300 r/min常溫離心1 min,靜置4 min,重復(fù)4次。將抽提液上清轉(zhuǎn)移到新的2 ml離心管中。重復(fù)上述步驟1次。
加入ACN彈勻,13 300 r/min常溫離心1 min,轉(zhuǎn)移上清,重復(fù)上述步驟至膠粒變?yōu)榘咨差w粒,將所有抽提液及ACN混勻。使用真空干燥機蒸干樣本,-80℃保存?zhèn)溆谩?/p>
溶樣緩沖液(1% ACN,0.1% FA)溶解肽段樣品,濃度調(diào)整至0.2 g/L。使用自動進(jìn)樣器自動進(jìn)樣。選擇LTQ Orbitrap Velos質(zhì)譜儀(Thermo Fisher Scientific,Palo Alto,CA)與UPLC EASY-nLC 1000系統(tǒng)(Thermo Fisher Scientific,Palo Alto,CA)配備一個自封的毛細(xì)管柱(75 μm×15 cm,1.9 μm C18reverse-phase fused-silica)聯(lián)用進(jìn)行質(zhì)譜檢測。
洗脫條件如下。流動相A:98% H2O+2%ACN+0.1% FA;流動相B:100% ACN+0.1% FA。60 min的梯度洗脫樣品:0~6 min,B相由4%升至8%;6~40 min,B相從8%升至26%;40~55 min,B相從26%升至43%;55~56 min,B相從43%升至80%;58~60 min,B相維持80%,流速0.4 μl/min。洗脫的組分直接通過納噴離子源(Nano Spray Ⅰonization,NSⅠ)進(jìn)入質(zhì)譜檢測。
參數(shù)設(shè)置:一級質(zhì)譜掃描離子質(zhì)荷比范圍為300~1 600,分辨率為30 000。自動增益控制(automatic gain control,AGC)設(shè)置為1×106,最大離子注入時間(maximum ion injection time,MⅠT)設(shè)置為50 ms。二級質(zhì)譜采用碰撞誘導(dǎo)解離(collision-induced dissociation,CⅠD)模式碎裂,選取豐度最高的前20個離子進(jìn)行二級碎裂分析,碰撞能量歸一化為35%,AGC的設(shè)置為5×104。動態(tài)排除設(shè)定為50 s避免冗余檢測。
所有的數(shù)據(jù)原始文件都由MaxQuant(1.6.17版)對照UniProt數(shù)據(jù)庫(2017年3月版,Uniprot,https://www.uniprot.org/)中的蛋白質(zhì)FASTA文件進(jìn)行搜索。搜庫參數(shù):非標(biāo)(lable free)定量方法,選擇iBAQ值;胰蛋白酶的特異性消化;最多允許2次漏切;最小肽的長度設(shè)定為7個氨基酸;前體質(zhì)量偏差小于20×10-6;MS/MS質(zhì)量偏差小于0.5 u;固定修飾為Carbamidomethyl(C),可變修飾為Oxidation(M),Acetyl(Protein N-term);肽和蛋白質(zhì)水平上的錯誤發(fā)現(xiàn)率(FDR)小于1%。使用Perseus(1.6.6.0版)[14]對所有樣品進(jìn)行基于質(zhì)譜的定量蛋白質(zhì)組學(xué)實驗的統(tǒng)計分析。
采用低的頭發(fā)起始量(10根1 cm長度的頭發(fā)),從樣本處理方法和裂解液成分兩方面優(yōu)化頭發(fā)蛋白質(zhì)提取效率和質(zhì)量,流程如圖1a所示。采用相同起始量的蛋白質(zhì)裂解液進(jìn)行SDS-PAGE凝膠電泳,使用考馬斯亮藍(lán)染色,將各方法的條帶進(jìn)行灰度定量量化蛋白質(zhì)提取量,以最高的方法為100%,根據(jù)灰度比例計算各方法的蛋白質(zhì)提取效率(圖1b),GH法和LN-BH法的頭發(fā)蛋白質(zhì)提取效率較低,分別為1%和0.48%,而RTO法和LNH95法的頭發(fā)提取效率則分別為43.25%和13.20%,高于GH法和LN-BH法。然而,RTO法和LN-H95法在3個重復(fù)中的提取穩(wěn)定性較低。SH-65法能夠以高效率和穩(wěn)定性在3次重復(fù)中提取蛋白質(zhì),提取率為66.52%~86.48%。H-90-SH-6法從頭發(fā)中高效提取最多含量的蛋白質(zhì),且在3個生物重復(fù)中具有良好重現(xiàn)性。H-90-SH-65法提取的平均效率比SH-65法高出22.71%,與其他提取方法相比,效率至少增加1.3倍。結(jié)果顯示,強烈的物理震蕩和長時間的煮沸處理明顯提高蛋白質(zhì)的提取效率。比較使用SDS緩沖液和尿素緩沖液提取頭發(fā)蛋白質(zhì)的效率(圖1c)。結(jié)果表明,SDS緩沖液提取的蛋白質(zhì)是尿素緩沖液提取蛋白質(zhì)的1.67倍。
Fig. 1 PLEE method for effective hair protein extraction
通過比較頭發(fā)樣本處理方法和裂解液成分,在SDS緩沖液的作用下,結(jié)合強沖擊和長時間加熱,可高效提取頭發(fā)中的蛋白質(zhì)。本研究中將H-90-SH-65法和SDS 緩沖液相結(jié)合的技術(shù)流程命名為PLEE (PTM lab for protein extraction from hair with high efficiency)法。
基于質(zhì)譜可穩(wěn)定、高效地分析PLEE法提取頭發(fā)蛋白質(zhì)。采集7例頭發(fā)樣本,使用PLEE法蛋白質(zhì)提取,通過膠內(nèi)消化和質(zhì)譜分析獲取質(zhì)譜數(shù)據(jù),其中P7樣本重復(fù)提取檢測4次,評估流程穩(wěn)定性。對產(chǎn)出質(zhì)譜數(shù)據(jù)進(jìn)行嚴(yán)格的質(zhì)量控制分析,85%的肽段二級譜譜圖數(shù)在1~2之間(圖2a),82%的肽段長度分布在8~20個氨基酸殘基之間(圖2b),99%的肽段評分分布在40~380之間(圖2c),99.9%的肽段質(zhì)量偏差在5×10-6之內(nèi)(圖2d)。結(jié)果提示,質(zhì)譜數(shù)據(jù)質(zhì)量較好,鑒定結(jié)果可靠。
Fig. 2 Mass spectrometry quality control analysis
蛋白質(zhì)組學(xué)分析頭發(fā)樣本蛋白質(zhì)鑒定情況(表1),樣本鑒定到總蛋白質(zhì)數(shù)量在169~229之間,其中角蛋白和角蛋白相關(guān)蛋白的數(shù)量在46~49之間。對P7樣本的4次技術(shù)重復(fù)分析,共同鑒定蛋白質(zhì)131種(圖3a),重復(fù)間的定量值進(jìn)行分析結(jié)果顯示各重復(fù)間的定量值分布(圖3b)及累計曲線(圖3c)相似,具有強的相關(guān)性系數(shù),均為0.99及以上(圖3d)。表明基于PLEE法和質(zhì)譜的頭發(fā)蛋白質(zhì)組學(xué)流程穩(wěn)定、重復(fù)性高。
Table 1 Search results in MaxQuant based on the PLEE method
Fig. 3 Proteomics analysis of technical replicates
分析各樣本的鑒定蛋白質(zhì)種類及共鑒定蛋白質(zhì)分布的情況,發(fā)現(xiàn)不同個體的頭發(fā)蛋白質(zhì)組成和占比存在差異。10份樣本共有蛋白質(zhì)為107種(圖4a),各樣本非共有蛋白質(zhì)種類在57~119之間(圖4b),其中5例樣本(P1、P3、P4、P5、P7-R4)各鑒定到1種獨特蛋白(PARP4、RRP15、SERPⅠNB4、ANK3、MACF1),1例(P6)鑒定到2種獨特蛋白(TUBA1C、TPP1)(圖4c,表2)。選擇共有蛋白質(zhì)對所有樣本進(jìn)行定量蛋白質(zhì)組學(xué)分析。主成分分析(圖4d)及聚類分析(圖4e)結(jié)果顯示,技術(shù)重復(fù)樣本聚為一類,不同樣本被區(qū)分。以上結(jié)果提示,不同個體間存在獨特鑒定的蛋白質(zhì),且共有蛋白質(zhì)在不同個體間定量值存在差異。
Fig. 4 Proteomics analysis among different samples
篩選在不同個體來源的頭發(fā)中表達(dá)量差異大、在同個體中穩(wěn)定鑒定的頭發(fā)蛋白質(zhì)簇。P1~P6樣本中的定量值方差最大的30個蛋白質(zhì)進(jìn)行定量值分布情況可視化,其中有17個為KRT或KAP(KRT33A、KRTAP9-6、KRT6A、KRTAP2-2、KRT83、KRTAP3-2、KRTAP7-1、KRTAP19-5等)(圖5a)。篩選4個技術(shù)重復(fù)中定量值方差最小的30個蛋白質(zhì)(圖5b)。同時符合兩個條件的10個蛋白為:KRT33A、KRTAP9-6、KRT83、KRTAP7-1、KRT32、BLMH、KRT38、KRTAP11-1、NPAS1、KRTAP4-3(圖5c,表3)。這些蛋白質(zhì)在不同樣本間的分布存在顯著差異,在同個體的不同技術(shù)重復(fù)內(nèi)穩(wěn)定鑒定。
Table 2 Protein statistics uniquely present in a sample
Fig. 5 Screening of differentially expressed proteins among different samples
Table 3 Statistics of proteins expressed stably between the same individuals and expressed differently between different individuals
追蹤人員身份的方法包括DNA檢測[15]、指紋識別[16]、面部識別、虹膜識別[17]等。然而,這些方法都有一定的限制和缺陷。例如,在DNA檢測中,樣本污染或者樣本量不足導(dǎo)致結(jié)果不準(zhǔn)確,指紋識別可能會出現(xiàn)誤判或者無法識別,面部識別和虹膜識別會受到光線、角度等因素的影響,導(dǎo)致識別失?。?8-19]。并且這些技術(shù)都需要預(yù)先錄入人員的信息,才能通過比對確定身份。在刑偵和考古工作中,經(jīng)常出現(xiàn)追蹤人員身份的困難。偵查人員搜集到的犯罪人員信息有限,考古人員在工作中存在人員身份、年代確認(rèn)的問題。在現(xiàn)場,往往能追尋頭發(fā)樣品的蹤跡。頭發(fā)可長時間穩(wěn)定儲存,可記錄身體一段時間內(nèi)的狀態(tài)[20-22]。頭發(fā)的特殊蛋白質(zhì)和結(jié)構(gòu)成分使蛋白質(zhì)在室溫下保持穩(wěn)定,對頭發(fā)蛋白質(zhì)組進(jìn)行更多的生物學(xué)信息挖掘可作為區(qū)分個體特質(zhì)的有效手段,從而進(jìn)行身份追蹤[23]。
為提高頭發(fā)蛋白質(zhì)的提取率和提取質(zhì)量,對樣本處理方法和蛋白質(zhì)裂解緩沖液進(jìn)行優(yōu)化。結(jié)果顯示,與SH-65方法相比,H-90-SH-65方法的提取率增加22.71%,比另外4種方法至少增加1.3倍。強烈的物理震蕩和長時間煮沸都有助于有效地從頭發(fā)中提取蛋白質(zhì)。SDS緩沖液的蛋白質(zhì)提取效率為尿素緩沖液的1.67倍。且PLEE法在3個生物學(xué)重復(fù)的提取效率具有高度的重現(xiàn)性,表明PLEE法對頭發(fā)蛋白質(zhì)的提取效率高效且穩(wěn)定。
通過對質(zhì)譜的質(zhì)量檢測及技術(shù)重復(fù)分析,表明該流程穩(wěn)定且高效的。對不同個人的特質(zhì)頭發(fā)蛋白質(zhì)組學(xué)數(shù)據(jù)進(jìn)行分析。在10份樣本共有的蛋白質(zhì)為107種。每個樣本中還含有57~119種非共有蛋白質(zhì),其中部分樣本鑒定出1~2種獨特蛋白質(zhì)。這提示,對個體特異性蛋白質(zhì)的鑒定有望作為個人特質(zhì)的區(qū)分。另外,發(fā)現(xiàn)在樣本間表達(dá)存在較大差異的蛋白質(zhì),且在同個體的技術(shù)重復(fù)間穩(wěn)定表達(dá)的10個蛋白質(zhì):KRT33A、KRTAP9-6、KRT83、KRTAP7-1、KRT32、BLMH、KRT38、KRTAP11-1、NPAS1、KRTAP4-3。這些蛋白質(zhì)有望作為區(qū)分個體特質(zhì)的關(guān)鍵蛋白。
綜上所述,基于PLEE方法的頭發(fā)蛋白質(zhì)組學(xué)提供不同個體之間更詳細(xì)的生物學(xué)信息,表明角蛋白及角蛋白相關(guān)蛋白是至關(guān)重要的一類蛋白質(zhì),可以用于區(qū)分個人特質(zhì)?;赑LEE法的頭發(fā)蛋白質(zhì)組學(xué)研究將是下一代強大而有用的工具。還可用于洗滌劑有效性評估和頭發(fā)健康評估?;诓煌磉_(dá)的蛋白質(zhì)簇用于區(qū)分個體特質(zhì)的靈敏性、準(zhǔn)確性還有待進(jìn)一步探索。
致謝感謝北京國家蛋白質(zhì)科學(xué)中心的孫浩帆博士在實驗中提供的幫助。