賴丹昀,胡傳圣,祁 環(huán),馬明亮,李 華,陶生策
1.上海交通大學(xué)系統(tǒng)生物醫(yī)學(xué)研究院,系統(tǒng)生物醫(yī)學(xué)教育部重點實驗室,上海200240;2.上海交通大學(xué)生物醫(yī)學(xué)工程學(xué)院,上海200240
血清作為重要的生物樣品,其組成和濃度含有豐富的信息,能反映個體的健康狀況,為醫(yī)學(xué)診斷提供依據(jù)[1]。血清蛋白質(zhì)組學(xué)是血清研究的一個重要領(lǐng)域,即以血清為研究對象的蛋白質(zhì)組學(xué),已成為尋找生物標志物的有效手段。在血清的生物標志物領(lǐng)域,除了差異表達蛋白和修飾異常蛋白之外,差異自身抗體的發(fā)現(xiàn)也有重要價值[2]。自身抗體,是識別自身抗原的抗體總稱,已被用于自身免疫性疾病和腫瘤等疾病標志物研究[3-4]。從血清采集到檢測,不可避免地會出現(xiàn)長短不同的時間間隔,血清中各組分往往因為時間滯后、保存條件差異等而出現(xiàn)不可預(yù)知的變化,可能導(dǎo)致不同程度的實驗錯誤,嚴重時可能出現(xiàn)假陰性和假陽性結(jié)果[5]。所以有效的血清質(zhì)控和質(zhì)量評估是非常必要的。已有的研究中,以全血樣品為目標的有血細胞計數(shù)法[6],而以血漿/血清樣品為目標的方法則有基于質(zhì)譜技術(shù)的全局性分析[7-8]。但目前還沒有有效的方法來判斷血清中抗體的整體質(zhì)量。因此,我們希望建立一種高效的全局性評估策略,以評價血清樣品中抗體的質(zhì)量,這對于血清樣品的實驗室保存、疾病隊列的建立等都有重要的意義。
噬菌體展示技術(shù)和高通量測序技術(shù)的聯(lián)合應(yīng)用已經(jīng)取得多項成果。噬菌體肽展示文庫(phage display peptide library)作為極為重要的資源之一,分為物種特異性肽文庫和隨機肽文庫。2010 年,首個人類蛋白質(zhì)組噬菌體肽展示文庫構(gòu)建成功,用于尋找疾病自身抗原[9]。隨后,利用物種特異性肽文庫的研究不斷涌現(xiàn)[10-11]。與物種特異性肽文庫相比,隨機肽文庫(如NEB 公司的Ph.D.-12)多樣性高達109數(shù)量級,與目標蛋白結(jié)合時,沒有物種特異性肽文庫的偏好性[12]。聯(lián)合Ph.D.-12 噬菌體隨機肽展示文庫和高通量測序技術(shù),我們已成功地篩選了系統(tǒng)性紅斑狼瘡的肽生物標志物[13],建立了高效且高通量的抗體識別表位解析技術(shù)[14]。香農(nóng)熵(Shannon entropy)經(jīng)常被用于表示組成某群體的個體多樣性及豐度[15],在癌癥研究領(lǐng)域,熵可用于計算DNA 拷貝數(shù)畸變情況[16];熵還可用于與免疫系統(tǒng)相關(guān)數(shù)據(jù)分析,例如將熵值應(yīng)用于建立抗體獨特型網(wǎng)絡(luò)[17]?;陔S機肽庫的多樣性和無偏性,我們用香農(nóng)熵來表示樣品各自的肽結(jié)合模式,將復(fù)雜的個體情況轉(zhuǎn)換為數(shù)字形式,并對不同樣品進行質(zhì)量評估,旨在初步建立一套能夠快速評價血清樣品中抗體整體質(zhì)量的量化指標。
噬菌體隨機肽展示文庫Ph.D.-12、Q5 DNA 聚合酶(NEB,美國),無IgG 牛血清白蛋白(翊圣,中國),anti-6×His 抗體(Millipore,美國),Protein G 磁珠(Invitrogen,美國),膠回收純化試劑盒(諾唯贊,中國),96 孔聚苯乙烯板(百賽,中國)。Illumina 測序指定引物由生工生物工程(上海)股份有限公司合成。
1.2.1 血清樣品的制備 收集上海交通大學(xué)醫(yī)學(xué)院附屬仁濟醫(yī)院臨床體檢的50 例健康者血清(臨床健康體檢報告中各項檢測結(jié)果均在參考范圍內(nèi))。本研究得到了上海交通大學(xué)醫(yī)學(xué)院附屬仁濟醫(yī)院醫(yī)學(xué)倫理委員會的批準,所有參與者或監(jiān)護人已簽署知情同意書。每個樣品各取2 μL加入EP 管中混勻,作為標準樣品。將標準樣品分至20 個EP 管中,每個EP 管5 μL,將EP 管置于不同的溫度條件下:以-80 ℃為對照溫度;-20 ℃、4 ℃、37 ℃ 3 個溫度各設(shè)置3 個放置時間,分別為12、24、48 h;另設(shè)95 ℃孵育10 min 組。處理完畢后與噬菌體隨機肽展示文庫Ph.D.-12 進行反應(yīng)。
1.2.2 血清結(jié)合噬菌體的分離 根據(jù)已發(fā)表的噬菌體文庫篩選相關(guān)報道[13],對其方法進行了簡單修改。取96 孔板,每孔用200 μL 3%無IgG 牛血清白蛋白封閉,放置于4 ℃環(huán)境中振蕩過夜(12 ~16 h)。封閉完畢后棄封閉液,用TBST 緩沖液200 μL/孔清洗1 遍。向96 孔板中加入TBST 緩沖液90 μL/孔,隨后將已經(jīng)處理好的血清樣品依次加入96 孔板中,每孔加入1 μL 血清,每種樣品重復(fù)3 個復(fù)孔。在96 孔板上設(shè)置陽性對照(加入1 μL 的anti-6×His 抗體)和空白對照(不加入血清)。最后加入噬菌體隨機肽展示文庫10 μL/孔,將該體系置于4 ℃環(huán)境中振蕩過夜(12 ~16 h)。每孔加入10 μL 清洗過的Protein G 磁珠,4 ℃下振蕩4 h。使用TBST 緩沖液200 μL/孔清洗后將96 孔板置于磁力架,把磁珠以外的液體除盡,該步驟重復(fù)3 次,最后使用去離子水清洗1 次。向96 孔板中加入去離子水20 μL/孔重懸,即為Protein G 磁珠、IgG及其結(jié)合的噬菌體三者的復(fù)合物(圖1)。
圖1 噬菌體淘選流程圖Fig 1 Work flow of phage screening
1.2.3 高通量測序文庫構(gòu)建 根據(jù)已發(fā)表的噬菌體文庫篩選相關(guān)報道[13],對其方法進行了簡單修改,具體流程:將上述得到的復(fù)合物,95 ℃加熱20 min 使噬菌體釋放出DNA,凍存于-20 ℃,待用。使用時通過96 孔磁力架固定磁珠,排槍吸取上清液作為第1 輪PCR 的模板。
用2 輪延伸PCR 法構(gòu)建高通量測序文庫,用Q5 熱啟動DNA 聚合酶進行擴增。引物序列見表1。用于擴增的引物序列中,標記的序列代表由8 個核苷酸組成的編號序列,用于樣品的混合。第1 輪PCR 的總體系為25 μL,包括噬菌體DNA(擴增模板)、1×Q5 緩沖液、100 μmol/L dNTP( 脫氧核糖核苷三磷酸,deoxy-ribonucleoside triphosphate)、0.25 μmol/L 正 向 引 物(01-S502-23R 至12-S517-23R)、0.25 μmol/L 反向引物(01-N701-18 至11-N714-18)、Q5 聚合酶0.25 μL。PCR 反應(yīng)條件:98 ℃預(yù)變性2 min;98 ℃變性10 s,55 ℃退火30 s,72 ℃延伸30 s,共25 個循環(huán);72 ℃延伸2 min。PCR 結(jié)束后配制2.5%瓊脂糖凝膠電泳驗證產(chǎn)物。按照試劑盒說明書從凝膠中回收產(chǎn)物。第2 輪PCR 的反應(yīng)體系為25 μL,包括第1 輪PCR擴增后的膠回收產(chǎn)物1 μL 作為擴增模板,1×Q5 緩沖液、0.25 μmol/L Index-S518 正向引物、0.25 μmol/L Index-N718反 向 引 物、100 μmol/L dNTP、Q5 聚 合 酶0.25 μL。PCR反應(yīng)條件:98 ℃預(yù)變性2 min;98 ℃變性10 s,55 ℃退火30 s,72 ℃延伸30 s,共10 個循環(huán);72 ℃延伸2 min。PCR 結(jié)束后配制2.5%瓊脂糖凝膠電泳驗證產(chǎn)物,并回收產(chǎn)物。在測量濃度后,將核酸產(chǎn)物等量混合在一起。合并的文庫在Illumina HiSeq5000 平臺上以2×150 配對末端作為測序模式進行測序。
表1 高通量測序相關(guān)引物序列Tab 1 Primers for next generation sequencing
Continued Tab
1.2.4 生物信息學(xué)分析 在噬菌體中插入的片段共103個堿基對,結(jié)構(gòu)見圖2。根據(jù)高通量文庫構(gòu)建過程中在核酸樣品兩端擴增引入的標簽(表1 中帶下劃線的序列)將所有讀出的多肽歸類至每個血清樣品中,核酸序列進一步被翻譯為氨基酸序列。將一個樣品中每條多肽的數(shù)量除以該血清樣品中所有多肽的數(shù)量之和,乘100 000 作為歸一化后的數(shù)值,減去空白對照組的數(shù)值,得到最終一個樣品中每條多肽的讀數(shù),取讀數(shù)排名前10 000 的多肽進行后續(xù)分析。通過MEME 網(wǎng)站(http://meme-suite.org/tools/meme)對陽性對照組的4 個復(fù)孔anti-6×His 抗體的多肽序列進行基序分析,以檢測實驗的可靠性。每個溫度處理條件下樣品的閾值都設(shè)在0.01 以上,將符合該條件的多肽進行香農(nóng)熵的計算,公式為H =-∑p (x) ×log[p (x) ],其中p (x)表示多肽x 的出現(xiàn)概率。
圖2 擴增產(chǎn)物二代測序結(jié)構(gòu)圖Fig 2 Sequence structure of amplified product for next generation sequencing
為了檢測上述淘選實驗的可靠性,我們采取具有已知結(jié)合表位的抗體anti-6×His 抗體作為陽性對照,陽性對照進行了4 次重復(fù),分散在96 孔板上的不同位置。淘選流程與血清樣品一致,經(jīng)二代測序?qū)⒏患氖删w中的核酸信息轉(zhuǎn)化為多肽信息后,通過在線Motif 模擬工具MEME 進行表位的發(fā)現(xiàn)[參數(shù)設(shè)置:-evt(篩選閾值)為0.001,-nepitopes(epitope 出現(xiàn)次數(shù))為8,-minw(功能域長度最小值)為6,-maxw(功能域長度最大值)為10,其余參數(shù)為默認值]。結(jié)果顯示4 個陽性對照識別的表位均與6×His 匹配,說明本實驗操作流程是可靠的(圖3)。
為了驗證淘選實驗的可重復(fù)性,將-80 ℃條件下的2 個血清樣品(80S1 和80S2)和陽性對照組的2 個樣品(80H1 和80H2)每條多肽的讀數(shù)經(jīng)歸一化處理后,進行Pearson 相關(guān)性分析。最終血清重復(fù)實驗和anti-6×His 抗體重復(fù)實驗的Pearson 相關(guān)系數(shù)r 分別為0.986 和0.976,說明淘選實驗的可重復(fù)性較好(圖4)。
圖4 在多肽水平對血清樣品及陽性對照的淘選實驗可重復(fù)性分析Fig 4 Reproducibility of biopanning of serum sample and positive control on peptide level
為了研究極端條件下血清的多樣性系數(shù),并將此作為所有處理條件的極值,我們選擇能使蛋白質(zhì)變性的條件——95 ℃下孵育10 min。血清樣品處理后呈淡黃色沉淀,幾乎無殘留液體。經(jīng)過噬菌體淘選、二代測序、數(shù)據(jù)分析等過程,讀數(shù)大于0.01 的多肽數(shù)量相比-80 ℃保存的樣品明顯減少,香農(nóng)熵從3.45 降至3.20,2 組樣品間差異有統(tǒng)計學(xué)意義(P=0.008)(圖5)。雖然95 ℃處理后的樣品抗體幾乎完全失活,但由于測序數(shù)據(jù)并不完全相同,減去空白對照后多肽仍有少量剩余,因而香農(nóng)熵并非完全為零。
圖5 95 ℃處理后血清樣品中IgG 識別多肽的多樣性Fig 5 Diversity of peptides recognized by antibodies in serum treated at 95 ℃
為了探究血清樣品在不同溫度條件下香農(nóng)熵是否發(fā)生變化以及這些變化是否能用香農(nóng)熵進行表征,我們將樣品在-20 ℃、4 ℃、37 ℃下分別處理12、24、48 h,并通過噬菌體淘選、二代測序、數(shù)據(jù)分析等過程,分別將各時間段樣品計算得到的香農(nóng)熵與-80 ℃條件下樣品的香農(nóng)熵進行比較(-80 ℃在X 軸上標示為“0”)。
其中,-20℃下處理不同時間的血清樣品,其香農(nóng)熵較-80℃未出現(xiàn)明顯變化。該結(jié)果表明,在凍存條件下,血清中抗體所識別的多肽的多樣性基本相同,抗體的結(jié)合能力保持穩(wěn)定。在4 ℃條件下處理的血清樣品在12 h 后,香農(nóng)熵呈下降趨勢,處理48 h 后從3.45 降至3.39。該結(jié)果表明,在4 ℃時,抗體的多樣性在12 h 內(nèi)已發(fā)生變化,抗體結(jié)合能力在12 h 內(nèi)開始下降。同樣地,樣品在37 ℃下放置12 h 后,香農(nóng)熵也呈現(xiàn)下降趨勢,并且其下降幅度比4 ℃更大;處理48 h 后,香農(nóng)熵已降至3.32。該結(jié)果表明,在37 ℃時,抗體的多樣性在處理的12 h 內(nèi)已發(fā)生明顯變化,抗體結(jié)合能力在處理的12 h 內(nèi)開始較大程度地降低(圖6)。結(jié)合幾個溫度條件下的實驗結(jié)果可見,香農(nóng)熵能夠表征血清抗體的結(jié)合能力。
圖6 不同溫度下血清樣品中IgG 識別多肽的多樣性變化趨勢Fig 6 Diversity trend of peptides recognized by antibodies in serum at different temperatures
優(yōu)質(zhì)的臨床生物樣品是生物標志物發(fā)現(xiàn)、鑒定和確認的關(guān)鍵。血液樣品加工和處理方式的變化會影響蛋白質(zhì)豐度和測定的可靠性[5]。對不同類型的血樣有不同的質(zhì)量檢查方法,如全血樣品各組分的分析方法,主要包括全細胞計數(shù)、綜合代謝分析,其中代謝分析中對蛋白質(zhì)和酶類的分析也僅限于已知蛋白質(zhì)(如血紅蛋白、白蛋白、堿性磷酸酶等)[6]。血樣中蛋白相關(guān)生物標志物以蛋白質(zhì)為主。蛋白質(zhì)相關(guān)生物標志物主要有2 種:①基于豐度和修飾改變的蛋白質(zhì)標志物。②基于抗體變化,尤其是自身抗體改變的生物標志物。對前者已有了相關(guān)的質(zhì)控手段[1],但對后者則嚴重欠缺。
本文采用高效方便的噬菌體展示技術(shù)和高通量測序技術(shù),將不同溫度下貯存的血清與噬菌體隨機肽展示文庫進行反應(yīng),通過免疫沉淀法捕捉噬菌體與IgG 的多肽復(fù)合物,在高溫條件下獲取噬菌體內(nèi)的核酸后擴增進行二代測序,最后轉(zhuǎn)換成每個樣品中IgG 識別的多肽信息。經(jīng)歸一化、減去空白對照后,保留出現(xiàn)頻率大于0.01 的多肽,以全面評價血清中抗體的結(jié)合能力。經(jīng)多樣性分析,在-80 ℃與-20 ℃這2 種相似的凍存狀態(tài)處理12、24、48 h 后,多肽的多樣性沒有明顯變化,這與已有報道[18]的全血樣品蛋白質(zhì)組的變化情況一致。但當(dāng)溫度分別為4 ℃、37 ℃時,其多樣性在12 h 內(nèi)呈下降趨勢,且并隨著時間變化逐漸接近極端條件。因此,我們認為香農(nóng)熵有潛力成為評價血清中抗體質(zhì)量的指標,以及將噬菌體展示技術(shù)與高通量測序技術(shù)結(jié)合起來用于評價血清質(zhì)量具備可行性,而且整個血清樣品的狀態(tài)還可通過抗體水平的結(jié)合能力來評價。
同時,我們認為現(xiàn)行的評估體系可以得到進一步改進。第一個問題是樣品的設(shè)計,可以進行更長時間的處理,使多樣性的變化趨勢更加明顯以及處理時間達到多久時樣品的香農(nóng)熵會達到極端值,這將指導(dǎo)后續(xù)實驗樣品的存儲和實驗隊列的建立。第二,數(shù)據(jù)分析應(yīng)從更多方面進行。一方面,測序通量大小引起的多肽數(shù)目的多少,本次實驗選取的1 萬條多肽較文獻[15]報道的少,因此可以擴大測序通量選擇的范圍,以擴大香農(nóng)熵的評估庫容量。另一方面,即空白對照的選取。95 ℃處理后,血清的真實狀態(tài)與空白對照比較接近,但由于二代測序后不同樣品的讀數(shù)并不完全相同,所以在減去空白對照后,95 ℃樣品的多肽讀數(shù)雖然接近于0,但仍可作為多樣性分析的輸入,香農(nóng)熵也因此不是0。所以在數(shù)據(jù)分析中選擇閾值也值得進一步探討。由于血清中有多種IgG,結(jié)合的肽序列復(fù)雜,不能獲得顯著的motif,因此與單抗的質(zhì)檢對比缺少了表位這一評估特征。盡管香農(nóng)熵已被證明具有評價血清中抗體質(zhì)量的潛力,但血清中含有的抗體比單抗復(fù)雜得多,在后續(xù)實驗改進時,可以擴大其范圍,增加其他的參數(shù),從多個方面對血清的抗體質(zhì)量進行綜合 評價。
綜上所述,我們首次將噬菌體展示技術(shù)和高通量測序技術(shù)聯(lián)合起來,利用香農(nóng)熵對血清中抗體的質(zhì)量進行表征,建立了一套通用性強,易于擴展,通量高,適用于全血清抗體質(zhì)量控制的初步評價體系。
參·考·文·獻
[1] Geyer PE, Voytik E, Treit PV, et al. Plasma Proteome Profiling to detect and avoid sample-related biases in biomarker studies[J]. EMBO Mol Med, 2019, 11(11): e10427.
[2] Betteridge Z, McHugh N. Myositis-specific autoantibodies: an important tool to support diagnosis of myositis[J]. J Intern Med, 2016, 280(1): 8-23.
[3] McHugh NJ, Tansley SL. Autoantibodies in myositis[J]. Nat Rev Rheumatol, 2018, 14(5): 290-302.
[4] Yang B, Li XY, Ren TY, et al. Autoantibodies as diagnostic biomarkers for lung cancer: a systematic review[J]. Cell Death Discov, 2019, 5: 126.
[5] Hassis ME, Niles RK, Braten MN, et al. Evaluating the effects of preanalytical variables on the stability of the human plasma proteome[J]. Anal Biochem, 2015, 478: 14-22.
[6] Wu DW, Li YM, Wang F. How long can we store blood samples: a systematic review and meta-analysis[J]. EBioMedicine, 2017, 24: 277-285.
[7] Daniels JR, Cao ZJ, Maisha M, et al. Stability of the human plasma proteome to pre-analytical variability as assessed by an aptamer-based approach[J]. J Proteome Res, 2019, 18(10): 3661-3670.
[8] Zimmerman LJ, Li M, Yarbrough WG, et al. Global stability of plasma proteomes for mass spectrometry-based analyses[J]. Mol Cell Proteomics, 2012, 11(6): M111.014340.
[9] Larman HB, Zhao ZM, Laserson U, et al. Autoantigen discovery with a synthetic human peptidome[J]. Nat Biotechnol, 2011, 29(6): 535-541.
[10] Xu GJ, Kula T, Xu QK, et al. Viral immunology. Comprehensive serological profiling of human populations using a synthetic human virome[J]. Science, 2015, 348(6239): aaa0698.
[11] Larman HB, Laserson U, Querol L, et al. PhIP-Seq characterization of autoantibodies from patients with multiple sclerosis, type 1 diabetes and rheumatoid arthritis[J]. J Autoimmun, 2013, 43: 1-9.
[12] Paull ML, Daugherty PS. Mapping serum antibody repertoires using peptide libraries[J]. Curr Opin Chem Eng, 2018, 19: 21-26.
[13] Wu FL, Lai DY, Ding HH, et al. Identification of serum biomarkers for systemic lupus erythematosus using a library of phage displayed random peptides and deep sequencing[J]. Mol Cell Proteomics, 2019, 18(9): 1851- 1863.
[14] Qi H, Ma ML, Hu CS, et al.Antibody binding epitope Mapping (AbMap) of two hundred antibodies in a single run[J]. BioRxiv, 2019, 8: 739342.
[15] Wang L, Whittemore K, Johnston SA, et al. Entropy is a simple measure of the antibody profile and is an indicator of health status: a proof of concept[J]. Sci Rep, 2017, 7(1): 18060.
[16] Kebede D, Aklilu M, Sanders E. The HIV epidemic and the state of its surveillance in Ethiopia[J]. Ethiop Med J, 2000, 38(4): 283-302.
[17] Adjei AA, Kudzi W, Armah H, et al. Prevalence of antibodies to syphilis among blood donors in Accra, Ghana[J]. Jpn J Infect Dis, 2003, 56(4): 165-167.
[18] Rai AJ, Gelfand CA, Haywood BC, et al. HUPO Plasma Proteome Project specimen collection and handling: towards the standardization of parameters for plasma proteome samples[J]. Proteomics, 2005, 5(13): 3262-3277.