李 達(dá),王 軍,楊 忠,王會如
(1.北京市醫(yī)療器械檢驗所,北京101111; 2.清華大學(xué)生命科學(xué)學(xué)院,北京100084)
人類基因組計劃的實施,推動了分子生物學(xué)技術(shù)在醫(yī)學(xué)和遺傳學(xué)基礎(chǔ)研究領(lǐng)域的應(yīng)用。隨著基因組序列信息的不斷完善,人們對疾病的認(rèn)識逐步深入到分子層面,分子檢測結(jié)果在臨床診斷指導(dǎo)中的作用越來越受到重視。雖然我國分子診斷產(chǎn)品市場占有率較小,但從2014年開始,每年的增速超過20%,成為體外診斷行業(yè)中發(fā)展最快的產(chǎn)品[1]。2015年,我國開展并實施了自己的“精準(zhǔn)醫(yī)療”計劃,由北京協(xié)和醫(yī)院、中國醫(yī)學(xué)科學(xué)院腫瘤醫(yī)院、北京大學(xué)人民醫(yī)院等作為第一批運用高通量基因測序技術(shù)進(jìn)行腫瘤診斷與臨床治療的試點單位[2]。分子診斷行業(yè)產(chǎn)品涉及無創(chuàng)產(chǎn)前診斷、癌癥早篩及伴隨診斷、耐藥基因檢測、血液病檢測、遺傳易感基因檢測、生殖醫(yī)學(xué)檢測和致病微生物檢測等。隨著基因測序數(shù)據(jù)和臨床病例的結(jié)合,疾病在分子水平呈現(xiàn)出了相同的機制,如非小細(xì)胞肺癌患者中,腫瘤體細(xì)胞中出現(xiàn)EGFR、KRAS和TP53基因的突變[3],乳腺癌患者體細(xì)胞中發(fā)現(xiàn)BRCA1、BRCA2和HER2突變[4,5]。從堿基水平來看,基因的變異類型主要有拷貝數(shù)變異(copy number variations, CNVs)、單核苷酸堿基突變(single nucleotide polymorphisms, SNPs)、小片段堿基的插入或缺失(insertion-deletion, Indel)、基因融合、基因重排和甲基化修飾等。
隨著分子體外診斷行業(yè)的發(fā)展,產(chǎn)品種類和數(shù)量與日俱增。然而,不同廠家產(chǎn)品的性能參差不齊,保證檢驗結(jié)果的可靠性需要依靠正確的參考方法和標(biāo)準(zhǔn)物質(zhì),通過溯源來實現(xiàn)標(biāo)準(zhǔn)化和一致化。目前,分子檢測產(chǎn)品主要以聚合酶鏈?zhǔn)椒磻?yīng)(polymerase chain reaction, PCR)、生物質(zhì)譜、分子雜交和測序法為主。市場上常見的核酸定值平臺有分光光度計、熒光染料定量儀、熒光定量PCR儀、數(shù)字PCR儀、雜交芯片、飛行質(zhì)譜儀、電感耦合等離子體質(zhì)譜和第二代高通量測序儀等。而核酸標(biāo)準(zhǔn)物質(zhì)一般由各國政府機構(gòu)和非盈利組織研制開發(fā),大多采用多實驗室合作定值方案。美國國家標(biāo)準(zhǔn)與技術(shù)研究院以熒光定量PCR和數(shù)字PCR作為定值的平臺,研制了人巨細(xì)胞病毒(RM 2366a)、人類DNA定量標(biāo)準(zhǔn)品(RM 2372a)、HER2基因拷貝數(shù)(RM 2373)等標(biāo)準(zhǔn)物質(zhì)[6,7];英國國家生物標(biāo)準(zhǔn)研究所研制的骨髓增殖性腫瘤驅(qū)動JAK2基因V617F突變標(biāo)準(zhǔn)品盤,采用了熒光定量PCR、數(shù)字PCR、生物質(zhì)譜和高通量測序儀等作為定值的平臺[8]。目前由于核酸標(biāo)準(zhǔn)物質(zhì)的需求量大,商業(yè)公司紛紛進(jìn)駐標(biāo)準(zhǔn)物質(zhì)研制領(lǐng)域,如英國Horizon Diagnostics公司生產(chǎn)的高通量測序人類基因組分子診斷標(biāo)準(zhǔn)物質(zhì)。該標(biāo)準(zhǔn)物質(zhì)同樣以數(shù)字PCR作為定值手段,根據(jù)不同測序平臺和文庫構(gòu)建方式,基于基因覆蓋率開發(fā)了不同等位基因頻率的標(biāo)準(zhǔn)物質(zhì)[9]。
核酸檢測的優(yōu)勢在于從分子層面揭示了疾病的成因,但樣品中較低的核酸濃度通常給檢測帶來了困擾。目前,分子診斷產(chǎn)品的性能和實際檢測能力的正確評價,需要利用均勻穩(wěn)定且量值可溯源的標(biāo)準(zhǔn)物質(zhì)[10]。而核酸標(biāo)準(zhǔn)物質(zhì)的研制過程,不僅需要正確地使用核酸檢測儀器和試劑產(chǎn)品,更需要合理規(guī)范的實驗設(shè)計和操作流程。本文從核酸的取樣量、核酸的稀釋、核酸定值方法和數(shù)據(jù)結(jié)果分析4個方面展開,探討核酸標(biāo)準(zhǔn)物質(zhì)定值的影響因素。
核酸作為生物體遺傳信息的載體,存在于人體的各類生物樣本中,如腫瘤組織細(xì)胞、血液白細(xì)胞、血漿、尿液、唾液和胸腹液等。從各種樣本中提取核酸并進(jìn)行檢測,涉及到復(fù)雜的提取過程和隨機取樣過程。為了盡可能得到核酸,我們應(yīng)盡量多收集樣本。然而,臨床樣本的特殊性,限制了樣本本身的取樣量,從而進(jìn)一步影響了被測樣本的準(zhǔn)確性。尤其是體液中游離核酸的檢測,因樣本取樣量的限制,對檢測結(jié)果造成很大的影響。依據(jù)阿伏伽德羅常數(shù)和分子量,將核酸質(zhì)量換算成各物種核酸分子的拷貝數(shù)。如表1所示,在相同質(zhì)量的樣本下,樣本基因組的大小與核酸拷貝數(shù)成反比,基因組越大,相同質(zhì)量的核酸所含有的拷貝數(shù)越少。
表1 1 ng核酸分子拷貝數(shù)估計Tab.1 Estimation of copy number in 1 ng nucleic acid molecules
*艾滋病病毒為RNA病毒。
在做核酸檢測時,檢測的目標(biāo)分子往往是稀有拷貝,這給樣本的取樣造成了很大的困擾。貝努利模型給出了檢測的核酸分子數(shù)量與置信區(qū)間的關(guān)系:
Φ(μ,m)=1-(1-μ)m
(1)
式中:Φ為置信區(qū)間;μ為目標(biāo)分子比例;m為檢測分子數(shù)。
圖1展示了在不同目標(biāo)分子比例下,所需檢測的核酸分子數(shù)量與置信區(qū)間的關(guān)系。
圖1 檢測分子數(shù)與置信區(qū)間的關(guān)系Fig.1 The relationship between the detecting molecular numbers and confidence intervals
當(dāng)要求達(dá)到95%的置信區(qū)間,目標(biāo)分子所占比例為1%時,至少要檢測299個分子才能保證檢測到1個目標(biāo)分子;而要達(dá)到99%的置信區(qū)間,則至少需要檢測459個分子才能保證檢測到1個目標(biāo)分子。假如目標(biāo)分子比例不變,理論上檢測500個分子中應(yīng)該有5個目標(biāo)分子被檢測到,然而在實際的測量值有可能是4個或6個目標(biāo)分子,最終用多次測量值的均值代表檢測結(jié)果。
由于定量通常使用多次測量值來估計真實值,我們用變異系數(shù)來衡量測量值的離散程度,要求測量值有較小的誤差。變異系數(shù)的表達(dá)式為:
(2)
式中:p為目標(biāo)分子比例;n為檢測分子數(shù)。
圖2給出了5個不同比例的目標(biāo)分子數(shù)下,測量的分子數(shù)與變異系數(shù)的關(guān)系曲線。
圖2 測量的分子數(shù)與變異系數(shù)的關(guān)系Fig.2 The relationship between the quantitating molecular numbers and coefficient of variation
可以看出,隨著測量分子數(shù)目的增加,變異系數(shù)逐漸減小,測量相同的分子數(shù)下,目標(biāo)分子所占比例越高,變異系數(shù)越小。當(dāng)目標(biāo)分子所占比例為1%時,測量大于39 600個分子時,變異系數(shù)小于5%;而當(dāng)目標(biāo)分子所占比例為0.1%時,則需測量99 900個分子,變異系數(shù)才能降低到10%。因此,檢測的樣本和變異系數(shù)決定了實際的工作量。
稀有核酸樣品對取樣體積有著更高的要求,取樣體積的大小直接影響著取樣的均勻性,從而影響測量的正確性。如圖3所示,假設(shè)樣品中僅含有16個目標(biāo)分子時,若按總體積的1/64取樣,每次取到的突變分子數(shù)為0至2個;按總體積的1/9取樣時,每次能取到1至3個突變分子;而只有按總體積的1/4取樣時,每次取樣才能得到一致的4個目標(biāo)分子。所以,為保證取樣的均勻性,稀有核酸分子的取樣體積要盡可能大,甚至接近樣品本身體積。
圖3 稀有核酸樣品的均勻性差異Fig.3 The uniformity differences of rare nucleic acid samples
為保證核酸檢測的正確度、精密度和準(zhǔn)確度,核酸檢測儀器和試劑都限定了不同的核酸上樣體積或上樣量。在樣品的制備過程中,核酸的稀釋成為不可缺少的試驗步驟。如圖4所示,樣品的稀釋倍數(shù)和取樣體積之間存在著緊密聯(lián)系。假設(shè)100 ng/μL的人類基因組DNA樣品,樣品總體積為20 μL,按照1:10的比例梯度稀釋DNA。不同的取樣體積決定了樣品可稀釋的倍數(shù)。當(dāng)取樣體積為0.5 μL時,僅能稀釋到1 500倍;而取樣體積為10 μL時,能夠稀釋到30 000倍。由此可見,在一定的核酸濃度下,取樣體積的大小應(yīng)根據(jù)稀釋倍數(shù)合理設(shè)定。
核酸稀釋的另一個重要因素是移液誤差,它影響取樣量的準(zhǔn)確度。假設(shè)一支10 μL移液槍的誤差為±0.02 μL,當(dāng)取樣體積為10 μL時,取樣誤差的絕對值僅為0.2%;而取樣量為0.5 μL時,取樣誤差的絕對值可達(dá)4%。隨著移液次數(shù)的增加,取樣誤差逐漸積累;稀釋次數(shù)的增加,同樣也增大了取樣的誤差。所以,較大的取樣體積、較少的移液次數(shù)和稀釋次數(shù),是提高取樣準(zhǔn)確度的有效手段。
在基因檢測中,不同的技術(shù)方法可以得到不同的核酸量值,表2介紹了6種常用的核酸定值技術(shù)。
表2 基因檢測常用的核酸定值方法Tab.2 Common methods for quantitation of nucleic acids in genetic testing
圖4 取樣體積和稀釋倍數(shù)之間的關(guān)系Fig.4 The relationship between sampling volume and dilution factor
賽默飛世爾公司生產(chǎn)的NanoDrop和Qubit核酸定量儀,通過核酸對光譜的吸收原理,能夠簡單快速地定量核酸[11];熒光定量PCR技術(shù)由Applied Biosystems公司首先推出,該技術(shù)在PCR反應(yīng)體系中加入熒光染料或熒光基團(tuán),利用熒光信號來實時監(jiān)測整個PCR進(jìn)程,通過產(chǎn)生的可被檢測到的熒光信號所需的最小循環(huán)數(shù),即Ct(cycle-threshold)值,來做標(biāo)準(zhǔn)曲線,定量核酸分子數(shù)[12];2012年,Bio-Rad公司推出了第一款商用微滴式數(shù)字PCR儀,該儀器為直接計數(shù)法,將待測樣本稀釋,可以將反應(yīng)單元中的DNA模板達(dá)到單分子水平。通過PCR擴增,具有熒光信號的反應(yīng)單元中至少含有一個拷貝分子[13]。生物質(zhì)譜的發(fā)展基于軟電離方式,1990年,AB SCIEX公司推出了第一款基質(zhì)輔助激光解析電離飛行時間質(zhì)譜(matrix-assisted laser desorption ionization time of flight mass spectrometry, MALDI-TOF-MS)。質(zhì)譜在準(zhǔn)確性方面具有優(yōu)勢, 通過等位基因特異延伸反應(yīng)得到較短的寡核苷酸片段,檢測寡核苷酸的分子量來確定樣本的SNP和Indel,再通過質(zhì)譜峰單位面積定量核酸[14];高分辨電感耦合等離子體質(zhì)譜法(high-resolution inductively-coupled plasma-mass spectrometry, HR-ICP-MS)對痕量和超痕量元素具有良好的檢測能力以及譜圖識別性能,以磷元素來定量核酸具有很好的分辨率[15];1997年,斯坦福大學(xué)研制出了第一張酵母全基因組芯片,基因芯片基于核酸分子堿基互補配對原理,通過合成特定的寡核苷酸序列,利用雜交過程產(chǎn)生不同強度的熒光信號值來定量核酸[16];羅氏454測序系統(tǒng)開啟了新一代的DNA測序儀市場,下一代測序技術(shù)一次能對幾十萬到幾百萬條DNA分子進(jìn)行序列測定,通過對測序上樣文庫的定量,運用生物信息學(xué)分析技術(shù),幾乎可以得到樣本里所有的核酸序列和豐度[17]。
不同方法有各自的儀器平臺的優(yōu)缺點,表2中總結(jié)了基因檢測中常用的6種技術(shù)平臺。其中,數(shù)字PCR方法由于不需要借助任何的標(biāo)準(zhǔn)品即可進(jìn)行核酸的絕對定量,且在低豐度檢測時具有更高的準(zhǔn)確性[18],越來越被廣泛接受為核酸溯源定值的標(biāo)準(zhǔn)參考方法。
數(shù)據(jù)處理過程中,我們在判斷陽性或陰性樣品時,常常碰到假陽性和假陰性問題,如圖5中指出的第I類錯誤和第II類錯誤。根據(jù)美國臨床實驗室標(biāo)準(zhǔn)化協(xié)會(Clinical & Laboratory Standards Institute, CLSI)EP17-A文中定義,由于實驗過程的復(fù)雜性,空白樣品有時會產(chǎn)生一個低值信號。當(dāng)樣品的濃度非常低時,低于空白限(limit of blank, LoB),容易產(chǎn)生假陰性。空白限由多次重復(fù)的有效上樣量的陰性樣品的數(shù)值來確定,在95%的置信區(qū)間內(nèi),空白限應(yīng)根據(jù)式(3)確定數(shù)值。另外,由于系統(tǒng)誤差的存在,實際的空白限設(shè)定應(yīng)大于計算得到的空白限。
(3)
圖5 空白限、檢測限和定量限的關(guān)系分布Fig.5 Distribution relationship between LoB, LoD and LoQ
檢測限(limit of detection, LoD)是能夠真實區(qū)分空白限并能夠得到合理的檢測結(jié)果的樣品最低濃度或起始量,標(biāo)志著實驗體系的最低檢測能力。式(4)明確了檢測限的計算方法。
LoD=LoB+1.645×SDLCsample
(4)
式中:SDLCsample為低值濃度樣本標(biāo)準(zhǔn)差。
核酸定量要達(dá)到定量限(limit of quantitation, LoQ)的要求,定量限是指滿足準(zhǔn)確度、精密度和總誤差的樣品最小檢測濃度或起始量。定量限一般要大于檢測限,有時在數(shù)值上也可以等于檢測限[19]。定量限的確定要考慮定量實驗體系和測試樣品的特點,測量值的標(biāo)準(zhǔn)差和線性相關(guān)系數(shù)是確定定量限的兩個重要因素。一旦線性關(guān)系確立,就可以通過回歸模型反推測量值代表的樣品濃度或上樣量。如圖6所示,在定量限以上,測量值的標(biāo)準(zhǔn)差有明確的數(shù)值范圍。隨著樣品濃度或上樣量的增加,測量值的標(biāo)準(zhǔn)差逐漸減小,達(dá)到最小范圍,即最佳定量范圍,而只有在最佳定量范圍內(nèi)測量值才能更接近真實值。
圖6 定量的準(zhǔn)確度與線性回歸分析Fig.6 The relationship between quantitative accuracy and linear regression analysis
我們以數(shù)字PCR定值方法為例,參考市場上常見的數(shù)字PCR儀型號。根據(jù)Dube等[20]人的研究,在95%的置信區(qū)間下,利用式(5)~式(9)模擬了5個不同數(shù)目的反應(yīng)單元下,反映單元內(nèi)平均分子數(shù)與相對誤差的關(guān)系。如圖7所示,隨著反應(yīng)單元數(shù)目的增多,相對誤差逐漸降低。當(dāng)反映單元內(nèi)平均分子數(shù)為1.59時,對應(yīng)的相對誤差全部達(dá)到了最低值。即λ=1.59為數(shù)字PCR的最佳定量范圍。
(5)
(6)
λmin=-ln(1-pmin)
(7)
λmax=-ln(1-pmax)
(8)
(9)
式中:λ為單元內(nèi)平均分子數(shù);λmin為單位內(nèi)最小分子數(shù);λmax為單位內(nèi)最大分子數(shù);p為平均陽性單元比例;pmin為最小陽性單元比例;pmax為最大陽性單元比例;C為單元數(shù)目;δ為相對誤差。
圖7 數(shù)字PCR反應(yīng)單元中平均拷貝數(shù)與相對誤差的關(guān)系Fig.7 The relationship between average number of copies per droplet and relative error in digital PCR
利用泊松分布計算單元內(nèi)實際分子數(shù)為k的概率:
(10)
如圖8所示,當(dāng)λ=1.59時,實際的反映單元內(nèi)為1個真實分子數(shù)的概率最大,為32.4%。
圖8 變異系數(shù)最小時反應(yīng)單元內(nèi)含有不同分子數(shù)的概率Fig.8 The probability of average number of copies per droplet in minimum coefficient of variation
隨著PCR技術(shù)的問世,以核酸為基礎(chǔ)的生命科學(xué)研究和臨床分子診斷得到了廣泛應(yīng)用。最早的核酸標(biāo)準(zhǔn)物質(zhì)始于丙型肝炎病毒(Hepatitis C virus, HCV)RNA(NIBSC code 06/202;06/206)[21],自此醫(yī)學(xué)檢驗科室和試劑廠家采用國際標(biāo)準(zhǔn)物質(zhì)進(jìn)行定量,建立了統(tǒng)一的定量單位,使得檢測結(jié)果不僅具有可比性,而且有了溯源性,保證了臨床檢測結(jié)果的可靠性。
2017年11月,美國食品和藥物管理局批準(zhǔn)的高通量測序平臺,能夠一次對病人腫瘤中468個基因的突變和遺傳變異進(jìn)行快速、靈敏的檢測。以高通量測序技術(shù)為依托的分子類體外診斷試劑和儀器產(chǎn)品的飛速發(fā)展,將傳統(tǒng)的單一核酸檢測項目逐步推向了全基因組水平的檢測。隨著分子診斷產(chǎn)品認(rèn)可度的提高,分子診斷檢測將有望從體細(xì)胞基因組、游離核酸逐步向代謝水平的核酸檢測發(fā)展,屆時核酸定值的重要性會越發(fā)突出[22]。因此,核酸標(biāo)準(zhǔn)物質(zhì)的研制也面臨著極大的挑戰(zhàn)。
本文重點介紹了核酸標(biāo)準(zhǔn)物質(zhì)研制實驗過程中取樣量、稀釋、定值方法和數(shù)據(jù)結(jié)果分析4個關(guān)鍵因素,為合理優(yōu)化實驗體系、減小實驗誤差和避免錯誤結(jié)果提供了理論依據(jù)。但核酸標(biāo)準(zhǔn)物質(zhì)的研制不僅要考慮實驗設(shè)計,還要考慮制作工藝,滿足標(biāo)準(zhǔn)物質(zhì)的均勻性、穩(wěn)定性、互換性和基質(zhì)效應(yīng)等要求[23]。另外,標(biāo)準(zhǔn)物質(zhì)需要規(guī)定用途范圍和適用儀器特點,在行業(yè)內(nèi)具有實用性,能夠起到規(guī)范和統(tǒng)一行業(yè)標(biāo)準(zhǔn)的作用。希望本文工作能夠指導(dǎo)核酸標(biāo)準(zhǔn)物質(zhì)的定值實驗設(shè)計,為完善核酸標(biāo)準(zhǔn)物質(zhì)的研制提供參考。