彭 玲,楊渝偉,王開正
(1.四川省綿陽市中心醫(yī)院檢驗科 621000;2.西南醫(yī)科大學(xué)附屬醫(yī)院檢驗科,四川瀘州 646000)
自身抗體是自身免疫應(yīng)答和自身免疫性疾病(AID)的重要特征,因此自身抗體譜檢測是目前臨床廣泛采用的篩查AID的重要手段之一。本室開展的EUROIMMUN自身免疫抗體譜檢測共含16種自身抗體,分別是抗核抗體(ANA)、抗核糖核蛋白抗體(nRNP/Sm)、抗Sm抗體(Sm)、抗干燥綜合征A抗體(SSA)、抗干燥綜合征Ro-52抗體(Ro-52)、抗干燥綜合征B抗體(SSB)、抗拓?fù)洚悩?gòu)酶Ⅰ抗體(Scl-70)、抗PM-Scl抗體(PM-Scl)、抗細(xì)胞漿組酰-tRNA合成酶抗體(Jo-1)、抗著絲點抗體B(CENP B)、抗增殖細(xì)胞核抗原抗體(PCNA)、抗雙鏈DNA抗體(ds-DNA)、抗核小體抗體(Nuclesome)、抗組蛋白抗體(Histone)、抗核糖體P蛋白抗體(Rib·P)和抗線粒體M2抗體(AMA-M2)。這些自身抗體對多種AID,如系統(tǒng)性紅斑狼瘡(SLE)、干燥綜合征、多發(fā)性肌炎、混合型結(jié)締組織病、原發(fā)性膽汁性肝硬化等均具有良好的診斷價值[1]。但是,這些自身抗體中,除極少數(shù)如Sm、Rib·P為疾病標(biāo)記性抗體(即僅在某一種AID中出現(xiàn),但其敏感性低)外,其余自身抗體均在多種AID中呈現(xiàn)不同程度的檢出率[2]。因此,自身抗體本身的多樣性和分布的復(fù)雜性增加了自身抗體譜檢測報告解讀的困難,同時該報告蘊(yùn)含的大信息量也進(jìn)一步給報告解讀帶來一定難度。本文通過回顧大量樣本自身抗體譜的檢測數(shù)據(jù),聯(lián)合多參數(shù)建立預(yù)測模型,旨在提高SLE診斷效率,同時為報告的規(guī)范化解讀提供依據(jù)。
1.1一般資料 收集2015年1月至2016年9月本院行EUROIMMUN自身免疫抗體譜檢驗的所有患者9 585例。因診斷不明或重復(fù)送檢排除681例,最后納入研究8 904例,其中男3 287例,女5 617例,男女比例為1∶1.71。疾病分布情況:非AID 6 957例,SLE 668例,類風(fēng)濕關(guān)節(jié)炎489例,干燥綜合征141例,系統(tǒng)性硬化癥79例,肌炎/皮肌炎75例,混合型結(jié)締組織病58例,未分化結(jié)締組織病100例,自身免疫性肝炎45例,其他AID 292例。AID診斷均符合美國風(fēng)濕病協(xié)會或歐洲抗風(fēng)濕病聯(lián)盟診斷標(biāo)準(zhǔn)。根據(jù)是否SLE將所有患者分為兩大類,然后采用分層隨機(jī)抽樣原則,按4∶1比例在SLE患者和非SLE患者中分別抽樣,建立訓(xùn)練組和驗證組。
1.2方法 所有受試者于清晨空腹抽取靜脈血約5 mL,室溫放置30 min后3 000 r/min離心10 min。離心后,取血清進(jìn)行自身抗體檢測。所有檢測嚴(yán)格按照試劑說明書進(jìn)行操作,試劑均由德國EUROIMMUN醫(yī)學(xué)實驗診斷公司生產(chǎn)。ANA檢測采用間接免疫熒光法,結(jié)果以陰陽性表示。每一批次試驗均設(shè)立陽性和陰性對照,其余自身抗體檢測采用免疫印跡法,每一檢測膜條自帶質(zhì)量控制帶,印跡膜條經(jīng)EURO印跡法自動操作儀進(jìn)行判讀,結(jié)果以陰性(-)、可疑陽性(±)、+、++和+++表示。
1.3SLE預(yù)測模型的建立
1.3.1數(shù)據(jù)預(yù)處理 性別分類以數(shù)字代替(男=1,女=0);自身抗體譜檢測結(jié)果-、±、+、++、+++依次轉(zhuǎn)換為0、1、2、3、4。SLE與非SLE分別以“1”和“0”組表示。
1.3.2模型相關(guān)指標(biāo)的選擇 采用ROC分析訓(xùn)練組患者中性別、年齡以及16種自身抗體對SLE的應(yīng)用價值,選擇有診斷意義的指標(biāo)納入模型建立。
1.3.3決策樹模型 對訓(xùn)練組數(shù)據(jù)采用10倍交叉驗證建立最優(yōu)分類樹模型,增長方法選擇CHAID法,最大樹深度設(shè)為3,父節(jié)點中的最小個案設(shè)為100,子節(jié)點中的最小個案設(shè)為50,生成分類規(guī)則并保存。
1.3.4Logistic模型 對訓(xùn)練組數(shù)據(jù)采用二元Logistic回歸,建模方式選擇向后條件法,分類標(biāo)準(zhǔn)值設(shè)為0.5,最大迭代次數(shù)設(shè)為20次。通過對各變量在方程中的估計系數(shù)值進(jìn)行相關(guān)性分析,從而進(jìn)行各變量之間共線性診斷,對相關(guān)關(guān)系大于0.8的估計系數(shù)值進(jìn)行校正,建立Logistic回歸公式。
1.3.5BP人工神經(jīng)網(wǎng)絡(luò)(ANN)模型 訓(xùn)練模型:輸入層10個節(jié)點,輸出層1個節(jié)點,隱含層節(jié)點數(shù)根據(jù)經(jīng)驗公式計算,訓(xùn)練次數(shù)設(shè)定1 000次,學(xué)習(xí)率0.01,采用反向傳播算法,建立并儲存人工神經(jīng)網(wǎng)絡(luò)模型。
1.4最佳模型預(yù)測指標(biāo)數(shù)據(jù)庫的建立 計算上述3個模型分別在訓(xùn)練組和驗證組患者的預(yù)測概率(適用ANN和Logistic模型)或結(jié)果(適用決策樹模型)。在驗證組患者中采用Delong檢驗比較各個模型間預(yù)測概率或曲線下面積(AUC)的大小,以AUC最大且與其他模型差異有統(tǒng)計學(xué)意義者為最優(yōu)模型;在訓(xùn)練組患者中采用ROC曲線分析最佳模型的預(yù)測概率或結(jié)果,并根據(jù)分析輸出的靈敏度和特異度結(jié)果,結(jié)合本地區(qū)SLE患病率,計算每個預(yù)測結(jié)果下的驗后概率(PostP)、漏診率和誤診率[3],建立最優(yōu)模型的預(yù)測指標(biāo)數(shù)據(jù)庫,用作SLE臨床篩選和自身抗體譜報告解讀的依據(jù)。
1.5統(tǒng)計學(xué)處理 采用SPSS19.0和Medcalc12.7統(tǒng)計學(xué)軟件進(jìn)行處理分析。計數(shù)資料用百分?jǐn)?shù)表示。診斷效能采用ROC分析;診斷性能的差異采用Delong檢驗比較兩個ROC曲線AUC的大小,以P<0.05為差異有統(tǒng)計學(xué)意義。
2.1自身抗體譜診斷SLE的ROC分析 ROC分析結(jié)果顯示,性別、年齡、ANA、nRNP/Sm等13個項目對SLE具有診斷價值(P<0.001)。其AUC從大到小依次為ANA(0.889)、SSA(0.821)、nRNP/Sm(0.774)、Ro-52(0.735)、Histone(0.704)、Nuclesome(0.692)、Rib·P(0.685)、年齡(0.670)、ds-DNA(0.662)、性別(0.640)、Sm(0.638)、SSB(0.579)和AMA-M2(0.537)。見表1。
2.2決策樹模型 將上述ROC分析中具有診斷價值的13項指標(biāo)作為變量輸入,經(jīng)分類樹分析顯示,輸出的決策樹模型深度為3,葉節(jié)點數(shù)17,終端節(jié)點數(shù)11。進(jìn)入決策樹的變量包括共6種自身抗體:第1層為nRNP/Sm;第2層為Nuclesome、ANA和Sm;第3層為Rib·P和ds-DNA。疾病分類歸屬根據(jù)有序變量的值,逐漸展開成樹狀。
表1 自身抗體診斷SLE的AUC
2.3Logistic模型 經(jīng)Logistic回歸分析顯示,SLE預(yù)測相關(guān)指標(biāo)為性別、年齡、ANA、nRNP/Sm、Sm、SSA、ds-DNA,Nuclesome、Histone和Rib·P。各指標(biāo)間的相關(guān)系數(shù)均小于0.8,不存在變量的估計系數(shù)值間的共線性問題。方程各變量估計系數(shù)見表2,建立方程如下:Logit(P)=0.593×性別-0.031×年齡+1.085×ANA+0.447×nRNP/Sm+0.593×Sm+0.440×SSA+0.837×ds-DNA+0.656×Nuclesome+0.417×Histone+0.577×Rib·P-4.876。
2.4ANN模型 結(jié)合Logistic回歸分析結(jié)果,選擇性別、年齡、ANA、nRNP/Sm、Sm、SSA、ds-DNA、Nuclesome、Histone和Rib·P共10項與SLE相關(guān)性較高的變量作為ANN輸入節(jié)點,隱含層數(shù)13,輸出節(jié)點1個,學(xué)習(xí)率0.01時,訓(xùn)練網(wǎng)絡(luò)誤差相對最小,仿真計算效能最高。訓(xùn)練結(jié)果存儲為Excel模型文件以備應(yīng)用。
2.53個模型預(yù)測效能比較 Logistic模型、ANN模型和決策樹模型對驗證組的預(yù)測概率或結(jié)果經(jīng)ROC分析顯示,其AUC大小依次為0.963、0.932和0.862。經(jīng)Delong檢驗比較,Logistic模型對SLE預(yù)測價值顯著優(yōu)于ANN模型(z=3.240,P<0.01)和決策樹模型(z=5.735,P<0.01),而ANN模型顯著優(yōu)于決策樹模型(z=3.535,P<0.01)。進(jìn)一步分析表明,Logistic模型對SLE預(yù)測價值顯著優(yōu)于單項檢測AUC最大者ANA(z=6.729,P<0.001)。因此Logistic模型為預(yù)測SLE的優(yōu)選模型,盲法驗證結(jié)果顯示,其靈敏度為81.2%,特異性為97.6%,陽性預(yù)測值為73.5%,陰性預(yù)測值為98.4%,準(zhǔn)確度為96.4%。
2.6建立Logistic模型預(yù)測指標(biāo)數(shù)據(jù)庫 綿陽地區(qū)SLE患病率為6.97%(668/9 585)。根據(jù)該患病率及訓(xùn)練組中Logistic模型預(yù)測概率的ROC分析輸出結(jié)果,分別計算每個閾值下的PostP、誤診率和漏診率,建立Logistic模型預(yù)測指標(biāo)數(shù)據(jù)庫,并列舉了P為0.000 8、0.005 6、0.010 1、0.066 2、0.126 1、0.178 4、0.218 4、0.918 2、0.962 6和0.994 3時的模型,見表4。
表2 Logistic模型分析
表3 Logistic模型預(yù)測指標(biāo)數(shù)據(jù)庫
2.7建立SLE的Logistic模型預(yù)測系統(tǒng) 利用Excel表格的計算和查找匹配功能,將Logistic模型方程與預(yù)測指標(biāo)數(shù)據(jù)庫相聯(lián)系,建立SLE的Logistic模型預(yù)測系統(tǒng)。只要將檢驗結(jié)果數(shù)字化處理后輸入或?qū)?,該系統(tǒng)可自動計算預(yù)測概率,然后根據(jù)預(yù)測概率自動從預(yù)測指標(biāo)數(shù)據(jù)庫中檢索并輸出該患者被診斷為SLE的驗后概率和誤診率、漏診率,由此提高工作效率,增加預(yù)測模型的實用性。
SLE是AID中最具代表性的疾病,其發(fā)病機(jī)制復(fù)雜,臨床表現(xiàn)復(fù)雜多樣,早期發(fā)現(xiàn)、診斷和治療是降低SLE致殘或致死率最有效的方法。目前臨床上較多采用1997年美國風(fēng)濕病協(xié)會制定的SLE診斷標(biāo)準(zhǔn),但其靈敏度有限,不利于早期診斷。2012年,SLE國際臨床協(xié)作組(SLICC)提出的新標(biāo)準(zhǔn),雖提高了靈敏度,但特異性有所降低,易造成誤診[1]。既往報道多有采用不同自身抗體聯(lián)合檢測提高SLE檢出率[4-5],但少有依據(jù)自身抗體建立的篩選模型。有較多研究分別運用蛋白指紋圖譜技術(shù)和代謝組學(xué)方法建立SLE診斷模型[6-8],為SLE診斷和監(jiān)測開辟了新的途徑,但這兩種方法技術(shù)要求高,尚不能在臨床常規(guī)開展。
EUROIMMUN自身免疫抗體譜檢測目前在臨床實驗室應(yīng)用廣泛,其中多種自身抗體是診斷SLE或其他AID的重要參考指標(biāo)。本研究針對大樣本量檢測結(jié)果進(jìn)行數(shù)據(jù)挖掘,從實驗室角度建立SLE預(yù)測模型,不僅可提高SLE診斷效率還有助于無癥狀患者的早期發(fā)現(xiàn)并提前進(jìn)行免疫干預(yù)和制訂個體化治療方案,同時聯(lián)合本地區(qū)患病率建立預(yù)測指標(biāo)數(shù)據(jù)庫為自身抗體譜標(biāo)準(zhǔn)化解讀提供客觀依據(jù)。
本文中ROC分析顯示性別、年齡以及11種自身抗體各單一項目對SLE僅有中等或較低診斷價值,而聯(lián)合性別、年齡和多種自身抗體建立的3種數(shù)學(xué)模型,其AUC明顯增高,Logistic模型和ANN模型的AUC分別為0.963和0.932,均顯示較高的診斷效能。Logistic模型的回歸公式直觀且易于理解,計算簡單方便,變量納入合理,其診斷SLE的靈敏度為81.2%,特異度97.6%,準(zhǔn)確度96.4%,為本研究中的優(yōu)選模型。ANN模型較高的診斷效率與既往研究結(jié)果一致[9-11],表明其應(yīng)用于疾病的診斷有較高的實用價值,但其網(wǎng)絡(luò)訓(xùn)練的最佳原則、隱含層層數(shù)及節(jié)點的選取缺乏明確的指導(dǎo)方法,并且計算過程不易理解,在本研究中列為次選模型。決策樹模型在本研究中對疾病的診斷效率相對偏低,該模型易于理解和實現(xiàn),可判斷各變量的相對重要性,并能從中提取診斷規(guī)則,缺點在于對具有連續(xù)值的屬性預(yù)測比較困難,數(shù)據(jù)集類別太多時,誤差會增加[12]。
預(yù)測指標(biāo)數(shù)據(jù)庫中的PostP、誤診率和漏診率這3項性能指標(biāo)相較于直接輸出的模型概率而言,考慮了試驗靈敏度、特異度及患病率(即驗前概率)等因素的影響,用于輔助臨床診斷和解釋檢驗報告比較客觀、真實,為實驗室開展檢驗信息咨詢找到一個新途徑。但是該數(shù)據(jù)庫不具有通用性,因為驗后概率的計算受驗前概率的影響,而驗前概率在用于預(yù)測時需要患者的來源符合本研究所推斷的群體[13],因此本研究中的預(yù)測指標(biāo)數(shù)據(jù)庫只適用于綿陽市中心醫(yī)院的自身抗體譜報告解釋,其他地區(qū)可根據(jù)本地SLE患病率及相關(guān)檢測數(shù)據(jù)建立相應(yīng)的數(shù)據(jù)庫。
[1]仲人前,楊再興.幾種常見自身免疫性疾病診斷標(biāo)準(zhǔn)進(jìn)展及展望[J].實用檢驗醫(yī)師雜志,2014,6(2):65-69.
[2]李永哲.自身抗體檢測技術(shù)臨床推廣應(yīng)用和質(zhì)量保證工作中應(yīng)重視的問題[J].中華檢驗醫(yī)學(xué)雜志,2006,29(9):769-773.
[3]王開正,陶華林,王治國.檢驗醫(yī)學(xué)信息學(xué)[M].成都:四川科學(xué)技術(shù)出版社,2004:152-168.
[4]姜清明.ANA、抗ds-DNA抗體及抗ENA抗體在自身免疫性疾病診斷中的應(yīng)用[J].國際檢驗醫(yī)學(xué)雜志,2016,37(14):2011-2013.
[5]彭賽蛟,陶錫東,王敏.不同自身抗體聯(lián)合檢測在系統(tǒng)性紅斑狼瘡中的診斷價值[J].中國免疫學(xué)雜志,2014,30(6):831-833.
[6]張妍,劉曉敏,李麗,等.系統(tǒng)性紅斑狼瘡患者血清蛋白質(zhì)組學(xué)研究[J].標(biāo)記免疫分析與臨床,2014,21(2):184-187.
[7]黃卓春,石運瑩,蔡培,等.運用蛋白質(zhì)指紋圖譜技術(shù)建立系統(tǒng)性紅斑狼瘡診斷模式的研究[J].四川大學(xué)學(xué)報(醫(yī)學(xué)版),2009,40(3):499-503.
[8]彭賽蛟,陶錫東,王敏.不同自身抗體聯(lián)合檢測在系統(tǒng)性紅斑狼瘡中的診斷價值[J].中國免疫學(xué)雜志,2014,30(6):831-833.
[9]OMID P,SARA D,HEDIEH Z,et al.A diagnostic model for cirrhosis in patients with non-alcoholic fatty liver disease:an artificial neural network approach[J].Med J Islamic Repu,2014,28:116-121.
[10]BARIS S,MEHMET K,SONMEZ O,et al.Artificial neural network analysis for evaluating cancer risk in multinodular goiter[J].J Res Med Sci,2013,18(7):554-557.
[11]江永平,張勇,蔣寧,等.腫瘤標(biāo)志物聯(lián)合人工神經(jīng)網(wǎng)絡(luò)對大腸癌的預(yù)警[J].中國衛(wèi)生檢驗雜志,2015,25(3):371-373.
[12]牟冬梅,馮超,王萍.?dāng)?shù)據(jù)挖掘方法在醫(yī)學(xué)領(lǐng)域的應(yīng)用及SWOT分析[J].醫(yī)學(xué)信息學(xué)雜志,2015,36(1):53-57.
[13]楊尚瑜,楊梅,王開正,等.血糖三項檢驗的數(shù)據(jù)挖掘及應(yīng)用[J].山東醫(yī)藥,2014,54(13):16-18.