劉昊,莫堅
復(fù)發(fā)性外陰陰道假絲酵母菌病(recurrent vulvovaginal candidiasis,RVVC)嚴(yán)重影響患者的生活質(zhì)量、心理健康和性生活[1]。研究表明,長時間的陰道菌群紊亂,可引起人乳頭瘤病毒(human papillomavirus,HPV)感染和持續(xù)不消退,而進(jìn)展為宮頸癌[2]。現(xiàn)階段臨床將HPV病毒檢測作為宮頸病變的常規(guī)篩查方法,但針對宮頸病變的高風(fēng)險患者,臨床缺乏一種簡單快速、科學(xué)客觀的識別方法或預(yù)測手段,而且目前影響HR-HPV感染并阻止疾病進(jìn)展為癌前病變的因素有哪些,國內(nèi)外尚未達(dá)成共識。Logistic回歸是采用線性模型,尋找疾病危險因素及預(yù)測疾病風(fēng)險的常用分析方法,但對于當(dāng)自變量與因變量為非線性關(guān)系時,預(yù)測效果不夠理想[3]。依托大數(shù)據(jù)學(xué)習(xí)可根據(jù)多項生理指標(biāo)預(yù)測RVVC患者宮頸病變發(fā)生風(fēng)險,與傳統(tǒng)統(tǒng)計學(xué)方法相比,多層人工神經(jīng)網(wǎng)絡(luò)可以高效處理更多醫(yī)學(xué)數(shù)據(jù),且可使用函數(shù)近似方法擬合復(fù)雜的函數(shù),解決非線性分類問題,是RVVC患者感染HR-HPV的一種低成本輔助性風(fēng)險評估工具。由此,本研究依據(jù)多項指標(biāo)構(gòu)建Logistic回歸及多層人工神經(jīng)網(wǎng)絡(luò)模型,預(yù)測RVVC患者發(fā)生宮頸病變的風(fēng)險,并比較兩種模型的性能,報道如下。
選取2016年1月至2020年12月于南寧市第一人民醫(yī)院婦科門診就診,明確診斷為RVVC的152例患者,作為研究對象,行陰道分泌物檢查。納入標(biāo)準(zhǔn):① RVVC患者:既往患單純性外陰陰道假絲酵母菌病,經(jīng)治療后,臨床癥狀和體征消失,假絲酵母菌檢查陰性后,再次出現(xiàn)癥狀,經(jīng)假絲酵母菌檢查又為陽性,1年內(nèi)發(fā)作 4次或以上;② 有性生活史女性;③ 年齡18~45歲;④ 此次就診時無陰道炎臨床癥狀;⑤ 無宮頸手術(shù)史及HPV治療史;⑥ 此前疾病處于活動期未用藥或緩解期避開局部用藥階段。排除標(biāo)準(zhǔn):① 有自身免疫性疾病者;② 妊娠期或月經(jīng)期;③ 合并滴蟲、衣原體、淋球菌、HIV等其他性傳播疾病者;④ 近1個月連續(xù)服用抗生素或其他特殊藥物者;⑤ 72 h內(nèi)有性生活、陰道沖洗或陰道放藥者。⑥ 既往有反復(fù)陰道炎癥,但不符合RVVC標(biāo)準(zhǔn)者。⑦ TCT異常,為ASCUS及以上宮頸病變患者。最終符合入組標(biāo)準(zhǔn)的患者152例,依據(jù)HPV E6/E7mRNA檢查結(jié)果,以HPV E6/E7陽性患者為觀察組,以HPV E6/E7陰性患者為對照組,觀察組患者65例,對照組患者87例。本研究經(jīng)南寧市第一人民醫(yī)院倫理委員會審核批準(zhǔn),所有患者對本研究知情并簽署知情同意書。
收集患者年齡、RVVC病程等一般資料及陰道分泌物的微生態(tài)指標(biāo),如清潔度、乳酸桿菌、加德納菌及雜菌、乙酰氨基葡糖苷酶、唾液酸苷酶、過氧化氫、白細(xì)胞脂酶、pH值等實驗室檢查指標(biāo)。
采用單因素方差分析篩選出與宮頸病變相關(guān)的變量作為自變量,以是否存在宮頸病變(是=1,否=0)為因變量,進(jìn)行多因素Logistic回歸分析。
通過R語言利用neuralnet包構(gòu)建由1個輸入層、多個隱含層及1個輸出層組成的多層人工神經(jīng)網(wǎng)絡(luò)分類模型(圖1),該模型是一種深度學(xué)習(xí)模型,可將輸入變量映射到高維非線性空間、學(xué)習(xí)到多個輸入變量之間的復(fù)雜相關(guān)性,進(jìn)而提高預(yù)測準(zhǔn)確性[4]。
圖1 多層人工神經(jīng)網(wǎng)絡(luò)分類模型示意圖
1.4.1 模型入選變量 納入患者年齡、RVVC病程、陰道分泌物清潔度、乳酸桿菌、加德納菌及雜菌、乙酰氨基葡糖苷酶、唾液酸苷酶、過氧化氫、白細(xì)胞脂酶、pH值10個指標(biāo)作為多層人工神經(jīng)網(wǎng)絡(luò)的輸入層,輸入層各指標(biāo)定義及賦值(表1),輸出變量為患者檢查結(jié)果是否屬于HPV E6/E7陽性。
表1 各指標(biāo)定義及賦值
1.4.2 數(shù)據(jù)預(yù)處理 本研究基于多變量方法進(jìn)行數(shù)據(jù)分析,根據(jù)研究對象是否屬于HPV E6/E7陽性進(jìn)行分類。數(shù)據(jù)集包括10個輸入變量和2個輸出變量,其中有2個輸入變量部分樣本存在數(shù)據(jù)缺失,缺失率小于0.5%,缺失值以0位填補(bǔ)。通過隨機(jī)數(shù)字法選取數(shù)據(jù)集的2/3為訓(xùn)練集,1/3為測試集,訓(xùn)練集共102例,用于模型訓(xùn)練,建立預(yù)測模型;測試集50例,用于模型測試,檢驗?zāi)P偷念A(yù)測效能。
兩組患者病程、乳酸桿菌、加德納菌及雜菌、乙酰氨基葡糖苷酶、唾液酸苷酶、過氧化氫、白細(xì)胞脂酶、pH值等指標(biāo)比較,差異均有統(tǒng)計學(xué)意義(P<0.05),詳見表2。
將單因素分析篩選出的特征變量作為自變量,以是否存在宮頸病變(是=1,否=0)為因變量,進(jìn)行多因素Logistic回歸分析,結(jié)果顯示,加德納菌及雜菌、白細(xì)胞脂酶是RVVC患者宮頸病變的危險因素,乳酸桿菌、過氧化氫是保護(hù)因素,詳見表3。
表3 多因素Logistic回歸分析
圖2 預(yù)測RVVC患者宮頸病變發(fā)生風(fēng)險的多層人工神經(jīng)網(wǎng)絡(luò)分類結(jié)構(gòu)圖
圖3 模型中各指標(biāo)重要性
訓(xùn)練集和測試集中觀察組與對照組患者病程、清潔度、乳酸桿菌、加德納菌及雜菌、乙酰氨基葡糖苷酶、唾液酸苷酶、過氧化氫、白細(xì)胞脂酶、pH值等指標(biāo)比較,差異有統(tǒng)計學(xué)意義(P<0.05)。
本研究中訓(xùn)練樣本102例,測試樣本50例,對數(shù)據(jù)分類的正確率均達(dá)到98.26%,模型的診斷參數(shù)均為96.12%,說明所構(gòu)建的多層神經(jīng)網(wǎng)絡(luò)預(yù)測模型的效果很好。模型展示圖見圖2。
圖3為多層人工神經(jīng)網(wǎng)絡(luò)分類模型中各指標(biāo)的重要性排序,根據(jù)權(quán)重大小,特征重要度排名前4的輸入變量分別是乳酸桿菌、過氧化氫、加德納菌及雜菌、白細(xì)胞脂酶。
兩種模型的預(yù)測結(jié)果見下頁圖4,Logistic 回歸模型ROC曲線下面積為0.833,靈敏度為0.802,特異度為0.808,在保證模型的穩(wěn)定性和泛化性的前提下,最終確定多層人工神經(jīng)網(wǎng)絡(luò)分類模型ROC曲線下面積為0.987,靈敏度為0.895,特異度為0.889,多層人工神經(jīng)網(wǎng)絡(luò)分類模型的預(yù)測效能高于Logistic回歸模型。
女性生殖道是重要的微生態(tài)區(qū)域,是由陰道正常解剖結(jié)構(gòu)、陰道微生物群、局部免疫系統(tǒng)和內(nèi)分泌調(diào)節(jié)系統(tǒng)等組成的相對平衡復(fù)雜體系,是人體重要的生物屏障之一。已有研究證實,HPV感染與陰道微生態(tài)菌群構(gòu)成有關(guān),陰道菌群平衡失調(diào)可能增強(qiáng)HPV病毒的表達(dá),從而誘發(fā)宮頸病變[5]。RVVC屬于陰道菌群失衡的范疇,病情反復(fù)難以治愈,長時間的陰道微生態(tài)紊亂,可導(dǎo)致陰道微環(huán)境pH值升高,延長了宮頸上皮細(xì)胞的化生期,導(dǎo)致上皮細(xì)胞發(fā)育不良,為HPV感染創(chuàng)造良好的條件,增加宮頸病變和宮頸癌風(fēng)險[6]。目前臨床主要通過宮頸液基細(xì)胞學(xué)檢查、進(jìn)一步病理活檢及頸管搔刮明確診斷宮頸病變和宮頸癌[7],尚缺乏高危HPV陽性患者宮頸病變之前的預(yù)測方法。傳統(tǒng)的Logistic回歸模型難以處理高維數(shù)據(jù),且對數(shù)據(jù)分布有較嚴(yán)格的假設(shè),數(shù)據(jù)不滿足條件時,預(yù)測精度較低。多層人工神經(jīng)網(wǎng)絡(luò)分類模型多元共線性不敏感,可根據(jù)假設(shè)檢驗結(jié)果及臨床經(jīng)驗納入輸入變量甚至將個體有關(guān)信息全部納入,有利于減少個體差異,在尋找高效性預(yù)測指標(biāo)中可發(fā)揮重要作用。
本研究發(fā)現(xiàn),加德納菌及雜菌、白細(xì)胞脂酶是RVVC患者宮頸病變的危險因素,乳酸桿菌和過氧化氫是保護(hù)因素。女性生殖道是開放性腔道,寄居著多種病原體,正常情況下以乳酸桿菌為優(yōu)勢菌,較為常見的有卷曲乳桿菌、加氏乳桿菌、詹氏乳桿菌和惰性乳桿菌,該菌群占陰道細(xì)菌的90%左右[8],其對維持陰道局部正常微環(huán)境具有重要作用。健康女性的陰道清潔度為Ⅰ~Ⅱ度,pH值為3.8~4.4,乳酸桿菌以糖原為媒介形成乳酸,釋放過氧化氫,維持生殖道酸性環(huán)境,抑制其他細(xì)菌的生長,進(jìn)而維持陰道處于正常清潔度及酸性環(huán)境。此外,乳酸桿菌表面存在的黏附素可定植于生殖道上皮細(xì)胞,并通過刺激機(jī)體免疫防御來抵抗外來病原體的入侵[9]。古萍等[10]發(fā)現(xiàn)隨著乳酸桿菌數(shù)目的增多,HPV-DNA的載量逐漸減少,乳酸桿菌產(chǎn)生的過氧化氫與蛋白抑制劑結(jié)核抑制了HR-HPV的生長。RVVC發(fā)病使某種專性厭氧菌,例如加德納菌、普雷沃菌、阿托波菌、巨型球菌和纖毛菌成為優(yōu)勢菌異常增生,乳酸桿菌功能受到影響,導(dǎo)致過氧化氫釋放減少,破壞局部免疫微環(huán)境的生物屏障,利于HR-HPV誘發(fā)宮頸的系列演變。此外,在女性陰道中加德納菌相較于其他厭氧雜菌,表現(xiàn)出更高的細(xì)胞毒性,其可通過形成生物膜、產(chǎn)生陰道溶解素、 唾液酸酶、誘導(dǎo)上皮脫落等機(jī)制影響疾病結(jié)局[3]。白細(xì)胞脂酶、唾液酸苷酶與HR-HPV持續(xù)感染和宮頸病變的嚴(yán)重程度密切相關(guān)[11],白細(xì)胞脂酶陽性提示陰道分泌物中有大量多核白細(xì)胞被破壞,陰道黏膜受損,存在炎癥反應(yīng)。有研究表明,唾液酸苷酶在腫瘤細(xì)胞的生存中有重要地位,其高水平表達(dá)有利于腫瘤細(xì)胞的凋亡,這一發(fā)現(xiàn)在未來可能成為宮頸癌治療的潛在靶點[12]。
注:A為Logistic回歸模型 B為多層人工神經(jīng)網(wǎng)絡(luò)分類模型
與傳統(tǒng)的統(tǒng)計學(xué)方法對數(shù)據(jù)分布和類型要求對比,多層人工神經(jīng)網(wǎng)絡(luò)分類模型具有很強(qiáng)的非線性映射能力,不需要考慮自變量是否滿足正態(tài)性和變量間獨立等條件,還可以根據(jù)模擬數(shù)學(xué)理論對復(fù)雜無規(guī)律的大規(guī)模樣本進(jìn)行量化處理,模型隱藏層數(shù)量增多時可將輸入變量轉(zhuǎn)化到復(fù)雜的非線性空間,以此得到有效向量,分類性能更優(yōu)[13-14]。本研究Logistic 回歸模型預(yù)測RVVC發(fā)生宮頸病變ROC曲線下面積為0.833,靈敏度為0.802,特異度為0.808,多層人工神經(jīng)網(wǎng)絡(luò)模型預(yù)測RVVC發(fā)生宮頸病變的ROC曲線下面積為0.987,靈敏度為0.895,特異度為0.889,多層人工神經(jīng)網(wǎng)絡(luò)模型預(yù)測效能高于Logistic回歸模型,取得令人滿意的效果。本研究多層人工神經(jīng)網(wǎng)絡(luò)的輸入層納入的10個指標(biāo)(年齡、病程、清潔度、乳酸桿菌、加德納菌及雜菌、乙酰氨基葡糖苷酶、唾液酸苷酶、過氧化氫、白細(xì)胞脂酶、pH值)均為婦科陰道微生態(tài)檢測中的重要指標(biāo),在平時的檢查中,即可展開宮頸病變和宮頸癌的預(yù)測,該預(yù)測模型適于在臨床上推廣應(yīng)用。
綜上所述,本研究構(gòu)建的多層人工神經(jīng)網(wǎng)絡(luò)分類模型相較于Logistic回歸模型,預(yù)測效能更高,分類性能優(yōu)良,結(jié)果證實加德納菌及雜菌、白細(xì)胞脂酶是RVVC患者宮頸病變的危險因素,乳酸桿菌和過氧化氫是保護(hù)因素。但由于本研究樣本量有限,加之?dāng)?shù)據(jù)的復(fù)雜性和個體差異性,可能導(dǎo)致了過擬合或分類性能下降,今后仍需進(jìn)一步探究。