郭 曉,劉 穎,王 蕊,廉亞麗,杜 蕓*
(河北醫(yī)科大學(xué)第四醫(yī)院細(xì)胞學(xué)室,河北 石家莊050011)
宮頸癌(cervical carcinoma)發(fā)病率在全球女性患者惡性腫瘤中位居第3,在發(fā)展中國家位居第2[1]。2020年,全球女性中宮頸癌新發(fā)人數(shù)約60萬,死亡人數(shù)約34萬,我國新發(fā)病例約11萬,死亡病例約2.6萬。由于篩查手段的完善和早期干預(yù)治療,西方發(fā)達(dá)國家宮頸癌的發(fā)病率和死亡率有所下降;而我國近年來,宮頸癌的發(fā)病率和死亡率均逐年升高,而且出現(xiàn)年輕化趨勢[2]。
宮頸癌從癌前病變發(fā)展到原位癌、早期癌、浸潤癌是一個漫長的過程[3],是可以通過早期的措施進(jìn)行防控甚至消滅的癌癥,若能夠及時發(fā)現(xiàn)病變并得到有效治療,將對宮頸癌的防治取得明顯成效,患者的生活質(zhì)量得到明顯提高。宮頸液基薄層細(xì)胞學(xué)(thinprep cytologic test,TCT)檢測是目前宮頸篩查的首選方法[4],而我國注冊病理醫(yī)生不到2萬,有經(jīng)驗的細(xì)胞病理醫(yī)生更匱乏,加之醫(yī)生易受主觀因素、視覺疲勞等的影響,都極大地限制了宮頸癌篩查。
近年來,隨著人工智能(artificial intelligence,AI)的快速發(fā)展,其在醫(yī)學(xué)圖像領(lǐng)域得到廣泛應(yīng)用。AI通過分析有經(jīng)驗的病理醫(yī)生標(biāo)記的細(xì)胞的圖像,捕捉圖像中特征數(shù)據(jù),運(yùn)用一些算法將其融入到計算機(jī)中,可提高工作效率,減輕閱片人員工作量,為宮頸癌的篩查提供了可行性方案[5]。
以往已有一些研究[6-9]將AI作為病理診斷的輔助性工具進(jìn)行嘗試,多集中于將TCT標(biāo)本的病變細(xì)胞進(jìn)行標(biāo)記或者分為陰、陽性,缺乏對病變細(xì)胞的分級。湖南品信研發(fā)的吉米娜風(fēng)險分層的AI輔助診斷系統(tǒng)應(yīng)用視覺卷積神經(jīng)網(wǎng)絡(luò)結(jié)合細(xì)胞顯微成像分析技術(shù)依照TBS(the bethesda system)診斷系統(tǒng)(2014版)嘗試對病變細(xì)胞進(jìn)行分級診斷。本文試圖通過比較AI輔助閱片與人工閱片的可靠性指標(biāo),來探討該系統(tǒng)在宮頸癌篩查中的應(yīng)用價值。
收集2017年1月—2021年12月河北醫(yī)科大學(xué)第四醫(yī)院進(jìn)行的宮頸TCT標(biāo)本2 719例,同時進(jìn)行AI輔助閱片和人工閱片,其中有病理活檢結(jié)果標(biāo)本1 179例。
前期共收集宮頸液基薄層細(xì)胞學(xué)標(biāo)本15 946例,其中未見上皮內(nèi)病變或惡性細(xì)胞(negative for intraepithelial lesion or malignancy,NILM)11 097例,意義不明的非典型鱗狀細(xì)胞病變(atyical squamous cells of underermined signification,ASC-US)2 639例,不典型鱗狀細(xì)胞,不能排除高度上皮內(nèi)病變(atypical squamsus cells cannot exclude high-grade squamous intraepithelial lesion,ASC-H)280例,低度鱗狀上皮內(nèi)病變(low-grade squamous intraepithelial lesion,LSIL)1 637例,高度鱗狀上皮內(nèi)病變(highgrade squamous intraepithelial lesion,HSIL)287例,鱗狀細(xì)胞癌(squamous cell carcinoma,SCC)6例。對制片染色后的玻片采用20倍的物鏡進(jìn)行掃描、圖像拼接和分析形成全視野的數(shù)字化切片,由經(jīng)驗豐富的細(xì)胞病理醫(yī)生選擇10 343 976幅圖像進(jìn)行標(biāo)注異常細(xì)胞和正常細(xì)胞。采用Faster R-CNN+FPN目標(biāo)檢測的方法自動完成病變細(xì)胞的定位和分類,篩選其中有細(xì)胞的圖片輸入到局部圖像塊特征提取網(wǎng)絡(luò)得到塊特征,然后添加可學(xué)習(xí)的分類標(biāo)記特征,將所有的塊特征和分類標(biāo)記特征一并輸入到標(biāo)注的Transformer編碼器中,將Transformer輸出的分類標(biāo)記特征輸入到多層感知機(jī),最終按照TBS系統(tǒng)得到切片分類結(jié)果,包括定性結(jié)果(正常、異常和不滿意)和表示異常概率的嚴(yán)重程度分?jǐn)?shù)(標(biāo)記出異常細(xì)胞并給出異常細(xì)胞級別的置信區(qū)間),我們將識別的鱗狀細(xì)胞數(shù)少于5 000的玻片定義為不滿意。
1.3.1 TCT標(biāo)本取樣應(yīng)避開月經(jīng)期,采樣前24 h禁止用藥、沖洗及性生活。用擴(kuò)陰器充分暴露宮頸,將采樣刷深入宮頸鱗狀交界,施加壓力并順時針旋轉(zhuǎn)3~5周,將收集的細(xì)胞洗入盛有Thin-Prep細(xì)胞保存液的小瓶中,制作巴氏染色的1張液基涂片,由計算機(jī)掃描生成數(shù)字化切片后交給病理醫(yī)生。人工閱片由兩位經(jīng)驗豐富的細(xì)胞病理學(xué)醫(yī)生采用鏡下閱片方式采用雙盲法按照TBS系統(tǒng)進(jìn)行判讀,如遇到結(jié)果不一致時,由兩位醫(yī)生商議后決定。AI輔助閱片采用數(shù)字化切片智能閱片,系統(tǒng)按照TBS系統(tǒng)給出判定結(jié)果,細(xì)胞病理醫(yī)生根據(jù)系統(tǒng)標(biāo)記出病變細(xì)胞的分級以及分級置信度綜合評定后給出最終判定結(jié)果。
TBS系統(tǒng)診斷結(jié)果描述為:①NILM;②ASCUS;③ASC-H;④LSIL;⑤HSIL;⑥SCC。ASC-US及以上的涂片認(rèn)定為陽性涂片。
1.3.2 宮頸活檢對于細(xì)胞學(xué)陽性或細(xì)胞學(xué)正常臨床醫(yī)生高度懷疑有宮頸病變的患者進(jìn)行宮頸多點活檢。病理診斷根據(jù)2014年世界衛(wèi)生組織(World Health Organization,WHO)女性下生殖道腫瘤分類標(biāo)準(zhǔn),將病理結(jié)果分為正常或炎癥、低級別病變(LSIL,包括CINⅠ)、高級別病變(HSIL,包括CINⅡ、CINⅢ及原位癌)、早期浸潤癌及浸潤癌。
應(yīng)用SPSS 26.0統(tǒng)計軟件對數(shù)據(jù)進(jìn)行分析,采用Fisher精確法估計指標(biāo)的95%CI。兩種方法率的比較采用χ2檢驗,以P<0.05為差異有統(tǒng)計學(xué)意義。以活體組織病理學(xué)檢查結(jié)果為金標(biāo)準(zhǔn),評估AI輔助診斷系統(tǒng)與人工閱片在宮頸癌診斷方面的敏感性、特異性和符合率等指標(biāo)。
2 719例患者同時進(jìn)行AI輔助診斷系統(tǒng)和人工閱片檢查后,AI診斷為NILM者926例(34.1%),ASC-US者451例(16.6%),ASC-H者153例(5.6%),LSIL者836例(30.7%),HSIL及SCC者353例(13.0%);人工閱片診斷 為NILM者852例(31.3%),ASC-US者792例(29.1%),ASC-H者116例(4.2%),LSIL者710例(26.1%),HSIL及SCC者249例(9.0%)。
1 179例患者進(jìn)行了陰道鏡下宮頸活檢,病理診斷為正常及炎癥者497例(42.2%),低級別病變CINⅠ者185例(15.7%),高級別病變及癌者497例(42.2%),其中包括CINⅡ者146例(12.4%)、CINⅢ及癌者351例(29.8%)。
兩種閱片方式的分級分布見表1,AI輔助閱片比人工閱片更有可能將玻片分類為ASU-H、HSIL及以上級別,人工閱片更有可能將玻片分類為ASC-US。有1 858例(825例NILM、320例ASC-US、474例LSIL、54例ASC-H和185例HSIL及癌)患者被AI輔助閱片和人工閱片分類為同一等級。在不同診斷分級的病例中,101例經(jīng)AI輔助閱片診斷為NILM的患者被人工閱片分類為ASC-US,27例(8例ASC-US、16例LSIL、2例ASC-H和1例HSIL)患者經(jīng)AI輔助閱片歸類為異常細(xì)胞學(xué)被人工閱片分類為NILM。AI輔助閱片與人工閱片的總體符合率為68.3%[95%CI(66.6%,70.1%)],相應(yīng)的Kappa值為0.578[95%CI(0.556,0.600)],兩者閱片方法基本一致。
表1 AI輔助閱片和人工閱片的宮頸細(xì)胞學(xué)分級分布及一致性分析
AI輔助閱片和人工閱片的組織病理學(xué)上的分布見表2。有2例CINII級患者被AI輔助閱片歸為正常,1例CINⅢ級患者被人工閱片歸為正常。人工閱片可能比AI輔助閱片更可能將患有高級別病變及癌的患者歸類為ASC-US或LSIL。
表2 AI輔助閱片和人工閱片的宮頸細(xì)胞學(xué)分級在活檢組織病理學(xué)中的分布
AI輔助閱片診斷為低級別病變及炎癥的準(zhǔn)確率為87.8%(643/732),見表3,有12.2%(89/732)的高級別病變及癌的患者被漏診,人工閱片診斷為低級別病變及炎癥的準(zhǔn)確率為71.6%(648/905),有28.4%(257/905)的高級別病變及癌的患者被漏診,兩者比較差異有統(tǒng)計學(xué)意義(P<0.01),AI輔助閱片在診斷低級別病變及炎癥的準(zhǔn)確率高于人工閱片。
表3 AI輔助閱片和人工閱片的準(zhǔn)確性分析
AI輔助閱片診斷為高級別病變及癌的準(zhǔn)確率為91.3%(408/447),有8.7%(39/447)的患者診斷過高,人工閱片診斷為高級別病變及癌的準(zhǔn)確率為87.6%(240/274),有12.4%(34/274)的患者診斷過高,兩者比較,差異無統(tǒng)計學(xué)意義(P=0.111),AI輔助閱片在診斷高級別病變及癌的準(zhǔn)確率與人工閱片相當(dāng)。
在診斷高級別病變及癌方面,AI輔助閱片敏感性為82.1%(408/497),高于人工閱片的敏感性48.3%(240/497),AI輔助閱片特異度為94.3%(643/682),略低于人工閱片的特異度95.0%(648/682)。AI輔助閱片的ROC曲線下面積為0.882,大于人工閱片的ROC曲線下面積0.717,兩者比較差異有統(tǒng)計學(xué)意義(P<0.01),AI輔助閱片在診斷高級別病變及癌的方面比人工閱片更有價值(見圖1)。
圖1 AI輔助閱片和人工閱片診斷宮頸高級別病變及癌的ROC曲線
2名細(xì)胞病理醫(yī)師閱片2 719例,共耗時227 h,AI輔助閱片僅用136 h完成閱片工作,節(jié)省了91 h的時間。
早在2009年,國家衛(wèi)生部和婦女聯(lián)合會在全國農(nóng)村婦女和城鎮(zhèn)家庭困難婦女中開啟了兩癌(乳腺癌和宮頸癌)的篩查工作。十多年過去了,雖然全國宮頸癌的篩查人數(shù)達(dá)到1億人次,但我國的宮頸癌篩查覆蓋范圍和人數(shù)仍遠(yuǎn)遠(yuǎn)滿足不了需求,究其原因可能有以下幾點:①我國人口眾多,篩查工作量巨大;②不同地區(qū)經(jīng)濟(jì)水平差異,導(dǎo)致“兩癌”篩查開展的差異;③宮頸液基薄層細(xì)胞學(xué)(thinprep cytologic test,TCT)檢測是目前宮頸篩查的首選方法,而病理醫(yī)生人數(shù)匱乏,加之醫(yī)生易受主觀因素、視覺疲勞等的影響,都極大地限制了宮頸癌篩查。
2022年1月18日,國家衛(wèi)生健康委又一次印發(fā)了《宮頸癌篩查工作方案》,將宮頸癌篩查納入了政府民生工程,其中提出明確目標(biāo),到2025年底,實現(xiàn)適齡婦女宮頸癌篩查率達(dá)到50%以上。同時《宮頸癌篩查工作方案》中提到可以通過創(chuàng)新宮頸癌篩查模式,來提高宮頸癌篩查的早診率。
近年來,隨著AI的快速發(fā)展,其在醫(yī)學(xué)圖像領(lǐng)域得到廣泛應(yīng)用。人們開始探索AI在細(xì)胞病理學(xué)領(lǐng)域的應(yīng)用,也使得我們向?qū)m頸癌的自動篩查邁進(jìn)了一步[5]。1992年,NSI開發(fā)了第一個商業(yè)化的自動輔助系統(tǒng)PAPNET[6],該系統(tǒng)采用神經(jīng)網(wǎng)絡(luò)接受目標(biāo)圖像,并根據(jù)其與訓(xùn)練的異常細(xì)胞的相似性,用來核查可能遺漏的宮頸上皮異常。之后2004年和2008年開發(fā)的ThinPrep成像儀[7]和FocalPoint GS成像系統(tǒng)[8]用基于多種細(xì)胞特征的專用算法來識別可疑視野,由細(xì)胞學(xué)家進(jìn)行核查。Zhang等[9]利用卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)將宮頸細(xì)胞學(xué)圖像分為良惡性,準(zhǔn)確率達(dá)98%。之前的AI讓病理醫(yī)生更多的精力集中于陽性和可疑細(xì)胞,而不是尋找細(xì)胞,一定程度上降低了病理醫(yī)生工作強(qiáng)度,緩解了醫(yī)療資源的緊張。但是相較于標(biāo)記出病變細(xì)胞,對病變細(xì)胞的分級診斷更具有意義。分級診斷能夠避免醫(yī)生的主觀判斷,有利于診斷標(biāo)準(zhǔn)的統(tǒng)一,真正實現(xiàn)宮頸癌篩查的自動化,推進(jìn)宮頸癌的大規(guī)模篩查的推廣,使病人能夠早發(fā)現(xiàn)早治療。本研究采用的AI輔助閱片對前人的技術(shù)進(jìn)行改進(jìn)和升級,將視覺卷積神經(jīng)網(wǎng)絡(luò)與細(xì)胞顯微成像分析技術(shù)結(jié)合起來,直接用目標(biāo)檢測的方法自動完成病變細(xì)胞的定位和分類。
本研究中發(fā)現(xiàn)AI輔助閱片和人工閱片在細(xì)胞學(xué)分級中能夠達(dá)到基本一致,說明AI輔助閱片的診斷效能與人工閱片相當(dāng)。AI輔助閱片在診斷低級別病變及炎癥的準(zhǔn)確性高于人工閱片,說明AI輔助閱片能夠早期發(fā)現(xiàn)病變且診斷準(zhǔn)確性高。AI輔助閱片與人工閱片在診斷高級別病變及癌的準(zhǔn)確性均較高,因此臨床醫(yī)生對細(xì)胞學(xué)發(fā)現(xiàn)高級別病變及癌的患者即使沒有臨床癥狀,也應(yīng)進(jìn)一步采取措施,以免延誤病情。在對診斷高級別病變及癌的研究中發(fā)現(xiàn)AI輔助閱片的敏感性高于人工閱片,AI輔助閱片的ROC曲線下面積大于人工閱片的ROC曲線下面積,說明AI輔助閱片對于高級別病變及癌的診斷價值更高。在收集的2 719例標(biāo)本中,AI輔助閱片診斷為ASC-US 451例,人工閱片診斷ASC-US 792例,AI輔助閱片降低了不確定性細(xì)胞比例,使分類更加精確。我們對AI輔助閱片漏診的2例CINⅡ患者的玻片進(jìn)行了復(fù)診,發(fā)現(xiàn)可能由于染色不充分、制片不良等原因造成漏診,而人工閱片造成的1例CINⅢ級漏診,可能由于病變細(xì)胞不典型造成。在閱片時間方面,AI輔助閱片比人工閱片節(jié)省了91 h,且AI輔助系統(tǒng)可24 h連續(xù)閱片,能夠有效縮短閱片時間,同時可避免人為技能水平、疲勞等因素,有效提高宮頸癌的篩查效率。
本研究的優(yōu)點,首先是將AI輔助閱片與人工閱片在分級診斷方面進(jìn)行了比較,其次以組織學(xué)為參考,展示了AI輔助閱片在宮頸癌初篩或分診中的應(yīng)用價值。缺點是未將腺上皮病變納入研究,在TBS系統(tǒng)分級診斷中是不完整的,其次在染色不佳、制片不良等情況下可能會造成漏診。
綜上所述,AI輔助診斷系統(tǒng)能夠大幅提升宮頸癌篩查的效率,減少病理醫(yī)生的工作量,能夠避免病理醫(yī)生的主觀因素,提高診斷的準(zhǔn)確性,減少誤診和漏診,其應(yīng)用前景廣闊,值得推廣。