張小松,杜 蕓,董 燕,畢 蕙
(1.北京大學(xué)第一醫(yī)院婦產(chǎn)科,北京 100034;2.河北省腫瘤醫(yī)院細(xì)胞學(xué)室,河北 石家莊 050011;3.中國(guó)婦幼保健協(xié)會(huì)人工智能項(xiàng)目辦公室,北京 100089)
宮頸癌是威脅女性健康的主要惡性腫瘤之一,據(jù)統(tǒng)計(jì)2020年全球新發(fā)宮頸癌60.4萬例,死亡34.2萬例,中、低收入國(guó)家是高發(fā)地區(qū)[1]。2016年我國(guó)宮頸癌新發(fā)病例11.93萬例,死亡病例3.72萬例[2],位居女性惡性腫瘤死亡順位第6位[3]。
宮頸癌篩查是宮頸癌防控的主要措施之一,隨著人工智能(artificial intelligence,AI)技術(shù)的發(fā)展,AI輔助宮頸細(xì)胞學(xué)診斷技術(shù)已經(jīng)開始在宮頸癌篩查工作中使用,為促進(jìn)宮頸癌篩查工作的開展提供了更多的選擇性。為進(jìn)一步提高和規(guī)范AI輔助宮頸細(xì)胞學(xué)診斷技術(shù)的工作質(zhì)量和應(yīng)用,2023年12月中國(guó)婦幼保健協(xié)會(huì)和中國(guó)婦幼保健協(xié)會(huì)婦女病防治專業(yè)委員會(huì)共同發(fā)布了《人工智能輔助宮頸細(xì)胞學(xué)診斷技術(shù)的應(yīng)用及質(zhì)量控制專家共識(shí)》(以下簡(jiǎn)稱《共識(shí)》)[4]。本文旨在對(duì)《共識(shí)》進(jìn)行解讀,便于相關(guān)專業(yè)人員在工作中進(jìn)一步理解和實(shí)踐。
宮頸癌作為威脅女性健康的主要惡性腫瘤,其主要病因已經(jīng)明確,即高危型人乳頭瘤病毒(high-risk human papillomavirus,HR-HPV)的持續(xù)感染。目前,隨著HPV預(yù)防性疫苗的應(yīng)用,我國(guó)宮頸癌防控已經(jīng)逐步形成了三級(jí)預(yù)防體系:一級(jí)預(yù)防措施包括健康教育和HPV疫苗接種,二級(jí)預(yù)防措施是宮頸癌篩查,三級(jí)預(yù)防措施主要是治療宮頸浸潤(rùn)癌[5]。宮頸癌篩查仍然是宮頸癌防控的主要措施之一。宮頸癌篩查方法主要包括HPV檢測(cè)和宮頸細(xì)胞學(xué)檢查,兩種方法既是初篩方法,也是分流方法。宮頸細(xì)胞學(xué)檢查的質(zhì)量在宮頸癌篩查工作中十分重要,其主要與細(xì)胞學(xué)醫(yī)生的能力和水平有關(guān)。由于我國(guó)幅員遼闊,不同地區(qū)醫(yī)療水平不同,細(xì)胞學(xué)醫(yī)生水平參差不齊,尤其是基層地區(qū),細(xì)胞學(xué)醫(yī)生的數(shù)量和能力有所欠缺,影響了當(dāng)?shù)貙m頸癌篩查的質(zhì)量[6-7]。
2020年11月,世界衛(wèi)生組織(World Health Organization,WHO)正式發(fā)布了全球首個(gè)消除宮頸癌的戰(zhàn)略,即《從公共衛(wèi)生問題中加速消除宮頸癌的全球戰(zhàn)略》,提出了2030年全球?qū)m頸癌防控“90-70-90”目標(biāo),其中目標(biāo)之一是70%的女性在35歲和45歲各接受一次高質(zhì)量的宮頸癌篩查[8]。我國(guó)積極響應(yīng)WHO“加速消除宮頸癌”的全球戰(zhàn)略,并于2023年由10個(gè)部委聯(lián)合發(fā)布了《加速消除宮頸癌行動(dòng)計(jì)劃(2023—2030年)》[9],也提出我國(guó)宮頸癌篩查的目標(biāo)是2025年適齡婦女宮頸癌篩查率達(dá)到50%,2030年達(dá)到70%。相關(guān)研究顯示,2018—2019年35~64歲女性宮頸癌篩查的覆蓋率僅為36.8%[10],距70%的篩查目標(biāo)仍有較大差距。因此,為實(shí)現(xiàn)上述目標(biāo),宮頸癌篩查的質(zhì)量和效率需要進(jìn)一步提升。
在此背景下,AI輔助宮頸細(xì)胞學(xué)診斷技術(shù)的發(fā)展及應(yīng)用,有望成為促進(jìn)我國(guó)高質(zhì)量高效率開展宮頸癌篩查工作的措施之一。我國(guó)《加速消除宮頸癌行動(dòng)計(jì)劃(2023—2030年)》中也提出探索人工智能、互聯(lián)網(wǎng)等新技術(shù)應(yīng)用于宮頸癌篩查和診療服務(wù)[9]。《共識(shí)》發(fā)布主要的目的就是在當(dāng)前形勢(shì)下,為AI輔助宮頸細(xì)胞學(xué)診斷技術(shù)在實(shí)際工作中的應(yīng)用及質(zhì)量控制提供參考。
在《共識(shí)》中對(duì)于AI輔助宮頸細(xì)胞學(xué)診斷的定義進(jìn)行了闡述。首先,AI輔助宮頸細(xì)胞學(xué)診斷系統(tǒng)仍然屬于病理學(xué)圖像診斷,且屬于醫(yī)療器械范疇。我國(guó)對(duì)于AI醫(yī)療器械也有相關(guān)定義,是指“基于醫(yī)‘療器械數(shù)據(jù)’,采用人工智能技術(shù)實(shí)現(xiàn)其預(yù)期用途(即醫(yī)療用途)的醫(yī)療器械”[11],從其定義中可以理解AI醫(yī)療器械既包括“AI獨(dú)立軟件”醫(yī)療器械,也包括“AI組件”醫(yī)療器械,后者也稱醫(yī)療器械嵌入式軟件[12]。AI輔助宮頸細(xì)胞學(xué)診斷技術(shù)包括軟件和硬件部分,主要是由掃描工作站、數(shù)字診斷和數(shù)據(jù)存儲(chǔ)三部分組成,因此屬于含有病理圖像AI分析軟件的醫(yī)療器械?!豆沧R(shí)》還參考了其他相關(guān)專家共識(shí)[13]對(duì)AI輔助宮頸細(xì)胞學(xué)診斷的定義。
需要注意的是目前AI輔助宮頸細(xì)胞學(xué)診斷技術(shù)還是屬于輔助診斷,沒有診斷權(quán)限,意味著AI輔助細(xì)胞學(xué)是篩選出陽性或陰性細(xì)胞,但最終需要細(xì)胞學(xué)醫(yī)生進(jìn)行診斷,并出具報(bào)告。
AI輔助宮頸細(xì)胞學(xué)診斷系統(tǒng)需要準(zhǔn)確分割細(xì)胞核,通過特征提取和分類來判斷細(xì)胞是否有病變。目前主要的核分割算法包括簡(jiǎn)單線性迭代聚類(simple linear iterative clustering,SLIC)方法、基于區(qū)域的分割方法、卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)和聚類方法[14]等。隨著AI輔助宮頸細(xì)胞學(xué)診斷技術(shù)的開展,相關(guān)應(yīng)用場(chǎng)景的探討也日益增多。
王娜等[15]研究者對(duì)于202例宮頸液基薄層細(xì)胞學(xué)標(biāo)本采用多流CNN細(xì)胞分類算法進(jìn)行判讀,并與人工判讀結(jié)果進(jìn)行比較,結(jié)果顯示多流CNN二分類和多分類算法的符合率分別為68.13%和73.08%。二分類算法的靈敏度、特異度、陰性預(yù)測(cè)值分別為100.00%、62.09%、100.00%;多分類算法的特異度相對(duì)較高,未見上皮內(nèi)病變細(xì)胞或惡性細(xì)胞(negative for intraepithelial lesion or malignancy,NILM)、無明確診斷意義的不典型鱗狀細(xì)胞(atypical squamous cells of undetermined significance,ASC-US)、低級(jí)別鱗狀上皮內(nèi)病變(low-grade squamous intraepithelial lesion,LSIL)、高級(jí)別鱗狀上皮內(nèi)病變(high-grade squamous intraepithelial lesion,HSIL)、非典型鱗狀細(xì)胞不除外鱗狀上皮內(nèi)高度病變(atypical squamous cells-cannot exclude HSIL,ASC-H)分別是96.55%、73.75%、98.29%、98.90%、99.45%。Bao等[16]基于188 542例宮頸樣本,深度學(xué)習(xí)模型診斷HSIL及以上病變的靈敏度為90.10%,且發(fā)現(xiàn)模型閱片水平相當(dāng)于經(jīng)驗(yàn)豐富的細(xì)胞學(xué)專家,甚至具有更高的特異度。朱孝輝等[17]分析了16 317例基于深度學(xué)習(xí)模型的AI診斷宮頸上皮內(nèi)病變的樣本及資料,結(jié)果顯示AI輔助診斷系統(tǒng)預(yù)測(cè)宮頸上皮內(nèi)病變靈敏度為92.90%,預(yù)測(cè)其他病變靈敏度為83.55%,陰性樣本特異度為87.02%;而細(xì)胞病理醫(yī)生運(yùn)用AI輔助診斷系統(tǒng)分別為99.34%、97.79%及99.10%。Xue等[18]對(duì)3 514名婦女的研究結(jié)果顯示,AI液基細(xì)胞學(xué)的敏感性與人工閱片相似(86.49%vs.83.78%,P=0.744),但在檢測(cè)宮頸上皮內(nèi)瘤樣病變(cervical intraepithlial neoplasia,CIN)2級(jí)及以上時(shí)高于HPV16/18分型(86.49%vs.54.05%,P=0.002)。雖然AI液基細(xì)胞學(xué)的特異性顯著低于HPV16/18分型(51.33%vs.87.17%,P<0.001),但其檢測(cè)CIN2及以上病變的特異性高于人工閱片(51.33%vs.40.93%,P<0.001)。Wilbur等學(xué)者[19]對(duì)12 313例宮頸細(xì)胞涂片采用人工閱片和AI輔助宮頸細(xì)胞學(xué)診斷閱片進(jìn)行比較,結(jié)果發(fā)現(xiàn)與人工閱片相比,AI輔助宮頸細(xì)胞學(xué)診斷組的HSIL陽性靈敏度增加了19.6%,LSIL陽性靈敏度增加了9.8%,但特異度略有降低,對(duì)于非典型鱗狀細(xì)胞(atypical squamous cells,ASC)陽性的靈敏度和特異度無統(tǒng)計(jì)學(xué)差異。
從上述研究可以看到,與傳統(tǒng)的人工閱片相比,AI的敏感性相當(dāng)或略高,特異性有些研究提示略低,有些研究提示顯著增高。研究結(jié)果的差異與研究采用的AI方法和研究設(shè)計(jì)不同有關(guān),但總體來說AI的準(zhǔn)確性與人工閱片相當(dāng)或略高,特異性有待進(jìn)一步研究。
由于宮頸細(xì)胞學(xué)檢查需要病理細(xì)胞學(xué)醫(yī)生閱片后做出診斷,結(jié)果容易受主觀因素影響,因此細(xì)胞學(xué)醫(yī)生的能力和臨床經(jīng)驗(yàn)十分重要。此外,由于宮頸癌篩查的工作量巨大,細(xì)胞學(xué)醫(yī)生容易疲勞,也會(huì)影響診斷結(jié)果的判斷,因此在細(xì)胞學(xué)閱片中要求細(xì)胞學(xué)醫(yī)生每天閱片不超過100張[20],但又會(huì)影響工作效率。而AI輔助細(xì)胞學(xué)診斷不存在人員疲勞的問題,且數(shù)字診斷標(biāo)準(zhǔn)統(tǒng)一,可以避免上述問題的發(fā)生。
國(guó)內(nèi)也有相關(guān)研究的報(bào)道,朱孝輝等[17]研究結(jié)果提示,細(xì)胞病理醫(yī)師運(yùn)用人工智能輔助診斷系統(tǒng)比人工閱片節(jié)省約6倍的閱片時(shí)間。郭曉等[21]報(bào)道2 719例細(xì)胞學(xué)圖片由2名細(xì)胞病理醫(yī)師閱片需要227h完成,而AI輔助閱片用時(shí)136h,節(jié)省了時(shí)間。因此,效率增加是AI的優(yōu)勢(shì)之一。
AI輔助宮頸細(xì)胞學(xué)診斷技術(shù)作為宮頸細(xì)胞學(xué)輔助診斷工具,應(yīng)按照宮頸細(xì)胞學(xué)檢查管理及質(zhì)量控制要求,應(yīng)用于宮頸癌機(jī)會(huì)性篩查及組織性篩查中,可以作為初篩,或HPV檢測(cè)分流及HPV聯(lián)合篩查的方法,但需要病理醫(yī)師最終確認(rèn)診斷。考慮到AI輔助宮頸細(xì)胞學(xué)診斷技術(shù)具有工作效率高,不存在閱片疲勞及診斷標(biāo)準(zhǔn)統(tǒng)一的優(yōu)勢(shì),更適宜應(yīng)用于工作量大的人群組織性篩查或篩查數(shù)量較大的機(jī)會(huì)性篩查中,尤其是在細(xì)胞學(xué)醫(yī)生能力不足和數(shù)量缺乏地區(qū)。
目前國(guó)內(nèi)外對(duì)于人群組織性篩查也有相關(guān)研究報(bào)道。有學(xué)者應(yīng)用云技術(shù)和人工智能的自動(dòng)化細(xì)胞學(xué)診斷平臺(tái)對(duì)湖北省83個(gè)縣(市)的年齡在20~72歲的703 103名女性進(jìn)行宮頸癌篩查,結(jié)果顯示以宮頸活檢組織病理學(xué)結(jié)果作為金標(biāo)準(zhǔn),AI自動(dòng)化診斷平臺(tái)的敏感性和特異性分別為99.18%和44.42%[22]。而陰性預(yù)測(cè)值和陽性預(yù)測(cè)值分別為41.27%和99.28%。與人工閱片相比,在NILM、ASC-US、ASC-H、LSIL、HSIL的診斷一致率分別為99.10%、87.49%、84.15%、85.31%和94.20%。與單純HPV檢測(cè)相比,Parham等[23]學(xué)者在本地區(qū)宮頸癌篩查工作中,采用HPV檢測(cè)加上自動(dòng)視覺評(píng)價(jià)算法的方法,結(jié)果顯示人類免疫缺陷病毒(human immunodeficiency virus,HIV)陽性且HPV16陽性的女性宮頸癌前病變及以上級(jí)別的檢出風(fēng)險(xiǎn)由48%增加到72%。
質(zhì)量控制是保證宮頸癌篩查質(zhì)量的重要措施之一。對(duì)于人工閱片的宮頸細(xì)胞學(xué)的質(zhì)量控制主要包括管理、人員能力建設(shè)及宮頸細(xì)胞學(xué)制片閱片等[20]。對(duì)于AI輔助宮頸細(xì)胞學(xué)診斷技術(shù)來說,除上述質(zhì)量控制內(nèi)容和人工閱片相同,《共識(shí)》也進(jìn)行了詳細(xì)的闡述。對(duì)于AI硬件和軟件系統(tǒng)的質(zhì)量控制也應(yīng)包括在其中,但目前實(shí)際工作中由于AI系統(tǒng)采用的方法不同,相關(guān)的參數(shù)并不統(tǒng)一,另外不同系統(tǒng)采集細(xì)胞學(xué)圖像的質(zhì)量也不統(tǒng)一,因此亟需統(tǒng)一AI輔助宮頸細(xì)胞學(xué)診斷技術(shù)系統(tǒng)的參數(shù)和細(xì)胞學(xué)圖集。
綜上所述,《共識(shí)》對(duì)于人工智能技術(shù)在宮頸癌篩查中的應(yīng)用和質(zhì)量控制提供了參考,大規(guī)模人群的組織性篩查更能充分發(fā)揮AI輔助宮頸細(xì)胞學(xué)診斷技術(shù)高效率、診斷標(biāo)準(zhǔn)統(tǒng)一的優(yōu)勢(shì),但仍然需要在質(zhì)量控制、信息管理等方面進(jìn)行深入探討,并需要更多真實(shí)世界的研究數(shù)據(jù)提供更全面的循證醫(yī)學(xué)證據(jù)。