張小松,杜 蕓,董 燕,畢 蕙
(1.北京大學第一醫(yī)院婦產(chǎn)科,北京 100034;2.河北省腫瘤醫(yī)院細胞學室,河北 石家莊 050011;3.中國婦幼保健協(xié)會人工智能項目辦公室,北京 100089)
宮頸癌是威脅女性健康的主要惡性腫瘤之一,據(jù)統(tǒng)計2020年全球新發(fā)宮頸癌60.4萬例,死亡34.2萬例,中、低收入國家是高發(fā)地區(qū)[1]。2016年我國宮頸癌新發(fā)病例11.93萬例,死亡病例3.72萬例[2],位居女性惡性腫瘤死亡順位第6位[3]。
宮頸癌篩查是宮頸癌防控的主要措施之一,隨著人工智能(artificial intelligence,AI)技術(shù)的發(fā)展,AI輔助宮頸細胞學診斷技術(shù)已經(jīng)開始在宮頸癌篩查工作中使用,為促進宮頸癌篩查工作的開展提供了更多的選擇性。為進一步提高和規(guī)范AI輔助宮頸細胞學診斷技術(shù)的工作質(zhì)量和應(yīng)用,2023年12月中國婦幼保健協(xié)會和中國婦幼保健協(xié)會婦女病防治專業(yè)委員會共同發(fā)布了《人工智能輔助宮頸細胞學診斷技術(shù)的應(yīng)用及質(zhì)量控制專家共識》(以下簡稱《共識》)[4]。本文旨在對《共識》進行解讀,便于相關(guān)專業(yè)人員在工作中進一步理解和實踐。
宮頸癌作為威脅女性健康的主要惡性腫瘤,其主要病因已經(jīng)明確,即高危型人乳頭瘤病毒(high-risk human papillomavirus,HR-HPV)的持續(xù)感染。目前,隨著HPV預(yù)防性疫苗的應(yīng)用,我國宮頸癌防控已經(jīng)逐步形成了三級預(yù)防體系:一級預(yù)防措施包括健康教育和HPV疫苗接種,二級預(yù)防措施是宮頸癌篩查,三級預(yù)防措施主要是治療宮頸浸潤癌[5]。宮頸癌篩查仍然是宮頸癌防控的主要措施之一。宮頸癌篩查方法主要包括HPV檢測和宮頸細胞學檢查,兩種方法既是初篩方法,也是分流方法。宮頸細胞學檢查的質(zhì)量在宮頸癌篩查工作中十分重要,其主要與細胞學醫(yī)生的能力和水平有關(guān)。由于我國幅員遼闊,不同地區(qū)醫(yī)療水平不同,細胞學醫(yī)生水平參差不齊,尤其是基層地區(qū),細胞學醫(yī)生的數(shù)量和能力有所欠缺,影響了當?shù)貙m頸癌篩查的質(zhì)量[6-7]。
2020年11月,世界衛(wèi)生組織(World Health Organization,WHO)正式發(fā)布了全球首個消除宮頸癌的戰(zhàn)略,即《從公共衛(wèi)生問題中加速消除宮頸癌的全球戰(zhàn)略》,提出了2030年全球?qū)m頸癌防控“90-70-90”目標,其中目標之一是70%的女性在35歲和45歲各接受一次高質(zhì)量的宮頸癌篩查[8]。我國積極響應(yīng)WHO“加速消除宮頸癌”的全球戰(zhàn)略,并于2023年由10個部委聯(lián)合發(fā)布了《加速消除宮頸癌行動計劃(2023—2030年)》[9],也提出我國宮頸癌篩查的目標是2025年適齡婦女宮頸癌篩查率達到50%,2030年達到70%。相關(guān)研究顯示,2018—2019年35~64歲女性宮頸癌篩查的覆蓋率僅為36.8%[10],距70%的篩查目標仍有較大差距。因此,為實現(xiàn)上述目標,宮頸癌篩查的質(zhì)量和效率需要進一步提升。
在此背景下,AI輔助宮頸細胞學診斷技術(shù)的發(fā)展及應(yīng)用,有望成為促進我國高質(zhì)量高效率開展宮頸癌篩查工作的措施之一。我國《加速消除宮頸癌行動計劃(2023—2030年)》中也提出探索人工智能、互聯(lián)網(wǎng)等新技術(shù)應(yīng)用于宮頸癌篩查和診療服務(wù)[9]?!豆沧R》發(fā)布主要的目的就是在當前形勢下,為AI輔助宮頸細胞學診斷技術(shù)在實際工作中的應(yīng)用及質(zhì)量控制提供參考。
在《共識》中對于AI輔助宮頸細胞學診斷的定義進行了闡述。首先,AI輔助宮頸細胞學診斷系統(tǒng)仍然屬于病理學圖像診斷,且屬于醫(yī)療器械范疇。我國對于AI醫(yī)療器械也有相關(guān)定義,是指“基于醫(yī)‘療器械數(shù)據(jù)’,采用人工智能技術(shù)實現(xiàn)其預(yù)期用途(即醫(yī)療用途)的醫(yī)療器械”[11],從其定義中可以理解AI醫(yī)療器械既包括“AI獨立軟件”醫(yī)療器械,也包括“AI組件”醫(yī)療器械,后者也稱醫(yī)療器械嵌入式軟件[12]。AI輔助宮頸細胞學診斷技術(shù)包括軟件和硬件部分,主要是由掃描工作站、數(shù)字診斷和數(shù)據(jù)存儲三部分組成,因此屬于含有病理圖像AI分析軟件的醫(yī)療器械?!豆沧R》還參考了其他相關(guān)專家共識[13]對AI輔助宮頸細胞學診斷的定義。
需要注意的是目前AI輔助宮頸細胞學診斷技術(shù)還是屬于輔助診斷,沒有診斷權(quán)限,意味著AI輔助細胞學是篩選出陽性或陰性細胞,但最終需要細胞學醫(yī)生進行診斷,并出具報告。
AI輔助宮頸細胞學診斷系統(tǒng)需要準確分割細胞核,通過特征提取和分類來判斷細胞是否有病變。目前主要的核分割算法包括簡單線性迭代聚類(simple linear iterative clustering,SLIC)方法、基于區(qū)域的分割方法、卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)和聚類方法[14]等。隨著AI輔助宮頸細胞學診斷技術(shù)的開展,相關(guān)應(yīng)用場景的探討也日益增多。
王娜等[15]研究者對于202例宮頸液基薄層細胞學標本采用多流CNN細胞分類算法進行判讀,并與人工判讀結(jié)果進行比較,結(jié)果顯示多流CNN二分類和多分類算法的符合率分別為68.13%和73.08%。二分類算法的靈敏度、特異度、陰性預(yù)測值分別為100.00%、62.09%、100.00%;多分類算法的特異度相對較高,未見上皮內(nèi)病變細胞或惡性細胞(negative for intraepithelial lesion or malignancy,NILM)、無明確診斷意義的不典型鱗狀細胞(atypical squamous cells of undetermined significance,ASC-US)、低級別鱗狀上皮內(nèi)病變(low-grade squamous intraepithelial lesion,LSIL)、高級別鱗狀上皮內(nèi)病變(high-grade squamous intraepithelial lesion,HSIL)、非典型鱗狀細胞不除外鱗狀上皮內(nèi)高度病變(atypical squamous cells-cannot exclude HSIL,ASC-H)分別是96.55%、73.75%、98.29%、98.90%、99.45%。Bao等[16]基于188 542例宮頸樣本,深度學習模型診斷HSIL及以上病變的靈敏度為90.10%,且發(fā)現(xiàn)模型閱片水平相當于經(jīng)驗豐富的細胞學專家,甚至具有更高的特異度。朱孝輝等[17]分析了16 317例基于深度學習模型的AI診斷宮頸上皮內(nèi)病變的樣本及資料,結(jié)果顯示AI輔助診斷系統(tǒng)預(yù)測宮頸上皮內(nèi)病變靈敏度為92.90%,預(yù)測其他病變靈敏度為83.55%,陰性樣本特異度為87.02%;而細胞病理醫(yī)生運用AI輔助診斷系統(tǒng)分別為99.34%、97.79%及99.10%。Xue等[18]對3 514名婦女的研究結(jié)果顯示,AI液基細胞學的敏感性與人工閱片相似(86.49%vs.83.78%,P=0.744),但在檢測宮頸上皮內(nèi)瘤樣病變(cervical intraepithlial neoplasia,CIN)2級及以上時高于HPV16/18分型(86.49%vs.54.05%,P=0.002)。雖然AI液基細胞學的特異性顯著低于HPV16/18分型(51.33%vs.87.17%,P<0.001),但其檢測CIN2及以上病變的特異性高于人工閱片(51.33%vs.40.93%,P<0.001)。Wilbur等學者[19]對12 313例宮頸細胞涂片采用人工閱片和AI輔助宮頸細胞學診斷閱片進行比較,結(jié)果發(fā)現(xiàn)與人工閱片相比,AI輔助宮頸細胞學診斷組的HSIL陽性靈敏度增加了19.6%,LSIL陽性靈敏度增加了9.8%,但特異度略有降低,對于非典型鱗狀細胞(atypical squamous cells,ASC)陽性的靈敏度和特異度無統(tǒng)計學差異。
從上述研究可以看到,與傳統(tǒng)的人工閱片相比,AI的敏感性相當或略高,特異性有些研究提示略低,有些研究提示顯著增高。研究結(jié)果的差異與研究采用的AI方法和研究設(shè)計不同有關(guān),但總體來說AI的準確性與人工閱片相當或略高,特異性有待進一步研究。
由于宮頸細胞學檢查需要病理細胞學醫(yī)生閱片后做出診斷,結(jié)果容易受主觀因素影響,因此細胞學醫(yī)生的能力和臨床經(jīng)驗十分重要。此外,由于宮頸癌篩查的工作量巨大,細胞學醫(yī)生容易疲勞,也會影響診斷結(jié)果的判斷,因此在細胞學閱片中要求細胞學醫(yī)生每天閱片不超過100張[20],但又會影響工作效率。而AI輔助細胞學診斷不存在人員疲勞的問題,且數(shù)字診斷標準統(tǒng)一,可以避免上述問題的發(fā)生。
國內(nèi)也有相關(guān)研究的報道,朱孝輝等[17]研究結(jié)果提示,細胞病理醫(yī)師運用人工智能輔助診斷系統(tǒng)比人工閱片節(jié)省約6倍的閱片時間。郭曉等[21]報道2 719例細胞學圖片由2名細胞病理醫(yī)師閱片需要227h完成,而AI輔助閱片用時136h,節(jié)省了時間。因此,效率增加是AI的優(yōu)勢之一。
AI輔助宮頸細胞學診斷技術(shù)作為宮頸細胞學輔助診斷工具,應(yīng)按照宮頸細胞學檢查管理及質(zhì)量控制要求,應(yīng)用于宮頸癌機會性篩查及組織性篩查中,可以作為初篩,或HPV檢測分流及HPV聯(lián)合篩查的方法,但需要病理醫(yī)師最終確認診斷??紤]到AI輔助宮頸細胞學診斷技術(shù)具有工作效率高,不存在閱片疲勞及診斷標準統(tǒng)一的優(yōu)勢,更適宜應(yīng)用于工作量大的人群組織性篩查或篩查數(shù)量較大的機會性篩查中,尤其是在細胞學醫(yī)生能力不足和數(shù)量缺乏地區(qū)。
目前國內(nèi)外對于人群組織性篩查也有相關(guān)研究報道。有學者應(yīng)用云技術(shù)和人工智能的自動化細胞學診斷平臺對湖北省83個縣(市)的年齡在20~72歲的703 103名女性進行宮頸癌篩查,結(jié)果顯示以宮頸活檢組織病理學結(jié)果作為金標準,AI自動化診斷平臺的敏感性和特異性分別為99.18%和44.42%[22]。而陰性預(yù)測值和陽性預(yù)測值分別為41.27%和99.28%。與人工閱片相比,在NILM、ASC-US、ASC-H、LSIL、HSIL的診斷一致率分別為99.10%、87.49%、84.15%、85.31%和94.20%。與單純HPV檢測相比,Parham等[23]學者在本地區(qū)宮頸癌篩查工作中,采用HPV檢測加上自動視覺評價算法的方法,結(jié)果顯示人類免疫缺陷病毒(human immunodeficiency virus,HIV)陽性且HPV16陽性的女性宮頸癌前病變及以上級別的檢出風險由48%增加到72%。
質(zhì)量控制是保證宮頸癌篩查質(zhì)量的重要措施之一。對于人工閱片的宮頸細胞學的質(zhì)量控制主要包括管理、人員能力建設(shè)及宮頸細胞學制片閱片等[20]。對于AI輔助宮頸細胞學診斷技術(shù)來說,除上述質(zhì)量控制內(nèi)容和人工閱片相同,《共識》也進行了詳細的闡述。對于AI硬件和軟件系統(tǒng)的質(zhì)量控制也應(yīng)包括在其中,但目前實際工作中由于AI系統(tǒng)采用的方法不同,相關(guān)的參數(shù)并不統(tǒng)一,另外不同系統(tǒng)采集細胞學圖像的質(zhì)量也不統(tǒng)一,因此亟需統(tǒng)一AI輔助宮頸細胞學診斷技術(shù)系統(tǒng)的參數(shù)和細胞學圖集。
綜上所述,《共識》對于人工智能技術(shù)在宮頸癌篩查中的應(yīng)用和質(zhì)量控制提供了參考,大規(guī)模人群的組織性篩查更能充分發(fā)揮AI輔助宮頸細胞學診斷技術(shù)高效率、診斷標準統(tǒng)一的優(yōu)勢,但仍然需要在質(zhì)量控制、信息管理等方面進行深入探討,并需要更多真實世界的研究數(shù)據(jù)提供更全面的循證醫(yī)學證據(jù)。