郭彩琴,王峻峰,楊嵐,石錦平,唐葉,趙頔,吳曉
214002 江蘇省無錫市婦幼保健院 江南大學(xué)附屬婦產(chǎn)醫(yī)院醫(yī)學(xué)遺傳與產(chǎn)前診斷科
我國的出生缺陷率約為5.6%,染色體異常是導(dǎo)致出生缺陷的常見原因之一[1]。由于暫無有效的根治方法,產(chǎn)前診斷發(fā)現(xiàn)染色體異常必要時進(jìn)行干預(yù)是出生缺陷防控最有效的手段。核型分析目前仍是診斷染色體異常的重要方法[2],但傳統(tǒng)的核型分析主要依靠人工,費時費力。即便是現(xiàn)在廣泛使用的染色體核型自動分析系統(tǒng),分割聚簇的染色體并進(jìn)行分類的效果仍不理想,容易誤報并增加系統(tǒng)的錯誤率。
近年來,人工智能(artificial intelligence,AI)已逐漸用于病理、影像、檢驗等醫(yī)學(xué)診斷領(lǐng)域[3-5],結(jié)果較令人滿意。AI采用卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)圖像識別技術(shù),通過學(xué)習(xí)大量已標(biāo)注的形態(tài)學(xué)數(shù)據(jù),訓(xùn)練出智能診斷AI算法模型,從而實時、快速地對樣本進(jìn)行形態(tài)學(xué)分析[6]。但在染色體核型分析領(lǐng)域,AI技術(shù)的應(yīng)用目前尚處于起步階段,相關(guān)的研究結(jié)果較少。
本研究應(yīng)用湖南自興智慧醫(yī)療科技有限公司開發(fā)的自興染色體核型智能分析系統(tǒng)(自興核型寶),對1 000例產(chǎn)前羊水樣本進(jìn)行染色體自動識別與分析,再與長期從事染色體形態(tài)學(xué)診斷的細(xì)胞遺傳學(xué)醫(yī)師分析結(jié)果相對比,旨在探討AI輔助染色體核型分析技術(shù)在產(chǎn)前診斷中的應(yīng)用價值。
選取2020—2022年在無錫市婦幼保健院醫(yī)學(xué)遺傳與產(chǎn)前診斷科接受介入性產(chǎn)前診斷、行羊水染色體核型分析的1 000例孕婦,年齡21~43歲,均為單胎妊娠,夫妻雙方表型均正常,無近親婚配及遺傳病家族史。所有相關(guān)檢查經(jīng)孕婦及家屬知情同意,本研究經(jīng)無錫市婦幼保健院醫(yī)學(xué)倫理委員會審查批準(zhǔn)(2023-06-0721-33)。
超聲引導(dǎo)下行羊膜腔穿刺術(shù),抽取孕婦羊水20 mL,立即送檢。常規(guī)羊水細(xì)胞培養(yǎng)、收獲后低滲、固定、滴片、G顯帶和Giemsa染色。
1.3.1 圖片掃描:將染色后的載玻片編號并按序放入染色體顯微圖像掃描分析系統(tǒng)(ZEISS MetaSystems Ikaros)的玻片架上,Metafer掃描軟件中錄入對應(yīng)的樣本編號,機(jī)械臂自動抓取單架玻片后傳送至顯微鏡的載物臺,在10×物鏡下進(jìn)行全片掃描與分裂相定位,然后自動滴油,并切換至63×油鏡采集模式,通過自動聚焦獲得清晰的單個染色體分裂相圖像并上傳至閱片系統(tǒng)電腦終端。
1.3.2 閱片方法:采用雙線法對所有樣本進(jìn)行染色體核型分析。每份樣本雙線各自計數(shù)≥20個分裂相,分析≥5個分裂相;嵌合體計數(shù)≥50個分裂相,分析≥20個分裂相。(1)一線AI閱片法由1名≥10年經(jīng)驗的細(xì)胞遺傳醫(yī)師應(yīng)用自興核型寶輔助診斷。將1 000例羊水樣本的染色體原始圖像資料導(dǎo)入自興核型寶,該智能分析系統(tǒng)基于約1 000萬染色體圖像數(shù)據(jù)庫的訓(xùn)練,數(shù)據(jù)庫數(shù)據(jù)來自全國多家大型三級甲等醫(yī)院,軟件能自動抓取掃描系統(tǒng)采集的染色體原始圖像,按質(zhì)量優(yōu)劣順序排列,點擊原始分裂相后一鍵式自動去噪、增強(qiáng)、分割和識別、排序并分析,呈現(xiàn)分析后按染色體序號排列的圖形并自動計數(shù)診斷,分析、計數(shù)的分裂相數(shù)量以及診斷結(jié)果自動顯示于軟件左側(cè)欄(圖1)。記錄自興核型寶的診斷結(jié)果及所需時間,再由細(xì)胞遺傳學(xué)醫(yī)師進(jìn)行人工審核,記錄審核后的診斷結(jié)果及所需時間。(2)二線由另1名≥10年經(jīng)驗的細(xì)胞遺傳醫(yī)師應(yīng)用Ikaros系統(tǒng)閱片。所有羊水樣本的染色體原始圖像資料導(dǎo)入Ikaros系統(tǒng)后,軟件根據(jù)圖像質(zhì)量優(yōu)劣自動按序排列,遺傳醫(yī)師手動點擊原始分裂相去噪、增強(qiáng)后,人工分割重疊、粘連并排序,手工輸入每個分裂相的診斷結(jié)果,計數(shù)后記錄每例樣本的核型結(jié)果以及核型分析所需時間。樣本的最終診斷結(jié)果以一線的人工審核和二線的人工閱片結(jié)果為準(zhǔn),雙線診斷結(jié)果不一致時以3名≥20年經(jīng)驗的細(xì)胞遺傳醫(yī)師顯微鏡下閱片結(jié)果為準(zhǔn)。
采用SPSS 27.0軟件對數(shù)據(jù)進(jìn)行統(tǒng)計分析。符合正態(tài)分布的計量資料以(±s)表示,多組間比較采用方差分析,組間兩兩比較采用LSD-t檢驗;計數(shù)資料以相對數(shù)表示;診斷一致性分析采用Kappa檢驗,以Kappa值≥0.40為一致性較好,0.41~0.60為中等一致性,0.61~0.80為較強(qiáng)一致性,0.81~1.00為強(qiáng)一致性。以P<0.05為差異有統(tǒng)計學(xué)意義。
1 000例羊水樣本中,AI診斷正常核型735例、非整倍體233例、結(jié)構(gòu)異常0例、嵌合體32例;AI輔助遺傳醫(yī)師診斷正常核型689例,非整倍體233例、結(jié)構(gòu)異常45例、嵌合體33例;遺傳醫(yī)師應(yīng)用Ikaros系統(tǒng)診斷正常核型689例,非整倍體233例、結(jié)構(gòu)異常45例、嵌合體33例(表1)。AI輔助遺傳醫(yī)師的診斷結(jié)果與遺傳醫(yī)師應(yīng)用Ikaros系統(tǒng)的診斷結(jié)果完全一致。
表1 3種閱片方式染色體核型分析的診斷結(jié)果比對(例)Table 1 Comparison of diagnostic results of karyotype analysis by three reading methods
由于2名遺傳醫(yī)師應(yīng)用AI和Ikaros系統(tǒng)的診斷結(jié)果完全一致,因此均可作為本研究中羊水染色體核型診斷的“金標(biāo)準(zhǔn)”。與AI輔助遺傳醫(yī)師相比,AI組診斷具有強(qiáng)一致性(Kappa值=0.895,95%CI=0.866~0.924,P<0.01)。AI組準(zhǔn)確率為95.4%,靈敏度為95.4%,陽性預(yù)測值為100%。其中,核型正常、非整倍體、嵌合體、結(jié)構(gòu)異常的靈敏度分別為100.0%、100.0%、97.0%、0;陽性預(yù)測值分別為100.0%、100.0%、100.0%、0(表2)。
表2 AI組與AI輔助遺傳醫(yī)師組診斷一致性分析(例)Table 2 Diagnostic concordance between AI-based and AI-assisted geneticist group
1 000例羊水的染色體核型分析中,每例樣本AI自動閱片的平均診斷耗時為(3.15±0.45)min,AI閱片后醫(yī)師審核即AI輔助遺傳醫(yī)師平均所需的診斷時間為(4.44±0.64)min,而遺傳醫(yī)師應(yīng)用Ikaros系統(tǒng)閱片的平均診斷耗時則為(32.28±3.93)min。AI組、AI輔助遺傳醫(yī)師組以及遺傳醫(yī)師應(yīng)用Ikaros系統(tǒng)閱片組的診斷平均用時比較,差異有統(tǒng)計學(xué)意義(F=50 740.97,P<0.001);其中,AI組診斷平均用時少于AI輔助遺傳醫(yī)師組和遺傳醫(yī)師應(yīng)用Ikaros系統(tǒng)閱片組,AI輔助遺傳醫(yī)師組平均診斷用時也少于遺傳醫(yī)師應(yīng)用Ikaros系統(tǒng)閱片組,差異有統(tǒng)計學(xué)意義(P<0.001)。
核型分析迄今仍是產(chǎn)前診斷染色體異常的重要方法,但由于羊水細(xì)胞培養(yǎng)周期長,從細(xì)胞接種、收獲到顯帶制備、鏡下閱片均需人工完成,過程煩瑣,因而檢測周期長達(dá)30 d。隨著半自動、全自動核型分析工作站(如ZEISS MetaSystems Ikaros系統(tǒng))的應(yīng)用,自動掃描獲得中期染色體圖像并按質(zhì)量初步排列、人工操作下初步識別染色體的功能得以逐步實現(xiàn),核型分析的效率也大幅提高。然而,此類工作站的自動化性能主要集中于核型圖像的拍攝與篩選;核型分析過程中,染色體重疊、粘連的分割主要還依賴人工,配對、排列的準(zhǔn)確率也較低,需要人工調(diào)整[7],并未做到真正的“全自動”。因此,工作站使用后產(chǎn)前染色體核型分析的報告周期仍需25 d左右。
由于染色體常呈現(xiàn)出復(fù)雜的形態(tài),如邊緣粘連、重疊、扭曲等,會給染色體的正確分割造成很大干擾[8],不成熟的分割又會導(dǎo)致后續(xù)分類準(zhǔn)確率降低,因此“分割和分類”是染色體識別的兩大難點[9-10],也是核型分析中耗費時間、精力的重要因素。近年來,隨著深度學(xué)習(xí)在醫(yī)學(xué)領(lǐng)域的廣泛應(yīng)用,使用深度學(xué)習(xí)的方法對染色體進(jìn)行分割分類從而實現(xiàn)核型分析的自動化已成為研究者們關(guān)注的熱點。2017年,HU等[11]首次用“分割網(wǎng)絡(luò)”來解決重疊染色體的分割問題。2019年,HU等[12]將CNN算法應(yīng)用到染色體核型分析中:把91個中期分裂相圖中的染色體基于邊緣輪廓進(jìn)行切割,取其中4 184個未折疊的單個染色體圖用CNN進(jìn)行識別,分類準(zhǔn)確率達(dá)93.79%。同年,XIE等[13]應(yīng)用多輸入CNN與幾何優(yōu)化相結(jié)合的技術(shù)對染色體進(jìn)行自動分割和分類,并構(gòu)建了一套完整的自動化分析流,顯著提高了粘連、重疊等情形下染色體識別的準(zhǔn)確度。由此可見,CNN在染色體分割和分類中性能均良好,這為智能化核型分析系統(tǒng)的構(gòu)建提供了新思路。本研究中,自興染色體核型智能分析系統(tǒng)應(yīng)用CNN模型深度挖掘粘連、重疊染色體的信息,可以實現(xiàn)重疊區(qū)的正確分割[14];并能推理染色體輪廓的分割及類型的識別,使分割與識別任務(wù)相互學(xué)習(xí);此外,還能將染色體感興趣區(qū)域間的重疊度作為鄰接矩陣,構(gòu)造一個基于染色體的圖網(wǎng)絡(luò),使單條染色體的分割識別不孤立,模型的泛化性強(qiáng)。最終,通過U型染色體切割網(wǎng)絡(luò)和染色體類型識別殘差網(wǎng)絡(luò),完成染色體的自動分割和分類,實現(xiàn)了自動化分析過程。
本研究中,應(yīng)用自興核型寶的AI系統(tǒng)對1 000例產(chǎn)前羊水進(jìn)行染色體核型分析后發(fā)現(xiàn),相比于細(xì)胞遺傳醫(yī)師人工診斷的金標(biāo)準(zhǔn),AI系統(tǒng)自動分析僅46例診斷錯誤,準(zhǔn)確率與靈敏度均為95.4%,陽性預(yù)測值達(dá)100.0%。其中,689例醫(yī)師組診斷為正常核型的羊水,AI全部判斷正確,靈敏度、陽性預(yù)測值達(dá)100.0%,表明AI具有優(yōu)良的分割、分類且識別正常染色體的能力。非整倍體是產(chǎn)前診斷最常見的染色體異常類型,也是造成出生缺陷的主要遺傳學(xué)病因之一[15]。本研究中AI閱片共診斷羊水非整倍體233例,包括21三體、18三體、13三體、X單體等,靈敏度和陽性預(yù)測值也均為100%,表明AI系統(tǒng)對非整倍體有很強(qiáng)的診斷優(yōu)勢。由于產(chǎn)前樣本嵌合體常規(guī)要求計數(shù)≥50個分裂相[16],因此嵌合體常是羊水染色體核型診斷中最費時費力的類型之一。與人工分析不同,AI系統(tǒng)的一鍵式自動去噪、分割分類的功能極大程度減輕了遺傳醫(yī)師手動分割粘連、重疊并計數(shù)≥50個分裂相耗費的人力及時間。本研究33例嵌合體中,AI僅漏診1例,靈敏度達(dá)97.0%;但診斷平均用時明顯低于AI輔助遺傳醫(yī)師和Ikaros輔助遺傳醫(yī)師閱片。AI對正常核型、非整倍體、嵌合體的診斷均展示了良好的性能,但在易位、倒位、缺失、重復(fù)等核型的診斷中,AI系統(tǒng)的辨識力則較差。本研究中,45例結(jié)構(gòu)異常的染色體AI系統(tǒng)均未能正確識別而誤判為正常核型;此外,1例漏診的21三體嵌合體[46,XN,t(21;21)/46,XN]也是因21號染色體同源易位形成的結(jié)構(gòu)異常與正常核型嵌合,但被AI系統(tǒng)漏診才誤判為正常核型。因此,46例誤診的病例均是由AI系統(tǒng)對染色體結(jié)構(gòu)異常的辨別力較弱所致,即使是最簡單、常見的羅伯遜易位[如46,XN,t(21;21)]目前也無法被AI系統(tǒng)正確識別并診斷。但經(jīng)遺傳醫(yī)師人工審核后,46例AI誤診的核型結(jié)果均得以糾正。
本研究中,1 000例羊水核型先由AI初診、再由人工審核的AI輔助遺傳醫(yī)師閱片模式,其診斷結(jié)果與遺傳醫(yī)師應(yīng)用染色體顯微圖像掃描分析系統(tǒng)(Ikaros輔助遺傳醫(yī)師)的閱片模式完全相同。但I(xiàn)karos輔助閱片中,每個分裂相染色體的分割、分類、排列以及初診結(jié)果的輸入仍需遺傳醫(yī)師耗費不少時間手動完成。而AI系統(tǒng)能一鍵式將染色體自動分割并分類,節(jié)約了大量人工去噪、分割粘連交叉染色體的時間,遺傳醫(yī)師僅需核對AI自動分類的結(jié)果,重點關(guān)注每條染色體的結(jié)構(gòu),因此AI輔助遺傳醫(yī)師分析1例染色體核型的平均時間僅需4.5 min左右,不到Ikaros輔助遺傳醫(yī)師閱片的1/7。盡管單純AI閱片耗時更短僅需約3 min/例,但由于對染色體結(jié)構(gòu)異常的判讀力較弱存在一定程度的漏診,因此人工審核環(huán)節(jié)非常必要,AI初診后遺傳醫(yī)師復(fù)審也是目前最理想的產(chǎn)前羊水染色體核型分析模式。相比于遺傳醫(yī)師應(yīng)用Ikaros軟件的半自動閱片模式,運用近全自動的AI輔助遺傳醫(yī)師診斷模式后,產(chǎn)前羊水染色體核型的報告周期可縮短至18~20 d,既保證了診斷質(zhì)量又能減少檢測周期。染色體核型分析是一項需長期積累經(jīng)驗的工作,培養(yǎng)一名專業(yè)的遺傳診斷醫(yī)師至少需要3~5年時間,AI的應(yīng)用實現(xiàn)了染色體分割分類的自動化,既減少了遺傳醫(yī)師不必要的重復(fù)勞動時間,又可同步提高診斷效率與診斷水平縮短培養(yǎng)周期。
盡管在AI輔助診斷領(lǐng)域,系統(tǒng)的假陰性陷阱會一直存在[17],但最大限度地降低假陰性率則是根本目標(biāo)。本研究中,AI產(chǎn)前診斷羊水核型的假陰性主要源于AI對染色體結(jié)構(gòu)異常的識別力較差。一方面,后續(xù)有必要積累更多的數(shù)據(jù)庫訓(xùn)練數(shù)據(jù)、優(yōu)化算法提高AI系統(tǒng)對易位、插入、缺失、重復(fù)等染色體結(jié)構(gòu)異常的識別能力;另一方面,遺傳醫(yī)師的審核作用不可或缺。需要牢記“AI不可取代專業(yè)遺傳醫(yī)師診斷,只能協(xié)助診斷”的原則,使AI合理地應(yīng)用于醫(yī)學(xué)領(lǐng)域,才能達(dá)到既解放人力又提高診斷性能的效果[18-20]。
綜上所述,本研究對AI系統(tǒng)在產(chǎn)前染色體核型診斷中的應(yīng)用進(jìn)行了初步分析研究。相比于常用的核型分析工作站(如Ikaros系統(tǒng)等),AI突破了染色體“分割、分類”的技術(shù)瓶頸,一鍵式完成了去噪、分割、排列的全過程。AI染色體核型輔助診斷系統(tǒng)具有自動化程度高、快速、高靈敏度、高準(zhǔn)確度、強(qiáng)泛化性的特點,但對染色體結(jié)構(gòu)異常的識別能力有待提高。運用“AI+人工”的AI輔助細(xì)胞遺傳醫(yī)師閱片模式,既能有效規(guī)避漏診、誤診的風(fēng)險又能顯著提高工作效率,在保證產(chǎn)前染色體核型診斷質(zhì)量的前提下能極大減輕遺傳醫(yī)師的工作負(fù)擔(dān),具有廣闊的出生缺陷二級防控應(yīng)用前景。
作者貢獻(xiàn):郭彩琴負(fù)責(zé)文章的構(gòu)思設(shè)計、研究的實施和可行性分析、論文撰寫;王峻峰、唐葉負(fù)責(zé)染色體核型診斷、結(jié)果分析與審核;楊嵐負(fù)責(zé)研究的設(shè)計與指導(dǎo)、論文修改、對文章整體負(fù)責(zé)、監(jiān)督管理;石錦平、吳曉負(fù)責(zé)染色體制備的實驗操作;趙頔負(fù)責(zé)收集整理數(shù)據(jù)、統(tǒng)計分析。所有作者確認(rèn)了論文最終稿。
本文無利益沖突。