吳洪基,王海霞,汪 玲,羅小剛,鄒冬玲
1.重慶大學(xué)生物工程學(xué)院,重慶 400030;
2.重慶大學(xué)附屬腫瘤醫(yī)院婦科腫瘤中心,重慶 400030;
3.重慶市卵巢癌專病醫(yī)學(xué)研究中心,重慶 400030;
4.重慶大學(xué)附屬腫瘤醫(yī)院,腫瘤轉(zhuǎn)移與個(gè)體化診治轉(zhuǎn)化研究重慶市重點(diǎn)實(shí)驗(yàn)室,類器官轉(zhuǎn)化研究實(shí)驗(yàn)室,重慶 400030
2009年,Sato等[1]報(bào)道了從成人組織中首次成功衍生出類器官,因類器官與對(duì)應(yīng)的人類器官擁有高度相似的組織學(xué)特征,并能重現(xiàn)該器官的生理功能,出現(xiàn)在疾病建模的最前沿,成為研究人類疾病的一種有價(jià)值、相對(duì)不昂貴且便捷的方法。但目前類器官形態(tài)學(xué)判讀主要依賴于專家的經(jīng)驗(yàn),且類器官研究所產(chǎn)生的高通量數(shù)據(jù)增加了研究的復(fù)雜性,對(duì)于類器官各種形態(tài)信息、組學(xué)信息等的有效整合與分析需要客觀和高效的方法來(lái)輔助實(shí)現(xiàn)。
人工智能技術(shù),尤其是作為機(jī)器學(xué)習(xí)一支的深度學(xué)習(xí),近年來(lái)發(fā)展迅速。醫(yī)療數(shù)據(jù)大量產(chǎn)生和積累契合該數(shù)據(jù)驅(qū)動(dòng)型方法,推動(dòng)了機(jī)器學(xué)習(xí)在醫(yī)療領(lǐng)域的全面應(yīng)用,提升了診療的客觀性、準(zhǔn)確性和效率。人工智能結(jié)合類器官大數(shù)據(jù)將幫助類器官研究專家減少基礎(chǔ)性、重復(fù)性工作,并進(jìn)行更深度的信息挖掘,進(jìn)而提高類器官自動(dòng)化和標(biāo)準(zhǔn)化[2],促進(jìn)類器官臨床轉(zhuǎn)化和精準(zhǔn)治療的實(shí)現(xiàn)。
本文旨在綜述人工智能在類器官研究中的最新進(jìn)展,探討人工智能在類器官研究應(yīng)用中的潛能。
類器官來(lái)源于多種類型干細(xì)胞,通過(guò)自組織方式形成三維結(jié)構(gòu),因其能夠模擬原生器官的結(jié)構(gòu)和功能,因此有助于人類疾病的建模、藥物篩選以及體外替代組織或器官的再生。相對(duì)于患者來(lái)源的動(dòng)物移植瘤模型,類器官具有成本低、成功率高、培養(yǎng)周期短、操作簡(jiǎn)便等優(yōu)勢(shì)[3-4]。相比于傳統(tǒng)的2D細(xì)胞系培養(yǎng),類器官直接來(lái)源于患者,能夠保留患者的基因組信息以及表觀遺傳學(xué)信息,并且更符合體內(nèi)條件下的三維結(jié)構(gòu)[4],可以更準(zhǔn)確地概括來(lái)源腫瘤的結(jié)構(gòu)、特定功能、分子特征和基因組改變[5]。前列腺癌[6]、胰腺癌[7]、結(jié)直腸癌[3]、卵巢癌[8]等多種實(shí)體腫瘤的類器官體外培養(yǎng)體系已成功建立。類器官在預(yù)測(cè)治療反應(yīng)、研究耐藥相關(guān)機(jī)制、優(yōu)化治療策略和精準(zhǔn)治療等方面擁有巨大潛力[9-10],成為近十年內(nèi)生物科學(xué)領(lǐng)域的重要突破之一[11]。
類器官具有眾多優(yōu)越的特性,但同時(shí)也給觀察和分析帶來(lái)了巨大的挑戰(zhàn),作為三維培養(yǎng)物的類器官擁有復(fù)雜的空間結(jié)構(gòu)和表型,且其在培養(yǎng)過(guò)程中強(qiáng)烈地變化和運(yùn)動(dòng),導(dǎo)致研究者們需要用合適的辦法來(lái)定量、準(zhǔn)確、快速和便捷地觀察。其次,類器官研究一般會(huì)產(chǎn)生大量的高通量數(shù)據(jù),數(shù)據(jù)的巨大規(guī)模、高緯度性、噪聲廣泛存在以及復(fù)雜的生物學(xué)過(guò)程使得人工篩選分析或者傳統(tǒng)的統(tǒng)計(jì)學(xué)方法難以處理。如何對(duì)這些數(shù)據(jù)進(jìn)行分析和挖掘,以獲得對(duì)類器官培養(yǎng)過(guò)程變化以及其代表的疾病發(fā)生、發(fā)展的理解等方面需要客觀和準(zhǔn)確的方法。
近年來(lái),伴隨著人工智能尤其是深度學(xué)習(xí)的迅速發(fā)展,其方法和模型越來(lái)越多地被研究者結(jié)合患者的臨床、病理學(xué)、影像學(xué)、基因組學(xué)、蛋白質(zhì)組學(xué)、轉(zhuǎn)錄組學(xué)等數(shù)據(jù),用于診療全過(guò)程的決策,以幫助醫(yī)師快速、客觀和準(zhǔn)確地完成患者的篩查、診斷、治療和預(yù)后,制訂個(gè)性化治療方案。
機(jī)器學(xué)習(xí)是人工智能的一個(gè)技術(shù)分支,能從數(shù)據(jù)中自動(dòng)學(xué)習(xí)規(guī)律和模式來(lái)決策。經(jīng)典的模型有隨機(jī)森林與支持向量機(jī)。隨機(jī)森林是由多個(gè)決策樹組成的集成模型,每個(gè)決策樹基于隨機(jī)子集得到,其魯棒性好,不易受噪聲和異常因素影響并且不需要大量調(diào)參操作。有研究成功運(yùn)用其進(jìn)行心血管疾?。?2]和糖尿病[13]風(fēng)險(xiǎn)預(yù)測(cè)。支持向量機(jī)是另一種流行的機(jī)器學(xué)習(xí)算法,其基本思想為尋找一個(gè)最佳的超平面,以最大程度地分隔不同類別的數(shù)據(jù)點(diǎn)。在小樣本高維數(shù)據(jù)上表現(xiàn)較好,其對(duì)核函數(shù)等參數(shù)的敏感性很高,并且大規(guī)模數(shù)據(jù)集計(jì)算時(shí)間和空間的效能都較高。有研究[14]嘗試結(jié)合語(yǔ)音數(shù)據(jù)檢測(cè)帕金森病。
深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的熱門領(lǐng)域,其由多層神經(jīng)網(wǎng)絡(luò)疊加而成。相較于傳統(tǒng)機(jī)器學(xué)習(xí),其能自動(dòng)學(xué)習(xí)數(shù)據(jù)中的特征并組合轉(zhuǎn)換為更高層、更抽象的特征,可減少人工設(shè)計(jì)特征工作[15],但對(duì)數(shù)據(jù)的數(shù)量和質(zhì)量都有較高要求。卷積神經(jīng)網(wǎng)絡(luò)是一種廣泛被使用的網(wǎng)絡(luò)結(jié)構(gòu),通過(guò)卷積和池化操作來(lái)層次化地進(jìn)行特征提取和學(xué)習(xí),用于處理和分析圖像及視頻數(shù)據(jù)。常見模型有Vgg、ResNet和U-NET等,其應(yīng)用已實(shí)現(xiàn)了分割腦腫瘤[16],對(duì)皮膚癌進(jìn)行分類[17]以及使用視網(wǎng)膜圖像檢測(cè)糖尿病視網(wǎng)膜病變與糖尿病性黃斑水腫[17],能力水平可與專業(yè)醫(yī)師媲美。另一種網(wǎng)絡(luò)結(jié)構(gòu)—循環(huán)神經(jīng)網(wǎng)絡(luò)擁有隱藏層對(duì)信息進(jìn)行存儲(chǔ)記憶,每個(gè)時(shí)間步的輸出和隱藏狀態(tài)都受前一個(gè)時(shí)間步的影響,常用于序列數(shù)據(jù)處理,但當(dāng)輸入序列比較長(zhǎng)時(shí)會(huì)出現(xiàn)長(zhǎng)期依賴問(wèn)題以及不能并行運(yùn)算導(dǎo)致無(wú)法充分利用計(jì)算資源。有研究[18]報(bào)道將電子健康記錄中事件之間的時(shí)間關(guān)系進(jìn)行建模進(jìn)行心力衰竭早期診斷。而Transformer使用自注意力機(jī)制,會(huì)計(jì)算序列每個(gè)元素與其他元素的相似度,實(shí)現(xiàn)全局依賴關(guān)系的捕捉且容易進(jìn)行改進(jìn)和擴(kuò)展。Transformer最初用于自然語(yǔ)言中,如Bert模型[19],隨后在圖像數(shù)據(jù)中也大放異彩[20]。研究者也嘗試將其引入醫(yī)學(xué)領(lǐng)域,如使用影像學(xué)和臨床特征在早期預(yù)測(cè)非小細(xì)胞肺癌患者的總生存期和無(wú)復(fù)發(fā)生存期[21]。值得一提的是,Transformer需要巨大的訓(xùn)練數(shù)據(jù)和計(jì)算資源。此外還有對(duì)抗生成網(wǎng)絡(luò),其由生成器和判別器組成,通過(guò)競(jìng)爭(zhēng)訓(xùn)練生成器生成逼真數(shù)據(jù),用于生成高質(zhì)量的圖像、音頻或其他數(shù)據(jù)。在醫(yī)學(xué)領(lǐng)域,研究者嘗試?yán)闷鋸幕颊進(jìn)RI圖像生成對(duì)應(yīng)的CT圖像以避免暴露于輻射[22]以及使用低質(zhì)量圖像進(jìn)行超分辨率重建,進(jìn)而獲得高質(zhì)量超聲圖像[23]。但對(duì)抗生成網(wǎng)絡(luò)也有缺點(diǎn):難以收斂,不穩(wěn)定,因此需要更多訓(xùn)練技巧。
應(yīng)用人工智能技術(shù),除了選擇高效合適的模型外,數(shù)據(jù)的可靠性直接影響到模型的魯棒性。在醫(yī)學(xué)領(lǐng)域,數(shù)據(jù)稀缺[24-25]和類不平衡[22,26]兩大問(wèn)題限制了人工智能在醫(yī)學(xué)領(lǐng)域的進(jìn)一步發(fā)展與應(yīng)用。通過(guò)幾何、色彩和噪聲引入等直接對(duì)原有數(shù)據(jù)進(jìn)行變換,或是訓(xùn)練中在特征空間進(jìn)行增強(qiáng)和利用對(duì)抗網(wǎng)絡(luò)生成數(shù)據(jù)等技術(shù),亦或微調(diào)預(yù)訓(xùn)練模型權(quán)重的遷移學(xué)習(xí)是解決數(shù)據(jù)稀缺的常用方法。針對(duì)類不平衡,可通過(guò)重采樣和特征選擇的數(shù)據(jù)預(yù)處理以及在模型層面納入代價(jià)敏感策略來(lái)嘗試解決。
細(xì)胞圖像蘊(yùn)含海量信息,人工智能通過(guò)對(duì)細(xì)胞形態(tài)、功能及亞細(xì)胞形態(tài)、功能的定性和定量分析,獲得大量的細(xì)胞特征信息,能夠幫助研究者更好地把握細(xì)胞結(jié)構(gòu)與功能的變化,從而理解細(xì)胞的生命過(guò)程及運(yùn)作機(jī)制。
3.1.1 提高類器官圖像質(zhì)量
類器官圖像分析的前提條件是獲取高質(zhì)量的類器官圖像,以便能充分和正確地提取圖像特征,尤其在需要使用機(jī)器學(xué)習(xí)這一數(shù)據(jù)驅(qū)動(dòng)型人工智能方法進(jìn)行后續(xù)分析的時(shí)候。由于成像技術(shù)和類器官的自身?xiàng)l件,研究者往往無(wú)法得到高質(zhì)量圖像。例如類器官為避免光毒性而需要快速采集和降低光照,往往無(wú)法得到高質(zhì)量圖像,為此McAleer等[27]提出兩種深度學(xué)習(xí)模型(基于U-NET和基于patch的回歸模型),通過(guò)在雙光子激發(fā)熒光下采集的類器官(人視網(wǎng)膜和皮膚類器官)低分辨率圖像和對(duì)應(yīng)的高分辨率圖像組成的訓(xùn)練集上訓(xùn)練后,能夠?qū)崿F(xiàn)圖像超分辨率重建,以達(dá)到使用減少光暴露來(lái)獲取高分辨類器官圖像的目的,并在這兩種類器官保留測(cè)試集上圖像重建指標(biāo)(均方誤差和結(jié)構(gòu)相似性)顯示兩種深度學(xué)習(xí)擁有良好的性能。
另外,成像技術(shù)的限制也會(huì)造就圖像質(zhì)量不佳,如定量相位成像技術(shù)會(huì)造成類器官相位包裹問(wèn)題。Yang等[28]針對(duì)此問(wèn)題提出了一種基于深度圖像先驗(yàn)的類U-net深度學(xué)習(xí)模型,能通過(guò)對(duì)類器官相位包裹圖像的擬合,從而達(dá)到無(wú)需訓(xùn)練集預(yù)訓(xùn)練模型來(lái)進(jìn)行相位展開,進(jìn)而修正類器官偽影還原真實(shí)圖像的效果,與其他方法(未加權(quán)最小二乘算法、相位展開最大流量算法等)在小鼠腸道類器官相比較,效果良好。
3.1.2 快速識(shí)別和分割類器官
大多數(shù)生物圖像分析的第一步是目標(biāo)識(shí)別和圖像分割,幫助研究者定位和提取感興趣區(qū)域以便進(jìn)行更準(zhǔn)確的分析和診斷。但類器官懸浮在三維空間中及其由數(shù)千個(gè)跨越數(shù)百微米的單個(gè)細(xì)胞組成,造就其龐大的規(guī)模。導(dǎo)致類器官成像常常出現(xiàn)遮擋、失焦、大小和形狀上的巨大異質(zhì)性以及高密度或高度稀疏的類器官分布,這給類器官的識(shí)別與分割造成巨大困難。有鑒于此,Kassis等[29]選擇焦點(diǎn)中具有最多人腸道類器官的位置進(jìn)行明場(chǎng)成像,再對(duì)該圖像上的類器官進(jìn)行位置、大小標(biāo)注,在訓(xùn)練集上訓(xùn)練基于R-CNN的深度學(xué)習(xí)模型,訓(xùn)練完成后的模型能對(duì)人腸道類器官自動(dòng)定位,標(biāo)志質(zhì)量(平均精度=80%)與人工相似,但速度更快。
二維成像雖然能一定程度地表征類器官,但三維成像更能展現(xiàn)它的復(fù)雜性和形態(tài)特征。Bao等[30]使用多尺度信息引導(dǎo)優(yōu)化的神經(jīng)網(wǎng)絡(luò)EGONet對(duì)光學(xué)相干斷層掃描技術(shù)得到的肝、胃和腸三類癌癥類器官的三維圖像進(jìn)行監(jiān)督分割,對(duì)比其他的單神經(jīng)網(wǎng)絡(luò),其在精度、靈敏度、Dice和Jacard等指標(biāo)上擁有最佳性能,尤其是對(duì)直徑≥50 μm的類器官?;诜指畹暮罄m(xù)分析表明,類器官的生長(zhǎng)過(guò)程經(jīng)歷了體積增大、空腔形成和融合等形態(tài)學(xué)變化;此外,類器官的生長(zhǎng)速度與初始尺度有關(guān)。Garrett等[31]通過(guò)擴(kuò)展他們?cè)诮M織學(xué)切片中描繪細(xì)胞核的深度學(xué)習(xí)方法擴(kuò)展到三維并改進(jìn)損失函數(shù),在已標(biāo)注的具有不同突變?nèi)橄侔┘?xì)胞系培養(yǎng)的類器官共聚焦圖像上訓(xùn)練,隨后在驗(yàn)證集分割效果與另一神經(jīng)網(wǎng)絡(luò)模型3D-Unet比較,F(xiàn)1為0.83,有所提高。
Sun等[32]則選擇磁粒子成像,對(duì)移植到小鼠腎囊的經(jīng)超順磁性氧化鐵納米顆粒標(biāo)記的胰島類器官進(jìn)行成像,隨后使用機(jī)器學(xué)習(xí)算法k-means進(jìn)行三維圖像分割,完成對(duì)感興趣區(qū)域的監(jiān)測(cè)和其含鐵量的估計(jì),實(shí)現(xiàn)對(duì)體內(nèi)移植胰島類器官的量化監(jiān)測(cè)。Gritti等[33]開發(fā)了MOrgAna軟件使用機(jī)器學(xué)習(xí)解決不同顯微鏡設(shè)備、放大倍率和視野獲得的圖像問(wèn)題;隨后使用不同拍攝條件下獲得的人腦類器官、小鼠胚胎類器官和腸類器官與CellProfiler及OrganoSeg兩種工具進(jìn)行比較,在Jaccard距離、精度和準(zhǔn)確性等標(biāo)準(zhǔn)指標(biāo)上有所提高。但其要求每張圖像只有一個(gè)對(duì)象,可能限制其應(yīng)用。
3.1.3 幫助類器官進(jìn)行形態(tài)學(xué)分類
類器官形態(tài)分類可以幫助我們更好地理解類器官結(jié)構(gòu)、狀態(tài)和功能之間的關(guān)系。例如,Abdul等[34]開發(fā)了一種基于深度學(xué)習(xí)的工具(D-CryptO)并對(duì)結(jié)直腸類器官進(jìn)行分類,經(jīng)過(guò)標(biāo)注圖片訓(xùn)練后,能以98.00%的準(zhǔn)確率區(qū)分透明和不透明的類器官以及以90.87%的準(zhǔn)確率區(qū)分球形和出芽類器官?;诖说念惼鞴賯鞔?、短期暴露于外部刺激和藥物治療的形態(tài)學(xué)分析能捕捉結(jié)腸類器官對(duì)不同作用下反應(yīng)方式的變化。Okamoto等[35]將結(jié)直腸癌類器官按形態(tài)分為6類后作為分類訓(xùn)練集,訓(xùn)練分類器支持向量機(jī)和DensNet201,結(jié)果顯示,分類準(zhǔn)確度與人工相當(dāng)。整個(gè)模塊訓(xùn)練后實(shí)現(xiàn)全自動(dòng)、高準(zhǔn)確率地對(duì)圖像中結(jié)直腸癌類器官進(jìn)行識(shí)別并分類,為其后續(xù)不同形態(tài)類器官基因差異表達(dá)分析提供支撐。
Kegeles等[36]使用單個(gè)視網(wǎng)膜類器官第5天明場(chǎng)圖像和第9天熒光報(bào)告結(jié)果為分化標(biāo)簽制作訓(xùn)練集,對(duì)比訓(xùn)練4個(gè)神經(jīng)網(wǎng)絡(luò)(ResNet50v2、VGG19、Xception和DenseNet121)后選擇ResNet50v2實(shí)現(xiàn)根據(jù)第5天明場(chǎng)圖像實(shí)現(xiàn)非侵入式預(yù)測(cè)單個(gè)視網(wǎng)膜類器官分化。在測(cè)試集上結(jié)果顯示,卷積神經(jīng)網(wǎng)絡(luò)在分化早期階段預(yù)測(cè)視網(wǎng)膜類器官分化方面,準(zhǔn)確度(0.84)高于人工(0.67±0.06),證實(shí)神經(jīng)網(wǎng)絡(luò)在報(bào)告基因表達(dá)開始之前可以成功地識(shí)別和預(yù)測(cè)類器官的視網(wǎng)膜分化。
Mergenthaler等[37]為解決特征選擇對(duì)類器官帶來(lái)的挑戰(zhàn),開發(fā)了數(shù)據(jù)驅(qū)動(dòng)的基于體素的特征結(jié)合機(jī)器學(xué)習(xí)的方法對(duì)三維圖像數(shù)據(jù)進(jìn)行自動(dòng)定量表型分析,并研究了不同癌基因表達(dá)(SNAIL、Bcl-XL和Bcl-2等)下對(duì)人乳腺腺泡類器官的形態(tài)影響。結(jié)果顯示,該方法相比于使用二維形態(tài)和預(yù)定義的三維特征能實(shí)現(xiàn)更小的計(jì)算量和更好的聚類與分類效果,并顯示與先前類器官惡性轉(zhuǎn)化中癌基因作用的研究結(jié)果吻合。
3.1.4 實(shí)現(xiàn)對(duì)類器官的自動(dòng)追蹤
類器官的顯著優(yōu)點(diǎn)是可以進(jìn)行實(shí)時(shí)觀察,以研究空間和時(shí)間上的復(fù)雜細(xì)胞生命活動(dòng)過(guò)程[38]。為了能對(duì)類器官實(shí)現(xiàn)跨時(shí)間追蹤,Hradecká等[39]提出了一個(gè)工作流程,使用人工標(biāo)注的真實(shí)類器官圖像和由條件生成對(duì)抗網(wǎng)絡(luò)生成的圖像數(shù)據(jù)訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)U-Net,實(shí)現(xiàn)類器官分割。結(jié)合后續(xù)的形狀相似約束和實(shí)例分割糾正的跟蹤步驟來(lái)關(guān)聯(lián)相應(yīng)的類器官。在不同表型的小鼠乳腺上皮類器官序列上對(duì)其進(jìn)行驗(yàn)證,在檢測(cè)精度、分割精度和邊界定位誤差等指標(biāo)上達(dá)到了與人工相當(dāng)?shù)男阅?。但該研究使用的?shù)據(jù)是局部圖像,每次需要重新對(duì)焦所需區(qū)域,可能會(huì)限制其應(yīng)用。而Bian等[40]則使用拼接和景深合成處理高通量采集的小鼠肝臟類器官和肺泡類器官圖片,得到全景明場(chǎng)圖。經(jīng)過(guò)標(biāo)注后作為訓(xùn)練集,訓(xùn)練目標(biāo)檢測(cè)神經(jīng)網(wǎng)絡(luò)SSD模型,進(jìn)而識(shí)別圖像中單個(gè)類器官,再以單個(gè)類器官不同時(shí)刻圖像和位置標(biāo)注為一個(gè)訓(xùn)練樣本的形式作為訓(xùn)練集,訓(xùn)練基于ResNet的跟蹤模型,實(shí)現(xiàn)對(duì)單個(gè)類器官的跟蹤。Kok等[41]則希望跟蹤類器官中的細(xì)胞,以便在單細(xì)胞水平上研究細(xì)胞的生長(zhǎng)和穩(wěn)態(tài)。使用U-Net神經(jīng)網(wǎng)絡(luò)架構(gòu),通過(guò)注釋細(xì)胞核來(lái)訓(xùn)練網(wǎng)絡(luò)預(yù)測(cè)每個(gè)細(xì)胞核的中心位置,結(jié)合之后的鏈接算法和手動(dòng)糾錯(cuò)完成細(xì)胞追蹤,實(shí)現(xiàn)半自動(dòng)類器官細(xì)胞追蹤,與手動(dòng)追蹤相比速度提升。
3.1.5 人工智能在其他類器官圖像處理中的應(yīng)用
除了分割、檢測(cè)和分類等計(jì)算機(jī)視覺常規(guī)任務(wù),研究者嘗試將生物學(xué)信息融入類器官圖像研究中。Ballweg等[42]使用機(jī)器學(xué)習(xí)隨機(jī)森林算法處理由胃類器官的延時(shí)共聚焦顯微鏡收集的時(shí)間過(guò)程數(shù)據(jù)分解得到的靜態(tài)特征,分析了分子水平事件(肌動(dòng)蛋白聚合和解聚)與細(xì)胞水平的行為(損傷修復(fù)、細(xì)胞剝落)的聯(lián)系,揭示了肌動(dòng)蛋白聚合時(shí)間在決定胃修復(fù)過(guò)程中涉及的細(xì)胞水平行為中的關(guān)鍵作用,為我們了解單個(gè)胃類器官如何調(diào)節(jié)修復(fù)提供了數(shù)據(jù)驅(qū)動(dòng)的見解。Libby等[43]將機(jī)器學(xué)習(xí)、數(shù)學(xué)模式和基因工程優(yōu)化相結(jié)合,創(chuàng)建了一種數(shù)據(jù)驅(qū)動(dòng)的方法,通過(guò)敲除顯示影響干細(xì)胞集落組織的基因CDH1和ROCK1來(lái)控制多能干細(xì)胞自組織。使用擴(kuò)展的Cellular Potts模型在計(jì)算機(jī)上對(duì)體外系統(tǒng)進(jìn)行計(jì)算復(fù)制,使機(jī)器學(xué)習(xí)驅(qū)動(dòng)的參數(shù)優(yōu)化能夠產(chǎn)生所需的模式,從而實(shí)現(xiàn)通過(guò)機(jī)器學(xué)習(xí)對(duì)多能干細(xì)胞行為的模型驅(qū)動(dòng)探索,準(zhǔn)確預(yù)測(cè)形態(tài)發(fā)生動(dòng)力學(xué),進(jìn)而實(shí)現(xiàn)多細(xì)胞模式的空間控制及更好地設(shè)計(jì)類器官。
3.2.1 便捷評(píng)估類器官保真度
癌癥模型的泛化性和功效源于它對(duì)所研究腫瘤的保真度,為了能客觀公正而快速地評(píng)價(jià)腫瘤類器官對(duì)患者疾病忠實(shí)反映程度,Chen等[44]利用機(jī)器學(xué)習(xí)方法結(jié)合其培養(yǎng)結(jié)直腸癌類器官的單細(xì)胞轉(zhuǎn)錄組學(xué)數(shù)據(jù)對(duì)類器官亞型進(jìn)行無(wú)偏聚類。結(jié)果顯示,類器官中的異質(zhì)性仍然保持良好,展示出高度的多樣性。Peng等[45]采用機(jī)器學(xué)習(xí)算法,開發(fā)出計(jì)算工具,可以排除平臺(tái)和物種的干擾,進(jìn)而利用轉(zhuǎn)錄組學(xué)數(shù)據(jù)定量評(píng)估癌癥模型與22種自然發(fā)生的腫瘤類型和36種亞型之間的相似性,并開發(fā)出計(jì)算工具。隨后用該工具來(lái)測(cè)量腫瘤類器官、細(xì)胞系、源自患者的異種移植物和基因工程小鼠模型與自然產(chǎn)生人類腫瘤的相似性,結(jié)果顯示,患者類器官和基因工程小鼠相比其他兩種模型擁有更高的轉(zhuǎn)錄保真度。
3.2.2 深度挖掘組學(xué)數(shù)據(jù)
使用人工智能方法對(duì)類器官組學(xué)數(shù)據(jù)進(jìn)行分析,可幫助研究者識(shí)別不同細(xì)胞類型和細(xì)胞狀態(tài)轉(zhuǎn)換,揭示細(xì)胞發(fā)育和疾病發(fā)展的動(dòng)態(tài)過(guò)程。Feng等[46]使用基于機(jī)器學(xué)習(xí)隨機(jī)森林的標(biāo)簽轉(zhuǎn)移方法結(jié)合原代人類胎兒心臟細(xì)胞的細(xì)胞注釋(細(xì)胞類型、腔室和偏側(cè)性),實(shí)現(xiàn)客觀的基于RNA-seq對(duì)類器官系統(tǒng)分化的細(xì)胞進(jìn)行表征。通過(guò)該方法對(duì)比和分析野生型細(xì)胞系衍生的類器官與攜帶三尖瓣下移畸形相關(guān)基因的類器官,確定腔室發(fā)育缺陷。He等[47]開發(fā)了一種機(jī)器學(xué)習(xí)框架,實(shí)現(xiàn)在細(xì)胞分辨率上比較大腦和類器官的基因表達(dá)分析,以識(shí)別保守和特異的發(fā)育軌跡,以及發(fā)育表達(dá)的基因和功能。Devall等[48]利用機(jī)器學(xué)習(xí)算法和RNA-seq來(lái)解釋致癌物對(duì)正常人結(jié)腸上皮細(xì)胞的早期轉(zhuǎn)錄組學(xué)和細(xì)胞學(xué)效應(yīng),確定了將結(jié)腸類器官暴露于單一劑量的致癌物混合物(包括MelQx、PhIP、BaP和NDEA)24 h后基因表達(dá)的差異。該研究結(jié)果觀察到在暴露于致癌物質(zhì)的結(jié)腸類器官中存在強(qiáng)大的轉(zhuǎn)錄組反應(yīng),揭示了細(xì)胞組成的選擇性變化。Kim等[49]使用基于圖像的機(jī)器學(xué)習(xí)方法分析14 d胚狀體類器官的單細(xì)胞轉(zhuǎn)錄組學(xué)數(shù)據(jù)來(lái)推斷細(xì)胞狀態(tài)和譜系軌跡,為后續(xù)轉(zhuǎn)錄和表觀遺傳學(xué)調(diào)控因子的驗(yàn)證奠定了基礎(chǔ)。
類器官電信號(hào)和光譜等類型的數(shù)據(jù)逐漸被研究者采用,以實(shí)現(xiàn)更全面地表征并揭示類器官的特征和生長(zhǎng)過(guò)程。Hasib等[50]使用局部場(chǎng)電位信號(hào)結(jié)合機(jī)器學(xué)習(xí)支持向量機(jī)和深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)兩種方案,實(shí)現(xiàn)高性能區(qū)分6個(gè)月(AUC分別為0.993和0.996)和12個(gè)月(AUC分別為0.881和0.997)下CHD2突變類器官與對(duì)照類器官。該研究結(jié)果揭示僅少數(shù)局部場(chǎng)電位特征包含突變特異性信息,并顯示了其隨時(shí)間的變化,證明了使用局部場(chǎng)電位信號(hào)表征類器官的可行性。Tubbesing等[51]使用拉曼共聚焦法獲取不同因子處理后被固定的小鼠唾液腺類器官細(xì)胞密集區(qū)域的拉曼光譜,將光譜與其對(duì)應(yīng)處理因子標(biāo)簽作為訓(xùn)練集,訓(xùn)練機(jī)器學(xué)習(xí)RSVM模型,隨后在活的小鼠唾液腺類器官進(jìn)行相同操作,結(jié)果顯示,EFG處理、FEF2處理、對(duì)照組相互區(qū)分準(zhǔn)確率為76%~81%,因此實(shí)現(xiàn)對(duì)不同分化狀態(tài)類器官進(jìn)行降低基質(zhì)膠信號(hào)干擾、無(wú)標(biāo)記和無(wú)損的分類。Becker等[52]使用神經(jīng)網(wǎng)絡(luò)FeaSel-Net和機(jī)器學(xué)習(xí)方法主成分分析與k均值聚類結(jié)合不同藥物處理下的膀胱癌類器官熒光和拉曼光譜數(shù)據(jù)來(lái)尋找生物標(biāo)志物,隨后使用挑選的拉曼光譜生物標(biāo)志物進(jìn)行分類,雖然準(zhǔn)確率僅在73%~87%,但考慮到其僅使用了不到原光譜數(shù)據(jù)的1%,降低了數(shù)據(jù)的復(fù)雜性,改進(jìn)了用于藥物特異性反應(yīng)的分類。
藥物篩選是類器官應(yīng)用的一個(gè)重要方面,人工智能的介入能更好地實(shí)時(shí)監(jiān)測(cè)和快速采集與分析數(shù)據(jù)以反饋調(diào)整和優(yōu)化篩選過(guò)程。此外,藥物篩選預(yù)測(cè)類器官對(duì)于藥物和治療方案的響應(yīng),人工智能可提升篩選的效率、成功率,減少實(shí)驗(yàn)的成本和時(shí)間以加速個(gè)體化治療的進(jìn)度。
3.4.1 監(jiān)測(cè)藥物作用于類器官的過(guò)程
基于ATP的活力檢測(cè)和活體染料是確定藥物效果的傳統(tǒng)方法,但有著明顯的缺點(diǎn):侵入式測(cè)定會(huì)在一定程度上影響類器官藥篩過(guò)程,細(xì)胞水平的測(cè)定需要跨細(xì)胞整理并掩蓋類器官異質(zhì)性。而使用人工智能結(jié)合類器官圖像能實(shí)現(xiàn)非侵入、定量和實(shí)時(shí)快速地監(jiān)測(cè)類器官對(duì)藥物的響應(yīng)。Spiller等[53]通過(guò)高內(nèi)涵顯微鏡獲取178個(gè)結(jié)直腸癌類器官不同時(shí)間點(diǎn)的明場(chǎng)圖像,統(tǒng)計(jì)單個(gè)類器官形態(tài)測(cè)量和紋理信息,訓(xùn)練機(jī)器學(xué)習(xí)線性模型。結(jié)果顯示,在保留的測(cè)試集上,與專家和DRAQ7染色的一致性分別為78%和61%。該研究隨后還使用該模型非破壞性跟蹤3例不同患者的類器官對(duì)伊立替康和奧沙利鉑的7天動(dòng)態(tài)響應(yīng),展現(xiàn)出捕捉患者特異性藥物反應(yīng)的能力。Larsen等[54]建立基于條件生成對(duì)抗網(wǎng)絡(luò)(RCA網(wǎng)絡(luò))的治療分析模型,該模型利用混合損失層來(lái)改進(jìn)生成的熒光讀數(shù),并包括一個(gè)額外的分支來(lái)預(yù)測(cè)明場(chǎng)圖像對(duì)應(yīng)的數(shù)據(jù)。該模型接受9種不同類型的癌癥29 165配對(duì)明場(chǎng)和3通道熒光圖像的訓(xùn)練,最終能夠使用明場(chǎng)圖像預(yù)測(cè)對(duì)應(yīng)熒光圖像和活力讀數(shù),即可以通過(guò)簡(jiǎn)單的光學(xué)顯微鏡預(yù)測(cè)熒光活體染料染色表型,實(shí)現(xiàn)藥物反應(yīng)監(jiān)測(cè),從而降低了高通量篩選的成本,也節(jié)省了時(shí)間。與基于代謝的測(cè)定相比,通過(guò)光學(xué)顯微鏡預(yù)測(cè)藥物反應(yīng)的RCA網(wǎng)絡(luò)能以很高的重現(xiàn)性和較少的生物量輸入來(lái)確定藥物敏感性,特別是使用縱向延時(shí)成像,這為克服個(gè)性化體外藥物測(cè)試中的時(shí)間障礙提供了可能性。
3.4.2 預(yù)測(cè)類器官對(duì)藥物的反應(yīng)
藥物篩選的周期長(zhǎng)、費(fèi)用高、失敗率高,類器官結(jié)合人工智能技術(shù)對(duì)藥物作用效果實(shí)現(xiàn)了準(zhǔn)確預(yù)測(cè)和分析,可提高研發(fā)效率,提高藥物安全性,優(yōu)化個(gè)性化臨床治療方案。Kong等[55]使用機(jī)器學(xué)習(xí)方法(嶺回歸、線性回歸和支持向量回歸),結(jié)合結(jié)直腸癌和膀胱癌類器官藥物基因組篩查數(shù)據(jù)構(gòu)建類器官藥物反應(yīng)預(yù)測(cè)模型,來(lái)挑選潛在藥物的生物標(biāo)志物。隨后使用挑選的生物標(biāo)志物準(zhǔn)確預(yù)測(cè)了114例5-FU治療的結(jié)直腸癌患者和77例順鉑(cisplatin,DDP)治療的膀胱癌患者的效果,接受治療的預(yù)測(cè)應(yīng)答者比預(yù)測(cè)無(wú)應(yīng)答者有更好的生存結(jié)果(P5-FU=0.014;PDDP=0.01)。這種將網(wǎng)絡(luò)分析結(jié)合到機(jī)器學(xué)習(xí)框架中的方法實(shí)現(xiàn)了使用類器官模型準(zhǔn)確識(shí)別穩(wěn)健的藥物反應(yīng)生物標(biāo)志物以改善治療結(jié)果,拉近了類器官與臨床的距離。Park等[56]在確定患者來(lái)源的直腸癌類器官的照射反應(yīng)與實(shí)際放療結(jié)果之間的相關(guān)性后,使用類器官生存分?jǐn)?shù)建立基于機(jī)器學(xué)習(xí)方法隨機(jī)森林的放射治療結(jié)果預(yù)測(cè)模型,用于預(yù)測(cè)良好應(yīng)答和低應(yīng)答,模型準(zhǔn)確度值分別為81.5%和92.1%。Esmail等[57]因腦類器官培養(yǎng)昂貴、耗時(shí),著眼于腦類器官的計(jì)算機(jī)模擬。Esmail等[57]使用遞歸神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)和進(jìn)化系統(tǒng)等方法,聯(lián)合開發(fā)了包含4 516個(gè)基因/蛋白質(zhì)或表型概念和41 493非零關(guān)系的系統(tǒng),結(jié)果顯示,與公布的濕實(shí)驗(yàn)數(shù)據(jù)結(jié)果相比,無(wú)偏二項(xiàng)檢驗(yàn)顯示其成功預(yù)測(cè)了全腦類器官常見的9種神經(jīng)細(xì)胞類型、7種腹側(cè)-背側(cè)區(qū)域、6種大腦皮層、酸堿狀態(tài)、細(xì)胞應(yīng)激等的表達(dá),這種低成本和易于定制的類器官模擬可用于許多神經(jīng)系統(tǒng)疾病模擬并帶來(lái)重要的治療見解。有研究[58]對(duì)異染性腦白質(zhì)營(yíng)養(yǎng)不良的全腦類器官進(jìn)行模擬,并模擬861種單藥和雙藥組合對(duì)該類器官的作用,提出幾種雙藥組合作為潛在的治療方案,將為罕見病的發(fā)病機(jī)制、疾病進(jìn)展和治療的評(píng)估提供新的手段。
盡管人工智能在類器官研究中逐漸應(yīng)用并展現(xiàn)出良好的性能,但也面臨如下困難。首先,某些類器官數(shù)據(jù)難以獲取,數(shù)據(jù)集樣本量和完備性不佳使得機(jī)器學(xué)習(xí)這一數(shù)據(jù)驅(qū)動(dòng)型方法建立的模型可能在單一來(lái)源的樣本上雖表現(xiàn)突出但泛化性能差。同時(shí),不同研究中數(shù)據(jù)質(zhì)量、來(lái)源和格式等的差異使得很難實(shí)現(xiàn)合并以充分利用來(lái)改善這種情況。其次,很多研究報(bào)道僅采用準(zhǔn)確性或受試者工作特征(receiver operating characteristic,ROC)曲線等性能指標(biāo),但這些指標(biāo)可能并不能充分客觀地評(píng)價(jià)模型。只有對(duì)輸入到輸出的因果關(guān)系進(jìn)行說(shuō)明,打破人工智能模型的黑盒性質(zhì),提高可解釋性才能更好地提高信任度。再次,多數(shù)研究使用單一類型數(shù)據(jù)或針對(duì)單一任務(wù)進(jìn)行建模,但單一模態(tài)數(shù)據(jù)可能存在信息缺失以及許多研究任務(wù)之間擁有相關(guān)性,存在特征共享。進(jìn)行多任務(wù)和多模態(tài)建??梢蕴岣邤?shù)據(jù)的利用效率與模型泛化性,并提供多角度、更全面分析。此外,現(xiàn)有的應(yīng)用大部分集中于高通量成像和分析技術(shù)的集成,更多的研究范式需要被挖掘,例如使用微流體和其他芯片實(shí)驗(yàn)室技術(shù)將類器官與人工智能連接起來(lái)。這些系統(tǒng)可以精確控制類器官周圍的環(huán)境,使研究人員能夠研究復(fù)雜的生物學(xué)過(guò)程,并對(duì)單個(gè)細(xì)胞或細(xì)胞群的生物學(xué)行為進(jìn)行預(yù)測(cè)[59]。
人工智能技術(shù)促進(jìn)了類器官研究的準(zhǔn)確度、客觀性和復(fù)雜數(shù)據(jù)的處理能力。盡管仍存在不少障礙,但我們相信隨著越來(lái)越多生物學(xué)、醫(yī)學(xué)和人工智能領(lǐng)域的科研人員參與到類器官的研究中,人工智能會(huì)在類器官研究中發(fā)揮重要作用,加速類器官向臨床轉(zhuǎn)化和精準(zhǔn)治療。
利益沖突聲明:所有作者均聲明不存在利益沖突。
作者貢獻(xiàn)聲明:
吳洪基:調(diào)查研究、撰寫初稿、審讀和修訂。
王海霞:撰寫初稿、審讀和修訂。
汪 玲:寫作、審讀和修訂。
羅小剛:寫作、審讀和修訂。
鄒冬玲:總體構(gòu)思、寫作指導(dǎo)、資金支持。