徐文浩,田 熙,艾合太木江·安外爾,瞿元元,施國海,張海梁,葉定偉
復旦大學附屬腫瘤醫(yī)院泌尿外科,復旦大學上海醫(yī)學院腫瘤學系,上海 200032
惡性腫瘤已占中國居民死因的23.91%,且發(fā)病率逐年升高,成為社會普遍關注的健康問題[1]。人工智能(artificial intelligence,AI)是指能夠模擬、延伸和擴展人類智能的一套計算機科學理論、方法、技術及應用系統(tǒng),試圖發(fā)展計算機的智能來模仿人類的工作和思維方式[2]。其概念于1956年被首次提出,旨在研究如何通過利用計算機的軟硬件特色模擬人類智能思維的基本理論、方法和技術,現(xiàn)已對生產、生活的多個學科領域產生了深遠影響。AI在醫(yī)療衛(wèi)生領域的應用不斷發(fā)展,2017年國務院正式印發(fā)的《新一代人工智能發(fā)展規(guī)劃》中明確指出要推廣智能醫(yī)療,建立快速精準的智能醫(yī)療體系,探索建設智慧醫(yī)院并加強群體智能健康管理。機器學習(machine learning,ML)是AI不可或缺的一部分,它將統(tǒng)計模型應用于機器,并允許它們以智能的方式獨立運行,而無需一組明確的命令[3-4]。深度學習是ML的一個子類,它利用人工神經網絡(artificial neural network,ANN)來模仿生物神經系統(tǒng)的結構方式及信息處理方式[5]。ANN具有可以充當神經元的人工節(jié)點的多層集合,這些人工節(jié)點接受輸入,處理數(shù)據(jù),最后將其傳遞給其他神經元。
在醫(yī)學的其他領域中,AI已經扮演不可或缺的重要角色,如幫助臨床醫(yī)師或科研人員進行信息管理、診斷和醫(yī)師決策[6-9]。根據(jù)最近的美國國立衛(wèi)生研究院(National Institutes of Health,NIH)醫(yī)學成像AI基礎研究路線圖,基于AI的算法將在未來10年內對臨床醫(yī)學成像實踐產生重大影響[10]。此外,在診斷中,ML已成功用于篩選更多優(yōu)質的生物標志物或疾病預測模型,以幫助診斷疾病,預測預后和復發(fā)率[11]。AI還可以通過分析骨骼X射線照片來診斷骨折,其準確度可與高級骨科醫(yī)師相媲美[12]。腫瘤是醫(yī)療健康領域的重要攻關難題,各國學者紛紛探索AI與腫瘤篩查、診斷、治療、護理和康復等領域的聯(lián)合應用[11,13-14]。鑒于其他領域的這些進步,AI在泌尿系統(tǒng)腫瘤領域具有用于診斷和治療優(yōu)化的強大潛力[15-16]。本文就AI在泌尿系統(tǒng)腫瘤領域的技術方法和應用現(xiàn)狀進行綜述,探討其面臨的機遇與挑戰(zhàn),以期為AI助力腫瘤診療和護理提供參考。
ML是AI的一大分支,即計算機借助算法模擬或實現(xiàn)人類學習行為,通過獲取新知識或技能,重新組織已有知識結構使之不斷改善自身性能的一種技術[17]。該技術不斷學習標準化的多來源數(shù)據(jù),如醫(yī)學文獻、醫(yī)療電子信息系統(tǒng)及醫(yī)學檢驗數(shù)據(jù)等,訓練出模型持續(xù)減少錯誤的發(fā)生,提高解決問題的效率和預測結局的效能,以幫助解決更多臨床問題[18-20]。
深度學習可進一步劃分為監(jiān)督學習和無監(jiān)督學習兩大類,在腫瘤病理學和影像學診斷中應用廣泛,本質就是發(fā)現(xiàn)輸入數(shù)據(jù)集中的變量標簽的結果,或直接分析數(shù)據(jù)集差異,達到鑒別分類的效果,如基于超聲圖像對乳腺癌亞型進行分類等[21-22]。監(jiān)督學習在于從輸入的樣本集中推演出目的變量的結果,常見算法包括k-近鄰(k-nearest neighbor,KNN)、決策樹(decision tree model,DTM)、樸素貝葉斯算法(Naive Bayesian algorithm,NBA)、最小絕對緊縮與選擇算子(least absolute shrinkage and selection operator,LASSO)多變量邏輯回歸、支持向量機(support vector machine,SVM)及隨機森林(random forest,RF)等。無監(jiān)督學習旨在分析沒有類別信息和目標變量的數(shù)據(jù)集,根據(jù)數(shù)據(jù)集中類似的對象生成新的分組或類別,甚至可以通過二維或三維方法可視化數(shù)據(jù)分類,常見算法包括k均值聚類分析、主成分分析(principal component analysis,PCA)等[23-25]。
自然語言處理是AI和語言學的交叉,即一門基于ML技術來實現(xiàn)人與計算機之間自然語言有效通信的技術,使得機器能夠理解人類的語言,為兩者建立起有效的溝通渠道[26]。美國IBM公司的沃森腫瘤解決方案(Watson for oncology,WFO)可使用自然語言與腫瘤患者進行實時人機互動,不僅發(fā)揮聊天機器人的作用,還能通過情感分析和關系提取隨時檢測患者的碎片化信息,總結發(fā)現(xiàn)醫(yī)師所忽視的細節(jié),為患者的身心健康保駕護航[27]。此外,自然語言處理技術也可與社交媒體結合,在幫助腫瘤患者進行決策的同時實現(xiàn)個性化診療和滿足情感需求。
自動規(guī)劃是一種問題求解技術,可以將問題分解成若干子問題并進一步解決,最終實現(xiàn)預期目標,在腫瘤個體化治療和護理方案制訂中有一定應用[28]。例如,利用該技術將彌散張量成像(diffusion tensor imaging,DTI)功能信息與磁共振成像(magnetic resonance imaging,MRI)結構信息相結合,進行腦干或前列腺腫瘤術前路徑自動規(guī)劃設計,能夠有效地引導醫(yī)師在術中規(guī)避重要的神經組織區(qū)域,降低手術風險[28-29]。
語音處理系統(tǒng)是研究語音發(fā)聲過程、語音信號統(tǒng)計特性、語音自動識別、機器合成及語音感知等各種處理技術的總稱。目前已有研究[30]通過該技術對顳葉膠質瘤術后患者的發(fā)聲及語音內容進行識別和處理,以評估患者手術恢復情況。
傳統(tǒng)的ML在開始真正意義上的普及化和商業(yè)化之前,幾乎沒有算法或系統(tǒng)程序能夠突破常規(guī)計算的束縛,專家系統(tǒng)就是這樣一個用于執(zhí)行基于復雜邏輯運算的任務系統(tǒng)[24]。主要通過一種知識表達模式將腫瘤或其他臨床領域專家知識和經驗存入計算機“專家知識庫”,再對輸入的事實(如患者診療信息等)進行邏輯推理,根據(jù)已有信息匹配“專家知識庫”中的固態(tài)條件和動態(tài)數(shù)據(jù),模擬醫(yī)學專家診斷疾病,作出開具處方藥等類似醫(yī)學專家的判斷和決策[26]。WFO即是一款目前較為成功的專家系統(tǒng),可進行癌癥患者病史總結、為患者提供治療方案建議和健康管理咨詢。
ANN分類算法即模仿人類神經活動進行分布式并行信息處理的算法數(shù)學模型,可基于系統(tǒng)復雜程度,優(yōu)化調整內部大量節(jié)點之間相互連接關系,從而達到處理信息的目的,具有自學習和自適應能力。深度卷積神經網絡(convolutional neural network,CNN)模型是一種有代表性的常用技術模型,有助于病理學或影像學圖像分類的深度學習[31]。在CNN的輔助下,計算機通過預先設計的特征變量,自動識別匹配目標圖像的最佳特征,在不依賴大量數(shù)據(jù)預處理或人類操作、干擾的情況下直接分類。在如今的臨床應用中,ANN已經逐漸廣泛用于腫瘤患者的病理學和影像學診斷,通過圖像處理技術對腫瘤圖像進行壓縮、增強、復原、匹配、描述和識別,輔助醫(yī)師進行診斷[32]。
泌尿系統(tǒng)腫瘤的診斷和處理涉及大量臨床數(shù)據(jù)的解析,包括組織學圖像、MRI及生物標志物篩選等。在使用AI診斷前列腺癌的挑戰(zhàn)中,研究者們正在開發(fā)一種去除異質性的方法來鏈接和平衡不同來源的定性數(shù)據(jù),以創(chuàng)建決策的定量指標,甚至讓AI創(chuàng)建一種使患者自己作出決定的方法[33]。盡管如此,Auffenberg等[20]最近設計了一個新模型,臨床登記數(shù)據(jù)納入了來自美國密歇根州45個不同醫(yī)院泌尿外科的7 500多例前列腺癌患者,臨床病理學數(shù)據(jù)包括前列腺穿刺活檢時的患者年齡、診斷前的前列腺特異性抗原(prostate-specific antigen,PSA)水平及Gleason評分等,以此為基礎,該團隊測試并訓練了一種ML算法來預測主要治療結果。該工具現(xiàn)已通過網絡和智能手機應用程序免費提供,使患者能夠輕松利用大量相關的臨床數(shù)據(jù)和ML算法進行長期主動監(jiān)測,更有利于患者信息隨訪。
近年來,深度學習還被用于自動化前列腺活檢組織標本的Gleason分級。盡管Gleason分級是前列腺癌患者重要的預后指標之一,但它不僅耗時較長,需要經驗豐富的病理學家和穿刺臨床醫(yī)師,并且受試者之間的可重復性有限[34]。最新研究[35]表明,泌尿系統(tǒng)腫瘤病理學家對前列腺活檢進行的Gleason評分和基于AI自動化的CNN算法結果可以達到65%的一致性,且上下偏差不超過1分。另外,ML也已被用于通過多參數(shù)MRI(multi-parameter MRI,mpMRI)圖像結合紋理特征以高精度預測Gleason評分,從而大大降低利用有創(chuàng)的前列腺活檢對癌癥診斷的需求[36]。此外,有研究[11]顯示,AI可以通過節(jié)省資源、提高可靠性和減少患者不適來改善前列腺癌診斷中的Gleason評分過程。
值得注意的是,ML的性能可因種族而異。2021年,Nayan等[37]納入美國國家癌癥中心68 630例患者,預測根治性前列腺切除術后存活率的XGBoost ML算法表現(xiàn)出不同種族的性能差異,強調了在臨床決策前應徹底評估種族亞組中的ML算法適用性,不可以因ML的結果而忽視該部分人群積極癌癥管理的重要性。Zhu等[38]研究發(fā)現(xiàn),亞洲(尤其是東亞)人群與西方人群的前列腺癌流行病學特征存在明顯差異,且東亞與歐洲后裔前列腺癌患者的基因多態(tài)性差異顯著。因此,中國的前列腺癌診療策略不適合“一邊倒”,還需結合大規(guī)模人群的不同臨床病理學和遺傳學特征,開發(fā)適用于中國前列腺癌人群的篩查、診斷和治療的AI模型,探索AI在多學科交叉融合應用中的更多契機[39]。
腎癌是致命的泌尿系統(tǒng)惡性腫瘤之一,高達25%的患者在初診時發(fā)現(xiàn)轉移[40]。腎癌的3種常見分類包括透明細胞癌、乳頭狀癌和嫌色細胞癌。由于不同腎癌類別之間腫瘤異質性極大,不同腎癌患者的的預后和治療方案也大不相同。2019年,Han等[41]創(chuàng)建了CNN算法,用于標記特定關注區(qū)域的三相計算機體層成像(computed tomography,CT)圖像來輔助腎癌分類鑒別,34個經活檢證實的病例的驗證集的曲線下面積(area under curve,AUC)高達0.9。
腎透明細胞癌通常根據(jù)Fuhrman方法進行核分級,該方法依賴于核多型性分析。然而,不同病理學家對病理學切片的分析依然存在很大的不一致,且現(xiàn)有的醫(yī)療資源無法讓每1張H-E或免疫組織化學切片被多位病理學家共同診斷。2019年,Holdbrook等[42]設計了一種SVM,可以直接從活檢的組織病理學全圖像中對這些標本進行自動分級。SVM是ML算法中應用最廣泛的一類,它使用許多功能子集(稱為支持向量)來作出最終決策,從而使它們快速有效,結果表明,所生成的自動圖像評分與另一種基于多基因檢測的評分系統(tǒng)之間存在顯著相關性,該評分系統(tǒng)可以準確預測腎癌患者預后。
此外,AI還可以被用于優(yōu)化腎癌患者的全程治療策略。晚期或高級別腎透明細胞癌患者可以通過一線細胞因子治療或酪氨酸激酶抑制劑(tyrosine kinase inhibitor,TKI)進行靶向治療[43-44]。但不同患者接受靶向治療的效果和不良反應存在極大差別,很難實現(xiàn)個體化精準治療。因此,Buchner等[45]近期開發(fā)了一種ANN,可以輸入多個參數(shù),包括但不限于治療方案、組織學類型、體重指數(shù)(body mass index,BMI)及年齡等,利用這些數(shù)據(jù),該算法能夠準確地預測患者的36個月生存率,驗證隊列的準確度達到91%。
在腎癌的ML領域,Ma等[46]首次基于眾多獨立數(shù)據(jù)隊列的共計超過1 500例腎透明細胞癌患者的轉錄組數(shù)據(jù),探索轉移和未轉移患者腫瘤組織的全基因組特征。結合臨床特征,通過多層邏輯算法和擬合回歸森林樹不斷篩選關鍵生物標志物,建立了臨床預測模型,描述腎透明細胞癌轉移發(fā)生的10個關鍵分子標志物,并且在中位隨訪時間超過72個月的380例來自復旦大學附屬腫瘤醫(yī)院隊列的腎透明細胞癌標本中進行驗證,發(fā)現(xiàn)這些分子標志物、臨床預測模型均能夠用于預測患者的不良預后,且模型預測效能達到0.758(總生存期)和0.772(無病生存期),這對缺乏明確分子分型和分子標志物的腎癌管理來說是至關重要的。在腎癌免疫治療的時代,Xu等[47]也率先對腎透明細胞癌微環(huán)境中免疫環(huán)境進行精確分組,發(fā)現(xiàn)免疫排斥型的Cluster B和C具有促腫瘤原性的免疫浸潤,并且顯示出比免疫荒漠型的Cluster A顯著更差的生存,可以作為全新的獨立預后指標,凸顯了腫瘤表型與免疫背景之間的緊密關系,提示腎癌新型免疫分型能夠很好地預測免疫檢查點抑制劑(immune checkpoint therapie,ICT)的療效。腎癌腫瘤亞型為傳統(tǒng)的腫瘤免疫理論提出了一個挑戰(zhàn):雖然該類型腫瘤突變負荷并不高,但是免疫治療對其有效;此外,腎癌中更高水平的CD8+T淋巴細胞浸潤反而可能與較差的預后相關,這為腎癌免疫精準治療帶來了更多挑戰(zhàn)[48]。隨著腫瘤免疫治療在腎癌等多種實體瘤臨床治療中的重要性逐漸提升,研究者們[49-52]陸續(xù)通過ML算法開發(fā)了如腫瘤新抗原(neoantigen)、腫瘤特異性抗原(tumor-specific antigen,TSA)、腫瘤純度(tumor purity)、腫瘤微環(huán)境(tumor microenvironment,TME)及腫瘤免疫功能障礙和排斥(tumor immune dysfunction and exclusion,TIDE)等多種評分,極大地提高了預測抗原表位免疫原性的精確性,有助于更好地篩選適合腫瘤免疫治療的群體,推動腫瘤治療精準化和個體化管理。
膀胱癌是全球第9大常見的癌癥,在老齡化人群中往往呈現(xiàn)出顯著升高的發(fā)病率和死亡率趨勢[53]。2018年,Eminaga等[54]嘗試通過開發(fā)CNN來采用AI方法解決膀胱鏡檢查術普適性的問題,該CNN算法納入479個不同案例,其中包含44個不同的泌尿外科臨床檢查結果,經過訓練算法,能夠成功地識別出膀胱鏡視野范圍下所有癌變的圖像。盡管膀胱鏡檢查是診斷膀胱癌的標準方法,但是它仍是一種侵入性的有創(chuàng)手術,非肌層浸潤的膀胱癌患者在行電切手術后仍需每年進行1次膀胱鏡復查。為解決這一難題,Eminaga等[54]最新設計了一種基于ML的方法,能夠從尿液樣本的細胞圖像中檢測出膀胱癌細胞或高度異型性的細胞,用于疾病診斷和復發(fā)預測,這種方法顯示出94%的診斷準確度,與膀胱鏡檢查相比有顯著改善。
在作出膀胱癌的診斷后,通常要進行臨床和病理學分期以確定預后和后續(xù)治療選擇。Garapati等[55]訓練了一個CNN算法用于準確使用來自CT泌尿系統(tǒng)造影術的圖像將膀胱癌患者分為以下兩組:不低于T2期或低于T2期,該模型顯示出AI不僅在診斷膀胱癌方面具有巨大潛力,而且能夠用于預測膀胱癌患者的預后和復發(fā),對患者后續(xù)和長期的治療選擇有重要指導價值。Cha等[56]納入了來自CT掃描的6 000多幅治療前后的影像,利用深度學習算法,對不同的基于放射學的預測模型進行了分析,以根據(jù)腫瘤的化學反應準確地對膀胱癌患者的治療響應率進行分類。雖然深度學習算法與放療、化療科專家在預測化療響應上的差異無統(tǒng)計學意義,但這些嘗試都為ML在泌尿系統(tǒng)腫瘤的應用打下堅實基礎。
近年來,以深度學習為代表的AI技術已經在多種腫瘤的病灶檢出、病理學分型、臨床分期、療效評價及生存預測研究等方面顯示出較為理想的效果。AI并非替代醫(yī)師作出臨床決策,而是加強和完善人機對話,讓臨床診療轉型為更智能、精準、安全、高效的方式。規(guī)范大數(shù)據(jù)標準,開展多中心研究與驗證是將AI由科研推向臨床的重要過程,需要醫(yī)、工交叉多學科的協(xié)作及共同努力。隨著科技進步及經濟發(fā)展,AI在腫瘤病理學分型、影像診斷、預測模型、手術導航及專家系統(tǒng)自動門診等領域也將更加安全并被逐漸推廣,在全國各級醫(yī)院開展AI輔助下的泌尿腫瘤診療是必然趨勢。面臨未來的機遇與挑戰(zhàn),我們需要進一步強化技術研發(fā),加強學科交叉的復合型人才培養(yǎng),使AI助力人類在戰(zhàn)勝腫瘤的道路上走的更遠,從而全面提高醫(yī)療質量。
利益沖突聲明:所有作者均聲明不存在利益沖突。