• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    深度學(xué)習(xí)輔助藥物發(fā)現(xiàn)的研究進(jìn)展

    2022-03-06 09:11:26戴青青余俊霖李國菠
    藥學(xué)進(jìn)展 2022年1期
    關(guān)鍵詞:靶標(biāo)分子預(yù)測(cè)

    戴青青,余俊霖,李國菠

    (四川大學(xué)華西藥學(xué)院藥物化學(xué)系,四川 成都 610041)

    人工智能(artificial intelligence,AI)概念始于1956年,經(jīng)過半個(gè)世紀(jì)的曲折探索,于2011年進(jìn)入蓬勃發(fā)展時(shí)期,目前已成為一門新的技術(shù)科學(xué),推動(dòng)人類進(jìn)入智能時(shí)代。深度學(xué)習(xí)(deep learning,DL),又稱為深度神經(jīng)網(wǎng)絡(luò),是AI領(lǐng)域中一個(gè)熱門研究方向,其通過對(duì)樣本數(shù)據(jù)進(jìn)行多層次的非線性信息處理和抽象,挖掘內(nèi)在規(guī)律,用于解決特征學(xué)習(xí)、分類和模式識(shí)別等問題。當(dāng)前主流的DL模型包括卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)和圖神經(jīng)網(wǎng)絡(luò)(graph neural network,GNN)等,以及這些模型的變體,如殘差卷積網(wǎng)絡(luò)模型(deep residual network, ResNet)、變分自編碼器(variational autoencoder,VAE)、對(duì)抗自編碼器(adversarial autoencoder, AAE)、生成對(duì)抗網(wǎng)絡(luò)模型(generative adversarial network,GAN)以及信息傳遞網(wǎng)絡(luò)模型(message passing neural network,MPNN)等,這些DL模型在圖像識(shí)別、語音識(shí)別、機(jī)器翻譯、人機(jī)對(duì)弈、無人駕駛等方面已取得了前所未有的成效,深刻地改變著人們的生產(chǎn)生活方式[1-2]。

    同時(shí),DL技術(shù)在醫(yī)學(xué)、藥學(xué)、生命科學(xué)等領(lǐng)域也逐漸嶄露頭角。例如,2018年Waller團(tuán)隊(duì)通過DL網(wǎng)絡(luò)對(duì)1 240萬個(gè)單步反應(yīng)進(jìn)行化學(xué)轉(zhuǎn)化規(guī)則提取,再利用3種不同的神經(jīng)網(wǎng)絡(luò)與蒙特卡洛樹搜索結(jié)合形成的新算法,實(shí)現(xiàn)了化合物合成路線的高效設(shè)計(jì)[3]。隨后, Jensen和Jamison團(tuán)隊(duì)又報(bào)道了一種集成合成路線設(shè)計(jì)和自動(dòng)化合成的平臺(tái),并完成了15個(gè)小分子藥物的自動(dòng)化合成,進(jìn)一步推動(dòng)了該領(lǐng)域的發(fā)展[4]。近期,Hassabis團(tuán)隊(duì)報(bào)道了新蛋白結(jié)構(gòu)預(yù)測(cè)工具AlphaFold2,通過將蛋白結(jié)構(gòu)的物理和生物知識(shí)整合到DL方法中,極大程度提高了蛋白結(jié)構(gòu)預(yù)測(cè)的準(zhǔn)確性[5];與此同時(shí),Baker團(tuán)隊(duì)也報(bào)道了新蛋白結(jié)構(gòu)預(yù)測(cè)工具RoseTTAFold[6],其采用了注意力機(jī)制使整個(gè)DL能夠同時(shí)學(xué)習(xí)到蛋白一級(jí)/二級(jí)/三級(jí)結(jié)構(gòu)不同維度的信息,預(yù)測(cè)準(zhǔn)確率與AlphaFold2不相上下。此外,近幾年還發(fā)展了若干DL方法用于藥物-靶標(biāo)相互作用預(yù)測(cè)、藥物靶標(biāo)預(yù)測(cè)、藥物從頭設(shè)計(jì)、藥物性質(zhì)[主要包括吸收、分布、代謝、排泄、毒性(ADMET)]的預(yù)測(cè),從而服務(wù)于創(chuàng)新藥物研發(fā)的多個(gè)重要環(huán)節(jié)。這些工具或?qū)⒏淖儎?chuàng)新藥物研發(fā)進(jìn)程,提升藥物研發(fā)效率。鑒于此,本文聚焦DL在創(chuàng)新藥物發(fā)現(xiàn)中的發(fā)展和應(yīng)用,綜述具有代表性的DL案例和研究思路,總結(jié)其應(yīng)用特點(diǎn)、面臨的問題及可能的解決策略,期望為DL在藥物發(fā)現(xiàn)領(lǐng)域的發(fā)展提供借鑒和思考。

    1 基于深度學(xué)習(xí)的蛋白結(jié)構(gòu)預(yù)測(cè)

    蛋白質(zhì)三維結(jié)構(gòu)是藥物靶標(biāo)功能研究與藥物設(shè)計(jì)的重要基礎(chǔ),如何快速高效獲得準(zhǔn)確的蛋白質(zhì)結(jié)構(gòu)是需要解決的科學(xué)問題。早期階段,研究人員基于統(tǒng)計(jì)的蛋白質(zhì)進(jìn)化信息,并采用傳統(tǒng)的機(jī)器學(xué)習(xí)方法(如蒙特卡羅方法、支持向量機(jī)等)和全連接神經(jīng)網(wǎng)絡(luò)(fully-connected neural network,F(xiàn)NN)模型實(shí)現(xiàn)蛋白質(zhì)三維結(jié)構(gòu)的預(yù)測(cè)。例如,Bohr等[7]和Fariselli等[8]使用目標(biāo)蛋白一級(jí)序列、同源蛋白序列以及關(guān)聯(lián)突變等數(shù)據(jù)來訓(xùn)練FNN模型,實(shí)現(xiàn)對(duì)蛋白質(zhì)主鏈結(jié)構(gòu)的預(yù)測(cè),但距離實(shí)現(xiàn)蛋白質(zhì)三維結(jié)構(gòu)精準(zhǔn)預(yù)測(cè)仍有較大差距。

    隨著蛋白結(jié)構(gòu)數(shù)據(jù)的不斷增加和DL技術(shù)的迅猛發(fā)展,更復(fù)雜的深度網(wǎng)絡(luò)模型和更豐富的蛋白質(zhì)序列信息被應(yīng)用于預(yù)測(cè)蛋白質(zhì)的三維結(jié)構(gòu),突破了從蛋白質(zhì)一級(jí)序列直接得到蛋白質(zhì)三維結(jié)構(gòu)的瓶頸,預(yù)測(cè)精度接近實(shí)驗(yàn)解析水平。基于DL的蛋白結(jié)構(gòu)預(yù)測(cè)是研究人員一直在嘗試和努力的方向,大致流程是通過序列比對(duì)得到進(jìn)化相關(guān)的多序列比對(duì)(multiple sequence alignment,MSA)特征,聯(lián)合蛋白序列編碼作為輸入,利用深度網(wǎng)絡(luò)模型預(yù)測(cè)殘基間的接觸圖或更具體的距離分布,以及蛋白骨架的二面角分布,然后將預(yù)測(cè)的空間結(jié)構(gòu)信息作為約束條件,重構(gòu)出蛋白三維結(jié)構(gòu)(見圖1)。例如,Hassabis團(tuán)隊(duì)最新報(bào)道的蛋白結(jié)構(gòu)預(yù)測(cè)工具AlphaFold2,在最近的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)技術(shù)評(píng)估(即The 14th Edition of Critical Assessment of Structure Prediction,CASP14)比賽中取得最佳預(yù)測(cè)名次,全局距離測(cè)試(global distance test,GDT)中位數(shù)得分達(dá)92.4,達(dá)到實(shí)驗(yàn)解析水平。AlphaFold2是基于注意力機(jī)制的神經(jīng)網(wǎng)絡(luò)模型,由Evoformer網(wǎng)絡(luò)模塊和結(jié)構(gòu)生成模塊組成,通過給定的一級(jí)序列,結(jié)合學(xué)習(xí)蛋白結(jié)構(gòu)的物理和生物知識(shí),端對(duì)端直接生成蛋白的三維結(jié)構(gòu)。Baek等[6]也基于注意力機(jī)制開發(fā)了一種新的端到端蛋白結(jié)構(gòu)預(yù)測(cè)工具RoseTTAFold。該工具是一種三軌網(wǎng)絡(luò)模型,分別用逐級(jí)連接的網(wǎng)絡(luò)來傳遞和處理來自蛋白一級(jí)、二級(jí)、三級(jí)結(jié)構(gòu)的信息,軌道之間的多次連接讓網(wǎng)絡(luò)能夠同時(shí)學(xué)習(xí)序列、殘基間距離和原子坐標(biāo)之間的關(guān)系。實(shí)驗(yàn)結(jié)果表明,RoseTTAFold不僅預(yù)測(cè)精度接近AlphaFold2,為未知結(jié)構(gòu)蛋白生物學(xué)功能和機(jī)制提供一種解釋,而且還能直接根據(jù)序列信息快速構(gòu)建出準(zhǔn)確的蛋白-蛋白復(fù)合物結(jié)構(gòu)。在所需計(jì)算資源和計(jì)算時(shí)間方面,RoseTTAFold較AlphaFold2也顯示出一定的優(yōu)勢(shì),除去序列比對(duì)和模版搜索所用時(shí)間,其僅需1個(gè)圖形處理器(graphic processing unit,GPU)就能在10 min之內(nèi)生成蛋白3D主鏈結(jié)構(gòu)。另外, Rahman等[9]在ResNet模型的基礎(chǔ)上進(jìn)行了改進(jìn),提出了一種用來預(yù)測(cè)蛋白質(zhì)殘基間距離的DL模型,相對(duì)比以上方法使用更少的蛋白特征,包括2種共同進(jìn)化特征和3種非進(jìn)化特征,實(shí)現(xiàn)對(duì)蛋白質(zhì)殘基間真實(shí)距離的高精度預(yù)測(cè),與最先進(jìn)的同類方法相比,局部距離差測(cè)試平均分?jǐn)?shù)提高了10%以上,為蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)提供了一種新的參考。

    圖1 基于深度學(xué)習(xí)的蛋白質(zhì)三維結(jié)構(gòu)預(yù)測(cè)流程Figure 1 The general process of deep learning-based 3D protein structure prediction

    此外,Yang等[10]首次提出利用GAN模型預(yù)測(cè)蛋白質(zhì)殘基-殘基接觸圖,并在基準(zhǔn)測(cè)試集上表現(xiàn)出不錯(cuò)的預(yù)測(cè)效果。該模型被命名為GANcon,GANcon通過對(duì)抗性學(xué)習(xí)策略訓(xùn)練生成模型和判別模型,最終能夠生成接近真實(shí)數(shù)據(jù)分布的接觸圖。其中,生成模型采用編碼器-解碼器框架從多種蛋白質(zhì)序列特征中捕捉潛在的殘基間接觸信息,從而生成仿真的殘基接觸圖;判別模型則選用基于殘基塊的CNN,以生成的或真實(shí)的接觸圖——蛋白質(zhì)序列特征樣本作為輸入,識(shí)別生成的接觸圖與真實(shí)接觸圖之間的差異,驅(qū)動(dòng)生成模型生成更準(zhǔn)確的接觸圖。他們還引入了一種新的對(duì)稱焦點(diǎn)損失函數(shù),用來解決接觸圖內(nèi)數(shù)據(jù)不平衡問題。但GANcon在訓(xùn)練過程中的不穩(wěn)定性以及輸入特征的選擇等方面仍有改進(jìn)空間。

    2 基于深度學(xué)習(xí)的藥物-靶標(biāo)相互作用預(yù)測(cè)

    藥物-靶標(biāo)相互作用(drug target interaction,DTI)是藥物發(fā)現(xiàn)的重要基礎(chǔ),準(zhǔn)確有效的DTI預(yù)測(cè)能極大地助力藥物研發(fā),加速先導(dǎo)或苗頭化合物發(fā)現(xiàn)。近幾年,基于DL預(yù)測(cè)DTI的方法陸續(xù)被報(bào)道,其一般工作流程如圖2所示,研究人員針對(duì)藥物和靶標(biāo)的結(jié)構(gòu)以及理化性質(zhì)構(gòu)建各具特色的描述符,并采用不同的DL網(wǎng)絡(luò)模型,學(xué)習(xí)DTI規(guī)律,最終預(yù)測(cè)出DTI的可能性或者相互作用強(qiáng)度。

    圖2 基于深度學(xué)習(xí)的藥物靶標(biāo)相互作用預(yù)測(cè)一般流程Figure 2 The general process of deep learning-based drug-target interaction prediction

    早期研究人員傾向于使用簡(jiǎn)單直接的輸入數(shù)據(jù)和結(jié)構(gòu)單一的網(wǎng)絡(luò)框架。例如采用藥物結(jié)構(gòu)信息和靶標(biāo)的序列信息,通過基礎(chǔ)版本的RNN、CNN等模型學(xué)習(xí)相互作用特征[11-12],但預(yù)測(cè)結(jié)果并不理想。研究人員分析發(fā)現(xiàn)只是純粹地使用藥物-靶標(biāo)相關(guān)信息套用DL模型不能從根本上解決問題,需在DL和藥物發(fā)現(xiàn)的雙重理論指導(dǎo)下,根據(jù)藥物、靶標(biāo)的各種性質(zhì)合理構(gòu)建輸入描述符,同時(shí)搭建適應(yīng)藥物-靶標(biāo)體系的神經(jīng)網(wǎng)絡(luò)框架,才能有效提高模型的預(yù)測(cè)能力和結(jié)果可靠性。在此基礎(chǔ)上,發(fā)展出了一系列基于格點(diǎn)、基于圖結(jié)構(gòu)以及新算法的DL網(wǎng)絡(luò),并合理引入注意力機(jī)制等算法增強(qiáng)模型的可解釋性。

    基于格點(diǎn)的特征構(gòu)建方法蘊(yùn)含更加豐富的空間信息,比較適應(yīng)于DTI預(yù)測(cè)體系。由此方法構(gòu)建的特征可以視作一幅三維圖片,可配合使用三維CNN模型進(jìn)行訓(xùn)練、學(xué)習(xí),但存在參數(shù)量大、計(jì)算成本高等問題。Li等[13]借鑒ShuffleNet、Xception等輕量級(jí)三維CNN模型[14]并構(gòu)建了DeepAtom模型,用于預(yù)測(cè)藥物-靶標(biāo)親和力。除了具備三維CNN模型的各種優(yōu)勢(shì),DeepAtom模型同時(shí)通過深度可分離卷積解決了三維CNN模型參數(shù)過多的問題,并利用多個(gè)小的卷積核代替單個(gè)大卷積核,達(dá)到減少參數(shù)的同時(shí)增加網(wǎng)絡(luò)復(fù)雜度的目的。該模型在PDBbind(2016版)核心測(cè)試集預(yù)測(cè)的皮爾森相關(guān)系數(shù)達(dá)0.831,表現(xiàn)出較強(qiáng)的預(yù)測(cè)能力。

    Zheng等[15]對(duì)DTI預(yù)測(cè)有著不同理解,他們將DTI預(yù)測(cè)抽象成虛擬問答(visual question answering,VQA)問題,采用藥物SMILES和靶標(biāo)殘基距離矩陣作為輸入,并基于CNN與RNN模型構(gòu)建了DrugVQA模型,同時(shí)引入了注意力機(jī)制以增加模型的可理解性。經(jīng)過訓(xùn)練及超參數(shù)優(yōu)化,DrugVQA模型最終在數(shù)據(jù)庫DUD-E上表現(xiàn)出不凡的預(yù)測(cè)能力,受試者工作特征曲線下面積(area under the receiver operating characteristic curve,ROC-AUC)達(dá)到0.972。

    GNN模型在此領(lǐng)域也備受關(guān)注,Cho等[16]采用了一種特殊的GNN模型,提出了InteractionNet框架,用于預(yù)測(cè)藥物-靶標(biāo)之間的結(jié)合常數(shù)。InteractionNet模型是一種非常規(guī)的GNN模型,在對(duì)藥物-靶標(biāo)體系建模時(shí)除了考慮共價(jià)鍵外,還考慮了非共價(jià)作用,最后基于PDBbind數(shù)據(jù)集采用20折交叉方法進(jìn)行驗(yàn)證,其均方根誤差(root mean square error,RMSE)為1.321,優(yōu) 于PoteintialNet模型(RMSE為1.343)。

    Zeng等[17]認(rèn)為通過拼接藥物和靶標(biāo)的特征向量來表征二者的相互作用,并不能準(zhǔn)確描述二者復(fù)雜作用體系,需要某種特殊的算法或網(wǎng)絡(luò)來解決。據(jù)此,他們提出了一種多注意力模塊MATT_DTI,首先通過相對(duì)自注意模塊提取藥物的化合物原子間聯(lián)系,用CNN模塊分別學(xué)習(xí)藥物和靶標(biāo)的隱含信息,最后通過多頭注意力模塊和全連接層提取相互作用信息并給出預(yù)測(cè)結(jié)果。該方法在KIBA和Davis數(shù)據(jù)集上表現(xiàn)良好,均比同類模型有更好的預(yù)測(cè)效果,如用KIBA數(shù)據(jù)集進(jìn)行測(cè)試,MATT_DTI模型平均標(biāo)準(zhǔn)誤差(mean squared error,MSE)在0.15左右,低于其他基準(zhǔn)模型的MSE指標(biāo)。Sajadi等[18]以藥物指紋矩陣和藥物-靶標(biāo)矩陣為輸入,構(gòu)建了一個(gè)無監(jiān)督去噪自編碼器(denoising autoencoder,DAE)模型,并將其命名為AutoDTI++。該方法在G蛋白偶聯(lián)受體(G protein-coupled receptor,GPCR)數(shù)據(jù)集上預(yù)測(cè)隨機(jī)藥物靶點(diǎn)對(duì)時(shí),ROCAUC值達(dá)0.85,與類似算法的模型測(cè)試結(jié)果相比有明顯提升。

    3 基于深度學(xué)習(xí)的藥物靶標(biāo)預(yù)測(cè)

    藥物靶標(biāo)預(yù)測(cè)可以幫助研究人員確定已知藥物或活性分子的潛在靶標(biāo),從而有助于實(shí)現(xiàn)老藥新用、藥物重定位、毒性預(yù)測(cè)等。上述DTI預(yù)測(cè)方法也可以用于藥物靶標(biāo)預(yù)測(cè)。除此之外,基于異質(zhì)網(wǎng)絡(luò)等DL方法也被用于藥物靶標(biāo)預(yù)測(cè),其特點(diǎn)在于利用藥物-疾病信息、靶標(biāo)-靶標(biāo)信息、藥物-靶標(biāo)信息等多維度信息(見圖3)作為網(wǎng)絡(luò)輸入特征,將其進(jìn)一步轉(zhuǎn)化為一組DL模型可處理的特征矩陣,實(shí)現(xiàn)對(duì)藥物靶標(biāo)的預(yù)測(cè)。

    圖3 基于機(jī)器學(xué)習(xí)——異質(zhì)網(wǎng)絡(luò)的藥物靶標(biāo)預(yù)測(cè)方法一般流程Figure 3 The general process of machine learning (heterogeneous network)-based target prediction

    自編碼器(autoencoder,AE)及其變體,如DAE等在基于異質(zhì)網(wǎng)絡(luò)的靶標(biāo)預(yù)測(cè)方法中較為主流,研究人員通過收集藥物、靶標(biāo)相關(guān)的各種信息,構(gòu)建異質(zhì)網(wǎng)絡(luò),利用各種AE變體進(jìn)行學(xué)習(xí),最終分析和預(yù)測(cè)藥物的潛在靶標(biāo)。Zeng等[19]收集了藥物-疾病、藥物-不良反應(yīng)、藥物-靶標(biāo)、藥物-藥物相關(guān)信息,以此構(gòu)建異質(zhì)網(wǎng)絡(luò),從中提取藥物與靶標(biāo)之間的關(guān)系,使用隨機(jī)游走算法計(jì)算得到概率共生矩 陣(probabilistic co-occurrence matrix,PCO),再計(jì)算正點(diǎn)互信息矩陣(positive pointwise mutual information,PPMI)來表征異質(zhì)網(wǎng)絡(luò)整體結(jié)構(gòu),用于訓(xùn)練DL網(wǎng)絡(luò)模型,由此發(fā)展了deepDR模型。該模型在基準(zhǔn)模型上,deepDR預(yù)測(cè)效果更佳,ROCAUC達(dá)0.908。后來,他們又進(jìn)一步做出了改進(jìn)[20],設(shè)計(jì)了一個(gè)新的模型(deepDTnet),該模型在輸入和框架方面都進(jìn)行了優(yōu)化,豐富了異質(zhì)網(wǎng)絡(luò)所蘊(yùn)含的信息,加入了更多靶標(biāo)相關(guān)信息,如靶標(biāo)-靶標(biāo)相似性、靶標(biāo)-疾病信息,同時(shí)保留PCO矩陣和PPMI矩陣的表征方式,采用多層DAE學(xué)習(xí)異質(zhì)網(wǎng)絡(luò)的隱含信息。與deepDR相比,deepDTnet具有更強(qiáng)的預(yù)測(cè)能力,ROC-AUC達(dá)0.963。也有研究人員通過將AE和其他網(wǎng)絡(luò)模型結(jié)合,嘗試發(fā)展了新的網(wǎng)絡(luò)模型。如Peng等[21]提出了DTI-CNN模型,特點(diǎn)在于使用Jaccard相似性系數(shù)結(jié)合重啟隨機(jī)游走算法(random walk with restart,RWR)來提取藥物特征和靶標(biāo)特征,且經(jīng)過DAE層后添加了CNN模塊來預(yù)測(cè)最終結(jié)果,訓(xùn)練后ROC-AUC達(dá)0.9416,與deepDTnet效果相當(dāng)。

    除了AE及其變體外,其他模型在藥物靶標(biāo)預(yù)測(cè)方面也展現(xiàn)出不俗的預(yù)測(cè)效果。Manoochehri等[22]利用更簡(jiǎn)單的輸入(僅考慮藥物-藥物相似性和靶標(biāo)-靶標(biāo)相似性信息)和FNN模型進(jìn)行學(xué)習(xí)預(yù)測(cè),但將更多的精力放在輸入數(shù)據(jù)的處理上,提出了獨(dú)特的特征提取和構(gòu)建方法。他們利用異質(zhì)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)來預(yù)測(cè)藥物的未知靶標(biāo),通過藥物-藥物相似性和靶標(biāo)-靶標(biāo)相似性信息把藥物-靶標(biāo)異質(zhì)網(wǎng)絡(luò)抽象成半二部圖,并從中提取出多個(gè)封閉子圖,然后采用Weisfeiler-Lehman算法對(duì)每個(gè)子圖中的節(jié)點(diǎn)進(jìn)行排序標(biāo)記,以表征藥物-靶標(biāo)對(duì)的拓?fù)浣Y(jié)構(gòu)。最后使用這種特殊的輸入來訓(xùn)練FNN模型,同時(shí)進(jìn)行了10折交叉驗(yàn)證。結(jié)果顯示,該方法比 BLMNII、CMF、HNM等同類模型預(yù)測(cè)能力更強(qiáng)。此外,GNN模型也被用來處理這些異質(zhì)網(wǎng)絡(luò),進(jìn)行藥物靶標(biāo)的預(yù)測(cè)。Huang等[23]提出了SkipGNN模型,并認(rèn)為異質(zhì)網(wǎng)絡(luò)中直接相連的2個(gè)節(jié)點(diǎn)并不一定有很強(qiáng)的相似性,反而是間接的或跳躍的節(jié)點(diǎn)間的相似性可能更加必要。根據(jù)這種思想,他們以藥物-藥物、靶標(biāo)-靶標(biāo)、藥物-靶標(biāo)、基因-疾病相關(guān)信息構(gòu)建了異質(zhì)網(wǎng)絡(luò),從中提取跳躍相似性信息并構(gòu)建跳躍相互作用圖,同時(shí)結(jié)合原始圖輸入至GNN模型中,最后經(jīng)由解碼器輸出藥物與靶標(biāo)相互作用概率。實(shí)驗(yàn)結(jié)果表明SkipGNN模型優(yōu)于其他模型,如DeepWalk、圖卷積神經(jīng)網(wǎng)絡(luò)(graph convolutional neural network,GCN)和node2vec模型等。

    4 基于深度學(xué)習(xí)的合成路線設(shè)計(jì)

    藥物研發(fā)離不開合成路線設(shè)計(jì),設(shè)計(jì)高效的合成路線可大幅度降低藥物研發(fā)成本、縮短生產(chǎn)周期、提高藥物研發(fā)效率。傳統(tǒng)的計(jì)算機(jī)輔助合成路線設(shè)計(jì)的方法主要是基于大量 “專家”規(guī)則和逆合成分析方法來規(guī)劃合成路線,但其存在設(shè)計(jì)速度較慢、設(shè)計(jì)的合成路線往往不太合理等問題[24]。隨著DL算法在化合物性質(zhì)預(yù)測(cè)和生物活性預(yù)測(cè)等領(lǐng)域中展現(xiàn)出巨大的潛力,其也逐漸被應(yīng)用于合成路線的設(shè)計(jì)并取得了一定的進(jìn)展。

    Waller團(tuán)隊(duì)于2018年報(bào)道了一種AI工具3N-MCTS,通過使用3種不同的深度神經(jīng)網(wǎng)絡(luò)(分別是拓展策略網(wǎng)絡(luò)、篩選網(wǎng)絡(luò)和展示策略網(wǎng)絡(luò))和蒙特卡洛樹搜索算法來設(shè)計(jì)目標(biāo)化合物的合成路線[3]。他們首先利用拓展策略網(wǎng)絡(luò)對(duì)目標(biāo)分子進(jìn)行逆向化學(xué)轉(zhuǎn)換,搜索當(dāng)前節(jié)點(diǎn)可能的變換路徑,然后使用篩選網(wǎng)絡(luò)分析判斷反應(yīng)是否可行,過濾不合理的反應(yīng)路線,最后通過展示策略網(wǎng)絡(luò)多次隨機(jī)采樣對(duì)搜索節(jié)點(diǎn)進(jìn)行評(píng)價(jià)打分。研究人員利用來自Reaxys數(shù)據(jù)庫的1 240萬條反應(yīng)數(shù)據(jù)訓(xùn)練這些網(wǎng)絡(luò),學(xué)習(xí)化學(xué)轉(zhuǎn)化規(guī)則。與其他方法相比,3N-MCTS在合成路線的搜索速度、質(zhì)量等方面均有顯著提升,能在短時(shí)間內(nèi)生成數(shù)百個(gè)化合物的合成路線,且雙盲實(shí)驗(yàn)結(jié)果表明3N-MCTS預(yù)測(cè)分子合成路線水平接近合成化學(xué)家水平。這種方法的優(yōu)勢(shì)體現(xiàn)在無需專家自定義規(guī)則,DL模型就可以學(xué)習(xí)到已知反應(yīng)所蘊(yùn)含的轉(zhuǎn)化規(guī)則,然后根據(jù)學(xué)習(xí)到的規(guī)則快速選擇出最佳合成路線。

    隨后,Coley等[4]推出了一個(gè)基于AI的自動(dòng)化合成平臺(tái),首先利用前饋神經(jīng)網(wǎng)絡(luò)生成目標(biāo)分子的合成路線,然后機(jī)器人根據(jù)合成方案執(zhí)行一系列具體的制備過程,實(shí)現(xiàn)自動(dòng)化合成。研究人員使用Reaxys和USPTO數(shù)據(jù)庫中的反應(yīng)數(shù)據(jù)訓(xùn)練網(wǎng)絡(luò)模型,學(xué)習(xí)反應(yīng)轉(zhuǎn)換規(guī)則,為目標(biāo)化合物設(shè)計(jì)出可行的合成路線,包括給出反應(yīng)條件,同時(shí)根據(jù)合成路線中的反應(yīng)類型是否容易實(shí)現(xiàn)以及中間產(chǎn)物是否多樣化等條件進(jìn)一步篩選得到最優(yōu)合成路線。最后,他們通過該平臺(tái)成功完成了15種小分子藥物合成路線設(shè)計(jì)并實(shí)現(xiàn)了自動(dòng)化合成。同時(shí),基于DL的序列到序列(sequence-to-sequence,seq2seq)模型(如Transformer模型等)的發(fā)展給不依賴模版的逆合成預(yù)測(cè)任務(wù)提供了一種新的解決思路(見圖4):可將該任務(wù)看成自然語言處理(natural language processing,NLP)領(lǐng)域內(nèi)機(jī)器翻譯任務(wù),輸入目標(biāo)分子的SMILES序列,不依賴反應(yīng)規(guī)則,就能輸出對(duì)應(yīng)單步的反應(yīng)物SMILES序列。

    圖4 基于序列到序列模型進(jìn)行合成路線預(yù)測(cè)Figure 4 Prediction of synthetic route based on the seq2seq model

    Liu等[25]率先將seq2seq模型應(yīng)用到逆合成預(yù)測(cè)任務(wù)中,使用的seq2seq模型是基于RNN的編碼器-解碼器結(jié)構(gòu),并在包含5萬個(gè)專利反應(yīng)的數(shù)據(jù)集上訓(xùn)練,并初步達(dá)到了與基于規(guī)則的基準(zhǔn)方法效果相當(dāng)?shù)乃健T摲椒ㄔ谝欢ǔ潭壬贤黄屏藢<乙?guī)則的限制,并表現(xiàn)出良好可擴(kuò)展性的優(yōu)勢(shì)。隨后seq2seq模型經(jīng)過發(fā)展,得到了較為流行基于注意力機(jī)制的Transformer模型。Zheng等[26]開發(fā)了一種無模板的自校正逆合成路線預(yù)測(cè)工具SCROP,通過使用基于多頭注意力機(jī)制的Transformer網(wǎng)絡(luò)模型預(yù)測(cè)逆合成路線,同時(shí)引入了基于Transformer的語法校正器,對(duì)預(yù)測(cè)模型產(chǎn)生的不合理候選前體分子SMILES進(jìn)行修正。SCROP在基準(zhǔn)數(shù)據(jù)集上預(yù)測(cè)準(zhǔn)確率達(dá)59%,比基于模板的方法提高了6%;同時(shí)實(shí)驗(yàn)結(jié)果表明語法校正器的加入提高了模型預(yù)測(cè)質(zhì)量,使無效的候選前體分子比例從12.1%降至0.7%。此外,Guo等[27]結(jié)合Transformer模型和貝葉斯推理算法進(jìn)行逆向合成預(yù)測(cè)。他們將該任務(wù)視為組合優(yōu)化問題,即在所有可用的反應(yīng)物組合中找到一組最佳的反應(yīng)物對(duì),用來合成目標(biāo)產(chǎn)物。他們首先通過訓(xùn)練好的Molecular Transformer模型對(duì)給定反應(yīng)物組合進(jìn)行高精度正向預(yù)測(cè),然后基于貝葉斯定理將正向預(yù)測(cè)模型反演為逆向合成模型,同時(shí)使用蒙特卡羅搜索算法探索得到最佳的反應(yīng)物組合。正向和逆向預(yù)測(cè)模型的組合提高了合成路線的可行性,同時(shí)改善了逆合成問題的不適定性。

    這類序列模型一般利用分子的SMILES字符串作為輸入,未能有效刻畫出分子中各原子間復(fù)雜關(guān)系。為此,Shi等[28]提出了一種基于圖神經(jīng)網(wǎng)絡(luò)的無模版逆合成預(yù)測(cè)框架G2G(graph to graph framework),利用圖表征分子,將任務(wù)轉(zhuǎn)化為圖到圖的翻譯問題,即將目標(biāo)分子圖轉(zhuǎn)化為一組反應(yīng)物分子圖。研究人員首先基于GCN識(shí)別目標(biāo)分子的反應(yīng)中心,將目標(biāo)分子拆分為一組合成子。然后,通過圖VAE將每個(gè)合成子轉(zhuǎn)換為最終的反應(yīng)物子圖。實(shí)驗(yàn)結(jié)果表明G2G在Top-1準(zhǔn)確率指標(biāo)上明顯優(yōu)于其他無模版的基準(zhǔn)模型(如seq2seq模型、transformer模型等),并與最先進(jìn)的基于模板的方法相比水平相當(dāng),如條件圖邏輯網(wǎng)絡(luò)(conditional graph logic network,GLN)模型。

    5 基于深度學(xué)習(xí)的從頭藥物分子設(shè)計(jì)

    近年來在從頭藥物分子設(shè)計(jì)領(lǐng)域,DL方法因部分解決了傳統(tǒng)方法的組合爆炸、多目標(biāo)優(yōu)化等問題而受到越來越多的關(guān)注。許多相關(guān)研究都證明了DL方法在從頭藥物分子設(shè)計(jì)的可行性,目前關(guān)于DL在這方面的應(yīng)用已經(jīng)被總結(jié)報(bào)道[29-31],在此筆者將對(duì)最新的研究進(jìn)展進(jìn)行進(jìn)一步介紹。Born等[32]構(gòu)建了一種混合的VAE模型,用來生成具有抗癌藥物特性的候選分子。值得注意的是,他們不僅使用分子SMILES作為輸入,還首次加入疾病相關(guān)的基因表達(dá)數(shù)據(jù),同時(shí)使用抗癌藥物敏感性預(yù)測(cè)模型作為獎(jiǎng)勵(lì)函數(shù)?;旌系腣AE模型由2個(gè)并列的VAE組成,一個(gè)用于接收小分子SMILES以學(xué)習(xí)其語法規(guī)則,另一個(gè)VAE用于接收基因表達(dá)數(shù)據(jù)以學(xué)習(xí)其特征表示,然后將這2個(gè)VAE編碼器的輸出結(jié)果一并輸入到同一解碼器,生成新分子,最后用抗癌藥物敏感性預(yù)測(cè)模型預(yù)測(cè)生成分子對(duì)靶細(xì)胞的活性值。應(yīng)用在4種不同癌癥類型的實(shí)例表明,該模型能夠針對(duì)特定疾病生成具有較強(qiáng)抑制效果的分子,且生成的分子在結(jié)構(gòu)、可合成性以及溶解性等方面均與現(xiàn)有藥物相似。然而,VAE也存在一定局限,它只會(huì)最大限度地“模仿”訓(xùn)練數(shù)據(jù),盡可能生成與訓(xùn)練數(shù)據(jù)在結(jié)構(gòu)上相似的分子,因此生成分子的結(jié)構(gòu)新穎性較低。

    AAE在VAE基礎(chǔ)上增加了判別模型,對(duì)采樣分子和真實(shí)樣本進(jìn)行區(qū)分,基于對(duì)抗的思想訓(xùn)練生成模型和判別模型,擴(kuò)展了分子的生成空間,一定程度上彌補(bǔ)了VAE在生成分子時(shí)結(jié)構(gòu)新穎性方面的缺陷。Polykovskiy等[33]構(gòu)建了一種新的AAE模型,即條件AAE,其能夠基于指定條件(如藥物分子的靶標(biāo)特異性、溶解性、可合成性等)生成相應(yīng)的分子。其中,基于長短時(shí)記憶網(wǎng)絡(luò)(long short term memory,LSTM)分別構(gòu)建編碼器和解碼器,同時(shí)使用多層的FNN作為判別模型,用來判斷采樣分子是否符合真實(shí)數(shù)據(jù)分布以及是否具備所需的理化性質(zhì),并基于半監(jiān)督學(xué)習(xí)方法優(yōu)化模型。他們利用該模型成功發(fā)現(xiàn)了一種新型的Janus激酶3(Janus kinase 3,JAK3)抑制劑。

    Bagal等[34]受生成式預(yù)訓(xùn)練新型神經(jīng)網(wǎng)絡(luò)模型(generative pre-training transformer,GPT)Transformer在生成文本任務(wù)中取得突破性進(jìn)展的啟發(fā),基于GPT構(gòu)建了一個(gè)新的生成模型MolGPT,能夠根據(jù)給定條件(輸入SMILES字符串、脂水分配系數(shù)、可合成性分?jǐn)?shù)以及拓?fù)錁O性表面積等目標(biāo)屬性值)生成具有所需骨架和理想特性的分子。MolGPT由多個(gè)堆疊的解碼器模塊組成,每個(gè)解碼器包含一層掩碼自注意力層和多層全連接網(wǎng)絡(luò),能夠捕獲SMILES字符串中字符間遠(yuǎn)距離依賴關(guān)系。與VAE、AAE等其他DL模型相比,MolGPT在生成分子的有效性、獨(dú)特性以及新穎性方面表現(xiàn)較好,打分分別為0.981、0.998和1.0。

    Goel等[35]結(jié)合RNN和強(qiáng)化學(xué)習(xí),提出了一個(gè)分子生成模型MoleGuLAR,其能夠?qū)Ψ肿拥念愃幮?、結(jié)合親和力等方面進(jìn)行多目標(biāo)優(yōu)化。尤其是,他們提出一種新的交替獎(jiǎng)勵(lì)策略,獎(jiǎng)勵(lì)函數(shù)隨著生成不同分子的過程中在動(dòng)態(tài)地改變,使得模型能夠交替探索不同的化學(xué)區(qū)間,采樣得到更加合理的分子。區(qū)別于以往大多數(shù)DL模型只能生成一維或二維的分子,Li等[36]將DL與基于結(jié)構(gòu)的從頭藥物設(shè)計(jì)策略相結(jié)合,發(fā)展了一種新的從頭分子生成模型DeepLigBuilder,其能夠直接生成具有高結(jié)合親和力類藥分子的三維結(jié)構(gòu)。DeepLigBuilder首先利用一種圖生成模型即配體神經(jīng)網(wǎng)絡(luò)(ligand neural network,L-Net)實(shí)現(xiàn)生成類藥分子的三維結(jié)構(gòu),然后結(jié)合蒙特卡洛樹搜索方法將靶標(biāo)的結(jié)構(gòu)信息引入到模型中,在靶標(biāo)活性位點(diǎn)搜索、優(yōu)化分子的結(jié)合構(gòu)象,從而得到具有高結(jié)合親和力的新分子。通過將其應(yīng)用于嚴(yán)重急性呼吸綜合征冠狀病毒2 (severe acute respiratory syndrome coronavirus 2,SARSCoV-2)抑制劑的從頭設(shè)計(jì),他們得到了3種新型具有高預(yù)測(cè)結(jié)合親和力且與已知抑制劑結(jié)構(gòu)類似的SARS-CoV-2潛在抑制劑,證明了DeepLigBuilder在從頭藥物設(shè)計(jì)以及先導(dǎo)物優(yōu)化方面的實(shí)用性。

    為了解決DL在小規(guī)模訓(xùn)練數(shù)據(jù)集上表現(xiàn)較差等問題,Krishnan等[37]設(shè)計(jì)了一套基于RNN的生成模型和遷移學(xué)習(xí)的藥物從頭設(shè)計(jì)流程,生成的分子不僅具有所需類藥特性,同時(shí)還具有靶標(biāo)特異性。他們首先利用ChEMBL數(shù)據(jù)庫中的活性分子SMILES數(shù)據(jù)預(yù)先訓(xùn)練RNN生成模型,以學(xué)習(xí)SMILES語法規(guī)則;然后,通過對(duì)接得到具有靶標(biāo)選擇性的分子并進(jìn)行遷移學(xué)習(xí),生成作用于特定靶標(biāo)的分子;同時(shí),再建立另一個(gè)基于RNN的預(yù)測(cè)模型,作為獎(jiǎng)勵(lì)函數(shù)評(píng)價(jià)生成的分子與靶標(biāo)的結(jié)合親和力。另外,Moret等[38]將RNN生成模型與數(shù)據(jù)增強(qiáng)、溫度采樣和遷移學(xué)習(xí)這3種優(yōu)化方法結(jié)合起來,也能夠在具有少量數(shù)據(jù)情況下生成所需特性的新分子。

    6 基于深度學(xué)習(xí)的藥物吸收、分布、代謝、排泄和毒性預(yù)測(cè)

    藥物的ADMET性質(zhì)研究對(duì)于藥物研發(fā)也是至關(guān)重要的。據(jù)統(tǒng)計(jì),將近50%的候選藥物在臨床試驗(yàn)階段因ADMET性質(zhì)不符要求而宣告失敗。因此,在早期藥物發(fā)現(xiàn)和藥物設(shè)計(jì)階段,研究人員應(yīng)提前對(duì)藥物分子的ADMET性質(zhì)進(jìn)行預(yù)測(cè)評(píng)估,以降低后續(xù)臨床試驗(yàn)失敗的風(fēng)險(xiǎn)。相較于耗時(shí)耗力的實(shí)驗(yàn)方法,精確可靠的ADMET預(yù)測(cè)方法能極大地縮短時(shí)間花費(fèi)、減少實(shí)驗(yàn)成本,提高候選藥物的篩選效率,基于DL的ADMET預(yù)測(cè)方法則恰逢其會(huì),并逐漸成為預(yù)測(cè)藥物ADMET性質(zhì)的重要手段。

    近幾年來,利用DL方法來預(yù)測(cè)小分子性質(zhì)已經(jīng)較為普遍,其中基于GNN模型的方法受到了學(xué)界的廣泛認(rèn)可,預(yù)測(cè)結(jié)果相較其他DL方法更為可靠。2018年,Wu等[39]基于DeepChem平臺(tái)構(gòu)建了一個(gè)用于分子性質(zhì)預(yù)測(cè)的DL框架,稱為MoleculeNet。他們通過這個(gè)框架為同行提供了一個(gè)基準(zhǔn),可以用于比較各種不同模型的效果和可靠程度。該框架涵蓋了不同的數(shù)據(jù)集拆分方法,包括基于骨架、隨機(jī)拆分等;以及不同的特征構(gòu)建方法,處理為ECFP、圖結(jié)構(gòu)等;和不同的網(wǎng)絡(luò)模型,例 如GCN、MPNN、weave、隨 機(jī) 森 林(random forest,RF)、核嶺回歸(Kernel ridge regression,KRR)等;并針對(duì)各種ADMET性質(zhì)相關(guān)的數(shù)據(jù)庫(如QM8、Clintox、Lipophilicity、BBBP等)進(jìn)行訓(xùn)練和測(cè)試。通過一系列基準(zhǔn)測(cè)試,他們發(fā)現(xiàn)在應(yīng)用量子力學(xué)性質(zhì)、物理化學(xué)性質(zhì)、生理學(xué)性質(zhì)相關(guān)的數(shù)據(jù)集時(shí),最佳的GNN模型比最佳的傳統(tǒng)模型更為有效,如應(yīng)用QM8數(shù)據(jù)集訓(xùn)練模型并預(yù)測(cè)小分子量子力學(xué)性質(zhì)時(shí),以平均絕對(duì)誤差(mean absolute error,MAE)為評(píng)價(jià)指標(biāo),表現(xiàn)最佳的傳統(tǒng)模型是KRR模型,該模型MAE達(dá)0.015,而基于GNN的網(wǎng)絡(luò)模型中表現(xiàn)最佳的是MPNN模型,其測(cè)試結(jié)果MAE為0.014 3,誤差低于KRR模型測(cè)試結(jié)果。隨后研究人員從不同角度出發(fā),建立了一系列各具特色的GNN模型。 Feinberg等[40]構(gòu)建了一種新型GNN網(wǎng)絡(luò)模型PotentialNet,其核心思想是在更新原子狀態(tài)過程中考慮距離因素,比常用的鄰接矩陣更能描述藥物分子結(jié)構(gòu)。該方法相較于傳統(tǒng)的機(jī)器學(xué)習(xí)方法和一些常見的GNN模型性能更佳,仍以QM8數(shù)據(jù)集進(jìn)行測(cè)試,在基于此數(shù)據(jù)集預(yù)測(cè)小分子量子化學(xué)性質(zhì)任務(wù)中,MPNN在測(cè)試集上MAE達(dá)0.013 9,而PotenialNet則提升明顯,MAE在0.011 8左右。后續(xù)研究中,他們又進(jìn)一步在PotentailNet模型基礎(chǔ)上進(jìn)行了改進(jìn),設(shè)計(jì)出多任務(wù)PotentialNet模型,同時(shí)采用31項(xiàng)ADMET性質(zhì)進(jìn)行訓(xùn)練,最終同時(shí)預(yù)測(cè)這31項(xiàng)性質(zhì)[41],例如電壓門控鉀離子通道(human ether-à-go-go-related gene encoded potassium ion channel,hERG)抑制性、人肝細(xì)胞清除率、半衰期、脂溶性等,并與RF模型進(jìn)行了比較。對(duì)于絕大部分性質(zhì)而言,多任務(wù)PotentialNet模型預(yù)測(cè)的相關(guān)系數(shù)(R2)與RF模型相比都有不同程度的提高,例如以時(shí)序拆分方法拆分?jǐn)?shù)據(jù)集時(shí),多任務(wù)PotentialNet模型較RF模型,在31項(xiàng)性質(zhì)預(yù)測(cè)中R2平均高出64%。

    Yang等[42]則開發(fā)了一種有向信息傳遞網(wǎng)絡(luò)(directed message passing neural network,D-MPNN),與往常的GNN模型做法不同,在表征藥物分子結(jié)構(gòu)時(shí),他們將原子間的鍵考慮為有方向的邊,而非常規(guī)的無向的邊,且通過邊的方向來對(duì)原子的狀態(tài)進(jìn)行更新,減少了無效冗余的原子狀態(tài)更新。預(yù)測(cè)結(jié)果表明,在所有數(shù)據(jù)集上D-MPNN都比RF模型、FNN模型等性能更好或者相當(dāng);例如,在血腦屏障透過能力預(yù)測(cè)方面,D-MPNN模型的ROC-AUC高達(dá)0.925,而RF模型和FNN模型分別僅為0.788和0.899。Li等[43]提出了基于多頭三聯(lián)注意力機(jī)制的MPNN模型TrimNet,通過給定的鄰接矩陣、邊特征矩陣、節(jié)點(diǎn)特征矩陣,分析周圍原子對(duì)當(dāng)前原子的影響,從而實(shí)現(xiàn)高效地從圖結(jié)構(gòu)表征的藥物分子結(jié)構(gòu)中學(xué)習(xí)潛在信息,并大幅度減少模型參數(shù)數(shù)量、降低計(jì)算成本,最終在多個(gè)數(shù)據(jù)集上取得良好的預(yù)測(cè)結(jié)果,如在ClinTox數(shù)據(jù)集上ROC-AUC高達(dá)0.948。

    除了GNN相關(guān)模型,研究人員也嘗試了其他類型的DL模型,并獲得一定成果。Kim等[44]開發(fā)了首個(gè)基于自注意力機(jī)制具有可解釋性的DNN模型,用于預(yù)測(cè)藥物是否存在hERG毒性。盡管只是采用了較為簡(jiǎn)單的ECFP描述符和FNN網(wǎng)絡(luò)模型,但在測(cè)試集上ROC-AUC依舊高達(dá)0.893,較傳統(tǒng)的定量構(gòu)效關(guān)系(quantitative structure-activity relationship,QSAR)模型,有明顯的改善。Wang等[45]基于概念新穎的膠囊網(wǎng)絡(luò)模型(capsule neural network,CapsNet),并結(jié)合CNN、受限波爾茲曼機(jī)(restricted boltzmann machine,RBM)等網(wǎng)絡(luò)模型構(gòu)建了一系列衍生網(wǎng)絡(luò),用于預(yù)測(cè)藥物hERG毒性,訓(xùn)練得到的最佳模型ROC-AUC達(dá)0.944。也有研究團(tuán)隊(duì)通過DL模型直接學(xué)習(xí)實(shí)驗(yàn)數(shù)據(jù)并預(yù)測(cè)給藥后患者體內(nèi)藥物的藥效學(xué)(pharmacodynamics,PD)/藥動(dòng)學(xué)(pharamcokinetics,PK)性質(zhì)變化曲線。例如,最近Lu等[46]基于RNN模型和神經(jīng)常微分方程(Neural-ODE)提出了Neural-PK/PD模型,其創(chuàng)新之處在于設(shè)計(jì)網(wǎng)絡(luò)框架時(shí),保留了PK/PD的一些基本原理,如藥物的體內(nèi)效應(yīng)與給藥劑量、體內(nèi)濃度直接相關(guān)等,從而提升了PK/PD性質(zhì)的預(yù)測(cè)準(zhǔn)確度。

    7 結(jié)語與展望

    DL技術(shù)在藥物發(fā)現(xiàn)多個(gè)環(huán)節(jié)中取得了驚人的預(yù)測(cè)能力,正在改變著藥物研發(fā)進(jìn)程,將有可能降低藥物發(fā)現(xiàn)成本、提高藥物研發(fā)效率。然而,現(xiàn)有DL技術(shù)仍面臨著諸多挑戰(zhàn)。首先,大多數(shù)DL技術(shù)嚴(yán)重依賴大量的計(jì)算資源,一定程度上限制了DL方法的發(fā)展及應(yīng)用。如何在保持模型預(yù)測(cè)準(zhǔn)確率的前提下,降低DL模型對(duì)計(jì)算資源的依賴已成為DL領(lǐng)域的一個(gè)研究熱點(diǎn)[47]。其中一個(gè)主流思路是通過修剪DL模型或者改善DL模型結(jié)構(gòu)以減少網(wǎng)絡(luò)參數(shù)數(shù)量和運(yùn)算量,從而降低對(duì)計(jì)算資源的需求。目前已有一些新型的輕量級(jí)DL模型被開發(fā)和應(yīng)用[14],如SqueezeNet、ThiNet、ShuffleNet。其次,數(shù)據(jù)樣本量、來源、質(zhì)量等參差不齊,也限制了DL技術(shù)建立和優(yōu)化。DL模型的訓(xùn)練依賴于大規(guī)模且高質(zhì)量的數(shù)據(jù)樣本。如何有效進(jìn)行小樣本學(xué)習(xí)是未來DL重要的發(fā)展方向[48],目前已有一些針對(duì)小樣本學(xué)習(xí)的方法,如采用數(shù)據(jù)增強(qiáng)技術(shù)、遷移學(xué)習(xí)、多任務(wù)學(xué)習(xí)策略等。同時(shí),數(shù)據(jù)集的質(zhì)量也決定著DL模型預(yù)測(cè)性能的好壞。藥物研發(fā)相關(guān)原始數(shù)據(jù)的提取、特征構(gòu)建等方法尚存在不足,影響著高質(zhì)量DL模型的發(fā)展。近年來,圖神經(jīng)網(wǎng)絡(luò)的發(fā)展,蘊(yùn)含更多結(jié)構(gòu)信息的圖被逐漸用來表征分子并應(yīng)用于藥物發(fā)現(xiàn)領(lǐng)域,已取得一些研究進(jìn)展。此外,DL模型中超參數(shù)搜索、內(nèi)部機(jī)制的不可解釋性等,也一定程度上阻礙了該技術(shù)的發(fā)展。總而言之,以上DL技術(shù)面臨的種種不足和挑戰(zhàn)都在提示我們,需要更多不同背景的研究人員加入到這一領(lǐng)域,來提出更多精湛的DL算法,并且要充分結(jié)合傳統(tǒng)的藥物設(shè)計(jì)方法,才能逐步解決藥物研發(fā)過程中各個(gè)環(huán)節(jié)的具體問題,從而能助力創(chuàng)新藥物發(fā)現(xiàn),進(jìn)一步推動(dòng)藥物研發(fā)領(lǐng)域邁向智能時(shí)代。

    猜你喜歡
    靶標(biāo)分子預(yù)測(cè)
    無可預(yù)測(cè)
    黃河之聲(2022年10期)2022-09-27 13:59:46
    選修2-2期中考試預(yù)測(cè)卷(A卷)
    選修2-2期中考試預(yù)測(cè)卷(B卷)
    “百靈”一號(hào)超音速大機(jī)動(dòng)靶標(biāo)
    分子的擴(kuò)散
    納米除草劑和靶標(biāo)生物的相互作用
    “精日”分子到底是什么?
    新民周刊(2018年8期)2018-03-02 15:45:54
    米和米中的危險(xiǎn)分子
    不必預(yù)測(cè)未來,只需把握現(xiàn)在
    復(fù)雜場(chǎng)景中航天器靶標(biāo)的快速識(shí)別
    男女国产视频网站| 91精品三级在线观看| 秋霞在线观看毛片| 欧美日韩视频高清一区二区三区二| 丝袜人妻中文字幕| 老汉色av国产亚洲站长工具| 免费黄频网站在线观看国产| 黄网站色视频无遮挡免费观看| netflix在线观看网站| 中文字幕最新亚洲高清| av片东京热男人的天堂| 国产精品成人在线| 美女脱内裤让男人舔精品视频| 亚洲视频免费观看视频| 午夜福利视频在线观看免费| 亚洲国产欧美日韩在线播放| 久久精品国产a三级三级三级| 午夜91福利影院| 亚洲欧美日韩高清在线视频 | 欧美国产精品一级二级三级| 午夜老司机福利片| 亚洲av欧美aⅴ国产| 一本一本久久a久久精品综合妖精| 少妇粗大呻吟视频| 男人爽女人下面视频在线观看| 中文字幕高清在线视频| 中文字幕色久视频| 性少妇av在线| 日本色播在线视频| 人人妻人人澡人人爽人人夜夜| 在线精品无人区一区二区三| 精品一区二区三卡| av天堂在线播放| 欧美 日韩 精品 国产| 色婷婷久久久亚洲欧美| 啦啦啦视频在线资源免费观看| 久久久久精品国产欧美久久久 | 欧美亚洲日本最大视频资源| av不卡在线播放| 亚洲色图综合在线观看| 国产成人av激情在线播放| 久久久久国产一级毛片高清牌| 久久99一区二区三区| 99国产综合亚洲精品| 黑丝袜美女国产一区| 成人亚洲欧美一区二区av| 欧美黑人精品巨大| 国产高清视频在线播放一区 | 99久久99久久久精品蜜桃| 青青草视频在线视频观看| 自拍欧美九色日韩亚洲蝌蚪91| 日本午夜av视频| 男人操女人黄网站| 制服诱惑二区| 制服诱惑二区| 制服诱惑二区| 青草久久国产| 一级,二级,三级黄色视频| 纵有疾风起免费观看全集完整版| 成人亚洲欧美一区二区av| 久久久久精品人妻al黑| 欧美激情 高清一区二区三区| 日韩电影二区| 国产野战对白在线观看| 亚洲精品国产av蜜桃| 欧美日韩亚洲高清精品| 精品少妇一区二区三区视频日本电影| 亚洲精品国产av成人精品| 国产免费一区二区三区四区乱码| 91老司机精品| 黑人猛操日本美女一级片| 成年女人毛片免费观看观看9 | 一区二区日韩欧美中文字幕| 新久久久久国产一级毛片| 悠悠久久av| 亚洲精品在线美女| 水蜜桃什么品种好| 黄色视频在线播放观看不卡| 老司机深夜福利视频在线观看 | 看免费av毛片| 亚洲免费av在线视频| 欧美日韩福利视频一区二区| 国产精品偷伦视频观看了| 色网站视频免费| 十八禁网站网址无遮挡| 国产又色又爽无遮挡免| 久久精品aⅴ一区二区三区四区| 嫩草影视91久久| 美女视频免费永久观看网站| 亚洲精品第二区| 在线 av 中文字幕| 少妇猛男粗大的猛烈进出视频| 久久精品久久精品一区二区三区| 各种免费的搞黄视频| 一区二区av电影网| 男人操女人黄网站| 操出白浆在线播放| 免费观看a级毛片全部| 两性夫妻黄色片| 国产精品一国产av| 汤姆久久久久久久影院中文字幕| 国产免费福利视频在线观看| 精品国产一区二区三区久久久樱花| 制服诱惑二区| 久久久久久久久久久久大奶| 国产女主播在线喷水免费视频网站| 中文字幕另类日韩欧美亚洲嫩草| 成人亚洲精品一区在线观看| 国产成人精品在线电影| 欧美日本中文国产一区发布| 久久精品人人爽人人爽视色| 叶爱在线成人免费视频播放| 成在线人永久免费视频| 看十八女毛片水多多多| 美女脱内裤让男人舔精品视频| 国产免费现黄频在线看| 精品少妇黑人巨大在线播放| 国产成人一区二区在线| www.999成人在线观看| 欧美激情极品国产一区二区三区| 19禁男女啪啪无遮挡网站| 十八禁网站网址无遮挡| 国产精品二区激情视频| www.av在线官网国产| 亚洲精品美女久久av网站| 午夜福利,免费看| 大香蕉久久网| 老司机影院毛片| 五月开心婷婷网| 亚洲av日韩精品久久久久久密 | 你懂的网址亚洲精品在线观看| 亚洲av电影在线进入| 黑丝袜美女国产一区| 黑丝袜美女国产一区| 黑丝袜美女国产一区| 免费高清在线观看日韩| 久久人妻福利社区极品人妻图片 | 大片电影免费在线观看免费| 国产成人91sexporn| 日韩制服骚丝袜av| 久久这里只有精品19| 制服诱惑二区| 亚洲一卡2卡3卡4卡5卡精品中文| 又大又黄又爽视频免费| 日韩大片免费观看网站| 大片电影免费在线观看免费| 丰满迷人的少妇在线观看| 啦啦啦在线免费观看视频4| 男男h啪啪无遮挡| 美女福利国产在线| 亚洲中文日韩欧美视频| 丝袜美足系列| 午夜福利影视在线免费观看| 国产精品久久久久成人av| 久久精品亚洲熟妇少妇任你| 中文乱码字字幕精品一区二区三区| 中文字幕精品免费在线观看视频| 超碰成人久久| 亚洲欧美精品综合一区二区三区| 一二三四在线观看免费中文在| 一区二区三区激情视频| 天堂俺去俺来也www色官网| 日韩一区二区三区影片| 免费在线观看影片大全网站 | 十八禁高潮呻吟视频| 亚洲精品国产av蜜桃| 99久久人妻综合| 国产亚洲精品第一综合不卡| 国产亚洲av片在线观看秒播厂| 亚洲伊人色综图| 狠狠精品人妻久久久久久综合| 少妇粗大呻吟视频| 伊人久久大香线蕉亚洲五| 男女无遮挡免费网站观看| 久久久精品免费免费高清| 国产欧美日韩一区二区三 | 久久综合国产亚洲精品| 亚洲色图综合在线观看| 丝袜美足系列| 婷婷色综合www| 国产黄色视频一区二区在线观看| 又紧又爽又黄一区二区| 久久精品久久久久久久性| 另类精品久久| 男人舔女人的私密视频| 国产一级毛片在线| 免费黄频网站在线观看国产| 久久精品aⅴ一区二区三区四区| 人人妻人人爽人人添夜夜欢视频| 国产一区二区激情短视频 | 成年人免费黄色播放视频| 国产一卡二卡三卡精品| 欧美黄色片欧美黄色片| 欧美日本中文国产一区发布| 视频区欧美日本亚洲| 精品福利永久在线观看| 中国美女看黄片| 观看av在线不卡| 久久久久国产一级毛片高清牌| 91精品国产国语对白视频| 精品国产超薄肉色丝袜足j| 国产成人啪精品午夜网站| 成年人午夜在线观看视频| 激情视频va一区二区三区| 午夜免费成人在线视频| 国产亚洲av片在线观看秒播厂| 男女无遮挡免费网站观看| 亚洲精品一二三| 黄色视频不卡| 免费观看人在逋| 18在线观看网站| 国产欧美日韩综合在线一区二区| 99热网站在线观看| av网站在线播放免费| 亚洲av电影在线观看一区二区三区| 久久99热这里只频精品6学生| 日韩免费高清中文字幕av| 亚洲精品在线美女| 亚洲精品一区蜜桃| 国产又色又爽无遮挡免| 性高湖久久久久久久久免费观看| 国产女主播在线喷水免费视频网站| 制服诱惑二区| 亚洲人成电影免费在线| 色综合欧美亚洲国产小说| 高潮久久久久久久久久久不卡| 在现免费观看毛片| 丝袜在线中文字幕| 午夜免费观看性视频| 久久av网站| 亚洲欧美一区二区三区黑人| 青草久久国产| 各种免费的搞黄视频| 国产成人av激情在线播放| 亚洲色图综合在线观看| 免费日韩欧美在线观看| 免费看av在线观看网站| 久久国产精品男人的天堂亚洲| 欧美激情极品国产一区二区三区| 老鸭窝网址在线观看| 一级片'在线观看视频| 国产精品一区二区免费欧美 | 亚洲国产精品一区三区| 高清欧美精品videossex| 国产成人欧美| 搡老岳熟女国产| 男女床上黄色一级片免费看| 51午夜福利影视在线观看| 久9热在线精品视频| 久久久久国产一级毛片高清牌| 免费在线观看日本一区| 下体分泌物呈黄色| 中文字幕亚洲精品专区| 女人高潮潮喷娇喘18禁视频| 人妻一区二区av| 香蕉丝袜av| 国产精品偷伦视频观看了| 一区二区av电影网| 欧美日韩视频高清一区二区三区二| 最近手机中文字幕大全| 亚洲精品国产区一区二| 国产一区有黄有色的免费视频| www.999成人在线观看| 亚洲欧美精品自产自拍| 后天国语完整版免费观看| 久久久精品94久久精品| 99九九在线精品视频| 一区二区三区激情视频| 国产精品久久久av美女十八| 女性生殖器流出的白浆| 香蕉国产在线看| 久久久久国产一级毛片高清牌| 美女福利国产在线| 日韩中文字幕欧美一区二区 | 日韩伦理黄色片| 男女国产视频网站| 超碰成人久久| 亚洲图色成人| 欧美人与善性xxx| 久久天躁狠狠躁夜夜2o2o | 18禁观看日本| kizo精华| 51午夜福利影视在线观看| 99香蕉大伊视频| av天堂久久9| 五月天丁香电影| 中文字幕制服av| 亚洲成人国产一区在线观看 | 青青草视频在线视频观看| 日本欧美国产在线视频| 韩国精品一区二区三区| 午夜福利乱码中文字幕| 亚洲av电影在线进入| 在线观看免费日韩欧美大片| 日韩伦理黄色片| 一本色道久久久久久精品综合| 日本a在线网址| 嫩草影视91久久| 黑人欧美特级aaaaaa片| 男女免费视频国产| 一区福利在线观看| 国产免费现黄频在线看| 如日韩欧美国产精品一区二区三区| 亚洲精品国产色婷婷电影| 欧美日韩av久久| 一区二区日韩欧美中文字幕| 久久久久久久久久久久大奶| 多毛熟女@视频| 男人爽女人下面视频在线观看| 欧美av亚洲av综合av国产av| 日韩熟女老妇一区二区性免费视频| 亚洲美女黄色视频免费看| 91老司机精品| av又黄又爽大尺度在线免费看| 国语对白做爰xxxⅹ性视频网站| 久久人人97超碰香蕉20202| 成年人免费黄色播放视频| 香蕉国产在线看| 高潮久久久久久久久久久不卡| 久久久久久免费高清国产稀缺| 国产精品国产av在线观看| 男女免费视频国产| 国产精品人妻久久久影院| 女人爽到高潮嗷嗷叫在线视频| 亚洲精品国产av蜜桃| 国产在线免费精品| 亚洲人成电影免费在线| xxxhd国产人妻xxx| 婷婷成人精品国产| 久久精品国产亚洲av涩爱| 女警被强在线播放| 一区二区三区四区激情视频| 91字幕亚洲| 黄色一级大片看看| 欧美日韩福利视频一区二区| 人人澡人人妻人| 久久久精品区二区三区| 午夜福利一区二区在线看| 国产成人精品久久二区二区91| 少妇人妻久久综合中文| 热re99久久国产66热| 婷婷成人精品国产| 在线精品无人区一区二区三| 久久精品亚洲av国产电影网| 黄片播放在线免费| 亚洲精品国产区一区二| 国产欧美日韩精品亚洲av| 中文字幕人妻熟女乱码| 99久久99久久久精品蜜桃| 日本91视频免费播放| 99精国产麻豆久久婷婷| 日韩中文字幕视频在线看片| a 毛片基地| 国产精品久久久人人做人人爽| 一级,二级,三级黄色视频| 日本猛色少妇xxxxx猛交久久| 亚洲精品日本国产第一区| 日本欧美视频一区| 麻豆av在线久日| 午夜激情久久久久久久| 欧美精品啪啪一区二区三区 | 免费在线观看日本一区| 国产视频一区二区在线看| 在线观看免费视频网站a站| 亚洲黑人精品在线| 国产成人啪精品午夜网站| 欧美国产精品va在线观看不卡| 欧美在线黄色| 国产精品av久久久久免费| 国产成人免费观看mmmm| 国产在视频线精品| 精品亚洲成国产av| 精品国产一区二区三区久久久樱花| 国产97色在线日韩免费| 日韩免费高清中文字幕av| 91成人精品电影| 中文字幕人妻丝袜制服| 久久久久国产一级毛片高清牌| 日韩免费高清中文字幕av| 国产成人系列免费观看| 欧美激情高清一区二区三区| 久久久久视频综合| 欧美乱码精品一区二区三区| 久久久久久久国产电影| 国产一区二区激情短视频 | 大话2 男鬼变身卡| 久久久久视频综合| 无限看片的www在线观看| 精品亚洲成国产av| 男女免费视频国产| 国产精品三级大全| 激情视频va一区二区三区| av视频免费观看在线观看| 亚洲五月婷婷丁香| 亚洲精品av麻豆狂野| 亚洲 国产 在线| 国产熟女欧美一区二区| 美女扒开内裤让男人捅视频| 精品少妇一区二区三区视频日本电影| 欧美变态另类bdsm刘玥| a级毛片在线看网站| 黑人猛操日本美女一级片| 亚洲欧美精品综合一区二区三区| 赤兔流量卡办理| 只有这里有精品99| 免费一级毛片在线播放高清视频 | 18禁观看日本| 日本黄色日本黄色录像| 69精品国产乱码久久久| 黄色毛片三级朝国网站| 亚洲国产精品国产精品| 国产精品av久久久久免费| 国产精品三级大全| 日韩一区二区三区影片| 日本黄色日本黄色录像| 最黄视频免费看| 精品国产国语对白av| 国产精品久久久av美女十八| 最近最新中文字幕大全免费视频 | av在线老鸭窝| 亚洲激情五月婷婷啪啪| 人人澡人人妻人| 999久久久国产精品视频| 你懂的网址亚洲精品在线观看| 美女扒开内裤让男人捅视频| 亚洲精品成人av观看孕妇| 精品人妻熟女毛片av久久网站| 日本wwww免费看| 99国产精品一区二区三区| 国产又色又爽无遮挡免| 亚洲一卡2卡3卡4卡5卡精品中文| 日韩免费高清中文字幕av| 纯流量卡能插随身wifi吗| 91字幕亚洲| a级毛片在线看网站| 好男人视频免费观看在线| 免费少妇av软件| 久9热在线精品视频| 五月天丁香电影| 五月开心婷婷网| 久久ye,这里只有精品| 亚洲av成人不卡在线观看播放网 | 高清黄色对白视频在线免费看| 国产99久久九九免费精品| 国产淫语在线视频| 一区二区av电影网| 侵犯人妻中文字幕一二三四区| 老司机影院毛片| 黄片播放在线免费| 天天影视国产精品| 99热国产这里只有精品6| 亚洲欧美日韩另类电影网站| 精品国产乱码久久久久久男人| 亚洲av电影在线观看一区二区三区| 老熟女久久久| 丝袜人妻中文字幕| 亚洲欧美清纯卡通| 成年人免费黄色播放视频| 亚洲国产中文字幕在线视频| www.自偷自拍.com| 两性夫妻黄色片| 久久久久网色| 亚洲av日韩精品久久久久久密 | 亚洲av电影在线观看一区二区三区| 亚洲精品成人av观看孕妇| 国产成人一区二区在线| 日本午夜av视频| 自拍欧美九色日韩亚洲蝌蚪91| 欧美性长视频在线观看| 国产在线视频一区二区| 交换朋友夫妻互换小说| 日日摸夜夜添夜夜爱| 亚洲精品成人av观看孕妇| 天天添夜夜摸| 精品久久蜜臀av无| 亚洲精品一卡2卡三卡4卡5卡 | 国产一区二区三区综合在线观看| 嫁个100分男人电影在线观看 | 女性被躁到高潮视频| 国产在线一区二区三区精| 久久精品人人爽人人爽视色| 黄色片一级片一级黄色片| 亚洲一卡2卡3卡4卡5卡精品中文| 国产熟女午夜一区二区三区| 国产成人欧美在线观看 | 日韩 欧美 亚洲 中文字幕| 19禁男女啪啪无遮挡网站| 又大又黄又爽视频免费| 亚洲欧美日韩高清在线视频 | 飞空精品影院首页| 午夜福利乱码中文字幕| 最新的欧美精品一区二区| 午夜久久久在线观看| 黄色 视频免费看| 久久精品国产亚洲av涩爱| 免费看十八禁软件| 各种免费的搞黄视频| 欧美精品啪啪一区二区三区 | 性色av一级| 日本五十路高清| 香蕉国产在线看| 亚洲 欧美一区二区三区| 啦啦啦啦在线视频资源| 高清视频免费观看一区二区| 国产色视频综合| 婷婷色综合www| av欧美777| 麻豆av在线久日| 少妇猛男粗大的猛烈进出视频| 一二三四社区在线视频社区8| 中文欧美无线码| 亚洲精品久久午夜乱码| 欧美日韩黄片免| 日本黄色日本黄色录像| 欧美另类一区| 老司机深夜福利视频在线观看 | 老司机午夜十八禁免费视频| 侵犯人妻中文字幕一二三四区| 欧美日本中文国产一区发布| 欧美精品一区二区免费开放| www日本在线高清视频| 午夜福利视频在线观看免费| 精品熟女少妇八av免费久了| 国产精品一区二区免费欧美 | 2021少妇久久久久久久久久久| 日韩 欧美 亚洲 中文字幕| 亚洲欧美成人综合另类久久久| 国产免费视频播放在线视频| 天天躁狠狠躁夜夜躁狠狠躁| 国产成人一区二区三区免费视频网站 | 午夜视频精品福利| 久久精品国产亚洲av涩爱| 99精品久久久久人妻精品| 高潮久久久久久久久久久不卡| 日韩 欧美 亚洲 中文字幕| 电影成人av| 午夜免费鲁丝| 1024香蕉在线观看| 国产国语露脸激情在线看| 亚洲精品国产区一区二| 国产成人精品在线电影| 国产99久久九九免费精品| av在线老鸭窝| 日本vs欧美在线观看视频| av国产久精品久网站免费入址| 欧美在线黄色| 一本色道久久久久久精品综合| 国产精品久久久久久精品电影小说| 大陆偷拍与自拍| 中文字幕精品免费在线观看视频| 蜜桃在线观看..| 多毛熟女@视频| 亚洲av综合色区一区| 岛国毛片在线播放| 啦啦啦中文免费视频观看日本| 国产精品香港三级国产av潘金莲 | 国产成人免费无遮挡视频| 日韩制服丝袜自拍偷拍| 欧美日韩视频精品一区| 女人爽到高潮嗷嗷叫在线视频| 夫妻性生交免费视频一级片| 中文精品一卡2卡3卡4更新| 欧美乱码精品一区二区三区| 五月开心婷婷网| 男女国产视频网站| 久久久久国产精品人妻一区二区| 蜜桃在线观看..| 色婷婷av一区二区三区视频| 中文乱码字字幕精品一区二区三区| 性色av乱码一区二区三区2| 91老司机精品| 一二三四社区在线视频社区8| 爱豆传媒免费全集在线观看| 国产精品免费视频内射| 满18在线观看网站| 搡老乐熟女国产| 老汉色∧v一级毛片| 欧美精品一区二区免费开放| 又黄又粗又硬又大视频| 国产有黄有色有爽视频| 久久久久久久精品精品| 免费在线观看完整版高清| 老司机午夜十八禁免费视频| 日韩制服丝袜自拍偷拍| 中文欧美无线码| 美女视频免费永久观看网站| 最近最新中文字幕大全免费视频 | 在线观看www视频免费| 成在线人永久免费视频| 国语对白做爰xxxⅹ性视频网站| 国产精品九九99| 亚洲 欧美一区二区三区| 久久天堂一区二区三区四区| 精品第一国产精品| 国产真人三级小视频在线观看| 亚洲精品国产一区二区精华液| 激情视频va一区二区三区| 日韩伦理黄色片| 91字幕亚洲| 国产精品成人在线| 999精品在线视频| 久久免费观看电影| 亚洲熟女毛片儿| 伊人亚洲综合成人网| 久久人人爽人人片av| 国产精品 国内视频| 91精品伊人久久大香线蕉| 精品人妻熟女毛片av久久网站| 亚洲,一卡二卡三卡| 18禁国产床啪视频网站| 91老司机精品| 日韩欧美一区视频在线观看| 国产精品 欧美亚洲| 午夜免费成人在线视频| 各种免费的搞黄视频|