黃群富,丁長松,2
(1 湖南中醫(yī)藥大學(xué) 信息科學(xué)與工程學(xué)院,長沙 410208;2 湖南省中醫(yī)藥大數(shù)據(jù)分析實(shí)驗(yàn)室,長沙 410208)
中醫(yī)臨床經(jīng)驗(yàn)豐富、療效顯著,但對(duì)中藥成分、治療靶點(diǎn)的作用機(jī)制仍知之甚少,給臨床精準(zhǔn)治療帶來了極大挑戰(zhàn)。然而,中藥具有多成分、多靶點(diǎn)等特點(diǎn),很多潛在成分與靶點(diǎn)間的關(guān)系尚未明確。通過生物實(shí)驗(yàn),分別從中藥的成分研究其作用靶點(diǎn)花費(fèi)的時(shí)間、經(jīng)濟(jì)成本大且難以實(shí)現(xiàn)。因此,研究快速高效的中藥成分-靶點(diǎn)相互作用預(yù)測方法亟不可待。
中藥靶點(diǎn)發(fā)現(xiàn)的關(guān)鍵,在于探究中藥多成分與多靶點(diǎn)的相互作用關(guān)系?,F(xiàn)有的定量結(jié)構(gòu)活性關(guān)系方法預(yù)測中藥靶點(diǎn)方法,主要以分子指紋、分子描述符結(jié)合機(jī)器學(xué)習(xí)為主[1],忽略了中藥、成分、靶點(diǎn)3者之間的潛在聯(lián)系,不利于模型的泛化調(diào)用。目前,網(wǎng)絡(luò)分析已廣泛應(yīng)用于疾病分類、生物醫(yī)療、新藥研發(fā)等領(lǐng)域,其有效性已在實(shí)踐中得到驗(yàn)證。如:Hao等[2]針對(duì)藥物-靶點(diǎn)相互作用,提出一種雙網(wǎng)絡(luò)集成邏輯矩陣分解的相似性度量方法;于亞運(yùn)等[3]基于分子指紋相似度構(gòu)建中藥成分-靶點(diǎn)相互作用分類模型。此類方法的準(zhǔn)確度很大程度依賴于分子結(jié)構(gòu)相似性。近年來,深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Network,DNN)結(jié)合傳統(tǒng)算法已成功應(yīng)用于海量、復(fù)雜的藥物-靶點(diǎn)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)分析[4]。如:使用DNN 和因子分解機(jī)實(shí)現(xiàn)自動(dòng)學(xué)習(xí)特征的高階及低階表達(dá)式[5];利用XGBoost 確定藥物分子指紋非冗余特征[6],并通過DNN 提高藥物靶點(diǎn)分類模型精度等。
本文針對(duì)傳統(tǒng)中藥靶點(diǎn)預(yù)測忽略中藥、成分、靶點(diǎn)之間的潛在聯(lián)系和藥物-靶點(diǎn)網(wǎng)絡(luò)研究中存在特征提取不全、過于依賴結(jié)構(gòu)相似性的問題,提出了一種基于中藥-成分-靶點(diǎn)(Traditional Chinese Medicine-Ingredient-Target,TCMIT)3 層異構(gòu)網(wǎng)絡(luò)的中藥靶點(diǎn)預(yù)測方法。利用結(jié)構(gòu)相似性和關(guān)聯(lián)矩陣構(gòu)建TCMIT 異構(gòu)網(wǎng)絡(luò),使用數(shù)學(xué)統(tǒng)計(jì)算法提取網(wǎng)絡(luò)拓?fù)涮卣?,并結(jié)合深度學(xué)習(xí)建立TCMIT-DNN 中藥成分-靶點(diǎn)相互作用分析模型,通過異構(gòu)網(wǎng)絡(luò)從分子維度分析中藥治療疾病的現(xiàn)代物質(zhì)基礎(chǔ)。
基于成分SMILES 相似性、靶點(diǎn)氨基酸序列相似性,以及已知相互作用的中藥-成分、成分-靶點(diǎn)關(guān)系,構(gòu)建TCMIT 3 層異構(gòu)網(wǎng)絡(luò)。采用重啟隨機(jī)游走、高斯核算法,分別提取層內(nèi)相似性網(wǎng)絡(luò)和層間異構(gòu)網(wǎng)絡(luò)的拓?fù)涮卣鳎唤Y(jié)合信息熵,分別融合成分、靶點(diǎn)特征矩陣,并利用DNN 構(gòu)建分類模型。本文整體框架如圖1 所示。
圖1 融入“中藥-成分-靶點(diǎn)”異構(gòu)網(wǎng)絡(luò)特征的深度學(xué)習(xí)預(yù)測中藥靶點(diǎn)框架Fig.1 Prediction of traditional Chinese medicine targets based on deep learning on integrated “TCM-ingredient-target” network features
令D ={d1,d2,…,dI} 表示中藥集合;I為中藥總數(shù);C ={c1,c2,…,cJ} 表示中藥包含的成分集合;J為成分總數(shù);T ={t1,t2,…,tK} 表示種屬來源于Human 物種的靶點(diǎn)集合;K為靶點(diǎn)總數(shù)。
利用Jaccard 算法[7],分別計(jì)算成分?jǐn)U展連通性指紋向量的結(jié)構(gòu)相似性,構(gòu)建成分相似矩陣SIMingre∈RJ×J。公式如下:
式中,ci、cj分別表示兩種成分的指紋向量。
利用史密斯-沃特曼(Smith-Waterman)算法[8],計(jì)算兩個(gè)不等長氨基酸序列的相似性,構(gòu)建靶點(diǎn)結(jié)構(gòu)相似矩陣SIMtarget∈RK×K。公式如下:
式中,空位罰分?jǐn)?shù)w設(shè)為2,若當(dāng)前對(duì)比的兩個(gè)元素相同,則s為3,否則s為-3。
中藥、成分、靶點(diǎn)分別作為3 個(gè)相似性網(wǎng)絡(luò)的節(jié)點(diǎn),根據(jù)節(jié)點(diǎn)間的相互作用關(guān)系,定義連接中藥層與成分層的鄰接矩陣M∈RI×J、連接成分層和靶點(diǎn)層的鄰接矩陣N∈RJ×K。當(dāng)矩陣中存在相互作用關(guān)系時(shí)編碼為1,否則編碼為0。編碼為1 表示異構(gòu)網(wǎng)絡(luò)相應(yīng)的節(jié)點(diǎn)間存在連邊,編碼為0 則不存在連邊,分別構(gòu)建“中藥-成分”、“成分-靶點(diǎn)”異構(gòu)網(wǎng)絡(luò);以成分層為連接層,將“中藥-成分”、“成分-靶點(diǎn)”異構(gòu)網(wǎng)絡(luò)融合為TCMIT 3 層異構(gòu)網(wǎng)絡(luò)(如圖1 中第三部分所示)。
中藥成分-靶點(diǎn)相互作用的預(yù)測過程,可被視為節(jié)點(diǎn)同時(shí)在成分層相似性網(wǎng)絡(luò)和靶點(diǎn)層相似性網(wǎng)絡(luò)隨機(jī)游走的過程。重啟隨機(jī)游走(Random Walk with Restart,RWR),對(duì)于解決具有多種異構(gòu)拓?fù)浣Y(jié)構(gòu)的生物網(wǎng)絡(luò)計(jì)算具有一定優(yōu)勢[7],可利用相似性網(wǎng)絡(luò)中的拓?fù)湎嗨菩詷?gòu)建RWR相似矩陣。以成分層網(wǎng)絡(luò)為例:
定義成分層轉(zhuǎn)移概率矩陣TC∈RJ×J,其中TC(ci,cj)為隨機(jī)游走過程中,成分節(jié)點(diǎn)i到達(dá)j的概率,計(jì)算公式如下:
利用藥物靶點(diǎn)的相互作用關(guān)系,計(jì)算藥物高斯核相互作用屬性(Gaussian Interaction Profile,GIP)相似性方法[9],同時(shí)計(jì)算“中藥-成分”和“成分-靶點(diǎn)”異構(gòu)網(wǎng)絡(luò)間拓?fù)浣Y(jié)構(gòu)相似性GIPingre∈RJ×J和GIPtarget∈RK×K。以GIPingre為例,計(jì)算公式如下:
其中,f(ci)表示在鄰接矩陣M中,成分ci與所有中藥的對(duì)應(yīng)關(guān)系;γd為控制核寬度的調(diào)節(jié)參數(shù);J為成分集合的總數(shù);的值則是根據(jù)使用高斯核的經(jīng)驗(yàn)而設(shè)置。
計(jì)算相似矩陣信息熵可獲得其攜帶多少信息,信息熵越小表示該相似矩陣中隨機(jī)信息越少,從而能為特征矩陣提供更大、更豐富的信息量。在異構(gòu)網(wǎng)絡(luò)中,使用信息熵算法融合各特征矩陣,降低矩陣中數(shù)據(jù)噪聲的影響。以矩陣SIMtarget∈RK×K為例,信息熵計(jì)算如下:
其中,P(ti,tj)表示靶點(diǎn)節(jié)點(diǎn)i和j在網(wǎng)絡(luò)中相連的概率值,計(jì)算公式如下:
SIMingre、RWRingre、RWRtarget、GIPingre、GIPtarget矩陣的信息熵值計(jì)算與SIMtarget矩陣類似。根據(jù)熵值確定各矩陣融合權(quán)重,分別將成分和靶點(diǎn)的結(jié)構(gòu)信息、相似性網(wǎng)絡(luò)拓?fù)湫畔?、異?gòu)網(wǎng)絡(luò)拓?fù)湫畔⒕€性融合,構(gòu)建成分特征矩陣FEAingre∈RJ×J和靶點(diǎn)特征矩陣FEAtarget∈RK×K。融合公式如下:
其中,F(xiàn)EAingre(i,j) ∈[0,1]表示成分ci與cj經(jīng)信息融合后的值,F(xiàn)EAtarget(i,j) 與其類似。
DNN 采用多層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),將復(fù)雜映射分解為一系列嵌套的簡單映射,以逐層抽象實(shí)現(xiàn)從局部特征到整體特征提取解決復(fù)雜問題。異構(gòu)網(wǎng)絡(luò)的拓?fù)鋵傩钥杀硎緸楣?jié)點(diǎn)的特征向量,利用DNN 的非線性擬合能力構(gòu)建TCMIT-DNN 模型,預(yù)測異構(gòu)網(wǎng)絡(luò)上中藥成分和靶點(diǎn)的相互作用。當(dāng)鄰接矩陣N(i,j)=1 時(shí),表示ci與tj存在相互作用,則將ci與tj視為中藥成分-靶點(diǎn)對(duì)正例樣本(y =1),當(dāng)鄰接矩陣N(i,j)=0 時(shí),則將其視為負(fù)例樣本(y =0),樣本特征向量v定義如下:
其中,F(xiàn)EAingre(i,:) 表示矩陣FEAingre的第i行,F(xiàn)EAtarget(j,:) 表示矩陣FEAtarget的第j行。因此,F(xiàn)EAingre(i,:) 和FEAtarget(j,:) 經(jīng)concat(·)拼接后,生成(J +K)維的樣本特征向量v,J和K分別為成分、靶點(diǎn)數(shù)據(jù)集總數(shù)。
TCMIT-DNN 模型由一個(gè)輸入層、3 個(gè)隱含層和一個(gè)輸出層組成。樣本特征向量v由輸入層神經(jīng)元流向下一層神經(jīng)元,通過3 個(gè)隱含層的非線性函數(shù)運(yùn)算后傳遞至輸出層,輸出v預(yù)測為正例和負(fù)例的概率值。
本文采用的數(shù)據(jù)來源于中藥藥理學(xué)數(shù)據(jù)庫和藥物化學(xué)數(shù)據(jù)庫。在BindingDB 數(shù)據(jù)庫(網(wǎng)址http://www.bindingdb.org/)中收集所有包含Human 物種來源的靶點(diǎn),共計(jì)2 135 個(gè),將靶點(diǎn)信息在TCMID 數(shù)據(jù)庫(網(wǎng)址http://www.megabionet.org/)中查詢其具有相互作用的成分,共計(jì)1 633 個(gè),將成分信息在Herb 數(shù)據(jù)庫(網(wǎng)址http://herb.ac.cn/)查詢其具有所屬關(guān)系的中藥,共計(jì)1 558個(gè),并收集成分SMILES(Simplified Molecular Input Line Entry Specification,SMILES)信息及靶點(diǎn)氨基酸序列信息。
2.2.1 建立TCMIT-DNN 分類模型
中藥集合D、成分集合C、靶點(diǎn)集合T的數(shù)量I、J、K分 別 為1 558、1 633、2 135,由Jaccard 和Smith-Waterman算法分別計(jì)算中藥成分和靶點(diǎn)的結(jié)構(gòu)相似性,構(gòu)建結(jié)構(gòu)相似矩陣SIMingre∈RJ×J和SIMtarget∈RK×K,并結(jié)合中藥-成分和成分-靶點(diǎn)的關(guān)聯(lián)關(guān)系構(gòu)建TCMIT 異構(gòu)網(wǎng)絡(luò)。在RWR 算法中,初始隨機(jī)游走矩陣主對(duì)角線的值為1,其余值為0;重啟概率a設(shè)置為0.5;基于成分-成分和靶點(diǎn)-靶點(diǎn)網(wǎng)絡(luò)構(gòu)建具有相似性網(wǎng)絡(luò)拓?fù)涮卣鞯木仃嘡WRingre∈RJ×J和RWRtarget∈RK×K。在GIP 算法中,調(diào)節(jié)核寬度的參數(shù)設(shè)置為1,基于中藥-成分和成分-靶點(diǎn)網(wǎng)絡(luò)構(gòu)建具有異構(gòu)網(wǎng)絡(luò)拓?fù)涮卣鞯木仃嘒IPingre∈RJ×J和GIPtarget∈RK×K;分別計(jì)算SIMingre、RWRingre、RWRtarget、GIPingre、GIPtarget和SIMtarget矩陣的信息熵值,并確定特征矩陣融合權(quán)重,結(jié)果見表1。融合后生成中藥成分特征矩陣FEAingre∈RJ×J和靶點(diǎn)特征矩陣FEAtarget∈RK×K,并將中藥成分、靶點(diǎn)結(jié)合鄰接矩陣N∈RJ×K拼接生成中藥成分-靶點(diǎn)對(duì),作為DNN 的輸入。
表1 相似矩陣信息熵值Tab.1 Information entropy of similarity matrix
中藥成分-靶點(diǎn)對(duì)存在相互作用的38 286 條數(shù)據(jù)作為正例樣本集,將中藥成分和靶點(diǎn)隨機(jī)組合,可以獲取344.816 9 萬條未知標(biāo)簽的組合樣本數(shù)據(jù),并在未知標(biāo)簽的數(shù)據(jù)中隨機(jī)選取與正例樣本集數(shù)量相同的作為負(fù)例樣本集[2]。生成正例和負(fù)例樣本集后,將其混合并打亂生成76 572*3 768 的樣本數(shù)據(jù),按比例8 ∶1 ∶1 劃分訓(xùn)練集、驗(yàn)證集和測試集。
本文選用python3.7 編程語言結(jié)合Pytorch 框架建立TCMIT-DNN 模型。模型為5 層網(wǎng)絡(luò)結(jié)構(gòu),輸入層神經(jīng)元數(shù)為中藥成分ci與靶點(diǎn)tj特征向量維數(shù)之和,共計(jì)3 768 個(gè);隱含層神經(jīng)元數(shù)分別為128、64、32;輸出層神經(jīng)元數(shù)為2 個(gè);采用非線性激活函數(shù)ReLU,學(xué)習(xí)率設(shè)為0.001,batch_size 一次性輸入模型中的樣本數(shù)設(shè)為64,epochs 數(shù)據(jù)訓(xùn)練輪次設(shè)為50;模型的損失函數(shù)loss采用交叉熵(Cross Entropy Loss),其公式如(13):
式中,n為樣本數(shù)量,yi表示第i個(gè)中藥成分-靶點(diǎn)對(duì)的實(shí)際標(biāo)簽,正例為1,負(fù)例為0,pi表示樣本i預(yù)測為正例標(biāo)簽的概率。
2.2.2 模型性能指標(biāo)
為檢驗(yàn)TCMIT-DNN 模型的分類結(jié)果并對(duì)模型進(jìn)行評(píng)估,遵循二分類模型評(píng)估指標(biāo),采用ROC曲線下面積(Area Under the ROC Curve,AUC)、準(zhǔn)確率(Accuracy,ACC)和F1 值(F-Measure)從不同角度評(píng)估模型性能。
2.3.1 消融實(shí)驗(yàn)
為檢驗(yàn)TCMIT-DNN 模型整合異構(gòu)網(wǎng)絡(luò)拓?fù)涮卣鞯挠行?,分別使用包含傳統(tǒng)屬性特征的STRDNN 模型、包含層內(nèi)相似性網(wǎng)絡(luò)拓?fù)涮卣鞯腞WRDNN 模型、包含層間異構(gòu)網(wǎng)絡(luò)拓?fù)涮卣鞯腉IPDNN 模型進(jìn)行對(duì)比;為檢驗(yàn)信息熵融合相似矩陣的有效性,使用相似矩陣融合權(quán)重取均值的ENTDNN 模型進(jìn)行對(duì)比。各模型相似矩陣融合權(quán)重見表2,實(shí)驗(yàn)結(jié)果見表3。
表3 5 種算法性能比較Tab.3 Performance comparison of 5 algorithms
在相同測試集、實(shí)驗(yàn)參數(shù)和評(píng)價(jià)標(biāo)準(zhǔn)下,使用信息熵整合網(wǎng)絡(luò)拓?fù)涮卣鞯腡CMIT-DNN 模型AUC值、F1 值、ACC值均為最高,較傳統(tǒng)屬性特征STRDNN 模型分別提升了4%、5.6%、5.4%。結(jié)果表明,本文整合異構(gòu)網(wǎng)絡(luò)拓?fù)涮卣鳎兄谥兴幊煞?靶點(diǎn)相互作用分析模型性能提升,同時(shí)信息熵算法有利于降低相似矩陣數(shù)據(jù)噪聲的影響。
2.3.2 與基線模型對(duì)比
為檢驗(yàn)TCMIT-DNN 模型在中藥成分-靶點(diǎn)相互作用分析優(yōu)越性,將其與近年來基于指紋相似度常用的隨機(jī)森林(Random Forest,RF)模型[3]、梯度提升樹(Gradient Boosting Decision Tree,GBDT)模型[10]、支持向量機(jī)(Support Vector Machine,SVM)模型[11]進(jìn)行對(duì)比實(shí)驗(yàn)。RF、GBDT、SVM 模型采用成分和靶點(diǎn)結(jié)構(gòu)相似性作為輸入,利用網(wǎng)格搜索法尋找最優(yōu)參數(shù)組合,TCMIT-RF、TCMIT-GBDT、TCMIT-SVM 分別為RF、GBDT、SVM 模型在使用TCMIT 3 層異構(gòu)網(wǎng)絡(luò)策略后的模型,其中分類模型的參數(shù)保持一致。RF 分類模型的參數(shù)為:子樹的數(shù)量為100,最大深度為10;GBDT 分類模型的參數(shù)為:子樹的數(shù)量為50,最大深度為5,子采樣系數(shù)為0.7;SVM 分類模型的參數(shù)為:懲罰系數(shù)C為1,核函數(shù)為線性核函數(shù)。
由表4 可知,在相同測試集上的評(píng)價(jià)指標(biāo)表明,TCMIT-DNN 具有最高的AUC、F1值和準(zhǔn)確率,TCMIT-GBDT和TCMIT-RF 模型效果稍差,TCMITRF 模型效果較差。究其原因,是由于TCMIT-DNN模擬人腦的工作原理建立多個(gè)函數(shù)單元,以及其強(qiáng)大的非線性擬合能力,能很好地模擬成分和靶點(diǎn)的子結(jié)構(gòu),并有效處理具有空間拓?fù)涮卣鞯牟灰?guī)則數(shù)據(jù),通過驗(yàn)證集調(diào)整確定網(wǎng)絡(luò)結(jié)構(gòu)參數(shù),建立高精度判別模型。實(shí)驗(yàn)結(jié)果還表明,在對(duì)中藥成分和靶點(diǎn)數(shù)據(jù)進(jìn)行TCMIT 3 層異構(gòu)網(wǎng)絡(luò)的構(gòu)建和網(wǎng)絡(luò)特征提取后,GBDT、SVM 和RF 模型的性能均有不同程度的提升。其中,TCMIT 網(wǎng)絡(luò)結(jié)合DNN 模型效果最好,表明TCMIT 異構(gòu)網(wǎng)絡(luò)策略能有效提取中藥多成分、多靶點(diǎn)之間的潛在關(guān)聯(lián)特征,從而提升中藥成分與靶點(diǎn)相互作用的分類性能。
表4 常用算法性能比較Tab.4 Performance comparison of common algorithms
以黃芪為例基于TCMIT-DNN 模型預(yù)測中藥成分和靶點(diǎn)的關(guān)系。將黃芪的成分信息按TCMIT 異構(gòu)網(wǎng)絡(luò)策略編碼后,輸入模型得到預(yù)測靶點(diǎn),并利用Cytoscape 軟件構(gòu)建黃芪成分-靶點(diǎn)網(wǎng)絡(luò),由網(wǎng)絡(luò)圖的度篩選出重要潛在靶點(diǎn),并通過藥物化學(xué)、藥理等理論分析結(jié)果,以此驗(yàn)證TCMIT-DNN 模型的有效性。
利用預(yù)測結(jié)果構(gòu)建黃芪成分-靶點(diǎn)網(wǎng)絡(luò),計(jì)算黃芪成分-靶點(diǎn)網(wǎng)絡(luò)圖的度值,并以排序前10 的靶點(diǎn)作為最終的潛在靶點(diǎn),最終結(jié)果見表5。
表5 黃芪靶點(diǎn)預(yù)測結(jié)果分析Tab.5 Analysis of target prediction results of Huangqi
將結(jié)果進(jìn)行中藥化學(xué)數(shù)據(jù)庫驗(yàn)證,以及從DrugBank、OMIM 數(shù)據(jù)庫和文獻(xiàn)中獲取靶點(diǎn)功能和已知藥物進(jìn)行分析。分析結(jié)果表明,NQO1、ABCB1、AURKB、ADRB1 均得到中藥化學(xué)數(shù)據(jù)庫驗(yàn)證,在其余靶點(diǎn)中,HRH1 基因大量表達(dá)于平滑肌和神經(jīng)元中參與覺醒、情緒和激素分泌的控制,靶向HRH1有助于早期治療一些自身免疫性疾病[12];Huai等[13]發(fā)現(xiàn),KAT8 通過促進(jìn)I 型干擾素的產(chǎn)生,保護(hù)突變小鼠抗病毒感染;DDX1 基因與抗病毒免疫應(yīng)答、腫瘤發(fā)生發(fā)展密切相關(guān)[14];LIPE 的缺失會(huì)導(dǎo)致胰島素抵抗、糖尿病的風(fēng)險(xiǎn)增加[15];ADAMTS13 是一種多結(jié)構(gòu)域蛋白酶,其缺陷會(huì)導(dǎo)致微血管過程觸發(fā)血小板和內(nèi)皮細(xì)胞的補(bǔ)體激活,從而引發(fā)血栓性微血管病[16]。上述結(jié)果體現(xiàn)了黃芪鎮(zhèn)靜、增強(qiáng)免疫力、抗突變、抗病毒、抗腫瘤、降血糖、預(yù)防周圍血管病變的藥理作用。
中藥治療通過多成分、多靶點(diǎn)、多環(huán)節(jié)、多途徑綜合調(diào)節(jié),作用于機(jī)體治療疾病,其作用機(jī)理具有明顯的空間拓?fù)浣Y(jié)構(gòu),且其拓?fù)浣Y(jié)構(gòu)具有明顯的異構(gòu)特性?,F(xiàn)有的基于分子結(jié)構(gòu)相似性分析中藥成分-靶點(diǎn)相互作用的方法忽略了中藥、成分、靶點(diǎn)3 者之間的復(fù)雜關(guān)系,導(dǎo)致分析結(jié)果不夠精準(zhǔn)。本研究通過TCMIT3 層異構(gòu)網(wǎng)絡(luò)建立中藥、成分、靶點(diǎn)3 者之間的聯(lián)系,并利用數(shù)學(xué)統(tǒng)計(jì)結(jié)合深度學(xué)習(xí)技術(shù)預(yù)測中藥靶點(diǎn)。實(shí)驗(yàn)表明所有對(duì)比模型結(jié)合TCMIT 異構(gòu)網(wǎng)絡(luò)策略時(shí)分類性能均得到提升,其中TCMITDNN 模型均優(yōu)于其他常用模型,并將模型有效應(yīng)用于黃芪的中藥靶點(diǎn)預(yù)測。本研究的中藥靶點(diǎn)虛擬篩選方法充分利用了不同特征的優(yōu)勢,降低了傳統(tǒng)依賴于結(jié)構(gòu)相似性特征和單一描述符的風(fēng)險(xiǎn),同時(shí)擬合了中藥多成分、多靶點(diǎn)之間潛在聯(lián)系,減輕特征提取的影響,有望應(yīng)用于分子維度分析中藥的現(xiàn)代物質(zhì)基礎(chǔ)。