• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    機(jī)器學(xué)習(xí)在化合物屬性預(yù)測(cè)中的應(yīng)用*

    2024-03-01 10:44:34王紫維
    環(huán)境化學(xué) 2024年1期
    關(guān)鍵詞:方法模型

    王紫維 韓 民 金 彪

    (1.中國(guó)科學(xué)院廣州地球化學(xué)研究所,有機(jī)地球化學(xué)國(guó)家重點(diǎn)實(shí)驗(yàn)室,廣州,510640;2.中國(guó)科學(xué)院深地科學(xué)卓越創(chuàng)新中心,廣州,510640;3.中國(guó)科學(xué)院大學(xué),北京,100049)

    化合物的屬性預(yù)測(cè)在藥物研發(fā)、材料設(shè)計(jì)、毒理學(xué)研究等領(lǐng)域發(fā)揮了重要的作用,與人類生活息息相關(guān)[1?2].化合物屬性預(yù)測(cè)的相關(guān)研究可追溯到藥物合成的早期研究,當(dāng)時(shí)主要是化學(xué)家通過重復(fù)實(shí)驗(yàn),進(jìn)行測(cè)試和驗(yàn)證并獲取各類化學(xué)信息,合成目標(biāo)分子[3].由于重復(fù)實(shí)驗(yàn)耗時(shí)長(zhǎng)、成本高,科學(xué)家基于構(gòu)效關(guān)系(SAR)發(fā)展出了定量-構(gòu)效關(guān)系,為化合物結(jié)構(gòu)與其性質(zhì)之間建立了數(shù)學(xué)關(guān)系框架.1962年,Hansch等首次實(shí)踐了定量-構(gòu)效關(guān)系(QSAR),成為該領(lǐng)域具有里程碑意義的事件,也是化合物屬性預(yù)測(cè)研究邁入新階段的標(biāo)志[4].隨后,Hansch 在1964年提出了Hansch 方程,這個(gè)發(fā)現(xiàn)為QSAR 模型運(yùn)行提供了一種新方法.但傳統(tǒng)QSAR 模型一般使用一些常見的分子描述符來預(yù)測(cè)化合物屬性,然而化合物結(jié)構(gòu)多樣,少量的分子描述符很難全面地描述化合物的結(jié)構(gòu)信息,這使得模型很難精準(zhǔn)預(yù)測(cè)化合物性質(zhì).同時(shí),隨著研究數(shù)據(jù)集增大、描述符增多,傳統(tǒng)的方法難以擬合化學(xué)結(jié)構(gòu)與性質(zhì)之間的復(fù)雜關(guān)系.因此,需要比傳統(tǒng)統(tǒng)計(jì)工具更先進(jìn)、更強(qiáng)大的計(jì)算和數(shù)據(jù)分析方法.

    機(jī)器學(xué)習(xí)(特別是深度學(xué)習(xí)),由于其強(qiáng)大的計(jì)算和數(shù)據(jù)分析能力,已被用于解決以上QSAR 研究中的問題.例如,研究人員通過機(jī)器學(xué)習(xí)或深度學(xué)習(xí)方法將三維甚至更高維分子結(jié)構(gòu)與其屬性聯(lián)系起來,彌補(bǔ)了傳統(tǒng)的化合物屬性預(yù)測(cè)方法的不足之處,大力推動(dòng)了化合物屬性研究的發(fā)展[5?6].

    近年來,機(jī)器學(xué)習(xí)在化合物屬性的預(yù)測(cè)研究上表現(xiàn)出不俗的潛力,因此這方面的研究也逐年增多.比如在理化性質(zhì)方面,在機(jī)器學(xué)習(xí)的幫助下,預(yù)測(cè)分子的原子化能、振動(dòng)頻率、溶劑化自由能、計(jì)算鍵離能等,成本更低,結(jié)果準(zhǔn)確可靠,計(jì)算速度更快[7?11];在生物活性方面,建模方面逐步引入了神經(jīng)網(wǎng)絡(luò)算法、分子圖等,所構(gòu)建模型性能更優(yōu)異,結(jié)果可靠[12?14];在毒性方面,根據(jù)機(jī)器學(xué)習(xí)建立的模型可以非常有效地識(shí)別有毒分子和預(yù)測(cè)特定毒性,可篩選確認(rèn)之前未曾識(shí)別出的危險(xiǎn)化學(xué)品[15?17].本文主要介紹機(jī)器學(xué)習(xí)在化合物屬性預(yù)測(cè)方面的應(yīng)用過程及相應(yīng)的模塊內(nèi)容,并結(jié)合應(yīng)用實(shí)例總結(jié)和展望機(jī)器學(xué)習(xí)在該應(yīng)用方面現(xiàn)存的問題和機(jī)遇.

    1 機(jī)器學(xué)習(xí)預(yù)測(cè)化合物屬性的流程(The process of machine learning on compound property prediction)

    在實(shí)際應(yīng)用中,用機(jī)器學(xué)習(xí)預(yù)測(cè)化合物屬性的整體過程如下所述,見圖1.

    圖1 機(jī)器學(xué)習(xí)進(jìn)行化合物屬性預(yù)測(cè)的流程Fig.1 Process for compound property prediction based on machine learning

    (1)構(gòu)建數(shù)據(jù)集:數(shù)據(jù)集一般來源于公開的數(shù)據(jù)庫、實(shí)驗(yàn)記錄數(shù)據(jù)、研究收集的文獻(xiàn);

    (2)數(shù)據(jù)預(yù)處理;主要包括分子特征化和數(shù)據(jù)集劃分;

    (3)模型構(gòu)建:主要包括模型訓(xùn)練、算法選擇、模型的應(yīng)用域、模型評(píng)估這四方面內(nèi)容;

    (4)模型解釋:解釋機(jī)器學(xué)習(xí)模型的預(yù)測(cè)機(jī)制.

    1.1 構(gòu)建數(shù)據(jù)集

    構(gòu)建數(shù)據(jù)集是構(gòu)建模型進(jìn)行化合物屬性預(yù)測(cè)之前的必要準(zhǔn)備,模型的工作主要基于數(shù)據(jù)運(yùn)行,數(shù)據(jù)集的質(zhì)量影響了模型預(yù)測(cè)結(jié)果的可靠性以及準(zhǔn)確性.目前眾多研究工作一般通過以下幾種途徑進(jìn)行數(shù)據(jù)集的構(gòu)建:(1)根據(jù)實(shí)驗(yàn)所得數(shù)據(jù)構(gòu)建數(shù)據(jù)集;(2)從公開的數(shù)據(jù)庫中下載研究所需要的數(shù)據(jù),并整理成數(shù)據(jù)集;(3)提取他人發(fā)表在期刊、專利中的數(shù)據(jù),整理成數(shù)據(jù)集;(4)前述3 種方式的組合形式.

    實(shí)驗(yàn)室所記錄的數(shù)據(jù)比較全面,是構(gòu)建數(shù)據(jù)集的來源之一.實(shí)驗(yàn)所得數(shù)據(jù)一般分為紙質(zhì)記錄數(shù)據(jù)和電子記錄數(shù)據(jù),其中,電子記錄數(shù)據(jù)可用于數(shù)據(jù)集構(gòu)建和數(shù)據(jù)挖掘,但由于實(shí)驗(yàn)數(shù)據(jù)為實(shí)驗(yàn)者所有,大多用于進(jìn)行數(shù)據(jù)存檔和知識(shí)產(chǎn)權(quán)維權(quán),難以獲得全面的數(shù)據(jù)來進(jìn)行數(shù)據(jù)挖掘.同時(shí),他人發(fā)表在期刊、專利中的數(shù)據(jù)相對(duì)于實(shí)驗(yàn)所記錄的數(shù)據(jù)大多數(shù)都經(jīng)過文章作者精心篩選,沒有展示相關(guān)實(shí)驗(yàn)失敗的數(shù)據(jù).失敗數(shù)據(jù)的缺乏可能會(huì)造成信息缺失,從而導(dǎo)致構(gòu)建的模型不能進(jìn)行準(zhǔn)確地預(yù)測(cè).

    構(gòu)建數(shù)據(jù)集最常用的方法是從公開的數(shù)據(jù)庫獲取研究要用的數(shù)據(jù).經(jīng)過多年的發(fā)展,目前也有許多可免費(fèi)獲取化學(xué)數(shù)據(jù)的公開數(shù)據(jù)庫,部分較常見的公開數(shù)據(jù)庫可見表1.

    表1 常見的公開數(shù)據(jù)庫Table 1 Common public databases

    1.2 數(shù)據(jù)預(yù)處理

    1.2.1 分子特征化

    分子特征化是把化合物的化學(xué)結(jié)構(gòu)編碼成機(jī)器學(xué)習(xí)算法能識(shí)別的模式.不同的分子特征化方式提取的分子信息有所差異,直接影響模型的預(yù)測(cè)效果,因此是化合物屬性預(yù)測(cè)的重要部分.常見的分子特征化方法有分子描述符、分子圖、分子線性表示、分子圖像[31],以及三維分子表面點(diǎn)云[32].

    (1)分子描述符

    分子描述符與分子結(jié)構(gòu)的關(guān)系密切,可以有效地表示相應(yīng)的化學(xué)信息[33].分子描述符按照復(fù)雜程度,可分為零維、一維、二維、三維等(見圖2)[34].零維描述符是最簡(jiǎn)單的分子描述符,其信息含量低,可表示原子數(shù)、原子性質(zhì)總和、分子量等;一維描述符表示一些官能團(tuán)、分子片段、取代基等信息,如分子量、摩爾折射率、辛醇/水分配系數(shù)的對(duì)數(shù)等;二維描述符可描述從二維分子表示計(jì)算得到的性質(zhì);三維描述符信息含量很高,可描述原子的性質(zhì)、連通性以及分子的空間構(gòu)型,可用于確定化合物的活性構(gòu)象等問題;四維描述符可以定量識(shí)別和描述分子與受體活性位點(diǎn)之間的相互作用[34].

    圖2 同分子的不同分子表示的示例[34]Fig.2 An example of different molecular representations of the same molecule[34]

    分子描述符按照定量和定性分類,可分為定量分子描述符和定性分子描述符.定量分子描述符有分子場(chǎng)描述符、分子形狀描述符、物理化學(xué)描述符、基于組成信息的描述符等[35].定性分子描述符一般指分子指紋,分子指紋又稱二元指紋,采用二進(jìn)制編碼相關(guān)的化學(xué)信息,指紋所具有的化學(xué)信息內(nèi)容一般為化學(xué)圖中的原子、鍵類型和距離等,是化學(xué)結(jié)構(gòu)的表示,常被用于分子相似性/多樣性問題[34,36].

    常見的分子指紋可主要分為基于子結(jié)構(gòu)的指紋、基于拓?fù)浠蚵窂降闹讣y和圓形指紋、藥效團(tuán)指紋等[37].基于子結(jié)構(gòu)的指紋主要有MACCS 指紋[38]、PubChem 指紋、BCI 指紋、TGD 和TGT 指紋等.基于拓?fù)浠蚵窂降闹讣y主要有Daylight 指紋(Daylight fingerprint)和Tree 指紋(Tree fingerprint).圓形指紋主要有擴(kuò)展連通性指紋(ECFP/Morgan Fingerprint)[39]、FCFP(Functional-Class Fingerprints)、Molprint2D[40].

    常用于計(jì)算分子指紋的軟件或工具包有alvaDesc[41]、RDkit、Open Babel[42]、CDK[43]、ChemFP、OEChem TK、Molecular Operating Environment(MOE)、JChem from ChemAxon、Pipeline Pilot from Accelrys 等.

    (2)分子圖

    分子圖是指化合物用圖進(jìn)行表示,是化合物的拓?fù)浔硎?在分子圖中,原子用節(jié)點(diǎn)表示,分子鍵用邊表示,示例可見圖3.分子圖降低了分子結(jié)構(gòu)表示的復(fù)雜性,可以捕捉到分子中原子核與電子間的關(guān)鍵的相互作用.此外,圖神經(jīng)網(wǎng)絡(luò)(GNN)模型從分子圖進(jìn)行學(xué)習(xí)表示可以得到很好的處理效果,減少了相應(yīng)的特征工程的工作,能進(jìn)行更好的分子性質(zhì)預(yù)測(cè),如Attentive FP[44]、D-MPNN[8].

    (3)分子線性表示

    分子線性表示最常用的有兩種:簡(jiǎn)化分子線性輸入規(guī)范(Simplified molecular input line entry system,SMILES)和國(guó)際化合物標(biāo)識(shí)符(International Chemical Identifier,InChI).SMILES 是一種利用ASCII 編碼表示分子結(jié)構(gòu)的線性符號(hào),是化學(xué)家為了進(jìn)行化學(xué)方面的機(jī)器計(jì)算而設(shè)計(jì)的化學(xué)符號(hào)語言,是根據(jù)相應(yīng)的規(guī)則對(duì)化學(xué)結(jié)構(gòu)簡(jiǎn)化的二維價(jià)鍵圖[45].SMILES 既可以與化學(xué)數(shù)據(jù)庫使用,又可以節(jié)省存儲(chǔ)空間,為化學(xué)數(shù)據(jù)的輸入提供了一種更簡(jiǎn)便的方式.化合物的“SMILES”字符串可通過一些軟件或程序獲得,如ChemDraw、OpenBabel、CIRpy[46](https://github.com/mcs07/CIRpy)等,同時(shí)也可以通過網(wǎng)站獲得化合物的“SMILES”字符串,如PubChem.“SMILES”字符串除了可以直接作為模型的輸入,也可以通過一些軟件或程序轉(zhuǎn)換為其他分子特征化形式,再作為模型的輸入[6,46?48].通用的SMILES 基于CANGEN算法衍生了規(guī)范的SMILES(Canonical SMILES),但其算法具有盈利性質(zhì),從而存在無法自由使用的問題.InChI[49]是一個(gè)非盈利的、免費(fèi)的化學(xué)標(biāo)識(shí),在描述分子方面具有嚴(yán)格的唯一性,在層狀設(shè)計(jì)時(shí)考慮了分子結(jié)構(gòu),容易獲得和生成,可以由InChI 軟件或者利用通用的化學(xué)繪圖軟件生成.因此,InChI 也被許多化學(xué)數(shù)據(jù)庫使用.

    (4)分子圖像

    分子圖像是將分子結(jié)構(gòu)或坐標(biāo)映射到圖像上后,作為模型的輸入數(shù)據(jù)用于模型訓(xùn)練,從而進(jìn)行分子性質(zhì)預(yù)測(cè)[50].比如,可以通過OpenBabel、Pybel 和RDKit 等化學(xué)信息軟件將SMILES 解碼為對(duì)應(yīng)的分子二維結(jié)構(gòu),再將其生成的坐標(biāo)映射到網(wǎng)格上,形成分子圖像,示例可見圖4.對(duì)于所生成的圖像可再進(jìn)行一個(gè)“灰色編碼”或者更為復(fù)雜的“顏色編碼”,表示出原子/鍵屬性,再用于卷積神經(jīng)網(wǎng)絡(luò)(CNN)算法進(jìn)行訓(xùn)練[50?51].

    圖4 RDkit 將化合物SMILES 轉(zhuǎn)換為分子圖像的示例Fig.4 An example of RDkit transforming SMILES into the molecular image

    1.2.2 數(shù)據(jù)集劃分

    整理好研究所需的數(shù)據(jù)集之后,應(yīng)及時(shí)對(duì)數(shù)據(jù)進(jìn)行劃分,數(shù)據(jù)劃分對(duì)于所建機(jī)器學(xué)習(xí)模型的泛化能力有一定影響.一般,數(shù)據(jù)集按比例隨機(jī)劃分為3 部分:訓(xùn)練集、測(cè)試集、驗(yàn)證集,其中,訓(xùn)練集一般用于模型的訓(xùn)練,測(cè)試集用于模型的性能評(píng)估,驗(yàn)證集用于超參數(shù)的優(yōu)化[52?53].但是,研究過程中數(shù)據(jù)集劃分的具體的分配比例應(yīng)按照研究需要進(jìn)行選擇,比如,有研究按8:1:1 的比例劃分成訓(xùn)練集、驗(yàn)證集和測(cè)試集[47];也有研究先將數(shù)據(jù)集按4:1 的比例隨機(jī)分成兩部分:訓(xùn)練集和測(cè)試集,隨后在訓(xùn)練過程中隨機(jī)抽取10%的訓(xùn)練集數(shù)據(jù)作為驗(yàn)證集數(shù)據(jù)[52].

    當(dāng)機(jī)器學(xué)習(xí)應(yīng)用于分類問題時(shí),可能會(huì)碰到數(shù)據(jù)集中各類別樣本數(shù)量分布不均衡的問題,即數(shù)據(jù)集中某一類別的樣本數(shù)量遠(yuǎn)遠(yuǎn)高于另一類.不平衡數(shù)據(jù)會(huì)影響模型的性能,因此,在數(shù)據(jù)集劃分后需對(duì)訓(xùn)練集數(shù)據(jù)進(jìn)行不平衡處理.目前進(jìn)行不平衡數(shù)據(jù)處理的方法主要有數(shù)據(jù)重構(gòu)和分類模型改進(jìn).

    數(shù)據(jù)重構(gòu)策略可分為特征選擇和重采樣技術(shù)[54].特征選擇方法主要分成3 類:過濾式、包裹式和嵌入式.重采樣技術(shù)是通過調(diào)整多數(shù)類和少數(shù)類的分布,削弱數(shù)據(jù)集不平衡的程度,主要包括欠采樣、過采樣、混合采樣.欠采樣通過減少多數(shù)類中的樣本數(shù)量,以平衡多數(shù)類和少數(shù)類;過采樣通過增加少數(shù)類中的樣本數(shù)量,以均衡數(shù)據(jù)集;混合采樣通過將過采樣和欠采樣組合在一起,提高分類性能[52].

    分類模型改進(jìn)策略主要從分類算法和分類思想對(duì)不平衡數(shù)據(jù)集進(jìn)行優(yōu)化和改進(jìn).分類算法主要有K 最近鄰、支持向量機(jī)、決策樹、樸素貝葉斯、神經(jīng)網(wǎng)絡(luò)算法;分類思想主要有代價(jià)敏感學(xué)習(xí)、集成學(xué)習(xí)、單類學(xué)習(xí)、主動(dòng)學(xué)習(xí)[54].

    1.3 模型的構(gòu)建

    1.3.1 算法選擇

    模型訓(xùn)練是指通過訓(xùn)練集數(shù)據(jù)進(jìn)行擬合模型、學(xué)習(xí)模型參數(shù)的過程.在這個(gè)過程,需要選擇合適的算法進(jìn)行訓(xùn)練.算法是機(jī)器學(xué)習(xí)的核心內(nèi)容,沒有算法,機(jī)器學(xué)習(xí)模型將無法運(yùn)行.目前,機(jī)器學(xué)習(xí)的算法按照是否有人類監(jiān)督訓(xùn)練,可分為監(jiān)督式學(xué)習(xí)、無監(jiān)督式學(xué)習(xí)、半監(jiān)督式學(xué)習(xí)、強(qiáng)化學(xué)習(xí)這4 個(gè)主要類型.監(jiān)督式學(xué)習(xí)可以處理有標(biāo)記的訓(xùn)練數(shù)據(jù),其算法主要有K-近鄰算法、線性回歸、邏輯回歸、支持向量機(jī)(SVM)[55]、神經(jīng)網(wǎng)絡(luò)、決策樹[56]和隨機(jī)森林(RF)[57].無監(jiān)督式學(xué)習(xí)使用的數(shù)據(jù)是沒有標(biāo)記的,其算法主要可分為聚類算法、可視化和降維算法、關(guān)聯(lián)規(guī)則學(xué)習(xí)算法.聚類算法主要有k-平均算法、分層聚類分析、最大期望算法等;可視化和降維算法主要有主成分分析(PCA)、核主成分分析(Kernel PCA)、局部線性嵌入(LLE)、t-分布隨機(jī)近臨嵌入(t-SNE);關(guān)聯(lián)規(guī)則學(xué)習(xí)算法主要有Apriori、Eclat.半監(jiān)督式學(xué)習(xí)可以處理部分標(biāo)記(大量未標(biāo)記和少量標(biāo)記)的數(shù)據(jù),其主要為監(jiān)督式學(xué)習(xí)算法與無監(jiān)督式學(xué)習(xí)算法的結(jié)合.強(qiáng)化學(xué)習(xí)[58]是學(xué)習(xí)到行動(dòng)的一種映射,通過不斷試錯(cuò),尋找到能夠最大化預(yù)期的路徑,并對(duì)能最大化預(yù)期的行動(dòng)進(jìn)行獎(jiǎng)勵(lì),主要涉及到的策略是試錯(cuò)搜索和延遲獎(jiǎng)勵(lì),這兩種策略是強(qiáng)化學(xué)習(xí)的最明顯最重要的特征.在化合物屬性預(yù)測(cè)中,常用的是監(jiān)督學(xué)習(xí)模式[59]、半監(jiān)督式學(xué)習(xí);常用的算法有隨機(jī)森林[57]、支持向量機(jī)[55]、樸素貝葉斯、神經(jīng)網(wǎng)絡(luò)、梯度提升決策樹(GBDT)、極限梯度提升算法(XGBoost)、線性回歸、決策樹[56]、邏輯回歸等算法.

    1.3.2 模型應(yīng)用域

    在化學(xué)信息研究中,為了更高效地進(jìn)行化合物屬性的預(yù)測(cè),通常將機(jī)器學(xué)習(xí)方法應(yīng)用于定量構(gòu)效關(guān)系中,其中涉及到的模型應(yīng)用域(AD)一般指化學(xué)空間中由描述符和模型響應(yīng)定義的一個(gè)理論域,其任務(wù)是定義一個(gè)模型可以被使用的邊界,并提供可靠的預(yù)測(cè)[60?61].當(dāng)要預(yù)測(cè)的分子在所定義的AD 范圍內(nèi)時(shí),使用該模型進(jìn)行預(yù)測(cè)才可靠,否則該模型不適用.

    對(duì)于模型應(yīng)用域的表征,已有學(xué)者在這個(gè)方面進(jìn)行過總結(jié),不同的學(xué)者考慮的角度不同,進(jìn)行的歸類方式和描述稱呼各有不同.Kar 等[61]根據(jù)不同假設(shè)將AD 的定義方法分為6 大類:描述符空間中基于范圍的方法、基于距離的方法、幾何方法、概率密度分布、響應(yīng)變量的范圍、其他方法,而王中鈺等[62]根據(jù)AD 的概念將其分為描述符域、結(jié)構(gòu)域、機(jī)理域3 個(gè)大類,再從這3 大類中對(duì)AD 的表征方法進(jìn)行細(xì)分.此外,也有一些學(xué)者提出或開發(fā)了新的應(yīng)用域表征方法或應(yīng)用域算法,如Wang 等人[63]基于指紋特異性相似性閾值,開發(fā)了新的AD 表征方法—ADfingerprint,并證明其性能優(yōu)于一些傳統(tǒng)的AD 表征方法;Berenger 等[64]對(duì)于創(chuàng)建的應(yīng)用域較為復(fù)雜并難以理解的現(xiàn)狀,提出了基于距離的Boolean 應(yīng)用域算法(DBBAD).雖然AD 表征方法的描述各有異同,但最常用的幾種表征方法一般為歐式距離、Tanimoto指數(shù)、杠桿方法、馬氏距離、核密度估計(jì)(KDE)、基于范圍的超矩形等方法.連續(xù)數(shù)據(jù)的研究,一般選用歐式距離定義模型應(yīng)用域[65];而針對(duì)二進(jìn)制數(shù)據(jù)或者想要進(jìn)行分子相似度的比較的研究,一般選用Tanimoto 指數(shù)定義模型應(yīng)用域[47?48].

    1.3.3 模型性能評(píng)估

    模型的性能評(píng)估是對(duì)所構(gòu)建的模型的泛化能力進(jìn)行評(píng)估,有助于判定模型的工作性能和開發(fā)適合研究數(shù)據(jù)的最佳模型,主要包括了性能度量、評(píng)估方法、過擬合或欠擬合、超參數(shù)調(diào)優(yōu)、泛化能力這幾個(gè)方面的內(nèi)容.模型泛化能力是指所構(gòu)建的模型經(jīng)過在訓(xùn)練集數(shù)據(jù)的訓(xùn)練之后,在新數(shù)據(jù)上的適應(yīng)能力.過擬合和欠擬合都是模型泛化能力不好的行為表示.過擬合指模型過度學(xué)習(xí)訓(xùn)練集數(shù)據(jù),使得模型過為復(fù)雜,不能在除訓(xùn)練集外的數(shù)據(jù)集上得到好表現(xiàn);欠擬合指模型過為簡(jiǎn)單,學(xué)習(xí)能力差,無法學(xué)到數(shù)據(jù)的內(nèi)在特點(diǎn),無法判定其潛在的趨勢(shì)[66].

    模型性能的評(píng)估方法常見的有留出法(hold-out)、交叉驗(yàn)證法(cross validation)、自助法(bootstrapping).在模型評(píng)估的實(shí)際情況中,一般先用評(píng)估方法對(duì)模型進(jìn)行數(shù)據(jù)集劃分,再在測(cè)試集上用評(píng)估指標(biāo)對(duì)模型性能進(jìn)行評(píng)估.比如,Korkmaz[52]在研究中先用留出法將數(shù)據(jù)集劃分為80%的訓(xùn)練集和20%的測(cè)試集,之后用計(jì)算了幾個(gè)性能指標(biāo)對(duì)模型進(jìn)行了性能評(píng)估.

    在化合物屬性預(yù)測(cè)方面的應(yīng)用,主要可將機(jī)器學(xué)習(xí)任務(wù)分為回歸問題和分類問題兩方面.在性能度量涉及到的性能指標(biāo)方面,回歸問題和分類問題所用到的性能評(píng)價(jià)指標(biāo)并不完全一致.回歸問題常用到的評(píng)價(jià)指標(biāo)有均方根誤差(root mean squared error,RMSE)、平均絕對(duì)誤差(mean absolute error,MAE)、均方誤差(mean square error,MSE)、均方根對(duì)數(shù)誤差(root mean squared logarithmic error,RMSLE)、決定系數(shù)(coefficient of determination,R2)和預(yù)測(cè)平方相關(guān)系數(shù)(predictive squared correlation coefficient,Q2)等.分類問題常用到的評(píng)價(jià)指標(biāo)有準(zhǔn)確率(accuracy,acc)、錯(cuò)誤率(error)、精確率(precision rate,p)、召回率(recall rate,r)、F1 分?jǐn)?shù)(F1-score)、ROC 曲線(receiver operating characteristic)、AUC(area under curve)等.分類問題的數(shù)據(jù)集并不一定平衡,在大多應(yīng)用情況下都會(huì)出現(xiàn)數(shù)據(jù)分布不均導(dǎo)致數(shù)據(jù)不平衡的現(xiàn)象,這種情況下,首先要在訓(xùn)練集上進(jìn)行數(shù)據(jù)不平衡處理,之后再用測(cè)試集對(duì)其進(jìn)行評(píng)估.針對(duì)不平衡數(shù)據(jù)集,準(zhǔn)確率往往無法作為主要的判斷指標(biāo),因此一般可采用前文所提到的精確率、召回率、F1 分?jǐn)?shù)以及均衡準(zhǔn)確率(balanced accuracy)和G-mean[54].除了上述的指標(biāo)外,還有一些其他的指標(biāo),如魯棒性、PRC(精確-召回曲線)等.在實(shí)際的應(yīng)用情況中,指標(biāo)的選擇應(yīng)根據(jù)數(shù)據(jù)的情況和研究需要來進(jìn)行選擇.

    1.4 模型解釋

    模型解釋是對(duì)模型的預(yù)測(cè)機(jī)制進(jìn)行解析的過程,有利于研究者做出更好的決策,并建立起對(duì)模型的理解和信任[67?68].模型根據(jù)解釋的難易程度,可以分為“白盒”模型和“黑盒”模型.“白盒”模型又可稱為可解釋性模型,創(chuàng)建其模型的算法透明度低,解釋簡(jiǎn)單,更易被人們理解.可解釋性模型一般指由線性回歸、邏輯回歸、其他線性擴(kuò)展、決策樹等算法構(gòu)建的模型.建立“黑盒”模型后再進(jìn)行解釋這一行為也可稱為事后可解釋性,進(jìn)行事后可解釋的方法主要可以分為兩大類:全局解釋和局部解釋,全局解釋是對(duì)模型整體進(jìn)行解釋,而局部解釋是對(duì)單個(gè)預(yù)測(cè)進(jìn)行解釋[69].

    全局解釋的方法主要有部分依賴圖(partial dependence plot,PDP)、累積局部效應(yīng)(accumulated local effects plot,ALE)、規(guī)則提取[70]、模型蒸餾[71]、稀疏集團(tuán)套索(sparse group lasso,SGL)[72]、全局Shapley值等.局部解釋的方法主要有個(gè)體條件期望(individual conditional expectation,ICE)[73]、敏感性分析、局部可解釋的模型無關(guān)闡釋(local interpretable model-agnostic explanations,LIME)[67]、Anchor[74]、基于局部規(guī)則的黑盒模型的分層相關(guān)性傳播(LRP)[75]、類激活映射(class activation mapping,CAM)、梯度加權(quán)類激活映射(Grad-CAM)[76]、SHAP(shapley additive exPlanations)[77]等.在化合物屬性預(yù)測(cè)方面,比較常用的解釋方法有PDP、ALE、ICE、Grad-CAM、Shapley Value、SHAP 等.如Zhong 等[6]利用Grad-CAM來解釋構(gòu)建的CNN 模型通過選擇分子圖像的哪些特征來進(jìn)行預(yù)測(cè).Sanches-Neto 等[46]在預(yù)測(cè)水中有機(jī)污染物自由基氧化過程的反應(yīng)速率常數(shù)的研究中,利用SHAP 方法解釋了反應(yīng)過程中相關(guān)的結(jié)構(gòu)分子特征,將氧原子所做的貢獻(xiàn)從氧原子與碳原子的比例(#O:C)的貢獻(xiàn)區(qū)分出來.

    2 機(jī)器學(xué)習(xí)在化合物屬性預(yù)測(cè)中的應(yīng)用進(jìn)展(The application progress of machine learning on compound property prediction)

    2.1 理化性質(zhì)預(yù)測(cè)

    機(jī)器學(xué)習(xí)中的神經(jīng)網(wǎng)絡(luò)算法可被用于量子化學(xué)性質(zhì)預(yù)測(cè).比如,2017年,由Gilmer 等[7]提出來的應(yīng)用于分子圖的監(jiān)督學(xué)習(xí)框架——消息傳遞神經(jīng)網(wǎng)絡(luò)(message passing neural networks,MPNNs),更易理解圖的結(jié)構(gòu)數(shù)據(jù)與模型之間的關(guān)系.他們基于MPNNs 進(jìn)行建模,采用QM9 數(shù)據(jù)集的數(shù)據(jù),對(duì)分子的原子化能、振動(dòng)頻率、最高占據(jù)分子軌道(HOMO)、最低未占據(jù)分子軌道(LUMO)、偶極矩等性質(zhì)進(jìn)行了預(yù)測(cè),結(jié)果表明利用機(jī)器學(xué)習(xí)進(jìn)行分子性質(zhì)預(yù)測(cè)的成本比密度泛函理論(DFT)計(jì)算低且計(jì)算速度更快,計(jì)算樣本誤差比DFT 小,在大型圖中應(yīng)用良好.之后,有學(xué)者在MPNNs 的基礎(chǔ)上進(jìn)行改動(dòng),提出了知識(shí)嵌入消息傳遞神經(jīng)網(wǎng)絡(luò)(KEMPNN)[78].KEMPNN 在MPNN 中的消息傳遞階段添加了知識(shí)注意機(jī)制作為一項(xiàng)加權(quán)項(xiàng),采用兩個(gè)數(shù)據(jù)集共同訓(xùn)練MPNN,并在ESOL,F(xiàn)reeSolv,Lipophilicity 以及聚合物性能數(shù)據(jù)集上進(jìn)行了測(cè)評(píng),與MPNN 進(jìn)行了對(duì)比.結(jié)果表明,KEMPNN 比MPNN 的模型的預(yù)測(cè)精度更高,并且發(fā)現(xiàn)了KEMPNN 在小數(shù)據(jù)集上的預(yù)測(cè)效果可與基于描述符的方法相當(dāng)甚至更好.

    溶劑化自由能與許多物理化學(xué)性質(zhì)密切相關(guān),在藥物發(fā)現(xiàn)方面有重要的影響,但溶劑化自由能的實(shí)驗(yàn)數(shù)據(jù)較少,且實(shí)驗(yàn)成本昂貴.盡管已經(jīng)有一些相應(yīng)的溶劑模型可預(yù)測(cè)溶劑化自由能,使得費(fèi)用成本有所降低,但其準(zhǔn)確性較低.相比之下,機(jī)器學(xué)習(xí)在溶劑化自由能預(yù)測(cè)方面更具優(yōu)勢(shì),既不會(huì)產(chǎn)生昂貴的費(fèi)用,又保證了較高的溶劑化自由能預(yù)測(cè)準(zhǔn)確率[10,79].如,Yang 等[8]在MPNN 的基礎(chǔ)上構(gòu)建了一個(gè)基于定向鍵的消息傳遞方式,并結(jié)合分子水平特征和分子式構(gòu)建了新的模型D-MPNN,在FreeSolv 數(shù)據(jù)集上表現(xiàn)出比其他基準(zhǔn)模型更好的性能;Weinreich 等[9]提出了一個(gè)以核嶺回歸(KRR)算法作為監(jiān)督機(jī)器方法的自由能機(jī)器學(xué)習(xí)模型(FML),并在FreeSolv 數(shù)據(jù)集和QM9 數(shù)據(jù)集上進(jìn)行了溶劑化自由能預(yù)測(cè),模型誤差與最好的物理預(yù)測(cè)方法相當(dāng),但計(jì)算成本更低,并且可在較小數(shù)據(jù)集上達(dá)到溶劑化的實(shí)驗(yàn)不確定度.需要指出的是,機(jī)器學(xué)習(xí)在溶劑化自由能預(yù)測(cè)方面存在數(shù)據(jù)稀缺的問題,深度學(xué)習(xí)的模型在小數(shù)據(jù)集上容易過擬合,性能差.鑒于此,Vermeire 等[80]基于D-MPNN 構(gòu)建了一個(gè)模型,通過引入一種結(jié)合量子化學(xué)和實(shí)驗(yàn)數(shù)據(jù)的遷移學(xué)習(xí)方法使模型在溶劑化自由能預(yù)測(cè)方面的性能得到了顯著提升;Zhang 等[10]提出一個(gè)基于GNN 和3D 原子特征的深度學(xué)習(xí)(DL)模型構(gòu)架,GNN 以主領(lǐng)域聚合PNAConv 作為編碼器,并將其與遷移學(xué)習(xí)策略相結(jié)合,進(jìn)行模型微調(diào)后在FreeSolv 數(shù)據(jù)集進(jìn)行溶劑化自由能預(yù)測(cè)并得到了目前最好的性能,RMSE 為0.719 kcal·mol?1,MAE 為0.417 kcal·mol?1,顯著提高了GNN 模型在溶劑化自由能預(yù)測(cè)方面的學(xué)習(xí)能力,為處理小型實(shí)驗(yàn)數(shù)據(jù)集提供了思考方向.

    此外,機(jī)器學(xué)習(xí)在預(yù)測(cè)化合物的其他性質(zhì)方面也有不錯(cuò)的表現(xiàn),以全氟化合物(PFASs)理化性質(zhì)預(yù)測(cè)為例.在全氟化合物(PFASs)理化性質(zhì)預(yù)測(cè)方面,Raza 等[11]在2019年提出了第一個(gè)利用機(jī)器學(xué)習(xí)來預(yù)測(cè)各種PFAS 結(jié)構(gòu)中的C—F 鍵解離能的應(yīng)用.這個(gè)應(yīng)用高效可靠準(zhǔn)確,訓(xùn)練數(shù)據(jù)時(shí)間短,預(yù)測(cè)C—F 鍵解離能的時(shí)間不超過1 s,偏差小于0.70 kcal·mol?1,不需量子力學(xué)計(jì)算,計(jì)算成本更低,有助于PFAS 和高效處理與去除.之后,有學(xué)者[81]于2021年構(gòu)建了一個(gè)數(shù)據(jù)庫框架,所構(gòu)建PFAS-Map 可以預(yù)測(cè)未測(cè)定的PFAS 化學(xué)品的基本物理性質(zhì),可視化PFAS 活性/性質(zhì)關(guān)系的實(shí)驗(yàn)數(shù)據(jù)趨勢(shì),發(fā)現(xiàn)隱藏的結(jié)構(gòu) -毒性關(guān)系.

    2.2 生物活性預(yù)測(cè)

    機(jī)器學(xué)習(xí)在上世紀(jì)就開始用于進(jìn)行生物活性預(yù)測(cè).在20 世紀(jì)90年代,神經(jīng)網(wǎng)絡(luò)算法廣泛應(yīng)用于定量結(jié)構(gòu)-活性關(guān)系,但由于其算法的局限性,在2000年早期被SVM 和RF 取代.近些年,神經(jīng)網(wǎng)絡(luò)算法逐步改進(jìn),引起了人們的關(guān)注,發(fā)現(xiàn)改進(jìn)后的神經(jīng)網(wǎng)絡(luò)算法在生物活性預(yù)測(cè)方面頗具優(yōu)勢(shì).2015年,Ma 和Dahl 等[82]采用“原子對(duì)”描述符和“供體-受體對(duì)”描述符的并集作為描述符來訓(xùn)練模型,并將深度神經(jīng)網(wǎng)絡(luò)(DNN)的性能評(píng)估參數(shù)R2與RF 模型在15 個(gè)數(shù)據(jù)集(Merck 公司內(nèi)部的數(shù)據(jù)集)上進(jìn)行比較,結(jié)果表明DNN 在大多數(shù)情況下預(yù)測(cè)性能都優(yōu)于RF 模型,在計(jì)算時(shí)間和成本方面甚至比RF 更有優(yōu)勢(shì),可作為一種實(shí)用的QSAR 方法.但需要指出的是,該項(xiàng)研究也存在局限性,無法闡明分子間未完成的潛在相互作用.針對(duì)這些缺點(diǎn),Wallach 等[12]建立了第一個(gè)基于結(jié)構(gòu)的深度卷積神經(jīng)網(wǎng)絡(luò)—AtomNet,可應(yīng)用于小分子生物活性預(yù)測(cè).他們將AtomNet 與DNN 技術(shù)進(jìn)行對(duì)比,發(fā)現(xiàn)AtomNet 可為目標(biāo)預(yù)測(cè)出新的活性分子,所構(gòu)建的模型能發(fā)現(xiàn)任意的分子特征,可描述配體和目標(biāo)之間的相互作用;同時(shí),在3 個(gè)基準(zhǔn)上做了應(yīng)用,結(jié)果表明AtomNet 表現(xiàn)出色,在DUDE 基準(zhǔn)測(cè)試中有一半的目標(biāo)的AUC 為0.9,遠(yuǎn)超以前的對(duì)接方法.

    此外,2019年,Cheng 和Ng[13]在前人的基礎(chǔ)上建立了ML-QSAR 模型預(yù)測(cè)全氟化合物(PFASs)的生物活性,引入了基于圖的模型,預(yù)測(cè)了OECD 名單中未經(jīng)測(cè)試的PFASs 的生物活性.在整個(gè)過程中,基于自行收集整理的PFASs 數(shù)據(jù)庫訓(xùn)練和評(píng)估了5 種機(jī)器學(xué)習(xí)模型,采用了ECFP、圖卷積、weave 特征3 種方法進(jìn)行分子特征化,網(wǎng)格搜索和貝葉斯優(yōu)化技術(shù)進(jìn)行超參數(shù)調(diào)優(yōu),基于距離的方法確定QSAR 模型的AD 值,結(jié)果表明,多任務(wù)神經(jīng)網(wǎng)絡(luò)模型和基于圖的圖卷積模型性能優(yōu)異,但構(gòu)建的模型不能提供有關(guān)效應(yīng)強(qiáng)度或劑量反應(yīng)的信息,有進(jìn)一步發(fā)展的空間.此外,不同于常用于化合物活性預(yù)測(cè)的結(jié)構(gòu)-活性關(guān)系(SAR)模型,Bertoni 等[14]于2021年構(gòu)建了一個(gè)深度神經(jīng)網(wǎng)絡(luò)的集合—SigAR(signature–activity relationship)模型預(yù)測(cè)分子的生物活性,讓機(jī)器學(xué)習(xí)從化合物的CC signatures(基于一個(gè)小分子生物活性特征集合開發(fā)的分子表征方法)中學(xué)習(xí)活性特征,并用MoleculeNet 中的9 個(gè)數(shù)據(jù)集評(píng)估了SigAR.其結(jié)果表明,相較于基于化學(xué)描述符的方法,SigAR 的性能更好.

    2.3 毒性預(yù)測(cè)

    對(duì)化合物的毒性進(jìn)行預(yù)測(cè),是藥物研發(fā)的一部分,對(duì)于藥物研發(fā)的成本和成功率有重要影響.同時(shí),化合物毒性預(yù)測(cè)也是化學(xué)品風(fēng)險(xiǎn)評(píng)估的一部分內(nèi)容,但基于動(dòng)物實(shí)驗(yàn)的毒性預(yù)測(cè),時(shí)間周期長(zhǎng),成本開支大.此外,人工合成化合物的種類在逐漸增多,在日常生活中隨處可見,識(shí)別危險(xiǎn)化學(xué)品的潛在毒性是有必要的,對(duì)化合物進(jìn)行毒性預(yù)測(cè)的需求在持續(xù)增長(zhǎng).機(jī)器學(xué)習(xí)應(yīng)用于化合物的毒性預(yù)測(cè)具有降低成本和加快研究速度的特點(diǎn),因此,機(jī)器學(xué)習(xí)在化合物毒性預(yù)測(cè)方面的研究一直以來都是熱點(diǎn)研究領(lǐng)域,相關(guān)的研究也比較多.

    2008年,美國(guó)的EPA、NIH 和FDA 開展了Tox21 計(jì)劃,這個(gè)計(jì)劃匯總了許多化合物的毒性數(shù)據(jù),推動(dòng)了機(jī)器學(xué)習(xí)在預(yù)測(cè)化學(xué)品的潛在毒性和評(píng)估化學(xué)品風(fēng)險(xiǎn)的進(jìn)程.2016年,Mary 等[83]開發(fā)了適用于毒性預(yù)測(cè)的集成模型—DeepTox,并將其運(yùn)用于Tox21 挑戰(zhàn)賽上.他們采用了化合物的大量的靜態(tài)特征(如,MACCS 指紋、PubChem 子結(jié)構(gòu)指紋等)和動(dòng)態(tài)特征(如,ECFP 指紋、徑向2D 指紋等)作為機(jī)器學(xué)習(xí)的輸入,并對(duì)DeepTox 中的每個(gè)機(jī)器學(xué)習(xí)算法模型進(jìn)行了性能評(píng)估,比較了各算法的AUC值,結(jié)果表明DNN 優(yōu)于SVM、RF、彈性網(wǎng)(ElNet).同時(shí),由DNN 主導(dǎo)的DeepTox 應(yīng)用于預(yù)測(cè)化合物毒性,取得了Tox21 大挑戰(zhàn)的冠軍.2019年,Pu 等[84]基于機(jī)器學(xué)習(xí)技術(shù)開發(fā)了一個(gè)新的程序—eToxPred,可以直接從分子指紋預(yù)測(cè)小型化合物的毒性.eToxPred 采用額外樹(Extra Trees,ET)算法作為毒性預(yù)測(cè)的默認(rèn)分類器,并在不同的數(shù)據(jù)集上與線性判別分析(LDA),多層感知器(MLP),隨機(jī)森林(RF)算法進(jìn)行了性能對(duì)比.結(jié)果表明,使用分子指紋作為輸入,基于ET 的分類器性能普遍高于LDA 和MLP,僅在一個(gè)組合數(shù)據(jù)集上略低于RF,可以非常有效地識(shí)別有毒分子和預(yù)測(cè)特定毒性.

    在化合物毒性評(píng)估方面,常用結(jié)構(gòu)警報(bào)(structural alerts,SAs)作為識(shí)別危險(xiǎn)化學(xué)品的潛在毒性的方法,但SAs 的準(zhǔn)確性有限,有時(shí)在無毒化合物中也會(huì)發(fā)現(xiàn)SAs[85].Mukherjee 等[15]引入了一個(gè)新概念——“關(guān)鍵結(jié)構(gòu)圖案”(critical structural motif,CSM),CSM 包含了SAs 的特異性.同時(shí),他們用SMILES 字符串作為模型輸入,開發(fā)了一個(gè)基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)的多輸出分類的深度學(xué)習(xí)模型--VisualTox,并在不同的化學(xué)數(shù)據(jù)上進(jìn)行了訓(xùn)練,通過識(shí)別 CSM 來預(yù)測(cè)內(nèi)分泌干擾物質(zhì)(ECD)的毒性,提供了一種理解化學(xué)毒性來源的新方法.

    此外,持久性有機(jī)污染物(POPs)和持久性、生物累積性和毒性物質(zhì)(PBT)對(duì)生態(tài)環(huán)境和人類健康都有重大影響,PBT/POP 類化學(xué)品也備受人們的關(guān)注.Sun 等[16]于2020年采用基于2424 個(gè)分子描述的二維表示矩陣(MDRM)作為模型輸入,開發(fā)了一個(gè)深度卷積神經(jīng)網(wǎng)絡(luò)(DCNN)模型來篩選化學(xué)品庫中潛在的PBT/POP 類物質(zhì),并采用k折交叉驗(yàn)證法和專家經(jīng)驗(yàn)判斷方法對(duì)模型性能進(jìn)行評(píng)價(jià),得到模型的預(yù)測(cè)精度可達(dá)90.4%.但需要指出的是,DCNN 模型是一個(gè)“黑盒”模型,基本不可得到有效的解釋.最近,Wang 等[17]利用一個(gè)包含14994 種PBT 和non-PBT 物質(zhì)的化學(xué)數(shù)據(jù)庫,基于圖注意力網(wǎng)絡(luò)(graph attention networks,GATs)架構(gòu),構(gòu)建了可篩選PBT 化學(xué)品并具有可解釋性的GAT 模型.GATs 是一種較先進(jìn)的GNN,為分子圖的每個(gè)節(jié)點(diǎn)引入了注意權(quán)重參數(shù)(PAW),可反映節(jié)點(diǎn)對(duì)預(yù)測(cè)端點(diǎn)的貢獻(xiàn),關(guān)注與目標(biāo)任務(wù)相關(guān)的重要局部結(jié)構(gòu),具有模型可解釋性.他們?cè)贏D 表征方面,提出并采用了一種新的方法—ADFP-AC,使GAT 模型更加可靠;在模型性能方面,將具有ADFP-AC表征的GAT 模型與DCNN 模型、傳統(tǒng)的機(jī)器學(xué)習(xí)方法(如隨機(jī)森林、支持向量機(jī))和根據(jù)不同分子特征化方法建立的QSAR 模型進(jìn)行性能對(duì)比,發(fā)現(xiàn)GAT 模型的性能最佳.在建立好GAT 模型之后,他們還將其應(yīng)用在中國(guó)現(xiàn)有化學(xué)物質(zhì)清單(IECSC)上,從中確定了8 類之前未確認(rèn)的化合物類別為PBT 化學(xué)品.

    3 機(jī)器學(xué)習(xí)在化合物屬性預(yù)測(cè)中的挑戰(zhàn)(The challenges of machine learning on compound property prediction)

    3.1 數(shù)據(jù)集

    目前,在構(gòu)建數(shù)據(jù)集的過程中,研究者往往面臨以下3 個(gè)問題,包括數(shù)據(jù)量不足、數(shù)據(jù)質(zhì)量不高以及數(shù)據(jù)不平衡.針對(duì)數(shù)據(jù)量不足問題,雖然前文介紹了一些相關(guān)的公開數(shù)據(jù)庫,但這些數(shù)據(jù)庫對(duì)于研究人員來說,數(shù)量還是較少,而且數(shù)據(jù)不夠全面,很多重要的化學(xué)信息被收集在商業(yè)數(shù)據(jù)庫中或其他難以獲取的數(shù)據(jù)庫中.此外,雖然公開的一些大型化學(xué)數(shù)據(jù)庫數(shù)據(jù)多,規(guī)模大,但是擁有的標(biāo)簽數(shù)據(jù)并不多.這種情況限制了監(jiān)督學(xué)習(xí)在化合物屬性預(yù)測(cè)方面進(jìn)行更深入的研究[51].這些都使得研究人員無法得到足夠的數(shù)據(jù),利用機(jī)器學(xué)習(xí)在化合物屬性層面進(jìn)行一個(gè)更好的突破.面臨的問題之二是數(shù)據(jù)的質(zhì)量不高.有些數(shù)據(jù)來自于實(shí)驗(yàn)記錄,雖然實(shí)驗(yàn)記錄數(shù)據(jù)能得到更多、更為全面的數(shù)據(jù),但公開的實(shí)驗(yàn)數(shù)據(jù)如何保證質(zhì)量,也是值得思考的問題.面臨的問題之三是數(shù)據(jù)不平衡問題.雖然機(jī)器學(xué)習(xí)有許多經(jīng)典的分類算法,如樸素貝葉斯、KNN、基于神經(jīng)網(wǎng)絡(luò)的分類算法等,這些算法盡可能地保留了原數(shù)據(jù)所有的信息,但是由于這些算法的假設(shè)都是基于平衡的樣本數(shù)據(jù),所以當(dāng)數(shù)據(jù)有少數(shù)類和多數(shù)類的情況出現(xiàn)時(shí),這些算法皆會(huì)更傾向于多數(shù)類數(shù)據(jù)[86].對(duì)此,許多學(xué)者提出了一些數(shù)據(jù)不平衡處理方法,如過采樣、欠采樣、混合采樣和特征選擇等,這些處理方法在一定程度上能夠緩解不平衡問題,但都存在不足.比如,欠采樣方法雖然簡(jiǎn)單又效果好,但是容易忽略多數(shù)類數(shù)據(jù)的內(nèi)在特征信息,影響模型的泛化能力.

    3.2 分子特征化

    分子特征化方法是化合物屬性預(yù)測(cè)中的重點(diǎn)之一,決定了模型的性能和解釋.目前,分子特征化方法能夠表征的信息很多,比如,定量分子描述符可以量化Hammett 常數(shù)、偶極矩、HOMO 和LUMO 能量等信息,為化合物的性質(zhì)預(yù)測(cè)提供了良好的輸入信息.但目前還沒有可以完整表達(dá)原始分子信息的特征化方式[87].

    此外,雖然分子指紋種類也頗多,但目前主要還是用二維(2D)分子指紋來做相應(yīng)的研究,高維度的分子指紋設(shè)計(jì)較為困難,這導(dǎo)致了現(xiàn)有的分子指紋種類缺少對(duì)分子立體結(jié)構(gòu)描述的三維結(jié)構(gòu)信息.對(duì)于此類問題,近些年也有學(xué)者提出了代數(shù)圖、代數(shù)拓?fù)?、微分幾何等分子三維結(jié)構(gòu)信息的表示方法,但是這些方法較為依賴分子結(jié)構(gòu)的可用性[88].分子特征化方法在描述分子的立體化學(xué)信息方面還有許多空間可以提升.

    3.3 模型的可解釋性

    模型的可解釋性是模型的重要部分,是可信性的前提,如何讓模型的工作機(jī)制更為透明,獲得人們的理解和信任,這是值得討論和重視的.可解釋的機(jī)器學(xué)習(xí)模型沒有“黑盒”模型的特征,更易被理解,透明度高.相較于可解釋的機(jī)器學(xué)習(xí)模型,具有“黑盒”特征的機(jī)器學(xué)習(xí)模型雖然更難進(jìn)行直觀的解釋,但是其性能更高,預(yù)測(cè)效果更好.因此,如何對(duì)“黑盒”模型進(jìn)行更好的解釋,增加模型的可解釋性,需要更多的研究來進(jìn)行探究.同時(shí),現(xiàn)在缺乏明確的模型的可解釋性基準(zhǔn),沒有嚴(yán)格的方法來評(píng)估和比較模型解釋方法[89].

    4 總結(jié)(Conclusion)

    機(jī)器學(xué)習(xí)在化合物屬性預(yù)測(cè)方面的應(yīng)用不斷拓展,不僅提高了預(yù)測(cè)結(jié)果的準(zhǔn)確性,而且為評(píng)估新化學(xué)物質(zhì)的環(huán)境風(fēng)險(xiǎn)提供了新方法.其中,深度學(xué)習(xí)算法更適用于大數(shù)據(jù)集,而機(jī)器學(xué)習(xí)算法應(yīng)用在小數(shù)據(jù)集更具優(yōu)勢(shì).但是,機(jī)器學(xué)習(xí)在化合物屬性預(yù)測(cè)中的應(yīng)用仍存在未知和挑戰(zhàn),這些亟待解決的問題將是未來研究工作的焦點(diǎn).機(jī)器學(xué)習(xí)(特別是深度學(xué)習(xí))將會(huì)與量子力學(xué)、毒理學(xué)、量子化學(xué)、電化學(xué)等深度融合,在藥物研發(fā)、毒理學(xué)研究、環(huán)境行為預(yù)測(cè)、材料研發(fā)等領(lǐng)域繼續(xù)發(fā)揮重要作用.

    猜你喜歡
    方法模型
    一半模型
    重要模型『一線三等角』
    重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
    學(xué)習(xí)方法
    可能是方法不對(duì)
    3D打印中的模型分割與打包
    用對(duì)方法才能瘦
    Coco薇(2016年2期)2016-03-22 02:42:52
    FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
    四大方法 教你不再“坐以待病”!
    Coco薇(2015年1期)2015-08-13 02:47:34
    賺錢方法
    国产亚洲欧美98| 天堂网av新在线| 亚洲国产精品合色在线| 久久人人精品亚洲av| 亚洲av免费在线观看| 精品免费久久久久久久清纯| 麻豆乱淫一区二区| 日韩成人伦理影院| 国产精品福利在线免费观看| 欧美精品国产亚洲| 国产片特级美女逼逼视频| 级片在线观看| 国产白丝娇喘喷水9色精品| 蜜臀久久99精品久久宅男| 国产国拍精品亚洲av在线观看| videossex国产| 国产单亲对白刺激| 欧美+日韩+精品| 此物有八面人人有两片| 舔av片在线| 国产人妻一区二区三区在| 国产在线精品亚洲第一网站| av在线蜜桃| 精品乱码久久久久久99久播| 国内精品宾馆在线| 久久久a久久爽久久v久久| 波野结衣二区三区在线| 日日撸夜夜添| 国产精品嫩草影院av在线观看| 尤物成人国产欧美一区二区三区| 九九在线视频观看精品| 久久久久久伊人网av| 69人妻影院| 插阴视频在线观看视频| 久久精品国产99精品国产亚洲性色| 成熟少妇高潮喷水视频| 欧美一级a爱片免费观看看| 亚洲专区国产一区二区| 在线免费观看的www视频| 国产精品久久视频播放| 色尼玛亚洲综合影院| 国产毛片a区久久久久| 精品人妻视频免费看| 偷拍熟女少妇极品色| 国产黄色视频一区二区在线观看 | 少妇裸体淫交视频免费看高清| 毛片女人毛片| 国产色婷婷99| 久久精品91蜜桃| 国产精品一及| 日韩亚洲欧美综合| 少妇的逼水好多| 国产精品一区二区性色av| 久久久久久久久久黄片| 国产真实乱freesex| 精品久久久噜噜| 亚洲国产高清在线一区二区三| 99久久精品热视频| 亚洲欧美日韩高清专用| 少妇的逼水好多| 此物有八面人人有两片| 18禁在线播放成人免费| 校园春色视频在线观看| 国产精品久久久久久久电影| 香蕉av资源在线| 久久午夜福利片| 亚洲国产精品久久男人天堂| 99久久九九国产精品国产免费| 18禁黄网站禁片免费观看直播| 欧美日韩乱码在线| 久久精品国产99精品国产亚洲性色| 久久精品国产亚洲av涩爱 | 免费看美女性在线毛片视频| 成人亚洲精品av一区二区| 搞女人的毛片| 91av网一区二区| av在线播放精品| 亚洲精品456在线播放app| 成人永久免费在线观看视频| 国产一区二区三区av在线 | 亚洲av不卡在线观看| 国产成人freesex在线 | 十八禁国产超污无遮挡网站| 日韩一本色道免费dvd| 九九热线精品视视频播放| 亚洲成人久久爱视频| 亚洲av成人精品一区久久| 身体一侧抽搐| 国产精品精品国产色婷婷| 麻豆精品久久久久久蜜桃| 中文资源天堂在线| 少妇丰满av| 夜夜爽天天搞| 免费观看精品视频网站| 亚洲真实伦在线观看| 乱人视频在线观看| 女的被弄到高潮叫床怎么办| 黄色一级大片看看| 久久亚洲精品不卡| 国产欧美日韩一区二区精品| 成人永久免费在线观看视频| 99久久中文字幕三级久久日本| 亚洲欧美清纯卡通| 赤兔流量卡办理| 亚洲真实伦在线观看| 日本爱情动作片www.在线观看 | 99热只有精品国产| 欧美色视频一区免费| 免费人成在线观看视频色| 国产爱豆传媒在线观看| 一区二区三区四区激情视频 | 国产黄片美女视频| 免费高清视频大片| 亚洲成a人片在线一区二区| 特级一级黄色大片| 男人舔女人下体高潮全视频| 1024手机看黄色片| 久久久久久久久久成人| 久久99热这里只有精品18| 国产精华一区二区三区| 成人一区二区视频在线观看| 国产三级中文精品| 免费人成视频x8x8入口观看| 啦啦啦韩国在线观看视频| 嫩草影视91久久| 偷拍熟女少妇极品色| 午夜福利成人在线免费观看| 日本黄大片高清| 亚洲精品粉嫩美女一区| 久久精品国产99精品国产亚洲性色| 欧美不卡视频在线免费观看| 日本精品一区二区三区蜜桃| 精品欧美国产一区二区三| 赤兔流量卡办理| 亚洲精品日韩av片在线观看| 亚洲欧美日韩高清专用| 日韩,欧美,国产一区二区三区 | 2021天堂中文幕一二区在线观| 我要看日韩黄色一级片| 亚洲国产精品国产精品| 日本免费一区二区三区高清不卡| av在线播放精品| 中文在线观看免费www的网站| 国产一级毛片七仙女欲春2| 久久久久久国产a免费观看| 又爽又黄无遮挡网站| 国产毛片a区久久久久| 国产精品免费一区二区三区在线| 久久人人爽人人片av| 日本熟妇午夜| 亚洲18禁久久av| 热99re8久久精品国产| 成人精品一区二区免费| 久久这里只有精品中国| 久久精品夜色国产| 亚洲专区国产一区二区| av在线天堂中文字幕| 成熟少妇高潮喷水视频| 中文字幕av成人在线电影| 久久综合国产亚洲精品| 人妻丰满熟妇av一区二区三区| 日韩av不卡免费在线播放| 搡老妇女老女人老熟妇| 亚洲欧美日韩高清在线视频| 搡老岳熟女国产| а√天堂www在线а√下载| 久久99热6这里只有精品| 国产国拍精品亚洲av在线观看| 我要看日韩黄色一级片| 久久午夜福利片| 亚洲人与动物交配视频| 少妇人妻精品综合一区二区 | av在线播放精品| 天天躁日日操中文字幕| 一本一本综合久久| 国产视频内射| 日本黄色片子视频| 中文在线观看免费www的网站| 亚洲经典国产精华液单| 日韩欧美 国产精品| 男女下面进入的视频免费午夜| 丰满人妻一区二区三区视频av| 日韩成人av中文字幕在线观看 | 亚洲,欧美,日韩| 日本成人三级电影网站| 97碰自拍视频| 亚洲国产欧美人成| 插阴视频在线观看视频| 尤物成人国产欧美一区二区三区| 网址你懂的国产日韩在线| 色噜噜av男人的天堂激情| 最近视频中文字幕2019在线8| 99在线视频只有这里精品首页| 国产在线精品亚洲第一网站| 婷婷亚洲欧美| 久久精品国产自在天天线| 深爱激情五月婷婷| 非洲黑人性xxxx精品又粗又长| 成人综合一区亚洲| 国产熟女欧美一区二区| 99热只有精品国产| 午夜免费激情av| 国产v大片淫在线免费观看| 久久亚洲国产成人精品v| 中文字幕av成人在线电影| 国产成年人精品一区二区| 男人的好看免费观看在线视频| 精品午夜福利视频在线观看一区| 亚洲精华国产精华液的使用体验 | 精品人妻视频免费看| 偷拍熟女少妇极品色| 亚洲成a人片在线一区二区| 中文字幕人妻熟人妻熟丝袜美| 久久久久国产精品人妻aⅴ院| 国产精品av视频在线免费观看| 日韩av在线大香蕉| 国产乱人偷精品视频| 变态另类成人亚洲欧美熟女| 久久久成人免费电影| 春色校园在线视频观看| 欧美潮喷喷水| 成人av一区二区三区在线看| 日韩欧美三级三区| videossex国产| 亚洲精品456在线播放app| 中文字幕av在线有码专区| 亚洲精品亚洲一区二区| 国国产精品蜜臀av免费| 少妇熟女欧美另类| 搡老熟女国产l中国老女人| 久久久午夜欧美精品| 免费观看人在逋| 精品久久久久久成人av| 亚洲中文字幕日韩| 久久精品影院6| 欧美丝袜亚洲另类| 麻豆一二三区av精品| 精品人妻偷拍中文字幕| 九九热线精品视视频播放| 能在线免费观看的黄片| 成人美女网站在线观看视频| 精品熟女少妇av免费看| 在线观看一区二区三区| 我要看日韩黄色一级片| 国产亚洲精品久久久com| 最近最新中文字幕大全电影3| 成人特级黄色片久久久久久久| 色综合亚洲欧美另类图片| 在现免费观看毛片| 成人亚洲精品av一区二区| 免费看光身美女| 久久久成人免费电影| 精品欧美国产一区二区三| 天堂影院成人在线观看| 搡老熟女国产l中国老女人| 欧美+亚洲+日韩+国产| 日韩成人av中文字幕在线观看 | 麻豆久久精品国产亚洲av| 亚洲av美国av| 一进一出抽搐动态| 欧美日韩国产亚洲二区| 少妇丰满av| 高清毛片免费观看视频网站| 中文字幕人妻熟人妻熟丝袜美| 色哟哟哟哟哟哟| 色综合站精品国产| 麻豆国产av国片精品| 老司机午夜福利在线观看视频| 91狼人影院| 搡老岳熟女国产| 亚洲精品影视一区二区三区av| 免费看av在线观看网站| 久久精品国产亚洲网站| 久久久国产成人精品二区| 欧美人与善性xxx| 一进一出好大好爽视频| 久久久色成人| 搞女人的毛片| 亚洲欧美日韩无卡精品| 久久综合国产亚洲精品| 欧美极品一区二区三区四区| 亚洲人成网站在线播放欧美日韩| 国产一区二区在线av高清观看| 国产精华一区二区三区| 精品久久久久久成人av| 日本熟妇午夜| 亚洲内射少妇av| 成年女人毛片免费观看观看9| 国产高清不卡午夜福利| 亚洲精品日韩av片在线观看| 嫩草影院新地址| 三级毛片av免费| 在线播放无遮挡| 免费在线观看影片大全网站| 婷婷六月久久综合丁香| 国产精华一区二区三区| 日韩欧美在线乱码| 天天躁夜夜躁狠狠久久av| 亚洲av成人av| 国产美女午夜福利| 亚洲欧美成人精品一区二区| 国产免费一级a男人的天堂| 国产精品久久久久久亚洲av鲁大| 国产高清激情床上av| 亚洲婷婷狠狠爱综合网| 啦啦啦啦在线视频资源| 黄色配什么色好看| 搡女人真爽免费视频火全软件 | 亚洲人与动物交配视频| 精品少妇黑人巨大在线播放 | 亚洲人成网站高清观看| 在线观看免费视频日本深夜| 久久中文看片网| 国产淫片久久久久久久久| av专区在线播放| 日韩中字成人| 99久国产av精品国产电影| 欧美日韩国产亚洲二区| 亚洲av免费在线观看| 久久99热6这里只有精品| 你懂的网址亚洲精品在线观看 | 成人亚洲欧美一区二区av| 日日撸夜夜添| 日本撒尿小便嘘嘘汇集6| 国产精品电影一区二区三区| 国产女主播在线喷水免费视频网站 | 欧美日韩国产亚洲二区| 91av网一区二区| 舔av片在线| 午夜精品国产一区二区电影 | 久久午夜亚洲精品久久| 天堂网av新在线| 12—13女人毛片做爰片一| 深爱激情五月婷婷| 国产欧美日韩精品一区二区| 男女边吃奶边做爰视频| 日韩大尺度精品在线看网址| 深夜精品福利| 免费观看精品视频网站| 国产高清视频在线观看网站| 亚洲三级黄色毛片| 国产一区二区在线av高清观看| 午夜精品一区二区三区免费看| 在线免费观看的www视频| 级片在线观看| 亚洲av美国av| 青春草视频在线免费观看| 日韩欧美三级三区| 午夜精品一区二区三区免费看| 亚洲一级一片aⅴ在线观看| 亚洲国产精品久久男人天堂| 久久久久久久久大av| 国产av一区在线观看免费| 国产伦精品一区二区三区视频9| 老司机午夜福利在线观看视频| 亚洲成人精品中文字幕电影| 成人二区视频| 精华霜和精华液先用哪个| 亚洲精品456在线播放app| 色在线成人网| 成年女人毛片免费观看观看9| 村上凉子中文字幕在线| 免费看av在线观看网站| 黄片wwwwww| 色av中文字幕| 精华霜和精华液先用哪个| 蜜桃亚洲精品一区二区三区| 精品久久久久久久久亚洲| 晚上一个人看的免费电影| 五月伊人婷婷丁香| 亚洲精品乱码久久久v下载方式| 日韩精品有码人妻一区| 久久久久精品国产欧美久久久| 精品国产三级普通话版| 天堂影院成人在线观看| 天堂动漫精品| 真人做人爱边吃奶动态| 黄色视频,在线免费观看| 中文资源天堂在线| а√天堂www在线а√下载| 亚洲国产精品合色在线| 国产精品久久视频播放| 成年女人看的毛片在线观看| 一边摸一边抽搐一进一小说| 日本-黄色视频高清免费观看| 给我免费播放毛片高清在线观看| 国产午夜福利久久久久久| 亚洲精品国产av成人精品 | 日本撒尿小便嘘嘘汇集6| av在线观看视频网站免费| 日本黄色片子视频| 国产一区二区在线观看日韩| 国产av一区在线观看免费| av免费在线看不卡| 啦啦啦观看免费观看视频高清| 99在线人妻在线中文字幕| 国产欧美日韩精品一区二区| 久久久精品欧美日韩精品| 亚洲性久久影院| 日本爱情动作片www.在线观看 | 老司机影院成人| 国产精品亚洲一级av第二区| 禁无遮挡网站| 精品一区二区三区视频在线观看免费| 国产精品一区www在线观看| 日韩av不卡免费在线播放| 一级黄片播放器| 蜜臀久久99精品久久宅男| 最新在线观看一区二区三区| 男女下面进入的视频免费午夜| 日本在线视频免费播放| 草草在线视频免费看| 国产久久久一区二区三区| 男女做爰动态图高潮gif福利片| 久久久久久久久久久丰满| 久久中文看片网| 国内精品久久久久精免费| 99在线人妻在线中文字幕| 波多野结衣巨乳人妻| av在线天堂中文字幕| 内射极品少妇av片p| 亚洲av第一区精品v没综合| 免费无遮挡裸体视频| 99riav亚洲国产免费| 身体一侧抽搐| 久久久久性生活片| 色噜噜av男人的天堂激情| 亚洲国产精品国产精品| 国产欧美日韩精品亚洲av| a级一级毛片免费在线观看| 国产黄a三级三级三级人| 午夜久久久久精精品| 中文字幕av成人在线电影| www日本黄色视频网| 免费观看的影片在线观看| 伦理电影大哥的女人| 少妇裸体淫交视频免费看高清| 乱人视频在线观看| 久久99热这里只有精品18| 日本黄色片子视频| 国产爱豆传媒在线观看| 18禁在线无遮挡免费观看视频 | 久久精品久久久久久噜噜老黄 | 亚洲av.av天堂| 国产91av在线免费观看| 亚洲乱码一区二区免费版| 1024手机看黄色片| 国产视频一区二区在线看| 欧美zozozo另类| 搡老熟女国产l中国老女人| 色哟哟·www| 久久人妻av系列| 国产精品av视频在线免费观看| aaaaa片日本免费| 久久久久久九九精品二区国产| 给我免费播放毛片高清在线观看| 变态另类成人亚洲欧美熟女| 99久久无色码亚洲精品果冻| 国产免费男女视频| 亚洲精品久久国产高清桃花| 22中文网久久字幕| 精品午夜福利视频在线观看一区| 国产精品国产三级国产av玫瑰| 国产伦精品一区二区三区四那| 我要搜黄色片| 亚洲人成网站在线播放欧美日韩| 国产成人aa在线观看| 午夜福利在线在线| 亚洲不卡免费看| 国产男人的电影天堂91| 国产成人一区二区在线| 成人无遮挡网站| 国产免费一级a男人的天堂| 99热这里只有是精品在线观看| 最新中文字幕久久久久| 人妻丰满熟妇av一区二区三区| 乱人视频在线观看| 变态另类成人亚洲欧美熟女| 亚洲成人久久爱视频| 一级a爱片免费观看的视频| 亚洲天堂国产精品一区在线| 国产精品三级大全| 欧美绝顶高潮抽搐喷水| 日本一二三区视频观看| 男人舔奶头视频| 欧美极品一区二区三区四区| 在线免费观看的www视频| 亚洲中文日韩欧美视频| 男女视频在线观看网站免费| 国产精品综合久久久久久久免费| 最新在线观看一区二区三区| 久久久久久久久大av| 国产在线男女| 亚洲av熟女| 欧美日韩一区二区视频在线观看视频在线 | 久久精品综合一区二区三区| 搞女人的毛片| 国产精品久久视频播放| 国产免费一级a男人的天堂| 麻豆精品久久久久久蜜桃| 男人舔女人下体高潮全视频| 欧美最黄视频在线播放免费| а√天堂www在线а√下载| 国产精品亚洲一级av第二区| 免费在线观看成人毛片| 日本 av在线| 国内精品久久久久精免费| 麻豆国产97在线/欧美| 国产精品99久久久久久久久| 99久久精品国产国产毛片| 国产女主播在线喷水免费视频网站 | 日韩欧美在线乱码| 亚洲自偷自拍三级| 成年av动漫网址| 久久国产乱子免费精品| 亚洲成人久久爱视频| 一区二区三区高清视频在线| 国产精华一区二区三区| 国产高清不卡午夜福利| 久久6这里有精品| 国产免费男女视频| 一夜夜www| 久久久久久久久久成人| 男女之事视频高清在线观看| 免费看光身美女| 91久久精品国产一区二区成人| 亚洲经典国产精华液单| 亚洲婷婷狠狠爱综合网| 你懂的网址亚洲精品在线观看 | 午夜影院日韩av| 日本黄色片子视频| 18禁黄网站禁片免费观看直播| 老司机福利观看| 国内揄拍国产精品人妻在线| 尤物成人国产欧美一区二区三区| 亚洲av.av天堂| 成人综合一区亚洲| 色综合站精品国产| 91在线观看av| 综合色丁香网| 大香蕉久久网| 一个人观看的视频www高清免费观看| av福利片在线观看| 校园人妻丝袜中文字幕| 国产精品乱码一区二三区的特点| 成人午夜高清在线视频| 国产黄片美女视频| 最后的刺客免费高清国语| 日本免费一区二区三区高清不卡| 欧美高清性xxxxhd video| 麻豆国产97在线/欧美| 国产精品一区二区三区四区免费观看 | 久久鲁丝午夜福利片| 99久国产av精品国产电影| 亚洲精品成人久久久久久| 亚洲在线自拍视频| av在线播放精品| 日本免费一区二区三区高清不卡| 国产久久久一区二区三区| 露出奶头的视频| 欧美区成人在线视频| 97超级碰碰碰精品色视频在线观看| 丰满的人妻完整版| 欧美日本视频| 日本一二三区视频观看| 搡老岳熟女国产| 可以在线观看毛片的网站| 嫩草影院入口| 欧美又色又爽又黄视频| 校园春色视频在线观看| 久久久久久大精品| 国语自产精品视频在线第100页| 精品无人区乱码1区二区| 色吧在线观看| 中文资源天堂在线| 在线观看午夜福利视频| 亚洲国产高清在线一区二区三| 亚洲国产色片| 国语自产精品视频在线第100页| 久久久久久伊人网av| 国产久久久一区二区三区| 久久这里只有精品中国| av在线老鸭窝| 天堂√8在线中文| 少妇的逼水好多| 亚洲av第一区精品v没综合| 波野结衣二区三区在线| 最近手机中文字幕大全| 国产免费一级a男人的天堂| 麻豆精品久久久久久蜜桃| 自拍偷自拍亚洲精品老妇| 晚上一个人看的免费电影| 国产蜜桃级精品一区二区三区| 久久久a久久爽久久v久久| АⅤ资源中文在线天堂| 免费观看精品视频网站| 欧美一区二区国产精品久久精品| 亚洲欧美成人精品一区二区| 最近中文字幕高清免费大全6| .国产精品久久| 男人的好看免费观看在线视频| 成人av一区二区三区在线看| 免费在线观看成人毛片| 在线观看一区二区三区| 精品久久久久久久久久免费视频| 亚洲熟妇熟女久久| 日韩欧美在线乱码| 亚洲七黄色美女视频| 波野结衣二区三区在线| 在线免费十八禁| 成人三级黄色视频| 天堂影院成人在线观看| 97在线视频观看| 欧美绝顶高潮抽搐喷水| 在线观看午夜福利视频|