劉亞平,程 平,張淑平
(上海理工大學 材料與化學學院,上海 200093)
含溴域蛋白4(bromodomain-containing protein 4,BRD4)[1]參與調控細胞周期、增殖和凋亡等活動。開發(fā)BRD4 抑制劑被認為是一種治療癌癥的有前景的策略[2]。近年來,計算機輔助藥物設計逐漸成為開發(fā)和改造藥物的重要方法之一,在高效開發(fā)新型BRD4 抑制劑方面具有廣泛的應用前景。
盡管多種BRD4 抑制劑用于臨床階段的研究,但臨床試驗過程中所表現(xiàn)出的療效差和耐藥性等問題不容忽視,仍需研發(fā)出更多高活性的BRD4 抑制劑。傳統(tǒng)的藥物設計方法通常周期長達10 年,成本高達26 億美元,無法滿足臨床藥物需求[3]。
近年來,3D-QSAR 研究以更經濟高效的方式加快藥物研發(fā)效率而得到廣泛關注[4]。為了設計出高活性的喹啉酮類小分子p53-MDM2 結合抑制劑,尤等人建立了具有預測能力的3D-QSAR 模型[5]。Tong等利用一系列4,5-二氫-[1,2,4]三唑并[4,3-f]蝶啶類BRD4 抑制劑建立QSAR 模型,并成功設計出4 個新BRD4 抑制劑[6]。此外,基于CoMFA 和CoMSIA兩種不同的分析方法,Yu 等人使用一系列四氫喹喔啉類BRD4 抑制劑建立了3D-QSAR 模型,并獲得5 個高活性的候選化合物,為新型BRD4 抑制劑的合成和設計提供必不可少的理論依據(jù)[7]。很多研究者對各類BRD4 抑制劑進行QSAR 建模,并在開發(fā)新型BRD4 抑制劑方面取得了許多成果,但是關于喹啉酮類BRD4 抑制劑的3D-QSAR 相關研究還比較匱乏。
在現(xiàn)有CADD 技術的啟發(fā)下,本文利用已報道的一系列BRD4 抑制劑建立3D-QSAR 模型并開發(fā)了一系列新型BRD4 抑制劑。通過三維比較分子力場分析(comparative molecular field analysis,CoMFA )[8]和比較分子相似性指數(shù)分析(comparative molecular similarity index analysis,CoMSIA)[9]預測BRD4 抑制劑的結構與活性之間的關系。此外,為了評估新設計分子的藥效,對其進行ADMET 性質和類藥性評價。所有研究成果為更高效地設計新型BRD4 分子提供了理論參考。
從文獻中提取33 個生物活性數(shù)據(jù)已知的喹啉酮類化合物,選取其中的27 個化合物作為訓練集來構建QSAR 模型,剩下的6 個化合物組成測試集來驗證模型的預測能力。33 個化合物的結構和生物活性數(shù)據(jù)如表S1 所示[10]。
本研究使用SYBYL-X 2.0 軟件繪制分子的化學結構并進行幾何優(yōu)化,然后使用最陡梯度下降法對這些結構進行能量最小化計算,從而獲得更穩(wěn)定的構象。原子電荷的計算和分子的能量最小化優(yōu)化步驟是在Chaube 等人的工作基礎上進行了改進,將最大迭代次數(shù)設置為10000 次[11]。隨后,將活性最高的化合物30 作為模板分子,并選擇一個合適的公共骨架進行分子疊合。選擇的公共骨架和訓練集分子疊合結果如圖1 所示。
圖1 BRD4 抑制劑的(a)公共骨架圖和(b)28 個分子疊合圖
為了探究抑制劑的生物活性與分子力場的關系,進行了CoMFA 和CoMSIA 模型的構建,模型構建過程中參考了李等人的方法和參數(shù)設置[12]。CoMFA 計算包括靜電場(electrostaic,E)和立體場(steric,S)。而CoMSIA 計算除了靜電場和立體場外,還有疏水場(hydrophobic,H)、氫鍵受體場(acceptor,A)和氫鍵供體場(donnor,D)。使用偏最小二乘(partial least-square,PLS)方法建立具有統(tǒng)計學意義的CoMFA 和CoMSIA 模型,將pIC50 值作為因變量,CoMFA 和CoMSIA 描述符作為自變量。在PLS 分析的交叉驗證方法中,采用留一法(left-one-out,LOO)得到最優(yōu)組成分值(optimal number of components,ONC)和交叉驗證回歸系數(shù)(cross-validation correlation coefficient,q2)。然后使用非交叉驗證方法得到標準誤差(standard error of estimation,SEE)、Fischer 檢驗值(Fischer test,F(xiàn))和非交叉驗證相關系數(shù)(square of the non-cross-validation correlation coefficient,r2),這些參數(shù)用于評價模型的預測能力和穩(wěn)定性。此外,為了進一步評估3D-QSAR 模型的預測能力,利用建好的模型來預測測試集中所有化合物的pIC50 值,并通過計算預測相關系數(shù)r2pred來評估模型的外部預測能力。
ADMET(藥物在人體內的吸收、分布、代謝、排泄和毒性)藥物動力學方法是藥物設計和篩選的重要方法。在藥物開發(fā)早期,使用ADMET 藥物動力學方法對候選化合物進行預測,可以有效提高藥物研發(fā)和篩選成功率,減少資金的浪費。在本研究中 , 使 用 pkCSM[13]在 線 服 務 器(http://biosig.unimelb.edu.au/pkcsm/prediction)進行ADME 和毒性評估。此外,類藥性評估也是識別潛在的候選藥物的重要手段,廣泛使用的SwissADME[14]工具(http://www.swissadme.ch)可以預測新設計分子的合成可行性和類藥性。
經過PLS 分析得到的CoMFA 和CoMSIA 模型相關統(tǒng)計參數(shù)如表1。在CoMFA 模型中,立體場和靜電場的貢獻率分別為0.610 和0.390,經過交叉驗證得到q2為0.926,ONC 為7。采用非交叉驗證得到的r2為0.997,SEE 為0.078,F(xiàn)為907.047,以及經過計算得到r2pred為0.744。由于CoMSIA 計算中包含五種不同的立場,為了獲得性能更優(yōu)的CoMSIA 模型,選取了不同的立場進行CoMSIA 建模,各個模型的PLS 結果如表2 所示,一般情況下,q2>0.5,r2pred>0.7,說明該模型具有良好的魯棒性和預測能力,構建的所有模型的q2和r2值均接近1,說明這些模型均具有較好的穩(wěn)定性和預測能力。其中SEHA 組合的CoMSIA 模型的q2和r2值分別為0.939 和0.991,具有更突出的預測能力。因此,選擇CoMSIA-SEHA 模型進行后續(xù)的分析和使用。在CoMFA 模型和CoMSIA-SEHA 模型中,訓練集化合物的實驗值和預測pIC50 值的散點圖如圖2 所示。從圖中可以觀察到,訓練集(黑點)和測試集(紅點)都均勻散布在直線y=x周圍,進一步說明建立的模型具有良好的預測能力和擬合能力。
表1 CoMFA 和CoMSIA 模型統(tǒng)計分析總結
表2 不同立場組合的CoMSIA 模型PLS 結果
圖2 CoMFA 模型和CoMSIA 模型的實驗pIC50 值與預測pIC50 值散點圖
結合活性最好的化合物30,對CoMFA 和CoMSIA 等勢圖進行合理分析,發(fā)現(xiàn)能提高化合物活性的取代基,得到更多分子改造的重要信息,進而為設計出理論活性更好的化合物提供理論指導。
CoMFA 等勢圖的立體場和靜電場如圖3 所示,在立體場中,綠色區(qū)域(貢獻度為80%)表示增大基的空間位阻有利于增加化合物活性,而黃色區(qū)域(貢獻度為20%)表示減小基團會增加化合物活性。在圖3a 中,A 環(huán)周圍存在大面積的黃色區(qū)域,表明此區(qū)域內合理減少基團的空間位阻,能促進化合物活性增加。化合物13(pIC50=6.149)比化合物14(pIC50=5.524)的活性高,也許是因為前者的甲基空間位阻明顯小于后者的苯基空間位阻。在靜電場中,藍色區(qū)域(貢獻度為80%)表示增加正電性基團有利于增加化合物活性,而紅色區(qū)域(貢獻度為20%)表示增加負電性基團有利于增加化合物活性。從圖3b 中可以看到,A 環(huán)由大量藍色色塊包圍,表明該區(qū)域加入吸電子基團有助于提高化合物生物活性,這也解釋了含有給電子基團-NH2的化合物 32(pIC50=7.310)的活性遠小于化合物 33(pIC50=8.046)。
圖3 基于3D-QSAR 的結構與活性關系的主要特征
CoMSIA 等勢圖如圖4 所示,圖4a 和圖4b 表示出的立場信息與圖3 類似。圖4c 表示疏水場,黃色色塊表示增加疏水基團有利于增加活性,而白色表示增加親水性基團更有利于提高化合物的生物活性。圖中A 環(huán)的第6 位置有白色色塊,表面該位置降低疏水基團可有效增加化合物活性,化合物30(pIC50=8.523)在該區(qū)域的基團多為親水性烴基,而化合物32(pIC50=7.310)在該位置的基團是疏水性胺基,所以前者的生物活性明顯大于后者。圖4d表示氫鍵受體場,明顯的紅色區(qū)域表明減少氫鍵受體有利于增加抑制劑的生物活性,含有氮和氧元素的A 環(huán)第3 位置被大塊紅色色塊包裹,該現(xiàn)象可以解釋為何化合物11(pIC50=5.469)的活性值小于化合物12(pIC50=6.292)。
圖4 模板化合物30 的CoMFA 等勢圖:a. 立體場;b. 靜電場
圖5 模板化合物30 的CoMSIA 等勢圖:a. 立體場;b. 靜電場;c. 疏水場;d. 氫鍵受體場
根據(jù)等勢圖的分析結果,最終設計出7 個新化合物,這些新化合物的pIC50 值均大于活性最好的化合物30,其具體結構和預測值如表3 所示。
表3 新設計化合物的結構及預測活性
為了提高藥物研發(fā)的成功率,減少藥物毒性和副作用,并指導臨床合理用藥,在藥物研發(fā)前期需要對藥物進行藥代動力學研究。對新設計的BRD4抑制劑進行ADMET 預測,同時進行了類藥性研究,進一步分析這些抑制劑是否具備理想藥物所表現(xiàn)出來的理化性質和結構特性。ADMET 性質預測結果如表4 所示,類藥性預測如表5 所示。
表4 新設計分子的ADMET 性質
表5 新設計分子的藥物相似性及其合成可達性
藥物從作用部位進入體循環(huán)的過程中,需要考慮人體腸道吸收率,一般吸收率大于30%的分子則表現(xiàn)出良好的吸收性。表4 所示的7 個新分子的吸收率均大于30%,表現(xiàn)出出色的人體腸道吸收性。藥物穿過血腦屏障的能力是提高藥物利用效力、減少人體副作用的重要指標。通常情況下,logBB<-1表示該化合物穿透血腦屏障的能力較差。由表4 可知,7 個新分子均不易透過血腦屏障,所以具有很低的神經毒性。細胞色素P450 是存在于人體肝臟內的一種重要解毒酶,能影響藥物的代謝,所以評估化合物抑制細胞色素P450 的能力至關重要。參與藥物代謝的兩個主要異構體是 CYP2D6 和CYP3A4,由表4 可知,7 個新分子均不是CYP2D6的底物和抑制劑,但屬于CYP3A4的底物和抑制劑,所以可以被CYP3A4 正常代謝。藥物清除率和肝臟清除率和腎臟清除率兩者有關,表中的所有新分子均不容易被肝臟和腎臟聯(lián)合清除。預測藥物對人體的毒性也是提高藥物成藥性的重要步驟。所有新設計分子均不會導致皮膚敏感現(xiàn)場產生,除了D07,其他新設計化合物均沒有AMES 毒性。總之,以上預測結果表明7 個新分子具有較為良好的藥代動力學特性。
表5 的類藥性預測結果表明,7 個新分子均符合Lipinski、Veber 和Muegge 規(guī)則,部分化合物也滿足Egan 規(guī)則,但所有化合物均不滿足Ghose 規(guī)則,說明所有新設計化合物具有理想的類藥性。此外,所有化合物的可合成性均在3 左右,表現(xiàn)出易于人工合成的特點。以上研究結果,為縮小藥物篩選范圍提供有利幫助。
本研究采用CoMFA 和CoMSIA 方法對一系列BRD4 抑制劑進行3D-QSAR 研究。通過內外部驗證,CoMFA 模型(q2=0.926,r2=0.997,r2pred=0.744)和CoMSIA 模型(q2=0.939,r2=0.991,r2pred=0.786)均表現(xiàn)出優(yōu)異的統(tǒng)計結果。進一步對模型的等勢圖進行分析,為設計活性更強的新BRD4 抑制劑提供理論指導。此外,對新設計的7 個BRD4 抑制劑進行ADMET 和類藥性預測,證明了7 個新設計化合物具有良好的藥代動力學特性。該研究結果為開發(fā)更高效喹啉酮類BRD4 抑制劑提供理論參考。