●張靜 雨萌
今天,Insilico Medicine宣布與日本制藥企業(yè)安斯泰來制藥集團合作,利用其AI技術研發(fā)新藥。安斯泰來是日本頂尖的制藥企業(yè),僅次于武田制藥。此次合作意味著Insilico Medicine在亞洲市場再添強大的合作伙伴。這家AI公司緣何獲得制藥大廠的青睞?生輝于近日采訪了 Insilico Medicine創(chuàng)始人兼首席執(zhí)行官 Alex Zhavoronkov。
《麻省理工科技評論》將“人工智能發(fā)現分子”評為2020年“全球十大突破性技術”(TR10)之一。Insilico是該項技術中被點名的一家AI公司,主要研究“用于藥物發(fā)現、生物標志物發(fā)展和衰老研究的AI”。該公司成立于2014年,總部位于中國香港,目前團隊規(guī)模剛剛超過100人,其中有80多人為AI背景,他們在2016年發(fā)表了該領域的第一篇同行評議論文。
一款新藥的研發(fā)涉及很多流程,從靶點發(fā)現——化合物合成——制劑生產——臨床實驗——批準上市之間要經歷極其復雜的過程,需要耗費大量的人力、物力和財力,正因如此,周期長、成功率低、費用高的困境使新藥研發(fā)難以破局。
“Incilico最擅長的是哪個方面?”,生輝問Zhavoronkov。“我們認為,藥物發(fā)現是一場MMA(綜合格斗)比賽,在藥物發(fā)現領域,每一方面都得最強?!盳havoronkov說。他從加拿大皇后大學計算機系畢業(yè)之后,在美國約翰霍普金斯大學攻讀生物學碩士,之后在俄羅斯的莫斯科國立大學獲得物理和數學雙博士學位。他曾在加拿大ATI Technologies擔任工程師,后該公司被AMD以90億美元收購。
“世界上沒有任何一家公司能做我們能做的事情”,Zhavoronkov宣稱。Insilico曾用21天時間創(chuàng)造了30000個蛋白質分子設計,與藥明康德和多倫多大學的研究人員合作在實驗室中設計出了6個分子,然后在細胞中測試了兩個,最后在老鼠身上試驗了其中一個分子,結論顯示出“類似藥物”的特性。整個過程用了46天。此項研究發(fā)表在Nature Biotechnology上。
之后沒多久,該公司宣布完成了3700萬美元的B輪融資,啟明創(chuàng)投領投,藥明康德、斯道資本、F-Prime Capital、禮來亞洲基金、創(chuàng)新工場、百度風投等其他投資方跟投。
該公司的核心技術是開發(fā)一系列生成對抗網絡(generative adversarial networks,GANs)和強化學習(reinforcement learning,RL)來識別蛋白質靶點,從而生成具有特定屬性的分子結構并合成數據。最新的融資將被用于加快該技術商業(yè)化,并推進癌癥、纖維化和其他與年齡有關的疾病的內部藥物發(fā)現項目。
Zhavoronkov所說的 Insilico Medicine的絕對優(yōu)勢在于他們是少有的能把AI滲透到從靶點發(fā)現到臨床預測每一個產業(yè)環(huán)節(jié)的公司。
AI技術主要包括自然語言處理、圖像識別、機器學習、深度學習、認知計算等,它們在新藥研發(fā)中的應用場景主要有七類,分布在藥物研發(fā)階段、臨床前研究階段和臨床研究階段。
從公司數量分布看,目前靶點發(fā)現場景的玩 家 最 多 , 比 如 Nimbus、Insitro、IBM、Verge Genomics等;化合物合成、篩選的玩家也不少,比如 Atomwise、Schrodinger、BenevolentAI、深度智耀等;晶泰科技、Iktos是典型的晶型預測公司;另外還有優(yōu)化臨床實驗設計、患者招募、藥物重定向場景的公司,相比靶點和分子篩選,后者入局者不多。
Zhavoronkov曾在接受《福布斯》采訪時說:“選擇正確的靶點是藥物研發(fā)中最復雜和最危險的過程,錯誤的靶點會導致多年后昂貴的失敗。測試靶點的最好方式之一是設計一個能且只能與之結合的小分子化合物。但是,即使是簡單的靶點,尋找化合物也需要一年多時間,再加上驗證的過程使之更加漫長。AI可以加速這一過程并更快地設計好分子結構。”
Insilico開發(fā)了一個名為 “pandomics”的AI開放平臺,可以幫助尋找和篩選靶點,該平臺上的樣本數量超過200萬。前幾日,勃林格殷格翰制藥公司剛剛宣布將利用該平臺尋找潛在靶點。
“整個制藥業(yè)的成功率都很低,傳統的制藥方式有92%的失敗率,他們需要分析各種失敗的可能性。對我來說,這只取決于我們所追求的靶點有多復雜。我們目前在纖維化的疾病上找到了5個靶點,非常成功。因為我們的 AI臨床數據在2018和2019年已經非常完備。傳統的方式會花費5年的時間,而我們在纖維化疾病上尋找靶點只需要2年時間。這是相比于傳統藥物發(fā)現方式上我們的絕對優(yōu)勢?!盳havoronkov對生輝說。不過他們在訓練數據的過程中也會遇到問題,比如一些罕見病的數據太少,沒辦法訓練模型。
Insilico每3個月更新一次模型,每9個月更新一次AI Pharma Pipeline。他們與150多個學術機構和公司合作,從中獲得訓練數據。
除了以上提到的“pandomics”平臺之外,Insilico還有一系列被稱為“工具包”的平臺資源:追蹤使用公共和私人資金生成數據的Pharmacognitive和AgingPortfolio;生成化學的社區(qū)資源;生物年齡的預測因子,如Aging.AI;他們正在幫助建立一個名為AgingChart的維基百科,以及一個名為geroprotector的數據庫,該數據庫跟蹤各種干預衰老的有效性。
此前,該公司表示只做 IND(Investigational New Drug Application,新藥臨床實驗申請)之前的環(huán)節(jié),所以他們沒有實驗室?,F在,他們決定啟動臨床前項目,要“把我們的分子從算法延伸到 I期、II期臨床試驗,AI藥物公司不能只是會寫漂亮的代碼,必須要自己親自做苦力活?!弊龀鲞@一決定主要是為了解決當下AI缺乏可解釋性的問題。
AI就像一個黑箱,AI公司用算法找到一個靶點或者生成一個分子結構,但藥廠不知道過程,這也是大多數藥廠對AI保持懷疑態(tài)度的原因。Insilico想要通過自己親自去驗證安全性、合理性,告訴藥企 AI的結果是可信的、可解釋的。
在Zhavoronkov此前的論文中寫到,AI缺乏可解釋性,機器學習預測器(predictors)、分類器(classifiers)、生成器(generators)的工作都沒有采用現代的特征提取和特征選擇則技術來使這些工具更加易于解釋。雖然人工智能在藥物發(fā)現方面的進展正在加速,但唯一真正成功的證據是對人工智能產生的分子進行靶點測試。
為了解決可解釋性的問題,Zhavoronkov認為,還有一個方式就是定期發(fā)表論文。他認為衡量一家AI公司能力的一個重要標準就是論文數量和質量。
Zhavoronkov說,除了可解釋性的問題,AI藥物研發(fā)還有一個難點:“現在有一個普遍的誤區(qū)是認為我們缺少數據,但事實上數據不難找。現在最大的問題在于驗證速度。這完全不同于語音或者圖像的識別。我們用幾天時間就能想出一個具體靶點的新結構,但需要一兩個月、甚至更長時間去合成。要去驗證并得到反饋通常需要五個月甚至半年時間。這還不僅僅是時間的問題,在驗證過程中很有可能藥廠會告訴我分子結構一開始就是錯的,或者在這個過程中分子結構因為儲藏條件的變化而發(fā)生改變?!?/p>
另外,AI藥物研發(fā)公司還有一個普遍的問題,藥物專業(yè)的人和AI工程師的思維方式存在偏差,在合作中可能會出現一些問題。
從AI初創(chuàng)與大藥企之間的合作關系網絡也可看出,“AI+藥物研發(fā)”的成熟期或許將在3-5年內,默沙東、葛蘭素史克、拜耳等等大藥廠與AI公司合作逐漸頻繁,AI日益參與到藥物發(fā)現的各個環(huán)節(jié)。
AI公司與大藥企的合作方式主要有三種:藥廠提出目標疾病,AI公司尋找靶點;藥廠給出蛋白質靶點,AI公司設計、篩選分子結構;藥廠給出以上要素,AI公司預測臨床結果。
“目前我們最大的競爭者就是涉足新藥研發(fā)全流程的AI公司,中國的相關公司目前的發(fā)展階段還不夠成熟,我們會在戰(zhàn)術上重視它們,但是我們很清楚,在這一領域我們掌握關鍵專利?!盳havoronkov說,很多AI公司說他們可以做藥物轉化、可以做化學分子、可以發(fā)現靶點,但他們手里拿著的卻是 MIT、阿斯康利等等公司或者機構的論文和成果掛在自己的公司官網或者PPT上。
Incilico除了與藥明康德有長期合作之外,去年10月,Insilico與江蘇正大豐海制藥簽訂了2個項目的AI技術開發(fā)服務合同,今年與北京泰德制藥達成戰(zhàn)略合作。
Insilico與藥明康德的合作對于雙方都至關重要,藥明康德早在2018年就領投了Insilico的A輪,布局AI新藥研發(fā)。前者更是在去年將總部搬到了中國。
“如果說歷史是未來的指示燈的話,我覺得中國代表未來的趨勢。我非??春弥袊扑幃a業(yè)的未來。在中國,我能找到很多非常聰明同時又有大藥廠工作經歷的人才?!?/p>
2017年以來,中國監(jiān)管機構對創(chuàng)新藥給出了積極的信號。新藥審批速度加快,以2018年來看,中國抗癌新藥審批時長比之前快一倍,最快僅需12個月,而以往需要24個月。2019年國內新藥研發(fā)領域一級市場活躍,投融資案例數量為130件。從監(jiān)管、研發(fā)、資本投入等多個方向來看,創(chuàng)新藥依舊是未來醫(yī)療市場最堅定的方向之一。
與之形成對比的是,從 1950年開始,每個新藥的研發(fā)費用平均每九年增加一倍,藥物開發(fā)的成本急劇上升。AI帶來行業(yè)變革是未來必然的趨勢?!拔覀儠芨吲d見到中國可以有越來越多的藥企開始尋找新靶點,我也希望鉆研計算機科學的年輕人們能更多地了解生命科學。”■