雖然從規(guī)模上講,生物信息學沒有辦法與制藥巨頭或硬件制造商們相比,但這不妨礙它成為2015年最熱門的投資領域之一。美國生信領域內(nèi)著名的網(wǎng)絡媒體GenomeWeb在2015年最后一天列舉了眾多歐美市場那些初創(chuàng)和成功融資的生信企業(yè);最后作者總結說,2015年,我們見證了生信領域更多的投資。我個人的見聞也是如此,國內(nèi)的也好,國外的也好,曾經(jīng)一起在學術界打拼的小伙伴們紛紛下海創(chuàng)業(yè),成功者也不在少數(shù)。
五大類別
簡單總結一下,生信平臺大致可以分為以下5類。
云存儲、云計算類。這類公司供云空間以及相應的工具用于分析全基因組和exome數(shù)據(jù)。從廣義上講,Amazon、Google、Microsoft以及華為、阿里的云計算平臺都屬于此類。雖然巨頭們(暫時)沒有整合生信分析工具,但其平臺的穩(wěn)定性、可靠性、安全性和可按需擴展性是小型生信公司所不能比擬的。而且,從數(shù)據(jù)分析的靈活性上講,利用現(xiàn)有云計算平臺自行搭建分析流程對一些大公司也有相當?shù)奈Α?/p>
分析流程類。這類產(chǎn)品往往與云計算相結合,即把分析的流程搬到線上,提供簡化直觀的操作界面,以方便有生信分析需求但對技術了解不深的用戶。
數(shù)據(jù)整合、解讀類。此類公司不僅提供序列分析工具,還能將發(fā)現(xiàn)的突變和多態(tài)位點與臨床數(shù)據(jù)相結合,幫助醫(yī)生解讀病人數(shù)據(jù)、診斷和準確用藥。
數(shù)據(jù)庫知識庫類。這些公司通過收集、整理、整合公共或私有信息,經(jīng)過人工檢閱(curation)后匯總為數(shù)據(jù)庫或知識庫。
輔助類。比如輔助個人或保險公司的產(chǎn)品。這些產(chǎn)品小到科研助手,大到電子病例管理和分析,不一而足。值得指出的是,同時具有多個分類特征的生信公司或產(chǎn)品是更常見的。比如,大多產(chǎn)品都以云計算和云存儲為基礎;而數(shù)據(jù)解讀也往往需要檢索突變和知識數(shù)據(jù)庫。
同質化競爭
正如我前面提到的,2015年生信企業(yè)雖然在資本領域混得風生水起,但隨著更多資本進入,公司之間的同質化已經(jīng)變得越來越嚴重。根據(jù) GenomeWeb的總結,2015年生信市場的另一特點就是競爭加劇。以主打下一代測序技術NGS數(shù)據(jù)分析的云計算平臺為例,在歐美市場就有ViaGenetics,DNAnexus,GenomeNext,Tute Genomics等4家。除了這些公司之間的競爭外,它們或許還要和Amazon華為等巨無霸爭奪市場和客戶;因為后者提供的云計算平臺可靠、安全,可擴展性強,用戶可以根據(jù)需要自行定制生信工具。
競爭加劇的特點之一,就是行業(yè)間整合加速。首先是生信企業(yè)之間并購。2015年,HLI(一家號稱研究人類長壽奧秘的公司)收購了Cyber Genomics,Tute Genomics收購了Knome。此外,橫向整合也屢有發(fā)生。特別需要注意的是,一些測序儀生產(chǎn)廠家也不甘寂寞,紛紛出手。比如,Illumina于2015年9月將GenoLogics收入囊中;GenoLogics是一家實驗室信息管理系統(tǒng)廠商,此舉將提高Illumina系統(tǒng)的集成度,增加實驗室對其產(chǎn)品的粘度;Roche則更早一步于2014年買下Bina Technologies。后者是提供全套NGS數(shù)據(jù)分析,號稱能夠完成從數(shù)據(jù)到信息 再到知識的一站式服務。Bina Technologies已被Roche并入其測序部門。走整合路線的當然不僅僅是硬件企業(yè)。前幾年BGI收購CG就是走一條“逆推”的路線,其目的同樣是建立完整的生態(tài)圈。
這就意味著在不遠的將來,我們買了哪家的測序儀器,就能以較低甚至免費的價格使用相應的數(shù)據(jù)分析服務?;蛘叻催^來,選擇哪家企業(yè)分析數(shù)據(jù),就能以較低的價格測序了。但不管哪種方式,都勢必會打壓那些沒有自己核心技術的生信公司的生存空間。
創(chuàng)業(yè)方向
那么,在現(xiàn)在的情況下,后來者要怎樣選擇創(chuàng)業(yè)的方向,才會更有“錢途”呢?原華大CEO王俊的創(chuàng)業(yè)方向就值得學習。王俊意外從華大離職后,創(chuàng)立了碳云科技,意圖用人工智能方法解密人類疾病。最近有消息稱,一家上市公司以自有資金1億元入股,將碳云科技的估值推高到50億人民幣。雖然這個估值高到不是一般的離譜,但我認為將人工智能引入疾病領域,是相當明智的選擇。因為人的疾病,除了少數(shù)的單基因疾病外,大都是多個基因共同作用的結果。也就是說,哪些基因發(fā)生突變,突變的位置在哪里,突變的類型是什么,都是影響到最終的疾病表型。但是,這么多因素排列組合在一起,是一個相當龐大的數(shù)字。然而病人的樣本數(shù)量總是有限的,我們的財力也是有限的;如何從有限的資源入手,去推測哪些基因、突變位置、突變類型的組合是有意義的,是重要的,就需要復雜的算法,比如人工智能。
把疾病當做是信息學的問題對待,用信息學的分析手段研究疾病,這一方面是很引吸眼球的事情,特別是現(xiàn)在熱門到不行的人工智能;另一方面也提高了創(chuàng)業(yè)的準入門檻。這兩點,是王俊值得我們借鑒的地方。
盤點最熱門的生物醫(yī)學領域
那么,在醫(yī)學領域,未來最熱門的都有哪些呢?我們下面把2015年的一些熱門話題總結如下。
第一,基因編輯。基因編輯原來是在細菌當中發(fā)現(xiàn)的一套防御系統(tǒng),通常包括被稱為CRISPR的基因序列和幾個蛋白質。其機理在于,細菌受到病毒侵染后,會將入侵者部分基因組片段保留于CRISPR當中。當再次受到感染時,CRISPR基因被激活轉錄為RNA。CRISPR RNA飲食的病毒和質粒片段能以互補的方式和入侵的DNA結合,在Cas蛋白的幫助下,將對應的互補片段切割,以達到阻止入侵者之目的??茖W家們研究發(fā)現(xiàn),把Cas蛋白和一段指導RNA同時引入人細胞內(nèi),可以來切除人基因組上與指導RNA互補的序列;此系統(tǒng)還可以用提供一段模板,用于替換被切除的片段。因此,CRISPR系統(tǒng)在疾病治療上有非常廣闊的前景;它即可以使指定的目標片段失活,也可以將指定的基因突變替換為正常的序列,從而起到治療甚至治愈相應疾病的目的。CRISPR系統(tǒng)簡單易用、功能強大,因此很快就被應用到了人身上。據(jù)媒體報道,截止2015年3月,已經(jīng)有至少4家美國的實驗室、不少中國、英國實驗室以及一家美國生物技術企業(yè)將CRISPR技術應用到人類胚胎上去。2015年4月,廣州中山大學的科學家們在《蛋白和細胞》(Protein and Cell)雜志上發(fā)表了他們的人類胚胎實驗結果。他們在受精卵發(fā)育早期引入將CRISPR系統(tǒng)試圖修復HBB基因上的一個突變,HBB突變會誘發(fā)beta-地中海貧血;當胚胎接收到的來自父母雙方的HBB都突變時,胚胎是不能存活的。他們的研究發(fā)現(xiàn),CRISPR系統(tǒng)可以有效地切除損壞的HBB基因。
基因編輯的應用前景吸引了大量資金的追捧,各種以CRISPR系統(tǒng)為賣點的商業(yè)公司紛紛成立,比如Editas Medicine, Caribou Biosciences, CRISPR Therapeutics, Intellia Therapeutics等等。由谷歌投資的Editas Medicine還于2016年1月4日向美國NASDAQ提交了IPO申請,并聲稱會盡快上市。
然而,CRISPR離真正的臨床應用還有很長的路要走。其中最大的挑戰(zhàn),在于基因修復的效率。在致病突變當中,大部分都是失效突變;也就是說,發(fā)生突變之后,基因的功能失活了。因此想要治病,就要重建基因的功能。這也是為什么很多疾病就算知道了發(fā)病機理,找到了對應的基因,也沒辦法治療的關鍵因素,因為基因功能重建是相當困難的。而CRISPR就提供了這種可能。但是,上面提到的中山大學的研究表明,將CRISPR應用于人類胚胎時,修復的效率并不高。在少數(shù)有修復發(fā)生的胚胎內(nèi),也并不是所有的細胞都被修復了。
因此,開發(fā)更好更有效的基因編輯系統(tǒng),對我們來說是挑戰(zhàn),也是機遇。
第二,ctDNA,即循環(huán)游離DNA(circulating cell free DNA;cfDNA)或者循環(huán)腫瘤DNA(circulating tumor DNA;ctDNA)。這項研究的原理是懷孕時,胎兒的DNA片段會進入母親的血液,以裸露的形式游離在血液中;通過一定的技術分離這種DNA片段,就能夠對胎兒進行各種基因檢測。這種無穿刺的技術大大方便了產(chǎn)前診斷。有研究表明,在診斷唐氏綜合癥(Down Syndrome)方面,cfDNA檢測的準確性高于常規(guī)的血清檢測。另外,腫瘤細胞破碎后,其DNA也會游離在血液中;捕獲此類DNA,或者監(jiān)測ctDNA的血液中的數(shù)量,就能鑒定并監(jiān)測腫瘤的發(fā)生發(fā)展情況。
第三,外排體(Exosomes,又譯外泌體/外吐小體),是細胞分泌形成的一種大小約50到90nm的囊泡,內(nèi)含來源細胞的多種蛋白質、脂類、DNA和RNA等重要信息。外排體與ctDNA一樣,都是近些年來發(fā)展出來的所謂的“體液活檢”技術。由于外排體可以通過非穿刺性方法收集,其中又含有來源細胞的DNA,因此同樣可用于進行基因于DNA的基因檢測。同時,如果可以完整收集外排體,還可以直接檢測癌癥細胞內(nèi)的生理狀況。除此診斷癌癥之外,最近的研究表明,還可以直接利用外排體治療癌癥:新墨西哥大學助理教授Kristina Trujillo的研究告訴我們,癌組織周圍的健康細胞分泌的外泌體具備毒殺癌細胞的能力。
第四,創(chuàng)新的血液檢測技術。這其中的代表是Theranos。與上面提到的三點不同,Theranos提供的創(chuàng)新血液檢測技術已經(jīng)被FDA批準進入實用階段。2015年7月15號,F(xiàn)DA正式批準了Theranos的一項測試,通過血液檢測一種性傳播的單純皰疹病毒(Herpes simplex virus);FDA還允許這項測試在非實驗室環(huán)境下進行,這使得Theranos可以直接面對“消費者”;而消費者可以像使用血糖儀和驗孕棒一樣,無需醫(yī)生的批準就可以選擇這項測試。單純皰疹病毒檢測只是Theranos提供的數(shù)百種檢測之一。與傳統(tǒng)血液檢測相比,Theranos的技術可以用少至一滴血液進行多達30種檢測。根據(jù)維基百科的介紹,Theranos使用一次性的手指針刺裝置抽取約1微升血液,然后裝入一種專門的讀取設備進行分析;結果會傳輸?shù)綄iT的安全數(shù)據(jù)庫,由測試者或其醫(yī)生連線獲取。每種檢測的價格均在10美元級別。除價格優(yōu)勢外,Theranos檢測的速度也快,通常為幾十分鐘至幾個小時,遠低于常規(guī)實驗室檢測所需的3天。此外,Theranos并不直接接觸消費者的血液樣品,也在最大程度上保障消費者的隱私(比如,不會將消費者血液用于其它目的等等)。
類似的技術還有無創(chuàng)性注射。目前,已經(jīng)有公司開發(fā)出類似于創(chuàng)可貼的胰島素注射技術,利用“創(chuàng)可貼”上非常細小的針頭刺入皮下,同時使用緩釋技術使得胰島素均勻的注射到患者體內(nèi)。這些對于那些怕針和不能見血的患者都是莫大的福音。
總的來看,醫(yī)學領域對于新技術新療法是非?!翱释钡?。一方面,有大量的疾病需要我們?nèi)スタ?,新的藥物去開發(fā);另一方面,也有大量的現(xiàn)有技術需要改進、升級。這些,都是我們在科研以及創(chuàng)業(yè)上需要重點努力的方向。
2016已經(jīng)來了。但它的開局注定了,這將是不平靜的一年:股市下跌、經(jīng)濟下行、美元強勢、資本外流。這意味著投資活動將會減弱,從資本市場上獲得資金將會比2015困難不少。在競爭加劇的情況下,只有擁有自己的核心優(yōu)勢人,才能順利脫穎而出。拿奇云諾德CEO羅奇斌的話說就是:“在創(chuàng)業(yè)時 … 別人能用錢堆出來的東西,我們不要去做…要做就做那些不能輕易被別人復制的東西”。
至于如何做到這一點,我只能說:“發(fā)揮你的想像力吧!”。