2020年疫情暴發(fā)后,中科院上海巴斯德研究所郝沛的名字再次響起來,她領導的課題組在新冠病毒肆虐的第一時間就參與了病毒的基因組數(shù)據(jù)分析工作,提供了關鍵的分析數(shù)據(jù)。包括《中國科學報》、央視新聞、澎湃新聞等媒體都報道了郝沛及課題組的貢獻及奉獻精神(整個春節(jié)期間郝沛及其同事都在為新冠病毒的數(shù)據(jù)分析而通宵達旦工作)。其實這不是郝沛第一次為媒體所關注。17年前,在那場全球科學家為盡快測定SARS病毒結構并做數(shù)據(jù)分析的競爭中,趙國屏院士領導的團隊在第一時間給出令人信服的數(shù)據(jù)和分析,相關工作在《科學》(Science)、《美國國家科學院院刊》(PNAS)等權威雜志發(fā)表。其時,27歲的郝沛參與了生物信息學方面的數(shù)據(jù)提供、分析工作。作為作者之一,郝沛的名字出現(xiàn)在國際頂尖雜志上。也正是憑借這樣出彩的工作,2004年郝沛申報啟明星的答辯成績在參評者中排名第一,盡管那是郝沛第一次參加課題申請答辯。
因為啟明星的向心力,也因為被訪者爽朗的性格,相約郝沛采訪進展很順利。那天來到郝沛的工作室,20平米不到的房間,除了臨窗的寫字臺,一大半空間是小會議室的風格,冰箱、咖啡機等一應俱全,每次客人來或是每周的組會以及郝沛和課題組成員的討論大都會安排在這里,主人的熱情,濃香的咖啡給每一位來者留下美好的印象。我們也是在這樣溫馨可人的氣氛里開始了這次啟明星訪問。訪問一共進行了三個多小時,結束時郝沛說這是她第一次把自己的經歷談得那么多且詳細。
1975年9月,郝沛出生在陜西省寶雞市。郝沛的父親是文革前的大學生。郝沛的母親是小學老師,工作后考入中國人民大學并完成在職本科教育。郝沛有一個大自己兩歲的哥哥,高考時哥哥考進上海交通大學電機系,以后又赴美國杜克大學拿到博士學位,現(xiàn)在任南方科技大學計算機科學系主任。哥哥一直是郝沛學習和追隨的榜樣。郝沛的記憶里,父親在子女教育方面非常傳統(tǒng)且堅持,他認為學習理工科未來才有出路。
郝沛的童年可以用獨立早、讀書早與成熟早來概括。她從小學一年級就開始自己照顧自己,比如自己安排晨跑、吃飯、洗澡與學習。令郝沛記憶猶新的是小學四五年級時媽媽在北京念書,她就自己拿著飯菜票去食堂吃飯。初中一年級,父親調到江蘇常州河海大學任教,舉家遷至常州生活。郝沛很快適應了在南方的生活與學習。高中時期的郝沛繼續(xù)著努力學習與全面發(fā)展的勢頭:學習成績全班數(shù)一數(shù)二,并一直擔任班長,獲得江蘇省中學三好學生榮譽以及獎學金資助等等。高考前夕,郝沛獲得直升大學的機會,但她放棄了。郝沛回憶道,她高考同時代的人對于考大學是有綜合考量的,比如把大學所在地域與未來工作事業(yè)所在地聯(lián)系起來等。她心中的“圣地”是清華,但或許是因為父親與哥哥對自己的影響,郝沛最終報考了上海交通大學。1993年,郝沛被上海交大電子工程系微電子大規(guī)模集成電路專業(yè)錄取。大學四年,郝沛覺得學習壓力很大。她所學的電子工程專業(yè)課程多,作業(yè)多,郝沛坦言自己學得非常累而苦。臨近本科畢業(yè)時,郝沛坦言自己當時沒有方向,參加了考研并沒有通過,但是讀研究生確實是她內心一直向往的目標。
在考本校研究生未果后郝沛選擇了就業(yè)。中科院上海分院網絡信息中心向她伸出了橄欖枝,彼時Windows剛問世,郝沛加入中科院不久就承接了中科院信息管理系統(tǒng)的軟件開發(fā)任務,受命開發(fā)中科院財務軟件系統(tǒng)。為此郝沛那段時間(1997—1998年)去了中科院在合肥、武漢、長春的幾個研究所,也就是在那時她認識了當時武漢植物所的副所長鐘揚老師。
1999年至2000年,中科院上海生命科學研究院成立,系統(tǒng)生物學、生物信息學這些新興學科方向得到重視。在趙國屏院士的力推下,上海成立了生物信息中心,由當時剛從德國引進回上海的李亦學教授擔任主任。那段時間也是中國生物信息學發(fā)展的起步期,郝沛說她是幸運的,趕上了這一波發(fā)展的潮頭,參加了李亦學老師領頭的生物信息平臺。初試身手是2001年為韓斌老師的水稻基因組提供數(shù)據(jù)分析支撐。在那段時間還做過擬南芥、老鼠、乳酸菌、水稻到人的基因組數(shù)據(jù)分析。
經過幾年的實踐歷練,郝沛對自己從事的提供數(shù)據(jù)分析工作的本質意義有了更深的理解:數(shù)據(jù)分析并非只是簡單地提供工具,而是要提供整個過程中對數(shù)據(jù)邏輯體系的把握。簡言之,對被測數(shù)據(jù)(如病毒)做出分析,實際上是要回答該數(shù)據(jù)說明什么問題。做到這一點就要求數(shù)據(jù)分析者要把所有的已知知識綜合進來,包括以往對病毒的認知,知道為什么要這么做,突破點在哪里等等。而要達到這樣的效果,除了需要非常廣的知識面,和課題組專家的討論也是至關重要的。
參加巴斯德研究所博士生畢業(yè)典禮
郝沛以2003年趙國屏院士做SARS病毒結構的生物進化分析為例介紹說,當時新加坡科學家圍繞SARS病毒和進化的關系先發(fā)了文章,但他們的病毒樣本是晚期患者的,早期的樣本在廣州。趙老師當時從廣州得到從早期到晚期的多個樣本,他希望能覆蓋早期到晚期的全過程,了解這個病毒是怎樣從動物跳躍到人身上的整個適應過程,而要達到這樣的效果就要有相應的邏輯體系來描述哪些突變對適應性是重要的。SARS病毒進化分析是一個理論性非常強的領域,以前沒有做過進化的郝沛領受任務后就和不同的人討論來加深理解,包括和研究過植物進化的鐘揚就有過很好的討論。最終這篇討論并闡明SARS病毒結構與生物進化相關性的論文在《科學》雜志發(fā)表。趙國屏院士是這篇具有里程碑意義的論文的通訊作者,郝沛作為數(shù)據(jù)組主要成員列為共同第一作者。
盡管郝沛屬于最早進入生物信息學領域的那批人,但是由于沒有海外留學經歷,沒有博士學位的她要想在強手如林的中科院立足還是非常不易的。同時,無論生物信息、數(shù)據(jù)分析有多重要,在生命科學這條主線里只是配角。郝沛如下這段聽似牢騷的話客觀道出了她當時的心境:我們總是在為別人做嫁衣。別人少不了我的分析,但是生物信息工作的屬性就決定了從業(yè)者無法也不可能專注、深耕于某一個領域(就如以上提到的測試對象從擬南芥、老鼠、乳酸菌、水稻到人一直在轉換)。簡言之,雖然我從事的是不可或缺的工作,但是我的工作永遠在做配角。雖然今天的郝沛對此的理解可能又深了一層,或者說更豁然了,但是生物信息學、生物數(shù)據(jù)分析的地位和作用應該得到應有的理解,從業(yè)者的創(chuàng)造性工作應得到更多認可和尊重終究是一個需要面對的問題,因為沒有出色的配角支撐,主角也無從確立。
2004年1月鐘揚老師推薦她作為談家楨院士的學生,實際上是掛在談老的名下(談老當時每年可帶2名學生),帶教導師是鐘揚老師。2004年1月到2009年1月,郝沛完成了生物信息博士的全部碩博課程后畢業(yè),進入吳家睿教授領導的中科院系統(tǒng)生物學重點實驗室,主要還是跟著李亦學老師做生物信息數(shù)據(jù)分析。其時,中科院在推廣以PI為單位的課題組長負責制,PI的門檻是要有研究員職稱。盡管拿到了博士學位,也有過原創(chuàng)性的工作,但因為沒有海外留學背景,郝沛很難得到研究員職位。2012年,急需生物信息方面專家的中科院巴斯德研究所向郝沛發(fā)出邀請,同意給她研究員職位。到了巴斯德所后,郝沛很快確定了聚焦病毒和免疫的科研方向,因為在郝沛看來免疫的復雜性可以與神經、腦相提并論,是一個可以不斷開拓耕耘的領域。就這樣,36歲的郝沛博士終以PI身份帶領一個課題組在自己認定的領域潛心耕耘。此后凡有新發(fā)現(xiàn)的病毒,郝沛課題組都會積極參與。如2013年和上海公共衛(wèi)生臨床中心(簡稱上海公衛(wèi))合作做了H7N9的病毒發(fā)現(xiàn)工作。當然更主要的,也會載入中國科學家抗疫史冊的是這次新冠疫情暴發(fā)以來郝沛與她的團隊做的工作。
2020年1月11日,上海公衛(wèi)張永振研究員發(fā)布了新冠病毒全基因組數(shù)據(jù)。得此信息的郝沛帶領課題組當天就開始分析。12日郝沛與她的同事們就把該病毒的傳染機制搞清楚了:和SARS很接近。第二天郝沛就向所領導和趙國屏院士匯報。趙老師讓郝沛趕快聯(lián)系合作者做進一步合成ACE-2蛋白的驗證。計算結果提示這個病毒從能進入人體這件事而言和SARS是一樣的。在病毒進入、復制、包裝、釋放整條鏈上,郝沛他們主要從進入這塊分析。當時已臨近春節(jié)。郝沛全無過年的心思,一心只想著趕快做出來、寫出來。1月16日晚文章寫好,投給《中國科學》,21日正式在線。這篇文章是這次疫情暴發(fā)以后國內外最早問世的討論新冠病毒結構的論文,也是頂著巨大壓力的產物。
2020年1月,新冠疫情暴發(fā)初期在工作室加班
緊接著,郝沛課題組又和營養(yǎng)健康所合作,開發(fā)了能對醫(yī)院提供的數(shù)據(jù)做進一步分析的“云上高通量測序病毒鑒定分析系統(tǒng)”。只要把病人的樣本、測序結果放到云上,研究人員就可以做出分析。郝沛主要承擔系統(tǒng)開發(fā),并把流程提供給需要的用戶。從大年初四開始開發(fā)這個系統(tǒng),2月中旬就公布啟用了,目前上海公衛(wèi)都是利用這個系統(tǒng)做分析。郝沛介紹這個系統(tǒng)不局限于分析新冠病毒,還可以分析所有基因組的病毒。此外,從2019年起郝沛就向上海市科委等有關部門提出要建人口高密度城市的環(huán)境病毒組的數(shù)據(jù)庫,并得到了中科院立項和有限的經費支持。郝沛認為這是一個需要持續(xù)做下去的抗病毒基礎性工作,第一步先要做每年會暴發(fā)的流感病毒。有了積累,以后有新發(fā)病毒就會有應對的底氣。郝沛也想借這次啟明星采訪再提一下建設人口高密度環(huán)境病毒組數(shù)據(jù)庫的重要性,希望能得到有關部門的重視和支持。
這次新冠病毒再次給我們所有人敲了警鐘,各種病毒在人群密集的特大城市暴發(fā)會是一個大概率事件,痛定思痛,在對病毒的基礎性研究和防控方面加大投入既刻不容緩,也是一本萬利的治本之策。從這個意義上說,這次啟明星采訪受訪者郝沛博士以上一些坦誠的進言希望得到更多的關注、理解和支持。