契合大眾對于理科生的一般想象,葉田田留著一頭短發(fā),穿著格子襯衫,臉上時常露出靦腆、溫和的微笑。她說,自己的工作很簡單,基本是對著計算機和數(shù)據(jù),像獵人一樣從十幾億個DNA堿基對中尋找到與優(yōu)良性狀相關(guān)的基因。正如她的名字所攜帶的意象,這些單調(diào)、重復(fù)的數(shù)據(jù)具有無窮的生命力,編織著生命的“基因密碼”。
2022年6月14日,浙江省第十家省實驗室湘湖實驗室在杭州蕭山成立。一年后,葉田田從美國學(xué)成歸來,加入了湘湖實驗室淡水水產(chǎn)核心種源創(chuàng)制團隊。她說,自己想為家鄉(xiāng)的水產(chǎn)行業(yè)和國內(nèi)的生物基因工作開發(fā)、驗證好的工具和方法。
加州大學(xué)河濱分校位于南加州的洛杉磯以東,以杰出的農(nóng)學(xué)研究聞名全球。在讀博期間,葉田田專攻生物信息的數(shù)據(jù)分析,分析的對象很多,包括人類、小鼠、擬南芥、酵母等。不過,她最想要“捕獵”的基因之一,藏在老家湖州的羅氏沼蝦里。帶著“能不能回國做點事”的想法,2023年7月她回到了國內(nèi)。
相較于周期更長、不確定性更強的傳統(tǒng)育種方式,湘湖實驗室開發(fā)的新一代育種技術(shù)“全基因育種”,能夠通過基因芯片技術(shù)把天然攜帶優(yōu)良性狀的基因提取出來,再結(jié)合人工繁育苗種、人工養(yǎng)殖、人工配合飼養(yǎng),就能形成一個更高效和優(yōu)質(zhì)的產(chǎn)業(yè),可以有效靠捕撈滿足大眾的消費需求。
舉個江浙人可能有感知的例子:這兩年,育種技術(shù)的提升直接反映在我們的餐桌上。翹嘴鲌,又名太湖白魚、銀刀,是一種生活在太湖里的淡水魚類,因肉質(zhì)細膩肥美,享有“天下第一鮮”的美譽。這道百姓桌上的珍饈,野生價格為每斤二三十元。通過人工繁育,價格降到每斤十元左右。
因此,像葉田田這樣能掌握基因挖掘精準(zhǔn)定位技術(shù)的人才,無論是在水產(chǎn)領(lǐng)域還是其他養(yǎng)殖領(lǐng)域,都非常稀缺。被聘為湘湖實驗室首席專家之前,顧志敏在浙江省淡水水產(chǎn)研究所工作了38年,當(dāng)了12年的所長,研究方向一直圍繞著新品種開發(fā)、健康養(yǎng)殖等方面。談到葉田田,他不吝贊美之詞:“她很厲害!之前在浙江大學(xué)竺可楨求是班就讀,又到哈佛大學(xué)完成了本科畢業(yè)論文,之后在加州大學(xué)河濱分校完成計算機碩士和生物信息學(xué)博士學(xué)位。我們很需要這樣的人才!”
和葉田田差不多時間加入湘湖實驗室的還有一批“90后”科研人才?!皥F隊包含1名科研骨干和5名博士后,靠他們挑大梁?!鳖欀久粽f。
除了和數(shù)據(jù)打交道,擔(dān)任副研究員的葉田田、博士后揭育鹍負責(zé)采集樣本,對羅氏沼蝦進行抗病研究;副研究員嚴軍軍負責(zé)基因編輯,劉翠專攻飼料營養(yǎng)。
“他們的研究方向涉及整個產(chǎn)業(yè)鏈,意味著新品種出來以后,馬上就可以應(yīng)用?!鳖欀久艚榻B,這個團隊研發(fā)的羅氏沼蝦、紅螯螯蝦兩種液相基因芯片在全球范圍內(nèi)都屬首次,也順道打破了國外的“卡脖子”技術(shù),“借助新的液相基因芯片,水產(chǎn)新品種的培育時間能縮短一半,效率提升40%以上?!?/p>
在數(shù)以億計的堿基對里解開“基因密碼”
生物的性狀主要是由基因決定的,了解了基因,就等于找到了深入了解并且改造生物的一把鑰匙。水產(chǎn)品的育種,關(guān)鍵在基因。只不過,基因測序只是“第一步”。羅氏沼蝦有30多億個堿基對,鱖魚有7億多個堿基對。從大量基因中初步篩選出相關(guān)性基因,依舊是個不小的數(shù)字,如何進行進一步精準(zhǔn)定位?這就輪到葉田田出場了。她的日常工作就是建立數(shù)據(jù)模型,用計算機進一步解開一段段“基因密碼”,將相關(guān)性基因準(zhǔn)確地挖掘、定位出來。
“我們通過建立數(shù)據(jù)模型,進行基因檢測分析。比如說,通過分析,我們檢測到長得高大的個體中,有幾個基因出現(xiàn)頻率比較高,就可以認為這幾個基因可能跟生長性能相關(guān)。”她說。精準(zhǔn)定位特定基因后,就可以根據(jù)育種目標(biāo),利用基因編輯技術(shù),“敲掉”或者“植入”相關(guān)的基因片段,以改良品種。
說起來簡單,但想要精準(zhǔn)捕捉到特定基因,通常要花費數(shù)以月計甚至年計的時間。“難點在于水產(chǎn)基因組的重復(fù)序列相對較多,尤其是蝦類,一整套基因組上可能有很多片段是重復(fù)的,這會讓測序拼裝面臨很大的挑戰(zhàn)?!比~田田說。
除了工作時間,葉田田會花大量的時間閱讀文獻:“我們需要了解國際上最新的算法和發(fā)展,包括現(xiàn)在用人工智能去做基因組相關(guān)的研究,這些技術(shù)的發(fā)展速度非???,我們必須跟進?!?/p>
在她看來,人工智能在對自然語言的處理、與人的對話這些方面的發(fā)展已經(jīng)非常領(lǐng)先,但對基因組還處于探索應(yīng)用的階段?!盎蚪M和人類語言的差別是很大的,所以不能照搬,但我們希望利用大模型和人工智能,進行基因組算法的訓(xùn)練?!彼诖?,有一天能實現(xiàn)對基因功能的預(yù)測,通過一個片段預(yù)測它的功能,包括基因編輯方向,用大模型判斷靶標(biāo)與基因編輯酶結(jié)合、編輯的效率等,以此更好、更快地篩選合適的靶標(biāo)。
從對人類、小鼠的研究轉(zhuǎn)向相對冷門的水產(chǎn)研究,葉田田依舊充滿熱情,她想要做一些好的、重要的、有影響力的工作,可以為水產(chǎn)學(xué)科進一步開發(fā)、驗證好的工具和方法。在她看來,水產(chǎn)學(xué)科方向,研究人員相對較少,未知更多,也更具挑戰(zhàn)性,國內(nèi)發(fā)展也是領(lǐng)先于國際的,反而能取得更大的成就。
“好奇心強,想要探索未知,所以才來搞科研嘛!”“90后”科研人葉田田如是說。