馮蕓芝,孫 棟,邵倩文,3,王春生,4,*
1 上海交通大學海洋學院,上海 200030
2 自然資源部第二海洋研究所,自然資源部海洋生態(tài)系統(tǒng)動力學重點實驗室,杭州 310012
3 寧波海洋研究院,寧波 315832
4 南方海洋科學與工程廣東省實驗室(珠海),珠海 519082
海洋浮游動物是一類個體微小,運動能力較弱或無,在水層中營浮游生活的異養(yǎng)生物類群。它們種類豐富,數(shù)量極大,廣泛分布于世界各大水域,作為海洋初級生產(chǎn)力的主要消費者,是連接海洋初級生產(chǎn)者和高營養(yǎng)級動物(魚、蝦、鯨、海鳥等)的關鍵營養(yǎng)紐帶[1]。許多浮游動物具備典型的晝夜垂直遷移行為,能夠直接促進不同水層間的物質(zhì)交換;而它們攝食體型較小的浮游生物,并排出較大顆粒的糞便,也促進了有機碳向海洋深層的轉(zhuǎn)移[2]。此外,浮游動物作為很多海產(chǎn)經(jīng)濟動物特別是經(jīng)濟魚類幼體的重要餌料生物,其群落結(jié)構(gòu)和多樣性動態(tài)直接影響這些經(jīng)濟動物的資源量與補充能力,因此它們是漁業(yè)資源管理的重要依據(jù)[3]。水母類、橈足類、被囊類和毛顎類等許多浮游動物類群對氣候、環(huán)境變化的響應非常敏感[4—5],是反映海洋環(huán)境變化的極佳研究對象;且它們的空間分布模式與水團、海流密切相關,也是研究水團、海流運動的良好指示生物[6]。綜上,浮游動物不僅是海洋生物學的研究重點,也是生物海洋學和漁業(yè)科學等研究的重要對象。
浮游動物包括了龐雜的分類階元,主要有原生動物(鞭毛蟲、肉足蟲、纖毛蟲等)、刺胞動物、櫛板動物、輪蟲動物、浮游甲殼動物(橈足類、枝角類、端足類、介形類、磷蝦類、糠蝦類、螢蝦類等)、腹足類軟體動物、毛顎動物、低等脊索動物(浮游有尾類和海樽類)等。除了上述的永久性浮游動物外,還有暫時性浮游動物,包括底棲生物的浮游幼體及游泳動物的魚卵、仔稚魚等?;谛螒B(tài)學的物種鑒定方法對鑒定人員的專業(yè)水平要求較高,尤其是浮游幼體缺乏明顯的形態(tài)學特征,難以鑒別,且形態(tài)鑒定工作量大成本高,不同專業(yè)人員的鑒定結(jié)果難以標準化,這仍然是海洋浮游動物生態(tài)學研究的一個主要障礙。此外,盡管相較于陸地、潮間帶和海底,海洋水體之間往往被認為不存在明顯的地理隔離,然而越來越多的分子生物學實驗結(jié)果表明,浮游動物廣布種在不同海域之間遺傳差異較大,隱存種可能廣泛存在[7—9],基于形態(tài)學鑒定得到的浮游動物物種多樣性往往被低估。隨著分子生物學技術的發(fā)展,基于不同物種特定基因序列的差異性,構(gòu)建以短的DNA序列為分類單元的數(shù)據(jù)庫,以實現(xiàn)快速、準確的物種鑒定的DNA條形碼技術[10]已得到越來越普遍的認可和發(fā)展。然而,大多數(shù)浮游動物個體微小,分離并提取DNA的操作困難,耗時耗力,難以滿足大規(guī)模生態(tài)監(jiān)測的需求。
近年來,DNA宏條形碼技術為克服上述困難提供了一套新的解決方案。該技術無需分離生物個體,而是通過提取復雜環(huán)境樣本(包括過濾的空氣和水、沉積物、生物混合樣本等)的總DNA,基于特定的一對或多對DNA條形碼進行聚合酶鏈式反應(PCR)擴增,然后通過高通量測序和比對,實現(xiàn)復雜樣本物種多樣性的快速評估[11]。隨著測序成本的逐漸降低,宏條形碼技術能夠避免不同鑒定人員主觀因素帶來的誤差,具有準確、高效、經(jīng)濟的特點,使其在浮游動物物種鑒定上具有顯著優(yōu)勢[12—13]。此外,高通量測序技術產(chǎn)生的大量信息有利于揭示海洋浮游動物群落的隱匿多樣性[14—15]。除了傳統(tǒng)浮游生物拖網(wǎng)采集得到的樣品可以用于宏條形碼分析外,水體環(huán)境中也存在著大量浮游動物的游離DNA,即環(huán)境DNA(eDNA)。eDNA聯(lián)合宏條形碼技術探測浮游動物多樣性的方法無需采集生物樣本,對環(huán)境和浮游動物群落的破壞性更小,正逐漸成為研究熱點,在生態(tài)監(jiān)測和評估方面具有較大應用潛力[16—18],相關報道數(shù)量增長迅速(圖1)。
圖1 浮游動物宏條形碼研究的文獻計量學分析
核糖體小亞基18S rRNA基因是浮游動物宏條形碼研究中的最常用的條形碼(圖2、表1)。其中18SV9高可變區(qū)長度約為130bp,非常適合高通量測序平臺,其通用性良好且數(shù)據(jù)庫中的參考序列十分豐富,因而是研究環(huán)境中真核生物多樣性的常用分子標記[27—28],在浮游動物宏條形碼研究中也有許多應用[15, 23—24, 29]。此外,18S rRNA的V1—V2區(qū)和V4區(qū)長度約為350—450bp,其中18SV1—V2區(qū)主要用于底棲生物的研究[30],而V4區(qū)更多用于浮游生物[31—32]。然而,V1—V2區(qū)比18S rRNA的其他可變區(qū)在橈足類中具有更高比例的簡約信息位點,且在公共數(shù)據(jù)庫中擁有豐富的參考序列[14],也適合浮游動物的多樣性研究[25, 33]。另外,不同浮游動物類群與引物的適配度不同,例如18SV7區(qū)變異最大,適合研究種內(nèi)高度分化的紡錘水蚤屬(Acartia)[33],核糖體小亞基12S rRNA被認為更適合在種水平上鑒定隆水蚤科的橈足類[34]。此外,核糖體大亞基28S rRNA可變性更高,也已被應用于橈足類的宏條形碼分析[26, 35]。
圖2 浮游動物宏條形碼研究中分子標記的統(tǒng)計
線粒體細胞色素c氧化酶I基因(COI)是后生動物最常用的條形碼之一[10,36],也是海洋浮游動物常用的分子遺傳標記(圖2)。COI基因進化速率快于核基因組,因此在物種水平上具有更高的分辨率,但是在更高的分類層級上分辨率較低[37—38]。此外,由于COI編碼蛋白質(zhì),在不同的生物類群中,密碼子第三位堿基的擺動性增加了引物的錯配率,而且COI基因在不同類群中進化速率差異較大,因此難以設計覆蓋廣泛浮游動物類群[39]或后生動物類群的通用引物[40—42],且對水母類、被囊類等膠質(zhì)浮游動物重現(xiàn)性較低[36,43—44]。Leray等[45]設計了一對擴增長度為313bp的COI通用引物,適用于高通量測序平臺,在珊瑚魚腸道后生動物多樣性研究中表現(xiàn)良好,目前已被廣泛應用于浮游動物宏條形碼研究(表1)[46—47]。此外,線粒體12S和16S基因也可以作為浮游動物宏條形碼研究的分子標記[41, 48—49],在保證物種識別分辨率的同時降低引物-模板的錯配率,且16S基因特別適合刺胞動物的檢測[44,50]。
表1 浮游動物宏條形碼研究中主要分子標記的應用示例
許多學者比較了18S和COI等分子標記對浮游動物多樣性的評估效果,發(fā)現(xiàn)橈足類的優(yōu)勢物種均能被各分子標記檢出,且都能有效地區(qū)分不同的浮游動物群落[51]。18S 能夠覆蓋更多的浮游動物類群,但由于其較高的保守性導致其對物種識別的分辨率較低,很難在種水平上區(qū)分物種,可能會造成對群落物種多樣性的低估以及對非本土物種的錯誤注釋[37,52—53],而且18S被發(fā)現(xiàn)在橈足類的不同科中的分辨率也不是一致的,這也會影響優(yōu)勢類群不同的區(qū)域之間多樣性的比較[24]。所以18S更適合對復雜群落多樣性的整體檢測。COI檢出的操作分類單元(OTU)中不能被注釋的比例遠高于18S和16S,可能的原因是COI數(shù)據(jù)庫中參考序列較少[51, 54],但在構(gòu)建并使用本土COI數(shù)據(jù)庫的情況下,COI檢出的浮游動物類群覆蓋度與18S相當,且注釋到種的比例高于18S[53—56]。
每種分子標記都有不同的類群偏好性,檢出的生物種類和組成存在差異,因此,在實際研究中,要根據(jù)研究目的和目標類群選擇最合適的引物。當進行生態(tài)監(jiān)測和評估研究時,需要盡可能標準化和固定化1—2對引物的使用,在保證較高類群覆蓋度的同時,降低多對引物帶來的誤差和成本,以實現(xiàn)不同時空的研究之間的比較。而當探索和挖掘環(huán)境中浮游動物多樣性時,采用多種標記基因的組合能夠起到相互補充的作用[16, 39, 57—58],甚至可以針對浮游動物的各個類群分別設計引物測序[59—60],以獲得更全面的結(jié)果。
DNA宏條形碼技術通過高通量測序產(chǎn)生幾萬至幾十萬條序列,為了提高分析效率和降低錯誤率,往往使用UPARSE和UCLUST等算法根據(jù)一定的相似度閾值將高通量測序得到的原始數(shù)據(jù)聚類為OTU,再基于OTU進行物種注釋數(shù)據(jù)[30]。大多數(shù)浮游動物研究者采用97%的相似度閾值進行OTU的劃分[23,35, 59,61]。但是,常用的分子標記如18SrRNA序列高度保守,Wu等[33]對數(shù)據(jù)庫中所有橈足類的序列進行分析,得出相似性在97%上的序列有超過90%的可能性不屬于同一個種。有些學者使用99%的相似度閾值以避免對物種多樣性的低估[51,62]。此外,不同類群的種間相似度水平不同,不應該使用相同的閾值進行聚類[63]。而且目前大量物種分子數(shù)據(jù)的缺失會低估或高估種間相似度,從而影響相似度閾值的選擇。也有學者認為不進行聚類,直接對所有序列進行比對注釋會使多樣性結(jié)果更可靠,尤其有利于識別低豐度和種間差異小的物種[31]。然而,Kunin等[64]建議采用不高于97%的閾值聚類以降低測序產(chǎn)生的大量錯誤對生物多樣性的高估。目前,新型算法不斷涌現(xiàn),通過降噪的方式代替聚類以保留更多的有效數(shù)據(jù)。例如DADA2算法基于模型的序列校正,相當于以100%相似度聚類[65],而UNOISE系列算法通過在UPARSE算法基礎上升級過濾流程,以減少測序錯誤[66],兩者均已被應用于海洋動物宏條形碼的研究[24,53, 67—68]。此外,物種注釋算法和數(shù)據(jù)庫的選擇也會影響物種識別和物種多樣性估計的準確性[69—71],經(jīng)典的形態(tài)分類技術仍然是驗證DNA宏條形碼技術結(jié)果準確性的有效手段。
許多基于拖網(wǎng)樣品的浮游動物宏條形碼研究表明,使用97%的相似性閾值的情況下,宏條形碼技術得到的結(jié)果能夠重現(xiàn)形態(tài)鑒定得到大部分類群,反映相似的多樣性特征[15,25, 29, 57]。此外,宏條形碼技術能夠揭示環(huán)境中的隱匿多樣性,尤其是個體非常微小的原生動物[72—73],形態(tài)特征不明顯的幼體和暫時性浮游動物,如多毛類,雙殼類等等,以及群落中豐度較低的稀有種[14,24,31,46]。目前基于海水過濾樣品中的eDNA進行浮游動物宏條形碼研究相對較少,因為水樣包含水體中所有生物的信息,所以使用通用引物擴增測序得到的結(jié)果中往往包含大量藻類和微生物等,且eDNA破碎、降解比例較高。盡管如此,基于eDNA的宏條形碼技術依然能夠很好地揭示浮游動物群落的多樣性,特別是能夠補充不易被拖網(wǎng)捕捉的浮游動物信息[16]。但是對于某些類群,宏條形碼技術得到的多樣性水平比形態(tài)鑒定得到的結(jié)果更低,原因主要有:(1)測序過程中的偏差;(2)數(shù)據(jù)庫中參考序列的缺失;(3)引物適配性弱;(4)擴增片段長度的多態(tài)性;(5)水體中DNA過快的降解[33,51, 74]。另外,宏條形碼技術也可能會高估某些低豐度的類群,如水母類和軟體類[29],特別是水體中的浮游動物DNA片段可能通過海流和游泳能力強的捕食者被傳播到幾千米外的水域[75—76],沉積物的擾動也會將季節(jié)性缺失的物種帶入水柱[77],從而引起檢測結(jié)果的偏差和β多樣性的降低[78]??傊?宏條形碼技術能夠快速而準確地反映浮游動物優(yōu)勢類群的多樣性及分布特征[79],但若要盡可能全面地研究環(huán)境中浮游動物的多樣性,則有必要綜合使用基于網(wǎng)樣和水樣的宏條形碼技術以及形態(tài)鑒定技術。
經(jīng)典形態(tài)學鑒定可以通過直接計數(shù)獲得浮游動物各個物種的豐度信息。數(shù)量變化對于了解浮游動物群落動態(tài)特征和評價海洋環(huán)境質(zhì)量至關重要。多個基于浮游動物拖網(wǎng)樣品的宏條形碼研究表明,各分類單元在高通量測序過程中產(chǎn)生的序列讀數(shù)與其生物量之間具有較好的相關性[14, 16,51]。然而,實驗表明序列讀數(shù)僅能定性地反映物種數(shù)量和群落的動態(tài)特征,而不能可靠地量化單個物種的生物量。一方面,即使在同一浮游動物群落的平行重復之間,序列讀數(shù)的分布在統(tǒng)計上也是不同的[80],DNA的提取、標記基因的選擇、PCR擴增和高通量測序等過程中產(chǎn)生的實驗偏差是產(chǎn)生差異的主要原因[81—82]。另一方面,浮游動物群落中的不同類群,乃至同一類群中不同分類水平的分類單元的序列讀數(shù)與生物量之間的相關性也有所差異[68]。由于真核生物的核糖體基因和線粒體基因都是多拷貝基因,其在不同動物類群中拷貝數(shù)的差異,以及數(shù)據(jù)庫中不同類群參考序列的完整性差異是使用宏條形碼技術進行浮游動物量化研究所面臨的重大挑戰(zhàn),特別是稀有類群[68,83]。此外,不同浮游動物類群個體大小差異較大,會對物種豐度的估計產(chǎn)生偏差,多個小型生物體可能產(chǎn)生與少數(shù)大型生物體相同數(shù)量的序列讀數(shù)[29]。
基于eDNA的宏條形碼研究面臨更復雜的情況。首先,需要驗證釋放到水體中eDNA的濃度與浮游動物的生物量或豐度存在相關性[18]。其次,不同環(huán)境中eDNA衰減率差異很大[74, 84—85],且對環(huán)境因素如何影響eDNA濃度、稀釋和擴散速率的理解尚不充分[18],這限制了不同采樣季節(jié)、地點水體中浮游動物群落結(jié)構(gòu)的比較。已有研究提出構(gòu)建人工群落或者結(jié)合實時熒光定量(qPCR)技術來校正序列讀數(shù)與物種生物量之間的偏差[82, 86],但這些方法都需要針對每個類群分別計算校正因子,浮游動物涵蓋的類群十分廣泛,宏條形碼技術實現(xiàn)對浮游動物的量化評估仍然需要更多研究支持。
與傳統(tǒng)的形態(tài)鑒定方法相比,DNA宏條形碼技術在海洋浮游動物群落監(jiān)測中的主要優(yōu)勢在于:(1)宏條形碼技術的便捷性,使之成為長時間尺度的多樣性連續(xù)監(jiān)測的好工具[61],有利于跟蹤浮游動物群落的長期變化,特別是觀測其對異常氣候事件的響應[59]。目前,冰芯或深海沉積物中保存的DNA可用于揭示成千上萬年前浮游生物多樣性[87]和群落的歷史變遷[88];(2) 全球范圍內(nèi)不同海域的浮游動物優(yōu)勢屬種和群落組成有明顯差異,宏條形碼技術無需鑒定人員具備完備的分類學知識,且能夠揭示廣布種在不同地理環(huán)境下的種內(nèi)變異,因而也非常適合大尺度浮游動物群落的監(jiān)測。例如Hirai等[26]調(diào)查了整個太平洋中上層橈足類的群落結(jié)構(gòu)分布模式,而Chain等[31]比較了太平洋、大西洋和北極海域浮游動物多樣性的差異。(3)宏條形碼技術可以與聲學技術聯(lián)合研究浮游動物的晝夜垂直遷移[89]。(4) 基于eDNA的宏條形碼技術,使用通用的分子標記,能夠一次性獲得從真菌、原生生物到后生生物的分類信息,有利于各類群的比較以及類群間相互作用的揭示,實現(xiàn)對生態(tài)系統(tǒng)整體的認識[67,90]。(5) 高通量測序產(chǎn)生的大量測序數(shù)據(jù),包括不能在數(shù)據(jù)庫中被注釋的序列信息,都能夠通過機器學習建立模型[91],在水域生態(tài)健康的評估和預測上具有更高的敏感性和準確度,目前在淡水生態(tài)系統(tǒng)中已有應用[92—93]??傊?下一代的全球海洋生物監(jiān)測將以大規(guī)模、自動化為特點,能夠獲取更豐富和多樣化的生態(tài)信息,促進對生態(tài)系統(tǒng)變化的理解[94]。
DNA宏條形碼技術還可以用于浮游生態(tài)系統(tǒng)的營養(yǎng)關系研究。生態(tài)系統(tǒng)營養(yǎng)關系研究的經(jīng)典方法是基于物種的食性分析,即通過收集和分析捕食者的消化道內(nèi)容物和糞便,在顯微鏡下觀察形態(tài)以鑒定物種。該研究面臨的最大技術障礙就是餌料生物個體在捕食者的消化道內(nèi)會產(chǎn)生物理性碎裂和化學性降解,以至于形態(tài)逐漸不可辨別。在糞便中,可鑒別形態(tài)的比例會更低。宏條形碼技術的應用,能夠快速、大規(guī)模地揭示捕食者的食譜特征和生物之間的營養(yǎng)關系[95—98],特別適合難以觀測的深海捕食關系和營養(yǎng)關系研究[99]。此外,在生物入侵的早期階段,入侵種的豐度較低,難以被傳統(tǒng)的采樣方式捕捉和鑒定,而宏條形碼技術對低豐度物種檢測的敏感性顯著地提高了識別入侵種的能力[100—101],有利于生態(tài)預警監(jiān)測和管理。宏條形碼技術在種群遺傳學上也有應用潛力,高通量測序產(chǎn)生的大量代表性序列,包含了足夠的物種特異性信息,可以直接用于系統(tǒng)發(fā)育和生物地理格局的分析[18,26]。
目前DNA宏條形碼技術在海洋浮游動物生態(tài)學的研究中展現(xiàn)出了巨大的優(yōu)勢,但是依然存在顯著的問題。一方面,完善的數(shù)據(jù)庫信息是利用宏條形碼技術進行物種比對注釋的基礎,但是浮游動物DNA條形碼的數(shù)據(jù)大量缺乏[36],尤其是COI條形碼亟需得到本土物種數(shù)據(jù)補充[69]。而且浮游動物的形態(tài)鑒定水平受鑒定人員的專業(yè)水平影響較大,由于審核機制的缺失,一些數(shù)據(jù)庫中DNA序列信息錯誤率較高[102]。另一方面,數(shù)量評估在海洋浮游動物生態(tài)學的研究中不可或缺,DNA宏條形碼技術如何做到對浮游動物生物量和豐度的準確量化是未來發(fā)展的重要目標。隨著高通量測序技術,定量PCR技術和生物信息學分析技術的進一步發(fā)展,覆蓋類群更廣泛的多基因片段組合條形碼的開發(fā)和測序質(zhì)量的提升,DNA宏條形碼技術結(jié)合跨學科的知識,將為海洋生態(tài)系統(tǒng)中浮游動物的多樣性和數(shù)量提供更準確的評估,在保護生態(tài)學、種群遺傳學及生物地理學等領域得到越來越廣泛的應用。