程佩琳 俞 丹 劉煥章 杜 浩 危起偉
(1. 中國水產(chǎn)科學(xué)研究院長江水產(chǎn)研究所, 農(nóng)業(yè)農(nóng)村部淡水生物多樣性保護(hù)重點(diǎn)實(shí)驗(yàn)室, 武漢 430223;2. 中國科學(xué)院水生生物研究所水生生物多樣性與保護(hù)重點(diǎn)實(shí)驗(yàn)室, 武漢 430072)
鱘形目魚類(Acipenseriformes), 隸屬于輻鰭魚亞綱(Subclasss Actinopterygii)、軟骨硬鱗魚下綱(Chondrostei), 是現(xiàn)生軟骨硬鱗魚類的代表類群[1]。除已絕跡的2個(gè)化石科類群(Chondrosteidae和Peipiaosteidae)外, 現(xiàn)生鱘形目魚類總計(jì)有2科6屬27個(gè)有效種[2—4]。作為最古老的魚類之一, 鱘類的化石記錄最早可追溯到2億年前的白堊紀(jì)時(shí)代, 因此鱘類在魚類乃至整個(gè)脊椎動(dòng)物進(jìn)化史上都占有極其重要的地位, 被譽(yù)為魚類的“活化石”[5,6]。
在過去的20多年中, 基于形態(tài)學(xué)特征及分子數(shù)據(jù)對(duì)鱘形目魚類的系統(tǒng)進(jìn)化關(guān)系進(jìn)行了廣泛探討,但仍未取得一致意見。特別是, 鱘科的內(nèi)部系統(tǒng)發(fā)育關(guān)系及鱘科的各個(gè)屬的單系性仍存有許多爭議。Birstein等[7]基于3個(gè)線粒體基因(Cytochromeb、12S rRNA和16S rRNA)首次較為完整地分析了鱘形目20個(gè)物種的系統(tǒng)發(fā)育關(guān)系, 發(fā)現(xiàn)鱘形目魚類的2個(gè)科, 匙吻鱘和鱘科是單系群。但鱘科內(nèi)部關(guān)系復(fù)雜, 鱘屬和鰉屬不是單系群; 鏟鱘屬是鱘科最原始的基部類群[7,8]。張四明等[9,10]采用2個(gè)線粒體基因(ND4L和ND4)對(duì)包括中國特有鱘類在內(nèi)的12種鱘形目魚類進(jìn)行了分子系統(tǒng)分析, 指出環(huán)太平洋地區(qū)的鱘科魚類可能有共同的起源。Ludwig等[11,12]基于22種鱘類的線粒體細(xì)胞色素b基因序列進(jìn)行了分子系統(tǒng)發(fā)育構(gòu)建, 顯示鏟鱘屬和尖吻鱘類為并系, 位于鱘科的基部位置; 并發(fā)現(xiàn)鱘科的部分魚類按生物地理分布區(qū)域進(jìn)行聚類, 首次提出鱘科內(nèi)部可以劃為大西洋鱘類和太平洋鱘類2個(gè)大類群。這一劃分得到之后的許多鱘類分子系統(tǒng)發(fā)育研究的支持[5,13]。Fontana等[14]回顧了早期的鱘類染色體核型和分子系統(tǒng)發(fā)育的研究結(jié)果, 基于18種鱘類的線粒體基因細(xì)胞色素b基因序列進(jìn)行了系統(tǒng)發(fā)育重建, 確認(rèn)了尖吻鱘類(大西洋鱘和尖吻鱘組成的單系群)是鱘科的基部類群。但Krieger等[15]基于25個(gè)鱘物種的5個(gè)線粒體基因(Cytochromeb、12S rRNA、Cytochromecoxidase subunit II、tRNA Asp和tRNA Phe)聯(lián)合數(shù)據(jù), 結(jié)果顯示鱘科魚類的基部類群仍無法確定, 可能是鏟鱘屬, 也可能是尖吻鱘類。Luo等[16]基于16種鱘類的30個(gè)單拷貝核基因序列聯(lián)合數(shù)據(jù), 分子系統(tǒng)分析認(rèn)為, 鱘科可以劃分為3個(gè)類群: 尖吻鱘類、太平洋鱘類和大西洋鱘類; 并確認(rèn)了尖吻鱘類為鱘科的基部類群。盡管早期鱘形目魚類形態(tài)分類與分子系統(tǒng)發(fā)育結(jié)果的差異很大, 但近些年的鱘形態(tài)分類學(xué)的研究也得到了新的進(jìn)展。Hilton等[17,18]對(duì)鱘類化石物種和現(xiàn)生種進(jìn)行了物種水平的形態(tài)學(xué)比較研究, 證據(jù)支持鱘屬不是單系群, 并定義了鱘科的2個(gè)新類群: 鰉科(Husinae)及擬鏟鱘科(Pseudoscaphirhynchinae)。因此, 鱘科的基部類群究竟是鏟鱘屬還是尖吻鱘類?鱘科的鱘屬和鰉屬的單系性是否有效? 及鱘科內(nèi)部的系統(tǒng)發(fā)育關(guān)系如何? 都是尚未解決的問題。
魚類線粒體基因組是一個(gè)15—20 kb的環(huán)狀雙鏈DNA分子, 通常編碼37個(gè)基因, 即13個(gè)蛋白質(zhì)編碼基因(PCGs)、22個(gè)轉(zhuǎn)運(yùn)RNA基因(tRNAs)和2個(gè)核糖體RNA基因(rrnL和rrnS)[19]。此外, 線粒體基因組通常還有2個(gè)負(fù)責(zé)復(fù)制和轉(zhuǎn)錄的非編碼區(qū)(OL和OH)。由于線粒體基因組具有母系遺傳、多拷貝、缺少遺傳重組及進(jìn)化速率快等特點(diǎn), 已廣泛應(yīng)用到系統(tǒng)發(fā)育重建、比較基因組學(xué)、譜系地理學(xué)及種群遺傳學(xué)等研究領(lǐng)域[20,21]。在過去的10年中, 魚類線粒體基因組研究受到了高度關(guān)注, 并由于高通量測序技術(shù)的廣泛應(yīng)用而使得已測線粒體基因組的魚類種類呈現(xiàn)快速增長的趨勢。目前, 線粒體基因組數(shù)據(jù)廣泛用于硬骨魚類不同分類階元的系統(tǒng)進(jìn)化關(guān)系研究[22,23]。然而, 鱘類中基于線粒體基因組數(shù)據(jù)的研究很少。一方面, 鱘類作為全球珍稀保護(hù)魚類, 廣泛分布在北半球, 樣本珍貴且難以收集; 另一方面, 不同的線粒體基因數(shù)據(jù)集的構(gòu)成, 不同的系統(tǒng)發(fā)育分析方法對(duì)系統(tǒng)發(fā)育的構(gòu)建的結(jié)果也存在影響。因此, 獲取更多的鱘線粒體基因組數(shù)據(jù), 特別是鱘屬魚類, 并比較分析不同系統(tǒng)發(fā)育分析方法在構(gòu)建鱘形目魚類的系統(tǒng)進(jìn)化關(guān)系方面的價(jià)值和潛力, 顯得非常必要。
本研究新測定了中華鱘(Acipenser sinensis)、長江鱘(A. dabryanus)、短吻鱘(A. brevirotrum)、納氏鱘(A. naccarii)、鰉(H. dauricus)和匙吻鱘(Polyodon spathula), 共計(jì)3屬6個(gè)種的線粒體基因組, 進(jìn)一步豐富了鱘形目魚類的線粒體基因組數(shù)據(jù)庫。在注釋這6種鱘的線粒體基因組基礎(chǔ)上, 聯(lián)合已有的17個(gè)鱘類的線粒體基因組, 基于5個(gè)線粒體基因組數(shù)據(jù)集(Pro、AA、2rRNA、Pro_2rRNA和Com_Mito), 采用2種方法(最大似然法和貝葉斯法)重新構(gòu)建了鱘形目的系統(tǒng)發(fā)育關(guān)系, 并采用似然值檢驗(yàn)對(duì)不同的樹拓?fù)浣Y(jié)構(gòu)進(jìn)行了評(píng)價(jià)。
本研究樣本均由中國水產(chǎn)科學(xué)研究院長江水產(chǎn)研究所荊州太湖基地提供, 包括3屬6種鱘形目魚類樣本(中華鱘、長江鱘、鰉、短吻鱘、納氏鱘和匙吻鱘)。本研究所涉及的動(dòng)物實(shí)驗(yàn)均得到中國水產(chǎn)科學(xué)研究院長江水產(chǎn)研究所實(shí)驗(yàn)動(dòng)物福利倫理委員會(huì)(編號(hào): YFI-001)批準(zhǔn)。收集樣本的新鮮血液或鰭條送至武漢天一輝遠(yuǎn)生物科技有限公司進(jìn)行測序。采用DNA提取試劑盒(天根生物, 北京)在提取總DNA后, 用Thermo Scientific NanoDrop 2000測定DNA濃度, 采用瓊脂糖電泳和Agilent 2100 Bioanalyzer檢測DNA完整性。采用全基因組鳥槍法(Whole Genome Shotgun, WGC)策略, 構(gòu)建400 bp文庫, 利用第二代測序技術(shù)(Next Generation Sequencing, NGS), 基于Illumia Miseq測序平臺(tái)進(jìn)行雙末端(Paired-end, PE)測序。采用A5-miseq v20150522[24]和SPAdes v3.9.0[25]對(duì)高質(zhì)量的二代測序數(shù)據(jù)進(jìn)行從頭拼裝, 構(gòu)建contig和Scaffold序列。根據(jù)拼接序列的測序深度提取序列, 將高測序深度的序列同NCBI(National Center for Biotechnology Information)的nt庫進(jìn)行blastn(BLAST v 2.2.31)比對(duì), 挑出各拼接結(jié)果的線粒體序列。將得到的線粒體拼接結(jié)果利用mummer v 3.1[26]軟件進(jìn)行共線性分析, 確定contig間的位置關(guān)系, 進(jìn)行contigs間gap填補(bǔ)。使用pilon v 1.1.8[27]軟件對(duì)結(jié)果進(jìn)行校正得到最終的完整線粒體基因組全序列。將拼接得到的完整線粒體基因組序列上傳至MITOS網(wǎng)頁服務(wù)器(http://mitos.bioinf.uni-leipzig.de/)進(jìn)行編碼基因, RNA和非編碼區(qū)的注釋[28]。密碼子選擇脊椎動(dòng)物數(shù)據(jù)庫,其余為默認(rèn)參數(shù)。采用軟件tRNAscan-SE 1.2.1[29]鑒定tRNA基因, 并預(yù)測其二級(jí)結(jié)構(gòu)。采用Mega 6.06[30]分析堿基組成和密碼子使用, 并計(jì)算AT-偏斜(AT-skew)和GC-偏斜(GC-skew)。
采用本研究新測的6種鱘的線粒體基因組全序列, 結(jié)合NCBI中已發(fā)表的17種鱘類的線粒體基因組進(jìn)行系統(tǒng)發(fā)育分析。通過軟件CLUSTAL X version 1.83[31]進(jìn)行序列的多重比對(duì)。為了明確線粒體數(shù)據(jù)集的構(gòu)成差異對(duì)系統(tǒng)發(fā)育結(jié)果的影響, 構(gòu)建了5個(gè)線粒體數(shù)據(jù)集: Pro(Combined 13 coding protein gene nucleotide sequences, 13個(gè)蛋白質(zhì)編碼基因核苷酸序列)、AA(Combined 13 protein coding gene amino acid sequence, 13個(gè)蛋白質(zhì)編碼基因氨基酸序列)、2 rRNA(Combined 2 rRNA nucleotide sequences, 2個(gè)rRNA聯(lián)合序列)、Pro_2 rRNA(Combined 13 coding protein gene and 2 rRNA gene nucleotide sequence, 13個(gè)蛋白編碼基因及2個(gè)rRNA聯(lián)合序列)和Com_Mito(Complete mitochondrial genome nucleotide sequences, 線粒體基因組核苷酸全序列)。其中1、2、3和4數(shù)據(jù)集均由單個(gè)蛋白質(zhì)編碼基因或者rRNA基因單獨(dú)比對(duì)。為了避免比對(duì)位點(diǎn)的偏倚, 排除模糊區(qū)域位點(diǎn)(包括蛋白質(zhì)編碼基因的起點(diǎn)和終點(diǎn)區(qū)域, 及rRNA序列中高度可變區(qū)域)使用軟件GBlocks 0.91b[32]進(jìn)行比對(duì)刪除。將比對(duì)好的單個(gè)蛋白質(zhì)編碼基因或者rRNA基因聯(lián)合在一起獲得目標(biāo)數(shù)據(jù)集。而5個(gè)線粒體基因組全序列則采用所有堿基無差別對(duì)待策略, 通過CLUSTAL進(jìn)行序列多重比對(duì)后, 采用GBlocks去除空位及模糊位點(diǎn), 最后基于比對(duì)刪除后得到的23種完整線粒體基因組數(shù)據(jù)的集合。對(duì)于這5個(gè)不同類型的數(shù)據(jù)集, 分別采用IQ-TREE web server[33](http://iqtree.cibiv.univie.ac.at/)的Model Finder[34]選擇序列的最佳分區(qū)及最優(yōu)堿基/氨基酸替代模型檢測, 并應(yīng)用于后續(xù)系統(tǒng)發(fā)育分析。對(duì)不同數(shù)據(jù)集分別使用IQTREE的Tree Inference[35]構(gòu)建最大似然(ML)樹, 采用對(duì)應(yīng)的最佳分區(qū)模式及進(jìn)化模型, 選擇超快自展法(Ultrafast bootstraping)[36]構(gòu)建ML樹, 節(jié)點(diǎn)可靠性采用1000次的bootstrap進(jìn)行評(píng)估。貝葉斯BI分析采用軟件Mrbayes 3.2.2[37]進(jìn)行, 基于貝葉斯信息準(zhǔn)則(BIC)選擇最優(yōu)堿基替換模型。根據(jù)結(jié)果設(shè)置模型參數(shù), 然后再運(yùn)行4條獨(dú)立的馬爾可夫鏈(Markov chains), 即3條熱鏈(Hot chain)和1條冷鏈(Cold chain)同時(shí)運(yùn)行6千萬代(Generation)。每運(yùn)行100代抽樣1次, 當(dāng)運(yùn)行結(jié)束時(shí)顯示“分列頻率平均標(biāo)準(zhǔn)差”(Average standard deviation of split frequencies)小于0.01即認(rèn)為分析趨于穩(wěn)定狀態(tài)。舍去25%的老化樣本, 再由剩余樹產(chǎn)生多數(shù)一致樹, 并計(jì)算貝葉斯后驗(yàn)概率。
由于不同的數(shù)據(jù)集及樹構(gòu)建方法獲得的鱘形目的系統(tǒng)發(fā)育關(guān)系存在不一致性, 因此為了明確哪種系統(tǒng)發(fā)育樹值得信任, 進(jìn)一步采用了IQ-TREE web server的Tree topology evaluation and tests進(jìn)行樹拓?fù)浣Y(jié)構(gòu)檢驗(yàn)。對(duì)于5個(gè)數(shù)據(jù)集, 分別采用SH(Shimodaira-Hasegawa test)[38]、WKH(Weighted Kishino-Hasegawa test)[39]、WSH(Weighted SH test)[38]和AU(Approximately unbiased test)[40]共4種方法進(jìn)行統(tǒng)計(jì)分析, 并設(shè)置1000次重復(fù)。其結(jié)果順序在擴(kuò)展名為iqtree的文件中給出, 一般認(rèn)為SH-aLRT≥80%且ultrafast bootstrap value ≥95%的節(jié)點(diǎn)可信賴。
通過測序組裝, 我們獲得了中華鱘、長江鱘、短吻鱘、納氏鱘、鰉和匙吻鱘的完整線粒體基因組(GenBank登錄號(hào): MK078260-MK078265)。新測的6種鱘的線粒體基因組均顯示是典型的閉合環(huán)狀雙鏈DNA分子, 總長度為16439—16766 bp, 編碼37個(gè)線粒體基因, 即13個(gè)PCGs、22個(gè)tRNAs和2個(gè)rRNAs, 及非編碼控制區(qū)(OH區(qū))和輕鏈復(fù)制起始區(qū)(OL區(qū))。只有8個(gè)tRNA和ND6基因在L鏈上編碼,其余多數(shù)基因均在H鏈上編碼, 且基因排序與魚類線粒體基因的原始排序完全一致。
新測的6種鱘顯示鱘類的基因組結(jié)構(gòu)較為緊湊。以中華鱘為例, 統(tǒng)計(jì)共有15處堿基間隔區(qū), 間隔堿基數(shù)為1—395 bp; 有9處堿基重疊區(qū), 重疊堿基數(shù)為1—10 bp。其中有3對(duì)蛋白質(zhì)編碼基因的開放閱讀框存在堿基重疊, 包括ATP8-ATP6、Nad4LNad4和Nad5-Nad6分別重疊10、7和4 bp?;蜷g既沒有間隔又無重疊的基因?qū)?5處。其余物種的線粒體基因組特征同中華鱘類似。
6種鱘的堿基組成顯示具有一定的A+T偏向性,同時(shí)還呈現(xiàn)出較強(qiáng)的A堿基和C堿基偏好。以中華鱘為例, 線粒體全基因組的堿基A、C、G和T含量分別為30.17%、29.51%、16.47%和23.85%。其中A+T含量(54.02%)大于G+C含量(45.98%), 表明存在一定的A+T偏向性, 這與其他脊椎動(dòng)物的線粒體基因組特征類似。而且, 除ND6基因外, 線粒體基因組基因都表現(xiàn)出一定的A+T偏向性, 其中ATP 8基因的A+T偏向性最高(60.12%)。因?yàn)镹D6基因以L鏈為反義鏈, 所以密碼子第三位G比重較大, 因而整個(gè)基因的T+G含量很高(76.82%), 這與脊椎動(dòng)物的線粒體基因組的情況是相似的。6個(gè)鱘的線粒體全基因組的AT-偏斜均為正值(0.109—0.126), 而GC-偏斜為負(fù)值(–0.284—0.316), 這與其他脊椎動(dòng)物的線粒體基因組核苷酸偏斜的規(guī)律一致(表 1)。在6種鱘中, 匙吻鱘的線粒體基因核苷酸偏斜值最大, AT-偏斜為0.126, GC-偏斜為–0.316。
表 1 新測6種鱘形目魚類的線粒體基因組長度及堿基組成Tab. 1 Total length and base composition of mitochondrial genomes of six sequenced Acipenseriforme fishes
6種新測鱘的線粒體基因組高的A+T含量及不同鏈上核苷酸的偏斜性, 也反映在蛋白質(zhì)編碼基因的密碼子使用上。相對(duì)同義密碼子使用頻率(Relative synonymous codon usage, RSCU)分析表明, 所有蛋白質(zhì)編碼基因的密碼子使用都存在較強(qiáng)的偏好性, NNA或NNC(即第三位點(diǎn)為C的密碼子)的RSCU都大于1, 使用頻率較高。6種鱘的基因組的這種密碼子的使用模式, 與已測其他鱘的高度相似。
在6種鱘的13個(gè)蛋白質(zhì)編碼基因中, 起止密碼子均為TAG或GTG, 其余12個(gè)蛋白質(zhì)編碼基因的起始密碼子均以ATG開始, 僅COXI基因以GTG開始。終止密碼子為TAA、TAG或T--, 其中COXII、ND4和Cytb基因以不完全密碼子T--終止, 而ND1、ND2、COXI、ND3和ND6基因以完整密碼子TAG終止, ATP8、ATP6、COXIII、ND4L和ND5基因以完全密碼子TAA終止。不完全的終止密碼子在魚類線粒體基因組是普遍存在的特征。tRNAscan-SE分析顯示, 6種鱘的22個(gè)線粒體tRNAs基因均具有經(jīng)典的三葉草結(jié)構(gòu)。
基于5個(gè)數(shù)據(jù)集(Pro、AA、Pro_2 rRNA、2 rRNA和Com_Mito)和2種系統(tǒng)發(fā)育分析方法(ML和Bayes)總共獲得了10個(gè)系統(tǒng)發(fā)育樹(圖 1)。盡管這10個(gè)系統(tǒng)發(fā)育樹的拓?fù)浣Y(jié)構(gòu)不完全一致, 但均高度支持匙吻鱘科和鱘科的單系性(表 2)。Pro_2rRNA和Com_Mito兩個(gè)數(shù)據(jù)集的BI和ML的拓?fù)浣Y(jié)構(gòu), 及Pro數(shù)據(jù)集的BI樹的拓?fù)浣Y(jié)構(gòu)完全一致, 即5個(gè)系統(tǒng)發(fā)育樹的結(jié)果完全一致。分子系統(tǒng)發(fā)育重建的結(jié)果顯示(圖 1), 匙吻鱘科為單系(BI:1.00/MP:100), 包括匙吻鱘屬和白鱘屬2個(gè)單屬單種。鱘科為單系(BI:1.00/MP:100), 但鱘屬和鰉屬的物種不構(gòu)成單系群。鱘科按系統(tǒng)發(fā)育結(jié)果可以分為3個(gè)單系類群。鱘科的基部類群是由歐洲大西洋鱘(A. sturio)和尖吻鱘(A. oxyrinchus)構(gòu)成的尖吻鱘類(A. sturio-A.oxyrinchusclade), 具有極高的節(jié)點(diǎn)支持率(BI:1.00/MP:100)。其余鱘科魚類可以分為2個(gè)大的單系類群: 大西洋鱘類(Atlantic clade)和太平洋鱘類(Pacific clade)。其中大西洋鱘類由3個(gè)鏟鱘屬物種、歐鰉及9個(gè)鱘屬物種構(gòu)成。鏟鱘屬顯示是大西洋鱘類的基部類群。太平洋鱘類由鰉和7個(gè)鱘屬物種構(gòu)成。3個(gè)BI樹的結(jié)果完全一致, 且節(jié)點(diǎn)支持率極高(BI>0.95), 僅一處節(jié)點(diǎn)支持率較低。而2個(gè)ML樹中節(jié)點(diǎn)支持率低于90的共計(jì)有2處。
圖 1 基于23種鱘形目魚類的線粒體全基因組(Com_Mito)構(gòu)建的貝葉斯法和最大似然法的系統(tǒng)發(fā)育樹(節(jié)點(diǎn)前數(shù)字表示BI后驗(yàn)支持率及ML自展數(shù))Fig. 1 Baysian and ML phylogenetic tree based on 23 complete mitochondrial genomes nucleotide sequences
Pro數(shù)據(jù)集的ML樹僅有一處不同于BI樹, 位于大西洋鱘類內(nèi)部的閃光鱘(A.stellatus)位置上(BI:40)。這表明, 盡管最大似然法在系統(tǒng)發(fā)育分析中得到廣泛應(yīng)用, 但在構(gòu)建某些類群的系統(tǒng)發(fā)育關(guān)系方面有時(shí)表現(xiàn)欠佳, 這與其他已有研究結(jié)果一致。2 rRNA數(shù)據(jù)集的BI和ML樹的結(jié)果一致, 支持鏟鱘屬為鱘科的基部類群(BI:1.00/ML:100), 然后是尖吻鱘類(BI:0.52/ML:65)。其余鱘科魚類可以分為2個(gè)單系群(BI:0.31/ML: 36)。AA數(shù)據(jù)集的BI和ML結(jié)果顯示, 支持尖吻鱘類是鱘科的基部類群(BI:1.00/ML:100), 其余鱘科魚類可以分為2個(gè)單系群(BI:0.98/ML:54)。
綜合比較10個(gè)系統(tǒng)發(fā)育樹發(fā)現(xiàn)(表 2), 核苷酸數(shù)據(jù)與氨基酸數(shù)據(jù)相比, 表現(xiàn)出更好的系統(tǒng)發(fā)育信息。而與13個(gè)蛋白質(zhì)編碼基因聯(lián)合序列或者2個(gè)rRNA基因聯(lián)合序列相比, 蛋白質(zhì)編碼基因和2個(gè)rRNA基因聯(lián)合序列, 及線粒體基因組全序列2個(gè)數(shù)據(jù)集的結(jié)果具有一致且極高的節(jié)點(diǎn)支持率, 這表明完整的線粒體基因組數(shù)據(jù)更有助于解決鱘形目的系統(tǒng)發(fā)育關(guān)系。
表 2 不同數(shù)據(jù)集、不同方法獲得的鱘形目魚類的系統(tǒng)發(fā)育結(jié)果Tab. 2 Phylogenetic relationships within order Acipenseriforme based on different dataset
按照鱘形目的系統(tǒng)發(fā)育關(guān)系, 本研究的10個(gè)系統(tǒng)發(fā)育樹共有5種不同的樹拓?fù)浣Y(jié)構(gòu)。樹拓?fù)浣Y(jié)構(gòu)檢驗(yàn)結(jié)果表明, 基于5個(gè)數(shù)據(jù)集的樹拓?fù)浣Y(jié)構(gòu)檢驗(yàn),獲得了高度一致的結(jié)果, 均支持Pro_2 rRNA和Com_Mito兩個(gè)數(shù)據(jù)集的BI和ML的系統(tǒng)發(fā)育關(guān)系(表 3)。系統(tǒng)發(fā)育結(jié)果表明, 鱘科的基部位置有2種情況: (1)拓?fù)浣Y(jié)構(gòu)檢驗(yàn)支持率最高的是尖吻鱘類為基部類群, 這與Fontana等[14]為代表的研究結(jié)果是一致的。(2)鏟鱘屬為鱘科的基部類群, 拓?fù)浣Y(jié)構(gòu)檢驗(yàn)支持度較低, 但早期的研究如Birstein等[7,8]也曾發(fā)現(xiàn)該系統(tǒng)發(fā)育關(guān)系。基于相同數(shù)據(jù)集的SH檢驗(yàn)結(jié)果表明, 尖吻鱘類為鱘科的基部類群; 鏟鱘屬與歐鰉, 及里海區(qū)鱘類共同構(gòu)成大西洋鱘類。
回顧鱘形目魚類的分子系統(tǒng)發(fā)育研究, 不同的研究在數(shù)據(jù)集構(gòu)成, 分析方法及物種選擇數(shù)量等方面存在差異, 推測這可能是導(dǎo)致鱘形目魚類不同研究的分子系統(tǒng)發(fā)育結(jié)果不一致的主要原因。鱘形目魚類目前現(xiàn)生種總計(jì)有27種, 本研究共收集23種,覆蓋率達(dá)85.2%。本研究結(jié)果表明, 鱘形目魚類包括匙吻鱘科和鱘科2個(gè)單系群。鱘科內(nèi)部關(guān)系復(fù)雜,鱘屬和鰉屬不是單系群。鱘科的基部類群為尖吻鱘類, 其余19種鱘科魚類可以分為大西洋鱘類和太平洋鱘類。這與多數(shù)前人的鱘類分子系統(tǒng)發(fā)育研究結(jié)果是一致的[11,12,14,16]。大西洋鱘類包括12個(gè)鱘科物種, 其中鏟鱘屬3種、鰉屬1種和鱘屬8種。值得注意的是, 本研究首次顯示鏟鱘屬為大西洋鱘類的基部類群。這與Dillman等[41]的推測是吻合的。Dillman等[41]基于2個(gè)線粒體基因(Cytb和控制區(qū)片段)對(duì)鏟鱘亞科進(jìn)行分子系統(tǒng)發(fā)育重建, 結(jié)果顯示鏟鱘亞科單系性被拒絕, 擬鏟鱘屬與閃光鱘有更近的親緣關(guān)系, 并推測鏟鱘屬與鱘屬物種的親緣關(guān)系更近。太平洋區(qū)類群共7個(gè)鱘科物種, 包括鰉屬1種和鱘屬6種。其中達(dá)烏爾鰉、中吻鱘、長江鱘、中華鱘和施氏鱘, 均屬于亞洲特有物種。而分布在中國的長江鱘, 及分布在東太平洋區(qū)的高首鱘, 被認(rèn)為可能是淡水陸封種。
表 3 系統(tǒng)發(fā)育樹拓?fù)浣Y(jié)構(gòu)檢驗(yàn)結(jié)果Tab. 3 Results of topological tests for five phylogenetic trees
本研究沒有覆蓋的鱘物種有4種, 包括擬鏟鱘屬(Pseudoscaphirhynchus)的3個(gè)物種和鱘屬的波斯鱘(A. persicus)。已有的形態(tài)學(xué)及分子生物學(xué)的證據(jù)表明, 擬鏟鱘屬與閃光鱘有很近的親緣關(guān)系[16,17,41],因此建議將擬鏟鱘屬和閃光鱘共同列入大西洋鱘類。綜合考慮到現(xiàn)有鱘形目魚類的分子系統(tǒng)發(fā)育結(jié)果同形態(tài)學(xué)結(jié)果仍有許多不一致, 未來仍需要聯(lián)合形態(tài)學(xué)數(shù)據(jù)進(jìn)行綜合分析, 可為鱘形目魚類的分類, 尤其是鱘科的屬的分類及屬間親緣關(guān)系提供新的認(rèn)識(shí)。
本研究新測定了包括中華鱘、長江鱘、短吻鱘、納氏鱘、鰉和匙吻鱘在內(nèi)的6種鱘的線粒體基因組全序列, 基因含量、基因排序、堿基組成、密碼子使用模式及tRNA二級(jí)結(jié)構(gòu)等與大部分已測鱘類高度相似?;?個(gè)線粒體基因組數(shù)據(jù)集及2種樹構(gòu)建方法的系統(tǒng)發(fā)育分析結(jié)果表明, 鱘科的基部類群是尖吻鱘類, 其余鱘科魚類可以劃分為大西洋鱘類和太平洋鱘類2個(gè)生物地理類群。鱘科的系統(tǒng)發(fā)育關(guān)系為(尖吻鱘類(太平洋鱘類(鏟鱘屬(歐鰉,里海區(qū)鱘類))))。盡管線粒體數(shù)據(jù)集的構(gòu)成及系統(tǒng)發(fā)育分析方法對(duì)樹拓?fù)浣Y(jié)構(gòu)具有一定影響, 但線粒體全基因組數(shù)據(jù)在解決鱘形目魚類的系統(tǒng)發(fā)育關(guān)系上顯示出重要的系統(tǒng)發(fā)育信息價(jià)值。