陳 燕
(《南方農(nóng)業(yè)學(xué)報(bào)》編輯部,廣西 南寧 530007)
自沃森和克里克提出 DNA分子的雙螺旋結(jié)構(gòu)模型以來,人類逐漸意識(shí)到這支強(qiáng)大的“分子部隊(duì)”在各種生物體中的強(qiáng)大指揮能力。人類根據(jù)“分子部隊(duì)”的作戰(zhàn)策略和規(guī)律建立了許多強(qiáng)大的生物技術(shù),如基因工程、細(xì)胞工程、酶工程等,這些技術(shù)賦予人類改造生命,甚至創(chuàng)造生命的能力。近十幾年來在我國高度重視生物技術(shù)發(fā)展,并從政策、環(huán)境方面采取了多項(xiàng)有效措施來推動(dòng)生物技術(shù)及其產(chǎn)業(yè)的發(fā)展。隨著現(xiàn)代生物技術(shù)快速發(fā)展,分子生物學(xué)研究已然成為前沿和熱點(diǎn),已在醫(yī)療、農(nóng)業(yè)、食品加工等多個(gè)領(lǐng)域占據(jù)舉世矚目的地位,發(fā)表的相關(guān)論文如雨后春筍般席卷各大科技期刊雜志。筆者在編校過程中發(fā)現(xiàn)此類稿件常存在意思相近的專業(yè)術(shù)語誤用的現(xiàn)象,如同源性、相似性、一致性3個(gè)術(shù)語常在描述基因(或蛋白)序列結(jié)果時(shí)出現(xiàn)混用;轉(zhuǎn)化、轉(zhuǎn)導(dǎo)、轉(zhuǎn)染 3個(gè)術(shù)語在描述基因?qū)胧荏w細(xì)胞時(shí)出現(xiàn)誤用。此外,分子生物學(xué)稿件還存在基因符號(hào)和工具酶正斜體且大小寫不規(guī)范、引物序列方向和酶切位點(diǎn)未標(biāo)出、PCR反應(yīng)體系和擴(kuò)增程序信息不全、微生物學(xué)名未遵循物種命名原則規(guī)范表達(dá);系統(tǒng)發(fā)育進(jìn)化樹缺少基因(或蛋白)編號(hào)(ID)信息等編排問題。經(jīng)調(diào)查發(fā)現(xiàn),這些問題廣泛存在于生物學(xué)、農(nóng)學(xué)、醫(yī)學(xué)等科技期刊中,不利于研究成果的推廣及學(xué)術(shù)交流。雖然部分問題已有相關(guān)研究報(bào)道,但近年來上述問題仍屢見不鮮。因此,文章對(duì)上述分子生物學(xué)文稿中的常見問題進(jìn)行綜述,并提出建議,以期為分子生物學(xué)文稿的撰寫及編排提供參考。
目前,分子生物學(xué)研究中常通過基因核苷酸序列或蛋白氨基酸序列比對(duì)衡量分子之間的相似性程度和同源的可能性,從而進(jìn)行物種親緣關(guān)系分析,主要使用同源性(Homology)、相似性(Similarity)和一致性(Identity)反映序列比對(duì)結(jié)果。三者表達(dá)意思相近,但用法存在本質(zhì)區(qū)別。雖然宋亞珍等[1]于2008年對(duì)這3個(gè)詞進(jìn)行了辨析,但近年刊發(fā)的文獻(xiàn)仍存在誤用現(xiàn)象,尤其是對(duì)相似性和一致性的使用仍存在誤區(qū),因此筆者通過查閱近年分子生物學(xué)相關(guān)書籍,結(jié)合全國科學(xué)技術(shù)名詞審定委員的術(shù)語在線,從理論和實(shí)例角度進(jìn)行補(bǔ)充和完善。
首先,分析同源性與相似性、一致性的區(qū)別和聯(lián)系。同源性是定性的推斷(表示序列是否同源),沒有程度之分,要么為同源的,要么為非同源性的,而一致性和相似性則是數(shù)量的推斷(表示序列相關(guān)程度),均屬于同源性的量化指標(biāo),不用考慮比對(duì)序列的起源[2]。如果兩個(gè)序列的一致性和相似性較低,可初步推測(cè)兩者是非同源的,但存在不確定性。即使兩個(gè)序列核苷酸(或氨基酸)的一致性較低,兩者也可能是同源的,例如球蛋白家族成員都是同源的,但部分成員如人類的β球蛋白和腦紅蛋白在進(jìn)化過程中發(fā)生了很大分化,兩者的氨基酸序列相似性僅為22%,但它們?nèi)允峭葱蛄衃2]。間接說明不能僅憑一致性和相似性的高低,判斷序列是否同源,而且即使兩個(gè)序列為同源序列也不代表兩者具有相同的功能。由于同源性沒有程度之分,故同源性不能用具體數(shù)據(jù)來表示,如“番茄SlGT-33基因與黃瓜CsGT-33基因的核苷酸序列同源性為50%”,為錯(cuò)誤表述,也不可表述為“這些序列高度同源”。綜上所述,判定兩條序列為“同源基因(或蛋白)”,或者“有同源性”等結(jié)論,必須在共同祖先或共同始祖分子的前提下,不能僅憑一致性和相似性來判定,而同源性也不能判定序列的功能是否相同。
其次,分析相似性和一致性的區(qū)別和聯(lián)系。研究者僅憑肉眼一一對(duì)應(yīng)比對(duì)兩條系列的核苷酸(或氨基酸)是不切實(shí)際的,且匹配成功率也會(huì)不高,必須借助計(jì)算機(jī)來完成比對(duì),而且允許比對(duì)中有空位出現(xiàn)以表示序列中出現(xiàn)刪除和插入,即通過調(diào)整兩條序列的排列方式已達(dá)到最大程度一致性的過程[2],那么匹配成功率可能會(huì)大幅上漲。例如,對(duì)2個(gè)蛋白的200個(gè)氨基酸殘基進(jìn)行比對(duì),結(jié)果發(fā)現(xiàn)有40個(gè)氨基酸殘基匹配,即氨基酸殘基相同,那么可以得出這兩個(gè)蛋白的一致性為20%。因此,一致性是指相同氨基酸(或核苷酸)總數(shù)占比對(duì)序列的氨基酸(或核苷酸)總數(shù)的百分比,用于表示兩條氨基酸(或核苷酸)序列發(fā)生變化的程度或簡(jiǎn)單一致程度,不考慮比對(duì)序列的起源和功能。序列比對(duì)的結(jié)果另一種計(jì)算方式是統(tǒng)計(jì)相同氨基酸和相似氨基酸總數(shù)占比對(duì)序列的氨基酸總數(shù)的百分比表示,稱為相似性[2-3]。相似氨基酸是指分子結(jié)構(gòu)和氨基酸相似,如天冬氨酸和谷氨酸均屬于酸性氨基酸;絲氨酸和蘇氨酸均屬于羥基化氨基酸;色氨酸、酪氨酸、苯丙氨酸等均屬于疏水氨基酸[2]。例如,對(duì)2個(gè)蛋白的200個(gè)氨基酸殘基進(jìn)行比對(duì),結(jié)果發(fā)現(xiàn)有40個(gè)氨基酸殘基相同,有60個(gè)氨基酸相似,那么可得出這兩個(gè)蛋白的相似性為50%。該數(shù)值反映比對(duì)序列間生物學(xué)功能或特點(diǎn)的趨同程度,可不考慮序列的具體起源,一般來說序列相似性越高,說明序列的生物學(xué)功能或結(jié)構(gòu)特點(diǎn)越相似[4]。綜上所述,一致性和相似性均用具體百分?jǐn)?shù)表示,不用考慮比對(duì)序列的起源,可間接衡量物種間的同一關(guān)系,但計(jì)算公式不一樣,如果把每個(gè)氨基酸(或核苷酸)當(dāng)做1個(gè)字符,計(jì)算公式表示如下:
轉(zhuǎn)化(Transformation)、轉(zhuǎn)導(dǎo)(Transduction)和轉(zhuǎn)染(Transfection)是分子生物學(xué)試驗(yàn)常用的專業(yè)術(shù)語。筆者在編校對(duì)過程中發(fā)現(xiàn)這3個(gè)詞錯(cuò)誤使用頻率較高。①轉(zhuǎn)化:是指外源遺傳物質(zhì)(如質(zhì)粒DNA等)進(jìn)入細(xì)菌,引起細(xì)菌遺傳變化的現(xiàn)象,但外源DNA并不整合到宿主基因組上;用病毒、化學(xué)致癌物或X射線誘發(fā)培養(yǎng)的細(xì)胞發(fā)生遺傳變異的現(xiàn)象,使細(xì)胞喪失接觸抑制等特性[4-5],而在基因工程中是將攜帶目的基因的質(zhì)?;虿《据d體導(dǎo)入感受態(tài)宿主細(xì)胞的一種重要手段,常用于DNA重組[6-7]。②轉(zhuǎn)導(dǎo):是指借助病毒、噬菌體或其他方法將外源DNA導(dǎo)入細(xì)胞并整合到宿主基因組上的方法,使其遺傳組成發(fā)生相應(yīng)的變化[2]。在基因工程中常通過病毒或病毒載體轉(zhuǎn)導(dǎo)外源基因[6-7]。③轉(zhuǎn)染:起初指外源基因通過病毒或噬菌體感染細(xì)胞或個(gè)體的過程,現(xiàn)在常泛指外源DNA(包括裸DNA)進(jìn)入真核細(xì)胞或個(gè)體導(dǎo)致遺傳改變的過程[7-8],轉(zhuǎn)染的主要方法有電轉(zhuǎn)、瞬時(shí)轉(zhuǎn)染、穩(wěn)轉(zhuǎn)、磷酸鈣轉(zhuǎn)染等[6-7]。綜上所述,三者的區(qū)別在于轉(zhuǎn)化是向原核細(xì)胞中導(dǎo)入外源DNA,但不整合到宿主上;轉(zhuǎn)導(dǎo)是通過病毒、噬菌體或其他方法將外源DNA導(dǎo)入真核/原核細(xì)胞并整合到宿主基因組;轉(zhuǎn)染是主動(dòng)或被動(dòng)向真核細(xì)胞中導(dǎo)入外源DNA。三者存在本質(zhì)不同,不可混用。
目前學(xué)術(shù)界對(duì)表示某基因的字母符號(hào)用斜體,其表達(dá)產(chǎn)物(即編碼的蛋白)符號(hào)用正體表示是比較認(rèn)可的[9]。如玉木耳(Auricularia cornea)漆酶基因符號(hào)為Aclac,其編碼的蛋白符號(hào)為AcLAC[10]。其中Ac為玉木耳拉丁名的英文縮寫(即取屬名和種加詞的第一個(gè)字母),lac則表示漆酶基因(Laccase)的縮寫。同理,朱紅密孔菌(Pycnoporus cinnabarinus)漆酶基因表示為Pclac。因此,學(xué)術(shù)界為了區(qū)分同一物種相同基因,常使用“物種拉丁名屬名和種加詞的第一個(gè)字母+酶基因名稱(縮寫)”的命名方法,如黃獨(dú)赤霉素受體基因表示為DbGID1。但目前對(duì)字母后的阿拉伯?dāng)?shù)字和羅馬數(shù)字編排成正體還斜體尚存爭(zhēng)議,也沒有國家標(biāo)準(zhǔn)和行業(yè)標(biāo)準(zhǔn)可以遵循,造成目前國內(nèi)期刊中基因符號(hào)編排格式不統(tǒng)一[11]。但國內(nèi)外具有較大影響力的科技期刊中,大部分期刊將基因符號(hào)的所有組成部分用斜體表示?!禩IG遺傳命名指南》[12-13]規(guī)定不同物種基因符號(hào)字母的大小寫應(yīng)根據(jù)具體物種而定,并不是統(tǒng)一的,如微生物中的細(xì)菌和真菌基因用小寫字母表示;植物物種不同,基因符號(hào)字母的大小寫也不同。因此,判斷基因符號(hào)大小寫時(shí),首先分析此基因的物種來源,然后查閱《TIG遺傳命名指南》判斷基因符號(hào)中字母大小寫。此外,很多期刊中基因還存在重組載體(質(zhì)粒)中基因符號(hào)用正體的現(xiàn)象。如“將重組表達(dá)載體pET28a-Aclac轉(zhuǎn)化大腸桿菌BL21(DE3)感受態(tài)細(xì)胞”,pET28a-Aclac應(yīng)改為pET28a-Aclac。
引物是人工合成的兩條寡核苷酸序列,其功能是作為核苷酸聚合作用的起始點(diǎn),DNA聚合酶可由其3′端開始合成新的核酸鏈[14]。引物設(shè)計(jì)是PCR擴(kuò)增成功與否的關(guān)鍵。在設(shè)計(jì)引物時(shí),如果克隆的序列只用于序列分析,可不設(shè)計(jì)酶切位點(diǎn),但如果PCR產(chǎn)物連接至載體,則須在5′端添加酶切位點(diǎn)[3,6-7,14-17]。因此,撰寫論文時(shí)應(yīng)標(biāo)明正反引物的方向和限制性酶切位點(diǎn),如克隆ARF21基因的引物可表示為 F:5'-GAATTCGAGCAGGGTGCTCCTGAG-3'(下劃線為EcoR I酶切位點(diǎn));R:5'-GCGGCCGCCAGCTGGGCCAGCTTCCG-3'(下劃線為NotI酶切位點(diǎn))。但目前很多已刊發(fā)的文獻(xiàn)中未標(biāo)明引物方向或酶切位點(diǎn),僅表示為 F:GAATTCGAGCAGGGTGCTCCTGAG;R:GCGGCCGCCAGCTGGGCCAGCTTCCG。這樣不能為讀者提供更多參考信息,大大降低了參考價(jià)值,因此撰寫論文時(shí)應(yīng)標(biāo)注引物方向及酶切位點(diǎn)。
PCR反應(yīng)體系主要由緩沖液、脫氧核糖核苷三磷酸(dNTPs)、DNA聚合酶、引物和模板等構(gòu)成。各成分的加入量直接影響試驗(yàn)的成敗。如DNA模板和DNA聚合酶加入量過高,均會(huì)引起非特異性擴(kuò)增,加入量過少則造成特異性產(chǎn)物較少,不易被檢測(cè)出;dNTPs加入量過高,則會(huì)與Mg2+結(jié)合,降低Mg2+的濃度,加入量過少則造成特異性產(chǎn)物較少;Mg2+濃度過高,反應(yīng)特異性降低,易出現(xiàn)非特異擴(kuò)增,濃度過低,會(huì)降低DNA聚合酶的活性,使反應(yīng)產(chǎn)物減少[18-19]。筆者在送稿件進(jìn)行同行專家評(píng)審時(shí),經(jīng)常收到審稿專家提出PCR反應(yīng)體系和擴(kuò)增程序信息不全的反饋意見。筆者調(diào)查發(fā)現(xiàn)該問題也同樣出現(xiàn)在很多科技期刊中。其中,反應(yīng)體系的主要問題是未寫清楚成分的濃度(或質(zhì)量濃度),如 50.0 μL反應(yīng)體系包括 10×KOD Neo Buffer 5.0 μL,MgSO43.0 μL,dNTPs 2.0 μL,正、反向引物各 1.5 μL,cDNA 模板 2.0 μL,KOD-PLUS-Neo 1.0 μL,ddH2O補(bǔ)足至50.0 μL。對(duì)于讀者來說,這樣寫基本沒有參考價(jià)值,無法推算出各成分在反應(yīng)體系中的具體含量。編輯審稿時(shí)應(yīng)提醒作者提供各成分的初始濃度(或初始質(zhì)量濃度),如 50.0 μL 反應(yīng)體系:10×KOD Neo Buffer 5.0 μL,25 mmoL/L 的 MgSO43.0μL,2 mmoL/L dNTPs 2.0 μL,10 μmoL/L 的正、反向引物各 1.5 μL,100 ng/μL 的 cDNA 模板2.0 μL,1.0 U/μL 的 KOD-PLUS-Neo 1.0 μL,ddH2O 補(bǔ)足至 50.0 μL[19]。也可直接標(biāo)明各成分的終濃度(或終質(zhì)量濃度),如 50.0 μL反應(yīng)體系包括10×KOD Neo Buffer 5.0 μL,MgSO4終濃度15 mmoL/L,dNTPs終濃度0.08 mmoL/L,正、反向引物終濃度0.3 μmoL/L,cDNA終質(zhì)量濃度4 ng/μL,KOD-PLUS-Neo終濃度0.02 U/μL,ddH2O補(bǔ)足至50.0 μL。但目前大多數(shù)期刊主要采用標(biāo)明各成分的初始濃度(或初始質(zhì)量濃度)和體積的方法,其原因是各成分的終濃度(或終質(zhì)量濃度)需要換算,比較麻煩,直接標(biāo)明各成分的初始濃度(或初始質(zhì)量濃度)和體積更方便,不容易出錯(cuò)。
PCR擴(kuò)增程序涉及預(yù)變性、變性、退火和延伸的溫度和時(shí)間等參數(shù),其表述方式在各期刊存在異同,主要依靠標(biāo)點(diǎn)符號(hào)和文字進(jìn)行表述,如普通PCR擴(kuò)增程序表示為:98 ℃預(yù)變性5 min;98 ℃變性30 s,60 ℃退火30 s,72 ℃延伸60 s,進(jìn)行36個(gè)循環(huán);72 ℃延伸2 min,還有部分文獻(xiàn)采用列表或繪圖的方式表示。上述這些方式均可清楚反映PCR擴(kuò)增程序。但還有部分文稿中僅提供了退火溫度,其原因是認(rèn)為退火溫度是PCR擴(kuò)增是否成功的關(guān)鍵因素,其他因素不重要,可寫可不寫。但事實(shí)并非如此,PCR擴(kuò)增程序的各項(xiàng)參數(shù)設(shè)置與具體試驗(yàn)對(duì)象息息相關(guān),不是一成不變的。如變性時(shí)間一般為30 s,如果模板GC含量較高,或用細(xì)胞為模板時(shí),變性時(shí)間應(yīng)適當(dāng)延長(zhǎng);延伸時(shí)間由擴(kuò)增目的片段的長(zhǎng)度決定,目的片段越長(zhǎng),延伸時(shí)間也越長(zhǎng);循環(huán)次數(shù)則主要取決于模板的起始數(shù)量(即初始質(zhì)量)[3,6-7,19],由于試驗(yàn)對(duì)象、人為試驗(yàn)操作或試劑等因素的差異均會(huì)造成獲得模板的初始質(zhì)量濃度不一致,添加的體積要根據(jù)模板的初始質(zhì)量而定。因此,編輯審稿時(shí)應(yīng)盡量讓作者補(bǔ)充這些參數(shù)信息,以便提供給讀者更多參考信息,畢竟科技論文的發(fā)表不僅是為了傳播科技成果,還要為讀者今后的深入研究提供參考。
工具酶是分子生物學(xué)研究不可缺少的工具,其中,使用頻率最高的是DNA聚合酶、DNA連接酶和限制性內(nèi)切酶。雖然張志鈺[21]、王連芬等[22]、賀窯青[23]已進(jìn)行研究報(bào)道,但筆者查閱的近期刊發(fā)現(xiàn)仍存在這些工具酶中外文字符的編排格式混亂的問題,其原因可能是部分編輯對(duì)專業(yè)領(lǐng)域的編排規(guī)范和標(biāo)準(zhǔn)關(guān)注較少,但相比2010年前有了明顯改善,尤其是DNA聚合酶和DNA連接酶,大多數(shù)期刊對(duì)兩者的表述形式和編排格式作了規(guī)范統(tǒng)一。常用的DNA聚合酶包括TaqDNA聚合酶、TthDNA聚合酶、PfuDNA聚合酶等[23]。常用的DNA連接酶包括T4 DNA連接酶、T7 DNA連接酶等。部分期刊將DNA聚合酶和DNA連接酶編排格式統(tǒng)一用正體或斜體,造成該問題的主要原因是編輯不了解DNA聚合酶和DNA連接酶的命名方法。
相比之下,限制性內(nèi)切酶的編排格式問題較嚴(yán)重,主要有以下 3種編排形式:①字母和羅馬數(shù)字用斜體,如BamH I、Hind Ⅲ;②4個(gè)字母用斜體,羅馬數(shù)字用正體,如BamHⅠ、HindⅢ;③前3個(gè)字母用斜體,第4個(gè)字母和羅馬數(shù)字用正體,如BamH I、Hind Ⅲ。由于限制性內(nèi)切酶的命名是根據(jù)細(xì)菌種類和發(fā)現(xiàn)的順序而定,如BamH Ⅰ是從解淀粉芽孢桿菌(Bacills amyloliquefaciens)H株首次發(fā)現(xiàn)的限制性內(nèi)切酶(GB/T 35539—2017),故B代表Bacills(屬名);am代表amyloliquefaciens(種加詞),H 代表 H 株系;I為首先發(fā)現(xiàn)(在此類細(xì)菌中發(fā)現(xiàn)的順序)[12,24]。物種拉丁名(又稱學(xué)名)由屬名和種加詞(種小名)兩個(gè)部分構(gòu)成,屬名由拉丁語法化的名詞形成,首字母須大寫;種加詞是拉丁文中的形容詞,首字母不大寫,常以斜體表示,故表明第③編排格式為正確,即物種拉丁名縮寫用斜體,其余用正體[11-12]。
在基因工程研究中,微生物既可以作為基因的供體(即提供功能基因),也可以作為基因的受體(即可擴(kuò)增或表達(dá)功能基因)。因此,分子生物學(xué)研究中常涉及微生物學(xué)名(又稱拉丁學(xué)名)的表述和編排問題。根據(jù)國際物種的命名原則[25],每一種微生物都有一個(gè)專門的學(xué)名,微生物的學(xué)名同其他植物、動(dòng)物等物種一樣主要采用林奈的二命名法,由兩個(gè)拉丁化名詞所組成,即“屬名+種名”,用斜體表示,如釀酒酵母的學(xué)名為Saccharomyces cerevisiae;大腸桿菌(又名大腸埃希菌、大腸埃希氏菌)的學(xué)名為Escherichia coli;枯草芽孢桿菌的學(xué)名為Bacillus subtilis。當(dāng)物種出現(xiàn)亞種、變種時(shí),采用三命名法,即“屬名+種名+subsp.(var.)+亞種(變種)名”,其中,“subsp.” “var.”用正體,亞種和變種名用斜體表示,如釀酒酵母橢圓變種的學(xué)名Saccharomyces cerevisiaevar.ellipsoides;脆弱擬桿菌卵形亞種的學(xué)名為Bacteroides fragilissubsp.ovatus。菌株為亞種以下的分類名詞,其學(xué)名則為“屬名+種名+菌株名稱”,菌株名稱不用斜體[26],如Escherichia coliK12。由于大腸桿菌可實(shí)現(xiàn)目的基因擴(kuò)增,保證外源基因穩(wěn)定于細(xì)胞受體內(nèi),因此,常被作為分子克隆的宿主(即受體),常用的菌株為 DH5α、BL21(DE3)、JM109、TOP1和HB101菌株。其中,DH5α菌株是一種能攝入外源DNA的受容菌,對(duì)外源DNA缺乏免疫,是基因工程中重要原核細(xì)胞表達(dá)系統(tǒng)。但較多科技期刊中常把大腸桿菌DH5α感受態(tài)細(xì)胞誤寫成“大腸桿菌DH5a感受態(tài)細(xì)胞”,即α誤寫成a。此外,為了避免表述累贅,當(dāng)前后兩個(gè)或更多的微生物學(xué)名連排在一起時(shí),若它們的屬名相同,首個(gè)屬名用全稱,則后面的一個(gè)或幾個(gè)署名可縮寫成一個(gè)、兩個(gè)或者三個(gè)字母,其后面加上一個(gè)點(diǎn)[26],例如Bacillus(芽孢桿菌屬)可縮寫成“B.”或者“Bac”,曲霉屬(Aspergillus)可縮寫成“A.”或者“Asp.”,文中后續(xù)出現(xiàn)可直接用縮寫形式。但目前仍有科技期刊中首次出現(xiàn)拉丁學(xué)名就簡(jiǎn)寫,導(dǎo)致讀者無法準(zhǔn)確判斷屬名,或者二次或多次出現(xiàn)仍用全稱的現(xiàn)象,導(dǎo)致文章顯得很累贅。
系統(tǒng)發(fā)育學(xué)主要是研究物種的形成或進(jìn)化歷史,以及物種之間的進(jìn)化關(guān)系。物種進(jìn)化的最根本原因在于生物分子(包括DNA、RNA和蛋白質(zhì))的進(jìn)化,體現(xiàn)在生物分子序列上的核苷酸或氨基酸殘基的變異,逐漸從一條序列變異成另一條序列,導(dǎo)致分子結(jié)構(gòu)和功能發(fā)生明顯改變[27]。雖然隨著越來越多的物種的全基因組序列被測(cè)序,但生物分子的結(jié)構(gòu)復(fù)雜,目前人們對(duì)其分子結(jié)構(gòu)和功能信息不夠全面和充分,因此利用分子結(jié)構(gòu)和功能信息研究物種進(jìn)化關(guān)系不是主要方法。目前用于系統(tǒng)發(fā)育分析的信息主要是生物分子的序列,尤其是基因核苷酸序列信息或蛋白氨基酸序列信息使用更普遍。目前主要采用多條序列比對(duì)的方法,再根據(jù)比對(duì)結(jié)果構(gòu)建系統(tǒng)發(fā)育進(jìn)化樹(也稱系統(tǒng)發(fā)育樹),以此分析基因(或蛋白)功能及系統(tǒng)發(fā)育關(guān)系[28]。由于相似的序列可能起源于一個(gè)共同的祖先序列,它們很可能有相似的空間結(jié)構(gòu)和生物學(xué)功能,因此對(duì)于一個(gè)已知序列但未知結(jié)構(gòu)和功能的蛋白質(zhì),如果與其序列相似的某些蛋白質(zhì)的機(jī)構(gòu)和功能已知,則可以推測(cè)這個(gè)未知結(jié)構(gòu)和功能的蛋白質(zhì)的結(jié)構(gòu)和功能。值得注意的是,物種基因組中存在的許多來源于同一個(gè)祖先且結(jié)構(gòu)和功能相似或相關(guān)的一組基因,編碼相似的蛋白質(zhì)產(chǎn)物[3]。選取不同的同源基因(或蛋白)所得出的系統(tǒng)發(fā)育分析結(jié)果也不同[2],而不同基因(或蛋白)在數(shù)據(jù)庫中的編號(hào)(ID)不同。因此,系統(tǒng)發(fā)育進(jìn)化樹中應(yīng)該標(biāo)明基因(或蛋白)ID,或者在系統(tǒng)發(fā)育進(jìn)化樹圖下面注釋 ID。但目前很多期刊刊發(fā)的文獻(xiàn)中系統(tǒng)發(fā)育進(jìn)化樹只標(biāo)明物種拉丁名,未標(biāo)明基因(或蛋白)ID,致使文章缺乏嚴(yán)謹(jǐn)性。
由于我國生物技術(shù)發(fā)展起步較晚,缺乏相關(guān)國家標(biāo)準(zhǔn)和行業(yè)標(biāo)準(zhǔn),是出現(xiàn)上述問題的原因之一。但目前較多書籍和文獻(xiàn)可供分子生物學(xué)文稿的寫作提供參考,如該研究領(lǐng)域口碑較高、認(rèn)可度較高的參考書籍如《分子克隆實(shí)驗(yàn)指南》《TIG遺傳命名指南》《生物信息學(xué)與功能基因組學(xué)》等,以及相關(guān)高等教科書如《現(xiàn)代分子生物學(xué)》等。此外,出現(xiàn)上述問題還與編輯自身息息相關(guān):①編輯缺乏分子生物學(xué)相關(guān)專業(yè)知識(shí)背景,造成稿件有問題看不出,或發(fā)現(xiàn)問題不知道如何改,甚至無法和作者進(jìn)行有效溝通的局面;②編輯標(biāo)準(zhǔn)化規(guī)范化意識(shí)不強(qiáng),缺乏分子生物學(xué)稿件的編輯規(guī)范;③編輯自身只注重文字、標(biāo)點(diǎn)等常規(guī)編校規(guī)范,而忽略分子生物學(xué)文稿的專業(yè)規(guī)范。作者自身也有較大責(zé)任:①作者平日更專注理論和試驗(yàn)研究,對(duì)論文寫作規(guī)范知之甚少;②作者思想上依賴編輯,認(rèn)為后續(xù)工作應(yīng)有編輯負(fù)責(zé)完成,編輯會(huì)做好后續(xù)編校工作;③作者沒有嚴(yán)謹(jǐn)?shù)目蒲袘B(tài)度,認(rèn)為論文能發(fā)表即可,不在乎文章的質(zhì)量,未對(duì)編輯的加工修改內(nèi)容進(jìn)行認(rèn)真斟酌,而是盲目認(rèn)同。
針對(duì)上述問題,筆者提出如下建議:①對(duì)于分子生物學(xué)稿件較多的科技期刊,為保證編校質(zhì)量,編輯部應(yīng)盡量招錄與分子生物學(xué)相關(guān)專業(yè)的賢人志士,確保編輯人員具備相關(guān)專業(yè)知識(shí)背景;②除做好本職工作外,編輯還要認(rèn)真閱覽與分子生物學(xué)論文編輯規(guī)范相關(guān)的文獻(xiàn),在工作中要認(rèn)真執(zhí)行有關(guān)科技書刊出版的標(biāo)準(zhǔn)和規(guī)范,對(duì)于把握不準(zhǔn)的用語,應(yīng)多查閱全國科學(xué)技術(shù)名詞審定委員會(huì)公布的相關(guān)專業(yè)名詞書籍;③編輯在工作中要有求真務(wù)實(shí)的精神,對(duì)把握不準(zhǔn)的學(xué)術(shù)問題要及時(shí)應(yīng)及時(shí)向相關(guān)研究領(lǐng)域的權(quán)威人士求證,尋求規(guī)范化的寫作和編排方法。