馮世鵬,袁紅梅,牛曉磊
(海南大學(xué)農(nóng)學(xué)院海南省熱帶生物資源可持續(xù)利用重點(diǎn)實(shí)驗(yàn)室,海南海口 570228)
?
生物信息學(xué)課程內(nèi)容設(shè)置研究
馮世鵬,袁紅梅,牛曉磊
(海南大學(xué)農(nóng)學(xué)院海南省熱帶生物資源可持續(xù)利用重點(diǎn)實(shí)驗(yàn)室,海南???570228)
分析了生物信息學(xué)課程設(shè)置的現(xiàn)狀,通過比較不同大學(xué)的培養(yǎng)方案,總結(jié)了生物、數(shù)學(xué)、計(jì)算機(jī)方面的主要專業(yè)課程。介紹了生物信息學(xué)的教材情況,并根據(jù)各教材生物信息學(xué)課程內(nèi)容,將相關(guān)內(nèi)容分為必選、可選、實(shí)驗(yàn)3部分,進(jìn)而分別闡述了這3部分課程內(nèi)容的設(shè)置。
生物信息學(xué);課程內(nèi)容設(shè)置;教材
隨著人類基因組計(jì)劃的實(shí)施及測(cè)序技術(shù)的進(jìn)步,人類獲得生物數(shù)據(jù)的能力越來越強(qiáng),不斷有新物種被測(cè)序的報(bào)道。大量數(shù)據(jù)的積累進(jìn)一步推動(dòng)生物信息分析技術(shù)的開發(fā),而新技術(shù)的開發(fā)又反過來吸引人們?nèi)カ@取更多的數(shù)據(jù),這樣循環(huán)往復(fù),極大地推動(dòng)生物信息學(xué)及其他生命科學(xué)的發(fā)展。生物信息學(xué)已經(jīng)成為生命科學(xué)不可分割的一個(gè)重要組成部分,所有生命科學(xué)相關(guān)專業(yè)的學(xué)生都必須具有一定的生物信息學(xué)知識(shí),否則其今后的學(xué)習(xí)或工作將會(huì)碰到很多困難。因此,生物信息學(xué)課程教學(xué)在各大專院校幾乎所有與生物相關(guān)專業(yè)廣泛開展。
生物信息學(xué)科程有幾個(gè)特點(diǎn)[1]:一是涉及生物學(xué)、數(shù)學(xué)、醫(yī)學(xué)、計(jì)算機(jī)科學(xué)等多個(gè)相關(guān)學(xué)科,內(nèi)容繁雜,幾乎沒有人能掌握生物信息學(xué)的所有內(nèi)容。二是待授課學(xué)生水平參差不齊,所屬專業(yè)包括生物學(xué)、醫(yī)學(xué)、農(nóng)學(xué)等。生源的多樣性及所學(xué)專業(yè)的多樣性決定了學(xué)生的生物信息水平存在差距。三是沒有統(tǒng)一的教材。目前市面上銷售的教材有四十余種,由各學(xué)校自行選取,增加了大學(xué)教學(xué)的自主性。四是教師的學(xué)識(shí)有限,并偏向講授自己擅長(zhǎng)的部分。生物信息學(xué)課程的上述特點(diǎn)決定了其教學(xué)內(nèi)容的繁雜性,筆者對(duì)生物信息學(xué)課程教學(xué)內(nèi)容進(jìn)行探討,希望對(duì)今后生物信息學(xué)課程的教學(xué)有所幫助。
目前我國(guó)已經(jīng)有多所高校設(shè)置生物信息學(xué)院(或系)、生物信息中心(或研究所、實(shí)驗(yàn)室),如重慶郵電大學(xué)、哈爾濱醫(yī)科大學(xué)、南京郵電大學(xué)設(shè)有生物信息學(xué)院;同濟(jì)大學(xué)、上海交通大學(xué)、天津醫(yī)科大學(xué)、鄭州大學(xué)等建有生物信息系;北京大學(xué)、天津大學(xué)、復(fù)旦大學(xué)、中國(guó)農(nóng)業(yè)大學(xué)、哈爾濱工業(yè)大學(xué)、華中科技大學(xué)、第三軍醫(yī)大學(xué)、蘇州大學(xué)、華中農(nóng)業(yè)大學(xué)等建有生物信息中心;清華大學(xué)、浙江大學(xué)、東南大學(xué)等建有生物信息學(xué)研究所或者國(guó)家級(jí)實(shí)驗(yàn)室;南京大學(xué)、武漢大學(xué)、華中理工大學(xué)、四川大學(xué)等高校設(shè)置了生物信息學(xué)專業(yè);另外,中國(guó)科學(xué)院、華大基因等科研機(jī)構(gòu)設(shè)置了生物信息分析部門。這些機(jī)構(gòu)在我國(guó)生物信息學(xué)研究中最具影響力,也極大地推動(dòng)我國(guó)生物信息科學(xué)的發(fā)展。大專院校生物信息專業(yè)的設(shè)置也為我國(guó)培養(yǎng)了一批生物信息學(xué)后備人才。
生物信息學(xué)作為一個(gè)招生專業(yè),在多個(gè)大學(xué)進(jìn)行招生。通過比較不同大學(xué)的培養(yǎng)方案[2-4],將其主要專業(yè)課程總結(jié)如下。①生物方面:分子生物學(xué)、細(xì)胞生物學(xué)、生物化學(xué)、遺傳學(xué)、基因組學(xué)、普通生物學(xué)、動(dòng)物學(xué)、植物學(xué)、微生物學(xué)、解剖學(xué)等;②數(shù)學(xué)方面:概率論與數(shù)理統(tǒng)計(jì)、生物統(tǒng)計(jì)學(xué)、線性代數(shù)、高等數(shù)學(xué)、微積分等;③計(jì)算機(jī)方面:計(jì)算機(jī)原理、網(wǎng)絡(luò)技術(shù)、Linux操作系統(tǒng)、高級(jí)語(yǔ)言程序設(shè)計(jì)、Perl(或Python)語(yǔ)言、R語(yǔ)言、數(shù)據(jù)庫(kù)技術(shù)等。
通過生物信息學(xué)專業(yè)課程設(shè)置情況來看,生物信息涉及生物、數(shù)學(xué)、計(jì)算機(jī)方面的課程,且各課程獨(dú)立設(shè)置,深化了學(xué)生對(duì)生物信息各方面知識(shí)及能力的培養(yǎng),目標(biāo)在于培養(yǎng)生物信息分析方面的專業(yè)人才。在不同學(xué)校,這些課程的選擇可能各有側(cè)重。
對(duì)于其他非生物信息學(xué)專業(yè)的學(xué)生,生物信息學(xué)作為課程的目的在于培養(yǎng)學(xué)生獲得基礎(chǔ)的生物信息學(xué)知識(shí),輔助學(xué)生更好地學(xué)習(xí)和理解其他生物學(xué)知識(shí)。因此,課程內(nèi)容的設(shè)置既要考慮生物信息學(xué)學(xué)科所涉及的各方面內(nèi)容,又要通俗易懂,更要有實(shí)用性,讓學(xué)生更好地利用生物信息學(xué)工具解決學(xué)習(xí)中的問題。其教學(xué)內(nèi)容如何選擇,后面將做詳細(xì)探討。
初步統(tǒng)計(jì),目前由我國(guó)教學(xué)科研人員撰寫的生物信息學(xué)教材有四十余本,時(shí)間跨度在2000~2016年[5-6],出版社包括科學(xué)出版社、高等教育出版社、清華大學(xué)出版社等多個(gè)國(guó)家一級(jí)出版社。其中,國(guó)家“十一五”規(guī)劃教材有4本,分別由陶士珩[7]、李霞[8]、王勇獻(xiàn)[9]、劉娟[10]編撰;國(guó)家“十二五”規(guī)劃教材有3本,分別由孫清鵬[11]、李霞[12]、陳銘[13]編撰;國(guó)家“十三五”農(nóng)林規(guī)劃教材1本,由呂巍等[6]編撰。這些教材在教學(xué)內(nèi)容選擇及深度方面各不相同,適合不同學(xué)校選用。
總結(jié)現(xiàn)有的生物信息學(xué)教材,根據(jù)各教材生物信息學(xué)課程內(nèi)容的情況,可將相關(guān)內(nèi)容分為3部分:一是各教材均有的內(nèi)容(也稱為必選內(nèi)容);二是僅有部分教材有的內(nèi)容(稱為可選內(nèi)容);三是實(shí)驗(yàn)部分內(nèi)容。
3.1必選內(nèi)容
3.1.1緒論。緒論部分的內(nèi)容選擇要達(dá)到3個(gè)目的:一是介紹課程的目的、意義及發(fā)展歷史;二是回顧所涉及的部分專業(yè)知識(shí),包括生物、數(shù)學(xué)、計(jì)算機(jī)方面;三是介紹課程學(xué)習(xí)內(nèi)容并提出學(xué)生應(yīng)該采納的學(xué)習(xí)方法。因此,緒論部分建議包括以下內(nèi)容:生物信息學(xué)定義及其發(fā)展歷史,生物學(xué)基礎(chǔ)知識(shí)、數(shù)學(xué)基礎(chǔ)知識(shí)、計(jì)算機(jī)及網(wǎng)絡(luò)基礎(chǔ)知識(shí),研究?jī)?nèi)容及發(fā)展前景,學(xué)習(xí)態(tài)度及方法。
3.1.2數(shù)據(jù)庫(kù)。生物信息學(xué)相關(guān)數(shù)據(jù)庫(kù)貯存了生物大分子相關(guān)文獻(xiàn)、序列、結(jié)構(gòu)、表達(dá)、定位等海量信息,這些信息對(duì)于學(xué)生今后的學(xué)習(xí)及工作助益很大,因此數(shù)據(jù)庫(kù)是學(xué)生需要重點(diǎn)掌握的內(nèi)容之一。數(shù)據(jù)庫(kù)學(xué)習(xí)的內(nèi)容要使學(xué)生了解有哪些重要數(shù)據(jù)庫(kù)、各數(shù)據(jù)庫(kù)分別貯存哪類信息、數(shù)據(jù)格式如何、怎樣使用等。因此,這部分內(nèi)容包括:數(shù)據(jù)庫(kù)總體特點(diǎn)、分類、幫助文件的查找;常用數(shù)據(jù)格式介紹,如fasta、fastq、genbank、gff3;核酸序列數(shù)據(jù)庫(kù)Genbank、ENA、DDBJ;蛋白質(zhì)序列、結(jié)構(gòu)數(shù)據(jù)庫(kù),如Uniprot、PIR、PDB、PFam、Prosite;模式物種基因組數(shù)據(jù)庫(kù),如MGI、RGD、Oryzabase、Tair、WormBase;基因表達(dá)數(shù)據(jù)庫(kù),如GEO;代謝通路數(shù)據(jù)庫(kù),如KEGG;基因組注釋及瀏覽數(shù)據(jù)庫(kù)ENSEMBL、UCSC;非編碼RNA數(shù)據(jù)庫(kù),如miRBase;綜合數(shù)據(jù)庫(kù)NCBI、EMBL、ExPASy等。
3.1.3序列特征分析。這部分內(nèi)容需讓學(xué)生了解對(duì)DNA、RNA、蛋白質(zhì)序列進(jìn)行相關(guān)生物信息分析。因此,這部分課程包括如下內(nèi)容。①DNA序列特征分析:常規(guī)轉(zhuǎn)換(如大小寫轉(zhuǎn)換、序列反向、反向互補(bǔ)等),酶切位點(diǎn)分析,引物設(shè)計(jì),基因預(yù)測(cè)、啟動(dòng)子預(yù)測(cè)、CpG島預(yù)測(cè)、終止信號(hào)預(yù)測(cè)等。②RNA序列特征分析:RNA類型預(yù)測(cè)、RNA結(jié)構(gòu)分析等。③蛋白序列特征分析:理化性質(zhì)分析、親疏水性分析、信號(hào)肽預(yù)測(cè)、跨膜區(qū)預(yù)測(cè)、亞細(xì)胞定位預(yù)測(cè)等。
3.1.4序列比較。這部分內(nèi)容設(shè)置需讓學(xué)生掌握序列比較軟件的原理及使用方法。序列比較主要包括序列兩兩比較、多序列比較,其中序列兩兩比較軟件主要是blast、fasta、blat,而又以blast使用最廣泛;多序列比較軟件包括cluster、DNAstar、DNAMAN。教學(xué)內(nèi)容包括序列比較算法(Needleman-Wunsch、Smith-Waterman、Karlin-Altchul),得分矩陣(PAM、BLOSUM、DNA替換矩陣),blast種類及使用,在線blast使用方法,blast參數(shù)設(shè)置及結(jié)果解讀,fasta及blat軟件的使用,多序列比較軟件cluster、DNAstar、DNAMAN的使用。3.1.5進(jìn)化分析。這部分內(nèi)容設(shè)置需要讓學(xué)生掌握通過生物大分子的比較來判斷物種進(jìn)化關(guān)系的方法。教學(xué)內(nèi)容包括分子進(jìn)化相關(guān)概念,可選建樹序列類型、建樹算法及軟件的選擇,不同進(jìn)化樹的選擇優(yōu)化,MEGA、PHYLIP建樹軟件介紹。
3.1.6蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)。蛋白質(zhì)序列決定其結(jié)構(gòu),結(jié)構(gòu)決定功能,因此,蛋白質(zhì)結(jié)構(gòu)在基因功能研究中發(fā)揮了重要作用。通過相關(guān)內(nèi)容的學(xué)習(xí),讓學(xué)生掌握蛋白質(zhì)結(jié)構(gòu)的種類、預(yù)測(cè)方法及通過蛋白質(zhì)結(jié)構(gòu)進(jìn)一步預(yù)測(cè)其功能。教學(xué)內(nèi)容包括蛋白質(zhì)I~I(xiàn)V級(jí)結(jié)構(gòu)特點(diǎn)、二級(jí)結(jié)構(gòu)預(yù)測(cè)及解讀、三級(jí)結(jié)構(gòu)預(yù)測(cè)及解讀、基于結(jié)構(gòu)預(yù)測(cè)蛋白質(zhì)功能。
以上內(nèi)容基本在各個(gè)學(xué)校生物信息學(xué)課程中均有反映,只是內(nèi)容的詳細(xì)程度、排列順序稍有差異。
3.2可選教學(xué)內(nèi)容這部分內(nèi)容由各個(gè)教師根據(jù)實(shí)際情況選擇授課。各個(gè)學(xué)校,甚至同一學(xué)校不同教師的授課內(nèi)容均有一定差異。
3.2.1非編碼RNA介紹。非編碼RNA是目前生物學(xué)研究的一個(gè)熱點(diǎn),通過學(xué)習(xí),要使學(xué)生掌握常見非編碼RNA的特點(diǎn)及其研究應(yīng)用方法。課程內(nèi)容包括非編碼RNA種類、各自特點(diǎn)、miRNA預(yù)測(cè)注釋、miRNA靶基因預(yù)測(cè)篩選、miRNA功能研究等。
3.2.2Linux系統(tǒng)&Perl語(yǔ)言介紹。這部分內(nèi)容是為了讓有志于在生物信息學(xué)方面發(fā)展的學(xué)生準(zhǔn)備,目的是讓他們掌握生物信息分析時(shí)常用的Linux操作系統(tǒng)及Perl語(yǔ)言。課程內(nèi)容包括Linux系統(tǒng)簡(jiǎn)介、安裝、常見命令使用、Perl語(yǔ)言簡(jiǎn)介、常有命令、簡(jiǎn)單的程序編制及解讀。
3.2.3siRNA介紹。RNAi技術(shù)已經(jīng)成為生命科學(xué)的常規(guī)技術(shù)。通過這部分內(nèi)容的學(xué)習(xí),可以讓學(xué)生了解siRNA技術(shù)原理及應(yīng)用。設(shè)置內(nèi)容包括siRNA來源、siRNA特點(diǎn)、siRNA設(shè)計(jì)合成等。
3.2.4基因表達(dá)分析。通過相關(guān)內(nèi)容的學(xué)習(xí),能讓學(xué)生掌握基因表達(dá)分析方法,熟悉基因芯片、qPCR、深度測(cè)序等操作原理及流程。設(shè)置內(nèi)容包括qPCR原理及數(shù)據(jù)分析、Northern Blot雜交原理及數(shù)據(jù)分析、基因芯片原理及結(jié)果解讀、RNA-seq基因表達(dá)分析原理及結(jié)果解讀。
3.3實(shí)驗(yàn)內(nèi)容
3.3.1數(shù)據(jù)庫(kù)檢索。在介紹完數(shù)據(jù)庫(kù)之后,可以安排上機(jī)進(jìn)行數(shù)據(jù)庫(kù)的檢索實(shí)驗(yàn),目的是熟悉數(shù)據(jù)庫(kù)及掌握常用數(shù)據(jù)庫(kù)檢索方法,如NCBI、KEGG、UCSC等。
3.3.2序列比較分析。通過NCBI在線blastn、blastp練習(xí),掌握blast軟件的使用方法,為今后生物信息分析奠定基礎(chǔ)。
3.3.3引物設(shè)計(jì)。引物設(shè)計(jì)是生物學(xué)相關(guān)專業(yè)從本科生到博士生均會(huì)面臨的問題。通過相關(guān)課程練習(xí),學(xué)生能熟悉引物設(shè)計(jì)原則,掌握常見設(shè)計(jì)軟件的使用,如Primer5、Oligo等,以及對(duì)所設(shè)計(jì)引物進(jìn)行篩選。
3.3.4進(jìn)化分析。通過練習(xí),讓學(xué)生掌握進(jìn)化樹的構(gòu)建及Cluster、Mega、Phylip等軟件的使用方法。
生物信息學(xué)課程主要是針對(duì)生物類專業(yè)學(xué)生的一門實(shí)踐操作性強(qiáng)的自學(xué)課程,課程內(nèi)容的設(shè)置要面向?qū)W生今后繼續(xù)學(xué)習(xí)和工作的要求,因此,教學(xué)內(nèi)容的選擇既要實(shí)用、易學(xué),又要有一定的深度,以為學(xué)生今后繼續(xù)從事生物信息分析奠定基礎(chǔ)。當(dāng)然,課堂教學(xué)內(nèi)容和時(shí)間畢竟有限,應(yīng)著重強(qiáng)調(diào)學(xué)生的自主學(xué)習(xí)。
[1] 呂巍,李濱.農(nóng)業(yè)院校生物信息學(xué)本科教學(xué)的實(shí)踐與心得[J].高校生物學(xué)教學(xué)研究(電子版),2015,5(1):20-23.
[2] 王宏,李霞,徐良德.面向?qū)嵺`能力培養(yǎng)的生物信息學(xué)課程體系建設(shè)[J].中國(guó)科技創(chuàng)新導(dǎo)刊,2013(19):47-49.
[3] 袁超,谷小青,朱偉,等.生物信息網(wǎng)絡(luò)資源在教學(xué)中的應(yīng)用與探索[J].農(nóng)業(yè)網(wǎng)絡(luò)信息,2013(2):122-125.
[4] 胡建平,楊彩萍.生物信息學(xué)內(nèi)容改革研究[J].安徽農(nóng)學(xué)通報(bào),2012,18(15):173-175.
[5] 郝柏林,張淑譽(yù).生物信息學(xué)手冊(cè)[M].上海:上??茖W(xué)技術(shù)出版社,2000.
[6] 呂巍,李濱.生物信息學(xué)實(shí)踐教程[M].北京:高等教育出版社,2016.
[7] 陶士珩.生物信息學(xué)[M].北京:科學(xué)出版社,2007.
[8] 李霞.物信息學(xué)[M].北京:人民衛(wèi)生出版社,2010.
[9] 王勇獻(xiàn).生物信息學(xué)導(dǎo)論:面向高性能計(jì)算的算法與應(yīng)用[M].北京:清華大學(xué)出版社,2011.
[10] 劉娟.生物信息學(xué)[M].北京:高等教育出版社,2014.
[11] 孫清鵬.生物信息學(xué)應(yīng)用教程[M].北京:中國(guó)林業(yè)出版社,2012.
[12] 李霞.生物信息學(xué)[M].2版.北京:人民衛(wèi)生出版社,2015.
[13] 陳銘.生物信息學(xué)[M].2版.北京:科學(xué)出版社,2016.
Study on Content about Bioinformatics Course
FENG Shi-peng, YUAN Hong-mei, NIU Xiao-lei
(Hainan Key Laboratory for Sustainable Utilization of Tropical Bioresource, College of Agriculture, Hainan University, Haikou, Hainan 570228)
The status of bioinformatics course was analyzed, the main courses in biology, mathematics and computer were summarized through comparing different universities’ training scheme. Teaching materials of bioinformatics were introduced, the relevant contents were devided into required, optional, and experiment three parts, the content of three parts were further elaborated.
Bioinformatics; Curriculum content arrangement; Teaching material
海南省中西部高校提升綜合實(shí)力工作項(xiàng)目。
馮世鵬(1980- ),男,湖北安陸人,講師,博士,從事miRNA功能與作用機(jī)制研究。
2016-07-31
S-01;G 420
A
0517-6611(2016)27-0230-02