馬文濤
摘要:生物信息學的產(chǎn)生標志著生物學研究模式的變革,其本科課程的建設(shè)倍受關(guān)注。目前,生物信息學課程建設(shè)的主流思想是注重實踐,引入諸如案例式教學、問題式教學或任務(wù)驅(qū)動式教學等新型教學模式。然而,生物信息學作為一個學科本身,具有強烈的理論內(nèi)涵和普遍規(guī)律。本文強調(diào)了傳統(tǒng)課堂在傳授這些知識方面的不可替代作用,并舉例說明了其中應(yīng)講授的基本思想和基礎(chǔ)概念。最后,這里提出,注重理論和簡單實踐的導(dǎo)論性課程和注重實踐的新型課程應(yīng)分開建設(shè),并同樣重視。
關(guān)鍵詞:傳統(tǒng)授課方式;理論聯(lián)系實踐;大學教學;跨學科課程
中圖分類號:G642.3 文獻標志碼:A 文章編號:1674-9324(2018)40-0122-03
一、生物信息學:從科學到教學
生物信息學是一個生物學和數(shù)學以及計算機科學交叉而形成的新興學科?,F(xiàn)在人們一般認為其英文說法“bioinformatics”是由時任弗羅里達州立大學超算中心基因與生物物理組主任的林華安(H.A.Lim)博士在1987年首創(chuàng),從此標志該學科的誕生;不過,也有人指出,早在1968年,已經(jīng)有教材采用相關(guān)概念[1]。無論如何,生物信息學仍是一個比較新的學科,它隨人類及其他生物基因組計劃的進行而蓬勃發(fā)展,研究范圍逐漸擴展到整個生命科學領(lǐng)域?,F(xiàn)在,生物信息學是生物學研究模式革命的標志,正如諾貝爾獎獲得者吉爾伯特(W.Gilbert)所言:“基于全部基因都將知曉并以電子技術(shù)可操作的方式駐留在數(shù)據(jù)庫中,新的生物學研究模式的出發(fā)點應(yīng)該是理論的??茖W家將從理論推測出發(fā),再返回到實驗中去,追蹤或驗證這些理論假設(shè)。……生物學家不僅必須成為計算機學者,而且也要改變他們研究生命現(xiàn)象的途徑”[2]。順應(yīng)科學發(fā)展的趨勢,生物信息學的大學教育也迅速開展。在美國,最早于1990s中期即開始培養(yǎng)相關(guān)的博士和碩士。目前幾乎每所美國和歐洲綜合性大學均開設(shè)生物信息學課程?,F(xiàn)在,我國各高等院校也逐漸和國際接軌——一般來說,有著生物學或生物技術(shù)專業(yè)的學校都在努力建設(shè)生物信息學課程。然而,生物信息學非常特殊,其課程建設(shè)并不容易。首先,它是一門跨專業(yè)學科,僅有生物學背景遠遠不夠,還需要數(shù)學和計算機方面的背景;但傳統(tǒng)上,生物專業(yè)的學生在這方面的基礎(chǔ)課程力度不夠。其次,由于涉及到生命科學領(lǐng)域的方方面面,它的內(nèi)容跨度很大,比如,從“序列比對分析”到“分子進化分析”,再到“分子結(jié)構(gòu)分析”,其中涉及到的生物學知識和算法知識都很不相同;其結(jié)果是,計劃的課時往往難以覆蓋。然后,它的理論和實踐內(nèi)容都很重要,但側(cè)重點上卻有很大的不同,難以緊密結(jié)合。
目前,解決這些矛盾的一個普遍采用的辦法就是“放棄”理論,專注于實踐。的確,不少關(guān)于生物信息學的教學改革的思路就是如此,即所謂“案例式教學(Case-based Learning)”、“問題式教學(Problem-based Learning)”和“任務(wù)驅(qū)動式教學(Task-based learning)”等等[3-5]。如此,理論和實踐相結(jié)合的問題當然沒有了;計劃的課時也因為對理論方面的放棄而足夠了;甚至,計算機和數(shù)學方面的基礎(chǔ)似乎也不那么重要了——只要會查數(shù)據(jù)庫以及會用軟件來“解決”實際問題就行了,最多用數(shù)據(jù)處理能力較強的腳本語言(如Perl或Python等)寫寫小程序就已經(jīng)是“小專家”了。然而,這樣培養(yǎng)出來的“人才”能配得上生物信息學這個改變生物學面貌的革命性學科嗎?顯然不是,這個問題需要引起足夠重視。我們在高等教育的課程建設(shè)上仍然需要注重學科的基本理論思想和基礎(chǔ)概念的傳授,才不至于流于“實用主義”,才能為我國培養(yǎng)具有“學科高度”的相關(guān)人才。下面,筆者結(jié)合本校生物信息學本科教學實踐的經(jīng)驗來談生物信息學理論教學需要注重的三個方面的內(nèi)容,而這些方面顯然是傳統(tǒng)課堂形式中的傳授內(nèi)容,將使生物信息學的魅力展現(xiàn)無疑。
二、生物信息學的內(nèi)容特色:生命的信息內(nèi)涵
正因為是新興學科,生物信息學并沒有一個統(tǒng)一的定義,幾乎每一本相關(guān)教材中都有自己的定義。根據(jù)一個較權(quán)威的來源——人類基因組計劃第一個五年總結(jié)報告(1995,美國)中的提法:生物信息學是利用信息技術(shù)對生物信息進行獲取、儲存、分發(fā)(查詢)和分析,以解釋這些信息數(shù)據(jù)所蘊涵的生物學意義的學科。從這個定義中,我們可以看出兩個和信息有關(guān)的關(guān)鍵詞:“信息技術(shù)”和“生物信息”。其中,第一個代表本學科用到的方法,在一般的教材和課堂教學中都會充分強調(diào)。然而,對于第二個,“生物信息”,也即本學科研究的內(nèi)容(對象),我們往往在講解中不夠重視——似乎大家都清楚:想想那些基因序列和蛋白質(zhì)序列就知道了。不過,大家真的清楚嗎?這些信息是怎么來的?為什么信息對于生命這么重要?為什么“生物信息學”現(xiàn)在這么熱門,卻沒有相應(yīng)的“物理信息學”和“化學信息學”等等?這些正是涉及到“生物信息學”作為一個學科的基本問題。大家都知道,化學對于生物學十分重要,生物專業(yè)的學生要學習很多化學方面的課程。如果有人說:“化學對于生物學不僅僅是一種方法,生命現(xiàn)象植根于化學的規(guī)律之上”,我們都不會有太多異議。然而,如果說:“信息學對于生物學不僅僅是一種方法,生命現(xiàn)象植根于信息學的規(guī)律之上”,很多人就會疑惑了。但這個卻是事實,生命世界里的各種現(xiàn)象和信息緊密相關(guān)。比如,遺傳是信息的代代相傳,而進化是信息的演化。信息論的鼻祖申農(nóng)(C.E.Shannon)指出,信息的產(chǎn)生來源于選擇(“不確定性的消除”);而顯然,進化中產(chǎn)生的基因組信息就源于“自然選擇”[6]。一個更加顯見的例子是,分子生物學中的中心法則就是一個信息傳遞和轉(zhuǎn)化的流程,昭示著“生命的核心機制就建立在信息的流轉(zhuǎn)之上”。那么,如果說化學代表著生物學的一面,則信息學就代表著它的另一面。所以,我們在課堂上講清楚“生命的信息內(nèi)涵”十分重要,將使學生理解到生物信息學的根本意義。
三、生物信息學的研究方式:算法思想的意義
算法,通俗來說就是計算的方法。計算機的基本工作原理就是基于計算的,因此,如何進行計算對于計算機來說就至關(guān)重要,關(guān)系到它能否完成我們希望它完成的任務(wù)。對于生物信息學來說,算法其實就是其分析問題的方式和解決問題的途徑。顯然,這又是一個生物信息學理論課堂必須強調(diào)的內(nèi)容。在課堂上,首先,我們要講解算法相關(guān)的基本概念,強調(diào)其嚴格的“步驟性”和面向“任務(wù)”的特性。其次,需要講解算法的最重要特性:正確性、時間復(fù)雜度、空間復(fù)雜度、并行可能性及其可實現(xiàn)性(變成代碼的難度)等等。然后,可以介紹一些經(jīng)典的算法思想,如貪婪算法、窮舉算法等等。當然,這些基本知識的傳授對學生理解生物信息學的工作方式是很有意義的。比如,經(jīng)典序列比對搜索工具Blast,對時效要求非常高,一方面是因為其搜索的數(shù)據(jù)庫的規(guī)模巨大,另一方面是因為來自全世界的網(wǎng)上訪問。所以,在講Blast算法的時候,我們要讓學生理解它是如何實現(xiàn)它的高效率的,其中就涉及到其對時間復(fù)雜度的降低以及貪婪算法思想的應(yīng)用等。再如,在講分子進化分析時,如果介紹“最大似然法”的算法,我們就可以向?qū)W生講解其窮舉算法的思想。生物信息學課講算法,決不僅僅是傳授不同問題的具體解決方法,更重要地是讓學生體會生物信息學的工作方式。生物專業(yè)的學生通過這些內(nèi)容可以知道:“原來,生物學研究還可以這樣進行”;而數(shù)學或計算機專業(yè)的學生會很興奮地發(fā)現(xiàn),原來他們所學到的知識和技能可以如此地應(yīng)用于解決生物學問題。這些內(nèi)容極可能觸發(fā)這些學生的興趣,讓他們進入生物信息學的殿堂,成為具有“學科”高度和眼界的相關(guān)人才。這樣才能使我國在生物信息學領(lǐng)域也可能有思想和理論的原創(chuàng)性,而不只是世界先進思想的跟隨者或?qū)嵺`者。
四、生物信息學應(yīng)用軟件的利用:研究結(jié)果的評估
當然,很多生物背景的學生并不會真正進入生物信息學領(lǐng)域。他們關(guān)心的只是怎么樣利用生物數(shù)據(jù)庫,以及怎樣運用別人開發(fā)好的軟件工具進行自己的研究。那么,傳統(tǒng)課堂的理論講授能不能在這方面也起到作用呢?
答案是肯定的。也許數(shù)據(jù)庫查詢方面的結(jié)果差異并不會很多,然而,用不同的軟件,即使針對同樣的問題并利用同樣的數(shù)據(jù),也往往得到不同的結(jié)果。有的時候,這些結(jié)果的區(qū)別還很大。那么,如何評估這些結(jié)果對于我們得出有效結(jié)論就至關(guān)重要。比如,在構(gòu)建進化樹的時候,各種構(gòu)樹方法可能得到不同的結(jié)果,我們要說明:各種方法的假設(shè),它們對其假設(shè)的敏感性(即如違背假設(shè),結(jié)果會不會錯得離譜),它們的統(tǒng)計特性(如估計一致性:樣本數(shù)據(jù)增加時,是否能傾向正確的樹),以及實踐過程中它們的一般表現(xiàn)如何(即符合實際情況程度的評價)等等。總的來說,我們的策略應(yīng)該是,各種方法都用——如果結(jié)果很相似,則此結(jié)果的可信度很高;如果結(jié)果明顯不同,就需要考慮上述有關(guān)假設(shè)、統(tǒng)計學以及符合程度等方面的評價。再如,在講解蛋白質(zhì)結(jié)構(gòu)預(yù)測的內(nèi)容,我們可以介紹兩年一屆的世界范圍內(nèi)的預(yù)測競賽:“CASP(Critical Assessment of Structure Prediction)”。各個參賽軟件的結(jié)果都不同,甚至可能相差甚遠;從而讓學生深刻地體會到,不同工具分析得到的結(jié)果不同是生物信息學研究領(lǐng)域的常態(tài)。的確,站在科學的高度,從研究方法上去評價生物信息學分析的結(jié)果,并基于生物學的背景知識去探討這些結(jié)果的意義十分重要——絕對不是會用某個或某些個軟件,就是生物信息學的專家了。
五、完備的生物信息學課程體系:兼得理論和實踐之妙
生物信息學的發(fā)展日新月異,方法和內(nèi)容上的更新都非常迅速。我們的理論課堂上需要傳授的內(nèi)容一定要站在相當?shù)母叨?,需要把生物信息學中不變的東西提煉出來,讓學生去體會。上述三個方面,從生命的信息內(nèi)涵,到生物信息學的研究方式,再到生物信息學軟件工具的利用方式,無一不是經(jīng)得起時間考驗的。當然,這里強調(diào)生物信息學基本理論思想和基礎(chǔ)概念的重要性,并不是否定實踐對這門學科的重要性。相反,我們要告訴學生,生物信息學是一個實踐性很強的學科,緊密聯(lián)系實踐,才能更深刻地體會和掌握它,才能在嶄新模式下的生物學研究中游刃有余。因此,一個好的方式是將生物信息學開成兩個課堂:傳統(tǒng)的講授課堂和新興的注重實踐的課堂。在傳統(tǒng)的講授課堂中,應(yīng)強調(diào)上述的基本理論思想和基礎(chǔ)概念,講解基本的數(shù)據(jù)庫和通用的應(yīng)用軟件工具的運用;而在注重實踐的新型課堂下,我們可以采用案例式教學、問題式教學、任務(wù)驅(qū)動式教學等方式。鑒于信息對生命科學的核心意義,建議前者開成必修課(可稱“生物信息學導(dǎo)論”,考慮到知識背景,應(yīng)開于分子生物學之后)。而實踐課應(yīng)該延后一學期,開成專業(yè)選修課(可稱為“生物信息學實踐”)。另外,由于一般來說,高校的研究生生源有很大差異,而生物信息學對現(xiàn)代生物學研究至關(guān)重要,所以這兩門本科課應(yīng)該通開于研究生,記選修學分??偟膩碚f,這樣就“兼得理論和實踐之妙”——我們可以期待,采取這種模式的生物信息學大學教育將為我國培養(yǎng)既有科學眼界、又有實踐能力的生物信息學人才。
參考文獻:
[1]Hodgman TC,F(xiàn)rench A,Westhend DR.Instant Notes in Bioinformatics,2nd edition[Z].Taylor & Francis Group,2010.
[2]Gilbert W.Towards a paradigm shift in biology[Z].Nature,1991,(349):99.
[3]劉念.案例教學法在《生物信息學》本科教學的應(yīng)用[J].考試周刊,2016,(78):152,191.
[4]朱柳村,李嘉睿.生物信息學創(chuàng)新教學模式的探究[J].安徽農(nóng)學通報,2017,23(6):179-181.
[5]鄒先瓊,林軍,廖錦鋒.任務(wù)驅(qū)動教學法在生物信息學教學中的實踐與思考[J].教育教學論壇,2017,(28):209-210.
[6]Ma WT.The essence of life[Z].Biological Direct,2016,(11):49.