黃 娟,王 獻(xiàn)
(中南民族大學(xué) 化學(xué)與材料科學(xué)學(xué)院,湖北 武漢 430074)
研究生教育是高等院校人才培養(yǎng)中重要環(huán)節(jié)之一,也是國家科技興旺發(fā)達(dá)與否的影響因素之一。在當(dāng)今大數(shù)據(jù)時代下,各個高校的研究生教育也需要跟上大數(shù)據(jù)時代的步伐,探討研究相關(guān)的教育改革措施[1],提高學(xué)生的綜合素質(zhì),培養(yǎng)學(xué)生的綜合能力,使學(xué)生能夠立足于今后的大數(shù)據(jù)時代之中?;瘜W(xué)及其相關(guān)專業(yè)作為科學(xué)研究中占比較重的學(xué)科,在大數(shù)據(jù)背景之下,其研究生綜合素質(zhì)培養(yǎng)亟待引起更多的關(guān)注。
大數(shù)據(jù)一詞常用于計算機、商業(yè)以及信息通訊領(lǐng)域,其主要特點有:大量(Volume)、迅速(Velocity)以及多樣化(Variety),即3V特征[2]。如圖1所示,大數(shù)據(jù)集成視圖的3個邊代表3個維度,分別為Volume、Velocity和Variety。三維維度的增長與準(zhǔn)確性呈負(fù)相關(guān),但與復(fù)雜性、變異性,衰退和價值呈正相關(guān)[3]。大數(shù)據(jù)不同層面的困難包括:數(shù)據(jù)捕獲、存儲、搜索、共享、分析、管理和可視化[4]。
近些年來與大數(shù)據(jù)相關(guān)的基礎(chǔ)研究及應(yīng)用發(fā)展迅猛,圖2是以big data 為關(guān)鍵詞,在web of science核心期刊數(shù)據(jù)庫中進(jìn)行檢索后生成的統(tǒng)計結(jié)果圖(截至2019年2月20日)。圖中反映出2012至2016年,文獻(xiàn)發(fā)表數(shù)量增幅均在20%以上,此五年平均增幅為42.6%。從學(xué)科方向上來看,排在前五位的學(xué)分分別為:計算機科學(xué)、工程學(xué)、數(shù)學(xué)、電信學(xué)以及生態(tài)環(huán)境學(xué),而化學(xué)類只排在第16位。不過與2014年文獻(xiàn)數(shù)據(jù)[5]比較而言,排名有些許提升,化學(xué)中大數(shù)據(jù)的整理與挖掘有較大的提升潛力,需要得到更多的關(guān)注。
科研文獻(xiàn)是創(chuàng)新靈感的重要來源之一,由于科研文獻(xiàn)的數(shù)量呈指數(shù)級增長,研究人員發(fā)現(xiàn)新的研究課題和課題的改變將會越來越具有挑戰(zhàn)性。如果能夠借助文本挖掘,將可視化技術(shù)應(yīng)用于文獻(xiàn)的主題分析,從大型文本流中提取有價值的內(nèi)容,則可大大提高科研熱點趨勢的獲取效率,發(fā)現(xiàn)特點特定知識領(lǐng)域的主要研究主題、新興主題及研究前沿和主題演變[6]。
Nadine Schneider等[7]利用近年熱門的文本挖掘技術(shù),分析了過去近40年(1976~2015年)從美國專利中檢索到的化學(xué)反應(yīng)和所涉及到的分子。結(jié)果顯示藥物專利中,使用的不同反應(yīng)類型的數(shù)量穩(wěn)步增加,但某些反應(yīng)類別的平均產(chǎn)率較低。2006~2015年,每個專利包含的反應(yīng)數(shù)由1976~1985年的6.2增加到20.1。在反應(yīng)類型中,雜原子烷基化及芳基化最多(占27.8%),乙?;南嚓P(guān)反應(yīng)次之(占21.3%)。前10名平均反應(yīng)率在86%~97%之間,主要反應(yīng)類型為官能團(tuán)轉(zhuǎn)換,后10名平均反應(yīng)率在43%~52%之間,主要為雜原子芳基化和烷基化。最后發(fā)現(xiàn)如今的藥物分子比40年前的更大、更疏水及更具剛性。在未來10年間,鉑催化的反應(yīng)、胺偶聯(lián)及還原胺反應(yīng)將會繼續(xù)增長,Click法和新3+2雜環(huán)形成法會更加受歡迎,而保守的鉻、鋁、錫等化學(xué)物質(zhì)將會被拋棄。
Chang等[8]報道了一種文本挖掘的方法,從PubMed出版物中提取的2128種候選生物標(biāo)記物中確定了肝癌的的潛在生物標(biāo)志物。為了縮小范圍廣泛的生物標(biāo)記以進(jìn)行進(jìn)一步的臨床驗證,生物信息學(xué)家需要使用已發(fā)表作品中提供的信息對其進(jìn)行分類。生物醫(yī)學(xué)文本挖掘是一種在大量生物醫(yī)學(xué)知識中獲取感興趣信息的自動化方法,從而能夠提取與某些疾病相關(guān)的生物標(biāo)記物的數(shù)據(jù)。這種方法可以顯著減少研究肝病等重要疾病所花費的時間和精力。
這些應(yīng)用還包括從文獻(xiàn)中提取藥物-藥物相互作用的藥代動力學(xué)證據(jù)[9]。當(dāng)然這些科研大數(shù)據(jù)技術(shù)的應(yīng)用離不開數(shù)據(jù)庫的開發(fā)與建立[10],從文獻(xiàn)的發(fā)掘[11]到數(shù)據(jù)的采集及處理[12, 13]_ENREF_10,甚至實驗方案的優(yōu)化設(shè)計[7, 14~16],均需要開發(fā)建立相應(yīng)的數(shù)據(jù)庫及工具。
從了解知曉各種數(shù)據(jù)庫、自然語言處理及文本數(shù)據(jù)挖掘技術(shù)[17]到盡可能掌握和利用這些數(shù)據(jù)庫及相應(yīng)技術(shù)來提取相關(guān)信息,這樣才能更好地幫助自己擴大知識背景,加深實驗理論研究,提高實驗效率。
不管是文獻(xiàn)閱讀及歸納,還是思路梳理及課題設(shè)立,亦或是從方法羅列及篩選,到實驗設(shè)計及優(yōu)化,再到數(shù)據(jù)采集及處理,直至最后結(jié)果分析及拓展。大數(shù)據(jù)及其相關(guān)技術(shù)能夠在科研的各個環(huán)節(jié)發(fā)揮其數(shù)據(jù)挖掘的功能[18],從大方向上把握整體科研的趨勢及走向。
在大數(shù)據(jù)時代下,科研工作者不僅自身需要學(xué)習(xí)大數(shù)據(jù)的相關(guān)技術(shù),更需要在培養(yǎng)學(xué)生的時候主動提升他們的相關(guān)綜合素質(zhì),導(dǎo)師和學(xué)校是研究生培養(yǎng)的關(guān)鍵所在。
大數(shù)據(jù)時代下導(dǎo)師更需要對學(xué)生側(cè)重以下幾種能力的培養(yǎng):收集能力、管理能力、分析能力以及應(yīng)用能力。
4.1.1 個性化引導(dǎo)與鼓勵
通過收集并傳遞一定數(shù)量的文獻(xiàn),導(dǎo)師需要引導(dǎo)學(xué)生從篩選中的文獻(xiàn)中學(xué)習(xí)及掌握實驗研究所涉及的一些基礎(chǔ)知識及必要操作。引導(dǎo)學(xué)生拓寬研究課題的應(yīng)用領(lǐng)域,鼓勵并培養(yǎng)學(xué)生對于化學(xué)研究的學(xué)習(xí)興趣,發(fā)揮其主觀能動性。通過進(jìn)一步的文獻(xiàn)調(diào)研,歸納總結(jié),匯報討論等形式培養(yǎng)學(xué)生對新知識的接受與學(xué)習(xí)能力。大數(shù)據(jù)時代不僅是數(shù)據(jù)收集,還需要數(shù)據(jù)的整理歸納,更重要的是從這些數(shù)據(jù)中衍生出經(jīng)自己吸收并消化后的產(chǎn)物。即大數(shù)據(jù)的收集性,管理性,分析性和應(yīng)用性。
4.1.2 研究方向的擬定
導(dǎo)師可以根據(jù)自身研究方向,結(jié)合學(xué)生在前期文獻(xiàn)檢索中對某類課題感興趣的程度擬定其研究的方向。引導(dǎo)學(xué)生對已有文獻(xiàn)的收集、管理、分類,與導(dǎo)師及小組成員分享其心得與想法,共同對擬定的研究課題進(jìn)行改進(jìn)與完善。當(dāng)學(xué)生在擬定的研究方向上進(jìn)行順利時,可鼓勵并引導(dǎo)其對此方向進(jìn)行適度的拓展延伸。當(dāng)學(xué)生在擬定的研究方向上受到挫折時,導(dǎo)師需要鼓勵并引導(dǎo)學(xué)生主動去發(fā)現(xiàn)解決并解釋實驗中的問題,而不是擱置或回避實驗中出現(xiàn)的問題與現(xiàn)象。
4.1.3 數(shù)據(jù)分析軟件的熟練應(yīng)用
可視化是大數(shù)據(jù)相關(guān)技能中重要的一項。如何利用軟件將數(shù)據(jù)轉(zhuǎn)化成圖形或圖像便于讀者更好地理解作者所表達(dá)的內(nèi)容,這是科研人員必備的一項能力,也是學(xué)生所需要學(xué)習(xí)并掌握的技能。
數(shù)據(jù)分析與處理是文章的撰寫中重要的一個環(huán)節(jié),學(xué)生能夠熟練的掌握這一項技能,不僅能夠增加其自信心,提高論文撰寫效率,更能使其在以后的科研工作中如魚得水。應(yīng)用能力的提升甚至在非科研領(lǐng)域也能為其帶來意想不到的收獲。導(dǎo)師可以將本課題組所涉及到的一些數(shù)據(jù)分析軟件的常用操作進(jìn)行整理,并撰寫成冊,讓學(xué)生經(jīng)常溫習(xí)演練。對于不常用的軟件功能也需要讓學(xué)生熟悉,鼓勵學(xué)生多掌握幾種最新的軟件,盡可能全面了解軟件中所有的功能。
大數(shù)據(jù)時代,僅僅依靠導(dǎo)師對學(xué)生綜合素質(zhì)強化是遠(yuǎn)遠(yuǎn)不夠的,學(xué)校也需要在研究生綜合素質(zhì)培養(yǎng)的環(huán)節(jié)上做出力所能及的努力與貢獻(xiàn)。
4.2.1 重視與時俱進(jìn)的文獻(xiàn)檢索技能實踐課程
院校不僅要培養(yǎng)學(xué)生傳統(tǒng)的文獻(xiàn)檢索技能,更需要培養(yǎng)與時俱進(jìn)的檢索能力。這不僅能夠提升學(xué)生的檢索能力更能幫助其開拓視野,更好的適應(yīng)當(dāng)下的大數(shù)據(jù)時代。同時也避免了學(xué)校圖書館所擁有的數(shù)據(jù)庫資源浪費現(xiàn)象的發(fā)生。
4.2.2 重視流行及新興學(xué)術(shù)應(yīng)用軟件的培訓(xùn)
學(xué)校應(yīng)該多舉辦一些流行的以及新型的學(xué)術(shù)應(yīng)用軟件培訓(xùn)講座,可將此講座納入創(chuàng)新學(xué)分統(tǒng)計之中。學(xué)校及各個學(xué)院可以適當(dāng)鼓勵學(xué)生成立一些軟件社團(tuán),給學(xué)生之間創(chuàng)造或增加交流的機會與空間。盡可能多舉辦一些軟件分析的講座及經(jīng)驗分享交流會,使大家能熟悉和了解大數(shù)據(jù)時代的數(shù)據(jù)分析軟件,加強大數(shù)據(jù)時代下學(xué)術(shù)生態(tài)鏈系統(tǒng)的完善性。
4.2.3 重視與計算機等學(xué)科的交叉培養(yǎng)
從大數(shù)據(jù)應(yīng)用程度來看,計算機科學(xué)、工程學(xué)、數(shù)學(xué)、電信學(xué)以及生態(tài)環(huán)境學(xué)排在前列,學(xué)?;?qū)W院可根據(jù)自身學(xué)科狀況,設(shè)立一些交叉培養(yǎng)方案,鼓勵大數(shù)據(jù)優(yōu)勢學(xué)科進(jìn)入各個學(xué)科之中。讓學(xué)生能夠接觸大數(shù)據(jù)時代下與其相關(guān)度較高的一些基本技能。從教育改革角度出發(fā),學(xué)校需要設(shè)立更多的化學(xué)交叉學(xué)科,特別是需要重視及設(shè)立與計算機相關(guān)的交叉專業(yè),從而能夠產(chǎn)出更多的混合型人才。
4.2.4 增加交叉合作成果的認(rèn)可度
院校應(yīng)該增加大數(shù)據(jù)相關(guān)學(xué)科的合作認(rèn)可度,提高各學(xué)科之間的合作動力,對涉及大數(shù)據(jù)相關(guān)的研究內(nèi)容及工作量應(yīng)該另立標(biāo)準(zhǔn)。可鼓勵大數(shù)據(jù)相關(guān)文章發(fā)表在學(xué)校校報,或者其他同水平或更高水平期刊雜志中。
4.2.5 增加大數(shù)據(jù)相關(guān)教育研究的經(jīng)費預(yù)算
對于大多數(shù)研究者來說,大數(shù)據(jù)可能是一個陌生又熟悉的領(lǐng)域。增加大數(shù)據(jù)相關(guān)教育或研究的經(jīng)費,能夠引導(dǎo)研究人員多接觸了解此領(lǐng)域,同時幫助其找到與之相關(guān)的交叉領(lǐng)域的研究課題。研究人員或?qū)熋碌膶W(xué)生也能夠擁有一定的經(jīng)費開展相關(guān)的學(xué)習(xí)與研究。
4.2.6 聯(lián)系相關(guān)企業(yè)進(jìn)校宣講
讓學(xué)生認(rèn)識到,大數(shù)據(jù)時代下,各個企業(yè)對于某些技能的需求,以及各個科技公司在大數(shù)據(jù)技能中的發(fā)展?fàn)顩r。聯(lián)系相關(guān)企業(yè)進(jìn)校宣講,不僅能夠提高學(xué)生對于掌握大數(shù)據(jù)相關(guān)技能的興趣,更能幫助學(xué)生擴大就業(yè)范圍,同時還能幫助相關(guān)企業(yè)解決用人問題。
在大數(shù)據(jù)時代,科研工作者自身需要不斷接觸并學(xué)習(xí)大數(shù)據(jù)相關(guān)的應(yīng)用技術(shù),利用相關(guān)軟件提高自己的科研綜合能力。作為導(dǎo)師,需要培養(yǎng)學(xué)生各項綜合能力,提高其在大數(shù)據(jù)時代的綜合素質(zhì),使他們面對今后的工作能夠更加自信。為國家的科技教育事業(yè)多做貢獻(xiàn)應(yīng)該是每一位導(dǎo)師的責(zé)任與追求。