陳竹兵 徐汪華
摘 要:在信息化、網(wǎng)絡(luò)化高度發(fā)達(dá)的今天,數(shù)據(jù)增長速度飛快,以至于難以使用現(xiàn)有的數(shù)據(jù)庫管理工具來駕馭,因此“大數(shù)據(jù)”這一概念應(yīng)運(yùn)而生?!按髷?shù)據(jù)”在化學(xué)方面的影響鮮為人知,該文將討論大數(shù)據(jù)對化學(xué)的影響力是否可以深入到大學(xué)化學(xué)教育層面。
關(guān)鍵詞:化學(xué)信息學(xué) 在線學(xué)習(xí) 學(xué)生為中心 學(xué)習(xí)方式
中圖分類號:G434 文獻(xiàn)標(biāo)識碼:A 文章編號:1672-3791(2016)03(b)-0014-02
近幾年來,“大數(shù)據(jù)”很時髦,作為一個計算機(jī)信息用語被炒得很火。任何公司學(xué)習(xí)利用“大數(shù)據(jù)”,更好地掌握客戶的需求,從而實現(xiàn)利益擴(kuò)大化,因此在這種大環(huán)境下“大數(shù)據(jù)”已然成為一種趨勢。很多化學(xué)教育工作者認(rèn)為“大數(shù)據(jù)”與化學(xué)沒有相關(guān)性,其實非也。很多學(xué)生在化學(xué)學(xué)習(xí)過程中,已經(jīng)開始利用相關(guān)搜索引擎查詢化學(xué)數(shù)據(jù)、文獻(xiàn)以及相關(guān)信息。“大數(shù)據(jù)”在化學(xué)方面的影響鮮為人知,該文將討論大數(shù)據(jù)對化學(xué)的影響力是否可以深入到大學(xué)化學(xué)教育層面。
1 “大數(shù)據(jù)”的定義
人們生活在這樣大數(shù)據(jù)填充的世界里,“推特”每天產(chǎn)生超過7 TB的數(shù)據(jù),“臉書”每天產(chǎn)生超過10 TB的數(shù)據(jù),很多大企業(yè)已經(jīng)存儲了PB級別的海量數(shù)據(jù)。David Weinberger指出,根據(jù)美國圣地亞哥研究所的數(shù)據(jù),美國人在2008年全年使用了約3.6 ZB的數(shù)據(jù)。Weinberger解釋道,托爾斯泰的《戰(zhàn)爭與和平》有1 296頁,6英寸厚,電子版有2 MB。而1ZB等于5×1014本《戰(zhàn)爭與和平》。因此,人們開啟了“大數(shù)據(jù)”時代?!按髷?shù)據(jù)”并不只是數(shù)據(jù)量大,其經(jīng)典定義可以歸納為4個V:海量的數(shù)據(jù)規(guī)模(volume)、快速的數(shù)據(jù)流轉(zhuǎn)和動態(tài)的數(shù)據(jù)體系(velocity)、多樣的數(shù)據(jù)類型(variety)和巨大的數(shù)據(jù)價值(value)。其中,快速的數(shù)據(jù)流轉(zhuǎn)和動態(tài)的數(shù)據(jù)體系是大數(shù)據(jù)區(qū)分與傳統(tǒng)數(shù)據(jù)挖掘的最顯著特征[1]。
近些年來,分析文本和交易的大數(shù)據(jù)軟件引起了公眾的注意。即使他們沒刻意地關(guān)注大數(shù)據(jù)分析軟件,大多數(shù)化學(xué)工作者在工作過程中不經(jīng)意間也已經(jīng)接觸了大數(shù)據(jù),例如Google等搜索引擎的使用。因為大多數(shù)搜索引擎結(jié)合了多核處理和Hadoop框架來分析海量數(shù)據(jù)并篩選出搜索結(jié)果。這一類型更高端的分析工具還能夠計算出關(guān)鍵詞的出現(xiàn)頻率,文檔中情感是否轉(zhuǎn)變,甚至在大文字信息中,能篩選出最有影響力的觀點(diǎn)。當(dāng)這些分析工具運(yùn)用到社會媒體中時,有助于社會學(xué)家們對社會輿論的研究產(chǎn)生新的視角。
2 “大數(shù)據(jù)”對化學(xué)教育的影響
雖然數(shù)據(jù)分析的化學(xué)應(yīng)用尚未引起廣泛地關(guān)注,但是其他類型的大數(shù)據(jù)分析工具已經(jīng)在化學(xué)各領(lǐng)域展開了應(yīng)用,特別是化學(xué)教育領(lǐng)域。如分子模型,藥物、環(huán)境、毒理化學(xué)等。Lusher Scott指出,大數(shù)據(jù)分析方法在藥物化學(xué)研究領(lǐng)域的應(yīng)用已有十余年[2]。他們指出數(shù)據(jù)驅(qū)動藥物化學(xué)的這種方法在提高藥物研發(fā)決策力方面具有很大的潛能,所有的研發(fā)人員都信賴大數(shù)據(jù),在海量數(shù)據(jù)中發(fā)現(xiàn)有用信息從而發(fā)現(xiàn)有意義的相關(guān)性和形式[3]。
大數(shù)據(jù)分析工具在工業(yè)化學(xué)領(lǐng)域也已經(jīng)開始應(yīng)用了,對大數(shù)據(jù)的需求是很明顯的。一項研究數(shù)據(jù)顯示:由于低效的實驗設(shè)計及不充分的信息技術(shù),研發(fā)實驗中有40%被重復(fù)。
迄今,大數(shù)據(jù)在化學(xué)教育上的應(yīng)用似乎只局限在研究生水平[4]?;瘜W(xué)分支學(xué)科,如環(huán)境化學(xué)、化學(xué)信息學(xué)、藥理學(xué)等,處理大量的數(shù)據(jù)集和復(fù)雜的數(shù)據(jù)交互,主要停留在研究生和研究水平。但是隨著商業(yè)軟件的使用越來越便利,大數(shù)據(jù)在化學(xué)教育方面的應(yīng)用將會引申到大學(xué)本科層面。屆時,大數(shù)據(jù)對研究生化學(xué)教育的影響同樣體現(xiàn)在大學(xué)本科生的化學(xué)教育課程里。
大學(xué)化學(xué)專業(yè)的學(xué)生也會查詢、搜索網(wǎng)絡(luò)信息和數(shù)據(jù),但是他們一般都是訪問大數(shù)據(jù)庫,而不是大數(shù)據(jù),如CAS Scifinder數(shù)據(jù)庫、英國皇家化學(xué)協(xié)會ChemSpider數(shù)據(jù)庫。這些數(shù)據(jù)庫含有上百萬的化合物及其分析數(shù)據(jù),但是這些數(shù)據(jù)并不是大數(shù)據(jù),其大小最多只有TB量級。美國杜蘭大學(xué)Gibb團(tuán)隊預(yù)測在不久的未來,化學(xué)工作者們將會有一個數(shù)據(jù)管理系統(tǒng),這個系統(tǒng)將會自動分析化學(xué)文獻(xiàn),并根據(jù)研究熱點(diǎn)進(jìn)行分類??傊?,大數(shù)據(jù)已經(jīng)對化學(xué)研究和化學(xué)工業(yè)產(chǎn)生了很大的影響,化學(xué)已經(jīng)開始走進(jìn)“大數(shù)據(jù)”時代[5]。因此,針對那些未來可能會成為研究學(xué)者的大學(xué)本科生,大數(shù)據(jù)化學(xué)教育應(yīng)該引起關(guān)注。
3 “大數(shù)據(jù)”在化學(xué)教育領(lǐng)域中的應(yīng)用前景
大學(xué)化學(xué)學(xué)院需要找到正確的方式為學(xué)生引入大數(shù)據(jù)及相關(guān)技術(shù),以作用于化學(xué)教育。迄今為止,有一些報道已成功將大數(shù)據(jù)技術(shù)引入到大學(xué)本科化學(xué)課程中。Reisner等人描述了一種練習(xí),可以提高學(xué)生命名、歸檔數(shù)據(jù)文件。另外,有一些學(xué)者成功運(yùn)用云計算管理實驗數(shù)據(jù)。這些并沒有真正將大數(shù)據(jù)工具運(yùn)用到大學(xué)化學(xué)學(xué)生的化學(xué)教學(xué)中。但可以預(yù)見,隨著大數(shù)據(jù)技術(shù)的普及,在化學(xué)教育領(lǐng)域,大數(shù)據(jù)會在資料查詢、網(wǎng)絡(luò)在線學(xué)習(xí)、視頻教學(xué)等教學(xué)實踐和教學(xué)活動中扮演信息保存庫的角色。
對于很多教育者而言,第一次接觸大數(shù)據(jù)可能并不是來自他們在專業(yè)學(xué)科中的應(yīng)用,而是學(xué)院在提高學(xué)生成績時所作出的努力。學(xué)習(xí)管理系統(tǒng)、網(wǎng)絡(luò)課堂、網(wǎng)絡(luò)作業(yè)等搜集大量的學(xué)生行為方面的信息。越來越多的大學(xué)運(yùn)用大數(shù)據(jù)分析工具將這些信息轉(zhuǎn)化為切實可行的建議,幫助提高學(xué)生的成績[6]。八年前,亞利桑那州立大學(xué)首創(chuàng)性的結(jié)合eAdvisor系統(tǒng)和數(shù)據(jù)分析學(xué)來幫助那些學(xué)習(xí)成績比較差的學(xué)生提高畢業(yè)率。結(jié)果,這所大學(xué)的差生畢業(yè)率由26%提高到了41%。其他大學(xué)也在運(yùn)用大數(shù)據(jù)技術(shù)來管理學(xué)生的出勤率、作業(yè)完成率,并且?guī)椭鷮W(xué)生選擇合適的專業(yè)課。這些例子無疑表明大數(shù)據(jù)無論是在化學(xué)教育數(shù)據(jù)信息共享,還是化學(xué)課堂教學(xué)都有很好的應(yīng)用前景。
4 結(jié)語
大數(shù)據(jù)工具在工業(yè)、醫(yī)藥、環(huán)境以及毒理研究等領(lǐng)域已有廣泛的應(yīng)用,并且這種應(yīng)用在未來會越來越廣泛。因此,將大數(shù)據(jù)引入到大學(xué)化學(xué)課程中將會大有裨益。最起碼,學(xué)生能根據(jù)相應(yīng)的文件學(xué)到最佳的方法,并且他們可以根據(jù)合適的元數(shù)據(jù)可以知其然,知其所以然。在網(wǎng)絡(luò)信息日漸發(fā)達(dá)的現(xiàn)代教育時代,逐漸認(rèn)識并應(yīng)用大數(shù)據(jù),也是教育與時俱進(jìn)的表現(xiàn)形式。
參考文獻(xiàn)
[1] 孟小峰,慈祥.大數(shù)據(jù)管理:概念、技術(shù)與挑戰(zhàn)[J].計算機(jī)研究與發(fā)展,2013,50(1):146-169.
[2] 歐陽勤,王懿,李海波,等.藥物大數(shù)據(jù)時代下的藥物化學(xué)教育創(chuàng)新[J].現(xiàn)代醫(yī)藥衛(wèi)生,2015(12):1905-1907.
[3] Edwards M,Aldea M,Belisle M.Big data is changing the environmental sciences[J].Environmental perspectives, 2015(1):1-13.
[4] Davenport TH,Patil DJ.Data scientist:the sexiest job of the 21st century [J].Harvard business review,2012,90(10):70-76,128.
[5] Liu Y,Cai WS,Shao XG.Big data and chemical data mining [J].Chinese Journal,2015,60(8):694.
[6] 黃明燕,蔡祖銳.云計算教育應(yīng)用研究綜述[J].軟件導(dǎo)刊:教育技術(shù),2014,13(1):6-11.