陳燕 郎坤 王聰
[摘 要] 針對管理類研究生大數據課程建設問題,從大數據課程內容理論體系、課程內容體系、課程實驗與實踐體系、課程應用工具與模型系統(tǒng)體系等角度考慮大數據課程的前驅和后繼,探討大數據課程建設內容,對如何上好研究生大數據課程進行探討,并提出合理建議。
[關鍵詞] 大數據;課程體系建設;管理類研究生
[基金項目] 中央高校基本科研業(yè)務費專項資金資助“航運與綜合交通運輸大數據關鍵技術與管理決策研究”(3132019353)
[作者簡介] 陳燕(1952—),女,遼寧大連人,博士,大連海事大學教授,博士生導師,研究方向:數據倉庫與數據挖掘、大數據等。
[中圖分類號] G643? ? [文獻標識碼] A? ? [文章編號] 1674-9324(2020)19-0275-02? ? [收稿日期] 2019-09-30
一、引言
隨著大數據的迅速發(fā)展,各高校逐年遞增大數據課程,迫使科學工作者不僅要了解大數據的概念、知識及如何分析處理大數據,而且高校的學生也要及時補充大數據專業(yè)知識。據500強公司統(tǒng)計數據,85%的公司都籌劃推出大數據項目。這也表明大數據課程開設的必要性。在國外多數高校都開設了大數據課程并針對大數據立項開展應用研究。
二、本科大數據課程建設內容
筆者曾提出關于本科大數據課程建設內容包括:(1)大數據課程理論體系;(2)大數據課程內容體系;(3)大數據課程的實驗體系;(4)大數據的應用工具與大數據課程的模型系統(tǒng)。本專業(yè)的學生可以根據大數據的前驅和后繼課程來選擇自己的課程內容,具體內容可參考《高校大數據課程內容體系探討》等相關文獻。
三、研究生大數據課程建設內容探討
(一)管理類研究生大數據課程內容理論體系
將管理類研究生細分為:博士與碩士研究生,開設的研究生課程則在大數據課程的學識和難易程度作更細的規(guī)定,針對博士研究生,可以根據下述的前驅、后繼及大數據本身的課程,按照知識結構及體系,選擇課程理論。因此,管理類研究生大數據課程理論體系總結為三部分。
1.前驅課程理論:高等數學理論、線性代數理論、多目標優(yōu)化理論、高級統(tǒng)計學理論、計算機軟件與硬件理論、計算機組成原理理論、數據結構建模理論、圖論、網絡理論、編碼理論、計算機系統(tǒng)結構理論、電子線路理論、有限自動機理論、信息集成與云存儲理論、數據庫高級管理理論、操作系統(tǒng)理論、多維信息組織與綜合管理理論、面向對象的高級語言程序設計方法與理論、綜合管理與群決策理論、多維數據建模理論與方法、非結構化數據挖掘理論與方法等相關理論。
2.大數據課程理論:非結構化異構數據整合與標準化理論、非結構化公共信息平臺建立機制與相關理論、機器學習與深度數據挖掘模型及相關理論、分布式并行計算理論與方法、編譯理論與方法、壓縮編碼理論與方法、非結構化數據庫建立與壓縮存儲方法(如:圖數據庫、圖像存儲與壓縮數據庫、聲音與視頻壓縮及存儲、文本數據庫壓縮存儲等)相關理論。
3.后繼課程理論:非結構化智能群決策支持系統(tǒng)建模理論、大數據開發(fā)工具與超網絡環(huán)境下深度挖掘理論及應用、非結構化超文本處理技術與應用理論、一體化運輸綜合監(jiān)控管理與智能群決策支持系統(tǒng)應用理論、多維存儲技術與虛擬計算、以運輸領域為主的知識圖譜理論方法及應用研究、非結構化數據庫建立理論方法及應用研究、快速多維空間信息搜索引擎理論方法及應用研究、大數據與城市計算理論及模型應用研究、圖數據庫的關聯分析與知識發(fā)現模型及理論、圖像與視頻(聲音)分析模型與存儲理論應用研究、物流等領域模擬與仿真理論與模型系統(tǒng)應用研究等理論。
(二)管理類研究生大數據課程內容體系
1.前驅課程教材:《高等數學》《計算機概論》《計算機原理》《線性代數》《高級統(tǒng)計學》《離散數學》《Office、JAVA編程》《面向對象程序設計》《信息科學相關課程》《數據結構》《網絡與設計》《計算與方法》《信息檢索》《數據庫原理》《運籌學》《模糊數學》《公共信息平臺建立方法》《軟計算》《數據倉庫建立方法》《編譯原理》《數據挖掘技術與應用》《linux操作系統(tǒng)》《科學知識圖譜》。
2.大數據課程:大數據技術與應用、文本挖掘、機器學習、深度挖掘模型系統(tǒng)。
3.后繼課程:大數據工具、架構、平臺建立技術與方法,非結構化異構數據處理與模型應用,交通運輸大數據處理及模型應用研究。
(三)管理類研究生大數據課程教學的實驗與實踐體系
對于管理類研究生而言,最好在實驗和實踐時,先熟練掌握建立數據庫的技術與方法,再掌握建立數據倉庫的技術與方法,然后進行數據倉庫的數據挖掘,以及挖掘模型的建立等試驗環(huán)節(jié),最后建立基于大數據公共信息平臺的數據挖掘與非結構化數據分析模型系統(tǒng)。
大數據課程的實驗體系的主要內容有:(1)掌握一種面向某領域的搭建大數據試驗系統(tǒng)和平臺的技術與方法;(2)具備安裝大數據應用環(huán)境的細茸軟件,如:大數據環(huán)境下Hadoop軟件系統(tǒng)等相關運行軟件系統(tǒng);(3)能夠運用某一種自然語言處理軟件,如:提供一個簡單而強大的應用接口,以提供全文索引與搜尋所用;(4)語言技術平臺(LTP)的應用實踐,重點任務是掌握某自然語言翻譯的全過程,如(以英語為例):根據語法樹和實際語言正則表達式特點,進行語法分析然后切分字符去停用詞最后形成目標句子。
(四)管理類研究生大數據的應用工具與模型系統(tǒng)
1.管理類研究生大數據的應用工具。前驅課程應用工具:MATLAB、SPSS、SAP、C語言、JAVA、VB、OLAP、匯編語言程序設計、數據結構、計算軟件、模擬仿真軟件、DB2、VFP、DelphiI、Oracle、Access、mysql。
2.大數據應用工具:Cloudera、MongoDB、Talend、OpenRefine、Datacleaner、Excel(MS)、RapidMiner、IBM SPSS Modeler、Teradata、Silk、chartio。
3.后繼課程應用工具:Lunix、自然語言翻譯軟件、weka、Hadoop、R語言、python、Hive、Hbase、Hdfs、Storm、Flume、Scala等。Unix、Spss26升級版本、數據與數據可視化工具如SQL等、基于Sqoop、Flume、Qozie、Hue協(xié)同框架的應用等、非結構化數據處理技術與模型應用、大數據相關項目研究。
4.管理類研究生大數據的模型系統(tǒng)。按照管理類研究生研究方向及內容,將管理類研究生大數據的模型系統(tǒng)內容歸納如下:預測模型系統(tǒng)、基于文本挖掘的相關推薦模型系統(tǒng)、最優(yōu)化模型系統(tǒng)、聚類與模糊聚類模型、快速發(fā)現知識相關算法、大數據的知識圖譜、大數據與城市計算等。
四、如何講好研究生大數據課程的探討
除了上述提到的大數據課程內容理論、教材內容、實驗與實踐體系內容要求外,還應該根據每位研究生具體情況和實際能力因材施教。
(一)教材體系方面
1.基礎理論與技術體系教材包含大數據采集技術與理論、非結構化數據整合與存儲技術及方法、大數據公共信息平臺建立技術與方法、搭建大數據架構技術與方法等。
2.綜合管理類教材包含數據倉庫、數據挖掘、大數據環(huán)境下數據庫與數據倉庫的建立技術方法、一體化運輸環(huán)境下綜合管理與監(jiān)控管理決策方法、物流信息管理與決策、預測與決策支持系統(tǒng)、客貨運量預測與決策分析等。
3.大數據模型系統(tǒng)教材內容的選取在選擇其教材時,應該注意該課程的覆蓋面是否滿足大數據課程內容的要求。比如:某研究生具備信管專業(yè)基礎,那么,應該在數學建模方面多實踐優(yōu)化和非結構化圖像處理等模型系統(tǒng);如果某研究生來自數學專業(yè)的,那么,應該在計算機綜合信息管理與決策模型方面增加實踐環(huán)節(jié)。
(二)注重大數據的實驗與實踐環(huán)節(jié)
大數據課程不能紙上談兵,是一門實踐性和理論性非常強的課程,因此,打鐵得自身硬,需要講授本課程教師具備強的實踐能力。本課程在教師的選拔上應該符合如下的要求:(1)具備搭建大數據架構的能力;(2)具備計算機多維數據組織與建模能力;(3)具備結構化與非結構化數據建模、處理與決策分析能力;(4)具備高級語言程序設計基礎與實踐能力。
五、結語
本文在提出大數據課程相關要求的同時考慮到大數據課程的前驅和后繼,進而完善了研究生大數據課程的建設體系,從而更系統(tǒng)地完成研究生教學。
參考文獻
[1]陳燕.數據挖掘技術與應用[M].北京:清華大學出版社,2011.
[2]陳燕.數據倉庫與數據挖掘教程[M].大連:大連海事學院出版社,2006.
Discussion on the Construction of Big Data Course System for Graduate Students Majoring in Management
CHEN Yan, LANG Kun, WANG Cong
(School of Shipping Economics and Management, Dalian Maritime University,
Dalian, Liaoning 116026, China)
Abstract:Aiming at the construction of Big Data course system for graduate students majoring in management, this paper considers the preliminary and follow-up work of Big Data course from the aspects of course theory system, course content system, course experiment and practice system, course application tool and model system. It explores the course construction content and how to teach the course well, and puts forward reasonable suggestions.
Key words:Big Data; course system construction; graduate students majoring in management