杜 賓,劉 煒
(江西財經(jīng)大學 信息管理學院,江西 南昌 330032)
近年來,隨著信息技術和互聯(lián)網(wǎng)的爆發(fā)式跨越發(fā)展,人類進入萬物互聯(lián)的大數(shù)據(jù)時代,數(shù)據(jù)已成為當今世界的基礎性戰(zhàn)略資源。2012年美國總統(tǒng)奧巴馬宣布啟動“大數(shù)據(jù)研究與開發(fā)計劃”,旨在提高從海量數(shù)據(jù)中獲取知識和觀點的能力[1]。與此同時,我國高度重視大數(shù)據(jù)發(fā)展,制定《大數(shù)據(jù)產(chǎn)業(yè)發(fā)展規(guī)劃(2016—2020年)》,全面實施國家大數(shù)據(jù)戰(zhàn)略,助力中國經(jīng)濟從高速增長轉(zhuǎn)向高質(zhì)量發(fā)展[2]。隨著大數(shù)據(jù)的不斷開發(fā)和深入應用,各行各業(yè)對大數(shù)據(jù)方面的人才產(chǎn)生強烈的需求,許多知名企業(yè)開設大數(shù)據(jù)研究中心,與大學開展合作,因而催生了大學大數(shù)據(jù)專業(yè)教育[1],系統(tǒng)地講授數(shù)據(jù)分析(Data Analytics,DA)類課程。
數(shù)據(jù)分析是指運用適當?shù)臄?shù)學、統(tǒng)計方法和軟件工具剖析數(shù)據(jù),揭示數(shù)據(jù)內(nèi)在的價值和規(guī)律,形成合乎邏輯的解釋和描述,達到對客觀事物的科學認識[3]。同時,數(shù)據(jù)分析也是對數(shù)據(jù)的全方位探索和概括提煉,從海量數(shù)據(jù)中提取有效信息和形成結(jié)論的過程[4],不僅通過對真實數(shù)據(jù)的分析去發(fā)現(xiàn)問題,還能夠運用經(jīng)濟學、會計學、金融學原理建立數(shù)學模型,對投資、期權或其他決策是否具有可行性進行分析并給出解釋,預測未來的收益及風險情況,為科學合理的決策提供參考依據(jù)[5]。
由此可見,基于財經(jīng)類高校的教學實踐構建數(shù)據(jù)分析課程體系,能夠提升學生的專業(yè)能力和社會競爭力,滿足經(jīng)濟高速發(fā)展的金融市場需求,體現(xiàn)財經(jīng)類高校自身的辦學能力。
面對大數(shù)據(jù)時代,市場對數(shù)據(jù)分析的要求發(fā)生“質(zhì)”與“量”的轉(zhuǎn)變。從“質(zhì)”的維度看,數(shù)據(jù)分析的水平提升很高,要求掌握統(tǒng)計學、數(shù)據(jù)挖掘和機器學習的知識;從“量”的維度看,不僅數(shù)據(jù)分析人員的數(shù)量增大,而且數(shù)據(jù)分析的職位細化,層次分明。應基于金融市場上數(shù)據(jù)分析行業(yè)的調(diào)查數(shù)據(jù),將數(shù)據(jù)分析職業(yè)匹配勝任能力,明確高校培養(yǎng)的目標。高級別的職位需要覆蓋低職位的能力要求。
(1)數(shù)據(jù)專員。此職位能夠收集數(shù)據(jù)、整理數(shù)據(jù)并實現(xiàn)基本的可視化功能,對應的能力要求是篩選、排序、透視表、公式和函數(shù),并且能夠簡單的編程,這就要求熟練掌握Excel +Powerpoint + VBA。
(2)數(shù)據(jù)分析員。此職位能夠運用專業(yè)的數(shù)據(jù)庫管理數(shù)據(jù),對應的能力要求是增、刪、改、查詢、數(shù)據(jù)的讀入和寫出等操作以及使用、管理大型數(shù)據(jù)庫,這就要求熟練掌握SQL+RMSDB+領域知識。
(3)數(shù)據(jù)分析師。此職位能夠熟練駕馭統(tǒng)計學知識,包括多元回歸、假設檢驗、方差分析、蒙特卡羅和貝葉斯方法;同時,熟悉領域背景知識,可以做到了解企業(yè)現(xiàn)狀與競爭環(huán)境、風險評判與決策支持,能夠充分利用大數(shù)據(jù)帶來的價值[6],進行數(shù)據(jù)挖掘與可視化后,呈現(xiàn)給企業(yè)決策者的將是一份清晰、準確且有數(shù)據(jù)支撐的報告。
(4)數(shù)據(jù)科學家。此職位能夠完成數(shù)據(jù)分析師、商務智能等工作,并且精通統(tǒng)計學和計算機科學。熟悉領域背景的同時,掌握機器學習的技巧和方法,不僅可以處理數(shù)據(jù)、ETL、可視化,還能做到調(diào)節(jié)參數(shù)、選擇模型、優(yōu)化算法。數(shù)據(jù)科學家已不是簡單的IT技術人員,而是可以參與到企業(yè)決策、制訂發(fā)展戰(zhàn)略的核心人物[6]。
20世紀70年代,以“智力”測評為主的能力評價思想遭到廣泛的質(zhì)疑[7]。哈佛大學教授McClelland提出“勝任力”概念,認為成就動機、人際關系、團隊影響力才是真正影響績效的能力特征[8]。針對本科教育,大學的培養(yǎng)目標定位于數(shù)據(jù)分析師;針對研究生教育,大學的培養(yǎng)目標定位于數(shù)據(jù)科學家。以本科教育為例,與之匹配的數(shù)據(jù)分析師應該具有的能力對應的勝任力模型,主要有4個維度,具體有知識結(jié)構、人文能力、工具能力、程序設計能力。
數(shù)據(jù)分析屬于數(shù)據(jù)科學的分支,需要多學科全方位的知識儲備,并在分析實踐過程中積累經(jīng)驗值,主要覆蓋以下幾個方面。
(1)數(shù)學方面。微積分、概率論、線性代數(shù)等課程是大部分數(shù)據(jù)結(jié)構進行矩陣運算和數(shù)理分析的基本計算方法。
(2)統(tǒng)計方面。掌握描述性統(tǒng)計、統(tǒng)計推斷的基礎知識以及多元回歸等相關性分析和因果分析,融合結(jié)構化、非結(jié)構化數(shù)據(jù)進行數(shù)據(jù)建模和預測,至少會使用一種統(tǒng)計工具軟件,例如R、SPSS、Stata、SAS以及SciPy包等。
(3)數(shù)據(jù)庫方面。掌握SQL語言,了解MySQL、SQLServer、Oracle等高性能關系數(shù)據(jù)庫。
(4)程序設計語言方面。掌握至少一門計算機高級語言,例如C/C++、Java、VBA、Python等,并且具備程序設計思維和方法。
(5)算法方面。主要包括數(shù)據(jù)挖掘、機器學習等,其中數(shù)據(jù)挖掘是數(shù)據(jù)分析的高級階段,機器學習則是數(shù)據(jù)挖掘的高級部分。具體算法是無監(jiān)督學習的主成分分析(PCA)和聚類、有監(jiān)督學習的回歸和分類、半監(jiān)督的強化學習、深度學習等。
(6)數(shù)據(jù)可視化。當R、Python、SPSS、Stata等軟件的可視化功能不能滿足數(shù)據(jù)分析的要求時,可以選擇一些專業(yè)性強的可視化工具,如HighCharts、Tableau、Google Visualization API 等。
數(shù)據(jù)分析是一項全方位融合的技術性工作,離不開人文能力的支撐。人文能力的維度主要包括以下幾方面。
(1)行業(yè)領域知識。對行業(yè)及其背景的數(shù)據(jù)屬性、類型、結(jié)構非常了解,例如服務業(yè)、制造業(yè)、政府機關、事業(yè)單位等。
(2)創(chuàng)造力。數(shù)據(jù)分析工作本身就是一項數(shù)據(jù)挖掘、知識發(fā)現(xiàn)和創(chuàng)新為主的活動,因此并不缺乏創(chuàng)造力。
(3)項目管理能力。針對特定項目的數(shù)據(jù)集,在一定的約束條件下,負責人帶領團隊成員完成數(shù)據(jù)分析和知識發(fā)現(xiàn)任務的綜合管理能力。
(4)溝通能力。團隊負責人及其成員有效地將信息、知識、經(jīng)驗等進行溝通和共享,是完成DA工作的關鍵[7]。
根據(jù)DA知識結(jié)構的要求,數(shù)據(jù)分析離不開計算機硬件、軟件和軟件包,尤其是面向大數(shù)據(jù)。工欲善其事,必先利其器。因此,數(shù)據(jù)分析師需要擅長一些工具軟件。數(shù)據(jù)分析工具眾多,主要有3類:一是統(tǒng)計軟件或軟件包,例如R、SPSS、Stata、SAS以及SciPy包;二是可視化軟件,例如,R有3套可視化系統(tǒng),由Base、lattice、ggplot2構成;三是數(shù)據(jù)庫軟件,例如SQLServer、MySQL、Oracle等大型數(shù)據(jù)庫。
以良好的工具軟件或工具包為基礎,數(shù)據(jù)分析在一般情況下不需要大量的編程工作。但是對于數(shù)據(jù)分析師或者數(shù)據(jù)科學家來說,具備高水平的程序設計能力,是職業(yè)勝任力不可或缺的一部分,而且,面向計算思維、掌握編程語言或者編寫腳本(script)文件實現(xiàn)算法既是內(nèi)在能力要求也能夠體現(xiàn)強大的競爭力。當前流行且功能強大的語言或者軟件有Python、R、C/C++、Java、MATLAB、Ruby等;未來可期的還有Julia、Go等。
以財經(jīng)類高校信息管理與信息系統(tǒng)專業(yè)(智能金融方向)為例,構建DA課程體系,主要從3個方面闡述,即培養(yǎng)目標、課程組成及其之間的依賴關系。
面向財經(jīng)類高校,信息管理與信息系統(tǒng)專業(yè)(智能金融方向)的培養(yǎng)目標融合傳統(tǒng)的信息管理與信息系統(tǒng)專業(yè)+財經(jīng)類專業(yè),同時突出金融智能化特色。所以,具體目標是培養(yǎng)具有先進管理理念,掌握金融管理基礎知識、信息管理理論與系統(tǒng)科學方法,熟練掌握互聯(lián)網(wǎng)金融數(shù)據(jù)處理技術以及互聯(lián)網(wǎng)金融平臺開發(fā)方法,具備較強的金融大數(shù)據(jù)分析能力,在銀行、證券、保險等各類金融機構和管理部門以及政府機關、事業(yè)單位及互聯(lián)網(wǎng)金融企業(yè)從事信息管理、電子支付、咨詢服務、管理信息系統(tǒng)的實施、維護與評價等方面工作,具有健全人格、富有創(chuàng)新精神,同時具有較強實踐能力的互聯(lián)網(wǎng)金融方面的創(chuàng)新創(chuàng)業(yè)人才。依據(jù)培養(yǎng)目標可以發(fā)現(xiàn),數(shù)據(jù)分析日益成為專業(yè)教育的核心能力,數(shù)據(jù)分析課程體系服從于培養(yǎng)目標,并為培養(yǎng)目標奠定重要基礎。
依據(jù)高?!叭乃摹苯虒W育人體系,可將大學本科教育的所有課程劃分為4類:通識課程、基礎課程、專業(yè)理論課程、實踐課程。從這4類課程中提取與數(shù)據(jù)分析相關聯(lián)的多層次課程,納入數(shù)據(jù)分析課程體系,同時,將課程知識與數(shù)據(jù)分析職位要求相匹配,見圖1,詳細課程構成如下。
(1)通識課程。指專業(yè)課程以外的基礎教育課程[9],旨在拓寬學生的知識廣度和獨立思考判斷力,主要包括:微積分Ⅰ&Ⅱ、辦公軟件高級應用、西方經(jīng)濟學、會計學等。
(2)基礎課程。指信息管理與信息系統(tǒng)專業(yè)的基本理論課程,旨在培養(yǎng)學生的基本能力和基本素質(zhì),主要包括線性代數(shù)、概率論與數(shù)理統(tǒng)計、程序設計語言、管理學原理、學科專業(yè)導論等。
圖1 數(shù)據(jù)分析課程體系
(3)專業(yè)課程。指專業(yè)的主干課程,旨在講授本專業(yè)的核心理論和專門技能,主要有數(shù)據(jù)庫原理及應用、R語言數(shù)據(jù)分析導論、金融大數(shù)據(jù)分析、管理統(tǒng)計學、管理信息系統(tǒng)、貨幣銀行學等。
(4)實踐課程。純粹的或側(cè)重于實踐課程有R語言數(shù)據(jù)分析、程序設計實訓、專業(yè)實訓等。一般地,與數(shù)據(jù)分析有關的實踐環(huán)節(jié)大部分與理論課程并行,即專業(yè)課程既有理論教學也有實踐輔助設計,例如,金融大數(shù)據(jù)分析、數(shù)據(jù)庫原理與應用、程序設計語言、辦公軟件高級應用等。
數(shù)據(jù)分析體系內(nèi)每門課程不是孤立的存在,既有為后續(xù)課程做“鋪路石”的前導向課程,發(fā)揮基礎性支撐作用,如微積分為概率論與數(shù)理統(tǒng)計、數(shù)據(jù)庫原理及應用為數(shù)據(jù)庫開發(fā)技術、R語言數(shù)據(jù)分析導論為金融大數(shù)據(jù)分析等;也有學科交叉融合的創(chuàng)新特色課程,如管理統(tǒng)計學融合管理學和統(tǒng)計學、R語言數(shù)據(jù)分析導論融合計算機科學和統(tǒng)計學等;還有應用融合類課程,如計算機應用技術涵蓋Excel、Powerpoint等軟件。
另一方面,數(shù)據(jù)分析是面向過程、強實踐性的一類課程,更加注重理論教學與實踐教學的融合和一致性,提高學生解決復雜問題能力和創(chuàng)新創(chuàng)業(yè)能力。依據(jù)數(shù)據(jù)分析課程體系的構建理念,可以區(qū)別驗證性實驗、綜合性實驗、設計性實驗、創(chuàng)新性實驗的實踐教學項目,分層次遞進式設計實驗目標和實驗內(nèi)容。主要實踐環(huán)節(jié)劃分為專業(yè)基礎實驗、個性化培養(yǎng)階段、畢業(yè)實習、畢業(yè)設計、社會調(diào)查與學年論文、課外科研創(chuàng)新實踐活動。其中,在第一、二、三學年個性化培養(yǎng)階段(小學期或二階段)分別安排程序設計實訓、專業(yè)實訓Ⅰ和專業(yè)實訓Ⅱ,強化學生的綜合實踐能力。
將DA課程體系應用在財經(jīng)類高校的智能金融方向,將財經(jīng)類高校的金融市場領域與數(shù)據(jù)分析技術相結(jié)合,可以提升學生的金融大數(shù)據(jù)分析、建模與計算能力,并進一步強化學生的綜合實踐能力。具體課程設置與學期分布見表1。
課程知識與職位勝任力相匹配,一年一個臺階,形成分階遞進培養(yǎng)模式[10]。①第一學年通過必修課計算機應用技術和選修課辦公軟件高級應用,重點學習Excel、Powerpoint等,達到數(shù)據(jù)專員水平;②第二學年通過必修課數(shù)據(jù)庫原理及應用和程序設計語言,重點學習SQL語言和管理數(shù)據(jù)庫,能夠達到數(shù)據(jù)分析員水平;③第三學年通過選修課R語言數(shù)據(jù)分析導論和必修課金融大數(shù)據(jù)分析課程,重點學習數(shù)據(jù)分析的基本理論、方法和模型,接近金融行業(yè)的數(shù)據(jù)分析師水平。
目前,我國處于經(jīng)濟發(fā)展轉(zhuǎn)型的關鍵時期。宏觀上,大數(shù)據(jù)環(huán)境下的社會實體渴求具備數(shù)據(jù)分析能力的創(chuàng)新人才;微觀上,中國高校打造一流本科教育,著重培養(yǎng)創(chuàng)新創(chuàng)業(yè)精神。因此,破解傳統(tǒng)的課程結(jié)構體系,重構信息管理與信息系統(tǒng)專業(yè)的課程規(guī)劃,構建數(shù)據(jù)分析課程體系,是高等教育不斷探索創(chuàng)新的舉措。數(shù)據(jù)分析課程體系既包容傳統(tǒng)數(shù)據(jù)庫類課程,又納入金融大數(shù)據(jù)分析等新課程,整體處于快速探索階段。有理由相信在未來若干年,數(shù)據(jù)分析類課程能像數(shù)學、英語,進入其他學科課程體系并在眾多領域中綻放光彩。
表1 數(shù)據(jù)分析課程設置與學期分布