主題論壇:大數(shù)據(jù)學(xué)科與人才
5月25日下午,“大數(shù)據(jù)學(xué)科與人才”主題論壇在貴陽金陽萬麗酒店5F黃果樹廳舉行,清華大學(xué)計算機科學(xué)與技術(shù)系教授,黨委書記,教育部在線教育研究中心副主任孫茂松作為論壇主席主持了會議。孫茂松教授表示,大數(shù)據(jù)要能夠真正地落地需要很多關(guān)鍵因素的促成,人才是其中關(guān)鍵的一環(huán)。沒有成熟的學(xué)科體系和人才培養(yǎng)機制,就無法提供優(yōu)秀的后備人才,因此以此為主題邀請了國內(nèi)外專家學(xué)者從不同角度介紹和探討大數(shù)據(jù)學(xué)科建設(shè)和人才培養(yǎng)的工作。會議現(xiàn)場氣氛熱烈,與會嘉賓與專業(yè)觀眾還進行了深入的互動交流。
主持人孫茂松教授與演講嘉賓陳振沖教授交流
會場觀眾
演講嘉賓與專業(yè)觀眾互動
對于大數(shù)據(jù)人才培養(yǎng)上面臨的挑戰(zhàn),孫茂松教授表示,當(dāng)前大數(shù)據(jù)領(lǐng)域的人才培養(yǎng)機制僅是在現(xiàn)有框架體系下做了延展,并沒有完全按照大數(shù)據(jù)包含的領(lǐng)域來設(shè)計體系,這也與大數(shù)據(jù)的領(lǐng)域特征有關(guān)。
首先,大數(shù)據(jù)領(lǐng)域比較廣泛,多樣性比較高,包括機器學(xué)習(xí)、并行計算、人工智能、統(tǒng)計學(xué)等多領(lǐng)域,同時還包括與工業(yè)領(lǐng)域的諸多結(jié)合,這樣豐富的內(nèi)容讓大數(shù)據(jù)的課程設(shè)置很難全面覆蓋,大數(shù)據(jù)的研究是相當(dāng)龐雜的。
其次,大數(shù)據(jù)業(yè)務(wù)跨度不斷擴大,涉及深度學(xué)習(xí)、基礎(chǔ)學(xué)習(xí)、腦部深度計算、工程技術(shù)等,動輒都是幾十億的數(shù)據(jù),且縱向延伸非常深,其研究需要極廣泛的積累。
再次,大數(shù)據(jù)還具備很高的前沿性。基礎(chǔ)科學(xué)、技術(shù)科學(xué)都是最前沿領(lǐng)域,采用最先進的技術(shù),同時需要跟工業(yè)領(lǐng)域深度結(jié)合。如果重新設(shè)計大數(shù)據(jù)的課程體系,需要選擇上游某一段進行若干種組合,目前系統(tǒng)性的嘗試仍未開始。
孫茂松教授接受采訪
香港理工大學(xué)教授、學(xué)務(wù)長陳振沖教授認為,社會對數(shù)據(jù)科學(xué)人才的需求量非常大,目前學(xué)校提供的數(shù)據(jù)科學(xué)人才數(shù)量遠不夠。McKinsey Global Institute針對大數(shù)據(jù)人才需求所做的一個研究結(jié)果表明,到2018年,美國面臨14萬~19萬的數(shù)據(jù)分析師缺口,150萬的管理和運營人才。與數(shù)據(jù)緊密相關(guān)的產(chǎn)業(yè)都急需大數(shù)據(jù)人才,包括互聯(lián)網(wǎng)、電子商務(wù)、金融、工業(yè)服務(wù)、教育、娛樂文化、游戲、信息安全、O2O、社交媒體等。通過他們對中美兩國對數(shù)據(jù)學(xué)科人才的招聘需求分析得出,目前市場所需的數(shù)據(jù)學(xué)科人才主要分為兩類:數(shù)據(jù)科學(xué)家和數(shù)據(jù)分析師。對于數(shù)據(jù)分析師的學(xué)歷要求相對數(shù)據(jù)科學(xué)家有所降低,而工作經(jīng)驗要求則高于數(shù)據(jù)科學(xué)家。綜合來看,合格的數(shù)據(jù)數(shù)據(jù)分析師需要具備較強的應(yīng)用能力,收集管理數(shù)據(jù);利用工具或軟件分析數(shù)據(jù)并生成報告,撰寫報告;利用工具或軟件進行數(shù)據(jù)挖掘;實現(xiàn)不同的算法。合格的數(shù)據(jù)科學(xué)家需要具備分析、研究、解決問題的能力;建立數(shù)據(jù)模型,分析模型;設(shè)計和實現(xiàn)數(shù)據(jù)分析、數(shù)據(jù)挖掘的算法;與商業(yè)或決策部門合作,利用數(shù)據(jù)分析結(jié)果提供決策支持。
美國伊利諾伊大學(xué)香檳分校教授翟成祥認為,從教育理論來講,大數(shù)據(jù)的價值將來很多方面體現(xiàn)在人的感知能力和判斷能力,是一種擴充,是智能助手。大數(shù)據(jù)的課程設(shè)置應(yīng)該緊密結(jié)合大數(shù)據(jù)的應(yīng)用來設(shè)計,即4個A:第一個是acquisition(數(shù)據(jù)的獲?。?,第二是aggregation(數(shù)據(jù)的整合),第三是analysis(數(shù)據(jù)的分析),第四個是application(數(shù)據(jù)的應(yīng)用)。這4個A是一個循環(huán)。acquisition,涉及傳感器的分布,如何優(yōu)化獲得的數(shù)據(jù)等;aggregation,涉及數(shù)據(jù)庫、搜索引擎、信息檢索包括對數(shù)據(jù)的理解等;analysis,涉及數(shù)據(jù)挖掘和統(tǒng)計模型、高性能分析;對于application,目前比較可行的是用云計算的方式來支撐,因為數(shù)據(jù)比較大,另外一個發(fā)展方向是人工智能。
翟成祥教授表示,大數(shù)據(jù)時代已經(jīng)到來,帶來了挑戰(zhàn)和機遇。挑戰(zhàn)就是我們要培養(yǎng)什么樣的人才,機遇就是可以改進教育,人才教育與教育方式二者結(jié)合起來,既能解決挑戰(zhàn),也能抓住機遇。
清華大學(xué)計算機系教授、副系主任武永衛(wèi)介紹,2015年CSDN社區(qū)經(jīng)過統(tǒng)計認為,未來3~5年中國所需的數(shù)據(jù)科學(xué)人才是180萬,但是目前國內(nèi)只有30萬此類人才,缺口達到了150萬。這說明了國內(nèi)數(shù)據(jù)科學(xué)人才培養(yǎng)的急迫性。目前大數(shù)據(jù)人才分為應(yīng)用數(shù)據(jù)分析師、數(shù)據(jù)系統(tǒng)構(gòu)架師、算法設(shè)計工程師3類。應(yīng)用數(shù)據(jù)分析師具備行業(yè)應(yīng)用領(lǐng)域知識,可提供基于數(shù)據(jù)挖掘分析的戰(zhàn)略決策。數(shù)據(jù)系統(tǒng)架構(gòu)師對數(shù)據(jù)的存儲、分析與處理等技術(shù)和系統(tǒng)架構(gòu)有深入理解。算法設(shè)計工程師則注重數(shù)據(jù)分析算法設(shè)計,統(tǒng)計分析為核心的數(shù)學(xué)能力突出。
武永衛(wèi)教授表示,針對大數(shù)據(jù)人才培養(yǎng),清華大學(xué)設(shè)立了“數(shù)據(jù)科學(xué)與工程”混合式專業(yè)學(xué)位教育項目,其目的就是:培養(yǎng)具備數(shù)據(jù)存儲、運行監(jiān)管、智能分析挖掘以及戰(zhàn)略決策等技能的專門人才,使其能夠勝任數(shù)據(jù)存儲管理師、數(shù)據(jù)分析師、數(shù)據(jù)系統(tǒng)構(gòu)架師乃至數(shù)據(jù)科學(xué)家、首席數(shù)據(jù)官、商務(wù)分析師、戰(zhàn)略管理者等職位。項目注重知識能力與職業(yè)素養(yǎng)融合的培養(yǎng)體系,設(shè)立了數(shù)據(jù)存儲、系統(tǒng)架構(gòu)、分析挖掘、應(yīng)用/素養(yǎng)的相關(guān)課程。
韋恩州立大學(xué)計算機科學(xué)系教授,大數(shù)據(jù)和商務(wù)分析中心主任,IEEE計算機學(xué)會計算生命科學(xué)技術(shù)委員會主席陳學(xué)文在論壇上做了精彩報告。
陳學(xué)文教授認為,數(shù)據(jù)科學(xué)的一個重要價值就是給商業(yè)帶來價值,通過大數(shù)據(jù)挖掘、分析可以得到其價值。因此數(shù)據(jù)科學(xué)家要掌握的基本技能包括編程能力、數(shù)學(xué)思維、機器學(xué)習(xí)和可視化、強烈的好奇心、軟技能(domain knowledge and soft skill)。
陳學(xué)文教授介紹,目前美國在數(shù)據(jù)科學(xué)上開設(shè)課程的研究機構(gòu)大大小小有30多家,高校開設(shè)的課程都是針對碩士研究生的培養(yǎng),如伯克利大學(xué)、紐約大學(xué)等。他建議應(yīng)該有一個本科生的培養(yǎng)方案,這樣學(xué)生在學(xué)校跟著導(dǎo)師做項目,經(jīng)過學(xué)習(xí),學(xué)生會很熟悉整個流程,對學(xué)生的幫助很大。
復(fù)旦大學(xué)計算機科學(xué)技術(shù)學(xué)院教授,上海市數(shù)據(jù)科學(xué)重點實驗室主任助理熊贇在論壇做了精彩報告。
熊贇教授認為,數(shù)據(jù)科學(xué)家包括3類人。第一類人更多的是從事科學(xué)數(shù)據(jù)分析,第二類人是從事商業(yè)業(yè)務(wù)分析;第三類人是科研高校里的師生,即專門研究數(shù)據(jù)的人。
熊贇教授表示,當(dāng)前國內(nèi)很多學(xué)校都建立了大數(shù)據(jù)專業(yè),但是整個學(xué)科體系還沒有能夠全面地建立起來。在培養(yǎng)過程中,領(lǐng)域?qū)<抑攸c是學(xué)習(xí)如何將領(lǐng)域業(yè)務(wù)需求轉(zhuǎn)化為數(shù)據(jù)問題交給數(shù)據(jù)分析人員,并不關(guān)注數(shù)據(jù)處理細節(jié);而數(shù)據(jù)分析人員注重對領(lǐng)域?qū)<宜o的數(shù)據(jù)集進行處理,缺乏對領(lǐng)域知識的理解。這是目前數(shù)據(jù)科學(xué)家培養(yǎng)的常見方式,但卻缺乏系統(tǒng)性。需要一個新的學(xué)科體系,包括數(shù)據(jù)科學(xué)基礎(chǔ)理論、科學(xué)研究、數(shù)據(jù)方法、數(shù)據(jù)界探索、數(shù)據(jù)技術(shù)及應(yīng)用、領(lǐng)域數(shù)據(jù)學(xué)。
熊贇教授表示,數(shù)據(jù)科學(xué)并不是簡單的學(xué)科交叉,應(yīng)該基于并和所有學(xué)科相關(guān)。而超學(xué)科數(shù)據(jù)人才培養(yǎng)體系,應(yīng)該實現(xiàn)以團隊培養(yǎng)為主的數(shù)據(jù)人才培養(yǎng)模式向培養(yǎng)具有數(shù)據(jù)能力的人(而非團隊)為目標(biāo)的培養(yǎng)模式轉(zhuǎn)變。
(內(nèi)容整合了嘉賓演講速記及相關(guān)媒體報道)
大會網(wǎng)址:bdse2016.j-bigdataresearch.com.cn