• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      “數(shù)據(jù)科學”課程群與“數(shù)據(jù)科學導論”課程建設初探

      2019-01-10 05:59:22覃雄派陳躍國李翠平柴云鵬徐君文繼榮杜小勇
      大數(shù)據(jù) 2018年6期
      關鍵詞:導論可視化科學

      覃雄派,陳躍國,李翠平,柴云鵬,徐君,文繼榮,杜小勇

      中國人民大學信息學院,北京 100872

      1 引言

      數(shù)據(jù)科學是以計算機科學(特別是數(shù)據(jù)庫、數(shù)據(jù)挖掘、機器學習等)和統(tǒng)計學為基礎,融合其他學科的一門新興的交叉學科。它研究數(shù)據(jù)的各種類型、狀態(tài)、屬性及其變化規(guī)律,研究如何對數(shù)據(jù)進行分析,從而揭示自然界和人類行為等現(xiàn)象背后的規(guī)律。

      2016年,北京大學、對外經(jīng)濟貿易大學及中南大學3所高校申請并且成功獲得教育部批準,建立“數(shù)據(jù)科學與大數(shù)據(jù)技術”本科專業(yè)。2017年,又有32所高校獲批建立該專業(yè),中國人民大學為其中之一。2018年3月,教育部公布第三批獲批建立“數(shù)據(jù)科學與大數(shù)據(jù)技術”專業(yè)的院校。至此,共有280多所高校獲批建立該專業(yè)。

      如何設計“數(shù)據(jù)科學與大數(shù)據(jù)技術”專業(yè)的課程體系、建設各門課程,成為各個高校的教學主管領導和任課老師關心的問題。本文介紹中國人民大學信息學院在計算機專業(yè)教育課程體系方面進行的改革,并重點介紹其中“數(shù)據(jù)科學導論”課程的建設情況。

      2 課程建設思路

      2.1 計算機專業(yè)教育課程體系

      隨著計算機及互聯(lián)網(wǎng)的飛速發(fā)展,當今社會已進入大數(shù)據(jù)時代,數(shù)據(jù)及其應用已經(jīng)滲透到社會和生活的方方面面。2015年9月5日國務院發(fā)布了《促進大數(shù)據(jù)發(fā)展行動綱要》,系統(tǒng)部署了大數(shù)據(jù)發(fā)展工作,這意味著大數(shù)據(jù)發(fā)展正式上升為國家戰(zhàn)略。數(shù)據(jù)的處理與分析是推動生產力增長的關鍵要素,國家急需大量能構建系統(tǒng)、會分析數(shù)據(jù)、懂領域業(yè)務的復合型人才。

      在新的需求背景下,中國人民大學信息學院(以下簡稱信息學院)把計算機專業(yè)課程劃分為“問題求解”“系統(tǒng)平臺”和“數(shù)據(jù)科學”3條主線、“數(shù)學和自然科學”“人文社科教育”兩條輔線,如圖1所示。

      “問題求解”類課程主要訓練學生用計算機求解問題的思維方式、方法和實現(xiàn)手段(編程)?!跋到y(tǒng)平臺”類課程主要介紹和訓練支持問題求解的實際計算機軟硬件系統(tǒng)的使用、設計與實現(xiàn)?!皢栴}求解”和“系統(tǒng)平臺”兩條主線中的課程設置主要是為了使計算機專業(yè)的學生在兩個方面打下扎實的基礎。而“數(shù)據(jù)科學”類課程涉及大數(shù)據(jù)從獲取、存儲、管理、分析到領域應用等整個數(shù)據(jù)生命周期各個環(huán)節(jié)的內容,尤其是云計算、大數(shù)據(jù)、人工智能(基于大數(shù)據(jù)的智能)等新技術,將重點集中在這一主線中進行講授和訓練?!皵?shù)學和自然科學”輔線課程將為計算機專業(yè)的學生打下扎實的數(shù)學和自然科學基礎,“人文社科教育”類課程的主要目標是提高學生的人文素養(yǎng),積累社會學科的基礎知識和方法論,同時數(shù)據(jù)科學中的大數(shù)據(jù)和人工智能的課程也會與人文社會學科深度結合。

      從縱向看,從大一到大四,4個年級的課程深度逐步加強。大一階段,主要通過“問題求解”主線中的程序設計等課程,訓練學生的計算機編程能力,培養(yǎng)計算思維。從大二開始,設置“系統(tǒng)平臺”和“數(shù)據(jù)科學”類課程,系統(tǒng)地培養(yǎng)學生問題求解的方法和能力,訓練學生如何抽象問題、建立模型、求解問題,并編程實現(xiàn);通過系統(tǒng)平臺方面的基礎課讓學生初步了解計算機軟硬件系統(tǒng),學習實際系統(tǒng)模塊的設計與開發(fā),同時也會通過導論類型的課程開啟“數(shù)據(jù)科學”主線課程的學習。大三階段的學習會再增加一個難度,增強問題求解的理論基礎和復雜問題求解的能力,并訓練學生完整設計和開發(fā)復雜的計算機系統(tǒng)的能力;在“數(shù)據(jù)科學”方面,也對大數(shù)據(jù)從獲取、存儲、管理、挖掘到可視化等整個數(shù)據(jù)生命周期各個環(huán)節(jié)進行綜合講授和訓練。在大四階段的畢業(yè)設計中,學生針對導師提出的開放性問題進行探索,在調研、分析、研究、設計與開發(fā)等方面得到進一步的訓練?!邦I域應用”板塊通過大三和大四的選修課和畢業(yè)設計完成。

      圖1 計算機專業(yè)教育課程體系

      2.2 “數(shù)據(jù)科學”課程群

      傳統(tǒng)計算機專業(yè)教育是以計算為中心的,與數(shù)據(jù)科學相關的課程設置比較薄弱,一般只包括關系數(shù)據(jù)庫系統(tǒng)一門課程,甚至只是一門選修課。但是在數(shù)字經(jīng)濟環(huán)境下,云計算、物聯(lián)網(wǎng)、人工智能都和大數(shù)據(jù)密切相關,需要轉換思維,增加一系列重要的數(shù)據(jù)科學和與大數(shù)據(jù)相關的新課程。這些課程應涵蓋數(shù)據(jù)從準備、存儲、管理、分析到領域應用等整個數(shù)據(jù)生命周期各個環(huán)節(jié)的內容。

      此外,在課程體系建設方面,需要加強實踐課程的建設,尤其是設計和建設以數(shù)據(jù)管理和分析課程為核心的在線實驗平臺,加強學生的實踐能力和動手能力;與企業(yè)合作建設新課程,給學生提供了解工業(yè)界的實際情況和最新技術的機會及充足的鍛煉機會。

      為了提高大數(shù)據(jù)人才的培養(yǎng)質量,信息學院專門為數(shù)據(jù)科學與大數(shù)據(jù)技術專業(yè)精心打造了一系列精品課程,試圖在本科階段給學生打下扎實的數(shù)學、大數(shù)據(jù)和計算機基礎。數(shù)據(jù)科學與大數(shù)據(jù)技術是一個寬口徑的專業(yè),與很多行業(yè)有相關性,全面而扎實的基礎可以提高本專業(yè)學生的適應能力。

      在圖2中,“數(shù)據(jù)科學導論”“大數(shù)據(jù)計算智能”“非結構化大數(shù)據(jù)分析”等課程是專門為大數(shù)據(jù)專業(yè)開設的新課程。信息學院精選了優(yōu)秀教師組建課程建設團隊,例如“數(shù)據(jù)科學導論”課程由杜小勇教授和文繼榮教授牽頭,陳躍國教授、徐君教授、覃雄派博士參與;“大數(shù)據(jù)計算智能”和“非結構化大數(shù)據(jù)分析”由李翠平教授和張靜博士負責;“計算機系統(tǒng)基礎”課程由柴云鵬副教授負責;“并行與分布式計算”由張峰博士負責。此外,信息學院的傳統(tǒng)精品課程“數(shù)據(jù)庫系統(tǒng)概論”由杜小勇教授和陳紅教授聯(lián)合授課。

      2.3 “數(shù)據(jù)科學導論”課程

      “數(shù)據(jù)科學導論”是一門入門課程,同時也是“數(shù)據(jù)科學”課程群統(tǒng)領式的課程,把學生引進數(shù)據(jù)科學的大門。它的目標有兩個,一個是擴展寬廣的視野和培養(yǎng)濃厚的興趣,另一個是打下堅實的基礎,有利于學生學習后續(xù)課程,有利于培養(yǎng)數(shù)據(jù)科學家。

      一般來講,該課程在大二下學期開設。在該時間點,學生已經(jīng)學習了必備的數(shù)學知識和編程基礎知識,為該課程的學習做好了準備。而這門課的學習,又為大三的專業(yè)課學習打下了必要的基礎。

      由此可見,“數(shù)據(jù)科學導論”課程的地位非常重要,它在學科基礎課和專業(yè)課之間起到了承上啟下的作用。由于它的入門和統(tǒng)領地位,在內容上它與后續(xù)的專業(yè)課程不可避免地會有部分重復。因此,這門課程在設計時,首先需要回答一個問題,即如何處理和后續(xù)課程的關系。換句話說,“數(shù)據(jù)科學導論”課程在廣度和深度方面應該如何設計,才能既避免和后續(xù)課程的簡單重復,同時又能夠起到入門和引領的作用。

      “數(shù)據(jù)科學導論”包含很多內容,而大部分內容可以擴展為一門課程。例如,在講到文本分析的時候,“數(shù)據(jù)科學導論”課程里面只對文本分析的概念、技術和方法做了初步的介紹,讓學生理解概念,會用工具,培養(yǎng)其數(shù)據(jù)思維。而在非結構化大數(shù)據(jù)分析課程里面,則深入介紹了文本的處理和分析方法。又如,在講到人工神經(jīng)網(wǎng)絡的時候,“數(shù)據(jù)科學導論”課程只需把神經(jīng)網(wǎng)絡的基本原理、深度學習的基本概念介紹清楚,學生會使用相關工具即可,具體的神經(jīng)網(wǎng)絡模型很多,不勝枚舉,可以選擇一兩種加以介紹,其他模型可以放在后續(xù)的機器學習或者深度學習課程中細細地展開分析。

      圖2 “數(shù)據(jù)科學”課程群

      3 “數(shù)據(jù)科學導論”課程內容安排及教學計劃

      3.1 國外若干著名大學的“數(shù)據(jù)科學導論”課程建設情況

      在設計課程內容時,筆者團隊首先調研了加州大學洛杉磯分校、斯坦福大學、華盛頓大學等幾個國外著名大學的“數(shù)據(jù)科學導論”課程的內容安排,下面對其進行詳細介紹。

      加州大學洛杉磯分校的數(shù)據(jù)科學導論課程的主要內容包括數(shù)據(jù)管理、機器學習、自然語言處理、統(tǒng)計分析、可視化等。該課程將自然語言處理進行了重點介紹,課程內容還包括大數(shù)據(jù)工具Hadoop、各種NoSQL數(shù)據(jù)庫、Python編程語言等。課程最后安排了一系列的實踐案例,要求學生在實際業(yè)務數(shù)據(jù)集上運用所學知識解決實際問題。該課程只需學生具有數(shù)學特別是概率統(tǒng)計的基礎,會編程即可,沒有其他先決條件,適用于本科生。

      斯坦福大學的數(shù)據(jù)科學導論課程主要包含3個方面的內容,分別是數(shù)據(jù)可視化、機器學習、R編程語言。該課程同時包括一系列來自實際業(yè)務的案例分析講座,包括天氣預報、市場營銷、生物學、股票市場、醫(yī)藥行業(yè)等,學生可以跟著教師的介紹,實際動手操作,一步步解決問題,這對于培養(yǎng)學生的動手能力是非常必要的。該課程在內容設計和教學設計上,照顧到?jīng)]有計算機基礎的學生,適用于本科生。

      華盛頓大學的數(shù)據(jù)科學導論課程的主要內容包括實現(xiàn)(大規(guī)模)數(shù)據(jù)管理的S Q L數(shù)據(jù)庫(關系數(shù)據(jù)庫管理系統(tǒng))、NoSQL數(shù)據(jù)庫技術及其選擇和取舍(trade off)、數(shù)據(jù)挖掘和機器學習的基本技術、統(tǒng)計建模方法(如線性和非線性回歸、數(shù)據(jù)可視化等)。該課程最后選擇圖數(shù)據(jù)分析作為特別的專題進行介紹。該課程雖然稱為“數(shù)據(jù)科學導論”,但是其中的內容是以一系列相對獨立的專題講座的形式講授的,前后兩次課堂內容并不一定連續(xù),適用于研究生或者高年級本科生。

      縱觀這些著名大學的數(shù)據(jù)科學導論課程可以發(fā)現(xiàn),在內容安排方面有以下共同點:

      ● 數(shù)據(jù)管理不能缺失,數(shù)據(jù)科學導論不能只講數(shù)據(jù)分析而不講數(shù)據(jù)管理,把數(shù)據(jù)管理起來是分析的基礎;

      ● 強調動手能力培養(yǎng),選用的編程語言有R、Python等,問題來自實際應用;

      ● 選擇某種數(shù)據(jù)類型進行深入介紹,比如圖數(shù)據(jù)、文本數(shù)據(jù)等,不同學校在內容上各有取舍;

      ● 數(shù)據(jù)可視化內容必不可少。

      3.2 信息學院“數(shù)據(jù)科學導論”課程建設情況和新規(guī)劃

      數(shù)據(jù)科學導論課程在中國人民大學開設已有5年時間。在探索的過程中,增長了課程建設的經(jīng)驗,同時也有一些教訓。這門課程剛開始作為大三的選修課開設,隨著數(shù)據(jù)科學和大數(shù)據(jù)人才需求的逐步旺盛,學生興趣濃厚,選修這門課的學生逐漸增多。部分學生的學習主動性很高,積極參加中國計算機學會和各大互聯(lián)網(wǎng)公司的大數(shù)據(jù)大賽,并且獲得了好名次。

      2017年,中國人民大學獲批建設“數(shù)據(jù)科學與大數(shù)據(jù)技術”專業(yè)后,對該課程的定位為學科基礎課。中國人民大學信息學院領導全方位督導這門課程的建設,對教學大綱、教學內容、教學環(huán)節(jié)、實踐環(huán)節(jié)進行了重新梳理,為2017年開始招生的“數(shù)據(jù)科學與大數(shù)據(jù)技術”專業(yè)本科生開設這門課程做好了準備。

      該課程作為選修課程講授時,主要的教訓有3點,分別是內容過于繁多、難度偏大、實踐部分安排的時間不夠。經(jīng)過信息學院“數(shù)據(jù)科學導論”課程建設小組多次討論,在教學目標方面,突出兩個方面:一個是掌握數(shù)據(jù)分析的基本思路、基本理論與基本方法;另一個是實踐應用能力培養(yǎng),即面向實際應用中不同行業(yè)的需求,能夠給出數(shù)據(jù)解決方案設計和最終實現(xiàn)。

      對上述前期教學的3個經(jīng)驗教訓進行梳理后,信息學院在內容方面刪繁就簡,突出結構化數(shù)據(jù)分析或者流數(shù)據(jù)處理、文本分析、圖數(shù)據(jù)分析三大塊;在難度方面,把該門課程定位為入門的課程,目的是培養(yǎng)學生濃厚的興趣,因此難度上要降低,對算法的數(shù)學基礎和推導過程的把握由后續(xù)的各門專業(yè)選修課程來承擔。本門課程僅要求掌握基本原理,加強實踐環(huán)節(jié),要求學生熟練掌握主流工具,完成數(shù)據(jù)管理和分析全流程的實踐,切實培養(yǎng)學生的動手(編程)能力。在具體的教學中,設計了模塊式教學法以及基于大作業(yè)(project)的教學法。通過3個大作業(yè),把理論講解和動手實踐有機結合起來。

      3.2.1 教學內容模塊化

      “數(shù)據(jù)科學導論”是一門入門性質的課程,內容安排上一定要注意取舍,達到廣度和深度的平衡,既要避免泛泛而談、沒有重點,也要避免過于強調某個方面,但是廣度不夠。

      從廣度上來講,要幫助學生構建起一個完整的知識體系。在理論部分,要包括數(shù)據(jù)科學的基本概念、技術和方法,數(shù)據(jù)的不同類型,數(shù)據(jù)處理的流程和數(shù)據(jù)的生命周期,數(shù)據(jù)處理的不同模式,數(shù)據(jù)分析的主要方法等。其中數(shù)據(jù)的類型是非常豐富的,包括文本、社交網(wǎng)絡、社交媒體、時間序列、軌跡數(shù)據(jù)、音頻/圖像和視頻等。在應用部分,要包括數(shù)據(jù)處理的基礎設施、平臺和各種工具以及一系列精心設計的案例。

      在深度上,只能選擇部分內容進行深入的介紹。在介紹完數(shù)據(jù)科學的基本概念、技術和方法以及主要的數(shù)據(jù)類型及其分析方法之后,可以選擇某種具體的數(shù)據(jù)類型進行深入的介紹。同時在應用部分,要設計一些實際的案例,要求學生結合實際數(shù)據(jù)進行上機實踐。

      教學內容分為四大模塊,分別是基礎(base)模塊、關系數(shù)據(jù)/流數(shù)據(jù)處理(relational & stream)模塊、文本數(shù)據(jù)處理和分析(text)模塊、圖數(shù)據(jù)處理和分析(graph)模塊。

      基礎模塊為后續(xù)的3個實踐模塊做準備工作。它的內容包括以下幾方面。

      ● 概念:數(shù)據(jù)科學概論,主要介紹數(shù)據(jù)科學的基本概念、大數(shù)據(jù)及其價值、數(shù)據(jù)處理的全生命周期,包括數(shù)據(jù)的采集和獲取、數(shù)據(jù)預處理/清洗和集成、數(shù)據(jù)管理、數(shù)據(jù)分析、可視化和解釋等。

      ● 方法:包括各種數(shù)據(jù)模型、數(shù)據(jù)處理的不同模式(批處理和流式處理)、通用的數(shù)據(jù)分析方法、數(shù)據(jù)可視化等。

      ● 平臺和工具:包括分布式計算與大數(shù)據(jù)平臺(Hadoop & Spark)以及Python語言。其中Python語言部分包括對Python語言基礎以及Python的幾個重要的庫(數(shù)據(jù)預處理庫pandas、機器學習庫Scikit-Learn、可視化庫Matplotlib)的介紹。

      大數(shù)據(jù)具有4個關鍵的特點,分別是數(shù)據(jù)量大(volume)、數(shù)據(jù)類型多樣(variety)、數(shù)據(jù)價值密度低(variety)以及速率快(velocity)。上述的教學內容完全體現(xiàn)了大數(shù)據(jù)的這些特點。分布式計算與大數(shù)據(jù)平臺體現(xiàn)了數(shù)據(jù)量大,數(shù)據(jù)模型體現(xiàn)了數(shù)據(jù)類型多樣,數(shù)據(jù)的清洗和集成體現(xiàn)了數(shù)據(jù)價值密度低,數(shù)據(jù)處理的不同模式體現(xiàn)了速率快。經(jīng)過模塊內部整理以后,基礎模塊的內容可以被劃分成如下子模塊,見表1。

      后續(xù)的3個模塊除了介紹理論之外,還要介紹平臺、方法和應用。由于是導論課程,其主要目的是把學生引進數(shù)據(jù)科學的大門,培養(yǎng)其對數(shù)據(jù)的感覺和興趣,基礎理論不必講得太深入(可以放在后續(xù)專業(yè)選修課程中深入介紹),而是偏向工具的使用和應用的開發(fā),讓學生迅速獲得對數(shù)據(jù)價值的認識。特別需要注意的是,要準備好必要的數(shù)據(jù)集,以便學生可以利用一些工具對其進行處理和分析。

      關系數(shù)據(jù)/流數(shù)據(jù)處理模塊提供兩個選項,可以根據(jù)需要進行選擇。第一個選項側重于介紹大數(shù)據(jù)的實時流式處理,內容包括流式處理基礎、流式處理工具和流式處理應用,可以選擇Storm作為典型流式數(shù)據(jù)處理系統(tǒng)加以介紹,大作業(yè)部分可以針對傳感器數(shù)據(jù),實現(xiàn)實時匯總和可視化。第二個選項側重于介紹關系模型、SQL語言以及分布式大數(shù)據(jù)多維分析(OLAP),工具部分可以選擇對MySQL以及SQL on Hadoop系統(tǒng)加以介紹,做到會用即可,大作業(yè)部分可以針對銷售數(shù)據(jù)進行多維分析以及可視化。

      文本數(shù)據(jù)處理和分析模塊依賴于分布式的大數(shù)據(jù)處理平臺和分析工具,包括Hadoop/Spark、NLTK for Spark、Scikit Learn for Spark等,使用各種文本分析方法,實現(xiàn)對文本的分詞、索引與檢索、情感分析、實體識別、可視化等關鍵任務。大作業(yè)部分可以針對產品評論進行情感分析,并且從產品維度、時間維度進行匯總,最后進行可視化,讓用戶了解熱門產品及客戶對不同產品的態(tài)度變化等。

      圖數(shù)據(jù)處理和分析模塊依賴于GraphX on Spark平臺(工具)或者Neo4J數(shù)據(jù)庫,對圖數(shù)據(jù)進行創(chuàng)建、查詢、路徑分析、PageRank、社區(qū)檢測等。大作業(yè)部分可以基于公開數(shù)據(jù)集進行重要節(jié)點排名、社區(qū)檢測等,甚至可以擴展到金融領域,實現(xiàn)欺詐團伙的檢測。

      這3個模塊都帶有很強的實踐性,教師在講解平臺、方法和應用的基礎上,給學生布置大作業(yè),要求學生熟練使用上述平臺和工具,對數(shù)據(jù)集進行處理、分析和可視化,并且解釋結果,體現(xiàn)數(shù)據(jù)的價值。

      表1 數(shù)據(jù)科學導論課程內容的模塊與子模塊

      3.2.2 教學計劃

      在時間安排上(共15個教學周,一個教學周2次課,每次課2課時,共30次課),基礎模塊被分配12次課,后續(xù)的3個模塊分別被分配6次課,共18次課。

      在基礎模塊,3位教師可以分別準備關于不同子模塊的內容,3位教師的教學計劃見表2(3位教師分別被命名為教師1、教師2、教師3)。

      表2 3位教師3個教學班的教學計劃(串行并行相結合)

      3.2.3 課程考核方法

      采用上述教學計劃,本課程的考核分為3個方面,包括平時的上機實踐、大作業(yè)和期末閉卷考試。在平時的上機實踐中,學生必須完成上機練習題目,并提交上機實驗報告。大作業(yè)鍛煉學生綜合運用所學知識解決復雜問題的能力。期末考試考查學生對知識點的掌握和靈活運用能力。最終成績按照15:15:15:15:40的比例,由平時成績、大作業(yè)1、大作業(yè)2、大作業(yè)3和期末成績構成。

      3.3 課程參考教材及配套資源建設

      自2013年以來,“數(shù)據(jù)科學導論”課程在中國人民大學信息學院計算機系開設已經(jīng)有5年。筆者團隊在授課的過程中,不斷整理講義。2016年開始,經(jīng)過兩年的精心編寫和仔細校對,《數(shù)據(jù)科學概論》教材于2018年3月正式出版。

      這本教材包括兩個部分,分別是理論篇和應用篇。理論篇包括兩個模塊:一是數(shù)據(jù)科學基礎,講述數(shù)據(jù)科學的基本概念和原則;二是數(shù)據(jù)和數(shù)據(jù)上的計算,講述不同的數(shù)據(jù)類型及其分析方法,數(shù)據(jù)類型包括結構化數(shù)據(jù)、非結構化數(shù)據(jù)、半結構化數(shù)據(jù),分析方法包括統(tǒng)計學方法、數(shù)據(jù)挖掘和機器學習方法等。應用篇也包括兩個模塊:一是數(shù)據(jù)處理基礎設施、平臺和工具,講述云平臺、數(shù)據(jù)庫、大數(shù)據(jù)平臺、工具以及編程語言Python;二是數(shù)據(jù)科學案例和實踐,講述大數(shù)據(jù)應用的案例,并且面向金融領域的量化交易應用,從數(shù)據(jù)采集、模型訓練、預測、評價到可視化等環(huán)節(jié),帶領讀者完成數(shù)據(jù)分析處理的實踐。在具體授課中,教師可以選擇其他行業(yè)領域的實踐案例進行介紹。

      為了方便各個高校教師開設和講授“數(shù)據(jù)科學導論”課程和提高學生的課程學習效果,筆者團隊建設了課程配套網(wǎng)站,網(wǎng)站上提供了課程PPT、代碼、數(shù)據(jù)、實驗參考和技術博客等資源。配套資源網(wǎng)站還針對若干難點專題,給出了基于實例的詳細和深入的剖析,幫助學生深入理解所學知識。這些難點包括最大期望(expectation maximization ,EM)算法、反向傳播算法、深度神經(jīng)網(wǎng)絡模型、奇異值分解(singular value decomposition,SVD)算法、概率潛在語義分析(probabilistic latent semantic analysis,PLSA)算法等。

      4 結束語

      本文介紹了中國人民大學信息學院面向大數(shù)據(jù)時代的課程體系改革,包括“問題求解”“系統(tǒng)平臺”和“數(shù)據(jù)科學”三大課程群建設的構想和實踐以及“數(shù)據(jù)科學”課程群的具體內涵。在此基礎上,重點介紹了“數(shù)據(jù)科學導論”課程的建設情況,包括課程的目標和定位、課程內容安排、課程教學計劃、考核方法、實踐環(huán)節(jié)設計等。

      猜你喜歡
      導論可視化科學
      基于CiteSpace的足三里穴研究可視化分析
      基于Power BI的油田注水運行動態(tài)分析與可視化展示
      云南化工(2021年8期)2021-12-21 06:37:54
      評《工程管理導論》(書評)
      基于CGAL和OpenGL的海底地形三維可視化
      “融評”:黨媒評論的可視化創(chuàng)新
      傳媒評論(2019年4期)2019-07-13 05:49:14
      科學大爆炸
      小小藝術家(2019年6期)2019-06-24 17:39:44
      科學
      使公民有道德:導論
      科學拔牙
      打造平衡中的適度:一部值得推薦的英語文學教材——評《文學導論》
      永登县| 德格县| 青岛市| 天祝| 阿克陶县| 凉城县| 保定市| 四子王旗| 孟津县| 湖州市| 锡林浩特市| 阳山县| 阿城市| 南昌县| 台安县| 微博| 嘉祥县| 敦煌市| 五家渠市| 黎平县| 常熟市| 淳化县| 揭西县| 从化市| 昌江| 环江| 五河县| 武冈市| 板桥市| 伊宁市| 漳州市| 文成县| 囊谦县| 马边| 赤城县| 酉阳| 彰化县| 富宁县| 始兴县| 大悟县| 时尚|