• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于R語言的學生成績分析

      2020-03-18 13:43:48
      遼寧師專學報(自然科學版) 2020年4期
      關鍵詞:代碼函數(shù)班級

      楊 超

      (遼寧民族師范高等??茖W校 民族文化與職業(yè)教育系,遼寧 沈陽 110032)

      0 引言

      學生成績作為檢驗教師教學效果的產物,直接反映學生對知識的掌握情況及教師的教學水平.近些年,有關教學的探索更多關注于新的教學手段,針對教學效果的分析,尤其是有關分析方法的研究較少.隨著人工智能和大數(shù)據(jù)時代的到來,為教師利用數(shù)據(jù)統(tǒng)計分析手段,從大量的學生成績中提取重要數(shù)據(jù),發(fā)現(xiàn)成績中隱藏的問題,提高學生成績,提供了新的思路.本文中嘗試引入R語言對學生成績進行統(tǒng)計分析[1-3],為教學人員探索新的統(tǒng)計方法提供參考.

      1 R語言特點

      數(shù)據(jù)分析是指采用合適方法對從海量數(shù)據(jù)中收集的大量數(shù)據(jù)進行分析、整理、歸納,抽取有價值的信息的過程.R語言作為一種強大的編程語言,不僅可提供大量多樣的數(shù)據(jù)統(tǒng)計分析方式,還可生成圖例,其主要特點有:

      (1)開源免費的軟件可從官網下載,安裝簡單快捷,而且其強大的R語言包均可根據(jù)需要從網上下載,支持多操作系統(tǒng)環(huán)境;

      (2)具有強大可自定義樣式的繪圖功能,可利用函數(shù)將統(tǒng)計分析的計算數(shù)據(jù)生成想要的圖,并根據(jù)修改函數(shù)中的參數(shù),自定義圖樣式;

      (3)操作流程簡單,無需編寫大量代碼,用戶只要了解所需函數(shù)的參數(shù)意義,即可生成對應圖例.

      2 R語言數(shù)據(jù)處理

      數(shù)據(jù)源是R語言進行統(tǒng)計分析的核心資源.考慮到大學課程成績存在一定主觀性,相比之下小學期末考試更嚴格、更真實,成績趨于客觀,因此本研究選擇沈陽市某小學四年級期末考試成績作為數(shù)據(jù)源進行統(tǒng)計分析.

      2.1 數(shù)據(jù)收集

      根據(jù)教學人員的需要,從眾多列成績中選取主要數(shù)據(jù)信息,包括序號(num)、姓名(name)、班級(class)、數(shù)學(math)、語文(chn)、英語(eng),將收集的數(shù)據(jù)存為.xls文件或.csv文件.收集數(shù)據(jù)時,出現(xiàn)的缺失值可刪除或按空缺值等方式處理.

      2.2 數(shù)據(jù)讀入

      R語言支持.xls、.csv和.txt等多種文件類型導入.導入文件前需要加載對應的R語言包,編寫代碼時需將導入文件賦值給變量,導入的變量類型以數(shù)據(jù)框形式存在.本文以導入.xls文件為例,利用R語言read_excel()函數(shù)實現(xiàn)導入代碼如下:

      library(read_excel)

      scores<- read_excel(scoresdata.xlsx)

      導入后查看數(shù)據(jù),見圖1.

      數(shù)據(jù)共105行,查看變量內容時R語言僅顯示10行,隱藏95行.每列除顯示導入數(shù)據(jù)時填寫的列名外,還顯示屬性類型,其中name為字符型,其余均為數(shù)據(jù)框.

      2.3 數(shù)據(jù)提取

      讀入數(shù)據(jù)后,需對有用數(shù)據(jù)進行提取運算.例如,在統(tǒng)計分析成績時,姓名、序號、班級等屬性不應參加統(tǒng)計分析,但無這些屬性就無法進行歸類統(tǒng)計分析,在眾多數(shù)據(jù)中提取所要數(shù)據(jù),可應用R語言中c()函數(shù)將所需數(shù)據(jù)連接在一起,通過如下代碼提取數(shù)據(jù):

      > scores.data <- scores[c(4:6)]

      > scores.data

      “scores[c(4:6)]”表示提取scores變量中4~6列的數(shù)據(jù)賦值給變量scores.data.

      3 R語言成績分析與圖形繪制

      學生成績是反映教學成果的客觀數(shù)據(jù).目前,大多數(shù)學校采取Excel錄入、匯總、計算的方式管理與分析學生成績,雖能計算出需要的最終數(shù)據(jù),但是缺乏對成績的客觀分析與直觀反映.針對這一問題,本文提出了基于R語言的統(tǒng)計分析方法以提高教學效果[4-6].

      3.1 各科成績描述性分析

      3.1.1 統(tǒng)計成績信息

      傳統(tǒng)數(shù)據(jù)計算一般通過Excel表格分列對各科進行求和、求平均值、求最大值和最小值的分類計算,工作略顯繁瑣.這里以沈陽某小學四年級成績?yōu)槔?,?3名學生成績導入R語言環(huán)境中,導入的數(shù)據(jù)變量以數(shù)據(jù)框的形式存在.R語言可通過summary()函數(shù)完成各科成績的初步計算,實現(xiàn)代碼如下:

      summary(scores[c(4:6)])

      生成的計算數(shù)據(jù)見圖2.

      通過生成數(shù)據(jù)可直觀看到,在整個四年級數(shù)學、語文和英語三科考試成績中,除最大值、最小值和平均值外,還計算出科目成績的中間值(Median)、1/4位數(shù)(1st Qu.)和3/4位數(shù)(3st Qu.),為分析、了解學生整體情況提供了便捷的數(shù)據(jù)計算服務,提高了教學決策的準確性.

      3.1.2 繪制成績箱形圖

      為更加直觀地向決策者提供數(shù)據(jù)依據(jù),R語言boxplot()函數(shù)可根據(jù)導入的成績數(shù)據(jù)生成箱形圖,即根據(jù)數(shù)據(jù)的分布情況生成統(tǒng)計圖.上述通過summary()函數(shù)計算出各科成績的重要屬性值,生成的箱形圖如圖3所示,實現(xiàn)運行代碼如下:

      boxplot(math~ class, data=scores)

      boxplot(chn ~ class, data=scores)

      boxplot(eng~ class, data=scores)

      箱形圖將計算得到的描述性統(tǒng)計量進行更直觀地展示.圖3中分別顯示各班級數(shù)學、語文、英語成績與班級的信息:長方形外部的上下兩條橫線分別表示該班級的最高分和最低分,長方形的上下邊框分別表示該班級成績的1/4位數(shù)(1st Qu.)和3/4位數(shù)(3st Qu.),長方形內部黑橫線表示該班級成績的中間數(shù),圖形中的空心白圓點表示異常數(shù)據(jù).除箱形圖規(guī)定的線形和圖形含義外,還可從圖形中看到隱藏的信息,例如長方形的面積大小決定該班級本科目成績是否在某成績段集中,如果面積過大表示成績涉及范圍較大.

      3.1.3 繪制成績直方圖

      R語言的強大不僅體現(xiàn)在便捷的數(shù)據(jù)計算,還體現(xiàn)在可依據(jù)頻數(shù)生成可視的直方圖[7].根據(jù)導入的數(shù)學、語文和英語成績,利用R語言的hist()函數(shù)、lines()函數(shù)和rug()函數(shù)生成整體成績直方圖,如圖4所示,運行代碼如下:

      hist(math, freq=FALSE)

      lines(density(math), col='blue')

      rug(jitter(math))

      通過成績直方圖可直觀看出,橫坐標為成績段,縱坐標為密度,各科成績圖形及密度曲線由分數(shù)段人數(shù)決定.數(shù)學成績除個別學生,大部分均已及格,并且在及格人數(shù)中很多學生的成績集中在85分以上,90分以上偏多;語文成績雖呈正態(tài)分布趨勢,但是存在一些成績不及格的學生,大部分學生在65~90分之間,80分以上偏多;英語成績分布呈現(xiàn)兩極化,成績不及格和90分以上的均偏多,60~80分之間學生較少.

      3.2 成績相關性分析

      成績是檢驗教學成果的重要指標.有效利用技術手段從大量的成績中發(fā)現(xiàn)科目之間的關聯(lián),挖掘隱藏信息,是提升成績、提高教學效果的重要方式.利用R語言cor()函數(shù),可從導入的數(shù)據(jù)中發(fā)現(xiàn)科目之間的相關性,為決策者提供分析依據(jù).運行代碼如下:

      cor(scores[,subjects])

      生成的相關性數(shù)據(jù)見圖5.

      通常認為,數(shù)學成績好的小學生語文和英語的成績都不會很差.通過R語言各科成績的相關性分析看出,數(shù)學與語文、數(shù)學與英語的相關系數(shù)均超過了0.6,根據(jù)統(tǒng)計學的規(guī)定,相關系數(shù)區(qū)域0.6~0.8屬于有很強的相關性,說明在該年級中數(shù)學學得好的學生,其數(shù)學成績與語文成績、英語成績存在一定的相關性.通過R語言生成的成績相關性如圖6所示,運行代碼如下:

      pairs(scores[,subjects])

      3.3 成績差異分析

      利用starts()函數(shù)可根據(jù)學生的成績生成星圖,教學人員通過星圖可直觀了解學生是否偏科、是否優(yōu)秀.本文中生成的星圖如圖7所示,運行代碼如下:

      stars(scores)

      星圖一般表示多個相互獨立的變量個體,每個連接角與中心點的軸線越長,數(shù)值就越大,生成的星圖就越大,各科成績分別對著數(shù)據(jù)的維度.圖7中,第一排第二個學生、第二排第二個學生,以及第八排第二個到第七個學生,這些學生成績相對優(yōu)異;第三排第五個和最后一排第一個學生存在偏科問題.

      4 結語

      R語言是對數(shù)據(jù)進行統(tǒng)計分析的技術手段,從文中小學四年級成績統(tǒng)計分析結果來看,軟件的應用既可滿足教學人員對數(shù)據(jù)的計算需求,也可生成直觀視圖為教學人員提供參考依據(jù),同時所生成的視圖還顯示了數(shù)據(jù)中的隱藏信息.從應用與實際需求的角度來看,采用R語言統(tǒng)計分析學生成績的應用策略可行,對教學未來發(fā)展方向起到一定指導作用.

      猜你喜歡
      代碼函數(shù)班級
      班級“四小怪”
      小讀者(2021年4期)2021-11-24 10:49:03
      二次函數(shù)
      第3講 “函數(shù)”復習精講
      二次函數(shù)
      函數(shù)備考精講
      如何構建和諧班級
      甘肅教育(2020年22期)2020-04-13 08:10:52
      創(chuàng)世代碼
      動漫星空(2018年11期)2018-10-26 02:24:02
      創(chuàng)世代碼
      動漫星空(2018年2期)2018-10-26 02:11:00
      創(chuàng)世代碼
      動漫星空(2018年9期)2018-10-26 01:16:48
      創(chuàng)世代碼
      動漫星空(2018年5期)2018-10-26 01:15:02
      城固县| 闽清县| 九寨沟县| 敦煌市| 北辰区| 浏阳市| 于田县| 米脂县| 饶阳县| 台东县| 昌邑市| 东阿县| 阿拉善盟| 汉中市| 巨野县| 阳高县| 西和县| 开封县| 龙南县| 叙永县| 莎车县| 靖州| 安达市| 凤台县| 宜丰县| 广州市| 遂川县| 富裕县| 吉水县| 塘沽区| 喀喇沁旗| 松江区| 佛学| 台湾省| 博白县| 平阳县| 武邑县| 措美县| 孟州市| 德庆县| 永寿县|