劉廣會 韓瑩瑩
摘 要:本文以大數(shù)據(jù)時(shí)代為背景,基于R軟件分析概率論與數(shù)理統(tǒng)計(jì)的教學(xué)中,探索如何在實(shí)踐教學(xué)中提高教學(xué)質(zhì)量,充分調(diào)動學(xué)生積極性的同時(shí),提高了大學(xué)生學(xué)習(xí)知識、運(yùn)用知識解決實(shí)際問題的能力。
關(guān)鍵詞:大數(shù)據(jù);R軟件;實(shí)踐教學(xué)
大數(shù)據(jù)指在一定時(shí)間范圍內(nèi)無法使用常規(guī)軟件工具捕捉、管理和處理的數(shù)據(jù)集合。大數(shù)據(jù)具有多種數(shù)據(jù)類型、快速采集速度、龐大的數(shù)據(jù)量和低數(shù)據(jù)成本等特點(diǎn)。目前,大數(shù)據(jù)時(shí)代已經(jīng)到來,政府、企事業(yè)單位等機(jī)構(gòu)已經(jīng)意識到數(shù)據(jù)是組織機(jī)構(gòu)重要的資產(chǎn),數(shù)據(jù)的分析能力成為各個(gè)組織核心競爭力。統(tǒng)計(jì)部門和高校科研單位要對海量數(shù)據(jù)進(jìn)行處理,挖掘數(shù)據(jù)寶庫,發(fā)現(xiàn)潛在規(guī)律信息等,為政府部門決策提供理論支持[1]。作為分析數(shù)據(jù)的一門重要學(xué)科,概率論與數(shù)理統(tǒng)計(jì)在大數(shù)據(jù)時(shí)代顯得尤為重要。在信息快速發(fā)展的大數(shù)據(jù)時(shí)代,傳統(tǒng)的概率論與數(shù)理統(tǒng)計(jì)的教學(xué)也面臨這諸多挑戰(zhàn)。
一、概率論與數(shù)理統(tǒng)計(jì)課程的教學(xué)現(xiàn)狀
許多現(xiàn)代高校都把培養(yǎng)應(yīng)用型人才作為培養(yǎng)目標(biāo),但是在課程的設(shè)置上還是側(cè)重理論基礎(chǔ)。概率論與數(shù)理統(tǒng)計(jì)是理工科類大學(xué)生必修數(shù)學(xué)理論基礎(chǔ)課程,是學(xué)習(xí)許多其他專業(yè)基礎(chǔ)課的先修課程,對其他專業(yè)課學(xué)習(xí)有重要的影響。但是由于概率論與數(shù)理統(tǒng)計(jì)課程內(nèi)容抽象、理論推導(dǎo)復(fù)雜、計(jì)算量大等特點(diǎn);對于數(shù)學(xué)基礎(chǔ)較差的學(xué)生,學(xué)習(xí)更加困難,造成學(xué)習(xí)倦怠。另外,教師又很難在有限的時(shí)間內(nèi)充分完成教學(xué)任務(wù),又能對典型例題進(jìn)行有效練習(xí)。諸多原因造成概率論與數(shù)理統(tǒng)計(jì)課程的教學(xué)質(zhì)量很不樂觀[2]。隨著教育改革的不斷深入,教育教學(xué)理論與觀念不斷更新,現(xiàn)代教育倡導(dǎo)以學(xué)生的發(fā)展為出發(fā)點(diǎn),在教學(xué)過程中將理論知識與實(shí)踐相結(jié)合,才能使得學(xué)生掌握的知識轉(zhuǎn)化為實(shí)際生產(chǎn)力,同時(shí)通過實(shí)踐教學(xué)提高學(xué)生分析和解決實(shí)際問題的應(yīng)用能力。在現(xiàn)代信息技術(shù)大力推廣的時(shí)代,如何讓抽象的數(shù)學(xué)課程變得直觀、生動、富有樂趣,讓復(fù)雜、繁瑣的理論推導(dǎo)過程變得簡單明了,通俗易懂,讓學(xué)生從被動的學(xué)習(xí)變成主動的獲取、探索,是概率論與數(shù)理統(tǒng)計(jì)課程改革方向和目標(biāo)。在多媒體教學(xué)的基礎(chǔ)上,借助R統(tǒng)計(jì)軟件輔助教學(xué)成為探索大數(shù)據(jù)時(shí)代概率論與數(shù)理統(tǒng)計(jì)課程新的教學(xué)手段。
二、R軟件在實(shí)踐教學(xué)中應(yīng)用案例探究
好的實(shí)踐教學(xué)效果離不開好的統(tǒng)計(jì)軟件。R是一種流行且完全免費(fèi)的免費(fèi)開源統(tǒng)計(jì)軟件,是統(tǒng)計(jì)計(jì)算和統(tǒng)計(jì)繪圖的絕佳工具。而且在數(shù)據(jù)挖掘等領(lǐng)域,人大經(jīng)濟(jì)論壇,數(shù)學(xué)中國論壇、統(tǒng)計(jì)之都等論壇匯集了眾多對R軟件有興趣的統(tǒng)計(jì)學(xué)、數(shù)據(jù)挖掘的專家和愛好者,共同探討R軟件在統(tǒng)計(jì)分析和數(shù)據(jù)挖掘方面的應(yīng)用[3]。
下面我們通過實(shí)踐案例說明在概率論與數(shù)理統(tǒng)計(jì)教學(xué)中如何使用R軟件進(jìn)行實(shí)踐教學(xué)和計(jì)算分析。
例1:已知某種材料的抗壓強(qiáng)度 ,現(xiàn)隨機(jī)地抽取 10 個(gè)試件進(jìn)行抗壓試驗(yàn),測得數(shù)據(jù)如下:
482 493 457 471 510 446 435 418 394 469
(1)求平均抗壓強(qiáng)度 的置信水平為 95%的置信區(qū)間;
(2)若已知 ,求平均抗壓強(qiáng)度 的置信水平為 95%的置信區(qū)間;
解析:這是學(xué)習(xí)區(qū)間估計(jì)時(shí)常見案例,通常教材上的會采用常規(guī)理論推導(dǎo)計(jì)算不同類型下的區(qū)間估計(jì).
下面使用R軟件編程,并調(diào)用相關(guān)的程序
編程語言:
interval_estimate1<-function(x,sigma=-1,alpha=0.05){
n<-length(x); xb<-mean(x)
if (sigma>=0){
tmp<-sigma/sqrt(n)*qnorm(1-alpha/2); df<-n
}
else{
tmp<-sd(x)/sqrt(n)*qt(1-alpha/2,n-1); df<-n-1
}
data.frame(mean=xb, df=df, a=xb-tmp, b=xb+tmp)
}
編寫程序后,在命令編輯窗口中輸入如下命令:
>? source(“interval_estimate1.R”)
>? X<-c(482,493,457,471,510,446,435,418,394,469)
>? interval_estimate1(X)
mean???? df??????? a???????? b
1 457.5???? 9????? 432.3069?? 482.6931
R軟件會輕松計(jì)算出在方差未知的情況下平均抗壓強(qiáng)度的置信水平為 95%的置信區(qū)間為。
同樣地,當(dāng)方差已知的情況下輸入
>? interval_estimate1(X,30)
mean??? df? ??????a???????? b
1 457.5?? 10???? 438.9061?? 476.0939
R軟件會輕松計(jì)算出在方差已知的情況下平均抗壓強(qiáng)度的置信水平為 95%的置信區(qū)間為。
例2:化肥廠用自動包裝機(jī)包裝化肥,每包的質(zhì)量服從正態(tài)分布,其平均質(zhì)量為100kg,標(biāo)準(zhǔn)差為1.2kg。某日開工后,為了確定這天包裝機(jī)工作是否正常,隨機(jī)抽取 9 袋化肥,稱得質(zhì)量如下:
99.3 98.7 100.5 101.2 98.3 99.7 99.5 102.1 100.5.
設(shè)方差穩(wěn)定不變,問這一天包裝機(jī)的工作是否正常(?。?/p>
傳統(tǒng)理論推導(dǎo)計(jì)算步驟如下:
解:概率論與數(shù)理統(tǒng)計(jì)常規(guī)方法為建立檢驗(yàn)假設(shè),選取統(tǒng)計(jì)量,給定顯著性水平,確定雙側(cè)拒絕域,并且計(jì)算檢驗(yàn)的值,確定接受原假設(shè)還是拒絕原假設(shè),即可以判斷這一天包裝機(jī)的工作正常.
編程語言:
mean.test1<-function(x, mu=0, sigma=-1, side=0){
source(“P_value.R”)
n<-length(x); xb<-mean(x)
if (sigma>=0){
z<-(xb-mu)/(sigma/sqrt(n))
P<-P_value(pnorm, z, side=side)
data.frame(mean=xb, df=n, Z=z, P_value=P)
}
else{
t<-(xb-mu)/(sd(x)/sqrt(n))
P<-P_value(pt, t, paramet=n-1, side=side)
data.frame(mean=xb, df=n-1, T=t, P_value=P)
}
}
> source(“mean.test1.R”)
> X<-c(99.3,98.7,100.5,101.2,98.3,99.7,99.5,102.1,100.5)
> mean.test1(X, mu=100, side=0)
mean???? df?????????? T???????? P_value
1 99.97778?? 8????? -0.05499613???? 0.9574902
通過R軟件P值為0.9574>0.05, 故接受原假設(shè),可以認(rèn)為這一天包裝機(jī)的工作正常。
三、R軟件在概率論與數(shù)理統(tǒng)計(jì)教學(xué)實(shí)踐意義
概率論與數(shù)理統(tǒng)計(jì)是一門研究隨機(jī)現(xiàn)象統(tǒng)計(jì)規(guī)律的學(xué)科,課程本身較為抽象,學(xué)生普遍反映面對抽象的概念定義、復(fù)雜的計(jì)算過程、難以理解的理論推導(dǎo)時(shí)往往都會失去學(xué)習(xí)興趣。如果僅采用傳統(tǒng)的教學(xué)模式、方法、手段,不但難以提高學(xué)生學(xué)習(xí)的積極性,教學(xué)效果相對也較差。
從前面的幾個(gè)教學(xué)實(shí)例的介紹可見,以R軟件進(jìn)行輔助教學(xué),一方面,可以讓復(fù)雜的計(jì)算過程用簡單的幾行程序代碼快速呈現(xiàn),減輕學(xué)生對概率論與數(shù)理統(tǒng)計(jì)課程的恐懼和反感,提高學(xué)生學(xué)習(xí)的積極性、主動性;另一方面,由于R軟件具有強(qiáng)大的圖形可視化功能,可以借助圖形將計(jì)算結(jié)果顯示出來,增加結(jié)果的直觀性,更有助于對統(tǒng)計(jì)結(jié)果的合理解釋。在實(shí)踐教學(xué)過程中,R軟件使得抽象的教學(xué)內(nèi)容變得直觀、生動的同時(shí)教學(xué)重難點(diǎn)也得突破,教學(xué)效果顯著提高。與此同時(shí),在學(xué)習(xí)概率論與數(shù)理統(tǒng)計(jì)理論基礎(chǔ)知識的同時(shí),對R軟件有了簡單的了解,增加深入學(xué)習(xí)R語言的興趣。
總之,將R軟件融入到概率論與數(shù)理統(tǒng)計(jì)課程的實(shí)踐教學(xué)中,既有利于教師在有限的時(shí)間內(nèi)把抽象的理論知識轉(zhuǎn)化為生動、形象的圖形、圖表,使得理論知識具體化了、直觀化了,這樣也激發(fā)了學(xué)生對數(shù)學(xué)相關(guān)課程產(chǎn)生濃厚的興趣的同時(shí),讓學(xué)生掌握、精通一門編程語言,進(jìn)一步提高學(xué)生的分析問題和解決實(shí)際問題的能力,為統(tǒng)計(jì)建模、數(shù)學(xué)建模類的實(shí)踐能力大賽打下堅(jiān)實(shí)的基礎(chǔ)。
在大數(shù)據(jù)時(shí)代背景下,培養(yǎng)綜合的應(yīng)用型人才是各高校人才培養(yǎng)目標(biāo),而能夠熟練精通掌握一門計(jì)算機(jī)編程語言又是新時(shí)代用人單位對大學(xué)生的基本要求,所以把R語言融入到概率論與數(shù)理統(tǒng)計(jì)的教學(xué)實(shí)踐中,可以在改善課堂教學(xué)效果的同時(shí),讓學(xué)生掌握一門實(shí)用編程語言,并掌握處理和分析數(shù)據(jù)的能力,為學(xué)校實(shí)現(xiàn)培養(yǎng)應(yīng)用型人才的目標(biāo)提供有力保障和奠定堅(jiān)實(shí)基礎(chǔ)。
參考文獻(xiàn)
[1] 蔣東興,付小龍.大數(shù)據(jù)背景下的高校智慧校園的建設(shè)探討[J].華東師范大學(xué)學(xué)報(bào),2015(3):119-131.
[2] 趙為華.R軟件在概率論與數(shù)理統(tǒng)計(jì)案例教學(xué)中應(yīng)用[J].福建電腦,2018,34(5):171-172.
[3] 李向利,趙紅衛(wèi).大數(shù)據(jù)時(shí)代背景下統(tǒng)計(jì)學(xué)教學(xué)模式的改革研究——以桂林電子科技大學(xué)為例[J].赤峰學(xué)院學(xué)報(bào):自然科學(xué)版.2016(3):262-263.