唐小勇 李小春
摘 要: 大數(shù)據(jù)時(shí)代的統(tǒng)計(jì)思維、相關(guān)概念、研究對(duì)象發(fā)生了重大的改變,因此,應(yīng)更新教學(xué)內(nèi)容,轉(zhuǎn)變思維模式,提升計(jì)算機(jī)技能來(lái)培養(yǎng)適應(yīng)大數(shù)據(jù)時(shí)代的優(yōu)秀人才。
關(guān)鍵詞:大數(shù)據(jù) 概率論 教學(xué)
引言
隨著高等教育由精英教育向大眾教育的轉(zhuǎn)型,高等教育在滿足社會(huì)精英人才需求的同時(shí),還應(yīng)該培養(yǎng)適應(yīng)社會(huì)現(xiàn)代化發(fā)展的應(yīng)用型本科人才。作為本科院校大多數(shù)專業(yè)的公共數(shù)學(xué)基礎(chǔ)課程之一的《概率論》,一直在自然科學(xué)、社會(huì)科學(xué)、工程技術(shù)、經(jīng)濟(jì)生活等領(lǐng)域起著重要的作用。不同于其它兩門(mén)公共數(shù)學(xué)基礎(chǔ)課程《高等數(shù)學(xué)》、《線性代數(shù)》是研究確定性現(xiàn)象的數(shù)學(xué)分支,《概率論計(jì)》是研究隨機(jī)現(xiàn)象的數(shù)據(jù)規(guī)律的一門(mén)學(xué)科。所謂的隨機(jī)現(xiàn)象指的是事前不可預(yù)言的現(xiàn)象,需要在大量的數(shù)據(jù)中找出某種規(guī)律,然后對(duì)這種規(guī)律提出合理的假設(shè),再對(duì)這種假設(shè)進(jìn)行檢驗(yàn),最后根據(jù)這種規(guī)律來(lái)預(yù)測(cè)未來(lái)的發(fā)展趨勢(shì)。不同于自然科學(xué)等存在的客觀現(xiàn)象,社會(huì)生活中廣泛存在著隨機(jī)現(xiàn)象,因此,概率論也成為處理隨機(jī)現(xiàn)象的最好工具。但是,隨著“云時(shí)代”的到臨,大數(shù)據(jù)受到越來(lái)越多的關(guān)注。根據(jù)研究機(jī)構(gòu)Gartner給出的定義,大數(shù)據(jù)是需要新處理模式才能有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力來(lái)適應(yīng)海量、高增長(zhǎng)率和多樣化的信息資產(chǎn)。根據(jù)IBM提出的有關(guān)大數(shù)據(jù)的特征,它具有“5V”的特征:規(guī)模性(Volume)、高速性(Velocity)、多樣性(Variety)、低價(jià)值密度性(Value)、真實(shí)性(Veracity)。而隨著大數(shù)據(jù)大規(guī)模的被廣泛使用,不僅僅很多學(xué)者和研究機(jī)構(gòu)也開(kāi)始關(guān)注這個(gè)問(wèn)題,各國(guó)政府以及企業(yè)也非常重視大數(shù)據(jù)的挖掘工作。大數(shù)據(jù)所隱藏的價(jià)值信息不但成為很多行業(yè)贏得競(jìng)爭(zhēng)的關(guān)鍵,還對(duì)國(guó)家的穩(wěn)定發(fā)展具有重大的戰(zhàn)略意義。為此,李克強(qiáng)總理在2015年9月簽批《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》,綱要明確提出在未來(lái)5到10年推動(dòng)大數(shù)據(jù)的發(fā)展和應(yīng)用。[1]
但是,大數(shù)據(jù)的數(shù)據(jù)特征使得傳統(tǒng)的統(tǒng)計(jì)學(xué)方法不一定再使用,傳統(tǒng)的統(tǒng)計(jì)學(xué)理論需要更新。因此,與之相對(duì)應(yīng)的《概率論》課程的教學(xué)也需要進(jìn)行改革。
一、大數(shù)據(jù)與傳統(tǒng)統(tǒng)計(jì)學(xué)
大數(shù)據(jù)給統(tǒng)計(jì)學(xué)帶來(lái)了新的機(jī)遇,但也帶來(lái)了一些新的挑戰(zhàn),一些經(jīng)典的統(tǒng)計(jì)學(xué)分析在大數(shù)據(jù)中已經(jīng)完全失效。因此,在大數(shù)據(jù)時(shí)代背景下,傳統(tǒng)統(tǒng)計(jì)學(xué)應(yīng)該如何發(fā)展?相關(guān)統(tǒng)計(jì)學(xué)課程又應(yīng)當(dāng)做怎樣的教學(xué)改革,這都是統(tǒng)計(jì)學(xué)家與教學(xué)工作者很關(guān)注的問(wèn)題。
1.相關(guān)性與因果性。舍恩伯格等在《大數(shù)據(jù)時(shí)代》中提到:“相關(guān)關(guān)系比因果關(guān)系更好地了解這個(gè)世界”,這種區(qū)別于傳統(tǒng)數(shù)學(xué)研究“因果關(guān)系”的現(xiàn)象引起了更多國(guó)外學(xué)者的關(guān)注。數(shù)據(jù)之間的相關(guān)關(guān)系的研究,使得人們對(duì)于世界的認(rèn)識(shí)有一個(gè)更為開(kāi)放的信息系統(tǒng)視覺(jué),對(duì)事物的認(rèn)識(shí)不再局限于封閉的領(lǐng)域。比如淘寶每年在11.11日舉辦的光棍節(jié)大促銷活動(dòng),淘寶官網(wǎng)通過(guò)hadoop數(shù)據(jù)平臺(tái),對(duì)2011-2015年的淘寶全網(wǎng)數(shù)據(jù)分析,發(fā)現(xiàn)中國(guó)人在八大行業(yè)如時(shí)尚美妝、家電數(shù)碼、食品、服裝等方面消費(fèi)較多,而且對(duì)這八大行業(yè)給出了行業(yè)發(fā)展趨勢(shì)報(bào)告。而且,通過(guò)個(gè)體的消費(fèi)偏好、消費(fèi)金額等數(shù)據(jù),利用相關(guān)性原理,以計(jì)算機(jī)強(qiáng)大的分析能力來(lái)尋找個(gè)體購(gòu)物的最優(yōu)的關(guān)聯(lián)物。很多網(wǎng)站也涌現(xiàn)出大數(shù)據(jù)相關(guān)性的應(yīng)用成果,不需要個(gè)體自行搜索,系統(tǒng)根據(jù)歷史記錄,自動(dòng)給出可視化的數(shù)據(jù)新聞。
雖然大數(shù)據(jù)分析的相關(guān)性研究的結(jié)果價(jià)值不凡,但相關(guān)性不能反應(yīng)出事物之間的本質(zhì)關(guān)系,只能反映出數(shù)據(jù)之間的關(guān)系。還有就是事物之間的相關(guān)性并不能替代事物之間的因果關(guān)系,因?yàn)榛谙嚓P(guān)分析的結(jié)果只是反映出事物之間的關(guān)聯(lián)性,說(shuō)明事物間有某種相同的變化趨勢(shì),但是事物之間可能并不存在因果關(guān)系。故如果做決策分析時(shí),直接采用相關(guān)性的結(jié)論,可能會(huì)導(dǎo)致決策失誤。
2.總體、個(gè)體、樣本
總體、個(gè)體、樣本是統(tǒng)計(jì)學(xué)中最基本的概念,也是統(tǒng)計(jì)學(xué)中最重要的關(guān)系,幾乎所有的統(tǒng)計(jì)理論都是從這三個(gè)概念出發(fā)而發(fā)展出來(lái)的?,F(xiàn)有的統(tǒng)計(jì)學(xué)中,總體指的是具有某種共同屬性的組成的集合,個(gè)體指的是集合中的每個(gè)元素,即是符合總體屬性的個(gè)別事物,是數(shù)據(jù)的承擔(dān)者或是來(lái)源者,樣本指的是從總體中隨機(jī)抽取的每個(gè)元素組成的集合。統(tǒng)計(jì)學(xué)研究的是總體的發(fā)展規(guī)律,但由于一些客觀原因如人力、物力的限制,無(wú)法來(lái)研究總體的發(fā)展規(guī)律,就從總體中隨機(jī)抽樣出一部分樣本,通過(guò)對(duì)樣本的研究來(lái)探討出總體的發(fā)展規(guī)律。所以,在一般的統(tǒng)計(jì)學(xué)中,其研究的邏輯路線是:先確定好研究的對(duì)象,然后研究每個(gè)個(gè)體的性質(zhì),從中找出所需的變量或者研究指標(biāo),然后再抽樣獲取所需變量的具體數(shù)據(jù),進(jìn)而根據(jù)這些數(shù)據(jù)通過(guò)統(tǒng)計(jì)分析得出結(jié)論,然后對(duì)結(jié)論進(jìn)行檢驗(yàn)。這種思路,很顯然是先確定總體,再由總體來(lái)確定研究所需的數(shù)據(jù)。但是,在大數(shù)據(jù)背景下,先看到的是數(shù)據(jù)而不是數(shù)據(jù)的承擔(dān)者,特別是網(wǎng)絡(luò)化時(shí)代當(dāng)中的數(shù)據(jù),根本無(wú)法得知數(shù)據(jù)的來(lái)源以及數(shù)據(jù)的基本特征,呈現(xiàn)出來(lái)的除了數(shù)據(jù)本身之外并無(wú)其他東西。這就導(dǎo)致大多數(shù)情況下直接面對(duì)全體數(shù)據(jù),原來(lái)傳統(tǒng)統(tǒng)計(jì)學(xué)中的抽樣以及統(tǒng)計(jì)理論完全失效了。[2]
舍恩伯格等在《大數(shù)據(jù)時(shí)代》中也提出,大數(shù)據(jù)的“大”不僅僅是數(shù)據(jù)體量的大,更重要的是數(shù)據(jù)結(jié)構(gòu)本身的重大改變。因此,他們?cè)跁?shū)中提出“要全體不要抽樣的”觀點(diǎn)。因?yàn)榇髷?shù)據(jù)可提供所有數(shù)據(jù)本身的信息,通過(guò)數(shù)據(jù)不但可以研究事物之間的普遍性規(guī)律,還可以具體研究個(gè)體的特征信息。但是,對(duì)舍恩伯格的“不需要樣本”的觀點(diǎn),很多人持懷疑態(tài)度。因?yàn)樵谔剿餍缘拇髷?shù)據(jù)分析中,抽樣分析仍然需要,只是功能會(huì)發(fā)生改變。而且,從動(dòng)態(tài)的來(lái)看,大數(shù)據(jù)只是某個(gè)時(shí)刻的總體而已,后面時(shí)刻總要包含前面時(shí)刻的總體,那么,前面時(shí)刻的大數(shù)據(jù)也只是后面時(shí)刻大數(shù)據(jù)的一個(gè)樣本而已。所以,即使大數(shù)據(jù)的總體、樣本的關(guān)系發(fā)生了改變,但抽樣分析還是必不可少的,只是需要構(gòu)建新的方法而已。
三、大數(shù)據(jù)時(shí)代下統(tǒng)計(jì)學(xué)教學(xué)的思考
大數(shù)據(jù)時(shí)代下,傳統(tǒng)的統(tǒng)計(jì)學(xué)思維模式發(fā)生了改變,一些統(tǒng)計(jì)理論需要構(gòu)建,新的軟件需要學(xué)習(xí)。因此,在大數(shù)據(jù)背景下,概率論的教學(xué)該怎樣進(jìn)行?這是每個(gè)數(shù)學(xué)教師所面臨的問(wèn)題。
1.改變思維模式。由于大數(shù)據(jù)研究的事物對(duì)象發(fā)生了改變,直接面對(duì)全體數(shù)據(jù)本身,因此,統(tǒng)計(jì)思維模式也應(yīng)跟著變化。在大數(shù)據(jù)時(shí)代下,數(shù)據(jù)不僅僅是研究對(duì)象,還是研究的基礎(chǔ)資源,數(shù)據(jù)本身可以反映出事物之間的關(guān)系,還可以協(xié)助解決其他問(wèn)題。所以,在現(xiàn)行的統(tǒng)計(jì)課堂上,需要改變統(tǒng)計(jì)思維模式。對(duì)數(shù)據(jù)的看法需要改變,從原來(lái)的研究對(duì)象來(lái)確定數(shù)據(jù)轉(zhuǎn)變成通過(guò)數(shù)據(jù)來(lái)研究事物對(duì)象。通過(guò)對(duì)數(shù)據(jù)的掌握與分析,來(lái)進(jìn)一步揭示事物的本質(zhì)關(guān)系。
2.更新教學(xué)內(nèi)容。由于大數(shù)據(jù)當(dāng)中的研究對(duì)象發(fā)生改變,抽樣的理論需要重新構(gòu)建,傳統(tǒng)數(shù)學(xué)當(dāng)中的確定性關(guān)系不再至關(guān)重要,事物之間的相關(guān)性比因果性更重要,等等這些方法與概念的重新推導(dǎo)與定義,都需要更新教學(xué)內(nèi)容。而且,在傳統(tǒng)概率論教學(xué)中,重公式推導(dǎo)輕數(shù)值計(jì)算。所以,在大數(shù)據(jù)時(shí)代下,數(shù)學(xué)的理論推導(dǎo)應(yīng)該讓步與數(shù)值計(jì)算,統(tǒng)計(jì)學(xué)課程的設(shè)定應(yīng)該更加重視應(yīng)用層面的知識(shí),應(yīng)該培養(yǎng)學(xué)生解決實(shí)際問(wèn)題的能力。
3.重視計(jì)算機(jī)技能。大數(shù)據(jù)時(shí)代下,一些傳統(tǒng)的統(tǒng)計(jì)軟件解決不了的問(wèn)題,可以在新的軟件下得以實(shí)現(xiàn)。而且大數(shù)據(jù)需要的是統(tǒng)計(jì)知識(shí)與計(jì)算機(jī)技能的結(jié)合,學(xué)生除掌握基本的統(tǒng)計(jì)理論外,還應(yīng)該熟練操作計(jì)算機(jī)。運(yùn)用計(jì)算機(jī)與統(tǒng)計(jì)方面的知識(shí)把數(shù)據(jù)整合在一起進(jìn)行分析,轉(zhuǎn)化成可以分析的統(tǒng)計(jì)數(shù)據(jù),并對(duì)數(shù)據(jù)的結(jié)果進(jìn)行解釋,這些都需要加強(qiáng)學(xué)生的計(jì)算機(jī)技能的培養(yǎng)。
在大數(shù)據(jù)時(shí)代下,數(shù)據(jù)比黃金還重要,但如何把這些數(shù)據(jù)轉(zhuǎn)化成所需要的知識(shí),這還需要統(tǒng)計(jì)學(xué)的教學(xué)得到改變。因此,教師應(yīng)該針對(duì)現(xiàn)實(shí)社會(huì)人才的需求狀況,積極改革統(tǒng)計(jì)學(xué)的教學(xué),來(lái)培養(yǎng)出適應(yīng)時(shí)代發(fā)展的優(yōu)秀人才。
參考文獻(xiàn)
[1] 李小平. 概率論與數(shù)理統(tǒng)計(jì)[M].北京:高等教育出版社, 2013.
[2] 馬雙鴿,方匡南.大數(shù)據(jù)時(shí)代統(tǒng)計(jì)學(xué)發(fā)展的若干問(wèn)題[J].統(tǒng)計(jì)研究,2017,1:5-11.
作者簡(jiǎn)介
唐小勇(1973-),男,湖南洞口人,博士,副教授,湖南農(nóng)業(yè)大學(xué)信息科學(xué)技術(shù)學(xué)院教師,研究方向?yàn)榇髷?shù)據(jù)技術(shù),高等教育理論.
通訊作者
李小春(1979-),男,湖南新邵人,副教授,湖南農(nóng)業(yè)大學(xué)經(jīng)濟(jì)學(xué)院在讀博士,研究方向?yàn)檗r(nóng)業(yè)經(jīng)濟(jì)理論,數(shù)學(xué)教育理論.