文/李紅
目前,互聯(lián)網(wǎng)、5G、人工智能、物聯(lián)網(wǎng)、多媒體、大數(shù)據(jù)等技術(shù)正在不斷發(fā)展。其中,大數(shù)據(jù)技術(shù)已經(jīng)在零售、制造、金融、政府政務(wù)、醫(yī)療、物流及移動通信等多個領(lǐng)域得到了廣泛應(yīng)用,并且創(chuàng)造了巨大的經(jīng)濟效益和社會效益。隨著大數(shù)據(jù)時代的到來,統(tǒng)計學研究對象的基礎(chǔ)發(fā)生了變化,人們認識、收集和分析數(shù)據(jù)的思維也發(fā)生了變化。[1]大數(shù)據(jù)提高了統(tǒng)計質(zhì)量,降低了統(tǒng)計成本,使統(tǒng)計學的應(yīng)用領(lǐng)域不斷擴大。大數(shù)據(jù)給統(tǒng)計學帶來了發(fā)展機遇,但分布式大數(shù)據(jù)和數(shù)據(jù)流環(huán)境也給統(tǒng)計學帶來了挑戰(zhàn)。統(tǒng)計學最直接的挑戰(zhàn)是,在大數(shù)據(jù)環(huán)境下,部分傳統(tǒng)經(jīng)典的統(tǒng)計方法已經(jīng)失效。[2]有學者提出從改變對樣本的認識、改變對不確定性的認識等八個方面出發(fā),應(yīng)對大數(shù)據(jù)帶來的機遇與挑戰(zhàn)。[3]
統(tǒng)計學是關(guān)于數(shù)據(jù)收集、整理、分析和解釋的一門學科。數(shù)據(jù)是統(tǒng)計學的研究對象。在大數(shù)據(jù)時代之前,統(tǒng)計數(shù)據(jù)往往來自普查、抽樣調(diào)查和統(tǒng)計報表;人們在研究目的的驅(qū)動下,收集數(shù)據(jù);數(shù)據(jù)類型為結(jié)構(gòu)化數(shù)據(jù)。然而,在大數(shù)據(jù)時代,數(shù)據(jù)類型不僅包括結(jié)構(gòu)化數(shù)據(jù),還包括非結(jié)構(gòu)化數(shù)據(jù)(如文字、圖片、聲音、視頻、網(wǎng)頁、日志等)、半結(jié)構(gòu)化數(shù)據(jù)。數(shù)據(jù)來源渠道多樣,不需要事前設(shè)計和組織調(diào)查,并且數(shù)據(jù)獲取速度快,從而極大地擴充了統(tǒng)計數(shù)據(jù)的來源。
2.2.1 數(shù)據(jù)收集方式發(fā)生變化
在大數(shù)據(jù)時代,統(tǒng)計數(shù)據(jù)大多來自網(wǎng)絡(luò)上自動記錄、儲存的數(shù)據(jù),不具有目的性,數(shù)據(jù)采集不再局限于傳統(tǒng)的問卷調(diào)查、座談會、電話調(diào)查等方式,而是使用傳感設(shè)備自動采集。這種新的數(shù)據(jù)采集方式,使統(tǒng)計樣本的概念發(fā)生了變化。傳統(tǒng)統(tǒng)計學樣本是來自總體的部分個體,樣本應(yīng)該具有代表性,并且能夠反映總體的特征。在大數(shù)據(jù)時代,樣本就等于總體。人們需要利用網(wǎng)絡(luò)爬蟲技術(shù),采集網(wǎng)頁信息或數(shù)據(jù)。
2.2.2 數(shù)據(jù)整理方式發(fā)生變化
在大數(shù)據(jù)時代之前,統(tǒng)計數(shù)據(jù)整理是指根據(jù)統(tǒng)計研究的任務(wù)和要求,按照整理方案,對調(diào)查收集到的原始數(shù)據(jù)進行加工,使之條理化、系統(tǒng)化,從而得出反映總體特征的綜合資料的工作過程。統(tǒng)計數(shù)據(jù)整理的程序包括統(tǒng)計數(shù)據(jù)的審核、分組與匯總、統(tǒng)計圖表編制。數(shù)據(jù)審核主要審核數(shù)據(jù)的完整性、準確性和及時性。在大數(shù)據(jù)時代,數(shù)據(jù)量非常大,其中可能存在虛假的、錯誤的數(shù)據(jù),這些數(shù)據(jù)不能直接使用。因此,在使用大數(shù)據(jù)之前,人們需要開展數(shù)據(jù)篩選、數(shù)據(jù)清洗、數(shù)據(jù)提煉、數(shù)據(jù)降維、數(shù)據(jù)降噪等工作。大數(shù)據(jù)不再強調(diào)數(shù)據(jù)的精確性,“允許不精確”已經(jīng)成為大數(shù)據(jù)的一個顯著特點[4,5]。與樣本容量小、數(shù)據(jù)類型為結(jié)構(gòu)化數(shù)據(jù)的統(tǒng)計數(shù)據(jù)相比,大數(shù)據(jù)的數(shù)據(jù)量更大,數(shù)據(jù)類型更加復雜多樣,數(shù)據(jù)價值密度更低。
2.2.3 統(tǒng)計分析方法發(fā)生變化
大數(shù)據(jù)時代的到來,給傳統(tǒng)統(tǒng)計分析方法帶來了挑戰(zhàn),一些傳統(tǒng)的統(tǒng)計分析方法已經(jīng)不再適用,人們需要發(fā)展新的數(shù)據(jù)分析方法。分布式并行計算技術(shù)的快速發(fā)展,催生了適用于大數(shù)據(jù)抽樣、分類、聚類、關(guān)聯(lián)分析的K-means算法、Apriori算法等新的分析方法。傳統(tǒng)統(tǒng)計學教材側(cè)重變量之間的因果關(guān)系,統(tǒng)計推斷分析是以抽樣分布理論為基礎(chǔ)的。在一定的概率下,人們可以利用樣本特征,推斷總體特征。然而,在大數(shù)據(jù)時代,統(tǒng)計分析側(cè)重相關(guān)關(guān)系分析,樣本就是總體。因此,人們不再用樣本特征推斷總體特征。
統(tǒng)計學是一門方法論科學,它主要培養(yǎng)學生利用統(tǒng)計學理論和方法分析解決實際問題的能力。因此,學校需要加強學生實踐能力培養(yǎng)。目前,經(jīng)管專業(yè)統(tǒng)計學課程教學包括理論教學和實踐教學。由于教學內(nèi)容復雜和課時較短,學校往往重視理論教學,卻忽視了實踐教學。同時,傳統(tǒng)實踐教學大多使用Excel、Eviews、SPSS等統(tǒng)計軟件。這些統(tǒng)計軟件無法對高維、復雜、多樣的海量數(shù)據(jù)進行降維、清洗。在大數(shù)據(jù)時代,這些軟件已經(jīng)不再適用。此外,實踐教學中的數(shù)據(jù)通常是經(jīng)過加工整理后的二手數(shù)據(jù),而不是原始數(shù)據(jù)。其中許多基于小樣本數(shù)據(jù)建立的傳統(tǒng)統(tǒng)計方法,并不適用于大數(shù)據(jù)分析。[6]實踐教學與大數(shù)據(jù)分析人才需求脫節(jié),導致許多學生無法利用所學知識去解決企業(yè)的實際問題。
大數(shù)據(jù)要求人們在數(shù)據(jù)處理與分析等方面使用新技術(shù)。因此,教師不僅需要掌握相應(yīng)的統(tǒng)計理論知識,還需要掌握計算機互聯(lián)網(wǎng)技術(shù)、信息技術(shù)等相關(guān)知識,例如數(shù)據(jù)庫、結(jié)構(gòu)化編程、算法、數(shù)據(jù)結(jié)構(gòu)等知識。另外,教師還需要熟練應(yīng)用統(tǒng)計軟件,對大數(shù)據(jù)中的數(shù)據(jù)進行獲取、清洗、降維、降噪、數(shù)據(jù)可視化展示、分布式計算、并行計算。這對經(jīng)管專業(yè)統(tǒng)計學教師提出了更高要求。因此,為了適應(yīng)時代發(fā)展,滿足人才培養(yǎng)的需求,教師需要及時調(diào)整和更新知識結(jié)構(gòu),提高大數(shù)據(jù)分析技能。
大數(shù)據(jù)時代的到來,使大數(shù)據(jù)在體量、類型、結(jié)構(gòu)等方面與傳統(tǒng)數(shù)據(jù)有所不同,這對數(shù)據(jù)的搜集、篩選、整理與分析提出了新的要求。在經(jīng)管專業(yè)統(tǒng)計學教學中,教師應(yīng)樹立大數(shù)據(jù)思維,結(jié)合與專業(yè)相關(guān)的大數(shù)據(jù)案例,選用合適的統(tǒng)計分析方法,對數(shù)據(jù)信息進行搜集、存儲、清洗、整理與分析,增強學生的大數(shù)據(jù)意識,提高學生的大數(shù)據(jù)分析能力。
在大數(shù)據(jù)時代,數(shù)據(jù)類型不僅包括結(jié)構(gòu)化數(shù)據(jù),還包括非結(jié)構(gòu)化數(shù)據(jù)。教師可以從以下兩個方面出發(fā),優(yōu)化統(tǒng)計學課程教學內(nèi)容:增加真實的大數(shù)據(jù)案例和大數(shù)據(jù)處理技術(shù)等相關(guān)內(nèi)容;增加大數(shù)據(jù)的統(tǒng)計分析方法。教師應(yīng)將大數(shù)據(jù)環(huán)境下產(chǎn)生的經(jīng)濟問題、商務(wù)問題作為案例,采用基于大數(shù)據(jù)分析技術(shù)的教學模式,培養(yǎng)學生的實踐能力。在大數(shù)據(jù)時代,人們不再區(qū)分總體與樣本的概念(總體即樣本),并且開始重視相關(guān)分析與因果分析。因此,教師應(yīng)結(jié)合實際情況,增加推斷統(tǒng)計等內(nèi)容。另外,在教學過程中,教師不僅需要介紹抽樣調(diào)查的基本原理和主要方法,還需要介紹參數(shù)估計、假設(shè)檢驗、時間序列分析、回歸分析、主成分分析等統(tǒng)計方法。
為滿足大數(shù)據(jù)時代對數(shù)據(jù)分析人才的需求,教師應(yīng)加強實踐教學。教師需要增加實踐學時,利用Python等統(tǒng)計軟件,提高學生數(shù)據(jù)分析能力;需要引入真實案例數(shù)據(jù),并且保證每一章都至少有一個真實案例;應(yīng)以問題為中心開展教學,以任務(wù)驅(qū)動改變教學方式,引導學生從被動接受知識轉(zhuǎn)變?yōu)閹е鴨栴}主動探索知識。除此之外,教師應(yīng)將社會熱點問題作為案例,比如新冠肺炎疫情下的國家宏觀經(jīng)濟和居民消費、稅收優(yōu)惠與企業(yè)研發(fā)投入、社會保險費率與企業(yè)用工成本等。教師還需要組織學生開展調(diào)查和研究,指導學生收集、整理、分析相關(guān)數(shù)據(jù)。實踐教學應(yīng)重在引導學生利用統(tǒng)計方法解決實際問題,培養(yǎng)學生的獨立思考能力和動手能力。
教師應(yīng)充分認識大數(shù)據(jù)時代帶來的變化和挑戰(zhàn)。教師需要不斷更新知識結(jié)構(gòu)和提高教學能力。在大數(shù)據(jù)時代,人們需要應(yīng)用分布式計算、云存儲、關(guān)系數(shù)據(jù)庫等信息技術(shù),快速搜索、抓取、存儲、計算和分析各種類型的數(shù)據(jù)。因此,教師應(yīng)當與時俱進,不斷學習大數(shù)據(jù)知識,更新和完善自身的知識體系,以適應(yīng)大數(shù)據(jù)背景下的統(tǒng)計學課程教學需求。
在大數(shù)據(jù)背景下,社會對經(jīng)管專業(yè)人才提出了新的要求。因此,在經(jīng)管專業(yè)統(tǒng)計學課程教學中,教師應(yīng)樹立大數(shù)據(jù)思維,不斷更新教學內(nèi)容,增加實踐教學,完善知識體系,以適應(yīng)大數(shù)據(jù)時代對數(shù)據(jù)分析人才的需求。