杜平
摘 ? 要: 統(tǒng)計素養(yǎng)是中學(xué)生數(shù)學(xué)核心素養(yǎng)的有機組成部分。針對培養(yǎng)學(xué)生統(tǒng)計素養(yǎng)的關(guān)鍵環(huán)節(jié),以案例形式設(shè)計了對應(yīng)的教學(xué)策略。首先,建立統(tǒng)計觀念環(huán)節(jié),涵蓋了古典概率和非古典概率模型;其次,收集統(tǒng)計數(shù)據(jù)環(huán)節(jié),涵蓋普查獲取數(shù)據(jù)和抽樣獲取數(shù)據(jù);最后,分析統(tǒng)計數(shù)據(jù)環(huán)節(jié),涵蓋線性回歸和非線性回歸。
關(guān)鍵詞: 統(tǒng)計素養(yǎng);數(shù)據(jù)獲??;概率統(tǒng)計;回歸模型
培養(yǎng)學(xué)生統(tǒng)計素養(yǎng)的價值,隨著時代的發(fā)展體現(xiàn)得愈益顯著。具備統(tǒng)計素養(yǎng)能夠更好地理解和應(yīng)用統(tǒng)計數(shù)據(jù),統(tǒng)計素養(yǎng)是適應(yīng)現(xiàn)代社會發(fā)展不可或缺的一種素養(yǎng)。時至今日,隨著信息化大數(shù)據(jù)時代的來臨,統(tǒng)計學(xué)知識和統(tǒng)計素養(yǎng)更是在政府部門決策評估、商業(yè)貿(mào)易、科學(xué)技術(shù)應(yīng)用乃至公眾生活中發(fā)揮著越來越重要的作用。因此,培養(yǎng)中學(xué)生的統(tǒng)計素養(yǎng),使其學(xué)會收集、整理、分析和解讀各種數(shù)據(jù),有助于他們養(yǎng)成敏銳的數(shù)據(jù)意識,從而對他們未來的工作和生活形成至關(guān)重要的素質(zhì)支撐。有鑒于此,統(tǒng)計素養(yǎng)是中學(xué)生數(shù)學(xué)核心素養(yǎng)和綜合能力發(fā)展的有機組成部分。本文試圖結(jié)合多年的中學(xué)數(shù)學(xué)教學(xué)經(jīng)驗,探討統(tǒng)計素養(yǎng)培育的教學(xué)策略。
一、中學(xué)數(shù)學(xué)教學(xué)中統(tǒng)計觀念的建立
對隨機現(xiàn)象的觀測和樣本數(shù)據(jù)的定量分析是認識世界的根本出發(fā)點,統(tǒng)計學(xué)家博克斯將統(tǒng)計描述為“新知和發(fā)現(xiàn)的催化劑”。1 統(tǒng)計素養(yǎng)是世界各國基礎(chǔ)階段數(shù)學(xué)教學(xué)都較為重視的一個面向,其具體內(nèi)涵指的是學(xué)生具備應(yīng)用統(tǒng)計學(xué)知識和技能進行問題解決、數(shù)據(jù)分析和推理的能力。概言之,統(tǒng)計素養(yǎng)作為一項重要的跨學(xué)科能力,是中學(xué)生數(shù)學(xué)核心素養(yǎng)和綜合能力發(fā)展的體現(xiàn)。在我國,在統(tǒng)計教學(xué)方面的實踐和研究亦早已有之,譬如詹麗等闡述了如何有效提高學(xué)生對統(tǒng)計學(xué)的理解和應(yīng)用能力,并提供了一些具體的教學(xué)實踐案例,以幫助讀者更好地理解和應(yīng)用中學(xué)統(tǒng)計教學(xué)目標。2 但鑒于基礎(chǔ)教學(xué)和學(xué)生素質(zhì)的區(qū)域性差異,以及不同學(xué)校和教師教學(xué)策略的不同,采取的方法和方式也不盡相同,唯有進一步對統(tǒng)計學(xué)素質(zhì)培育的教學(xué)實踐進行反思性歸納,才能總結(jié)出一套行之有效的方法,促進我國中學(xué)數(shù)學(xué)統(tǒng)計素養(yǎng)的培育。
我國今天中學(xué)數(shù)學(xué)教學(xué)中統(tǒng)計素質(zhì)教育的培育,常見的數(shù)據(jù)獲取方式為必修課程統(tǒng)計教學(xué)中實施隨機實驗,并結(jié)合案例加以分析,譬如擲硬幣、擲骰子實驗等。
1.擲硬幣實驗
伯努利實驗是課堂上首選的經(jīng)典隨機實驗,它可以通過拋擲硬幣或擲骰子來實現(xiàn),該實驗是在古典概率框架下的隨機模型。該實驗可以控制拋擲硬幣的初始高度、速度和環(huán)境等因素,堪稱是設(shè)計方式獲取數(shù)據(jù)的典型例子。
擲一枚硬幣——單枚硬幣多次拋擲和多枚硬幣同時拋擲,其結(jié)果必然是隨機的,我們可將之定義為相應(yīng)的隨機變量X,如果正面出現(xiàn),則X=1;反面出現(xiàn),則X=0。教師要求學(xué)生控制硬幣的初始狀態(tài),重復(fù)實驗,每次實驗都是獨立的,將得到簡單樣本X1,…,Xn和相應(yīng)的觀測值x1,…,xn。由此,可以觀察到正面朝上的頻率,以及頻率隨著實驗次數(shù)的變化情況。
擲硬幣實驗教學(xué)可以幫助學(xué)生理解大數(shù)定律和頻率的穩(wěn)定性,考慮到課堂教學(xué)的時間限制,可同時拋擲多枚硬幣,記錄數(shù)據(jù)。同時,教師可要求學(xué)生思考這兩種實驗方式是否等價。樣本會使波動漲落趨緩,學(xué)生通過觀測頻率隨樣本容量的增大而帶來的穩(wěn)定性,能夠更直觀理解大數(shù)據(jù)時代統(tǒng)計方法的有效性。
2.擲骰子和硬幣的復(fù)合實驗
在上面所述的教學(xué)案例中,擲硬幣實驗只能構(gòu)造出符合古典概率模型的樣本空間,但事實上,并非所有的統(tǒng)計情境都符合古典概率模型,因此,需要創(chuàng)建非古典的統(tǒng)計情境。其中一個有效的策略是將兩個隨機實驗復(fù)合,從而得到一個非古典概率模型。
拋擲一枚骰子,如果得到的點數(shù)為2到6,直接記錄點數(shù);如果得到的點數(shù)是1,則拋擲一枚硬幣,當出現(xiàn)正面,則記錄點數(shù)1,出現(xiàn)反面,則記錄為點數(shù)6。隨機變量X定義為記錄的點數(shù),那么就是通過擲骰子和擲硬幣實驗的復(fù)合,設(shè)計得到了一個非古典概率模型:出現(xiàn)1的概率將減小,出現(xiàn)6的概率會增大。而其余點數(shù)出現(xiàn)的概率不變。實驗的結(jié)果同樣可以得到簡單樣本和觀測值:X1,…,Xn與x1,…,xn。通過頻率的統(tǒng)計,學(xué)生可將其與理論結(jié)果進行比較,由此證實大數(shù)定律(頻率可近似估計概率)。同時,可計算點數(shù)的樣本均值,并把計算結(jié)果和理論計算得到的均值比較,理解一般大數(shù)定律的結(jié)論(樣本均值可近似估計均值),這也為理解用樣本的數(shù)字特征估計整體即矩估計方法做了鋪墊。
結(jié)合以上隨機實驗,學(xué)生可以學(xué)習(xí)到如何設(shè)計隨機實驗來收集數(shù)據(jù),并運用數(shù)據(jù)分析來推斷概率,估計均值等參數(shù),這對理解統(tǒng)計的思想和方法極有幫助。同時,學(xué)生利用計算機來實現(xiàn)隨機現(xiàn)象的模擬再現(xiàn),為以后的統(tǒng)計學(xué)習(xí)和應(yīng)用做充分的準備。而古典概型實驗設(shè)計,可以幫助學(xué)生理解隨機現(xiàn)象所產(chǎn)生的復(fù)雜性:各種不同簡單隨機因素的共同作用會導(dǎo)致出現(xiàn)復(fù)雜的現(xiàn)象。如何有效合理獲取數(shù)據(jù)是中學(xué)統(tǒng)計教學(xué)中的重要內(nèi)容,對這些隨機實驗的數(shù)據(jù)分析探索,也可以幫助學(xué)生理解概率統(tǒng)計中的一個基本觀念:概率不是純粹由數(shù)學(xué)理論確定的量,而是現(xiàn)實世界中的一個物理量,應(yīng)該通過對隨機現(xiàn)象的觀測來確定概率,統(tǒng)計的應(yīng)用基礎(chǔ)在于數(shù)據(jù)的獲取。
二、中學(xué)數(shù)學(xué)教學(xué)中統(tǒng)計數(shù)據(jù)的獲取
現(xiàn)實世界中隨機現(xiàn)象的產(chǎn)生原因極其復(fù)雜,很難去人為控制。更有現(xiàn)實意義的數(shù)據(jù)往往來自對隨機現(xiàn)象的直接觀測。如何在課堂教學(xué)中找到這樣的實例?日常生活中可以方便獲取得到的身高、體重等數(shù)據(jù),無疑是適切而便捷的實例。譬如在起名字時,名字的字數(shù)是否隨機的?名字與地域環(huán)境是否有密切的關(guān)系?身高統(tǒng)計調(diào)查同樣蘊含著很多意義,譬如家族遺傳、飲食習(xí)慣或營養(yǎng)水平等。
首先,名字字數(shù)。名字字數(shù)不是一個敏感性問題,學(xué)生很容易在課堂上得到統(tǒng)計數(shù)據(jù)。定量記錄結(jié)果為:如果學(xué)生名字是單名,則隨機變量X=1,不是單名,則X=0。這樣就可得到整個班級的樣本和觀測值:X1,…,Xn與x1,…,xn。教師引導(dǎo)學(xué)生思考這些問題:名字字數(shù)是否隨機的?是否真正存在這樣一個定量描述的概率?如何估計X的概率分布?同時課前可準備一份全年級和全校的學(xué)生名冊,進一步比較年級、全校的相應(yīng)統(tǒng)計數(shù)據(jù)得到的估計值,以探討樣本容量的影響。數(shù)理統(tǒng)計與一般觀念下的統(tǒng)計并不完全等同,頻率的觀念只有針對簡單樣本才是有效的,這是統(tǒng)計理論分析中的一個重要的前提條件。概率理論中的隨機現(xiàn)象除了結(jié)果的不可預(yù)測之外,還需要觀測過程的可重復(fù)性。教師可以鼓勵學(xué)生思考隨機現(xiàn)象產(chǎn)生的原因,例如“概率是主觀還是客觀的”等問題。在后續(xù)課程中,學(xué)生可以直觀深入理解總體和樣本這些統(tǒng)計中基本概念的含義。
針對收集到的學(xué)生名字數(shù)據(jù),學(xué)生在教師的引導(dǎo)下可以思考估計單名的概率問題。在中學(xué)統(tǒng)計課堂,根據(jù)學(xué)生名字的單字和雙字的數(shù)據(jù)收集,學(xué)生得出了一些有關(guān)名字分布的統(tǒng)計結(jié)果。比較樣本容量對估計的概率的影響,即在提供年級和學(xué)校的學(xué)生名單中比較所得到的結(jié)論。這種以自然方式收集數(shù)據(jù)的實踐,不僅讓學(xué)生參與統(tǒng)計學(xué)的學(xué)習(xí),而且更好地理解統(tǒng)計學(xué)是如何應(yīng)用于實際生活中。
其次,有關(guān)身高分布調(diào)查及相關(guān)問題。由于受到調(diào)查時間、社會資源等因素的限制,取得獨立有效的數(shù)據(jù)是有一定難度的。例如,從家族中收集的樣本不具有獨立性,會得到不同的概率估計值,因此,教師可引導(dǎo)學(xué)生進一步理解簡單樣本的重要性。通過學(xué)生的參與和數(shù)據(jù)收集,我們可以應(yīng)用統(tǒng)計技術(shù)來分析和理解,真實世界中的有些現(xiàn)象和問題無法代表整個中學(xué)或整個國家的情況。未來的研究可以擴大樣本規(guī)模,并考慮其他因素,如地域、文化背景等,以獲得更全面和準確的結(jié)果。
因此,根據(jù)學(xué)生的實際情況布置適切的統(tǒng)計任務(wù)十分關(guān)鍵。教師可以要求學(xué)生通過調(diào)查、觀察或?qū)嶒灥确绞绞褂煤唵纬闃臃椒ㄊ占瘮?shù)據(jù),即從整個群體中隨機選擇一部分樣本進行觀察和測量。學(xué)生可以選擇感興趣的主題,并自己設(shè)計數(shù)據(jù)收集方式。結(jié)果學(xué)生提交了各種各樣的數(shù)據(jù)收集作業(yè),涵蓋不同的主題和問題。如,有的學(xué)生隨機選擇了30名同伴并測量他們的身高,通過計算平均身高、制作直方圖和計算身高的范圍,學(xué)生得出了關(guān)于班級身高分布的結(jié)論。
通過作業(yè)收集數(shù)據(jù),學(xué)生不僅能夠應(yīng)用統(tǒng)計學(xué)技術(shù)來分析數(shù)據(jù),還能夠培養(yǎng)觀察和實證研究技能。此外,簡單樣本的選擇應(yīng)當具有代表性,能夠準確反映整個群體的特征。通過使用簡單抽樣方法,學(xué)生盡可能地避免選擇偏差,從而使樣本更具代表性。簡單樣本的收集相對容易實施,但要求具有可行性,特別是在中學(xué)水平的統(tǒng)計課程中。學(xué)生可以通過選擇小規(guī)模的樣本,減少數(shù)據(jù)收集的復(fù)雜性和難度,使統(tǒng)計分析更加可行。在數(shù)據(jù)處理方面,學(xué)生可以使用基本的統(tǒng)計技術(shù),如計算平均數(shù)、制作簡單圖表等,對收集的數(shù)據(jù)進行分析和展示。這有助于學(xué)生理解統(tǒng)計學(xué)的基本概念和數(shù)據(jù)處理方法。因此,這種實踐有助于學(xué)生將統(tǒng)計學(xué)應(yīng)用于實際問題中,并為他們未來的學(xué)習(xí)和研究打下堅實基礎(chǔ)。
通過對這些數(shù)據(jù)的搜集調(diào)查,我們可以進一步追問身高數(shù)據(jù)背后的遺傳學(xué)問題,即遺傳學(xué)中的高爾頓問題:父代和子代的身高之間有什么關(guān)系?記父代身高為X,子代的身高Y,通常Y不是X的函數(shù),那么,是否可通過X估計Y的值?
在繪制父代和子代的身高數(shù)據(jù)散點圖時,學(xué)生會遇到這樣的情況:同一個回歸變量的觀測值,會對應(yīng)不同的響應(yīng)變量值。由此,引導(dǎo)學(xué)生從中領(lǐng)悟回歸模型和確定性函數(shù)關(guān)系的不同:回歸變量和響應(yīng)變量不是一種因果關(guān)系,對于回歸模型自身而言,哪個量作為回歸變量,哪個作為響應(yīng)變量都是有意義的,回歸模型要解決的僅僅是兩種現(xiàn)象之間的關(guān)聯(lián)性?;貧w模型中,回歸和響應(yīng)變量都是隨機的量,會有波動,觀測到的這種情況正是波動性的體現(xiàn)。在現(xiàn)實世界中,我們會觀測到大量的回歸現(xiàn)象:觀測值有向平均值回歸的趨向。
三、中學(xué)數(shù)學(xué)教學(xué)中統(tǒng)計數(shù)據(jù)的分析
科學(xué)研究并不是從結(jié)論出發(fā)的,而是從觀測到的現(xiàn)象出發(fā),進而對之進行歸納,從中觀察深層次的因素或規(guī)律性的東西。數(shù)據(jù)的收集是和研究的問題相關(guān)聯(lián)的??茖W(xué)研究的一個重要的問題是探索不同現(xiàn)象之間的相互聯(lián)系。兩個隨機變量之間是否具有相關(guān)性?能否由一個隨機變量的觀測值來估計另一個隨機變量的值?在自然方式獲取數(shù)據(jù)時,也許并不清晰知道將要探討的具體問題是什么,會有什么樣的結(jié)論,所以必須盡可能全面記錄信息數(shù)量。對此,教師不妨在教學(xué)過程中引入一些學(xué)生感興趣的話題,引導(dǎo)學(xué)生在這些話題當中發(fā)現(xiàn)統(tǒng)計現(xiàn)象,從而進行深入研究。
球隊成績問題無疑是學(xué)生熟悉且感興趣的話題。一個常見的現(xiàn)象是,當球隊成績在低谷時更換教練,短期成績也許會有提高,有可能教練確實帶來了新理念,提高了球隊的戰(zhàn)術(shù)水平,但也有可能僅僅是回歸現(xiàn)象:球隊低谷時的成績不是其真實平均水平,成績的提高只是向平均水平回歸。是否與更換教練有關(guān),需要長期的觀測和評價,才能確定新教練是否真正提高了球隊水平。學(xué)生可以思考其他可能影響球隊成績的因素,并提出假設(shè),進而收集球隊成績和相關(guān)因素的數(shù)據(jù)得出結(jié)論。
針對上述問題可以通過繪制散點圖和計算相關(guān)系數(shù)來分析。在學(xué)生前期的數(shù)據(jù)收集中,得到樣本和觀測值:(X1,Y1),…(Xn,Yn)與(x1,y1),…(xn,yn),當觀測值[(x1,y1),…(xn,yn)]形成的散點圖具有線性函數(shù)的形態(tài),可把問題歸結(jié)為這樣的問題:確定線性函數(shù)Y=aX+b+e作為由X估計Y的函數(shù),這里,稱X為回歸變量,Y為響應(yīng)變量,e是偏差,理想情況下希望e~N(0,s2)。換言之,當確定了a、b值后,當觀測到回歸變量的值為x時,就以[y=ax+b]作為相應(yīng)響應(yīng)變量y觀測值的估計值。
回歸模型僅僅是選擇回歸變量的某個函數(shù)來估計響應(yīng)的響應(yīng)變量的平均值,而線性回歸僅僅是選擇線性函數(shù)ax+b作為估計函數(shù)。理解了回歸模型的基本思想,學(xué)生可舉一反三,思考線性回歸模型推廣的可能性:是否可以在aH(x)+b中,選擇其他的函數(shù)類型,例如H(x)=x2,[x,logx,ex],……,甚至非線性的回歸,eax+b+c等。而選擇哪一類函數(shù),應(yīng)該根據(jù)觀測數(shù)據(jù)來分析判斷。這樣,學(xué)生在運用回歸分析建立模型時,就不會照搬線性回歸模型的公式,而是通過對得到現(xiàn)象觀測的觀測數(shù)據(jù)分析,真正找到合理的模型。掌握了線性回歸模型的基本方法后,需要解決的問題就成為如何選擇適當?shù)南禂?shù)a、b,在給定回歸變量后x后,相應(yīng)響應(yīng)變量的均值估計ax+b能最好地體現(xiàn)符合已得到的觀測數(shù)據(jù)。
四、反思總結(jié)
上文為建立統(tǒng)計觀念、收集統(tǒng)計數(shù)據(jù)、分析統(tǒng)計數(shù)據(jù)這三個培養(yǎng)學(xué)生統(tǒng)計素養(yǎng)的關(guān)鍵環(huán)節(jié),以案例形式設(shè)計了對應(yīng)的教學(xué)策略。在建立統(tǒng)計觀念環(huán)節(jié),案例包括古典概率和非古典概率模型;收集統(tǒng)計數(shù)據(jù)環(huán)節(jié),案例涵蓋普查獲取數(shù)據(jù)和抽樣獲取數(shù)據(jù);分析統(tǒng)計數(shù)據(jù)環(huán)節(jié),案例分為線性回歸和非線性回歸。
通過對上述高中數(shù)學(xué)課堂教學(xué)中統(tǒng)計素養(yǎng)培育的案例探索和研究,可以發(fā)現(xiàn)在統(tǒng)計教學(xué)中設(shè)計恰當?shù)慕y(tǒng)計情境,引導(dǎo)學(xué)生獲取數(shù)據(jù)并進行統(tǒng)計分析,對統(tǒng)計素養(yǎng)的培育起關(guān)鍵作用。圖1為指向統(tǒng)計素養(yǎng)培育的統(tǒng)計教學(xué)策略模型。
為培養(yǎng)學(xué)生提出問題、分析問題的能力,教師還可以提出以下教學(xué)反思:為什么選擇偏差平方和最???是否有其他選擇的可能性?回歸分析是一個應(yīng)用廣泛的統(tǒng)計模型,可啟發(fā)學(xué)生探討諸如價格和銷量之間的關(guān)系,學(xué)習(xí)時間和學(xué)習(xí)成績之間的關(guān)系等問題。針對后者,可提出以下子問題:
1.是否需要分別考慮性別的因素,即男性和女性會有不同的回歸系數(shù)?
2.是否可考慮選擇母親作為回歸變量?
3.是否可同時建立選擇父親和母親的作為回歸變量,建立二元線性回歸模型[Y=aX+bZ+c]?
4.是否可由正規(guī)方程[y=ax+bz+ci=1nxiyi=i=1nxi(axi+bzi+c)i=1nziyi=i=1nzi(axi+bzi+c)]確定系數(shù)?與相應(yīng)的最小二乘方法[mina,b,ci=1n(yi-axi-bzi-c)2]是否一致?
Middle School Mathematics Teaching Strategies for Cultivating Statistical Literacy
— Taking the Establishment of a Linear Regression Model as an Example
DU Ping
(Shanghai Shibei Middle School, Shanghai,200071)
Abstract: Statistical literacy is an organic component of the core mathematical literacy of middle school students. This study has designed the corresponding teaching strategies in the form of case studies to address the key parts in the cultivation of students statistical literacy. First,statistical concepts was given,covering both classical and non-classical probability models;then,the statistical data was collected, including both census data and sampling data;finally,statistical data was analyzed involving both linear regression and nonlinear regression.
Key words: statistical literacy,data acquisition,probability statistics,regression model