• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    經(jīng)歷系統(tǒng)的數(shù)據(jù)處理過程在解決實(shí)際問題中發(fā)展數(shù)據(jù)分析素養(yǎng)

    2021-05-25 09:02:22程???/span>章建躍
    數(shù)學(xué)通報(bào) 2021年4期
    關(guān)鍵詞:樣本量平均數(shù)總體

    程???章建躍

    (1.河北師范大學(xué)數(shù)學(xué)科學(xué)學(xué)院050024;2.人民教育出版社 課程教材研究所100081)

    統(tǒng)計(jì)以數(shù)據(jù)為研究對(duì)象,利用概率論進(jìn)行數(shù)學(xué)建模,通過收集整理所觀察對(duì)象的數(shù)據(jù)進(jìn)行量化分析,進(jìn)而作出推斷和預(yù)測(cè),為決策提供依據(jù)和參考.統(tǒng)計(jì)中提供的“運(yùn)用數(shù)據(jù)進(jìn)行推斷”的思想方法已成為現(xiàn)代社會(huì)的一種普遍使用且強(qiáng)有力的思維方式,統(tǒng)計(jì)無處不在、無所不用.高中必修課程中的統(tǒng)計(jì)主要學(xué)習(xí)收集數(shù)據(jù)的方法,解決單變量的統(tǒng)計(jì)問題(樣本估計(jì)總體).本單元要通過一些典型案例,使學(xué)生經(jīng)歷數(shù)據(jù)處理的全過程,熟悉統(tǒng)計(jì)的基本思想方法,逐步形成統(tǒng)計(jì)觀念,養(yǎng)成尊重事實(shí)、用數(shù)據(jù)說話的態(tài)度,在解決實(shí)際問題中發(fā)展數(shù)據(jù)分析素養(yǎng).

    1 課程定位

    課程標(biāo)準(zhǔn)對(duì)概率統(tǒng)計(jì)的定位為:概率研究的對(duì)象是隨機(jī)現(xiàn)象,為人們從不確定性的角度認(rèn)識(shí)客觀世界提供重要的思維模式和解決問題的方法.統(tǒng)計(jì)的研究對(duì)象是數(shù)據(jù),核心是數(shù)據(jù)分析.概率為統(tǒng)計(jì)的發(fā)展提供理論依據(jù).

    課程標(biāo)準(zhǔn)指出,本單元的學(xué)習(xí),可以幫助學(xué)生進(jìn)一步學(xué)習(xí)數(shù)據(jù)收集和整理的方法、數(shù)據(jù)直觀圖表的表示方法、數(shù)據(jù)統(tǒng)計(jì)特征的刻畫方法;通過具體實(shí)例,感悟在實(shí)際生活中進(jìn)行科學(xué)決策的必要性和可能性;體會(huì)統(tǒng)計(jì)思維與確定性思維的差異、歸納推斷與演繹證明的差異;通過實(shí)際操作、計(jì)算機(jī)模擬等活動(dòng),積累數(shù)據(jù)分析的經(jīng)驗(yàn).課程標(biāo)準(zhǔn)強(qiáng)調(diào),統(tǒng)計(jì)的教學(xué)應(yīng)通過典型案例進(jìn)行,引導(dǎo)學(xué)生經(jīng)歷系統(tǒng)的數(shù)據(jù)處理全過程,學(xué)習(xí)數(shù)據(jù)分析方法,理解數(shù)據(jù)分析的思想,運(yùn)用所學(xué)知識(shí)和方法解決實(shí)際問題;要注重利用計(jì)算器、計(jì)算機(jī)進(jìn)行模擬活動(dòng)、處理數(shù)據(jù),幫助學(xué)生更好地體會(huì)統(tǒng)計(jì)思想.

    2 內(nèi)容與要求

    1.獲取數(shù)據(jù)的基本途徑及相關(guān)概念

    (1)知道獲取數(shù)據(jù)的基本途徑,包括:統(tǒng)計(jì)報(bào)表和年鑒,社會(huì)調(diào)查,試驗(yàn)設(shè)計(jì),普查和抽樣,互聯(lián)網(wǎng)等.

    (2)了解總體、樣本、樣本量的概念,了解樣本數(shù)據(jù)的隨機(jī)性.

    2.抽樣

    (1)通過實(shí)例,了解簡(jiǎn)單隨機(jī)抽樣的含義及其解決問題的過程,掌握兩種簡(jiǎn)單隨機(jī)抽樣方法:抽簽法和隨機(jī)數(shù)法.會(huì)計(jì)算樣本均值和樣本方差,了解樣本與總體的關(guān)系.

    (2)通過實(shí)例,了解分層隨機(jī)抽樣的特點(diǎn)和適用范圍,了解分層隨機(jī)抽樣的必要性,掌握各層樣本量比例分配的方法.結(jié)合具體實(shí)例,掌握分層隨機(jī)抽樣的樣本均值和樣本方差.

    (3)在簡(jiǎn)單的實(shí)際情境中,能夠根據(jù)實(shí)際問題的特點(diǎn),設(shè)計(jì)恰當(dāng)?shù)某闃臃椒ń鉀Q問題.

    3.統(tǒng)計(jì)圖表

    能夠根據(jù)實(shí)際問題的特點(diǎn),選擇恰當(dāng)?shù)慕y(tǒng)計(jì)圖表對(duì)數(shù)據(jù)進(jìn)行可視化描述,體會(huì)合理使用統(tǒng)計(jì)圖表的重要性.

    4.用樣本估計(jì)總體

    (1)結(jié)合實(shí)例,能用樣本估計(jì)總體的集中趨勢(shì)參數(shù)(平均數(shù)、中位數(shù)、眾數(shù)),理解集中趨勢(shì)參數(shù)的統(tǒng)計(jì)含義.

    (2)結(jié)合實(shí)例,能用樣本估計(jì)總體的離散程度參數(shù)(標(biāo)準(zhǔn)差、方差、極差),理解離散程度參數(shù)的統(tǒng)計(jì)含義.

    (3)結(jié)合實(shí)例,能用樣本估計(jì)總體的取值規(guī)律.

    (4)結(jié)合實(shí)例,能用樣本估計(jì)百分位數(shù),理解百分位數(shù)的統(tǒng)計(jì)含義.

    與初中的統(tǒng)計(jì)課程相比較,本單元的內(nèi)容有些是初中沒有的,例如分層抽樣、分層抽樣樣本均值和樣本方差、百分位數(shù)等,有些是初中就有的,但有不同的要求.例如,對(duì)總體、樣本等概念,要求在結(jié)合具體問題進(jìn)行描述性說明的基礎(chǔ)上,適當(dāng)引入嚴(yán)格定義;了解數(shù)據(jù)的隨機(jī)性,了解樣本和總體的關(guān)系等.這樣的課程設(shè)計(jì),體現(xiàn)了統(tǒng)計(jì)這個(gè)內(nèi)容獨(dú)特性.

    3 本單元的認(rèn)知基礎(chǔ)分析

    在初中階段,學(xué)生學(xué)習(xí)了隨機(jī)抽樣的必要性、簡(jiǎn)單隨機(jī)抽樣方法、用統(tǒng)計(jì)圖表整理和表示數(shù)據(jù),了解了平均數(shù)、方差等數(shù)字特征的意義及計(jì)算,學(xué)習(xí)了簡(jiǎn)單的統(tǒng)計(jì)推斷以及用統(tǒng)計(jì)方法解決實(shí)際問題等,這些知識(shí)經(jīng)驗(yàn)為學(xué)習(xí)本單元知識(shí)打下了一定的認(rèn)知基礎(chǔ).不過,初中數(shù)學(xué)課程對(duì)統(tǒng)計(jì)的要求不高,總體、樣本等概念僅僅是描述性,學(xué)生對(duì)樣本數(shù)據(jù)的隨機(jī)性,樣本均值、樣本方差等數(shù)字特征的隨機(jī)性還缺乏認(rèn)識(shí).在高中階段的統(tǒng)計(jì)學(xué)習(xí)中,要結(jié)合實(shí)際問題,利用信息技術(shù),使學(xué)生能夠?qū)颖竟烙?jì)總體效果的評(píng)價(jià)、樣本容量對(duì)估計(jì)精度的影響、以及估計(jì)結(jié)果的解釋等有新的認(rèn)識(shí),對(duì)平均數(shù)、中位數(shù)、百分位數(shù)、方差、標(biāo)準(zhǔn)差等數(shù)字特征,也要借助更加豐富的實(shí)際背景進(jìn)行更深入的理解,在提高認(rèn)識(shí)水平的基礎(chǔ)上,能夠用于解決實(shí)際問題.

    4 核心內(nèi)容的理解與教學(xué)思考

    下面重點(diǎn)就隨機(jī)抽樣、總體、樣本的概念,數(shù)字特征的刻畫方法,百分位數(shù)的概念及應(yīng)用,分析內(nèi)容的本質(zhì)及其蘊(yùn)含的統(tǒng)計(jì)思想,討論教學(xué)中需要注意的問題.

    4.1 隨機(jī)抽樣、總體、樣本的概念

    用統(tǒng)計(jì)方法解決實(shí)際問題,要明確研究對(duì)象的范圍是什么?關(guān)心的指標(biāo)是什么?這些指標(biāo)是數(shù)值指標(biāo)還是屬性指標(biāo)?將這些指標(biāo)統(tǒng)稱為變量,通過隨機(jī)抽樣得到變量的一些具體值(樣本觀測(cè)數(shù)據(jù)),計(jì)算樣本數(shù)據(jù)的特征值,由此估計(jì)總體的特征,最后提出決策與建議.因此,統(tǒng)計(jì)學(xué)習(xí)首先要抽象總體和樣本的概念.課程標(biāo)準(zhǔn)指出:對(duì)統(tǒng)計(jì)中的基本概念(如總體、樣本、樣本量等),要結(jié)合具體問題進(jìn)行描述性說明,在此基礎(chǔ)上適當(dāng)引入嚴(yán)格定義.

    4.1.1 總體和樣本的概念

    我們將總體直觀描述為研究對(duì)象的全體, 組成總體的每個(gè)對(duì)象稱為個(gè)體.在實(shí)際問題中,我們往往關(guān)心調(diào)查對(duì)象的某些指標(biāo),這些指標(biāo)大致可分為數(shù)量指標(biāo)和屬性指標(biāo).例如,學(xué)生的身高、居民家庭月用電量、空氣污染指數(shù)等都是數(shù)量指標(biāo);性別、近視或不近視、等級(jí)成績(jī)等都是屬性指標(biāo).進(jìn)一步地,還可以把總體描述為全體個(gè)體的指標(biāo)值,更一般地,將總體抽象為一個(gè)變量X(隨機(jī)變量),稱其為總體變量.

    從總體中按照等概率原則抽取的部分個(gè)體稱為樣本.一次抽樣實(shí)際上得到的是一組個(gè)體指標(biāo)值x1,x2,…,xn,稱為樣本觀測(cè)值.由于隨機(jī)抽樣要滿足抽到每個(gè)個(gè)體概率相等,在相同的樣本量下,重復(fù)抽樣得到的樣本觀測(cè)值不會(huì)完全相同,因此樣本具有隨機(jī)性.樣本的嚴(yán)格定義是:

    對(duì)總體變量X的n次觀測(cè)X1,X2,…,Xn,滿足獨(dú)立同分布(與X具有相同的分布).

    在教學(xué)中,不必追求概念的嚴(yán)格性,只要對(duì)研究的實(shí)際問題,能明確研究對(duì)象的范圍以及考察的指標(biāo)變量即可.例如,研究某中學(xué)全體學(xué)生的身高分布情況,范圍是該中學(xué)全體學(xué)生,指標(biāo)變量為身高.如果研究全體學(xué)生的近視情況,指標(biāo)就是取值為近視和不近視兩個(gè)值的屬性變量.

    4.1.2 隨機(jī)抽樣

    根據(jù)總體的規(guī)模和結(jié)構(gòu)特點(diǎn),有很多種抽樣方法.課程標(biāo)準(zhǔn)要求了解簡(jiǎn)單隨機(jī)抽樣和比例分層抽樣,簡(jiǎn)單隨機(jī)抽樣又分為有放回隨機(jī)抽樣和不放回隨機(jī)抽樣.不論哪種抽樣方法都要滿足每個(gè)個(gè)體被抽到的概率相等,這是為了保證統(tǒng)計(jì)推斷不會(huì)產(chǎn)生系統(tǒng)性誤差.

    關(guān)于隨機(jī)抽樣的必要性,初中已有了解,具體的抽樣方法屬于操作性知識(shí),不難理解.為了發(fā)展學(xué)生的數(shù)據(jù)分析素養(yǎng),教學(xué)中要引導(dǎo)學(xué)生思考下面的問題.

    (1)不同的抽樣方法的適用范圍及優(yōu)缺點(diǎn)是什么?

    有放回和不放回隨機(jī)抽樣,適用于總體規(guī)模和樣本量都較小的情形.有放回隨機(jī)抽樣的優(yōu)點(diǎn)是:各次抽樣的結(jié)果互相不受影響,便于進(jìn)一步統(tǒng)計(jì)分析,也便于計(jì)算機(jī)模擬實(shí)現(xiàn);缺點(diǎn)是產(chǎn)生極端樣本的可能性較大.比較而言,不放回隨機(jī)抽樣同一個(gè)體不會(huì)被重復(fù)抽到,產(chǎn)生極端樣本的可能性要小,但各次抽樣結(jié)果之間不獨(dú)立,統(tǒng)計(jì)分析要困難一些.

    比例分層抽樣適合于總體包含多個(gè)子類,同一類中個(gè)體的變量值差異較小,但不同類之間個(gè)體的變量值差異較大.分層抽樣可以避免極端樣本的產(chǎn)生,在實(shí)際中也便于實(shí)施,是最常用的抽樣方法.

    (2)如何認(rèn)識(shí)和理解估計(jì)結(jié)果的不確定性?如何評(píng)價(jià)估計(jì)的效果?

    以樣本均值估計(jì)總體均值為例,為了理解樣本均值的隨機(jī)性(不確定),可以就相同的樣本量,進(jìn)行重復(fù)多次抽樣,觀察這些樣本均值是否相同,樣本均值波動(dòng)幅度的大小,以及和總體均值的關(guān)系.

    首先看一個(gè)極端例子:

    四名學(xué)生A,B,C,D的身高構(gòu)成總體, 其中A,B為女生,C,D為男生.h(A)=156cm,h(B)=160cm,h(C)=170 cm,h(D)=174cm,隨機(jī)抽取2名學(xué)生,用樣本平均值估計(jì)總體的身高的平均值.總體4個(gè)身高的平均數(shù)為165cm.

    采用有放回抽樣,共有16種等可能的樣本.如表1所示,有八分之一的可能出現(xiàn)極端樣本(156, 156),(174,174),由極端樣本計(jì)算的樣本平均數(shù)與總體平均數(shù)偏差很大.

    表1 有放回抽樣的16種等可能樣本

    采用不放回抽樣,有12種等可能的樣本,如果不考慮順序,可合并為6種等可能的樣本,不會(huì)出現(xiàn)上述極端樣本.

    比例分層抽樣,只有4種等可能的樣本(156, 170),(156, 174),(160, 170),(160,174). 樣本平均數(shù)與總體平均數(shù)都比較接近.

    樣本均值的波動(dòng)情況如圖1所示:

    圖1

    三種抽樣方法的樣本均值都圍繞總體均值波動(dòng),直觀看, 波動(dòng)幅度越大,表示估計(jì)的誤差較大的可能性也較大.定量評(píng)價(jià)估計(jì)的效果,是比較在相同限定誤差下的概率大小.例如,限定誤差為2,比較樣本均值落在區(qū)間[163, 167]的概率p,如表2所示.

    表2

    可以看到,用樣本估計(jì)總體,不放回抽樣效果好,但放回抽樣方便統(tǒng)計(jì)分析,如何解決這個(gè)矛盾?實(shí)際上,當(dāng)樣本容量遠(yuǎn)小于總體容量時(shí),兩種抽樣方法差別很小.

    (3)樣本容量的大小對(duì)估計(jì)結(jié)果的精確性有什么影響?

    用樣本估計(jì)總體,由于樣本的隨機(jī)性,估計(jì)的結(jié)果也具有隨機(jī)性,誤差是不可避免的.一般地,樣本量越大,估計(jì)的效果也越好.如何描述樣本容量對(duì)估計(jì)結(jié)果的影響呢?在高中階段,概率知識(shí)還不足以支持進(jìn)行嚴(yán)格的描述,可以結(jié)合具體問題,采用計(jì)算機(jī)模擬重復(fù)抽樣,借助于統(tǒng)計(jì)圖的直觀來認(rèn)識(shí).

    問題某中學(xué)高一年級(jí)學(xué)共有700名學(xué)生,其中男生360人,女生340人.全年級(jí)學(xué)生的平均身高為165.0 cm.用簡(jiǎn)單隨機(jī)抽樣的方法,從這些數(shù)據(jù)中分別抽取容量為25和100的樣本各10組,分別計(jì)算出樣本平均數(shù),繪制統(tǒng)計(jì)圖如下(圖2):

    圖2

    定性分析:觀察圖形發(fā)現(xiàn)樣本均值圍繞著總體均值波動(dòng),且具有隨機(jī)性,但沒有系統(tǒng)性偏差;樣本量為100的樣本均值的波動(dòng)幅度明顯小于樣本量為25的.結(jié)論是:增加樣本量使誤差較小的可能性增大.但就一次抽樣而言,樣本量大的平均值未必一定比樣本量小的平均值誤差小.

    定量分析:我們知道方差可以描述一組數(shù)據(jù)的波動(dòng)大小,分別計(jì)算10個(gè)樣本均值的方差.通過方差的大小,比較兩組樣本均值的波動(dòng)大小.

    容量為100的10個(gè)樣本平均數(shù)方差明顯要小,所以波動(dòng)也小.

    4.2 數(shù)據(jù)集中程度、離散程度的刻畫

    1.對(duì)數(shù)字特征的理解

    用樣本推斷總體是最重要的統(tǒng)計(jì)思想.統(tǒng)計(jì)估計(jì)和假設(shè)檢驗(yàn)是兩種基本的推斷方法, 估計(jì)內(nèi)容包括用樣本數(shù)字特征估計(jì)總體特征.

    描述數(shù)據(jù)特征的量稱為統(tǒng)計(jì)量,按其作用可分為以下幾類:

    (1)描述數(shù)據(jù)集中趨勢(shì)的量:平均數(shù)、中位數(shù)、眾數(shù)、百分位數(shù).

    (2)描述數(shù)據(jù)離散程度的量:方差、標(biāo)準(zhǔn)差、極差等.

    (3)描述兩組數(shù)據(jù)關(guān)系密切程度的量:相關(guān)系數(shù).

    其中,平均數(shù)、百分位數(shù)和方差是最重要的統(tǒng)計(jì)量.表3給出了這些統(tǒng)計(jì)量的意義、各自的優(yōu)缺點(diǎn)及適用范圍.

    表3 各種統(tǒng)計(jì)量的意義、優(yōu)缺點(diǎn)及適用范圍

    2.對(duì)數(shù)字特征認(rèn)識(shí)的層次性

    對(duì)于平均數(shù)和方差,學(xué)生在初中已有初步認(rèn)識(shí).如何在初中的基礎(chǔ)上引導(dǎo)學(xué)生進(jìn)一步理解它們的意義和優(yōu)缺點(diǎn),掌握它們的適用范圍,這是教學(xué)中需要認(rèn)真思考的問題.下面通過具體案例進(jìn)行說明.

    案例1對(duì)平均數(shù)認(rèn)識(shí)的幾個(gè)層次.

    隨著學(xué)生年齡增長(zhǎng)、學(xué)習(xí)的深入,他們對(duì)平均數(shù)的認(rèn)識(shí)層次也在不斷提升.

    (1)初中階段:平均數(shù)是將數(shù)據(jù)之間的差異抹平后得到的一組數(shù)據(jù)的代表值,反映這組數(shù)據(jù)的整體水平.平均數(shù)作為一個(gè)度量性概念,主要用于不同總體某個(gè)指標(biāo)的比較.一組數(shù)據(jù)的平均數(shù)定義為

    (2)高中階段:要求理解樣本平均數(shù)與總體平均數(shù)的關(guān)系,用樣本平均數(shù)估計(jì)總體平均數(shù),理解樣本平均數(shù)的隨機(jī)性.根據(jù)頻率分布表或直方圖近似計(jì)算平均數(shù),由多個(gè)樣本平均數(shù)計(jì)算總平均數(shù).

    作為拓展,在教學(xué)中還可以引導(dǎo)學(xué)生討論如下性質(zhì):

    這一性質(zhì)揭示了平均數(shù)是一組數(shù)據(jù)與其偏差平方和最小的代表值,同時(shí)也說明方差的特殊性.證明中用到的平方和分解的方法,在統(tǒng)計(jì)分析中具有廣泛應(yīng)用.

    換一個(gè)角度看,就是用最小二乘法估計(jì)參數(shù)的思想.

    例如,假設(shè)某段公路的長(zhǎng)為a(未知參數(shù)),n次測(cè)量的數(shù)據(jù)為x1,x2,…,xn,根據(jù)測(cè)量數(shù)據(jù),如何估計(jì)參數(shù)a?

    (3)大學(xué)階段:大學(xué)《數(shù)理統(tǒng)計(jì)》課程中,大數(shù)定律嚴(yán)格描述了樣本均值與總體均值(數(shù)學(xué)期望)的關(guān)系.

    假設(shè)X是總體隨機(jī)變量,X1,X2,…,Xn是取自總體的一組樣本(看成獨(dú)立同分布的隨機(jī)變量),且E(X)=μ,D(X)=σ2,則

    樣本均值的期望等于總體隨機(jī)變量的期望,說明樣本均值估計(jì)總體均值無系統(tǒng)誤差,而樣本均值的方差隨著樣本容量的增大而減小,即波動(dòng)幅度越來越小,逐漸穩(wěn)定到總體均值.頻率穩(wěn)定到概率是其特殊情形.

    案例2構(gòu)建一組數(shù)據(jù)的方差的過程.

    這里的目標(biāo)是構(gòu)建一個(gè)統(tǒng)計(jì)量,用于描述一組數(shù)據(jù)相對(duì)于其平均數(shù)的離散程度,其基本思路和調(diào)整過程大致可以概述如下:

    另外,還有如下問題需要解決:

    (6)如果要比較兩組均值不等數(shù)據(jù)的離散程度,或者要消除量綱的影響,該怎么做?

    (7)為什么有時(shí)用方差

    根據(jù)要刻畫的數(shù)字特征的意義,從直觀想法出發(fā),逐步進(jìn)行修正,是構(gòu)造統(tǒng)計(jì)量的常用的思想方法.構(gòu)造描述成對(duì)數(shù)據(jù)的相關(guān)系數(shù)、估計(jì)回歸系數(shù)時(shí)的偏差平方和、獨(dú)立性檢驗(yàn)的統(tǒng)計(jì)量都用到這種思想.

    4.3 百分位數(shù)的概念及應(yīng)用

    總體百分位數(shù)的估計(jì)是新增加的內(nèi)容.根據(jù)課程標(biāo)準(zhǔn)的要求,這一內(nèi)容的教學(xué)也要結(jié)合一些典型的案例,使學(xué)生經(jīng)歷系統(tǒng)的數(shù)據(jù)處理全過程.具體而言,就是要從實(shí)際問題出發(fā),通過收集數(shù)據(jù),構(gòu)建百分位數(shù)進(jìn)行數(shù)據(jù)分析,并用樣本推斷總體,做出決策.

    中位數(shù)是一個(gè)反映數(shù)據(jù)集中趨勢(shì)的量,也就是50百分位數(shù),它是一個(gè)描述數(shù)據(jù)中間位置的量.在實(shí)際中,僅用中位數(shù)反映數(shù)據(jù)的特征信息量還不夠,需要將中位數(shù)推廣到任意的百分位數(shù).先看下面的實(shí)際問題.

    問題某市政府為了減少水資源的浪費(fèi),計(jì)劃對(duì)居民生活用水實(shí)施階梯水價(jià)制度,即確定一戶居民月用水量標(biāo)準(zhǔn)a,用水量不超過a的部分按平價(jià)收費(fèi),超出a的部分按議價(jià)收費(fèi).如果希望80%的家庭能享受平價(jià),如何確定a?

    如果能獲得全體居民月用水量數(shù)據(jù),然后確定一個(gè)數(shù)值a,使得不超過a的數(shù)據(jù)占80%,那么問題得到解決.但實(shí)際中很難獲得全部數(shù)據(jù),可以通過隨機(jī)抽樣得到一組居民月用水量的樣本數(shù)據(jù)x1,x2,…,xn,然后確定一個(gè)值,使得樣本中不超過的數(shù)據(jù)占80%,然后用估計(jì)a.

    對(duì)于任意的n以及任意的百分?jǐn)?shù)p%, 如何給百分位數(shù)下個(gè)確切的定義呢?能否仿照中位數(shù)的定義進(jìn)行直接推廣呢?

    由于中位數(shù)太特殊了,直接推廣有難度,先看下面的兩種特殊情形.

    (1)有重復(fù)數(shù)據(jù)的情形:測(cè)量10名同學(xué)的身高數(shù)據(jù)(單位:cm)如下:

    165 168 170 172 172 175 176 176 176 180

    10個(gè)數(shù)據(jù)由小到大排列的第8個(gè)數(shù)和第9個(gè)數(shù)都是176,如果把176作為80%分位數(shù),這10個(gè)數(shù)據(jù)中小于或等于176的數(shù)至少占80%(90%),而大于或等于176的數(shù)至少占20%(40%).

    (2)n×p%不是整數(shù)的情形:測(cè)量8名同學(xué)的身高數(shù)據(jù)(單位:cm)如下:

    165 168 170 172 172 175 176 178

    8×80%=6.4,取第7個(gè)數(shù)176作為80%分位數(shù),這 8個(gè)數(shù)據(jù)中小于或等于176的數(shù)占87.5%,而大于或等于176的數(shù)占25%.

    對(duì)上面問題進(jìn)行歸納,給出百分位數(shù)定義:百分位數(shù)是位于由小到大排列的一組數(shù)據(jù)中某一百分位置的數(shù)值,一般用Pp表示.它使得這組數(shù)據(jù)中至少有p%的數(shù)據(jù)小于或等于這個(gè)值,且至少有(100-p)%的數(shù)據(jù)大于或等于這個(gè)值.顯然50%分位數(shù)P50也就是中位數(shù).

    根據(jù)定義,可得計(jì)算一組數(shù)據(jù)百分位數(shù)的方法.

    (1)由原始數(shù)據(jù)確定百分位數(shù).

    第1步 按從小到大順序排列原始數(shù)據(jù);

    第2步 計(jì)算i=n×p%;

    第3步 若i不是整數(shù),而大于i的比鄰整數(shù)為j,則Pp為第j項(xiàng)數(shù)據(jù);若i是整數(shù),則Pp為第i項(xiàng)與第(i+1)項(xiàng)數(shù)據(jù)的平均數(shù).

    (2)由頻率分布表估算百分位數(shù).

    表4是根據(jù)100戶居民月用水量整理的頻率分布表,試估計(jì)月用水量樣本數(shù)據(jù)的80%分位數(shù)P80.

    表4

    由累計(jì)頻率列看到,月用水量在13.2 t以下的居民用戶所占比例為77%,而月用水量在16.2 t以下的居民用戶所占比例為86%.因此,第80百分位數(shù)位于[13.2,16.2]內(nèi),這個(gè)區(qū)間長(zhǎng)度為3,其中分布的數(shù)據(jù)占9%,假設(shè)數(shù)據(jù)在區(qū)間內(nèi)均勻分布,可得

    由特殊到一般,可以得到估算百分位數(shù)的一般公式.

    其中,Lmin為百分位數(shù)所在組的下限,s為組距,m%為小于Lmin的頻率.

    注意:對(duì)總體的百分位數(shù)的概念在高中不做要求,對(duì)有限總體,可以理解為全體個(gè)體對(duì)應(yīng)指標(biāo)值的百分位數(shù).可使用Excel中的函數(shù)PERENTILE.EXC計(jì)算百分位數(shù).

    5 教學(xué)建議

    (1)注意初、高中內(nèi)容的銜接

    學(xué)生在初中已經(jīng)學(xué)習(xí)過一些統(tǒng)計(jì)知識(shí),本單元是在此基礎(chǔ)上的進(jìn)一步學(xué)習(xí).與初中的統(tǒng)計(jì)比較,本單元有些內(nèi)容是新增的,有些內(nèi)容則是內(nèi)容相同但要求不同.例如,對(duì)于抽樣方法,初中只要求了解簡(jiǎn)單隨機(jī)抽樣方法;高中除了要求了解簡(jiǎn)單隨機(jī)抽樣,還要求了解分層隨機(jī)抽樣,并要求會(huì)設(shè)計(jì)恰當(dāng)?shù)某闃臃椒ń鉀Q問題.對(duì)于簡(jiǎn)單隨機(jī)抽樣,高中不但要求了解它的含義及其解決問題的過程,還要掌握兩種實(shí)現(xiàn)簡(jiǎn)單隨機(jī)抽樣的方法.又如,在初中只要知道方差可以刻畫數(shù)據(jù)的離散程度,并會(huì)計(jì)算簡(jiǎn)單數(shù)據(jù)的方差;但高中需要理解方差的統(tǒng)計(jì)含義,對(duì)方差定義的合理性有所體會(huì),會(huì)結(jié)合實(shí)例計(jì)算分層隨機(jī)抽樣的樣本方差,以及會(huì)根據(jù)具體問題選擇恰當(dāng)?shù)奶卣鲾?shù)(標(biāo)準(zhǔn)差、方差、極差)刻畫數(shù)據(jù)的離散程度.因此,準(zhǔn)確把握本單元的教學(xué)要求,除了要認(rèn)真研讀課程標(biāo)準(zhǔn)和教科書,還需要了解初中的統(tǒng)計(jì)內(nèi)容和要求.

    (2)從統(tǒng)計(jì)的整體看局部的統(tǒng)計(jì)方法

    一個(gè)統(tǒng)計(jì)問題的完整解決包括從收集數(shù)據(jù)到獲得結(jié)論的一系列過程,而具體的統(tǒng)計(jì)方法往往是針對(duì)某個(gè)具體環(huán)節(jié)而言的.只有使學(xué)生在較為系統(tǒng)的數(shù)據(jù)處理過程中學(xué)習(xí)統(tǒng)計(jì)方法,才能理解其目的和本質(zhì).例如,抽樣目的是為了估計(jì)總體,研究抽樣方法是為了有效地抽取樣本,從而更好地估計(jì)總體.只有在估計(jì)總體這個(gè)大目標(biāo)下,才能體現(xiàn)出簡(jiǎn)單隨機(jī)抽樣的概率合理性,分層隨機(jī)抽樣的必要性.又如,畫頻率分布直方圖的目的是為了觀察樣本數(shù)據(jù)的分布規(guī)律,進(jìn)而估計(jì)總體的分布規(guī)律.因此組數(shù)多少應(yīng)以是否有利于觀察數(shù)據(jù)的分布規(guī)律以及估計(jì)總體的分布規(guī)律為標(biāo)準(zhǔn).

    (3)在問題解決過程中培養(yǎng)數(shù)據(jù)分析素養(yǎng)

    針對(duì)研究對(duì)象獲取數(shù)據(jù),運(yùn)用數(shù)學(xué)方法對(duì)數(shù)據(jù)進(jìn)行整理、分析和推斷,形成關(guān)于研究對(duì)象的知識(shí),這是高中統(tǒng)計(jì)需要重點(diǎn)培養(yǎng)的素養(yǎng).?dāng)?shù)據(jù)分析素養(yǎng)的培養(yǎng)需要在具體問題的解決中逐漸形成.本單元的教學(xué),應(yīng)結(jié)合典型案例,引導(dǎo)學(xué)生根據(jù)實(shí)際問題的需求,選擇不同的抽樣方法獲取數(shù)據(jù),理解數(shù)據(jù)蘊(yùn)含的信息;根據(jù)數(shù)據(jù)分析的需求,選擇適當(dāng)?shù)慕y(tǒng)計(jì)圖表描述和表達(dá)數(shù)據(jù),并從樣本數(shù)據(jù)中提取需要的數(shù)字特征,估計(jì)總體的統(tǒng)計(jì)規(guī)律,解決相應(yīng)的實(shí)際問題.對(duì)統(tǒng)計(jì)中的基本概念(如總體、樣本、樣本量),應(yīng)結(jié)合具體問題進(jìn)行描述性說明,在此基礎(chǔ)上適當(dāng)引入嚴(yán)格的定義,并利用數(shù)字特征(平均數(shù)、方差等)和數(shù)據(jù)直觀圖表(直方圖、散點(diǎn)圖等)分析數(shù)據(jù).

    (4)合理使用信息技術(shù)

    信息技術(shù)既是現(xiàn)代統(tǒng)計(jì)的組成部分,也是統(tǒng)計(jì)學(xué)習(xí)的有效手段.因此,在統(tǒng)計(jì)教學(xué)中,必須加強(qiáng)信息技術(shù)的使用,這不僅是為了提高教學(xué)的效率,同時(shí)也是為了更好地體現(xiàn)統(tǒng)計(jì)的學(xué)科特點(diǎn).例如,繪制頻率分布直方圖涉及數(shù)據(jù)的分組、頻率的計(jì)算、圖形的繪制等大量工作,用統(tǒng)計(jì)軟件可以快速繪制出不同組距和組數(shù)的直方圖,節(jié)約重復(fù)計(jì)算、機(jī)械性操作的時(shí)間,從而把更多的精力花在直方圖信息的提取上;又如,平均數(shù)、方差等特征數(shù)的計(jì)算,在學(xué)生已經(jīng)知道如何計(jì)算的前提下,統(tǒng)計(jì)軟件的使用就可以大大節(jié)約時(shí)間,進(jìn)而把更多的精力花在理解特征數(shù)的統(tǒng)計(jì)含義上.在中學(xué)階段,信息技術(shù)最大的優(yōu)勢(shì)在于可以實(shí)現(xiàn)隨機(jī)模擬,它使大量重復(fù)試驗(yàn)成為可能,可以讓學(xué)生直觀觀察、體驗(yàn)樣本的隨機(jī)性和規(guī)律性,了解樣本和總體之間的關(guān)系,彌補(bǔ)沒有理論基礎(chǔ)的不足.教學(xué)中,應(yīng)鼓勵(lì)學(xué)生盡可能運(yùn)用隨機(jī)模擬的方法,更好地體會(huì)統(tǒng)計(jì)的思想.

    猜你喜歡
    樣本量平均數(shù)總體
    加權(quán)平均數(shù)的應(yīng)用
    醫(yī)學(xué)研究中樣本量的選擇
    用樣本估計(jì)總體復(fù)習(xí)點(diǎn)撥
    2020年秋糧收購總體進(jìn)度快于上年
    外匯市場(chǎng)運(yùn)行有望延續(xù)總體平穩(wěn)發(fā)展趨勢(shì)
    航空裝備測(cè)試性試驗(yàn)樣本量確定方法
    Sample Size Calculations for Comparing Groups with Binary Outcomes
    直擊高考中的用樣本估計(jì)總體
    關(guān)注加權(quán)平均數(shù)中的“權(quán)”
    平均數(shù)應(yīng)用舉隅
    渝中区| 古浪县| 子长县| 辉县市| 安新县| 东山县| 龙门县| 河西区| 奉贤区| 怀宁县| 平塘县| 霍林郭勒市| 普陀区| 安多县| 新晃| 松江区| 高淳县| 南涧| 新闻| 荔波县| 胶南市| 丰城市| 芜湖县| 综艺| 湖北省| 铁力市| 北宁市| 金沙县| 隆德县| 广东省| 翁牛特旗| 岐山县| 安西县| 清丰县| 河津市| 施甸县| 赣榆县| 平度市| 宜宾县| 乌兰察布市| 姚安县|