■劉大鳴(特級教師)
近幾年高考對統(tǒng)計的考查主要是圍繞“抽樣方法,莖葉圖,頻率分布直方圖,樣本的數(shù)字特征,回歸分析”等核心考點展開的,著重考查同學們應(yīng)用統(tǒng)計知識解決實際問題的核心素養(yǎng)。下面以近幾年高考試題為載體進行全方位的考點聚焦,希望對同學們的學習有所幫助。
例1甲、乙兩套設(shè)備生產(chǎn)的同類型產(chǎn)品共4800件,采用分層抽樣的方法從中抽取一個容量為80的樣本進行質(zhì)量檢測。若樣本中有50件產(chǎn)品由甲設(shè)備生產(chǎn),則乙設(shè)備生產(chǎn)的產(chǎn)品總件數(shù)為____。
解:由題設(shè)可得抽樣比為設(shè)甲設(shè)備生產(chǎn)的產(chǎn)品為x件,則,可得x=3000。故乙設(shè)備生產(chǎn)的產(chǎn)品總件數(shù)為4800—3000=1800。
品味:當個體差異較大時,常采用分層抽樣法。分層抽樣就是按比例抽樣,根據(jù)總體中的個體數(shù)N和樣本容量n計算抽樣比k=確定第i層應(yīng)抽取的個體數(shù)為k(Ni為第i層包含的個體數(shù)),當k不是整數(shù)時,要從總體中剔除多余的個體。
變式1:某工廠生產(chǎn)甲,乙,丙,丁四種不同型號的產(chǎn)品,產(chǎn)量(單位:件)分別為200,400,300,100。為檢驗產(chǎn)品的質(zhì)量,現(xiàn)用分層抽樣的方法從以上所有的產(chǎn)品中抽取60件進行檢驗,則應(yīng)從丙種型號的產(chǎn)品中抽取的件數(shù)為____。
提示:依據(jù)分層抽樣為按比例抽樣的特點確定抽樣比為,故抽取的件數(shù)為60×,即應(yīng)從丙種型號的產(chǎn)品中抽取的件數(shù)為18。
例2已知某地區(qū)中小學學生的近視情況分布如圖1和圖2所示。為了解該地區(qū)中小學學生的近視形成原因,用分層抽樣的方法抽取2%的學生進行調(diào)查,則樣本容量和抽取的高中生近視人數(shù)分別為( )。
圖1
圖2
解:根據(jù)圖1可得總體個數(shù),根據(jù)抽取比例可得樣本容量。計算分層抽樣的抽樣比,求得樣本中的高中生人數(shù),利用圖2求得樣本中抽取的高中生近視人數(shù)。
由圖1可知,總體個數(shù)為3500+2000+4500=10000,由此可得樣本容量為10000×2%=200。
品味:把握統(tǒng)計圖表的意義,合理運用統(tǒng)計圖表的數(shù)據(jù),借助計算進行推理判斷,凸顯對數(shù)據(jù)收集和應(yīng)用的核心素養(yǎng)的考查。
變式2:某中學初中部共有110名教師,高中部共有150名教師,其性別比例如圖3所示,則該校女教師的人數(shù)為( )。
圖3
提示:由圖3可知該校女教師由初中的和高中的組成,其人數(shù)為77+60=137。應(yīng)選B。
例3某工廠為提高生產(chǎn)效率,開展技術(shù)創(chuàng)新活動,提出了完成某項生產(chǎn)任務(wù)的兩種新的生產(chǎn)方式。為比較兩種生產(chǎn)方式的效率,選取40名工人,將他們隨機分成兩組,每組20人,第一組工人用第一種生產(chǎn)方式,第二組工人用第二種生產(chǎn)方式。根據(jù)工人完成生產(chǎn)任務(wù)的工作時間(單位:m i n)繪制了莖葉圖,如圖4所示。
圖4
根據(jù)莖葉圖判斷哪種生產(chǎn)方式的效率更高。請說明理由。
解:由莖葉圖中的數(shù)據(jù)可知,第二種生產(chǎn)方式的效率更高。理由如下:
(1)由莖葉圖可知:用第一種生產(chǎn)方式的工人中有75%的工人完成生產(chǎn)任務(wù)所需時間至少80m i n,用第二種生產(chǎn)方式的工人中有75%的工人完成生產(chǎn)任務(wù)所需時間至多79m i n。因此第二種生產(chǎn)方式的效率更高。
(2)由莖葉圖可知:用第一種生產(chǎn)方式的工人完成生產(chǎn)任務(wù)所需時間的中位數(shù)為85.5m i n,用第二種生產(chǎn)方式的工人完成生產(chǎn)任務(wù)所需時間的中位數(shù)為73.5m i n。因此第二種生產(chǎn)方式的效率更高。
(3)由莖葉圖可知:用第一種生產(chǎn)方式的工人完成生產(chǎn)任務(wù)平均所需時間高于80m i n,用第二種生產(chǎn)方式的工人完成生產(chǎn)任務(wù)平均所需時間低于80m i n。因此第二種生產(chǎn)方式的效率更高。
(4)由莖葉圖可知:用第一種生產(chǎn)方式的工人完成生產(chǎn)任務(wù)所需時間分布在“莖8”上的最多,關(guān)于“莖8”大致呈對稱分布,用第二種生產(chǎn)方式的工人完成生產(chǎn)任務(wù)所需時間分布在“莖7”上的最多,關(guān)于“莖7”大致呈對稱分布,且用兩種生產(chǎn)方式的工人完成生產(chǎn)任務(wù)所需時間分布的區(qū)間相同,故可以認為用第二種生產(chǎn)方式完成生產(chǎn)任務(wù)所需的時間比用第一種生產(chǎn)方式完成生產(chǎn)任務(wù)所需的時間更少。因此第二種生產(chǎn)方式的效率更高。
品味:在莖葉圖中,“莖”表示數(shù)的高位部分,“葉”表示數(shù)的低位部分。從莖葉圖中能看到原始數(shù)據(jù),沒有任何信息損失,且莖葉圖便于記錄和表示。借助莖葉圖的數(shù)據(jù)可以求樣本的數(shù)字特征。
變式3:已知某班級部分同學一次測驗的成績統(tǒng)計如圖5所示,則中位數(shù)和眾數(shù)分別為( )。
圖5
提示:由莖葉圖可知,中位數(shù)為92,眾數(shù)為86。應(yīng)選B。
例4隨著互聯(lián)網(wǎng)的發(fā)展,移動支付(又稱手機支付)越來越普遍,某學校興趣小組為了解移動支付在大眾中的熟知度,對15~65歲的人群隨機抽樣調(diào)查,調(diào)查的問題是:你會使用移動支付嗎?其中回答“會”的共有n人。
把這n人按照年齡分成5組,即第1組為[15,25),第2組為[25,35),第3組為[35,45),第4組為[45,55),第5組為[55,65],然后繪制成如圖6所示的頻率分布直方圖。其中第1組的頻數(shù)為20。
(1)求n和x的值。
(2)根據(jù)頻率分布直方圖估計這組數(shù)據(jù)的眾數(shù)、中位數(shù)、平均數(shù)、方差。
解:(1)由題意可知
由10×(0.02+0.036+x+0.01+0.004)=1,解得x=0.03。
(2)由頻率分布直方圖可估計這組數(shù)據(jù)的眾數(shù)為30。
設(shè)中位數(shù)為m,則各組頻率分別為0.2,0.36,0.3,0.1,0.04,且0.2+0.36>0.5,可知中位數(shù)在第2組中,所以0.2+0.036×(m—25)=0.5,解得m≈33.3,即中位數(shù)約為33.3。
方差s2=(20—34.2)2×0.2+(30—34.2)2×0.36+(40—34.2)2×0.3+(50—34.2)2×0.1+(60—34.2)2×0.04=108.36。
品味:在頻率分布直方圖中,每個小長方形的面積就是相應(yīng)的頻率,所有小長方形的面積之和為1。用樣本的數(shù)字特征估計總體的數(shù)字特征時,眾數(shù)是樣本數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)據(jù),反映在頻率分布直方圖中,對應(yīng)小長方形的面積應(yīng)最大,所以用最高小長方形底邊中點橫坐標估計眾數(shù);中位數(shù)是頻率分布直方圖中的左右面積等分線對應(yīng)的數(shù)值(橫坐標);用頻率分布直方圖中每個小長方形的面積pi乘以小長方形底邊中點的橫坐標xi之和估計樣本平均數(shù),計算公式為,方差計算公式
變式4:某學校為了解小學生的體能情況,抽取了該校不同年級部分學生進行跳繩測試,將所得的數(shù)據(jù)整理后畫出頻率分布直方圖(如圖7)。已知圖中從左到右的前三個小組的頻率分別是0.1,0.3,0.4,第一小組的頻數(shù)是5。
(1)求第四小組的頻率和參加這次測試的學生人數(shù)。
(2)在這次測試中,學生跳繩次數(shù)的中位數(shù)落在第幾小組內(nèi)?
(3)參加這次測試跳繩次數(shù)在100次以上為優(yōu)秀,試估計學生跳繩成績的優(yōu)秀率。
提示:(1)第四小組的頻率為1—(0.1+0.3+0.4)=0.2。因為第一小組的頻數(shù)為5,第一小組的頻率為0.1,所以參加這次測試的學生人數(shù)為5÷0.1=50。
(2)由頻率分布直方圖可知,0.1×50=5,0.3×50=15,0.4×50=20,0.2×50=10,則第一、第二、第三、第四小組的頻數(shù)分別為5,15,20,10。所以學生跳繩次數(shù)的中位數(shù)落在第三小組內(nèi)。
(3)由第三、四小組的頻率,可知學生跳繩成績的優(yōu)秀率為(0.4+0.2)×100%=60%。