江蘇 宋衛(wèi)東
新課標(biāo)下的概率統(tǒng)計(jì)考點(diǎn)分析與命題規(guī)律
江蘇 宋衛(wèi)東
新課標(biāo)指出,中國(guó)學(xué)生在數(shù)學(xué)學(xué)習(xí)中應(yīng)培養(yǎng)數(shù)學(xué)抽象、邏輯推理、數(shù)學(xué)建模、數(shù)學(xué)運(yùn)算、直觀想象、數(shù)據(jù)分析六大核心素養(yǎng),它是每一名學(xué)生獲得成功生活、適應(yīng)個(gè)人終生發(fā)展和社會(huì)發(fā)展都不可或缺的共同素養(yǎng).在概率統(tǒng)計(jì)部分中,頻率分布直方圖是其中重要的考點(diǎn),頻率分布直方圖作為一種提供背景材料的很好載體和工具,被稱(chēng)為考查簡(jiǎn)單數(shù)據(jù)處理能力的重要載體,因此備受高考命題者的青睞,仔細(xì)分析近年來(lái),尤其是近幾年的高考試卷會(huì)發(fā)現(xiàn),頻率分布直方圖、莖葉圖等圖表問(wèn)題成為僅次于數(shù)學(xué)文化素養(yǎng)考查的熱點(diǎn)題型.
【例1】(2016·山東理)某高校調(diào)查了200名學(xué)生每周的自習(xí)時(shí)間(單位:小時(shí)),制成了如圖所示的頻率分布直方圖,其中自習(xí)時(shí)間的范圍是[17.5,30],樣本數(shù)據(jù)分組為[17.5,20), [20,22.5), [22.5,25),[25,27.5),[27.5,30].根據(jù)直方圖,這200名學(xué)生中每周的自習(xí)時(shí)間不少于22.5小時(shí)的人數(shù)是
( )
A.56 B.60 C.120 D.140
【解析】自習(xí)不少于22.5小時(shí)是后三組,200×(0.16+0.08+0.04)×2.5=140,故選D.
【例2】(2014·廣東理·第17題)隨機(jī)觀測(cè)生產(chǎn)某種零件的某工廠(chǎng)25名工人的日加工零件數(shù)(單位:件),獲得數(shù)據(jù)如下:30,42,41,36,44,40,37,37,25,45,29,43,31,36,49,34,33,43,38,42,32,34,46,39,36,根據(jù)上述數(shù)據(jù)得到樣本的頻率分布表如下:
分組頻數(shù)頻率[25,30]30.12(30,35]50.20(35,40]80.32(40,45]n1f1(45,50]n2f2
(Ⅰ)確定樣本頻率分布表中n1,n2,f1和f2的值;
(Ⅱ)根據(jù)上述頻率分布表,畫(huà)出樣本頻率分布直方圖;
(Ⅲ)根據(jù)樣本頻率分布直方圖,求在該廠(chǎng)任取4人,至少有1人的日加工零件數(shù)落在區(qū)間(30,35]的概率.
(Ⅱ)樣本頻率分布直方圖如下:
(Ⅲ)根據(jù)樣本頻率分布直方圖,每人的日加工零件數(shù)落在區(qū)間(30,35]的概率為0.2,
設(shè)所取的4人中,日加工零件數(shù)落在區(qū)間(30,35]的人數(shù)為ξ,則ξ~B(4,0.2),
P(ξ≥1)=1-P(ξ=0)=1-(1-0.2)4=1-0.409 6=0.590 4,
所以4人中,至少有1人的日加工零件數(shù)落在區(qū)間(30,50]的概率約為0.590 4.
【例3】(2014·全國(guó)新課標(biāo)Ⅰ理)從某企業(yè)生產(chǎn)的某種產(chǎn)品中抽取500件,測(cè)量這些產(chǎn)品的一項(xiàng)質(zhì)量指標(biāo)值,由測(cè)量結(jié)果得如下頻率分布直方圖:
s2=(-30)2×0.02+(-20)2×0.09+(-10)2×0.22+0×0.33+102×0.24+202×0.08+302×0.02=150.
點(diǎn)評(píng):組中值是上下限之間的中點(diǎn)數(shù)值,以代表各組標(biāo)志值的一般水平.組中值并不是各組標(biāo)志值的平均數(shù),各組標(biāo)志值的平均數(shù)在統(tǒng)計(jì)分組后很難計(jì)算出來(lái),就常以組中值近似代替.由頻率分布直方圖可估計(jì)樣本特征數(shù),如眾數(shù)、中位數(shù)、均值、方差.若同一組數(shù)據(jù)用該組區(qū)間中點(diǎn)代表,則眾數(shù)為最高矩形的中點(diǎn)橫坐標(biāo),中位數(shù)為左邊和右邊的小長(zhǎng)方形的面積和是相等的點(diǎn),均值為每個(gè)矩形的中點(diǎn)橫坐標(biāo)與該矩形面積的累加值,方差是矩形的橫坐標(biāo)與均值的差的平方的加權(quán)平均值.
【例4】(2016·全國(guó)新課標(biāo)Ⅰ理)某公司計(jì)劃購(gòu)買(mǎi)2臺(tái)機(jī)器,該種機(jī)器使用三年后即被淘汰.機(jī)器有一易損零件,在購(gòu)進(jìn)機(jī)器時(shí),可以額外購(gòu)買(mǎi)這種零件作為備件,每個(gè)200元.在機(jī)器使用期間,如果備件不足再購(gòu)買(mǎi),則每個(gè)500元.現(xiàn)需決策在購(gòu)買(mǎi)機(jī)器時(shí)應(yīng)同時(shí)購(gòu)買(mǎi)幾個(gè)易損零件,為此搜集并整理了100臺(tái)這種機(jī)器在三年使用期內(nèi)更換的易損零件數(shù),得下面柱狀圖:
以這100臺(tái)機(jī)器更換的易損零件數(shù)的頻率代替1臺(tái)機(jī)器更換的易損零件數(shù)發(fā)生的概率,記X表示2臺(tái)機(jī)器三年內(nèi)共需更換的易損零件數(shù),n表示購(gòu)買(mǎi)2臺(tái)機(jī)器的同時(shí)購(gòu)買(mǎi)的易損零件數(shù).
(Ⅰ)求X的分布列;
(Ⅱ)若要求P(X≤n)≥0.5,確定n的最小值.
【解析】(Ⅰ)先確定X取值分別為16,17,18,19,20,21,22,再用相互獨(dú)立事件概率模型求概率,然后寫(xiě)出分布列:
X16171819202122P0.040.160.240.240.200.080.04
(Ⅱ)P(X≤18)=0.44,P(X≤19)=0.68,滿(mǎn)足P(X≤n)≥0.5的n的最小值是19.
點(diǎn)評(píng):柱狀圖是一種以長(zhǎng)方形的長(zhǎng)度為變量的表達(dá)圖形的統(tǒng)計(jì)報(bào)告圖,由一系列高度不等的縱向條紋表示數(shù)據(jù)分布的情況,用來(lái)比較兩個(gè)或以上的價(jià)值(不同時(shí)間或者不同條件),只有一個(gè)變量,通常用于較小的數(shù)據(jù)集分析.
【例5】(2013·福建理)某校從高一年級(jí)學(xué)生中隨機(jī)抽取部分學(xué)生,將他們的模塊測(cè)試成績(jī)分成6組:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以統(tǒng)計(jì),得到如圖所示的頻率分布直方圖.已知高一年級(jí)共有學(xué)生600名,據(jù)此估計(jì),該模塊測(cè)試成績(jī)不少于60分的學(xué)生人數(shù)為
( )
A.588 B.480
C.450 D.120
【解析】由頻率分布直方圖知40~60分的頻率為(0.005+0.015)×10=0.2,故估計(jì)不少于60分的學(xué)生人數(shù)為600×(1-0.2)=480.故選B.
點(diǎn)評(píng):在頻率分布直方圖中,每個(gè)小矩形面積就是相應(yīng)的頻率或概率,頻率×樣本容量=頻數(shù),所有小矩形面積之和為1,這是解題的關(guān)鍵.
【例6】(2014·遼寧理)一家面包房根據(jù)以往某種面包的銷(xiāo)售記錄,繪制了日銷(xiāo)售量的頻率分布直方圖,如圖所示:
將日銷(xiāo)售量落入各組的頻率視為概率,并假設(shè)每天的銷(xiāo)售量相互獨(dú)立.
(Ⅰ)求在未來(lái)連續(xù)3天里,有連續(xù)2天的日銷(xiāo)售量都不低于100個(gè)且另一天的日銷(xiāo)售量低于50個(gè)的概率;
(Ⅱ)用X表示在未來(lái)3天里日銷(xiāo)售量不低于100個(gè)的天數(shù),求隨機(jī)變量X的分布列、期望E(X)及方差D(X).
【解析】(Ⅰ)設(shè)A1表示事件“日銷(xiāo)售量不低于100個(gè)”,A2表示事件“日銷(xiāo)售量低于50個(gè)”,B表示事件“在未來(lái)連續(xù)3天里有連續(xù)2天日銷(xiāo)售量不低于100個(gè)且另一天的日銷(xiāo)售量低于50個(gè)”.因此可求出P(A1)=0.6,P(A2)=0.15,利用事件的獨(dú)立性即可求出P(B)=0.108.
(Ⅱ)由題意可知X~B(3,0.6),所以即可列出分布列,求出期望為E(X)和方差D(X)的值.因?yàn)閄~B(3,0.6),所以期望為E(X)=3×0.6=1.8,方差D(X)=3×0.6×(1-0.6)=0.72.
點(diǎn)評(píng):每個(gè)區(qū)間內(nèi)的頻率就是本區(qū)間內(nèi)所有個(gè)體個(gè)數(shù)與樣本容量的比值,這與古典概型概率計(jì)算原理是一致的,因此可以把頻率近似地看作概率.
【例7】(2016·北京文)某市民用水?dāng)M實(shí)行階梯水價(jià),每人用水量中不超過(guò)w立方米的部分按4元/立方米收費(fèi),超出w立方米的部分按10元/立方米收費(fèi),從該市隨機(jī)調(diào)查了10 000位居民,獲得了他們某月的用水量數(shù)據(jù),整理得到如下頻率分布直方圖:
(Ⅰ)如果w為整數(shù),那么根據(jù)此次調(diào)查,為使80%以上居民在該月的用水價(jià)格為4元/立方米,w至少定為多少?
(Ⅱ)假設(shè)同組中的每個(gè)數(shù)據(jù)用該組區(qū)間的右端點(diǎn)值代替,當(dāng)w=3時(shí),估計(jì)該市居民該月的人均水費(fèi).
【解析】(Ⅰ)由圖可知,用水量不超過(guò)2立方米的頻率是(0.2+0.3+0.4)×0.5=0.45,
用水量不超過(guò)3立方米的頻率是(0.2+0.3+0.4+0.5+0.3)×0.5=1.7×0.5=0.85.
顯然為使80%以上居民在該月的用水價(jià)格為4元/立方米,w至少定為3.
(Ⅱ)由用水量的頻率分布直方圖及題意,得居民該月用水費(fèi)用的數(shù)據(jù)分組與頻率分布表:
組號(hào)12345678分組[2,4](4,6](6,8](8,10](10,12](12,17](17,22](22,27]頻率0.10.150.20.250.150.050.050.05
根據(jù)題意,該市居民該月的人均水費(fèi)估計(jì)為
4×0.1+6×0.15+8×0.2+10×0.25+12×0.15+17×0.05+22×0.05+27×0.05=10.5(元).
點(diǎn)評(píng):頻率分布表在數(shù)量表示上比較準(zhǔn)確,直方圖比較直觀,頻率分布表中的頻數(shù)之和等于樣本容量.居民該月的人均水費(fèi),也就是總水費(fèi)除以樣本容量10 000,其中計(jì)算總水費(fèi)可以一人一人地加起來(lái),也可以對(duì)落在每個(gè)區(qū)間內(nèi)的人數(shù)乘以相應(yīng)的水費(fèi),再加起來(lái),而后者再分別除以樣本容量之后,實(shí)際上頻率就成了每個(gè)水費(fèi)數(shù)據(jù)的權(quán)重,這就是一種簡(jiǎn)便計(jì)算.
【例8】(2016·四川文)我國(guó)是世界上嚴(yán)重缺水的國(guó)家,某市為了制定合理的節(jié)水方案,對(duì)居民用水情況進(jìn)行了調(diào)查,通過(guò)抽樣,獲得了某年100位居民每人的月均用水量(單位:噸),將數(shù)據(jù)按照[0,0.5), [0.5,1),…,[4,4.5]分成9組,制成了如圖所示的頻率分布直方圖.
(Ⅰ)求直方圖中的a值;
(Ⅱ)設(shè)該市有30萬(wàn)居民,估計(jì)全市居民中月均用水量不低于3噸的人數(shù),說(shuō)明理由;
(Ⅲ)估計(jì)居民月均用水量的中位數(shù).
【解析】(Ⅰ)由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a+0.5×a,解得a=0.30.
(Ⅱ)100位居民月均用水量不低于3噸的頻率為0.06+0.04+0.02=0.12.
由以上樣本的頻率分布,可以估計(jì)30萬(wàn)居民中月均用水量不低于3噸的人數(shù)為300 000×0.12=36 000.
(Ⅲ)設(shè)中位數(shù)為x噸.因?yàn)榍?組的頻率之和為 0.04+0.08+0.15+0.21+0.25=0.73gt;0.5,
而前4組的頻率之和為0.04+0.08+0.15+0.21=0.48lt;0.5,
所以2≤xlt;2.5.由0.50×(x-2)=0.5-0.48,解得x=2.04.
故可估計(jì)居民月均用水量的中位數(shù)為2.04噸.
點(diǎn)評(píng):在一般問(wèn)題中,中位數(shù)就是將所有數(shù)據(jù)按照從小到大順序排列,位于最中間的數(shù)據(jù)或者相鄰兩個(gè)數(shù)據(jù)的均值,本題因?yàn)榍?組的頻率之和為0.73gt;0.5,而前4組的頻率之和為0.48lt;0.5,所以中位數(shù)應(yīng)該在第5組內(nèi),所以 2≤xlt;2.5,中位數(shù)x到2之間的頻率等于0.5(x-2),也等于0.5-0.48,因此x=2.04.可見(jiàn)探求中位數(shù)的本質(zhì)也是探究頻率恰為0.5時(shí)相應(yīng)的用水量.
【變式】若該市政府希望使85%的居民每月的用水量不超過(guò)標(biāo)準(zhǔn)x(噸),估計(jì)x的值,并說(shuō)明理由.
【解析】因?yàn)榍?組的頻率之和為0.04+0.08+0.15+0.21+0.25=0.73lt;0.85,
而前6組的頻率之和為0.73+0.30×0.5=0.88gt;0.85,
所以2.5≤xlt;3.由0.3×(x-2.5)=0.85-0.73,解得x=2.9.
所以,估計(jì)月用水量標(biāo)準(zhǔn)為2.9噸時(shí),85%的居民每月的用水量不超過(guò)標(biāo)準(zhǔn).
【例9】(2016·全國(guó)新課標(biāo)Ⅰ文)某公司計(jì)劃購(gòu)買(mǎi)1臺(tái)機(jī)器,該種機(jī)器使用三年后即被淘汰.機(jī)器有一易損零件,在購(gòu)進(jìn)機(jī)器時(shí),可以額外購(gòu)買(mǎi)這種零件作為備件,每個(gè)200元.在機(jī)器使用期間,如果備件不足再購(gòu)買(mǎi),則每個(gè)500元.現(xiàn)需決策在購(gòu)買(mǎi)機(jī)器時(shí)應(yīng)同時(shí)購(gòu)買(mǎi)幾個(gè)易損零件,為此搜集并整理了100臺(tái)這種機(jī)器在三年使用期內(nèi)更換的易損零件數(shù),得下面柱狀圖:
記x表示1臺(tái)機(jī)器在三年使用期內(nèi)需更換的易損零件數(shù),y表示1臺(tái)機(jī)器在購(gòu)買(mǎi)易損零件上所需的費(fèi)用(單位:元),n表示購(gòu)機(jī)的同時(shí)購(gòu)買(mǎi)的易損零件數(shù).
(Ⅰ)若n=19,求y與x的函數(shù)解析式;
(Ⅱ)若要求“需更換的易損零件數(shù)不大于n”的頻率不小于0.5,求n的最小值;
(Ⅲ)假設(shè)這100臺(tái)機(jī)器在購(gòu)機(jī)的同時(shí)每臺(tái)都購(gòu)買(mǎi)19個(gè)易損零件,或每臺(tái)都購(gòu)買(mǎi)20個(gè)易損零件,分別計(jì)算這100臺(tái)機(jī)器在購(gòu)買(mǎi)易損零件上所需費(fèi)用的平均數(shù),以此作為決策依據(jù),購(gòu)買(mǎi)1臺(tái)機(jī)器的同時(shí)應(yīng)購(gòu)買(mǎi)19個(gè)還是20個(gè)易損零件?
【解析】(Ⅰ)因?yàn)橘?gòu)機(jī)的同時(shí)購(gòu)買(mǎi)的易損零件數(shù)為19,
所以當(dāng)x≤19時(shí),y=3 800;
當(dāng)xgt;19時(shí),y=3 800+500(x-19)=500x-5 700.
(Ⅱ)由柱狀圖知,需更換的零件數(shù)不大于18的概率為0.46,不大于19的概率為0.7,故n的最小值為19.
若每臺(tái)機(jī)器在購(gòu)機(jī)同時(shí)都購(gòu)買(mǎi)20個(gè)易損零件,則這100臺(tái)機(jī)器中有90臺(tái)在購(gòu)買(mǎi)易損零件上的費(fèi)用為4 000元,10臺(tái)的費(fèi)用為4 500元.
比較兩個(gè)平均數(shù)可知,購(gòu)買(mǎi)1臺(tái)機(jī)器的同時(shí)應(yīng)購(gòu)買(mǎi)19個(gè)易損零件.
點(diǎn)評(píng):柱狀圖本身不連續(xù),圖形只有高度沒(méi)有寬度,它的高就是頻數(shù).柱狀圖在本題中起到了提供數(shù)據(jù)的作用,并且更為直觀形象.
【例10】(2013·全國(guó)新課標(biāo)Ⅱ文·第19題)經(jīng)銷(xiāo)商經(jīng)銷(xiāo)某種農(nóng)產(chǎn)品,在一個(gè)銷(xiāo)售季度內(nèi),每售出1 t該產(chǎn)品獲利潤(rùn)500元,未售出的產(chǎn)品,每1 t虧損300元.根據(jù)歷史資料,得到銷(xiāo)售季度內(nèi)市場(chǎng)需求量的頻率分布直方圖,如圖所示.經(jīng)銷(xiāo)商為下一個(gè)銷(xiāo)售季度購(gòu)進(jìn)了130 t該農(nóng)產(chǎn)品.以X(單位:t,100≤X≤150)表示下一個(gè)銷(xiāo)售季度內(nèi)的市場(chǎng)需求量,T(單位:元)表示下一個(gè)銷(xiāo)售季度內(nèi)經(jīng)銷(xiāo)該農(nóng)產(chǎn)品的利潤(rùn).
(Ⅰ)將T表示為X的函數(shù);
(Ⅱ)根據(jù)直方圖估計(jì)利潤(rùn)T不少于57 000元的概率.
【解析】(Ⅰ)當(dāng)X∈[100,130)時(shí),T=500X-300(130-X)=800X-39 000;
當(dāng)X∈[130,150]時(shí),T=500×130=65 000,
(Ⅱ)由(Ⅰ)知利潤(rùn)T不少于57 000元當(dāng)且僅當(dāng)120≤X≤150.
由直方圖知需求量X∈[120,150]的頻率為0.7,所以下一個(gè)銷(xiāo)售季度內(nèi)的利潤(rùn)T不少于57 000元的概率的估計(jì)值為0.7.
點(diǎn)評(píng):頻率分布直方圖所研究的數(shù)據(jù)是分區(qū)存放的,在該區(qū)內(nèi)的數(shù)據(jù)都滿(mǎn)足同樣函數(shù)關(guān)系,因此頻率分布直方圖也可以用分段函數(shù)表達(dá).此外頻率分布直方圖可以很好地反應(yīng)數(shù)據(jù)分布規(guī)律服從正態(tài)分布,2014全國(guó)新課標(biāo)Ⅰ理第18題就考查過(guò)該種問(wèn)題.
江蘇省贛榆縣教育局教研室)