王娟
概率與統(tǒng)計在新高考中的命題大致是“兩小一大”(參見2020年高考山東卷),總分為22分. 其中“兩小”中的一題比較基礎,另一題比較難.“一大”屬于概率統(tǒng)計與實際應用相結合問題,難宜適中,正常情況下考生是可以得分的.看看過去、想想今天,我們將面對2021年高考,這是新的開始,那么,高考試題會如何設計呢?我們暫且認定既有“小題”也有“大題”. 這些題將落在何處,以什么樣的面孔與考生見面?依據(jù)考試說明、命題大綱及近期各地市的模擬試題,談談我們對2021年高考全國高考概率統(tǒng)計方面的命題預測,供參考.
一、客觀性試題的設計
由于概率統(tǒng)計內容十分豐富,必修三兩章、選修2-3整本,于是,“小題”出現(xiàn)在哪里?值得我們認真思考,再想想過往試題,再看看近期試卷,我們認為在以下幾個方面設計試題的可能性會很大.
1. 在隨機抽樣中設計
例1 采用系統(tǒng)抽樣方法從960人中抽取32人做問卷調查,為此將他們隨機編號為1,2,…,960,分組后在第一組采用簡單隨機抽樣的方法抽到的號碼為9.抽到的32人中,編號落入?yún)^(qū)間[1,450]的人做問卷A,編號落入?yún)^(qū)間[451,750]的人做問卷B,其余的人做問卷C. 則抽到的人中,做問卷B的人數(shù)為( )
A. 7 B. 9 C. 10 D. 15
解析 C. 抽樣間隔為30,所以第k組被抽中的號碼為9+30(k-1).令451≤9+30(k-1)≤750,15■≤k≤25■,k∈N*,∴做B卷的人數(shù)為10人,選C.
點評系統(tǒng)抽樣的特點——機械抽樣,又稱等距抽樣,所以依次抽取的樣本對應的號碼就是一個等差數(shù)列,首項就是第1組所抽取樣本的號碼,公差為間隔數(shù),根據(jù)等差數(shù)列的通項公式就可以確定每一組內所要抽取的樣本號碼.系統(tǒng)抽樣時,如果總體中的個數(shù)不能被樣本容量整除時,可以先用簡單隨機抽樣從總體中剔除幾個個體,然后再按系統(tǒng)抽樣進行.
2. 在特殊數(shù)據(jù)中設計
例2 由正整數(shù)組成的一組數(shù)據(jù)x1, x2, x3, x4,其平均數(shù)和中位數(shù)都是2,且標準差等于1,則這組數(shù)據(jù)的立方和為()
A. 70 B. 60 C. 50 D. 56
解析 D. 不妨設x1≤x2≤x3≤x4, x1, x2, x3, x4∈N*,依題意得x1+x2+x3+x4=8,s=■=1,
即(x1-2)2+(x2-2)2+(x3-2)2+(x4-2)2=4,所以x4≤3.
則只能x1=x2=1,x3=x4=3,則這組數(shù)據(jù)為1, 1, 3, 3.
于是■+■+■+■=13+13+33+33=56,選D.
例3 “微信運動”是騰訊開發(fā)的一個記錄跑步或行走情況(步數(shù)里程)的公眾號用戶通過該公眾號可查看自己某時間段的運動情況,某人根據(jù)2018年1月至2018年11月期間每月跑步的里程(單位:十公里)的數(shù)據(jù)繪制了下面的折線圖,根據(jù)該折線圖,下列結論正確的是()
A. 月跑步里程逐月增加
B. 月跑步里程最大值出現(xiàn)在10月
C. 跑步里程的中位數(shù)為5月份對應的里程數(shù)
D. 1月至5月的月跑步里程相對于6月至11月波動性更小,變化比較平穩(wěn)
解析 BCD.由某人2018年1月至2018年11月期間每月跑步的平均里程(單位:公里)的數(shù)據(jù)繪制的折線圖知:
在A中,月跑步平均里程2月、7月、8月和11月減少,故A錯誤.
在B中,月跑步里程最大值出現(xiàn)在10月,故B正確.
在C中,月跑步里程數(shù)按從小到大排列,發(fā)現(xiàn)中位數(shù)為5月份對應的里程數(shù),故C正確.
在D中,1月至5月的月跑步平均里程相對于6月至11月,波動性更小,變化比較平穩(wěn),故D正確.
點評平均數(shù)與方差都是重要的數(shù)字特征,是對總體的一種簡明的描述,它們所反映的情況有著重要的實際意義,平均數(shù)、中位數(shù)、眾數(shù)描述其集中趨勢,方差和標準差描述其波動大小.
3. 在概率中設計
例4 儲物罐中有2個紅球,3個白球和3個黑球,現(xiàn)從該罐任取2球,則下列結論中正確的是()
A. 兩球都是紅球、白球、黑球的概率之比為2 ∶ 3 ∶ 3
B. 兩球同色的概率為■
C. 兩球為一紅一白的概率為■
D. 若兩球一紅一白為事件A,一白一黑為事件B,則事件A與事件B不是互斥事件
解析 BC. 對于A,兩球都是紅球、白球、黑球的概率分別為■,■,■,顯然,A一正確. 對于B,兩球同時色的概率為■=■,選項B正確. 對于C,兩球為一紅一白的概率為■=■. 對于D,若兩球一紅一白為事件A,一白一黑為事件B,則事件A與事件B不會同時發(fā)生,是互斥事件.
點評概率涉及的內容很豐富,既有古典概型問題,又有離散型隨機變量的概率等,在此處設計多選題恰到好處,可以達到一題多考的目的.
4. 在排列組合中設計
例5 設集合A={(x1,x2,x3,x4,x5)|xi∈|-1,0,1|,i=1,2,3,4,5},那么集合A中滿足條件“1≤|x1|+|x2|+|x3|+|x4|+|x5|≤3”的元素個數(shù)為()
A. 130 B. 120 C. 90 D. 60
(5)A. 其一:|x1|+|x2|+|x3|+|x4|+|x5|=1,此時,從x1, x2, x3,x4, x5中任取一個讓其等于1或-1,于是有■■=10.
其二:|x1|+|x2|+|x3|+|x4|+|x5|=2,此時,從x1, x2, x3, x4, x5中任取兩個讓其都等于1或都等于-1或一個是1另一個是-1,于是有2■+■■ = 40.
其三:|x1|+|x2|+|x3|+|x4|+|x5|=3,此時,從x1, x2, x3, x4, x5中任取三個讓其都等于1或都等于-1或兩個是1另一個是或兩個是-1另一個是1,
于是有2■+■■+■■=80. 選A.
點評求解排列、組合的綜合應用問題關鍵在于分類與分步要非常清晰,在分類上做到不重不漏,在分步上做到層次分明.這樣就可以保證結論的準確性.
5. 在二項式定理中設計
例6 設f(x)是(x2+■)6展開式的中間項,則f(x)≤mx在區(qū)間 [■,■] 上恒成立的必要不充分條件是()
A. m∈[0, +∞) B. m∈[■, +∞)
C. m∈[■, 5) ??? D. m∈[5, +∞)
解析 AB. 由于(x2+■)6的展開式共有7項,所以中間項為第4項,
因為(x2+■)6展開式的通項為Tr+1=■(x2)6-r(■)r=(■)r ■x12-3r.
令r=3得T4=■(x2)6-3(■)3=■x3,所以f(x)=■x3.
因為f(x)≤mx在區(qū)間[■,■] 上恒成立,∴■x3≤mx在區(qū)間[■,■] 上恒成立,∴ m≥■x2在區(qū)間[■,■] 上恒成立,當x=■時,■x2有最大值為5.
∴ m≥5,所以f(x)≤mx在區(qū)間[■,■] 上恒成立的必要不充分條件,符合條件的是AB.
點評二項式定理中的命題還可以設計求一個三項式展開式某指定項的系數(shù),這也是??汲P碌囊活愒囶},同樣值得我們關注.
6. 在離散型隨機變量的均值與方差中設計
例7 下列命題中,正確的命題的是( )
A. 已知隨機變量服從二項分布B(n,p),若E(X)=30,D(X)=20,p=■
B. 將一組數(shù)據(jù)中的每個數(shù)據(jù)都加上同一個常數(shù)后,均值與方差恒都不變
C. 設隨機變量?孜服從正態(tài)分布N(0,1),若P(?孜>1)=p,則P(-1<?孜≤0)=■-p
D. 某人在10次射擊中,擊中目標的次數(shù)為X, X~B(10, 0.8),則當X=8時概率最大
解析 ACD. 對于A,隨機變量服從二項分布B(n, p),若E(X)=30, D(X)=20可得np=30,np(1-p)=20?圯p=■故A正確. 對于B,根據(jù)公式易知,將一組數(shù)據(jù)中的每個數(shù)據(jù)都加上同一個常數(shù)后,方差恒不變,但均值會改變,故不正確. 對于C隨機變量?孜服從正態(tài)分布N(0,1),則圖像關于y軸對稱,若P(?孜>1)=p則P(0<?孜<1)=■-p?圯P(-1<?孜<0)=■-p,故正確. 對于D,因為在10次射擊中,擊中目標的次數(shù)為X, X ~ B(10, 0.8),對應的概率P(x=k)=■×0.8k×0.210-k,當k≥1時,■=■=■≥1?圯1≤k≤■,因為k為整數(shù),所以1≤k≤8即當k=8時,概率X=8最大,故D正確.
點評在離散型隨機變量的均值及方差中設計試題,往往不會單獨考查某一知識點或技能點,可能會考查多個不同的內容,如本題均值、方差、二項分布及二項分布中概率的最值等,可以看出:有一個不過關,想征服此題根本沒可能.
二、主觀性試題的設計
主觀性試題,我們首先要關注幾個常規(guī)的命題點,然后我們再注重試題創(chuàng)新,具體內容請看:
1. 圍繞獨立性檢驗進行設計
例8 海水養(yǎng)殖場進行某水產(chǎn)品的新、舊網(wǎng)箱養(yǎng)殖方法的產(chǎn)量對比,收獲時各隨機抽取了100個網(wǎng)箱,測量各箱水產(chǎn)品的產(chǎn)量(單位:kg),其頻率分布直方圖如下:
(Ⅰ)記A表示事件“舊養(yǎng)殖法的箱產(chǎn)量低于50 kg”,估計A的概率.
(Ⅱ)填寫下面列聯(lián)表,并根據(jù)列聯(lián)表判斷是否有99%的把握認為箱產(chǎn)量與養(yǎng)殖方法有關.
(Ⅲ)根據(jù)箱產(chǎn)量的頻率分布直方圖,對這兩種養(yǎng)殖方法的優(yōu)劣進行比較.附:
K2=■
解析(Ⅰ)舊養(yǎng)殖法的箱產(chǎn)量低于50 kg的頻率為(0.012+0.014+0.024+0.034+0.040)×5=0.62,
因此,事件A的概率估計值為0.62.
(Ⅱ)根據(jù)箱產(chǎn)量的頻率分布直方圖得列聯(lián)表
K2=■≈15.705,
由于15.705>6.635,故有99%的把握認為箱產(chǎn)量與養(yǎng)殖方法有關.
(Ⅲ)箱產(chǎn)量的頻率分布直方圖平均值(或中位數(shù))在45 kg到50 kg之間,且新養(yǎng)殖法的箱產(chǎn)量分布集中程度較舊養(yǎng)殖法的箱產(chǎn)量分布集中程度高,因此,可以認為新養(yǎng)殖法的箱產(chǎn)量較高且穩(wěn)定,從而新養(yǎng)殖法優(yōu)于舊養(yǎng)殖法.
點評獨立性檢驗是對兩個變量有關系的可信程度的判斷,而不是對其是否有關系的判斷. 獨立性檢驗得出的結論是帶有概率性質的,只能說結論成立的概率有多大,而不能完全肯定一個結論.
2. 圍繞線性與非線性回歸進行設計
例9 下表是近幾屆奧運會中國代表團獲得的金牌數(shù)之和y(從26屆算起,不包括之前已獲得的金牌數(shù))隨時間x變化的數(shù)據(jù).
作出散點圖如圖所示.
由圖可以看出,金牌數(shù)之和y與時間x之間存在線性相關關系.
(Ⅰ)求y關于x的線性回歸方程.
(Ⅱ)預測第32屆中國代表團獲得的金牌數(shù)之和為多少?
(Ⅲ)現(xiàn)已知第31屆中國代表團實際所獲的金牌數(shù)為26,求殘差■.
參考數(shù)據(jù):x=28,y=85.6,■(xi -x)(yi -y)=381,■(xi -x)2=10.
附:對于一組數(shù)據(jù)(x1, y1),(x2, y2),…,(xn, yn),其回歸直線■=■+■x的斜率和截距的最小二乘估計分別為:■=■=■,■=■-■■.
解析(Ⅰ)■=■=■=38.1,
■=■-■■=85.6-38.1×28=-981.2,
所以金牌數(shù)之和y關于時間x的線性回歸方程為■=38.1x-981.2.
(Ⅱ)由(Ⅰ)知,當x=32時,中國代表團獲得的金牌數(shù)之和的預測值■=38.1×32-981.2=238,故預測第32屆中國代表團獲得的金牌數(shù)之和為238枚.
(Ⅲ)當x=31時,中國代表團獲得的金牌數(shù)之和的預測值為:
■=38.1×31-981.2=199.9,
第31屆中國代表團獲得的金牌數(shù)之和的真實值為165+26=191,
所以殘差■=191-199.9=-8.9.
點評求回歸方程的方法是最小二乘法,即使得樣本數(shù)據(jù)的點到回歸直線的距離的平方和最小. 線性回歸模型y=bx+a+e,其中e稱為隨機誤差,自變量x稱為解釋變量,因變量y稱為預報變量. 回歸直線■=■x+■必過樣本點的中心(x,y),這個結論既是檢驗所求回歸直線方程是否準確的依據(jù),也是求參數(shù)的一個依據(jù).
3. 圍繞均值與方差進行設計
例10 某花店每天以每枝5元的價格從農場購進若干枝玫瑰花,然后以每枝10元的價格出售,如果當天賣不完,剩下的玫瑰花作垃圾處理.
(1)若花店一天購進16枝玫瑰花,求當天的利潤y(單位:元)關于當天需求量n(單位:枝,n∈N)的函數(shù)解析式.
(2)花店記錄了100天玫瑰花的日需求量(單位:枝),整理得下表:
以100天記錄的各需求量的頻率作為各需求量發(fā)生的概率.
①若花店一天購進16枝玫瑰花,X表示當天的利潤(單位:元),求X的分布列、數(shù)學期望及方差.
②若花店計劃一天購進16枝或17枝玫瑰花,你認為應購進16枝還是17枝?請說明理由.
解析(1)當n≥16時,y=16×(10-5)=80.
當n≤15時,y=5n-5(16-n)=10n-80,得:y=10n-80(n≤15)80?????? (n≥16)(n∈N).
(2)①X可取60,70,80.
P(X=60)=0.1, P(X=70)=0.2, P(X=80)=0.7.
X的分布列為:
EX=60×0.1+70×0.2+80×0.7=76,
DX=162×0.1+62×0.2+42×0.7=44.
②答案一:
花店一天應購進16枝玫瑰花. 理由如下:
若花店一天購進17枝玫瑰花,Y表示當天的利潤(單位:元),那么Y的分布列為:
Y的數(shù)學期望為EY=55×0.1+65×0.2+75×0.16+85×0.54=76.4,Y的方差為DY=(55-76.4)2×0.1+(65-76.4)2×0.2+(75-76.4)2×0.16+(85-76.4)2×0.54=112.04,
由以上的計算結果可以看出,DX 另外,雖然EX 答案二: 花店一天應購進17枝玫瑰花. 理由如下: 若花店一天購進17枝玫瑰花,Y表示當天的利潤(單位:元),那么Y的分布列為: Y的數(shù)學期望為EY=55×0.1+65×0.2+75×0.16+85×0.54=76.4, 由以上的計算結果可以看出,EX 點評本題與實際問題結合,將分段函數(shù)與均值、方差有效的交匯在一起,借助均值做決策的問題,確實是一道非常好的試題,難度不大,但完全征服你有絕對把握嗎? 4. 圍繞正態(tài)分布進行設計 例11 從某企業(yè)的某種產(chǎn)品中抽取500件,測量這些產(chǎn)品的一項質量指標值,由測量結果得如下頻率分布直方圖: (Ⅰ)求這500件產(chǎn)品質量指標值的樣本平均數(shù) x 和樣本方差s2(同一組數(shù)據(jù)用該區(qū)間的中點值作代表). (Ⅱ)由頻率分布直方圖可以認為,這種產(chǎn)品的質量指標值Z服從正態(tài)分布N(?滋, ?啄2),其中?滋近似為樣本平均數(shù) x ,?啄2近似為樣本方差s2. (i)利用該正態(tài)分布,求P(187.8 (ii)某用戶從該企業(yè)購買了100件這種產(chǎn)品,記X表示這100件產(chǎn)品中質量指標值為于區(qū)間(187.8,212.2)的產(chǎn)品件數(shù),利用(i)的結果,求EX. 附:■≈12.2. 若Z~N(?滋,?啄2),則P(?滋-?啄 解析(Ⅰ)抽取產(chǎn)品質量指標值的樣本平均數(shù) x 和樣本方差s2分別為: x =170×0.02+180×0.09+190×0.22+200×0.33+210×0.24+220×0.08+230×0.02=200. s2=(-30)2×0.02+(-20)2×0.09+(-10)2×0.22+0×0.33+(10)2×0.24+(20)2×0.08+(30)2×0.02=150. (Ⅱ)(ⅰ)由(Ⅰ)知Z~N(200, 150),從而 P(187.8 (ⅱ)由(ⅰ)知,一件產(chǎn)品中質量指標值為于區(qū)間(187.8, 212.2)的概率為0.6826. 依題意知X~B(100,0.6826),所以EX=100×0.6826=68.26. 點評正態(tài)分布是重要的命題點之一,2017年高考全國(I)卷的第19題你看過嗎?是一道難得的好題,把正態(tài)分布考到了極致. 今天呢?我們也一定要想到正態(tài)分布可能還會出現(xiàn)絕妙之題. 5. 圍繞綜合應用與知識交匯進行設計 例12 新型冠狀病毒肺炎疫情發(fā)生以來,電子購物平臺成為人們的熱選擇,為提高市場銷售業(yè)績,某公司設計了一套產(chǎn)品促銷方案,并在某地區(qū)部分營銷網(wǎng)點進行試點. 運作一年后,對“采用促銷”和“沒有采用促銷”的營銷網(wǎng)點各選取了50個,對比上一年度的銷售情況,分別統(tǒng)計了它們J的年銷售總額,并按年銷售總額增長的百分點分成5組:[-5,0),[0,5), [5,10), [10,15), [15,20],分別統(tǒng)計后制成如圖所示的頻率分布直方圖,并規(guī)定年銷售總額增長10個百分點及以上的營銷網(wǎng)點為“精英店”. (1)請根據(jù)題中信息填充下面的列聯(lián)表,并判斷是否有99%的把握認為“精英店與采用促銷活動有關”. (2)某“精英店”為了創(chuàng)造更大的利潤,通過分析上一年度的售價xi(單位:元)和日銷yi(單位:件)(i=1,2,…,10)的一組數(shù)據(jù)后決定選擇y=a+bx2作為回歸模型進行擬合. 具體數(shù)據(jù)如下表,表中的wi=xi2(i=1,2,…,10) ①根據(jù)上表數(shù)據(jù)計算a,b的值; ②已知該公司產(chǎn)品的成本為10元/件,促銷費用平均5元/件,根據(jù)所求出的回歸模型,分析售價x定為多少時日利潤z可以達到最大. 附①:K2=■ 附②:對應一組數(shù)據(jù)(u1,v1),(u2,v2),(u3,v3),…,(un,vn),其回歸直線v=α + βu的斜率和截距的最小二乘法估計分別為■=■,■=v- ■■. 解析(1) 因為K2=■≈9.09>6.635. (2)①由公式可得:b=■=-■,a=y-bw=395.5+■×2413.5=1200. 所以回歸方程為y=-■x2+1200. ②若售價為x,單件利潤為x-15,日銷售量為y=-■x2+1200. 故日利潤z=(-■x2+1200)(x-15),z■=-(x+30)(x-40). 當x∈(0, 40)時,z=(-■x2+1200)(x-15)單調遞增; 當x∈(40, +∞)時,z=(-■x2+1200)(x-15)單調遞減, 故當售價x=40時,日利潤達到最大,其值為■元. 點評本題將頻率分布直方圖、獨立性檢驗、線性回歸及函數(shù)綜合在一起,由于題目中本身給出數(shù)據(jù),因此,運算量不大. 但本題的題目較長,求解時,首先要克服心理障礙,讓心理不再排斥它,然后再進行常規(guī)計算,不出意外的話都能產(chǎn)生結論. 例13 一只螞蟻在如圖所示的棱長為1米的正四面體的棱上爬行,每次當它到達四面體頂點后,會在過此頂點的三條棱中等可能的選擇一條棱繼續(xù)爬行(包含來時的棱),已知螞蟻每分鐘爬行1米,t=0時螞蟻位于點A處. (1)2分鐘末螞蟻位于哪點的概率最大; (2)記第n分鐘末螞蟻位于點A,B,C,D的概率分別為Pn(A), Pn(B), Pn(C), Pn(D). ①求證:Pn(B)=Pn(C)=Pn(D). ②辰辰同學認為,一段時間后螞蟻位于點A、B、C、D的概率應該相差無幾,請你通過計算10分鐘末螞蟻位于各點的概率解釋辰辰同學觀點的合理性. 附:(■)9≈5×10-5,(■)10=1.7×10-5,(■)9≈1.9×10-9,(■)10=9.8×10-4. 解析(1)由題可知,在1鐘末螞蟻位于A、B、C、D點的概率分別為0,■,■,■. 故2分鐘末位于A點的概率P(A)=■·■+■·■+■·■=■. 位于B的概率等于P(B)=■·■+■·■=■. 同理,位于C、D的概率也等于■, 故2分鐘末螞蟻位于點A的概率最大. (2)①記第n分鐘末螞蟻位于A、B、C、D點的概率分別為Pn(A)、 Pn(B)、 Pn(C)、 Pn(D),則Bn+1=■(An+Cn+Dn)=■(1-Bn), 同理:Cn+1=■(1-Cn),相減得Bn+1-Cn+1=-■(Bn-Cn), Bn-Cn=(B1-C1)·(-■)n-1,又B1=C1=■,Bn-Cn=0,Bn=Cn, 同理可得Cn=Dn,∴ Bn=Cn=Dn. ②∵ An+1=■(1-An),∴ An+1-■=-■(An-■). ∴數(shù)列{An-■}是公比為-■的等比數(shù)列,A1-■=-■, An-■=(-■)(-■)n-1,An=■+(-■)(-■)n-1, ∴ A10=■+(-■)(-■)9,同理B10=■+(■)(-■)9, ∴ A10-B10=(■+(-■)(-■)9)-(■+(■)(-■)9)=(-■)10≈1.7×10-5. 又∵ Bn=Cn=Dn ,∴ 10分鐘末螞蟻位于A、B、C、D點的概率相差無幾,第n(n>10)分鐘末螞蟻位于A、B、C、D點的概率之差將會更小,所以辰辰的話合理. 點評本題將獨立事件的概率與遞推數(shù)列及數(shù)列運算結合在一起,可以看出第(2)問,基本上就是遞推數(shù)列的有關運算與推理,尚若數(shù)列的有關技能不熟練,即便是概率統(tǒng)計的知識與技能再熟,最終也只能望題興嘆. 關于概率與統(tǒng)計的命題,我們就預測到這里. 請注意:預測與實際命題可能會有距離. 這可能也就是我們與命題專家的區(qū)別,若不準確,請不要怪我們. 要怪,就怪命題專家太狡猾. 【本文系中山市2018年重點課題“高中數(shù)學學科核心素養(yǎng)之數(shù)學建模的教學實踐研究”(項目編號:A2018021)研究成果】 責任編輯 徐國堅