四川省綿陽實驗高級中學(xué) 劉林強
通過對近幾年的高考概率統(tǒng)計解答題進行分析,其命題不斷強化應(yīng)用意識的考查,這也是新高考改革的必然趨勢。概率與統(tǒng)計作為高考的熱點之一,其往往以實際問題為背景,考查統(tǒng)計或概率的相關(guān)計算。復(fù)習(xí)時,我們應(yīng)多關(guān)注其命題新動向。
統(tǒng)計案例分析問題通常是給出解題所需的公式,此類問題考查同學(xué)們的數(shù)據(jù)處理能力和運算求解能力。要求同學(xué)們能正確使用公式進行運算、變形和數(shù)據(jù)處理,能根據(jù)題意尋找合理、簡捷的運算途徑,并會對數(shù)據(jù)進行近似和估計計算。
例1(2022年安徽蚌埠一模)文旅部門統(tǒng)計了某網(wǎng)紅景點在2022年3月至7月的旅游收入y(單位:萬),得到表1中的數(shù)據(jù):
表1
(1)根據(jù)表中所給數(shù)據(jù),用相關(guān)系數(shù)r加以判斷,是否可用線性回歸模型擬合y與x的關(guān)系? 若可以,求出y關(guān)于x之間的線性回歸方程;若不可以,請說明理由。
(2)為調(diào)查游客對該景點的評價情況,隨機抽查了200 名游客,得到如表2 所示的列聯(lián)表,請?zhí)顚懕?,依據(jù)α=0.001 的獨立性檢驗,能否認為“游客是否喜歡該網(wǎng)紅景點與性別有關(guān)聯(lián)”。
附參考公式、參考數(shù)據(jù)及表3:相關(guān)系數(shù)
表2
表3 (臨界值)
(2)2×2列聯(lián)表如表4所示:
表4
假設(shè)H0:游客是否喜歡該網(wǎng)紅景點與性別無關(guān)聯(lián),根據(jù)表4 中的數(shù)據(jù)可得,χ2==x0.001,依據(jù)小概率值α=0.001的獨立性檢驗,我們推斷H0不成立,即游客是否喜歡該網(wǎng)紅景點與性別有關(guān)聯(lián)。
評注:高考中的線性回歸問題,主要考查同學(xué)們的數(shù)據(jù)處理能力,線性回歸和相關(guān)系數(shù)的公式一般會在考題中給出,但需要同學(xué)們能對公式進行準確的變形,靈活處理相關(guān)數(shù)據(jù)。對于分類變量的關(guān)系,也就是獨立性檢驗問題,若利用公式計算出的K2越大,則說明兩個分類變量的關(guān)系越強;反之,關(guān)系越弱。
為了考查總體的分布情況,通常是從總體中抽取一個樣本,用樣本的分布情況去估計總體的分布情況。這種估計大體分為兩類:用樣本的頻率分布估計總體的分布;用樣本的數(shù)字特征估計總體的數(shù)字特征。
例2(2022年黑龍江哈爾濱模擬)我國發(fā)表的《人類減貧的中國實踐》白皮書提到占世界人口近五分之一的中國全面消除絕對貧困,提前10 年實現(xiàn)減貧目標,為了鞏固脫貧成果,哈爾濱市某地區(qū)積極引導(dǎo)人們種植一種名貴中藥材,并成立藥材加工廠對該藥材進行切片加工,包裝成袋出售,已知這種袋裝中藥的質(zhì)量以某項指標值k(40≤k≤100)為衡量標準,k值越大,質(zhì)量越好,該質(zhì)量指標值的等級及出廠價如表5所示:
表5
該藥材加工廠為了解生產(chǎn)這種袋裝中藥的經(jīng)濟效益,從所生產(chǎn)的這種袋裝中藥中隨機抽取了1 000袋,測量了每袋中藥成品的k值,得到如圖1所示的頻率分布直方圖。
(1)視頻率為概率,求該藥材加工廠所生產(chǎn)的袋裝中藥成品的質(zhì)量指標值k的平均數(shù)(同一組中的數(shù)據(jù)用該組區(qū)間中點值作代表)。
圖1
(2)現(xiàn)從質(zhì)量指標值為[60,80)中分層抽取6袋,某人在6袋中抽取2袋,已知其中一袋的質(zhì)量指標值在[60,70)內(nèi)的條件下,求另一袋的質(zhì)量指標值在[70,80)內(nèi)的概率。
(3)假定該中藥加工廠一年的袋裝中藥的產(chǎn)量為10 萬袋,且全部都能銷售出去,若每袋袋裝中藥的成本為90元,工廠的設(shè)備投資為200萬元,試問:該中藥加工廠是否有可能在一年內(nèi)通過加工該袋裝中藥收回投資?并說明理由。
解析:(1)由題意可得平均數(shù)為ˉk=45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71,所以可以估計該中藥加工廠生產(chǎn)的袋裝中藥的指量指標值的平均數(shù)為71。
(2)從質(zhì)量指標值為[60,80)中分層抽取6袋,則在質(zhì)量指標值為[60,70)內(nèi)抽取6×(袋),設(shè)為a,b;在質(zhì)量指標值為[70,80)內(nèi)抽取(袋),設(shè)為C,D,E,F。某人在6袋中抽取2袋,已知其中一袋的質(zhì)量指標值在[60,70)內(nèi),基本事件有(a,b),(a,C),(a,D),(a,E),(a,F),(b,C),(b,D),(b,E),(b,F),共9個,其中一袋的質(zhì)量指標值在[60,70)內(nèi)的條件下,另一袋的質(zhì)量指標值在[70,80)內(nèi)包含的基本事件有(a,C),(a,D),(a,E),(a,F),(b,C),(b,D),(b,E),(b,F),共8個,所以其中一袋的質(zhì)量指標值在[60,70)內(nèi)的條件下,另一袋的質(zhì)量指標值在[70,80)內(nèi)的概率為
(3)設(shè)每袋袋裝中藥的銷售利潤為z元,則樣本中每袋的平均利潤為z=10×0.25+30×0.45+60×0.25+100×0.05=36(元/袋),利用樣本平均數(shù)估計總體平均數(shù)可得該廠一年內(nèi)生產(chǎn)該袋裝中藥的盈利約為36×100 000=3 600 000(元)=360 (萬元)。
因為360 萬元>200 萬元,所以該中藥加工廠有可能在一年內(nèi)通過加工該袋裝中藥收回投資。
評注:利用頻率分布直方圖來估計總體是用樣本的頻率分布去估計總體分布的重要方法,在頻率分布直方圖中,各小長方形的面積表示相應(yīng)各組的頻率,所以所有小長方形的面積的和等于1。
概率問題的復(fù)習(xí)中應(yīng)注意弄清題意,找出關(guān)鍵詞和破題點,區(qū)分清楚各種概率模型及適用范圍。教材中有兩個重要概率分布:超幾何分布和二項分布,要注意二項分布與超幾何分布的區(qū)別:二項分布是有放回的抽樣,超幾何分布是不放回的抽樣。
例3(2022年廣東廣州高三一模)某從事智能教育技術(shù)研發(fā)的科技公司開發(fā)了一個“AI作業(yè)”項目,并且在甲、乙兩個學(xué)校的高一學(xué)生中做用戶測試。經(jīng)過一個階段的試用,為了解“AI作業(yè)”對學(xué)生學(xué)習(xí)的促進情況,該公司隨機抽取了200名學(xué)生,對他們的“向量數(shù)量積”知識點掌握的情況進行調(diào)查,樣本調(diào)查結(jié)果如6表所示:
表6
假設(shè)每位學(xué)生是否掌握“向量數(shù)量積”知識點相互獨立。
(1)從樣本中隨機抽取2 名學(xué)生沒有掌握“向量數(shù)量積”知識點的學(xué)生,用ξ表示抽取的2名學(xué)生中使用“AI作業(yè)”的人數(shù),求ξ的分布列和數(shù)學(xué)期望;
(2)用樣本頻率估計概率,從甲校高一學(xué)生中抽取1 名使用“AI作業(yè)”的學(xué)生和1 名不使用“AI作業(yè)”的學(xué)生,用“X=1”表示該名使用“AI作業(yè)”的學(xué)生基本掌握了“向量數(shù)量積”,用“X=0”表示該名使用“AI作業(yè)”的學(xué)生沒有掌握“向量數(shù)量積”,用“Y=1”表示該名不使用“AI作業(yè)”的學(xué)生基本掌握了“向量數(shù)量積”,用“Y=0”表示該名不使用“AI作業(yè)”的學(xué)生沒有掌握“向量數(shù)量積”。比較方差D(X)和D(Y)的大小關(guān)系。
解析:(1)依題意,沒有掌握“向量數(shù)量積”知識點的學(xué)生有60人,其中,使用“AI作業(yè)”的人數(shù)為20人,不使用“AI作業(yè)”的人數(shù)為40,所以ξ的所有可能取值為0,1,2,且
所以ξ的分布列為表7:
表7
評注:本題主要考查超幾何分布和二項分布。超幾何分布描述的是不放回抽樣問題,隨機變量為抽到的某類個體的個數(shù)。在根據(jù)獨立重復(fù)試驗求二項分布的有關(guān)問題時,關(guān)鍵是確定二項分布的試驗次數(shù)n和變量的概率。
統(tǒng)計與概率在高考中既考查核心知識,也考查知識點的覆蓋面。在近幾年的高考中就出現(xiàn)了條件概率和正態(tài)分布的問題,因此,在復(fù)習(xí)中不能忽視對所謂的“冷門知識”的復(fù)習(xí),如正態(tài)分布、條件概率、相關(guān)系數(shù)、殘差圖、擬合效果等。
例4(2022年山東濰坊高三模擬)冬奧會的成功舉辦極大鼓舞了人們體育強國的熱情,掀起了青少年鍛煉身體的熱潮。某校為了解全校學(xué)生“體能達標”的情況,從高三年級1 000 名學(xué)生中隨機選出40 名學(xué)生參加“體能達標”測試,并且規(guī)定“體能達標”預(yù)測成績小于60 分的為“不合格”,否則為合格。若高三年級“不合格”的人數(shù)不超過總?cè)藬?shù)的5%,則該年級體能達標為“合格”;否則該年級體能達標為“不合格”,需要重新對高三年級學(xué)生加強訓(xùn)練?,F(xiàn)將這40 名學(xué)生隨機分成甲、乙兩個組,其中甲組有24名學(xué)生,乙組有16名學(xué)生。經(jīng)過預(yù)測后,兩組各自將預(yù)測成績統(tǒng)計分析如下:甲組的平均成績?yōu)?0,標準差為4;乙組的平均成績?yōu)?0,標準差為6。(數(shù)據(jù)的最后結(jié)果都精確到整數(shù))
(1)求這40名學(xué)生測試成績的平均分和標準差s。
(2)假設(shè)高三學(xué)生的體能達標預(yù)測成績服從正態(tài)分布N(μ,σ2),用樣本平均數(shù)作為μ的估計值,用樣本標準差s作為σ的估計值。請利用估計值估計,高二學(xué)生體能達標預(yù)測是否“合格”。
(3)為增強趣味性,在體能達標的跳繩測試項目中,同學(xué)們可以向體育特長班的強手發(fā)起挑戰(zhàn)。每場挑戰(zhàn)賽都采取七局四勝制,積分規(guī)則如下:以4∶0或4∶1獲勝隊員積4分,落敗隊員積0分;以4∶2或4∶3獲勝隊員積3分,落敗隊員積1 分。假設(shè)體育生王強每局比賽獲勝的概率均為,求王強在這輪比賽中所得積分為3 分的條件下,他前3局比賽都獲勝的概率。
附:①n個數(shù)的方差②若隨機變量Z~N(μ,σ2),則P(μ-σ<Z<μ+σ)=0.682 6,P(μ-2σ<Z<μ+2σ)=0.954 4,P(μ-3σ<Z<μ+3σ)=0.997 4。
(2)由=74,s≈7,得μ的估計值μ=74,σ的估計值
因為P(μ-2σ<X<μ+2σ)=P(60<X<88)=0.954 4,所以P(X<60)=P(X
所以高三年級1 000 名學(xué)生中,不合格的有1 000×0.022 8≈23(人),又,所以高三年級學(xué)生體能達標為“合格”。
評注:正態(tài)分布是一種重要的分布,尤其是正態(tài)分布的3σ原則在復(fù)習(xí)時要注意。在解決條件概率問題時要分析幾個事件間的先后順序,以及先發(fā)生事件的概率對后發(fā)生事件的概率產(chǎn)生如何的影響(即后發(fā)生的事件算的是條件概率),同時根據(jù)隨機變量的不同取值,事件發(fā)生的過程會有所不同,要注意區(qū)別。
概率與統(tǒng)計解答題的文字閱讀量通常比較大,這是高考命題的主要方向。復(fù)習(xí)時應(yīng)注意把握命題動向,逐步形成解題四大步驟:讀題提取關(guān)鍵信息、析題形成解題思路、解題示范規(guī)范表達、反思積淀解題方法,同時書寫要規(guī)范,這樣在解決概率統(tǒng)計問題時才能得心應(yīng)手。
中學(xué)生數(shù)理化(高中版.高考數(shù)學(xué))2023年3期