江蘇省高郵市第一中學 薛晉紅
新高考中,統(tǒng)計圖表問題經常以頻率分布直方圖(或條形圖、柱狀圖)、折線圖及扇形圖(或餅狀圖)等幾種形式給出,考查對統(tǒng)計圖表的識別、數據信息的分析、數據信息的處理、統(tǒng)計元素的運算及決策等,出現在各種題型中,難度中等。
加強識圖能力,理解并記準頻率分布直方圖(或條形圖、柱狀圖)與眾數、中位數及平均數的關系;在頻率分布直方圖中,需要注意小矩形的高,小矩形的面積=組距×=頻率,所有小矩形的面積之和為1。
例1為調查禽類某種病菌感染情況,某養(yǎng)殖場每周都定期抽樣檢測禽類血液中A指標的值。養(yǎng)殖場將某周的5 000只家禽血液樣本中A 指標的檢測數據進行整理,繪成如圖1所示的頻率分布直方圖。
圖1
(1)根據頻率分布直方圖,估計這5 000 只家禽血液樣本中A 指標值的中位數(結果保留兩位小數)。
(2)通過長期調查分析可知,該養(yǎng)殖場家禽血液中A 指標的值X服從正態(tài)分布N(7.4,2.632)。
①若其中一個養(yǎng)殖棚有1 000 只家禽,估計其血液樣本中A 指標的值不超過10.03的家禽數量(結果保留整數)。
②在統(tǒng)計學中,把發(fā)生概率小于1%的事件稱為小概率事件,通常認為小概率事件的發(fā)生是不正常的。該養(yǎng)殖場除定期抽檢外,每天還會隨機抽檢20 只,若某天發(fā)現抽檢的20只家禽中恰有3只血液樣本中A 指標的值大于12.66,判斷這一天該養(yǎng)殖場的家禽健康狀況是否正常,并分析說明理由。
參考數據:①0.022 753≈0.000 01,0.977 2517≈0.7;②若X~N(μ,σ2),則P(μ-σ≤X≤μ+σ)≈0.682 7;P(μ-2σ≤X≤μ+2σ)≈0.954 5。
分析:(1)先判斷中位數所在區(qū)間,再設出中位數,利用中位數左側頻率和為0.5 求解即可;(2)①由正態(tài)分布的對稱性及特殊區(qū)間的概率求得P(X≤10.03),再計算家禽數量即可;②先求出P(X>12.66),再由獨立重復實驗的概率公式求出恰有3只血液樣本中A 指標的值大于12.66 的概率,和1%比較作出判斷即可。
解:(1)由2×(0.02+0.06+0.14)=0.44,2×(0.02+0.06+0.14+0.18)=0.8,可得中位數在區(qū)間[7,9)內。
設中位數為x,則2×(0.02+0.06+0.14)+(x-7)×0.18=0.5,解得x≈7.33。
(2)①由X~N(7.4,2.632),可得P(7.4-2.63≤X≤7.4+2.63)=P(4.77≤X≤10.03)≈0.682 7,則P(X≤10.03)=1 000×0.841 35=841.35≈841(只)。
②P(7.4-2×2.63≤X≤7.4+2×2.63)=P(2.14≤X≤12.66)≈0.954 5,,隨機抽檢20 只相當于進行20 次獨立重復實驗,設恰有3只血液樣本中A 指標的值大于12.66為事件B,則P(B)×(1-0.022 75)17≈0.007 98< 1%,所以這一天該養(yǎng)殖場的家禽健康狀況不正常。
點評:根據統(tǒng)計中的頻率分布直方圖(或條形圖、柱狀圖)解決實際問題的步驟:(1)根據頻率分布直方圖(或條形圖、柱狀圖)明確橫軸與縱軸數據的實際含義;(2)了解橫軸和縱軸數據的關系;(3)根據數據解決實際問題。
折線圖中,注意上升或下降趨勢,以及圖形的波動性等情況,同時注意橫軸與縱軸數據的實際含義,以及對應的數值等信息。
例2某校高一年級學生全部參加了體育科目的達標測試,現從中隨機抽取40名學生的測試成績,整理數據并按分數段[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]進行分組,已知測試分數均為整數,現用每組區(qū)間的中點值代替該組中的每個數據,則得到體育成績的折線圖,如圖2所示:
圖2
(1)若體育成績大于或等于70 分的學生為“體育良好”,已知該校高一年級有1 000名學生,試估計該校高一年級學生“體育良好”的人數;
(2)為分析學生平時的體育活動情況,現從體育成績在[60,70)和[80,90)內的樣本學生中隨機抽取2名,求所抽取的2名學生中,至少有1名為“體育良好”的概率;
(3)假設甲,乙,丙三人的體育成績分別為a,b,c,且a∈[60,70),b∈[70,80),c∈[80,90),當三人的體育成績的方差s2最小時,寫出a,b,c的值(不要求證明)。
分析:(1)體育成績大于或等于70 分的學生有30人,由此能估計該校高一年級學生“體育良好”的人數;(2)體育成績在[60,70)內的有2 名學生,在[80,90)內的有3 名學生,設“至少有1名學生體育良好”為事件A,從體育成績在[60,70)和[80,90)內的樣本學生中隨機抽取2 人,利用組合確定基本事件總數n與事件A包含的基本事件個數m,由此能求出所抽取的2名學生中,至少有1 人為“體育良好”的概率;(3)當數據a,b,c的方差s2最小時,a=69,b=74,c=80或a=69,b=75,c=80。
解:(1)體育成績大于或等于70 分的學生有30 人,所以估計該校高一年級學生“體育良好”的人數為
(2)體育成績在[60,70)內的有2 名學生,在[80,90)內的有3名學生,設“至少有1名學生為體育良好”為事件A,從體育成績在[60,70)和[80,90)內的樣本學生中隨機抽取2人,基本事件總數,事件A包含的基本事件個數,則所抽取的2 名學生中,至少有1 名學生為“體育良好”的概率
(3)當數據a,b,c的方差s2最小時,a=69,b=74,c=80或a=69,b=75,c=80。
點評:根據折線統(tǒng)計圖來解決實際問題的具體步驟:(1)根據折線統(tǒng)計圖明確橫軸與縱軸數據的實際含義;(2)了解橫軸和縱軸數據的關系與數值;(3)根據數據信息來解決實際問題。
扇形圖(或餅狀圖)中,注意數據所對應的實際含義,經常根據需要,數據可先用表格列出,再分析、計算、判斷。
例3據報道,2019年全球進行了102次航天發(fā)射,發(fā)射航天器492個。中國以34次航天發(fā)射蟬聯榜首,美國、俄羅斯分列第二和第三位。2019 年全球發(fā)射的航天器按質量m(單位:kg)可分為六類:Ⅰ類(0≤m<50),Ⅱ類(50≤m<200),Ⅲ類(200≤m<500),Ⅳ類(500≤m<1 000),Ⅴ類(1 000≤m<5 000),Ⅵ類(m≥5 000),其中Ⅰ類航天器仍然保持較高的活躍度,但整體的發(fā)射熱度相較2018年有所降低,發(fā)射數量仍以較大優(yōu)勢排名榜首,總數達到191個,占比下降到38.8%:而Ⅱ類和Ⅲ類航天器由于低軌寬帶星座部署改變,發(fā)射衛(wèi)星數量均實現大幅增長。根據2019 年全球發(fā)射航天器數量按質量分類得到如圖3所示的餅形圖,假設2021年全球共計劃發(fā)射500 個航天器,且航天器數量按質量分布比例與2019年相同。
(1)利用該餅狀圖,估計2021 年發(fā)射的航天器中Ⅳ類,Ⅴ類,Ⅵ類的個數。
(2)由(1)的計算,采用分層抽樣的方法,從Ⅳ類,Ⅴ類這兩類中抽取6 個航天器。根據研究需要,要從這6個航天器中隨機抽取2個航天器作研究,求這2 個航天器來自不同類航天器的概率。
分析:(1)通過扇形圖中的數據分析,直接利用“頻數=頻率×樣本容量”分別求解即可;(2)由(1)可知,抽取的6個航天器中Ⅳ類有2個,記作a,b,Ⅴ類的有4 個,記作1,2,3,4,然后用列舉法求出總基本事件數,再求解事件的基本事件數,最后由概率公式求解即可。
解:(1)由題意可知,500×4.4%=22,500×8.8%=44,500×6.6%=33,所以估計2021年發(fā)射的航天器中Ⅳ類,Ⅴ類,Ⅵ類的個數分別為22,44,33。
圖3
(2)由(1)可知,抽取的Ⅳ類與Ⅴ類航天器的比例為1∶2,所以抽?、纛惡教炱?×(個),Ⅴ類航天器(個),記抽取的2個Ⅳ類航天器為a,b,4個Ⅴ類航天器為1,2,3,4,則從這6個航天器中隨機抽取2個航天器作研究,所有的基本事件為ab,a1,a2,a3,a4,b1,b2,b3,b4,12,13,14,23,24,34,共15個,記事件A=“這2 個航天器來自不同類航天器”,則事件A包含8個基本事件,所以
點評:根據扇形統(tǒng)計圖來解決實際問題的具體步驟為:(1)根據扇形統(tǒng)計圖明確所給扇形部分占總體圓形的百分比;(2)了解每部分扇形數據的實際意義;(3)根據數據解決實際問題。
其實,涉及統(tǒng)計圖表的數據分析與應用主要表現在:(1)圖表的比較信息,確定不同數據的結果情況;(2)圖表的數據信息與統(tǒng)計信息,通過識圖、讀圖,從圖表中獲取數據信息并加以統(tǒng)計,從而通過這些統(tǒng)計表或圖給出相應的統(tǒng)計信息,或通過相應的統(tǒng)計信息求解這些統(tǒng)計表或圖等。