姚踐紅
統(tǒng)計是高中數(shù)學的重要內(nèi)容之一,也是新高考的必考知識點。高考主要考查隨機抽樣,考查用樣本估計總體等。下面舉例分析,供同學們學習與提高。
題型一:簡單隨機抽樣
用簡單隨機抽樣抽取樣本的依據(jù):總體中的個體之間無明顯差異;總體中個體數(shù)N有限;抽取的樣本個體數(shù)n小于總體中的個體數(shù)N;逐個不放回地抽取;每個個體被抽到的可能性均為2。一個抽樣試驗?zāi)芊裼贸楹灧?,關(guān)鍵看兩點:一是制簽是否方便;二是個體之間差異不明顯。當總體容量較大、樣本容量不大時,用隨機數(shù)法抽取樣本較好
例1 下列5個抽樣中,簡單隨機抽樣的序號是。
①從無數(shù)個個體中抽取50個個體作為樣本;②倉庫中有1萬支奧運火炬,從中一次性抽取100支火炬進行質(zhì)量檢查;③一彩民選號,從裝有36個大小、形狀都相同的號簽的盒子中無放回地抽出6個號簽;④箱子里共有100個零件,從中選出10個零件進行質(zhì)量檢驗,在抽樣操作中,從中任意取出1個零件進行質(zhì)量檢驗后,再把它放回箱子里。
解:根據(jù)簡單隨機抽樣的特點逐個判斷。①不是簡單隨機抽樣,因為簡單隨機抽樣要求被抽取的樣本總體的個數(shù)是有限的。②不是簡單隨機抽樣,雖然“一次性抽取”和“逐個抽取”不影響個體被抽到的可能性,但簡單隨機抽樣要求的是“逐個抽取”。③是簡單隨機抽樣,因為總體中的個體數(shù)是有限的,并且是從總體中逐個進行抽取的,是不放回、等可能的抽樣。④不是簡單隨機抽樣,因為它是有放回抽樣。答案為③。
題型二:分層隨機抽樣
使用分層隨機抽樣的原則:將相似的個體歸入一類,即為一層,要求每層的各個個體互不交叉,即遵循不重復、不遺漏的原則;為保證每個個體等可能入樣,需遵循在各層中進行簡單隨機抽樣,使每層樣本數(shù)量與每層個體數(shù)量的比等于抽樣比。
例2 某校500名學生中,O型血有200人,A型血有125人,B型血有125人,AB型血有50人,為了研究血型與色弱的關(guān)系,需從中抽取一個容量為20的樣本。按照比例分配的分層隨機抽樣方法抽取樣本,各種血型的人分別抽多少?
解:
故O型血抽8人,A型血抽5人,B型血抽5人,AB型血抽2人。
題型三:獲取數(shù)據(jù)的途徑
獲取數(shù)據(jù)的途徑一般有四種:調(diào)查,試驗,觀察和查詢。在應(yīng)用以上四種方式獲取數(shù)據(jù)時,要清楚數(shù)據(jù)的類型,選擇適當?shù)墨@取方式。
例3 為了緩解城市的交通擁堵情況,某市準備出臺限制私家車的政策,為此要進行民意調(diào)查。某個調(diào)查小組調(diào)查了一些擁有私家車的市民,你認為這樣的調(diào)查結(jié)果能很好地反映該市市民的意愿嗎?
解:一個城市的交通狀況的好壞將直接影響著生活在這個城市里的每個人,關(guān)系到每個人的利益。為了調(diào)查這個問題,在抽樣時應(yīng)當關(guān)注到各種人群,既要抽到擁有私家車的市民,也要抽到?jīng)]有私家車的市民。
如果只對擁有私家車的市民進行調(diào)查,結(jié)果一定是片面的,不能代表所有市民的意愿。因此,要對生活在該城市的所有市民進行隨機地抽樣調(diào)查,不要只關(guān)注到擁有私家車的市民。
題型四:頻率分布直方圖的應(yīng)用
頻率分布指的是一個樣本數(shù)據(jù)在各個小范圍內(nèi)所占比例的大小,一般用頻率分布直方圖反映樣本的頻率分布。頻率分布直方圖中的縱軸表示;頻率分布直方圖中各個組距小長方形的面積等于頻率,各個小長方形的面積之和為1;各個小長方形的高的比就是頻率之比。
例4 為了迎接某市作為全國文明城市的復查,愛衛(wèi)會隨機抽取了60位路人進行問卷調(diào)查,調(diào)查項目是自己對該市各方面衛(wèi)生情況的滿意度(假設(shè)被問卷的路人回答是客觀的),以分數(shù)表示問卷結(jié)果,并統(tǒng)計他們的問卷分數(shù),把其中不低于50分的分成五段:[50,60),[60,70),···,[90,100]后畫出如圖1所示的部分頻率分布直方圖,觀察圖形信息,回答下列問題。
(1)求出問卷調(diào)查分數(shù)低于50分的被問卷人數(shù)。
(2)估計全市市民滿意度在60分及以上的百分比。
解:(1)因為各組的頻率之和等于1,所以低于50分的頻率為f=1—(0.015x2+0.03+0.025+0.005)x10=0.1,故低于50分的人數(shù)為60x0.1=6。
(2)依題意可知,60分及以上的頻率和為(0.015+0.03+0.025+0.005)x10=0.75,所以抽樣滿意度在60分及以上的百分比為75%。
于是可以估計全市市民滿意度在60分及以上的百分比為75%。
題型五:百分位數(shù)的計算
一般地,一組數(shù)據(jù)的第p百分位數(shù)是這樣一個值,它使得這組數(shù)據(jù)中至少有p%的數(shù)據(jù)小于或等于這個值,且至少有(100—p)%的數(shù)據(jù)大于或等于這個值。計算一組n個數(shù)據(jù)的第p百分位數(shù)的三個步驟:第1步,按從小到大排列原始數(shù)據(jù);第2步,計算i=nxp%;第3步,若i不是整數(shù),而大于i的比鄰整數(shù)為j,則第p百分位數(shù)為第j項數(shù)據(jù);若i是整數(shù),則第p百分位數(shù)為第i項與第(i+1)項數(shù)據(jù)的平均數(shù)。利用頻率分布直方圖求百分位數(shù)的方法:百分位數(shù)表示左側(cè)小矩形的面積之和,先確定在哪個區(qū)間,再從左到右計算所有小矩形的面積和,百分位數(shù)所在區(qū)間需按照對應(yīng)邊比例計算面積。
例5 某中學舉行電腦知識競賽,現(xiàn)將高一參賽學生的成績進行整理后分成五組繪制成如圖2所示的頻率分布直方圖,已知圖中從左到右的第一、二、三、四、五小組的頻率分別是0.3,0.4,0.15,0.1,0.05。
求高一參賽學生成績的第60百分位數(shù)。
解:由圖知第1個小矩形的面積為0.3,第2個小矩形的面積為0.4,則第60百分位數(shù)一定位于[60,70)內(nèi)。因為60+10x0.6-0.3=67.5,所以估計高一參賽學生成績0.7-0.3的第60百分位數(shù)約為67.5。
題型六:眾數(shù)、中位數(shù)、平均數(shù)的計算
眾數(shù)、中位數(shù)及平均數(shù)都是描述一組數(shù)據(jù)集中趨勢的量。平均數(shù)的大小與一組數(shù)據(jù)里每個數(shù)的大小均有關(guān)系,任何一個數(shù)據(jù)的變動都會引起平均數(shù)的變動。眾數(shù)考查各數(shù)出現(xiàn)的頻率,其大小與這組數(shù)據(jù)中部分數(shù)據(jù)有關(guān),當一組數(shù)據(jù)中有不少數(shù)據(jù)重復出現(xiàn)時,其眾數(shù)往往更能反映問題。中位數(shù)僅與數(shù)據(jù)的排列位置有關(guān),某些數(shù)據(jù)的變動對中位數(shù)沒有影響,中位數(shù)可能出現(xiàn)在所給數(shù)據(jù)中,也可能不在所給數(shù)據(jù)中,當一組數(shù)據(jù)中個別數(shù)據(jù)較大時,可用中位數(shù)描述這組數(shù)據(jù)的集中趨勢。
例6 某公司的33名職工的月工資(以元為單位)如表1所示。
(1)求該公司職工月工資的平均數(shù)、中位數(shù)、眾數(shù)。
(2)假設(shè)副董事長的工資從5000元提升到20000元,董事長的工資從5500元提升到30000元,那么新的平均數(shù)、中位數(shù)、眾數(shù)又是多少?(精確到元)
(3)你認為哪個統(tǒng)計量更能反映這個公司員工的工資水平?結(jié)合此問題談一談你的看法。
解:(1)平均數(shù)是x=1/3x(5500x1+5000x1+3500x2+3000x1+2500x5+ 2000x3+1500x20)≈2091(元),中位數(shù)是1500元,眾數(shù)是1500元。
(2)新的平均數(shù)是x=1/33)x(30 000x 1+20000x1+3500x2+3000x1+ 2500x5+2000x3+1500x20)≈3 288 (元),新的中位數(shù)是1500元,新的眾數(shù)是1500元。
(3)在這個問題中,中位數(shù)或眾數(shù)均能反映該公司員工的工資水平。因為公司中少數(shù)人的工資與大多數(shù)人的工資差別較大,這樣導致平均數(shù)與中位數(shù)偏差較大,所以平均數(shù)不能反映這個公司員工的工資水平。
題型七:
例7 從甲、乙兩種玉米苗中各抽10株,分別測得它們的株高(單位:cm)如下。
甲:25,41,40,37,22,14,19,39,21,42。乙:27,16,44,27,44,16,40,40,16,40。
(1)哪種玉米苗長得高?
(2)哪種玉米苗長得齊?
解:
題型八:利用頻率分布直方圖求眾數(shù)、中位數(shù)、平均數(shù)
頻率分布直方圖的數(shù)字特征:眾數(shù)一般用頻率分布表中頻率最高的一組的組中值來顯示,在樣本數(shù)據(jù)的頻率分布直方圖中,眾數(shù)是最高小矩形的底邊中點的橫坐標;在頻率分布直方圖中,中位數(shù)就是頻率分布直方圖面積的一半所對應(yīng)的橫坐標,中位數(shù)左邊和右邊的直方圖的面積相等;平均數(shù)等于每個小矩形的高乘以底邊中點的橫坐標之和。
例8 從高三抽出50名學生參加數(shù)學競賽,由成績得到的頻率分布直方圖,如圖3。
由于一些數(shù)據(jù)丟失,試利用頻率分布直方圖求:
(1)這50名學生成績的眾數(shù)與中位數(shù)。(2)這50名學生的平均成績。
解:(1)由眾數(shù)的概念可知,眾數(shù)是出現(xiàn)次數(shù)最多的數(shù)。在頻率分布直方圖中,最高的小長方形的底邊中點的橫坐標即為眾數(shù),所以眾數(shù)應(yīng)為75。
由于中位數(shù)是所有數(shù)據(jù)中的中間值,故在頻率分布直方圖中體現(xiàn)的是中位數(shù)的左右兩邊頻數(shù)應(yīng)相等,即頻率也相等,從而就是小矩形的面積和相等。因此在頻率分布直方圖中將所有小矩形的面積一分為二的垂直于橫軸的直線與橫軸交點的橫坐標所對應(yīng)的成績即為所求。因為0.004x10+0.006x10+0.02x10=0.04+0.06+0.2=0.3,所以前三個小矩形面積的和為0.3。而第四個小矩形面積為0.03x10=0.3,0.3+0.3>0.5,所以中位數(shù)應(yīng)位于第四個小矩形內(nèi)。設(shè)其底邊為x,則高為0.03。令0.03x=0.2,可得x≈6.7。故中位數(shù)約為70+6.7=76.7。
(2)樣本平均值應(yīng)是頻率分布直方圖的“重心”,即所有數(shù)據(jù)的平均值,也就是每個小矩形底邊中點的橫坐標乘以每個小矩形的面積之和。
所以平均成績?yōu)?5x(0.004x10)+55x(0.006x10)+65x(0.02x10)+75x (0.03x10)+85x(0.024x10)+95x (0.016x10)=76.2。
題型九:動態(tài)樣本的平均數(shù)、方差問題
利用動態(tài)樣本求平均數(shù)、方差的策略:平均數(shù)、方差的基本公式不變,但要注意變化前后的關(guān)系;適當結(jié)合平均數(shù)、方差的意義進行估值。
例9
解:
應(yīng)選A。
題型十:其他統(tǒng)計圖表中反映的集中趨勢與離散程度
若x1,x2,x3,·,x。的平均數(shù)為x,方差為s2,則ax1+b,ax2+b,ax3+b,··,axn+b 的平均數(shù)為x'=a元+b,方差為s2=a2s2。標準差刻畫了數(shù)據(jù)的離散程度或波動幅度,標準差越大,數(shù)據(jù)的離散程度越大;標準差越小,數(shù)據(jù)的離散程度越小。顯然,在刻畫數(shù)據(jù)的分散程度上,方差和標準差是一樣的,但在解決實際問題中,一般多采用標準差。
例10 如圖4,圖5,樣本A和B分別取自兩個不同的總體,它們的樣本平均數(shù)分別為xA和B,樣本標準差分別為SA和sB,則()。
解:觀察圖形可得,樣本A的數(shù)據(jù)均小于或等于10,樣本B的數(shù)據(jù)均大于或等于10,故xA
作者單位:河南省許昌實驗中學
(責任編輯郭正華)