李琳
要點(diǎn)一、隨機(jī)抽樣
(一)要點(diǎn)整合
1.簡(jiǎn)單隨機(jī)抽樣
(1)定義:一般地,設(shè)一個(gè)總體含有N個(gè)個(gè)體,從中逐個(gè)不放回地抽取n個(gè)個(gè)體作為樣本(n≤N),如果每次抽取時(shí)總體內(nèi)的各個(gè)個(gè)體被抽到的機(jī)會(huì)都相等,就把這種抽樣方法叫做簡(jiǎn)單隨機(jī)抽樣.這樣抽取的樣本,叫做簡(jiǎn)單隨機(jī)樣本.
(2)常用方法:抽簽法和隨機(jī)數(shù)法.
2.分層抽樣
(1)在抽樣時(shí),將總體分成互不交叉的層,然后按照一定的比例,從各層獨(dú)立地抽取一定數(shù)量的個(gè)體,將各層取出的個(gè)體合在一起作為樣本,這種抽樣方法是一種分層抽樣.
(2)分層抽樣的應(yīng)用范圍:當(dāng)總體是由差異明顯的幾個(gè)部分組成時(shí),往往選用分層抽樣.
3.系統(tǒng)抽樣
(1)定義:當(dāng)總體中的個(gè)體數(shù)較多時(shí),可以將總體分成均衡的幾部分,然后按照預(yù)先制定的規(guī)則,從每一部分抽取一個(gè)個(gè)體,得到所需的樣本,這種抽樣的方法叫做系統(tǒng)抽樣.
(2)系統(tǒng)抽樣的步驟:假設(shè)要從容量為N的總體中抽取容量為n的樣本.
①先將總體的N個(gè)個(gè)體編號(hào);
②確定分段間隔k,對(duì)編號(hào)進(jìn)行分段.當(dāng)Nn(n是樣本容量)是整數(shù)時(shí),取k=Nn;
當(dāng)總體中的個(gè)體數(shù)不能被樣本容量整除時(shí),可先用簡(jiǎn)單隨機(jī)抽樣的方法從總體中剔除幾個(gè)個(gè)體,使剩下的個(gè)體數(shù)能被樣本容量整除,然后再按系統(tǒng)抽樣進(jìn)行.這時(shí)在整個(gè)抽樣過程中每個(gè)個(gè)體被抽取的可能性仍然相等.
③在第1段用簡(jiǎn)單隨機(jī)抽樣確定第一個(gè)個(gè)體編號(hào)l(l≤k);
④按照一定的規(guī)則抽取樣本.通常是將l加上間隔k得到第2個(gè)個(gè)體編號(hào)l+k,再加k得到第3個(gè)個(gè)體編號(hào)l+2k,依次進(jìn)行下去,直到獲取整個(gè)樣本.
(二)常用結(jié)論
(1)不論哪種抽樣方法,總體中的每一個(gè)個(gè)體入樣的概率都是相同的.
(2)系統(tǒng)抽樣一般也稱為等距抽樣,入樣個(gè)體的編號(hào)相差分段間隔k的整數(shù)倍.
(3)分層抽樣是按比例抽樣,每一層入樣的個(gè)體數(shù)為該層的個(gè)體數(shù)乘抽樣比.
(4)三種抽樣方法的特點(diǎn)、聯(lián)系及適用范圍
類別共同點(diǎn)各自特點(diǎn)聯(lián)系適用范圍
簡(jiǎn)單隨機(jī)抽樣
系統(tǒng)抽樣
分層抽樣①抽樣過程中每個(gè)個(gè)體被抽到的可能性相等;
②每次抽出個(gè)體后不再將它放回,即不放回抽樣
從總體中逐個(gè)抽取總體個(gè)數(shù)較少
將總體均分成幾部分,按預(yù)先定出的規(guī)則在各部分中抽取在起始部分取樣時(shí),采用簡(jiǎn)單隨機(jī)抽樣總體個(gè)數(shù)較多
將總體分成幾層,分層進(jìn)行抽取各層抽樣時(shí),采用簡(jiǎn)單隨機(jī)抽樣或系統(tǒng)抽樣總體由差異明顯的幾部分組成
(三)考向舉例
1.簡(jiǎn)單隨機(jī)抽樣
例1?下列抽取樣本的方式屬于簡(jiǎn)單隨機(jī)抽樣的個(gè)數(shù)有(??)個(gè).
①?gòu)臒o(wú)限多個(gè)個(gè)體中抽取100個(gè)個(gè)體作為樣本;
②盒子里共有80個(gè)零件,從中選出5個(gè)零件進(jìn)行質(zhì)量檢驗(yàn).在抽樣操作時(shí),從中任意拿出一個(gè)零件進(jìn)行質(zhì)量檢驗(yàn)后再把它放回盒子里;
③用抽簽方法從10件產(chǎn)品中選取3件進(jìn)行質(zhì)量檢驗(yàn);
④某班有56名同學(xué),指定個(gè)子最高的5名同學(xué)參加學(xué)校組織的籃球賽.
解析:①不是簡(jiǎn)單隨機(jī)抽樣,因?yàn)楸怀槿颖镜目傮w的個(gè)數(shù)是無(wú)限的,而不是有限的;②不是簡(jiǎn)單隨機(jī)抽樣,因?yàn)樗怯蟹呕爻闃?③明顯為簡(jiǎn)單隨機(jī)抽樣;④不是簡(jiǎn)單隨機(jī)抽樣,因?yàn)椴皇堑瓤赡艹闃?答案:1個(gè)
點(diǎn)撥:應(yīng)用簡(jiǎn)單隨機(jī)抽樣應(yīng)注意的問題
(1)一個(gè)抽樣試驗(yàn)?zāi)芊裼贸楹灧?,關(guān)鍵看兩點(diǎn):一是抽簽是否方便;二是號(hào)簽是否易攪勻.一般地,當(dāng)總體容量和樣本容量都較小時(shí)可用抽簽法.
(2)在使用隨機(jī)數(shù)法時(shí),如遇到三位數(shù)或四位數(shù),可從選擇的隨機(jī)數(shù)表中的某行某列的數(shù)字計(jì)起,每三個(gè)或四個(gè)作為一個(gè)單位,自左向右選取,有超過總體號(hào)碼或出現(xiàn)重復(fù)號(hào)碼的數(shù)字舍去.
2.系統(tǒng)抽樣
例2?(2019年高考全國(guó)Ⅰ卷文數(shù))某學(xué)校為了解1000名新生的身體素質(zhì),將這些學(xué)生編號(hào)為1,2,…,1000,從這些新生中用系統(tǒng)抽樣方法等距抽取100名學(xué)生進(jìn)行體質(zhì)測(cè)驗(yàn).若46號(hào)學(xué)生被抽到,則下面4名學(xué)生中被抽到的是______號(hào)學(xué)生.
________________________
A.8號(hào)學(xué)生?B.200號(hào)學(xué)生
C.616號(hào)學(xué)生?D.815號(hào)學(xué)生
解析:由已知將1000名學(xué)生分成100個(gè)組,每組10名學(xué)生,用系統(tǒng)抽樣,46號(hào)學(xué)生被抽到,所以第一組抽到6號(hào),且每組抽到的學(xué)生號(hào)構(gòu)成等差數(shù)列{an},公差d=10,所以an=6+10n(n∈N),若8=6+10n,解得n=15,不合題意;若200=6+10n,解得n=19.4,不合題意;若616=6+10n,則n=61,符合題意;若815=6+10n,則n=80.9,不合題意.故選C.
點(diǎn)撥:系統(tǒng)抽樣中所抽取編號(hào)的特點(diǎn)
系統(tǒng)抽樣又稱等距抽樣,所以依次抽取的樣本對(duì)應(yīng)的號(hào)碼就是一個(gè)等差數(shù)列,首項(xiàng)就是第1組所抽取樣本的號(hào)碼,公差為間隔數(shù),根據(jù)等差數(shù)列的通項(xiàng)公式就可以確定每一組內(nèi)所要抽取的樣本號(hào)碼.
提醒:系統(tǒng)抽樣時(shí),如果總體中的個(gè)數(shù)不能被樣本容量整除時(shí),可以先用簡(jiǎn)單隨機(jī)抽樣從總體中剔除幾個(gè)個(gè)體,然后再按系統(tǒng)抽樣進(jìn)行.
3.分層抽樣
例3?(2018年高考全國(guó)卷Ⅲ文)某公司有大量客戶,且不同齡段客戶對(duì)其服務(wù)的評(píng)價(jià)有較大差異.為了解客戶的評(píng)價(jià),該公司準(zhǔn)備進(jìn)行抽樣調(diào)查,可供選擇的抽樣方法有簡(jiǎn)單隨機(jī)抽樣、分層抽樣和系統(tǒng)抽樣,則最合適的抽樣方法是______.
解析:由題可知滿足分層抽樣特點(diǎn).由于從不同齡段客戶中抽取,故采用分層抽樣,故答案為:分層抽樣.
點(diǎn)撥:分層抽樣問題的類型及解題思路
(1)求某層應(yīng)抽個(gè)體數(shù)量:按該層所占總體的比例計(jì)算.
(2)已知某層個(gè)體數(shù)量,求總體容量或反之求解:根據(jù)分層抽樣就是按比例抽樣,列比例式進(jìn)行計(jì)算.
(3)分層抽樣的計(jì)算應(yīng)根據(jù)抽樣比構(gòu)造方程求解,其中“抽樣比=樣本容量總體容量=各層樣本數(shù)量各層個(gè)體數(shù)量”.
要點(diǎn)二、用樣本估計(jì)總體
(一)知識(shí)整合
1.頻率分布直方圖
(1)縱軸表示頻率組距,即小長(zhǎng)方形的高=頻率組距;
(2)小長(zhǎng)方形的面積=組距×頻率組距=頻率;
(3)各個(gè)小方形的面積總和等于1.
2.頻率分布表的畫法
第一步:求極差,決定組數(shù)和組距,組距=極差組數(shù);
第二步:分組,通常對(duì)組內(nèi)數(shù)值所在區(qū)間取左閉右開區(qū)間,最后一組取閉區(qū)間;
第三步:登記頻數(shù),計(jì)算頻率,列出頻率分布表.
3.莖葉圖
莖葉圖是統(tǒng)計(jì)中用來(lái)表示數(shù)據(jù)的一種圖,
莖是指中間的一列數(shù),葉就是從莖的旁邊生長(zhǎng)出來(lái)的數(shù).
4.中位數(shù)、眾數(shù)、平均數(shù)的定義
(1)中位數(shù)
將一組數(shù)據(jù)按大小依次排列,處于最中間位置的一個(gè)數(shù)據(jù)(或最中間兩個(gè)數(shù)據(jù)的平均數(shù))叫做這組數(shù)據(jù)的中位數(shù).
(2)眾數(shù)
一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)據(jù)叫做這組數(shù)據(jù)的眾數(shù).
(3)平均數(shù)
一組數(shù)據(jù)的算術(shù)平均數(shù)即為這組數(shù)據(jù)的平均數(shù),n個(gè)數(shù)據(jù)x1,x2,…,xn的平均數(shù)x=1n(x1+x2+…+xn).
5.樣本的數(shù)字特征
如果有n個(gè)數(shù)據(jù)x1,x2,…,xn,那么這n個(gè)數(shù)的
(1)平均數(shù)x=1n(x1+x2+…+xn).
(2)標(biāo)準(zhǔn)差s=1n[(x1-x)2+(x2-x)2+…+(xn-x)2].
(3)方差s2=1n[(x1-x)2+(x2-x)2+…+(xn-x)2].
(二)常用結(jié)論
1.頻率分布直方圖中的常見結(jié)論
(1)眾數(shù)的估計(jì)值為最高矩形的中點(diǎn)對(duì)應(yīng)的橫坐標(biāo).
(2)平均數(shù)的估計(jì)值等于頻率分布直方圖中每個(gè)小矩形的面積乘以小矩形底邊中點(diǎn)的橫坐標(biāo)之和.
(3)中位數(shù)的估計(jì)值的左邊和右邊的小矩形的面積和是相等的.
2.平均數(shù)、方差的公式推廣
(1)若數(shù)據(jù)x1,x2,…,xn的平均數(shù)為x,則mx1+a,mx2+a,mx3+a,…,mxn+a的平均數(shù)是mx+a.
(2)若數(shù)據(jù)x1,x2,…,xn的方差為s2,則數(shù)據(jù)ax1+b,ax2+b,…,axn+b的方差為a2s2.
(三)考向舉例
1.莖葉圖
例4?(2017年高考山東高考)如圖所示的記錄了甲、乙兩組各5名工人某日的產(chǎn)量數(shù)據(jù)(單位:件).若這兩組數(shù)據(jù)的中位數(shù)相等,且平均值也相等,則x和y的值分別為(??)
A.3,5???B.5,5???C.3,7???D.5,7
解析:由兩組數(shù)據(jù)的中位數(shù)相等可得65=60+y,解得y=5,又它們的平均值相等,
所以15×[56+62+65+74+(70+x)]=15×(59+61+67+65+78),解得x=3.答案:A
點(diǎn)撥:莖葉圖的應(yīng)用
(1)莖葉圖通常用來(lái)記錄兩位數(shù)的數(shù)據(jù),可以用來(lái)分析單組數(shù)據(jù),也可以用來(lái)比較兩組數(shù)據(jù).通過莖葉圖可以確定數(shù)據(jù)的中位數(shù),數(shù)據(jù)大致集中在哪個(gè)莖,數(shù)據(jù)是否關(guān)于該莖對(duì)稱,數(shù)據(jù)分布是否均勻等.
(2)給定兩組數(shù)據(jù)的莖葉圖,比較數(shù)字特征時(shí),“重心”下移者平均數(shù)較大,數(shù)據(jù)集中者方差較小.
2.頻率分布直方圖
例5?(2018年新課標(biāo)Ⅰ卷文)某家庭記錄了未使用節(jié)水龍頭50天的日用水量數(shù)據(jù)(單位:m3)和使用了節(jié)水龍頭50天的日用水量數(shù)據(jù),得到頻數(shù)分布表如下:
未使用節(jié)水龍頭50天的日用水量頻數(shù)分布表
頻數(shù)151310165
(1)在答題卡上作出使用了節(jié)水龍頭50天的日用水量數(shù)據(jù)的頻率分布直方圖:
(2)估計(jì)該家庭使用節(jié)水龍頭后,日用水量小于0.35m3的概率;
(3)估計(jì)該家庭使用節(jié)水龍頭后,一年能節(jié)省多少水?(一年按365天計(jì)算,同一組中的數(shù)據(jù)以這組數(shù)據(jù)所在區(qū)間中點(diǎn)的值作代表.)
解析:(1)根據(jù)題中所給的使用了節(jié)水龍頭50天的日用水量頻數(shù)分布表,算出落在相應(yīng)區(qū)間上的頻率,借助于直方圖中長(zhǎng)方形的面積表示的就是落在相應(yīng)區(qū)間上的頻率,從而確定出對(duì)應(yīng)矩形的高,從而得到直方圖;(2)結(jié)合直方圖,算出日用水量小于0.35的矩形的面積總和,即為所求的頻率;(3)根據(jù)組中值乘以相應(yīng)的頻率作和求得50天日用水量的平均值,作差乘以365天得到一年能節(jié)約用水多少m3,從而求得結(jié)果.
(1)
(2)根據(jù)以上數(shù)據(jù),該家庭使用節(jié)水龍頭后50天日用水量小于0.35m3的頻率為
0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,
所成角的正弦值;
(2)若點(diǎn)M,N分別在AB,PC上,且MN⊥平面PCD,試確定點(diǎn)M,N的位置.
解:(1)由題意知,AB,AD,AP兩兩垂直.
以{AB,AD,AP}為正交基底,建立如圖所示的空間直角坐標(biāo)系A(chǔ)xyz,則
B(1,0,0),C(1,2,0),
D(0,2,0),P(0,0,2).
從而PB=(1,0,-2),
PC=(1,2,-2),
PD=(0,2,-2).
設(shè)平面PCD的法向量n=(x,y,z),
則n·PC=0,n·PD=0,即x+2y-2z=0,2y-2z=0,
不妨取y=1,則x=0,z=1.
所以平面PCD的一個(gè)法向量為n=(0,1,1).
設(shè)直線PB與平面PCD所成角為θ,所以
sinθ=|cos〈PB,n〉|=|PB·n|PB|·|n||=105,
即直線PB與平面PCD所成角的正弦值為105.
(2)設(shè)M(a,0,0),則MA=(-a,0,0),
設(shè)PN=λPC,則PN=(λ,2λ,-2λ),
而AP=(0,0,2),
所以MN=MA+AP+PN=(λ-a,2λ,2-2λ).
由(1)知,平面PCD的一個(gè)法向量為n=(0,1,1),
因?yàn)镸N⊥平面PCD,所以MN∥n.
所以λ-a=0,2λ=2-2λ,解得,λ=12,a=12.
所以M為AB的中點(diǎn),N為PC的中點(diǎn).
評(píng)注:這類問題的基本特征是:針對(duì)一個(gè)結(jié)論,條件未知需探索,或條件增刪需確定,或條件正誤需判斷.解決這類問題的基本策略是:執(zhí)果索因,先尋找結(jié)論成立的必要條件,再通過檢驗(yàn)或認(rèn)證找到結(jié)論成立的充分條件.在“執(zhí)果索因”的過程中,常常會(huì)犯的一個(gè)錯(cuò)誤是不考慮推理過程的可逆與否,誤將必要條件當(dāng)作充分條件,應(yīng)引起注意.
(作者:石鵬,如皋市石莊中學(xué))