李琳
統(tǒng)計是高中數(shù)學的重要內(nèi)容,每年的高考中都有涉及,統(tǒng)計解題中由于審題不嚴,考慮不周,忽視甚至挖掘不出題目的隱含條件,常會使解題感覺困難或產(chǎn)生錯誤.下面就一些常見的錯誤加以剖析,以幫助同學們避免出現(xiàn)同樣的錯誤.
一、不能正確區(qū)分總體、樣本、樣本容量
例1?為了了解2019年參加市運動會的240名運動員的身高情況,從中抽取40名運動員進行測量.下列說法正確的是(??)
A.總體是240名運動員
B.個體是每一名運動員
C.40名運動員的身高是一個個體
D.樣本容量是40
錯解:選擇A、B、C中的一個.
剖析:對于選項A、B,對總體、個體、樣本的概念把握不準,誤將考察的對象當作運動員;對于選項C,把個體和樣本混淆致誤.
正解:選D.根據(jù)統(tǒng)計的相關(guān)概念并結(jié)合題意可得,此題的總體、個體、樣本這三個概念的考察對象都是運動員的身高,而不是運動員,并且一個個體是指一名運動員的身高,選項A,B表達的對象都是運動員,選項C未將個體和樣本理解透徹.在這個問題中,總體是240名運動員的身高,個體是每名運動員的身高,樣本是40名運動員的身高,樣本容量是40.因此選D.
應對策略:
1.明確相關(guān)概念
對總體、個體、樣本、樣本容量的概念要熟練把握,要明確總體與樣本的包含關(guān)系及樣本與樣本容量的區(qū)別,如本例選項C,是對概念把握不準.
2.注意考察對象
解決考查總體、個體、樣本、樣本容量的概念問題時,關(guān)鍵是明確考察對象,根據(jù)相關(guān)的概念可知總體、個體與樣本的考察對象是相同的,如本例中選項A,B表達的對象都是運動員的身高而不是運動員.
二、對隨機抽樣的概念理解不透徹
例2?對于下列抽樣方法:①運動員從8個跑道中隨機抽取1個跑道;②從20個零件中一次性拿出3個來檢驗質(zhì)量;③某班50名學生,指定其中成績優(yōu)異的2名學生參加一次學科競賽;④為了保證食品安全,從某廠提供的一批月餅中,拿出一個檢查后放回,再拿一個檢查,反復5次,拿了5個月餅進行檢查.其中,屬于簡單隨機抽樣的是______.(把正確的序號都填上)
錯解:②③④
剖析:對簡單隨機抽樣的概念理解不透徹.
正解:對于②,一次性拿出3個來檢驗質(zhì)量,違背簡單隨機抽樣特征中的“逐個”抽取;對于③,指定其中成績優(yōu)異的2名學生,不滿足等可能抽樣的要求;對于④,不滿足不放回抽樣的要求.故填①.答案:①
點睛:要判斷所給的抽樣方法是否是簡單隨機抽樣,關(guān)鍵是看它們是否符合簡單隨機抽樣的定義,即簡單隨機抽樣的四個特點:有限性、逐一性、不放回性、等可能性.
①有限性:簡單隨機抽樣要求被抽取的樣本的總體個數(shù)是有限的,便于通過樣本對總體進行分析.
②逐一性:簡單隨機抽樣是從總體中逐個地進行抽取,便于實踐中操作.
③不放回性:簡單隨機抽樣是一種不放回抽樣,便于進行有關(guān)的分析和計算.
④等可能性:簡單隨機抽樣中各個個體被抽到的機會都相等,從而保證了抽樣方法的公平性.
應對策略:
1.簡單隨機抽樣是不放回抽樣,抽樣過程中,每個個體被抽到的機會(概率)相等.
2.應用簡單隨機抽樣應注意的問題
(1)一個抽樣試驗能否用抽簽法,關(guān)鍵看兩點:
一是抽簽是否方便;
二是號簽是否易攪勻.
一般地,當總體容量和樣本容量都較小時可用抽簽法.
(2)在使用隨機數(shù)表時,如遇到三位數(shù)或四位數(shù)時,可從選擇的隨機數(shù)表中的某行某列的數(shù)字計起,每三個或四個作為一個單位,自左向右選取,有超過總體號碼或出現(xiàn)重復號碼的數(shù)字舍去.
(3)簡單隨機抽樣需滿足:
①被抽取的樣本總體的個體數(shù)有限;
②逐個抽取;
③是不放回抽取;
④是等可能抽取.
三、對系統(tǒng)抽樣的特點理解不到位
例3?從2003名學生中抽取一個容量為40的樣本,應如何抽?。?/p>
錯解:將2003名學生按0001到2003編上號;將號碼隨機分成40份,每一份再用抽簽法隨機抽取一名學生,即得到了一個容量為40的樣本.
剖析:由于2003不能被40整除,誤以為只能用簡單隨機抽樣進行抽取,對兩種抽樣方法的特點理解不到位.
正解:先將2003名學生按0001到2003編上號,利用隨機數(shù)表法從中剔除3名學生,再對剩余的2000名學生重新從0001到2000編號,按編號順序分成40組,每組50人,先在第一組中用抽簽法抽出某一號,如0006,依次在其他組抽取0056,0106,…,1956,這樣就得到了一個容量為40的樣本.
應對策略:
1.當總體容量較大,總體可以分為均勻的幾個部分時,用系統(tǒng)抽樣較為合理,但當總體容量除以樣本容量不是整數(shù)時,要先在總體中剔除部分個體.
2.系統(tǒng)抽樣的操作步驟
第一步編號:先將總體的N個個體編號;
第二步分段:確定分段間隔k,對編號進行分段,當Nn(n是樣本容量)是整數(shù)時,取k=Nn;
第三步確定首個個體:在第1段用簡單隨機抽樣確定第一個個體編號l(l≤k);
第四步獲取樣本:按照一定的規(guī)則抽取樣本,通常是將l加上間隔k得到第2個個體編號l+k,再加k得到第3個個體編號l+2k,依次進行下去,直到獲取整個樣本.
四、對個體的入樣可能性與抽樣間隔理解不透
________________________
例4?中央電視臺動畫城節(jié)目為了對本周的熱心觀眾給予獎勵,要從2014名小觀眾中抽取50名幸運小觀眾.先用簡單隨機抽樣從2014人中剔除14人,剩下的2000人再按系統(tǒng)抽樣方法抽取50人,則在2014人中,每個人被抽取的可能性(??)
A.均不相等?B.不全相等
C.都相等,且為251007?D.都相等,且為140
錯解:選A或D.
剖析:對于選項A,誤認為剔除14人,被抽取到的機會就不相等了,錯選A;對于選項D,認為被抽取的機會相等,但利用了剔除后的數(shù)據(jù)計算,錯選D.
正解:選C.因為在系統(tǒng)抽樣中,若所給的總體個數(shù)不能被樣本容量整除,則應先剔除幾個個體,本題先剔除14人,然后再分組,在剔除過程中,每個個體被剔除的機會相等.所以,每個個體被抽到的機會都相等,均為502014=251007.答案:C.
應對策略:
1.明確系統(tǒng)抽樣的操作要領
系統(tǒng)抽樣操作要領是先將個體數(shù)較多的總體分成均衡的若干部分,然后按照預先指定的規(guī)則,從每一部分中抽取一個個體,得到所需樣本.系統(tǒng)抽樣是等距離抽樣,每個個體被抽到的機會是相等的,如本題中2000人要分為50段.
2.對系統(tǒng)抽樣合理分段
在系統(tǒng)抽樣過程中,為將整個編號分段,要確定分段間隔,當在系統(tǒng)抽樣過程中比值不是整數(shù)時,要從總體中剔除一些個體(用簡單隨機抽樣),但每一個個體入樣的機會仍然相等.如本題中剔除14人后,每個人被抽取的可能性不變.
五、忽略分層抽樣的特點
例5?某單位有老年人28人,中年人54人,青年人81人,為了調(diào)查他們的身體情況,需從中抽取一個容量為36的樣本,則適合的抽樣方法是(??)
A.簡單隨機抽樣
B.系統(tǒng)抽樣
C.直接運用分層抽樣
D.先從老年人中剔除1人,再用分層抽樣
錯解:因為總體由差異明顯的三部分組成,所以考慮用分層抽樣.因為總?cè)藬?shù)為28+54+81=163,樣本容量為36,由于按36163抽樣,無法得到整數(shù)解,因此考慮先剔除1人,將抽樣比變?yōu)?6162=29.若從老年人中隨機地剔除1人,則老年人應抽取27×29=6(人),中年人應抽取54×29=12(人),青年人應抽取81×29=18(人),從而組成容量為36的樣本.故選D.
剖析:如果用簡單隨機抽樣先從老年人中剔除1人的話,老年人被抽到的概率顯然比其他人群小了,這不符合隨機抽樣的特征——每個個體入樣的幾率相等.注意題干明確地說“先從老年人中剔除1人”,這和以前做的從總體中隨機剔除1人是不一樣的.
正解:直接運用分層抽樣,老年人、中年人和青年人中應抽取的人數(shù)分別為36163×28≈6,36163×54≈12,36163×81≈18,故選C.
點睛:分層抽樣的一個很重要的特點是每個個體被抽到的概率是一樣的.當按照比例計算出的值不是整數(shù)時,一般是采用四舍五入的方法取值,若四舍五入后得到的樣本容量與要求的不盡相同,則可根據(jù)問題的實際意義適當處理,使之相同,這只是細節(jié)性問題,并未改變分層抽樣的本質(zhì).
應對策略:
1.分層抽樣的前提和遵循的兩條原則
(1)前提:分層抽樣使用的前提是總體可以分層,層與層之間有明顯區(qū)別,而層內(nèi)個體間差異較小,每層中所抽取的個體數(shù)可按各層個體數(shù)在總體的個體數(shù)中所占比例抽取.
(2)遵循的兩條原則
①將相似的個體歸入一類,即為一層,分層要求每層的各個個體互不交叉,即遵循不重復、不遺漏的原則;
②分層抽樣為保證每個個體等可能入樣,需遵循在各層中進行簡單隨機抽樣,每層樣本數(shù)量與每層個體數(shù)量的比等于抽樣比.
2.與分層抽樣有關(guān)問題的常見類型及解題策略
(1)求某一層的樣本數(shù)或總體個數(shù).可依據(jù)題意求出抽樣比,再由某層總體個數(shù)(或樣本數(shù))確定該層的樣本(或總體)數(shù).
(2)求各層的樣本數(shù).可依據(jù)題意,求出各層的抽樣比,再求出各層樣本數(shù).
六、誤將頻率分布直方圖的縱坐標當作頻率
例6?中小學生的視力狀況受到社會的關(guān)注.某市有關(guān)部門從全市6萬名高一學生中隨機抽取400名學生,對他們的視力狀況進行一次調(diào)查統(tǒng)計,將所得到的有關(guān)數(shù)據(jù)繪制成頻率分布直方圖,如圖所示,從左至右五個小組的頻率之比為5∶7∶12∶10∶6,則該市6萬名高一學生中視力在[3.95,4.25)范圍內(nèi)的學生約有多少人?
錯解:由圖可知,第五小組的頻率為0.5,所以第一小組的頻率為0.5×56=512.
所以該市6萬名高一學生中視力在[3.95,4.25)范圍內(nèi)的學生約有60000×512=25000(人).
剖析:表面上看本題的回答似乎正確無誤,其實答案是錯誤的,其錯因在于沒有看懂所提供的頻率分布直方圖中的數(shù)據(jù)的含義,誤將該頻率分布直方圖中的縱坐標(頻率與組距的比)看成了頻率,從而導致問題的解答出錯.
正解:由圖可知,第五小組的頻率為0.5×0.3=0.15,
所以第一小組的頻率為0.15×56=0.125.
所以該市6萬名高一學生中視力在[3.95,4.25)范圍內(nèi)的學生約有60000×0.125=7500(人).
答案:7500.
應對策略:
1.畫頻率分布直方圖的步驟
(1)求極差(即一組數(shù)據(jù)中最大值與最小值的差);