王小莉
統(tǒng)計(jì)是高中數(shù)學(xué)的重要內(nèi)容,每年的高考中都有涉及,在求解與統(tǒng)計(jì)相關(guān)的問(wèn)題時(shí),學(xué)生常常會(huì)由于審題不嚴(yán)、考慮不周、忽視甚至挖掘不出題目的隱含條件等原因出現(xiàn)解題錯(cuò)誤.本文就一些常見的問(wèn)題加以剖析,以期幫助同學(xué)們避免出現(xiàn)同樣的錯(cuò)誤.
例1中央電視臺(tái)動(dòng)畫城節(jié)目為了對(duì)本周的熱心觀眾給予獎(jiǎng)勵(lì),要從2 014名小觀眾中抽取50名幸運(yùn)小觀眾.先用簡(jiǎn)單隨機(jī)抽樣從2 014人中剔除14人,剩下的2 000人再按系統(tǒng)抽樣方法抽取50人,則在2 014人中,每個(gè)人被抽取的可能性( ).
A. 均不相等
B. 不全相等
錯(cuò)解選A或D.
剖析對(duì)于選項(xiàng)A,常有學(xué)生誤認(rèn)為剔除14人,被抽取到的機(jī)會(huì)就不相等了,從而錯(cuò)選A;對(duì)于選項(xiàng)D,有的學(xué)生會(huì)認(rèn)為被抽取的機(jī)會(huì)相等,但利用剔除后的數(shù)據(jù)計(jì)算,從而錯(cuò)選D.
點(diǎn)睛系統(tǒng)抽樣具有等可能性,即每個(gè)個(gè)體被抽到的可能性相等.
例2某單位有老年人28人,中年人54人,青年人81人,為了調(diào)查他們的身體情況,需從中抽取一個(gè)容量為36的樣本,則適合的抽樣方法是( ).
A. 簡(jiǎn)單隨機(jī)抽樣
B. 系統(tǒng)抽樣
C. 直接運(yùn)用分層抽樣
D. 先從老年人中剔除1人,再用分層抽樣
剖析如果用簡(jiǎn)單隨機(jī)抽樣先從老年人中剔除1人,老年人被抽到的概率顯然比其他人群小了,這不符合隨機(jī)抽樣的特征——每個(gè)個(gè)體入樣的概率相等.注意錯(cuò)解中明確地說(shuō)“先從老年人中剔除1人”這和從總體中隨機(jī)剔除1人是不一樣的.
點(diǎn)睛分層抽樣的一個(gè)很重要的特點(diǎn)就是每個(gè)個(gè)體被抽到的概率相等.當(dāng)按照比例計(jì)算出的值不是整數(shù)時(shí),一般是采用四舍五入的方法取值,若四舍五入后得到的樣本容量與要求的不相同,則可根據(jù)問(wèn)題的實(shí)際意義適當(dāng)處理,使之相同,但不能改變分層抽樣的本質(zhì).
例3中小學(xué)生的視力狀況受到社會(huì)的關(guān)注.某市有關(guān)部門從全市6萬(wàn)名高一學(xué)生中隨機(jī)抽取400名學(xué)生,對(duì)他們的視力狀況進(jìn)行一次調(diào)查統(tǒng)計(jì),將所得到的有關(guān)數(shù)據(jù)繪制成頻率分布直方圖,如圖1所示,從左至右五個(gè)小組的頻率之比為5∶7∶12∶10∶6,則該市6萬(wàn)名高一學(xué)生中視力在[3.95,4.25)內(nèi)的學(xué)生約有多少人?
圖1
剖析表面上看本題的回答似乎正確無(wú)誤,其實(shí)答案是錯(cuò)誤的,其錯(cuò)因在于沒有看懂所提供的頻率分布直方圖中數(shù)據(jù)的含義,誤將該頻率分布直方圖中的縱坐標(biāo)(頻率與組距的比)當(dāng)成了頻率,從而導(dǎo)致問(wèn)題的解答出錯(cuò).
點(diǎn)睛解答本題時(shí)需注意縱坐標(biāo)為頻率/組距.繪制頻率分布直方圖的注意事項(xiàng)如下:
1)計(jì)算極差,需要找出這組數(shù)的最大值和最小值,當(dāng)數(shù)據(jù)很多時(shí),可選一個(gè)數(shù)當(dāng)參照.
2)將一批數(shù)據(jù)分組,目的是要描述數(shù)據(jù)分布規(guī)律,要根據(jù)數(shù)據(jù)多少來(lái)確定分組數(shù)目,一般來(lái)說(shuō),數(shù)據(jù)越多,組數(shù)越多.
3)列頻率分布表時(shí),可通過(guò)逐一判斷各個(gè)數(shù)據(jù)落在哪個(gè)小組內(nèi),以“正”字計(jì)數(shù)法確定各個(gè)小組內(nèi)數(shù)據(jù)的個(gè)數(shù).
4)畫頻率分布直方圖時(shí),縱坐標(biāo)表示頻率與組距的比值,一定不能標(biāo)成頻率.
例4某市對(duì)上下班情況作了抽樣調(diào)查,在上下班時(shí)間各抽測(cè)了12輛機(jī)動(dòng)車的車速如下(單位:km·h-1).
上班時(shí)間:30,33,18,27,32,40,26,28,21,28,35,20;
下班時(shí)間:27,19,32,29,36,29,30,22,25,16,17,30.
用莖葉圖表示以上數(shù)據(jù).
錯(cuò)解機(jī)動(dòng)車行駛速度的莖葉圖,如圖2所示.
上班下班[5]81679876102257953203026[5]04
圖2
剖析莖葉圖需要對(duì)于重復(fù)出現(xiàn)的數(shù)據(jù)進(jìn)行重復(fù)記錄.
正解機(jī)動(dòng)車行駛速度的莖葉圖如圖3.
上班下班[6]81679887610225799532030026[6]04
圖3
點(diǎn)睛畫莖葉圖需要注意將每個(gè)數(shù)據(jù)分為莖和葉兩部分,將表示莖的數(shù)字按照由小到大的順序由上到下排列,在寫每行葉子的時(shí)候,重復(fù)出現(xiàn)的數(shù)字也應(yīng)該按原次數(shù)寫入葉子部位,不能只按一次寫入.
例5甲、乙兩種冬小麥試驗(yàn)品種連續(xù)5年的平均單位面積產(chǎn)量如表1(單位:t·km-2).
表1
若某村要從中引進(jìn)一種冬小麥大量種植,給出你的建議.
錯(cuò)解由題意得
甲、乙兩種冬小麥的平均產(chǎn)量都等于10,所以引進(jìn)兩種冬小麥的任意一種都可以.
剖析上述錯(cuò)誤在于只對(duì)兩種冬小麥的平均產(chǎn)量做了比較,而忽略了對(duì)冬小麥產(chǎn)量穩(wěn)定性的討論.
正解由題意得
點(diǎn)睛平均數(shù)反映的是樣本個(gè)體的平均水平,方差和標(biāo)準(zhǔn)差則反映了樣本的離散程度.對(duì)于形如“誰(shuí)發(fā)揮更好、誰(shuí)更穩(wěn)定、誰(shuí)更優(yōu)秀”之類的問(wèn)題,除比較數(shù)據(jù)的平均值外,還應(yīng)該比較方差或標(biāo)準(zhǔn)差的大小,以作出更為公正、合理的判斷.
例6某班5名學(xué)生的數(shù)學(xué)和物理成績(jī)?nèi)绫?.
表2
(1)畫出散點(diǎn)圖;
(2)求物理成績(jī)y對(duì)數(shù)學(xué)成績(jī)x的線性回歸方程.
錯(cuò)解(1)散點(diǎn)圖如圖4所示.
圖4
(2)計(jì)算得
66×64+63×61=25 054,
732+662+632=27 174,
所以
例7假設(shè)某設(shè)備的使用年限和所支出的維修費(fèi)用如表3中統(tǒng)計(jì)資料所示.
表3
能否用線性回歸模型描述兩個(gè)變量間的關(guān)系?
剖析沒有先判斷兩個(gè)變量是否具有線性相關(guān)關(guān)系.
正解畫出散點(diǎn)圖,如圖5所示,
圖5
從散點(diǎn)圖上看,這些點(diǎn)的分布幾乎沒有什么規(guī)律,故不能用線性回歸模型描述兩個(gè)變量之間的關(guān)系.
例8有甲、乙兩個(gè)班級(jí)進(jìn)行一門考試,將學(xué)生考試成績(jī)按照優(yōu)秀和不優(yōu)秀統(tǒng)計(jì)后,得到列聯(lián)表(如表4).
表4 班級(jí)與成績(jī)列聯(lián)表
試問(wèn)能有多大把握認(rèn)為“成績(jī)與所在班級(jí)有關(guān)系”?
參考公式及數(shù)據(jù):
其中n=a+b+c+d.
表5
錯(cuò)解計(jì)算得K2的觀測(cè)值為
因?yàn)?6.86>6.635,所以有99%的把握認(rèn)為“成績(jī)與所在班級(jí)有關(guān)系”.
剖析由于對(duì)2×2列聯(lián)表中a,b,c,d的位置不清楚,所以在代入公式時(shí)代錯(cuò)了數(shù)值,導(dǎo)致計(jì)算結(jié)果錯(cuò)誤.
正解計(jì)算得K2的觀測(cè)值為
因?yàn)?.653<3.841,所以沒有充分證據(jù)認(rèn)為“成績(jī)與所在班級(jí)有關(guān)系”.
點(diǎn)睛獨(dú)立性檢驗(yàn)中,參數(shù)K2的公式復(fù)雜,計(jì)算量大,要弄清公式的特點(diǎn),熟記公式,避免因粗心而出現(xiàn)錯(cuò)誤.
鏈接練習(xí)
已知數(shù)據(jù)x1,x2,x3,…,xn是上海普通職工n(n≥3,n∈N*)個(gè)人的年收入,設(shè)這n個(gè)數(shù)據(jù)的中位數(shù)為x,平均數(shù)為y,方差為z,如果再加上世界首富的年收入xn+1,則這n+1個(gè)數(shù)據(jù)中,下列說(shuō)法正確的是( ).
A. 年收入平均數(shù)大大增大,中位數(shù)一定變大,方差可能不變
B. 年收入平均數(shù)大大增大,中位數(shù)可能不變,方差變大
C. 年收入平均數(shù)大大增大,中位數(shù)可能不變,方差也不變
D. 年收入平均數(shù)大大增大,中位數(shù)可能不變,方差可能不變
鏈接練習(xí)參考答案
B.