統(tǒng)計(jì)數(shù)據(jù)伴隨著我們的工作和生活,是具體、詳細(xì)、清晰地認(rèn)識(shí)事物時(shí)不可或缺的重要工具。當(dāng)說(shuō)明事物的狀態(tài)時(shí),如果僅從定性的角度加以描述,很可能給人以模糊不清的印象。比如,評(píng)論某人收入很高,某企業(yè)發(fā)展很快,那么多少算高、多少算快呢?讓我們換一種說(shuō)法來(lái)描述:某人月收入5萬(wàn)元,某企業(yè)年銷(xiāo)售增長(zhǎng)率達(dá)50%——這樣的信息,讓人們對(duì)某人的收入狀況與某企業(yè)的發(fā)展速度了然于心。這就是統(tǒng)計(jì)數(shù)據(jù)的魅力。統(tǒng)計(jì)數(shù)據(jù)在幫助我們認(rèn)識(shí)事物及決策方面具有迷人的功效。正如一位資深的統(tǒng)計(jì)學(xué)家所說(shuō):統(tǒng)計(jì)就和柴米油鹽醬醋茶一樣,存在的時(shí)候并不是很突出,一旦不見(jiàn)了,人生就是黑白的了。
然而,如果數(shù)據(jù)運(yùn)用不當(dāng),或者角度偏狹、單一,又或者缺乏對(duì)數(shù)據(jù)本質(zhì)的正確認(rèn)識(shí),則不僅不能幫助我們正確認(rèn)識(shí)事物,甚至?xí)淙霐?shù)據(jù)的陷阱中。因此,數(shù)據(jù)運(yùn)用不好,它又會(huì)讓人迷惑。就拿最常見(jiàn)的平均數(shù)來(lái)說(shuō),它似乎是統(tǒng)計(jì)中最簡(jiǎn)單不過(guò)的概念了。然而,你真的了解它嗎?下面就讓筆者通過(guò)一些實(shí)例帶您領(lǐng)略平均數(shù)的獨(dú)特內(nèi)涵。
算術(shù)平均數(shù)的背后
算術(shù)平均數(shù)是最基本的也是最常用的平均指標(biāo),它表明的是同類(lèi)事物的一般水平。在現(xiàn)實(shí)應(yīng)用中經(jīng)常出現(xiàn)對(duì)算術(shù)平均數(shù)的理解出現(xiàn)偏差或者不理解的現(xiàn)象。在此,通過(guò)兩個(gè)例子對(duì)應(yīng)用算術(shù)平均數(shù)的前提條件及其影響因素加以說(shuō)明。
算術(shù)平均數(shù)的應(yīng)用前提——同質(zhì)總體
在日常工作及生活中,經(jīng)常用到算術(shù)平均數(shù),如平均工資、人均消費(fèi)支出、平均成績(jī)等。但是,媒體上發(fā)布的該類(lèi)數(shù)據(jù)經(jīng)常會(huì)遭到公眾的質(zhì)疑。為什么會(huì)產(chǎn)生這樣的結(jié)果呢?在此通過(guò)一個(gè)簡(jiǎn)單的例子來(lái)說(shuō)明這個(gè)問(wèn)題。
假如某公司有8個(gè)員工,基年和報(bào)告年年收入資料如下,計(jì)算人均收入增長(zhǎng)率:
基年平均收入:
1310000/8=163750元
報(bào)告年平均收入:
1510000/8=188750元
人均收入報(bào)告年比基年增長(zhǎng):
188750/163750-1=15.27%
該計(jì)算結(jié)果發(fā)布出來(lái),7人(占總?cè)藬?shù)的87.5%)會(huì)覺(jué)得不可思議:我們的收入沒(méi)有超過(guò)10萬(wàn)的,平均收入?yún)s達(dá)到16萬(wàn)以上;我們的收入一分沒(méi)漲,平均收入?yún)s增長(zhǎng)15.2%。但是,平均收入計(jì)算是沒(méi)有錯(cuò)誤的。
讓我們來(lái)看看平均數(shù)的計(jì)算過(guò)程:每一個(gè)人的收入在平均數(shù)的計(jì)算中都發(fā)揮了一定的作用,由于員工中出現(xiàn)一個(gè)極端高收入者,達(dá)到100萬(wàn)元以上,致使總體的平均收入被大大拉高了,偏離了大多數(shù)員工的收入水平。因此,從計(jì)算的結(jié)果來(lái)看,該平均收入并不具有代表性。
平均數(shù)的本質(zhì)是反映同類(lèi)事物數(shù)據(jù)一般水平的代表值,當(dāng)該數(shù)據(jù)不具有代表性時(shí),說(shuō)明總體并非同質(zhì)總體,即不是同一類(lèi)事物。該例中8號(hào)員工不是普通的員工,作為高層管理人員和其他員工存在質(zhì)的差異,應(yīng)當(dāng)分別計(jì)算平均收入。
因此,不是任何一堆數(shù)據(jù)放在一起都是可以計(jì)算平均數(shù)的,對(duì)非同質(zhì)總體計(jì)算平均數(shù)毫無(wú)意義,強(qiáng)行計(jì)算出的平均數(shù)不具有代表性。在上述事例中,8號(hào)員工收入達(dá)到100萬(wàn),與另外7個(gè)人的收入出現(xiàn)顯著差異,8號(hào)員工與另外7人應(yīng)該不屬于同一總體范疇,而由此計(jì)算出的平均數(shù)163750元不能夠反映上述員工的收入一般水平,該平均數(shù)不具有代表性。對(duì)于該例,在計(jì)算平均收入時(shí),應(yīng)將8號(hào)員工剔除出該總體范圍??傊?,正確應(yīng)用平均數(shù)的基本前提條件是建立同質(zhì)總體。
結(jié)構(gòu)因素對(duì)平均數(shù)的影響
一個(gè)朋友在兩個(gè)地段分別經(jīng)營(yíng)了兩個(gè)商鋪,某月份兩個(gè)店鋪每天的價(jià)格記錄如下。她困惑地找到我,為什么甲店每天的價(jià)格都比乙店高,而平均價(jià)格卻低于乙店?為了能夠更清楚地說(shuō)明問(wèn)題,在此將數(shù)據(jù)進(jìn)行了處理,并計(jì)算如下(見(jiàn)下表):
平均數(shù)的影響因素有兩個(gè):被平均的數(shù)據(jù)和數(shù)據(jù)出現(xiàn)的次數(shù)。
f(或f/∑f)為權(quán)數(shù),它具有權(quán)衡輕重的作用,即哪一組變量值出現(xiàn)的次數(shù)多,哪一組變量值在平均數(shù)計(jì)算的過(guò)程中發(fā)揮的作用就大。
該例資料顯示,盡管甲店每天的價(jià)格都高于乙店,但是平均價(jià)格甲店卻低于乙店。之所以會(huì)出現(xiàn)該種情形是因?yàn)榧椎陜r(jià)格處于108以上的高位時(shí),其銷(xiāo)售量占比為10%,而處于102及以下的低價(jià)位時(shí),其銷(xiāo)量占比高達(dá)55%;乙店恰好相反,價(jià)格處于106以上高位時(shí),銷(xiāo)量占比達(dá)55%,價(jià)格處于100及以下低位時(shí),其銷(xiāo)售量占比為10%。
可見(jiàn),數(shù)據(jù)的結(jié)構(gòu)是平均數(shù)計(jì)算過(guò)程中的一個(gè)重要影響因素。
相對(duì)數(shù)的平均算法
正如前文所述,算術(shù)平均數(shù)是最常用的平均指標(biāo),但是,對(duì)產(chǎn)品合格率這一類(lèi)的相對(duì)數(shù)求平均,算術(shù)平均數(shù)就不適用了。請(qǐng)看下面二例:
(1)某種零件加工需經(jīng)過(guò)鋸、磨、車(chē)、插四道工序?,F(xiàn)加工1000個(gè)零件,各道工序的合格率分別是95%、98%、93%、100%,計(jì)算各道工序的平均合格率。由于合格率不能相加,所以采用算術(shù)平均法求平均合格率是不可行的。
下面分析一下該例的特點(diǎn),四道工序存在相關(guān)性,后道工序必須在前道工序的基礎(chǔ)上進(jìn)行加工生產(chǎn)。經(jīng)過(guò)四道工序,最終得到的合格產(chǎn)品數(shù)量是:
1000×95%×98%×93%×100%
=865(件)
產(chǎn)品總的合格率為865/1000
=95%×98%×93%×100%
=86.5%
由于總的比率等于被平均比率的連乘積,因此,四道工序的平均合格率要用幾何平均法計(jì)算:
幾何平均數(shù)是針對(duì)特定的相對(duì)數(shù)求平均的方法,它是變量值連乘積的n次方根。當(dāng)被平均的相對(duì)數(shù)的連乘積等于總的比率或總速度時(shí),應(yīng)該采用幾何平均法求平均。
(2)某公司下屬四個(gè)企業(yè)生產(chǎn)同一種產(chǎn)品,某月份產(chǎn)出量分別為300件、500件、600件、1000件,合格率分別為95%、98%、93%、100%,計(jì)算該企業(yè)產(chǎn)品的平均合格率。
該問(wèn)題也是對(duì)相對(duì)數(shù)求平均,但是,被平均的四個(gè)相對(duì)數(shù)之間沒(méi)有相關(guān)性。對(duì)這類(lèi)相對(duì)數(shù)求平均既不能采用算術(shù)平均法,也不適合采用幾何平均法。
由于是對(duì)相對(duì)數(shù)求平均,最終結(jié)果仍然是相對(duì)數(shù)。而相對(duì)數(shù)是根據(jù)兩個(gè)數(shù)值之比求得,對(duì)這類(lèi)不存在相關(guān)性的相對(duì)數(shù)求平均,其平均體現(xiàn)在該相對(duì)數(shù)的分子和分母上,即對(duì)該相對(duì)數(shù)的分子和分母分別求平均,再對(duì)比,在此,把它稱(chēng)為比值平均數(shù)。本例產(chǎn)品平均合格率的計(jì)算方法如下:
對(duì)相對(duì)數(shù)求平均的方法提示:對(duì)相對(duì)數(shù)求平均,絕對(duì)不可采用算術(shù)平均法。當(dāng)被平均的相對(duì)數(shù)存在相關(guān)性時(shí),即其連乘積等于總的比率,則采用幾何平均法;如果被平均的相對(duì)數(shù)不存在相關(guān)性,則采用比值平均法。
看似簡(jiǎn)單的平均數(shù)其實(shí)奧妙無(wú)窮,正確加以運(yùn)用,有助于我們認(rèn)識(shí)事物和分析問(wèn)題,是科學(xué)決策不可缺少的有力武器。