于笑月 青島實(shí)驗(yàn)高級中學(xué)
概率論與數(shù)理統(tǒng)計是數(shù)學(xué)的一個重要分支。在生產(chǎn)生活中,人們經(jīng)常需要應(yīng)用概率論知識,分析隨機(jī)事件發(fā)生的可能性。在兩個人各擲一個骰子時,得到的點(diǎn)數(shù)相同的可能性是多少,Z12次列車到達(dá)終點(diǎn)站時晚點(diǎn)的可能性是多少,結(jié)腸癌患者術(shù)后復(fù)發(fā)的可能性是多少,都是可以用概率論知識解決的問題。數(shù)理統(tǒng)計在生活中也有著廣泛的應(yīng)用。在分析某養(yǎng)殖場中肉雞的重量分布情況時,在確定某一新發(fā)現(xiàn)的生物標(biāo)志物的醫(yī)學(xué)參考值范圍時,在為房屋或其他資產(chǎn)估價時,人們都需要應(yīng)用與數(shù)理統(tǒng)計相關(guān)的知識??梢哉f,概率統(tǒng)計在科研、工業(yè)、醫(yī)療等領(lǐng)域有著廣泛的應(yīng)用。
在企業(yè)經(jīng)營的過程中,經(jīng)營者常常需要對未來一段時間內(nèi)某產(chǎn)品的銷量、運(yùn)輸過程中發(fā)生的意外進(jìn)行預(yù)測,此外,他們需要從一些歷史數(shù)據(jù)中總結(jié)特定事件發(fā)生的規(guī)律,從而制定合適的戰(zhàn)略。應(yīng)用概率統(tǒng)計知識,這些經(jīng)營者可以高效地建立相關(guān)模型,定量地描述特定的場景,總結(jié)事件的發(fā)生規(guī)律??梢哉f,分析企業(yè)經(jīng)營的過程中,概率統(tǒng)計知識發(fā)揮著十分重要的作用。
由于人類很早就開始進(jìn)行類似賭博的活動,似乎概率的概念應(yīng)該與人類一樣古老。但是,古時候的人們并沒有系統(tǒng)地總結(jié)賭博中出現(xiàn)特定結(jié)果的規(guī)律。直到16世紀(jì)和17世紀(jì),人們才意識到,可以在某種程度上預(yù)測這些不確定性事件的結(jié)果。這種思維方式可以幫助人們確定未來事件的可能性。賭徒們必須預(yù)測可能承擔(dān)的風(fēng)險和潛在的收益,并實(shí)現(xiàn)兩者的平衡。此外,為了獲利,各行業(yè)的經(jīng)商者也需要可靠的方法預(yù)期自己獲利。
帕斯卡和費(fèi)馬是概率論的創(chuàng)始人,他們使概率論成為了一門獨(dú)立的學(xué)科。1654年,這兩位科學(xué)家在發(fā)表的著作中,討論了夏瓦利·德·梅爾(Chevalier de Mere)提出的賭博問題,奠定了概率論的基礎(chǔ)。他們探討了玩家投擲24顆骰子時,下“雙6”的賭注能夠獲勝的概率。此外,這兩位數(shù)學(xué)家還提出了期望的概念。
此外,著名的數(shù)學(xué)家伯努利在《猜想技巧》(《Ars Conjectandi》)中,對惠更斯提出的賭博概率問題進(jìn)行了進(jìn)一步證明,并提出了組合和排列的概念,他對賭博中的一系列問題進(jìn)行了數(shù)學(xué)解釋。此外,他還提出了著名的伯努利定理,亦即大數(shù)定律[2]。
棣莫弗1718年出版的著作中探討了計算活動中事件的發(fā)生概率的一般方法,對獲得數(shù)學(xué)結(jié)論的過程進(jìn)行了詳細(xì)解釋。拉普拉斯提出了加法原理和乘法原理,并探討了應(yīng)用伯努利定理時的幾個問題。至此,概率論已經(jīng)基本發(fā)展為一個非常成熟的學(xué)科,當(dāng)時的人們可以應(yīng)用概率論的知識,評估生產(chǎn)生活中隨機(jī)事件發(fā)生的可能性。
18世紀(jì)初,一些研究人員在進(jìn)行天文學(xué)、大地測量學(xué)、實(shí)驗(yàn)心理學(xué)、遺傳學(xué)和社會學(xué)研究時,發(fā)現(xiàn)他們經(jīng)常需要處理大量數(shù)據(jù),但是當(dāng)時的人們?nèi)狈τ行У姆椒枋鲞@些數(shù)據(jù)的特征。他們提出了許多重要的問題:科學(xué)家應(yīng)如何整合在不同條件下得到的測量數(shù)據(jù)?如何應(yīng)用概率論衡量結(jié)果的準(zhǔn)確性?應(yīng)用于天文學(xué)的原始統(tǒng)計方法是否可以被應(yīng)用于社會科學(xué)研究中?最小二乘法和回歸分析分別適用于那些場景?在后來的研究中,人們逐漸摸索出一些初步的數(shù)理統(tǒng)計方法,應(yīng)用這些方法,他們可以對實(shí)驗(yàn)測量和科學(xué)觀察中的不確定性進(jìn)行評估,盡可能降低不確定性,將社會科學(xué)中難以量化的問題轉(zhuǎn)化為數(shù)學(xué)模型。這些新的統(tǒng)計學(xué)概念、統(tǒng)計學(xué)方法在不同的學(xué)科中發(fā)揮著不同的作用。幾百年來,科學(xué)家不斷完善這些方法,使其應(yīng)用更加廣泛。今天,人們已經(jīng)可以熟練地應(yīng)用數(shù)理統(tǒng)計方法,高效地分析農(nóng)業(yè)、工業(yè)、科研、生活中的許多大樣本問題,得到可靠的結(jié)論[3]。
如果人們以數(shù)據(jù)的值為x,以變量取該值的概率為y,就可以繪制出變量的概率分布函數(shù)。隨機(jī)事件發(fā)生的概率就是概率分布函數(shù)與x軸之間的區(qū)域的面積。當(dāng)隨機(jī)變量為連續(xù)變量時,人們需要用連續(xù)分布函數(shù)描述其分布情況。正態(tài)分布是最常用的連續(xù)分布函數(shù),其在企業(yè)經(jīng)營中有著廣泛的應(yīng)用[4]。
正態(tài)分布能夠被用于描述幾乎所有自然變量的特征。身高、血壓、智商、測量誤差等變量,都服從正態(tài)分布。正態(tài)分布是一種對稱分布,其中,大多數(shù)觀測值都集中在均值附近,并且遠(yuǎn)離均值的數(shù)值的出現(xiàn)概率在x軸正向和負(fù)向上均等地逐漸減小。同樣地,正態(tài)分布曲線兩端的極小值也不太可能出現(xiàn)。例如,14歲女孩的身高數(shù)據(jù)是服從正態(tài)分布的。大多數(shù)女孩的身高都接近平均水平。但是每個人的身高與均值之間存在一定的差異。此外,身高低于平均數(shù)的女孩數(shù)等于身高高于平均數(shù)的女孩數(shù),極矮的女孩和極高的女孩很少出現(xiàn)。
正態(tài)分布參數(shù)主要包括均值μ和標(biāo)準(zhǔn)差σ。正態(tài)分布的參數(shù)會改變圖像的形狀和位置。平均值決定了正態(tài)分布曲線的峰值的位置。大多數(shù)數(shù)值是接近平均值。改變平均值將使整個曲線在x軸上向左或向右移動。標(biāo)準(zhǔn)差是關(guān)于變異性的參數(shù)。它決定正態(tài)分布曲線的形狀。標(biāo)準(zhǔn)差反映了數(shù)據(jù)在多大程度上是離散的,也就是數(shù)據(jù)“遠(yuǎn)離”平均值的程度、數(shù)據(jù)的分散程度。正態(tài)分布的3σ原則是,與μ相差不超過一個σ的數(shù)據(jù)的出現(xiàn)概率為68.27%,與μ相差不超過一個σ的數(shù)據(jù)的出現(xiàn)概率為95.45%,與μ相差不超過一個σ的數(shù)據(jù)的出現(xiàn)概率為99.74%[5]。
接下來,筆者以養(yǎng)豬場對生豬的重量分布情況評估為例,說明正態(tài)分布在企業(yè)經(jīng)營中的應(yīng)用。秦叔叔經(jīng)營著一家養(yǎng)豬場,其中有大約10000頭成年豬。由于近期豬肉的價格上漲,他打算賣掉一部分生豬。在賣掉生豬前,他需要先了解現(xiàn)有的成年生豬的重量分布情況。他隨機(jī)抽取了100頭成年豬,并測定了它們的重量。這些成年豬的重量的平均值是350kg,標(biāo)準(zhǔn)差為50kg。秦叔叔決定只賣掉重量為400kg以上的成年生豬,那么他可以賣掉多少頭豬?
在這個問題中,我們需要首先對自然條件下生豬的重量分布規(guī)律進(jìn)行基本的估計,由于所有的生豬都處于完全相同的生長條件下,其重量服從正態(tài)分布。對被抽到的100頭成年豬的重量數(shù)據(jù)進(jìn)行分析,可以得到正態(tài)分布的兩個十分關(guān)鍵的特征數(shù)據(jù)——成年豬的重量的平均值是350kg,標(biāo)準(zhǔn)差是50kg。如果用X表示成年豬的重量這一變量,則可以根據(jù)前述分析得到X服從平均值為350、標(biāo)準(zhǔn)差為50的正態(tài)分布,因此,我們可以根據(jù)正態(tài)分布的3σ原則,得到該養(yǎng)殖場中成年豬的重量分布情況:重量介于300~400kg之間的成年豬約占總數(shù)的68.27%,也就是約6827頭,重量介于250~450kg之間的成年豬約占總數(shù)的95.45%,也就是約9545頭,重量介于200~500kg之間的成年豬約占總數(shù)的99.74%,也就是約9974頭。由于這10000頭成年豬的重量關(guān)于其平均值對稱,我們可以推測,重量超過400kg的成年豬的數(shù)量約為(10000-6827)/2≈1587頭。由此可見,養(yǎng)豬場中的大多數(shù)豬沒有達(dá)到市場上的售賣要求,應(yīng)當(dāng)繼續(xù)養(yǎng)殖。此外,該養(yǎng)豬場可能需要改變當(dāng)前的養(yǎng)殖策略,才能使大多數(shù)豬的重量超過400kg,提高養(yǎng)豬場的銷售收入。
應(yīng)用概率論與數(shù)理統(tǒng)計知識,人們可以高效解決生產(chǎn)生活中的許多問題。概率知識可以幫助人們預(yù)測隨機(jī)事件發(fā)生的可能性,統(tǒng)計知識可以幫助人們根據(jù)樣本推斷總體的特征,或者根據(jù)歷史數(shù)據(jù)預(yù)測某些變量的未來變化趨勢。在經(jīng)營企業(yè)的過程中,經(jīng)營者應(yīng)當(dāng)運(yùn)用概率統(tǒng)計知識建模,預(yù)測盈利事件或虧損事件的發(fā)生概率,判斷某些經(jīng)濟(jì)變量的變化趨勢,從而更高效地決策。