林宸
摘 要:2018年末以來,隨著豬流感疫情的不斷傳播發(fā)展,國(guó)內(nèi)的生豬價(jià)格飛漲,這對(duì)人民的生產(chǎn)生活造成了一定的影響。為此本文希望通過研究豬肉價(jià)格和居民生活相關(guān)的恩格爾系數(shù)之間的關(guān)系,探究生豬價(jià)格的變化對(duì)恩格爾系數(shù)的影響。本文根據(jù)最小二乘法,利用EXCEL對(duì)廣州等五個(gè)城市的調(diào)研數(shù)據(jù)進(jìn)行擬合分析,給出相關(guān)合理解釋,并預(yù)測(cè)2019年的恩格爾系數(shù)。
關(guān)鍵詞:最小二乘法;EXCEL;曲線擬合;預(yù)測(cè);
1.引言
恩格爾系數(shù)是用于衡量一個(gè)國(guó)家或地區(qū)居民用于食品類支出占所有花費(fèi)總比重的數(shù)字,由德國(guó)統(tǒng)計(jì)學(xué)家恩格爾于19世紀(jì)提出[1],隨后在不同國(guó)家和地區(qū)得到了廣泛的應(yīng)用。特別地,恩格爾系數(shù)在我國(guó)的統(tǒng)計(jì)數(shù)據(jù)中也占有舉足輕重的地位,每年的統(tǒng)計(jì)數(shù)據(jù)也不可或缺。由于2018年以來全球各地爆發(fā)的豬瘟疫情蔓延到中國(guó),使得我國(guó)的生豬行情收到很大影響,各地的豬肉價(jià)格也一路走高,豬肉相關(guān)概念股也隨之飛漲。這激發(fā)本文去探究生豬價(jià)格對(duì)恩格爾系數(shù)的影響關(guān)系,并通過統(tǒng)計(jì)數(shù)學(xué)的相關(guān)方法,對(duì)此進(jìn)行研究。
另一方面,在進(jìn)行科學(xué)實(shí)驗(yàn)和工程實(shí)踐的過程當(dāng)中,經(jīng)常遇到一些復(fù)雜的問題,這些問題最終都可以歸納為數(shù)學(xué)方程組。通過對(duì)這些數(shù)學(xué)方程組或者模型進(jìn)行分析和求解,得到問題最終的解。但是并不是所有的模型都可以采用數(shù)學(xué)分析的方法。因此就產(chǎn)生了通過將這些連續(xù)的模型轉(zhuǎn)換為離散的模型,通過差分方法得到最終解。這就是數(shù)值分析發(fā)展的過程,由此產(chǎn)生了一系列的數(shù)值計(jì)算的方法。本文研究的最小二乘法即是其中的一種方法,是一種使用較為廣泛的數(shù)值優(yōu)化方法,是18世紀(jì)勒讓德和高斯共同發(fā)明發(fā)展用于統(tǒng)計(jì)及其誤差推算,應(yīng)用極為廣泛的計(jì)算方法。這方法及其發(fā)展延伸的算法幾乎應(yīng)用于所有的統(tǒng)計(jì)計(jì)算中。包括同學(xué)們考試成績(jī)推算,學(xué)區(qū)房?jī)r(jià)推算及豬肉價(jià)格分析,氣溫和冰鎮(zhèn)可樂銷售量的關(guān)系分析等等[2-4]。最小二乘法是找尋擬合函數(shù)值與實(shí)際函數(shù)值之差的平方和最小的方式,來構(gòu)建該擬合函數(shù),即所有觀察點(diǎn)的誤差的平方和最小。利用最小二乘法擬合出的曲線,還可以對(duì)其余的數(shù)據(jù)進(jìn)行估計(jì)或預(yù)測(cè)。
本文通過觀察不同城市的生豬價(jià)格和恩格爾系數(shù)的關(guān)系,利用最小二乘法的原理,對(duì)其關(guān)系進(jìn)行量化,進(jìn)行曲線擬合,并對(duì)2019年的恩格爾系數(shù)進(jìn)行估計(jì)預(yù)測(cè)。
2.最小二乘法
2.1 最小二乘法的原理
假設(shè)隨機(jī)變量Y與x存在某種相關(guān)關(guān)系。x是一般變量,而Y是隨機(jī)變量,則對(duì)于每一個(gè)確定的x值,Y有其分布,并且對(duì)于每一組這樣的(x,Y),都有潛在的對(duì)應(yīng)關(guān)系。我們?nèi)タ疾炱渲械年P(guān)系,求Y的數(shù)學(xué)期望,記為E(Y)。我們記E(Y)=μ(x),其中μ(x)為x的擬合函數(shù)。在實(shí)際問題中,擬合函數(shù)μ(x)一般是未知的,進(jìn)行擬合分析的任務(wù)是在于根據(jù)實(shí)驗(yàn)數(shù)據(jù)去估計(jì)擬合函數(shù),并且對(duì)所求出的擬合曲線進(jìn)行分析,討論其是否合理等內(nèi)容。
對(duì)于x取一組不完全相同的值x1,x2…xn,設(shè)Y1,Y2,…Yn分別是其獨(dú)立的觀察結(jié)果,稱(x1,Y1),(x2,Y2),…(xn,Yn)是一個(gè)樣本集合,將其描繪在直接坐標(biāo)系中,得到一系列散點(diǎn),叫做散點(diǎn)圖。通過散點(diǎn)圖的形狀,可以大致看出擬合函數(shù)μ(x)的表達(dá)形式。一般而言,μ(x)的表達(dá)形式可以是一元函數(shù)形式,也可以是多元函數(shù)形式,針對(duì)一元函數(shù)表達(dá)式,我們令表達(dá)式為μ(x)=a+bx,此時(shí)對(duì)μ(x)進(jìn)行估計(jì)的問題就叫做一元線性擬合問題。假定對(duì)于所觀測(cè)區(qū)間內(nèi)的所有點(diǎn)(x,Y)都有,Y服從于a+bx,且誤差的絕對(duì)值不超過σ2,記為
2.3曲線擬合
曲線擬合就是從給定的數(shù)據(jù)點(diǎn)當(dāng)中找出這些數(shù)據(jù)點(diǎn)所呈現(xiàn)的規(guī)律,通常這些點(diǎn)的規(guī)律可以用曲線的函數(shù)方程進(jìn)行表示。曲線擬合廣泛應(yīng)用于科學(xué)實(shí)驗(yàn)和工程實(shí)踐當(dāng)中,是擬合中的一種重要方法。曲線擬合適用于觀測(cè)數(shù)據(jù)的誤差較大,不可能也沒有必要將它作為準(zhǔn)確值來處理的數(shù)據(jù)問題,則只要求所構(gòu)造的函數(shù)盡可能靠近這些采樣點(diǎn)即可。即要求所構(gòu)造的函數(shù)gx和采樣點(diǎn)(xi,yi)(i=1,2,…n)之間滿足某種誤差準(zhǔn)則,如滿足最小二乘法的曲線擬合關(guān)系,
使總的偏差Q最小。按照上述要求構(gòu)造函數(shù)gx的方法,就是曲線擬合方法。其中g(shù)x稱為擬合函數(shù)??梢娗€擬合方法是用于觀測(cè)數(shù)據(jù)本來就含有不可避免誤差的場(chǎng)合,其中構(gòu)造出的函數(shù)gx不需要都通過這些采樣點(diǎn)(xi,yi),而只需要盡可能的靠近這些采樣點(diǎn)即可。為了提高擬合函數(shù)的精度或準(zhǔn)確性,我們應(yīng)該增大觀察的樣本,提供數(shù)量足夠多的采樣點(diǎn)。
3.最小二乘法的應(yīng)用
本文通過調(diào)研得到五個(gè)城市不同年份的豬肉價(jià)格和恩格爾系數(shù),對(duì)其進(jìn)行建模分析,利用最小二乘法進(jìn)行曲線擬合,量化二者之間的關(guān)系。然后根據(jù)2019年的豬肉價(jià)格,對(duì)當(dāng)年的恩格爾系數(shù)進(jìn)行預(yù)測(cè)。
通過第二章的公式進(jìn)行計(jì)算,得到每個(gè)城市對(duì)應(yīng)的曲線的參數(shù)值結(jié)果如下表所示:
則可計(jì)算出每個(gè)城市的一元擬合函數(shù),比如廣州的為y1(x)=0.037293x+31.97762:,則帶入2019年的豬肉價(jià)格35.8,可以得到2019年度的恩格爾系數(shù)33.31271。同理可得其他幾個(gè)城市的擬合函數(shù)和2019年預(yù)測(cè)的恩格爾系數(shù)。
接下來我們將用EXCEL軟件對(duì)這些數(shù)據(jù)進(jìn)行處理,并且通過EXCEL圖表的方式對(duì)擬合曲線與點(diǎn)的關(guān)系進(jìn)行直觀的展示。
如圖1所示是五個(gè)城市的豬肉價(jià)格和恩格爾系數(shù)的一元函數(shù)擬合曲線,從圖中可以看出,各個(gè)點(diǎn)都分布在函數(shù)的周圍,并且是以平方和最小的方式排布的。因此我們可以說豬肉價(jià)格對(duì)居民恩格爾系數(shù)有一定的相關(guān)性的影響。1)廣州、南昌、滄州等三市恩格爾系數(shù)隨著豬肉價(jià)格的上漲而升高,呈現(xiàn)正相關(guān)性。成都、溫州兩市恩格爾系數(shù)隨著豬肉價(jià)格的上漲而下降,呈現(xiàn)負(fù)相關(guān)性。這可能是由于成都、溫州兩市本來就在肉類支出較高,因此豬肉價(jià)格上漲之后,適量的減少了采購(gòu),居民對(duì)豬肉價(jià)格的上漲有很大的調(diào)節(jié)空間。2)而為何廣州豬肉價(jià)格和南昌豬肉價(jià)格相差不大情況下,廣州的恩格爾系數(shù)會(huì)比南昌的要高,這主要是因?yàn)槎鞲駹栂禂?shù)的影響因子較多,豬肉價(jià)格僅是一方面原因,比如廣州對(duì)飲食方面的支出較大,因此雖然廣州的人均GDP較高,但還是豬肉價(jià)格差不多的情況下,出現(xiàn)了恩格爾系數(shù)較大的情況。
綜上,恩格爾系數(shù)和不同城市的飲食文化,消費(fèi)理念也有較大關(guān)系。經(jīng)濟(jì)數(shù)據(jù)只是客觀反映實(shí)際情況,但是受多方面因素的影響。并且根據(jù)該擬合曲線,我們可以計(jì)算出2019年的恩格爾系數(shù),對(duì)重要的經(jīng)濟(jì)數(shù)據(jù)指標(biāo)預(yù)估。
4.結(jié)論
本文通過對(duì)最小二乘法原理的介紹,描述了其自變量與因變量的關(guān)系,以及怎樣利用已知數(shù)據(jù)計(jì)算其一元擬合函數(shù)的相關(guān)系數(shù)。最后將最小二乘法應(yīng)用到實(shí)際生活當(dāng)中,通過調(diào)研不同城市豬肉價(jià)格和恩格爾系數(shù),量化了二者之間的關(guān)系。并且利用EXCEL軟件對(duì)這一關(guān)系進(jìn)行了直觀的展示,分析了其中的原因。最后對(duì)2019年為公布的恩格爾系數(shù)進(jìn)行了預(yù)測(cè),能對(duì)居民的生活質(zhì)量和當(dāng)前經(jīng)濟(jì)形勢(shì)有一個(gè)前瞻性的了解。
參考文獻(xiàn)
[1] 王少飛.用恩格爾系數(shù)衡量居民生活水平的可行性研究[J].統(tǒng)計(jì)研究,2002(6):19-22.
[2] 鄒樂強(qiáng).最小二乘法原理及其簡(jiǎn)單應(yīng)用[J].科技信息,2010(23):282-283.
[3] 陸健.最小二乘法及其應(yīng)用[J].中國(guó)西部科技,2007(12):19-21.
[4] 商繼敏,王海燕,蔣逢春等.最小二乘法對(duì)溫度傳感器測(cè)溫?cái)?shù)據(jù)線性擬合及其應(yīng)用[J],大學(xué)物理實(shí)驗(yàn),2019(2):81-84.