朱夢(mèng)楠 彭濤 陳軻
(江蘇大學(xué)能源與動(dòng)力工程學(xué)院 江蘇鎮(zhèn)江 212013)
奧運(yùn)會(huì)獎(jiǎng)牌榜影響因素的數(shù)學(xué)分析①
朱夢(mèng)楠 彭濤 陳軻
(江蘇大學(xué)能源與動(dòng)力工程學(xué)院 江蘇鎮(zhèn)江 212013)
利用第26~31屆夏季奧運(yùn)會(huì)獎(jiǎng)牌榜排名前10位國(guó)家的相關(guān)數(shù)據(jù),使用多元線性回歸法建立了奧運(yùn)會(huì)獎(jiǎng)牌榜排名在影響因素:國(guó)家綜合實(shí)力、人口數(shù)量、國(guó)家體制和東道主效應(yīng)作用下的線性回歸方程。運(yùn)用基于GM(1,1)模型的灰色預(yù)測(cè),利用前6屆國(guó)家影響?yīng)勁瓢衽琶嚓P(guān)數(shù)據(jù),預(yù)測(cè)出了2020年相應(yīng)影響因素對(duì)應(yīng)的數(shù)值,采用加權(quán)求和和定量計(jì)算的方式預(yù)測(cè)了2020年?yáng)|京奧運(yùn)會(huì)的獎(jiǎng)牌榜前10名的排名。
獎(jiǎng)牌榜排名 影響因素 多元線性回歸 灰色預(yù)測(cè)
2016年里約奧運(yùn)會(huì)已經(jīng)落下帷幕,中國(guó)代表隊(duì)取得了金牌榜第三,獎(jiǎng)牌榜第二的好成績(jī)。2020年?yáng)|京奧運(yùn)在即,一旦比賽敲響,一切準(zhǔn)備與喧嘩都將化為賽場(chǎng)上的真實(shí)較量。哪個(gè)國(guó)家將在本次奧運(yùn)會(huì)上爭(zhēng)奪最多的獎(jiǎng)牌?哪個(gè)國(guó)家的國(guó)歌將最頻繁地在奧運(yùn)領(lǐng)獎(jiǎng)臺(tái)上響起?這些問(wèn)題也成為人們期待中的熱點(diǎn)[1]。一個(gè)國(guó)家所獲得的獎(jiǎng)牌數(shù)不僅僅受到運(yùn)動(dòng)員競(jìng)技水平單一要素的影響,更受到國(guó)家經(jīng)濟(jì)實(shí)力、人口數(shù)量、政治結(jié)構(gòu)等多因素的影響。對(duì)于奧運(yùn)會(huì)獎(jiǎng)牌榜排名的影響因素,已經(jīng)有學(xué)者開(kāi)始相關(guān)的研究工作。但是相關(guān)文獻(xiàn)研究大多只進(jìn)行定性分析,而不進(jìn)行定量分析。在定量分析的研究中,存在著相關(guān)影響因素少、分析方法單一的問(wèn)題。本文在借鑒以前相關(guān)研究的基礎(chǔ)上,通過(guò)多元線性回歸模型,建立了2020年?yáng)|京奧運(yùn)會(huì)獎(jiǎng)牌榜排名預(yù)測(cè)的數(shù)學(xué)模型。影響2020年?yáng)|京奧運(yùn)會(huì)的因素有國(guó)家綜合實(shí)力、人口數(shù)量、政治體制和東道主組成,本文分別選用人均GDP,人口規(guī)模等級(jí),同時(shí)將政治體制和東道主用虛擬變量1,0表示,分別作為相應(yīng)因素的指標(biāo),采用加權(quán)求和和定量計(jì)算的方式預(yù)測(cè)了2020年?yáng)|京奧運(yùn)會(huì)的獎(jiǎng)牌榜排名。
預(yù)測(cè)奧運(yùn)會(huì)的獎(jiǎng)牌榜排名這一問(wèn)題,本質(zhì)上為統(tǒng)計(jì)學(xué)問(wèn)題,即運(yùn)用一些基于客觀變量的數(shù)學(xué)模型對(duì)奧運(yùn)比賽進(jìn)行預(yù)測(cè),問(wèn)題的關(guān)鍵在于找到各個(gè)影響因素對(duì)于獲得獎(jiǎng)牌事件影響作用的大小。影響?yīng)勁瓢衽琶囊蛩胤譃閲?guó)家綜合實(shí)力、人口、政治環(huán)境、舉辦地四個(gè)指標(biāo),分別以人均GDP,人口規(guī)模等級(jí),政治體制以及東道主效應(yīng)作為反映以上4點(diǎn)影響因素的指標(biāo)。這4個(gè)指標(biāo)的影響系數(shù)分別為人均GDP對(duì)獎(jiǎng)牌榜的影響系數(shù)β1,人口總量對(duì)獎(jiǎng)牌榜的影響系數(shù)β2,政治環(huán)境對(duì)獎(jiǎng)牌榜的影響系數(shù)β3,東道主對(duì)獎(jiǎng)牌榜的影響系數(shù)β4。
總的說(shuō)來(lái),國(guó)家的綜合實(shí)力E是否雄厚,決定這個(gè)國(guó)家對(duì)體育事業(yè)資金投入的多少。如果各個(gè)國(guó)家各種人才的概率分布是相同的,那么在其他條件相同的情況下,人口規(guī)模等級(jí)P大的國(guó)家將擁有絕對(duì)數(shù)量更多的優(yōu)秀運(yùn)動(dòng)員,大大提高一個(gè)國(guó)家在奧運(yùn)會(huì)得獎(jiǎng)的概率。人口規(guī)模與等級(jí)的關(guān)系見(jiàn)表1所示。國(guó)家性質(zhì)決定政府職能,政府制定什么樣的政策取決于一個(gè)國(guó)家用的是什么樣的體制。這里把國(guó)家體制G作為政府政策的主要影響因素。而國(guó)家體制G是指一個(gè)國(guó)家采取的社會(huì)制度,主要分為社會(huì)主義國(guó)家和資本主義國(guó)家兩類(lèi)。通常社會(huì)主義國(guó)家的中央政府比資本主義國(guó)家有更高的號(hào)召力和對(duì)全國(guó)資源的整合能力。這里把國(guó)家體制G作為虛擬變量,取值0或1,1表示社會(huì)主義,0表示資本主義。東道主H擁有主場(chǎng)優(yōu)勢(shì)的同時(shí),本國(guó)運(yùn)動(dòng)員對(duì)本國(guó)的氣候、食物等條件比外國(guó)運(yùn)動(dòng)員更加適應(yīng)[2],這里東道主效應(yīng)H為虛擬變量,取值0或1,1表示有東道主效應(yīng),0表示無(wú)東道主效應(yīng)。
表1 人口規(guī)模與等級(jí)的關(guān)系
表2 6屆獎(jiǎng)牌榜前10名國(guó)家獎(jiǎng)牌榜影響因素加權(quán)值
表3 2020年獎(jiǎng)牌榜排名影響因素預(yù)測(cè)值
利用獎(jiǎng)牌積分作為獎(jiǎng)牌榜排名確定的依據(jù),其中獎(jiǎng)牌積分計(jì)算方法為:Y=金牌數(shù)×5+銀牌數(shù)×3+銅牌數(shù)×1(即金牌權(quán)重為5分,銀牌權(quán)重為3分,銅牌的權(quán)重為1分)。
一般而言,設(shè)系統(tǒng)變量y與k個(gè)自變量x1,x2…xk之間存在統(tǒng)計(jì)線性相關(guān)關(guān)系,且給定n組樣本數(shù)據(jù)點(diǎn)如下:
多元線性回歸模型可以表示為:
解上面的方程組即可得到a0,a1,…,ak的估計(jì)值,系統(tǒng)值獎(jiǎng)牌榜排名Y即是在4個(gè)自變量:人均GDP、人口規(guī)模等級(jí)、政治體制以及東道主效應(yīng)作用下的線性回歸問(wèn)題??梢哉J(rèn)為每屆奧運(yùn)會(huì)獲得獎(jiǎng)牌榜前10名的國(guó)家基本不變,即可以認(rèn)為每屆奧運(yùn)會(huì)獎(jiǎng)牌榜的前10名從以前得過(guò)奧運(yùn)會(huì)獎(jiǎng)牌榜前10名的國(guó)家中產(chǎn)生。這種假設(shè)符合實(shí)際情況的同時(shí),減少了數(shù)據(jù)收集和分析的工作量。收集1996—2016年得過(guò)奧運(yùn)會(huì)獎(jiǎng)牌榜前10名的16個(gè)國(guó)家的人均GDP、人口規(guī)模等級(jí)、政治體制以及東道主效應(yīng),按照獎(jiǎng)牌榜積分值計(jì)算方法得到表2的數(shù)據(jù)。
利用MATLAB中regress多元線性回歸分析得到的結(jié)果為:Y=-201.2233+23.5087×E+96.5315×P+33.3057×G+1.0899×H。
灰色預(yù)測(cè)模型是通過(guò)少量的、不完全的信息,建立數(shù)學(xué)模型并做出預(yù)測(cè)的一種預(yù)測(cè)方法。當(dāng)我們應(yīng)用運(yùn)籌學(xué)的思想方法解決實(shí)際問(wèn)題,制定發(fā)展戰(zhàn)略和政策、進(jìn)行重大問(wèn)題的決策時(shí),都必須對(duì)未來(lái)進(jìn)行科學(xué)的預(yù)測(cè)。預(yù)測(cè)是根據(jù)客觀事物的過(guò)去和現(xiàn)在的發(fā)展規(guī)律,借助于科學(xué)的方法對(duì)其未來(lái)的發(fā)展趨勢(shì)和狀況進(jìn)行描述和分析,并形成科學(xué)的假設(shè)和判斷。所以,基于我們收集到的有限的數(shù)據(jù),我們利用灰色預(yù)測(cè)模型,分別預(yù)測(cè)出2020年的參賽國(guó)家的人均GDP以及人口數(shù)量的變化?;疑A(yù)測(cè)的一般步驟如下文所示:
表4 2020年?yáng)|京奧運(yùn)會(huì)獎(jiǎng)牌榜預(yù)測(cè)排名
表5 模型綜述
表6 參數(shù)估計(jì)值
在此我們依據(jù)x(0)數(shù)據(jù)建立GM(1,1)實(shí)現(xiàn)預(yù)測(cè)功能,具體步驟如此下:記x(1)為生成數(shù)列:
對(duì)x(1)(t)建立x(1)(t)的一階線性微分方程:
其中a,b為待定系數(shù),分別為發(fā)展系數(shù)和灰色作用量,a的區(qū)間為(-2,2),記a,b組成的矩陣為求出參數(shù)a,b,就能求出進(jìn)而求出的預(yù)測(cè)值。
對(duì)累加生成數(shù)據(jù)做均值生成B與常數(shù)項(xiàng)向量yn,即:
用最小二乘法,通過(guò)最小誤差的平方和尋找數(shù)據(jù)函數(shù)的最佳匹配求解灰參數(shù)a':
將灰色參數(shù)a'代入進(jìn)行求解,得:
利用MATLAB軟件實(shí)現(xiàn)GM(1,1)灰色預(yù)測(cè),得出2020年16個(gè)相關(guān)國(guó)家的影響奧運(yùn)會(huì)獎(jiǎng)牌榜排名因素的權(quán)值,見(jiàn)表3。
根據(jù)多元線性回歸表達(dá)式:
可得,2020年各個(gè)國(guó)家的獎(jiǎng)牌榜排名見(jiàn)表4。
從模型可得2020年?yáng)|京奧運(yùn)會(huì)的獎(jiǎng)牌榜前10名預(yù)測(cè)結(jié)果為:中國(guó)、美國(guó)、英國(guó)、日本、德國(guó)、法國(guó)、澳大利亞、俄羅斯、韓國(guó)、西班牙。
模型的回歸系數(shù)分析見(jiàn)表5。
F分布的顯著性概率為0,即檢驗(yàn)假設(shè)“H0:回歸系數(shù)B=0”成立的概率為0,從而拒絕0假設(shè),說(shuō)明因變量與自變量的線性關(guān)系是顯著的,可建立線性模型,見(jiàn)表6。
復(fù)相關(guān)系數(shù)檢驗(yàn)如下:
y的每次取值yk(k=1,2,3…)是有波動(dòng)的,這種波動(dòng)稱(chēng)為變差。每次觀測(cè)值yk的變差大小常用該次觀測(cè)值與n次觀測(cè)值的平均值的差來(lái)表示,稱(chēng)為離差,而全部觀測(cè)值的總變差可由總的離差的平方和用Syy表示。
Q稱(chēng)為剩余平方和(或稱(chēng)殘差平方和),是實(shí)測(cè)值yk與回歸值之差的平方和,它是由試驗(yàn)誤差及其他因素引起的,其自由度f(wàn)Q=n-m-1(n為數(shù)據(jù)個(gè)數(shù),該線性回歸數(shù)據(jù)個(gè)數(shù)為16個(gè),m為自變量個(gè)數(shù),為4個(gè)),
引入無(wú)量綱指標(biāo)復(fù)相關(guān)系數(shù)R(0<R<1)作為檢驗(yàn)總的回歸效果的指標(biāo),回歸平方和U實(shí)際上是反映回歸方程中全部自變量的“方差貢獻(xiàn)”,因此R就是這種貢獻(xiàn)在總回歸平方和中所占的比例,因此R表示全部自變量與因變量y的相關(guān)程度。復(fù)相關(guān)系數(shù)越接近1,回歸效果就越好。記Ra為臨界復(fù)相關(guān)系數(shù),
當(dāng)R>Ra時(shí),稱(chēng)線性回歸方程顯著,則在4個(gè)影響因素作用下的奧運(yùn)會(huì)獎(jiǎng)牌榜排名積分線性回歸方程顯著。
F檢驗(yàn)分析如下:
要檢驗(yàn)y與x1,x2…是否存在線性關(guān)系, 就是要檢驗(yàn)假設(shè)H0:β1=β2=……=0。
當(dāng)假設(shè)H0成立時(shí),則無(wú)線性關(guān)系,否則認(rèn)為線性關(guān)系顯著。所以應(yīng)該拒絕假設(shè)H0。檢驗(yàn)假設(shè)H0應(yīng)用統(tǒng)計(jì)量這是兩個(gè)方差之比,它服從自由度為m及n-m-1的F分布,即
用此統(tǒng)計(jì)量可檢驗(yàn)回歸的總體效果。如果假設(shè)成立,則當(dāng)給定檢驗(yàn)水平α=0.01下,統(tǒng)計(jì)量F應(yīng)有對(duì)于給定的置信度α=0.01,由F分布表可查得的值,如果根據(jù)統(tǒng)計(jì)量算得的值為則拒絕假設(shè)H0, 即不能認(rèn)為全部βi為0,即m個(gè)自變量的總體回歸效果是顯著的, 否則認(rèn)為回歸效果不顯著。查表可得,則,則F檢驗(yàn)通過(guò)。
利用多元線性回歸方法得出了在國(guó)家綜合實(shí)力、人口數(shù)量、國(guó)家體制和東道主效應(yīng)4個(gè)影響因素作用下的奧運(yùn)會(huì)獎(jiǎng)牌榜積分的線性回歸方程,使用灰色預(yù)測(cè)克服了數(shù)據(jù)少且規(guī)律性不強(qiáng)的特點(diǎn)[3],預(yù)測(cè)得出了2020年?yáng)|京奧運(yùn)會(huì)的獎(jiǎng)牌榜積分前10名的國(guó)家為:中國(guó)、美國(guó)、英國(guó)、日本、德國(guó)、法國(guó)、澳大利亞、俄羅斯、韓國(guó)、西班牙。綜合以上分析,可以得出以下幾點(diǎn)結(jié)論。
(1)對(duì)回歸系數(shù)進(jìn)行檢驗(yàn),利用復(fù)相關(guān)系數(shù)檢驗(yàn)和F檢驗(yàn),說(shuō)明基于多元線性回歸方法得出的回歸方程具備合理性和科學(xué)性。采用多元線性回歸的方法,將復(fù)雜的問(wèn)題分解成能夠被量化分析的簡(jiǎn)單問(wèn)題。
(2)上述所建立的模型具有一定的推廣性,可用于以后多屆奧運(yùn)會(huì)的結(jié)果。
(3)除了上述文中已經(jīng)考慮到的因素,還有其他因素可能影響最終的結(jié)果。日后的研究中,可將更多的因素考慮進(jìn)去,做出更合理、有效地預(yù)測(cè)。
[1]王雅平.國(guó)家之間的體育角逐?——經(jīng)濟(jì)學(xué)家運(yùn)用經(jīng)濟(jì)模式預(yù)測(cè)各國(guó)奧運(yùn)獎(jiǎng)牌總數(shù)[EB/OL].http://carnegieendowment.org/2008/07/01/zhpub-47475.2017.5.14.
[2]王宇鵬,許健,張媛媛.奧運(yùn)會(huì)獎(jiǎng)牌榜影響因素的實(shí)證分析[J].統(tǒng)計(jì)研究,2008,25(10):138-139.
[3]王道林,樊新生.奧運(yùn)金牌數(shù)預(yù)測(cè)的灰色模型[J].山東體育科技,2005,27(2):45.
Use the 5 Olympic Games medal table data since the 26th Olympic Game and the multiple linear regression to establish the linear regression equation, based on the relevant factors: national comprehensive strength, population, state system and effects of the host. Based the grey forecasting model, predict the relevant data influencing the medal table. Use the weighted sum and quantitative calculate and forecast the result of the Tokyo Olympic Game medal table.
Olympic medals;Factors;Multiple linear regression;Grey forecasting model
G812
A
2095-2813(2017)09(c)-0239-05
10.16655/j.cnki.2095-2813.2017.27.239
朱夢(mèng)楠(1995,9—),男,漢族,江蘇徐州人,本科,研究方向:流體機(jī)械,計(jì)算機(jī)應(yīng)用。