吳 琴
(湖北民族學院 理學院,湖北 恩施445000)
對于很多足球名宿,曾經(jīng)都有一段罰失點球的經(jīng)歷,點球大戰(zhàn)造成了不堪回首的往事.罰球隊員如何選擇自己的射門方向?而守門員又會朝哪個方向撲救?這無疑是一場博弈,罰球隊員和守門員的博弈,又是怎樣的針鋒相對?
每一個點球涉及兩名球員:罰球隊員(shooter)和一個守門員(goalkeeper).理論上來講,一個專業(yè)的射手主罰點球,足球只需0.2 s 就能從罰球點到達球門線,而守門員的最快反應時間為0.2~0.3 s,因此罰球隊員和守門員必須同時行動,點球只有兩種結果:得分或者不得分,只能一次觸球,沒有第二次罰球的機會,罰球隊員和守門員需要自己做出抉擇[1-3].罰球隊員可以選擇三種不同射門路徑:左路、中路和右路,守門員可以選擇撲向左路或者右路封堵足球,原則上守門員可以站在中路不做移動,但除非他看出了罰球隊員明顯的射門意圖,或者故意不作撲救,否則將通常都會撲向一邊[4].
在罰點球的情境里,罰球隊員有三種選擇—打左邊(L)、打右邊(R)和打中路(C).對于一個混合策略而言,上述三種策略出現(xiàn)的概率相同,都為0.33.在一個相對理想的狀態(tài)下,即罰球隊員對守門員的撲救偏好等信息事先并不了解,那么守門員選擇左路、中路、右路的概率應該是相同的.但這是否意味著連續(xù)三次罰點球,罰球隊員會分別選擇左路、中路、右路呢?答案是否定的[5].
現(xiàn)做出如下假設:P(S)表示進球的概率,P(L)/P(R)/P(C)表示射向某一方向的概率,P(M)表示射丟的概率.根據(jù)以上假設,有:P(S)+P(M)=1,進一步地,有:
其中P(S|L)表示在已知點球射向左邊時的進球概率,P(S|R)、P(S|C)的意思也類似.
最后,為了算出點球射向任何一個方向時的進球概率有公式:
基于相同的模型,可以定義兩個不同的概率:一個是球員射點球方向與守門員撲救方向匹配的概率,一個是兩者方向不匹配時的概率.顯然,就知道守門員撲錯方向而導致得分的概率要大于守門員撲對方向而得分的概率,在這里假設射出的點球沒有擊中門楣或門柱,球也沒有飛出門框范圍之外.
出于適用性的考慮,假設所有球員踢點球的方向分為兩種(自然的方向與非自然的方向).對于一個右腳球員來說,自然的方向意味著球會自然地射向左路,對左腳球員而言則恰好相反[6].因此可以將上述問題描述為如下的博弈問題:
1)博弈參與者為兩方(罰球隊員和守門員);
2)博弈中罰球隊員有兩種決策行動:踢向自然方向、踢向非自然方向;守門員有兩種決策行動:撲向罰球者的自然方向、撲向罰球者的非自然方向;
3)博弈雙方的目的都是要獲得最后的勝利,即:罰球隊員希望破門得分,守門員希望撲出球或者球偏出門框.
參與博弈的雙方用N={1,2}表示,1 為罰球隊員,2 為守門員.罰球隊員可能的決策行動記作a1∈A1={1,2},分別表示踢向自然方向、踢向非自然方向;守門員可能的決策行動記作a2∈A2={1,2},分別表示撲向自然方向和撲向非自然方向.
對于雙方每一種可能的決策(a1,a2),用u1(a1,a2)表示對罰球隊員產(chǎn)生的結果,即進球概率百分數(shù),稱為罰球隊員的效用函數(shù).根據(jù)文獻[7],u1(a1,a2)可以用矩陣:表示,即u1(i,j)=mij,M稱為罰球隊員的贏得矩陣或支付矩陣,類似的,守門員的效用函數(shù)用u2(a1,a2)表示,顯然其贏得矩陣是-M.這種具有完全競爭性質,即一方所得正是對手所失的博弈,一般稱為零和博弈.
在博弈中雙方都力求通過決策行動使己方的效用函數(shù)最大化,用分別表示罰球隊員和守門員會選擇的決策行動,則必須滿足
對于由矩陣M給出的效用函數(shù),容易驗證(如通過枚舉)不存在純納什均衡.對于不存在純納什均衡的博弈問題,可以考慮雙方隨機的采取行動,即雙方都對每一種決策行動賦予一定的概率,形成混合策略.設罰球隊員采取行動i的概率為pi(i=1,2),守門員采取的行動j的概率為qj(j=1,2),記罰球隊員和守門員的(混合)策略集分別為:
顯然,A1中的每一個行動i也是罰球隊員的一個混合策略(采取行動i的概率為1),稱為純策略(相對于和混合策略而言).A2也類似.在混合策略下上方的效用函數(shù)用期望效用定義,記作:
注意到雙方的純策略是有限的,其純策略下的效用可以用矩陣描述,且雙方效用之和為0,這樣的博弈稱為二人零和矩陣博弈.對這種特殊類型的博弈,可以采用線性規(guī)劃求解[7].
如果罰球隊員選擇射向自然方向的概率是p,那么,當守門員撲向自然方向時,罰球隊員的期望收益為70p+93(1-p);當守門員撲向非自然方向時,罰球隊員的期望收益為95p+58(1-p).罰球隊員想使這個期望收益盡可能的大,而同時,守門員卻想使這個期望盡可能的?。e例說明,假定罰球隊員選擇踢向自然方向的概率是50%,當守門員撲向自然方向時,罰球隊員的期望收益為70* 50%+93* 50%=81.5.罰球隊員意識到,守門員總是在試圖最小化他的期望收益.因此,對于任意的p,他有期望獲得的最佳收益是上述兩個策略所給出的收益中的最小值.可以得出70p+93(1-p)=95p+58(1-p),求得p=0.583.因此得到如果罰球隊員踢向自然方向的概率為58.3%,并且,守門員做出相應的最優(yōu)反應,那么,罰球隊員將獲得的期望收益為79.59.那么守門員的情況又如何呢?對于守門員的選擇,可以進行相似的分析.假定守門員選擇撲向自然方向的概率是q,從而撲向非自然方向的概率為1-q.因此,當罰球隊員踢向自然方向時,罰球隊員的期望收益是70q+95(1-q);當罰球隊員踢向非自然方向時,罰球隊員的期望收益是93q+58(1-q).對于任意的q,守門員將使得罰球隊員的收益最小化.這種情況下,罰球隊員當然會選擇踢向自然方向.同樣的,可以得到罰球隊員最大收益點,使下面的式子成立:70q+95(1-q)=93q+58(1-q),求得q=0.617.
現(xiàn)在,已經(jīng)計算出了博弈雙方的均衡策略,罰球隊員應該按58.3%的概率踢向自然方向,守門員應該按61.7%的概率撲向自然方向.通過使對方選擇兩個策略所給出的收益相等來確定概率值,所以這些概率使得無論對方采取什么行動,罰球隊員和守門員都能得到相同的收益[8].
因此,當罰球隊員選擇p=0.583 時,守門員的撲救方向之間無差別,因此他也可以按任意的概率q撲向自然方向.特別地,守門員按概率0.617 撲向自然方向就更好了.類似的,如果守門員按照0.617 撲向自然方向,那么,罰球隊員向兩個方向踢就無差異了,或者可以選擇這兩個策略的任何混合策略.因此,這些選擇是一個納什均衡:給定對方的選擇,每一個參與人的選擇都是最優(yōu)的[9].
罰點球的時候罰球隊員和守門員之間確實存在相應的博弈關系,其中也存在一些規(guī)律.以2012 年歐洲杯的例子,是否也存在相應的規(guī)律.2012 年歐洲杯的1/4 決賽,英格蘭vs 意大利的點球大戰(zhàn),罰球隊員和守門員的技術動作記錄如表1 和表2 所示.
上面已經(jīng)得到的結論是:罰球隊員應該按58.3%的概率踢向自然方向,守門員應該按61.7%的概率撲向自然方向.即:罰球隊員和守門員都傾向于踢(撲)向自然方向.
在觀察了意大利和英格蘭隊的9 個點球,其中7 名右腳射門的球員中5 人將球射向了左路,2 人射向了中路,2 名左腳射門的球員分別將球射向了左路和右路,那么,9 名罰球隊員中射向自然方向的人數(shù)是6 人,3人射向了非自然方向,那么罰球隊員在罰點球的時候確實傾向于射向自然方向,考慮到樣本數(shù)量有限,計算出來的數(shù)據(jù)有所偏差,也在預計之中.對于守門員來說,英格蘭門將喬哈特和意大利門將布馮在9 次撲救中6 次選擇了自然方向,這和之前的研究結果(守門員傾向于選擇撲向自然方向)相吻合.這個特點尤其體現(xiàn)在喬哈特身上,5 次撲救4 次都是自然方向.而布馮的撲救規(guī)律就沒那么明顯,這也體現(xiàn)出優(yōu)秀守門員的價值:不會讓對方輕易摸到自己的撲救規(guī)律.
表1 意大利隊球員技術動作統(tǒng)計Tab.1 Statistics of the Italian team players' technical action
表2 英格蘭隊球員技術動作統(tǒng)計Tab.2 Statistics of the England team players' technical action
觀察點球大戰(zhàn)時的幾個關鍵球,一個是皮爾洛的扳平球,皮爾洛右腳射門,把球射向了非自然方向(中路),騙過門將輕松得分;一個是迪亞曼蒂的制勝球,迪亞曼蒂左腳射門,也是把球射向了非自然方向(右路),得分.再看全場唯一被撲住的點球:阿什利科爾左腳射門,射向了自然方向,力道和角度欠佳,被守門員布馮輕松撲獲.從這幾個關鍵球可以看出:往往罰球隊員射向非自然方向是取得進球的好辦法,而罰球隊員總是選擇自然方向,如果力道和角度不夠刁鉆,則很有可能被守門員撲出.
在均衡狀態(tài)下,罰球隊員的期望收益為79.59.如果對方做出最優(yōu)選擇,那么,這就是守門員的最優(yōu)選擇.如果守門員沒有做出最優(yōu)的反應,情況又怎樣呢?可以得到,當p <0.583 時,守門員將撲向自然方向;當p >0.583 時,守門員將撲向非自然方向.類似的,當q <0.617 時,罰球隊員將踢向自然方向;當q >0.617時,罰球隊員將踢向非自然方向.
因此在足球比賽罰點球中,運動員和教練只要在戰(zhàn)術上運用得當,運動員強大的心理素質,教練員和運動員在點球前對對手的技術特點加以認真細致的研究,就能在罰點球的時候發(fā)揮較好的水平.
[1] 周培勇,呂中凡,豬俁公宏,等.從守門員撲點球動作的時間空間特征看足球運動員點球射門區(qū)域選擇策略[J]. 首都體育學院學報,2013,25(1):67-71.
[2] 謝明.對點球射門區(qū)域的探討[J].成都體育學院學報,2002,28(3):62-64.
[3] 張曉剛.足球守門員在防守點球運動情境中眼動特征的研究[J].中國體育科技,2010,46(1):88-92.
[4] 周培勇,豬俁公宏.優(yōu)秀足球守門員應對點球的認知行動策略[J].中國體育科技,2010,46(6):39-45.
[5] 王祥.世界杯點球決戰(zhàn)中技術運用及策略分析[J].蘇州大學學報:自然科學版,2010,26(2):91-94.
[6] Andrewzxyjy.點球納什均衡與博奕論[EN/OL].(2012-10-20)[2014-08-12],http://soccer.hupu.com/columm/42995.html.
[7] 張啟金,陳文略.點球進攻的數(shù)學模型[J].黃岡師范學院學報,2002,22(6):15-16,60.
[8] 李丹.基于有限次重復博弈的足球點球策略分析[J].山西青年:下半月,2013(5):147.
[9] 李益群,謝亞龍.體育博弈論[M].北京:北京體育大學出版社,2002:88-89.