一、簡介
當(dāng)今社會,網(wǎng)球這項(xiàng)體育運(yùn)動越來越受歡迎。頻繁的賽季轉(zhuǎn)換、高密度的比賽安排和以賽代練是網(wǎng)球的顯著特點(diǎn)[1],當(dāng)描述比賽的整體走勢出現(xiàn)了不可思議的波動或者轉(zhuǎn)折點(diǎn)時,“勢頭”這個詞被經(jīng)常提及?!皠蓊^”指運(yùn)動員在一系列事件之后獲得的一種能夠提升比賽狀態(tài)和氣勢的動力,它在網(wǎng)球比賽的走勢中起到了相當(dāng)重要的作用。[2]
在2023年溫布爾登網(wǎng)球公開賽男子單打決賽中,盡管阿爾卡拉斯在第一盤中落后了5分,他在第二、三、五盤中分別以7-6, 6-1, 6-4比分獲勝,最終逆轉(zhuǎn)局勢,打敗了德約科維奇。于是,一個自然的想法是,在這場比賽中“勢頭”在阿爾卡拉斯第一盤大幅度落后及后面乘勝追擊時發(fā)揮作用,扭轉(zhuǎn)了比賽結(jié)果。根據(jù)以上背景,本文將“勢頭”選做研究對象。但考慮到“勢頭”是一種球員在比賽過程中擁有動力的主觀感受,很難進(jìn)行準(zhǔn)確的刻畫,無法衡量球員在某一時刻有多少“勢頭”,也難以說明“勢頭”在一場比賽中是如何產(chǎn)生及變化的。
基于此,本文的主要任務(wù)是給“勢頭”一個量化的指標(biāo),找到在“勢頭”不斷作用下比賽局勢發(fā)生逆轉(zhuǎn)的具體時刻,同時找出對“勢頭”影響較大的因素。本文利用2023年溫布爾登網(wǎng)球公開賽男子單打比賽的數(shù)據(jù)進(jìn)行研究,并考慮了如下假設(shè):
1.兩個球員綜合實(shí)力的差距可以用他們在ATP上的實(shí)時排名的差距來衡量。
2.環(huán)境等客觀因素如天氣、場地等不影響球員的表現(xiàn)水平。這是因?yàn)楸荣悤虿焕硐氲奶鞖庋雍?,并且承辦比賽的場地均滿足一定的標(biāo)準(zhǔn)。
3.比賽輪次不影響球員的狀態(tài)。即每個球員的比賽狀態(tài)在不同場、盤及局中保持穩(wěn)定。
4.每一分的比賽結(jié)果只影響球員下一分比賽中的表現(xiàn)水平,且每一分在比賽進(jìn)程中的位置不影響球員的狀態(tài)。由于比賽的盤數(shù)和比分在一定程度上能夠體現(xiàn)比賽的進(jìn)程,于是本文假定在局點(diǎn)和盤點(diǎn)時的關(guān)鍵分與非關(guān)鍵分對球員的影響是一樣的。
5.每一得分的性質(zhì)相同。由于雙發(fā)失誤、ACE球、破發(fā)點(diǎn)等具有特殊性質(zhì)的分已經(jīng)在比賽結(jié)果比分中有所反映,故此處不加以考慮。
二、數(shù)據(jù)集介紹及預(yù)處理
2023年溫布爾登網(wǎng)球公開賽男子單打比賽決賽的數(shù)據(jù)包含了31場比賽中每一分的信息。每一行數(shù)據(jù)含有比賽編號、盤數(shù)、局?jǐn)?shù)、分、球員雙方的名稱等基本信息。本文將此數(shù)據(jù)集中的每行分別以兩個球員作為主體,拆分為兩行,將數(shù)據(jù)集整理成共含有了14568行的新數(shù)據(jù)集。則新數(shù)據(jù)集的各行擁有唯一主體,稱為球員,同一分中的另一方被稱為對手。
數(shù)據(jù)集中與比賽表現(xiàn)相關(guān)的變量符號及含義如表1、表2、表3所示。
此外,本文還定義了兩個組合變量:Server_count×Server,Server×Speed_no,分別記為Server_no,Speed。根據(jù)假設(shè)5,P1_ace,P1_break等變量含有的特殊信息已蘊(yùn)含在比分中,故不需要添加額外變量。
本文利用隨機(jī)森林填補(bǔ)了speed_no中含有的752個缺失值。經(jīng)過檢驗(yàn),未發(fā)現(xiàn)不符合常識的離群值,故不進(jìn)行其他處理。
三、“勢頭”的衡量及比賽結(jié)果的估計(jì)
(一)基于TOPSIS熵權(quán)法的“勢頭”的量化估計(jì)
考慮到“勢頭”是一種比賽狀態(tài),本文利用與比賽表現(xiàn)相關(guān)的變量來估計(jì)球員在比賽指定時刻的“勢頭”的多少。
根據(jù)假設(shè)3與4,每一分所處位置不影響球員狀態(tài),故本文能夠把每一分的信息作為被評價(jià)對象,并利用TOPSIS熵權(quán)法給出一個比賽狀態(tài)評分。評分越高說明球員在這一分的“勢頭”越大,表現(xiàn)得越好,贏的可能性也越大。此評分就是“勢頭”的一個量化指標(biāo)。
1.熵權(quán)法為指標(biāo)賦權(quán)
指標(biāo)權(quán)重的確定是TOPSIS的重要環(huán)節(jié),而采用熵權(quán)法可有效消除主觀判斷的影響。它利用熵值判斷指標(biāo)的離散程度,并把熵值更大的指標(biāo)賦予更高的權(quán)重。接下來采用此方法計(jì)算權(quán)重。
共有14568個被評價(jià)的分,24個評價(jià)指標(biāo)。首先構(gòu)建判斷矩陣:X=(xij)14568*24(i=1,2,…,14568;j=1,2,…,24)。對判斷矩陣進(jìn)行標(biāo)準(zhǔn)化處理,得到
xij'=xijxjmax
其中xjmax指第j個指標(biāo)的最大值。接下來計(jì)算信息熵
Hj=-k∑14568i=1pijlnpij,j=1,2,…,24
其中pij=xij'∑14568i=1xij' ,k=1ln14568。進(jìn)一步得到第j個指標(biāo)的權(quán)重
ωj=1-Hj∑24j=11-Hj
其中ωj∈[0,1],且 ∑24j=1ωj=1。指標(biāo)權(quán)重計(jì)算結(jié)果如表4所示。
最后,計(jì)算出加權(quán)矩陣
R=(rij)14568×24
其中rij=ωj*xij'(i=1,2,…,14568;j=1,2,…,24)。
2.基于TOPSIS的“勢頭”的量化估計(jì)
首先將指標(biāo)轉(zhuǎn)化成數(shù)值越大越好的極大型數(shù)據(jù),并進(jìn)行標(biāo)準(zhǔn)化。
接下來使用TOPSIS對球員的比賽狀態(tài)進(jìn)行評價(jià)。首先確定各指標(biāo)的最優(yōu)理想解A+和最劣理想解A-。由于所有指標(biāo)均已轉(zhuǎn)化為極大型數(shù)據(jù),所以各指標(biāo)中最大值代表最優(yōu)情況,最小值代表最劣情況,即
A+j=max(r1j,r1j,…,r14568j),A-j=min(r1j,r1j,…,r14568j)
然后計(jì)算每個球到A+與A-的距離
D+i=∑24j=1(A+j-rij)2,
D-i=∑24j=1(A-j-rij)2
進(jìn)一步能夠計(jì)算出球員在第i分時刻的比賽狀態(tài)評分
Ci=D-iD+i+D-i,Ci∈[0,1]
其中,Ci值越大表征第i分時刻球員的表現(xiàn)水平越優(yōu)。決賽前14分阿爾卡拉斯的比賽狀態(tài)評分及其排序如表5所示。
每一分的比賽狀態(tài)評分量化了每個球員在特定時間下的表現(xiàn)水平,從而描述了球員在此刻的“勢頭”的多少。至此,本文已找出衡量“勢頭”的指標(biāo),即C。
3.模型可視化
為觀察球員的表現(xiàn)水平隨比賽進(jìn)程的波動情況,繪制決賽中兩球員比賽狀態(tài)評分折線圖與散點(diǎn)圖如圖1。為便于觀察球員表現(xiàn)水平的整體走勢,右圖中擬合出了C的回歸直線。由此可看出,隨著比賽的進(jìn)展,阿爾卡拉斯的比賽狀態(tài)評分呈現(xiàn)上升趨勢,說明表現(xiàn)狀態(tài)在不斷提升,這與其最終獲勝的結(jié)果相符。
(二)預(yù)測比賽結(jié)果的Logistic回歸模型
1.模型建立
為探究“勢頭”對比賽結(jié)果的作用,現(xiàn)用C來預(yù)測比賽下一分的輸贏情況。注意到同一比賽中的兩個球員的“勢頭”的差距,即他們比賽狀態(tài)評分之差,能反映每一分的輸贏情況。于是,將球員與對手在第i分時的比賽狀態(tài)評分相減,并記為ΔCi(i=1,2,…,14568),則ΔCi越大說明球員在第i分打得越好,贏的可能性越大。記ΔC為所有ΔCi(i=1,2,…,14568)的集合。
令outcome=1,當(dāng)此分中選手獲勝時0,當(dāng)此分中對手獲勝時。根據(jù)outcome的取值分類0和1,可以將樣本點(diǎn)分loss和win兩類。繪制箱線圖與小提琴圖如圖2。由圖可看出,在win類別中,大部分ΔCi取值為正,說明當(dāng)球員在此分中獲勝時,其比賽狀態(tài)評分高于對手的評分;反之,loss中大部分ΔCi為負(fù)值,這與常識相符。因此能進(jìn)一步建立模型。
將outcome看作因變量,把ΔC當(dāng)作自變量,建立Logistic模型
lnoutcome1-outcome=β0+β1ΔC
其中β0與β1的估計(jì)值如表6所示。其中所有系數(shù)均是顯著的。
2.10折交叉驗(yàn)證
為評估模型的預(yù)測效果,現(xiàn)進(jìn)行10折交叉驗(yàn)證。首先將樣本集隨機(jī)地劃分為樣本量相同的10部分[3],把前9部分當(dāng)作訓(xùn)練集,用于建立模型及擬合參數(shù);最后1部分當(dāng)作測試集,以此來估計(jì)平均預(yù)測準(zhǔn)確率。
其次,繪制ROC曲線如圖3所示,由圖可得到用于判斷預(yù)測類別的最優(yōu)閾值=0.020。于是,對于測試集的樣本點(diǎn),如果它的后驗(yàn)概率≥0.020,則此點(diǎn)的outcome被判為1;否則,outcome被判為0。將預(yù)測得到的outcome與測試集中outcome的真實(shí)值進(jìn)行比較,計(jì)算得到預(yù)測準(zhǔn)確率為0.8333。
此外,計(jì)算得到AUC為0.929,非常接近1,說明此模型有很強(qiáng)的二元分類能力,區(qū)分兩個類別的表現(xiàn)很好,且ROC曲線是可靠的[4]。
最后將上述操作重復(fù)200次,計(jì)算得到平均預(yù)測準(zhǔn)確率為87.9%,說明模型比較穩(wěn)健且預(yù)測效果不錯。
四、轉(zhuǎn)折點(diǎn)的識別與“勢頭”的刻畫因素
(一)基于核回歸方法的轉(zhuǎn)折點(diǎn)識別
前文已說明“勢頭”會對比賽結(jié)果造成影響,接下來的目的是描述“勢頭”如何在比賽中發(fā)揮作用。具體來說,希望找到在“勢頭”不斷作用下,比賽走勢從有利于某一方轉(zhuǎn)化為另一方的具體時刻,即比賽的“轉(zhuǎn)折點(diǎn)”。
從直觀上來看,當(dāng)一方選手的表現(xiàn)得更好時,比賽走勢更有利于這一方。故首先考慮用球員比賽狀態(tài)評分的差值當(dāng)作自變量。但由圖1右圖可以看出,C變化特別大且迅速,故直接使用ΔC作為自變量難以識別出ΔC正負(fù)號的變化規(guī)律。因此接下來對C進(jìn)行核回歸,使得ΔC的變化更加平滑,便于識別轉(zhuǎn)折點(diǎn)的發(fā)生。
本文把C當(dāng)作因變量,把分當(dāng)作自變量,進(jìn)行核回歸擬合,記擬合后的比賽狀態(tài)評分為RC,并繪制同一場比賽雙方的核回歸曲線如圖4所示。兩條曲線的交點(diǎn)就是轉(zhuǎn)折點(diǎn)發(fā)生的時刻,距離轉(zhuǎn)折點(diǎn)最近的分就是“勢頭”扭轉(zhuǎn)比賽局勢的那一分。為簡化表達(dá),本文把上述距離轉(zhuǎn)折時刻最近的分簡稱為轉(zhuǎn)折點(diǎn)。
(二)基于BPNN的自變量重要性的評估
為了找到對“勢頭”影響較大的指標(biāo),并計(jì)算出每個指標(biāo)影響的大小,本文采用BPNN。此算法具有大規(guī)模并行結(jié)構(gòu)、分布式存儲等特點(diǎn)[5],有很強(qiáng)的分類能力。
為充分利用在轉(zhuǎn)折點(diǎn)出現(xiàn)之前的ΔRC隨比賽進(jìn)程不斷減小的信息,本文把轉(zhuǎn)折點(diǎn)與其前兩個點(diǎn)一起看作“轉(zhuǎn)折時刻”。定義出用于判斷點(diǎn)是否位于轉(zhuǎn)折時刻的指標(biāo)
reversion =1,此點(diǎn)位于轉(zhuǎn)折時刻
且ΔRC由負(fù)轉(zhuǎn)正0,此
點(diǎn)不位于轉(zhuǎn)折時刻
-1,此點(diǎn)位于轉(zhuǎn)折時
刻且ΔRC由正轉(zhuǎn)負(fù)
為了探究哪些因素影響轉(zhuǎn)折時刻,現(xiàn)把reversion當(dāng)做因變量,使用reversion=1或-1的點(diǎn)對應(yīng)的數(shù)據(jù),把各項(xiàng)指標(biāo)當(dāng)做自變量,使用BPNN對reversion的分類進(jìn)行預(yù)測。計(jì)算得到預(yù)測準(zhǔn)確率為75.9%。
在進(jìn)行BPNN 時,訓(xùn)練集的樣本點(diǎn)被分為幾個批次,每個批次依次進(jìn)行訓(xùn)練。而權(quán)重更新就是在兩個訓(xùn)練批次切換之間進(jìn)行的。[6]這些權(quán)重可以被理解為每個指標(biāo)解釋了多少因變量的變化,即每個指標(biāo)對轉(zhuǎn)折時刻的影響有多大。于是,指標(biāo)的權(quán)重就是其重要性的一種量化。經(jīng)過正態(tài)化的自變量重要性如表7所示。此外,為便于直觀地觀察自變量重要性的排序,繪制柱狀圖如圖5。
從圖5可以看出,重要性最高的自變量是P1_continue_score,即球員連續(xù)得分與失分次數(shù),占比達(dá)到17%。研究表明每局比賽中“連續(xù)得兩分”和“連續(xù)失兩分”是技戰(zhàn)術(shù)變化的關(guān)鍵時機(jī)[7],此處從運(yùn)動員“勢頭”的角度來驗(yàn)證了此結(jié)論。當(dāng)選手在比賽中連續(xù)得分時次數(shù)越多時,他獲勝的概率越大。這是因?yàn)檫B續(xù)得分能夠使球員更加有斗志,即增加了“勢頭”,從而他獲勝的可能性也越高。因此,在運(yùn)動員日常比賽中,應(yīng)更加關(guān)注此因素,在球員連續(xù)得分時把握“勢頭”,一鼓作氣;在連續(xù)失分時及時調(diào)整狀態(tài),恢復(fù)動力。
重要性占比第二的變量是球員在破發(fā)點(diǎn)的情況,占比為11%。相關(guān)文獻(xiàn)說明高水平球員在破發(fā)點(diǎn)關(guān)鍵分上的獲勝率高于其他分?jǐn)?shù),即高水平球員在比賽的重要時刻能夠表現(xiàn)出更好的狀態(tài),且這種能力具有相對的穩(wěn)定性[8]。于是,在關(guān)鍵時刻以良好的狀態(tài)面對壓力,把握住每個破發(fā)點(diǎn),能夠?yàn)榍騿T增加“勢頭”,提升獲勝概率。
對手打出ACE球的次數(shù)是重要性排名第三的變量,占比9%。當(dāng)對手打出ACE球的次數(shù)增加時,球員的“勢頭”也會發(fā)生較大改變,從而影響了比賽結(jié)果。這為球員的訓(xùn)練提供了兩點(diǎn)建議:第一,提高接發(fā)球的能力,降低比賽中對手打出ACE球的頻率,能夠減少“勢頭”的衰減;第二,鍛煉球員在對手打出ACE球之后的狀態(tài)調(diào)節(jié)能力,盡量保持“勢頭”的穩(wěn)定,嘗試發(fā)揮其積極作用,從而扭轉(zhuǎn)比賽的不利走勢。
五、結(jié)論
1.任意時刻的運(yùn)動員“勢頭”的多少能夠用比賽狀態(tài)評分C衡量,C∈[0,1],且C越高說明此分中球員的表現(xiàn)越好。
2.在網(wǎng)球選手及賽況的研究中,過去的理論將比賽中的球員每一分的表現(xiàn)看作是相互獨(dú)立的,但現(xiàn)在越來越多研究表明,過去比賽的分?jǐn)?shù)、表現(xiàn)等因素都會影響球員接下來的比賽狀態(tài)。[9]“勢頭”為球員提供激勵與動力,影響了比賽每一分的結(jié)果??赏ㄟ^如下模型預(yù)測任意分的比賽結(jié)果outcome。
lnoutcome1-outcome=-0.8519+22.5353ΔC
其中ΔC是球員與對手C的差值。此模型的平均預(yù)測準(zhǔn)確率為87.9%。
3.“勢頭”在比賽中發(fā)揮作用的具體時刻體現(xiàn)在轉(zhuǎn)折點(diǎn)上。兩個球員核回歸擬合后的比賽狀態(tài)評分曲線的交點(diǎn)就是轉(zhuǎn)折點(diǎn)發(fā)生的時刻。通過BPNN對轉(zhuǎn)折時刻的預(yù)測準(zhǔn)確率為75.9%。
4.對“勢頭”影響最大的三個因素為:選手連續(xù)得分或者失分的次數(shù)、球員在破發(fā)點(diǎn)的情況及對手打出ACE球的次數(shù),重要性占比分別為17%,11%和9%。在日常訓(xùn)練及比賽中重視上述因素,并及時調(diào)整球員的心態(tài)和身體狀態(tài),能夠有效發(fā)揮“勢頭”的積極作用,提升比賽獲勝的概率。
參考文獻(xiàn):
[1]時廣彬,任楊千千,石磊,等.基于機(jī)器學(xué)習(xí)的網(wǎng)球最佳回球落點(diǎn)決策模型[J].體育科學(xué),2023,43(06):53-60.
[2]Klaassen and Magnus (2014).Analyzing Wimbledon. The Power of Statistics, Oxford University Press.
[3]Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani. An Introduction to Statistical Learning with Applications in R. Springer; 2021. p. 203-205.
[4]Roumeliotis, S.,Schurgers,J.,Tsalikakis,D.G.et al. ROC curve analysis: a useful statistic multi-tool in the research of nephrology. IntUrolNephrol (2024). https://doi.org/10.1007/s11255-024-04022-8.
[5]TuJuanjuan. Research on Learning Algorithm of Neural Nerwork Optimized with PSO and its Application[D]. Jiangsu University, 2013.
[6]韓普,周漢辰,周北望.BP神經(jīng)網(wǎng)絡(luò)原理研究與實(shí)現(xiàn)[J].廣播電視信息,2018,0(10):121-125.
[7]劉明朋,劉晨.世界優(yōu)秀女子網(wǎng)球運(yùn)動員連續(xù)得失分特征研究[J].Sports World,2019,(05):23-24.
[8]GONZALEZ-DIAZ J,GOSSNER O,ROGERS BW, 2012. Performing Best When It Matters Most : Evidence From Professional Tennis [J].J Econ Behav Organ, 84(3):767-781.
[9]Jackson, D. and Mosurski, K. (1997). Heavy Defeats in Tennis:Psychological Momentum of Random Effect. Chance, 10:27-34.Dqsad.
責(zé)任編輯 朱守鋰