劉書楷
(北京體育大學(xué)中國足球運動學(xué)院 北京 100091)
隨著足球運動的快速發(fā)展,不僅是場上技戰(zhàn)術(shù)發(fā)展迅速,賽場之外的領(lǐng)域也在日新月異地發(fā)展著。我國足球水平在世界范圍排名較為落后,因此如何發(fā)展足球事業(yè)成為亟須解決的問題??茖W(xué)技術(shù)飛速發(fā)展,體育科技助力足球產(chǎn)業(yè)發(fā)展的思考備受關(guān)注?!按髷?shù)據(jù)時代”的到來,為足球訓(xùn)練、比賽、賽事傳播等方面的發(fā)展帶來了前所未有的便利,海量數(shù)據(jù)的快速處理符合當今足球運動快速發(fā)展的需求,如何使大數(shù)據(jù)更好地應(yīng)用于我國足球運動領(lǐng)域,是需要繼續(xù)研究的內(nèi)容。
早在20世紀50年代,“數(shù)據(jù)”一詞就隨著計算機的發(fā)明被正式使用,信息系統(tǒng)的應(yīng)用使數(shù)據(jù)可以通過計算機,產(chǎn)生價值轉(zhuǎn)換的功能。隨著大數(shù)據(jù)時代的到來,人們對數(shù)據(jù)的看法在定義上有了不同的觀點。數(shù)據(jù)是信息數(shù)字化的記錄,是人通過事物觀察、實驗或計算得出的結(jié)果,本身除了記錄信息并無意義。維克托·邁爾-舍恩伯格在其著作《大數(shù)據(jù)時代》中表示,數(shù)據(jù)代表著對某件事物的描述,可以用來記錄、分析和重組[1]。自此,任何可以在計算機上儲存的信息(如數(shù)字、文字、圖像、聲音等),都被稱為數(shù)據(jù)。數(shù)據(jù)的最根本意義是記錄,千百年來人類社會上記錄信息的方式表明了社會進步程度,隨著不同計量工具的產(chǎn)生,數(shù)據(jù)在人類的日常生活中隨處可見。數(shù)據(jù)的增長速度是爆炸性的,Gartner 公司在其研究報告中指出,數(shù)據(jù)的爆炸速度是三維的[2]。數(shù)據(jù)的功能在于讓人類日常生活的現(xiàn)象可視化,轉(zhuǎn)換為表格或趨勢圖等形式進行分析。維克托·邁爾-舍恩伯格指出,文字是人類文明傳遞的載體,人類將文字以數(shù)據(jù)的方式統(tǒng)計后,加以利用,使其用途更加便捷、多元,如電子圖書的產(chǎn)生,使閱讀更便利,并且記錄閱讀行為。
隨著信息化浪潮的開始,“大數(shù)據(jù)”一詞也映入人們視線中。早在20 世紀90 年代,該概念已在美國出現(xiàn),當時的大數(shù)據(jù)更偏向于計算機領(lǐng)域?;ヂ?lián)網(wǎng)時代的到來,標志著新一輪的信息化浪潮的出現(xiàn),云計算、物聯(lián)網(wǎng)、人工智能等詞匯層出不窮,大數(shù)據(jù)則是這些技術(shù)的基礎(chǔ)。2011 年,學(xué)者維克托·邁爾-舍恩伯格出版了權(quán)威性專注《大數(shù)據(jù)時代》,將大數(shù)據(jù)的定義、特點和發(fā)展前景進行了解釋。同年,麥肯錫全球研究院發(fā)表文章進行概念定義,并提出大數(shù)據(jù)時代的到來。隨后幾年,世界各國紛紛對大數(shù)據(jù)的應(yīng)用進行探索,在各行各業(yè)中結(jié)合大數(shù)據(jù)思維進行變革,極大地提高了生產(chǎn)力和科技水平。
第七版《現(xiàn)代漢語詞典》中將大數(shù)據(jù)定義為“大規(guī)模數(shù)據(jù)的集合,具有數(shù)據(jù)巨大、類型多樣、收集處理及時、數(shù)據(jù)來源可靠性低等特點”?!杜=蚋唠A英漢雙解》詞典中將大數(shù)據(jù)解釋為“無法使用標準方法處理、分析或使用的過大或過復(fù)雜的信息集合”。麥肯錫全球研究院將大數(shù)據(jù)定義為“一種規(guī)模遠遠超出傳統(tǒng)數(shù)據(jù)庫軟件獲取、儲存、管理和分析能力的數(shù)據(jù)集合,具有集合規(guī)模巨大、數(shù)據(jù)傳輸速度極快、類型眾多和價值密度較低的特征”。我國頒發(fā)的關(guān)于《促進大數(shù)據(jù)發(fā)展行動綱要》中,根據(jù)大數(shù)據(jù)的特征,將大數(shù)據(jù)定義為“以容量大、類型多、存取速度快、應(yīng)用價值高為主要特征的數(shù)據(jù)集合,正快速發(fā)展為對數(shù)量巨大、來源分散、格式多樣的數(shù)據(jù)進行采集、存儲和關(guān)聯(lián)分析,從中發(fā)現(xiàn)新知識、創(chuàng)造新價值、提升新能力的新一代信息技術(shù)和服務(wù)業(yè)態(tài)”[3]。
通過對文獻的歸納與總結(jié),分析得出大數(shù)據(jù)具有以下4點特征,即4V特征:第一,體量極大(Volume),日常網(wǎng)絡(luò)軟件的使用,用戶行為會產(chǎn)生巨大的數(shù)據(jù);第二,來源極廣(Variety),無論是文字數(shù)據(jù),還是圖片、視頻以及任何可量化的內(nèi)容;第三,高效快速(Velocity),隨著科技水平的提高,如人工智能的出現(xiàn),數(shù)據(jù)的收集、處理和分析更加快速;第四,低價值密度(Value),數(shù)據(jù)價值密度與數(shù)據(jù)體量成反比例關(guān)系,數(shù)據(jù)通過海量的基礎(chǔ)數(shù)據(jù)體現(xiàn)其價值。
隨著體育科技的發(fā)展,大數(shù)據(jù)在足球行業(yè)的應(yīng)用越來越重要,在競技體育中存在海量的信息需要工作人員進行分析處理,效率的高低往往可以反映出一支球隊的整體實力。大數(shù)據(jù)在足球領(lǐng)域中的應(yīng)用,首先是對于日常訓(xùn)練與比賽的使用,包括足球技戰(zhàn)術(shù)分析、足球運動表現(xiàn)分析、人才選拔與培養(yǎng)等方面。其次對足球事業(yè)和產(chǎn)業(yè)的發(fā)展也有重要的推動作用,如足球賽事傳播、足球發(fā)展政策制定、足球產(chǎn)品營銷等。
在職業(yè)足球中,涉及戰(zhàn)術(shù)行為分析的大量數(shù)據(jù)被收集,由于大數(shù)據(jù)對體育領(lǐng)域常用的數(shù)據(jù)管理和分析方法提出了新的思路,因此,與計算機科學(xué)的合作,可以使足球技戰(zhàn)術(shù)發(fā)展得更為迅速。近年來,足球表現(xiàn)數(shù)據(jù)收集的設(shè)備日新月異(如GPSports、Catapult、STATSports、Polar Team Pro、MT-Sports等設(shè)備),數(shù)據(jù)質(zhì)量和數(shù)量都有了快速增長,導(dǎo)致球隊每日都有大量的數(shù)據(jù)需要處理。人為統(tǒng)計與分析的形式早已無法匹配現(xiàn)今足球運動的高速發(fā)展,大數(shù)據(jù)處理的高效快速性體現(xiàn)得淋漓盡致。結(jié)合大數(shù)據(jù)的應(yīng)用,技術(shù)、戰(zhàn)術(shù)表現(xiàn)此類較為抽象并且通常以質(zhì)性評價為主的內(nèi)容,可以得出量化分析的結(jié)果,為運動員日常訓(xùn)練與比賽提供更具科學(xué)性的建議。
在戰(zhàn)術(shù)表現(xiàn)分析中,傳球作為一項最為常見且最為頻繁出現(xiàn)的元素,值得教練員與球員去關(guān)注。如何界定、區(qū)分有效傳球與無效傳球的區(qū)別,并不能完全以主觀判斷下定論,這時需要數(shù)據(jù)導(dǎo)向的內(nèi)容作為支撐。外國學(xué)者弗洛里斯等人[4]通過建立模型,對傳球的有效與否進行評估,將傳球有效性與持續(xù)的進攻表現(xiàn)(對防守的破壞性)進行結(jié)合,而不是依賴不頻繁概率事件(如進球或進球機會)的發(fā)生。該模型的建立有助于評估任何位置、個人戰(zhàn)術(shù)、效率、球員比較以及球隊能力,同時該方法適用于比賽中,還可以幫助團隊確定球隊的重要角色。跟蹤數(shù)據(jù)分析技術(shù)應(yīng)用于足球技戰(zhàn)術(shù),體現(xiàn)出大數(shù)據(jù)的高效快速。以往的技戰(zhàn)術(shù)分析對比賽表現(xiàn)的作用,僅僅在表層體現(xiàn),如今數(shù)據(jù)分析過程的進步極大提高了運動表現(xiàn)的合理性。通過多學(xué)科協(xié)作解決關(guān)于表現(xiàn)特征構(gòu)建、空間與時間的聚合,對于釋放足球位置跟蹤數(shù)據(jù)的潛力至關(guān)重要[5]。
我國足球聯(lián)賽自1994 年開始走向職業(yè)化道路,聯(lián)賽發(fā)展離不開賽事傳播,大數(shù)據(jù)在足球賽事傳播中的作用十分顯著。我國足球賽事的參與主體主要有運作主體(主辦方)、傳播開端(參與方)、傳播媒介(媒體)、傳播歸宿(觀眾)、商業(yè)化推動力(贊助商)和賽事管理者(政府),這些主體都會產(chǎn)生海量的數(shù)據(jù),大數(shù)據(jù)可以快速處理分析這些數(shù)據(jù),讓足球賽事傳播始終在正確的軌道上進行。足球賽事傳播的內(nèi)容包括常規(guī)內(nèi)容、體驗內(nèi)容和衍生內(nèi)容,其中常規(guī)內(nèi)容包括比賽直播、視頻、音頻、圖片等內(nèi)容;體驗內(nèi)容指以球迷需求為依據(jù),打造多方位的傳播內(nèi)容和形式,如電視、網(wǎng)絡(luò)、新媒體平臺的足球賽事直播、錄像、集錦等;衍生內(nèi)容指對于足球運動、球隊、球員以及賽事附加產(chǎn)品,利用大數(shù)據(jù)統(tǒng)計分析,實現(xiàn)精準定位,帶動各種產(chǎn)業(yè)發(fā)展,如根據(jù)球迷喜好,推出球星的專屬裝備等。
目前,足球賽事預(yù)期產(chǎn)品傳播較為熱門?;ヂ?lián)網(wǎng)、大數(shù)據(jù)技術(shù)的應(yīng)用,可以收集各個球隊、球員的大量數(shù)據(jù),并通過不同指標進行展示與總結(jié),對球隊、球員的比賽表現(xiàn)進行預(yù)測,為球迷呈現(xiàn)更為直觀的數(shù)據(jù),優(yōu)化球迷的體驗。許多賽事傳播公司會使用信息化交互模式,實現(xiàn)解說與球迷的互動、球迷與球迷的互動等,豐富受眾的觀賽體驗,同時后臺可以通過用戶反饋信息的收集,及時做出調(diào)整。大數(shù)據(jù)的應(yīng)用還體現(xiàn)在體育博彩方面。賽事傳播公司通過收集海量數(shù)據(jù),向球迷提供參考結(jié)果,球迷可以根據(jù)數(shù)據(jù)進行比賽結(jié)果的分析,并吸引更多人觀看足球賽事。賽事傳播公司可以提高用戶量,收集更多數(shù)據(jù),實現(xiàn)良性循環(huán)。2014年世界杯,騰訊和IBM 公司合作針對用戶需求進行數(shù)據(jù)挖掘,抓取實時的用戶社交行為信息進行數(shù)據(jù)化分析,包括球迷話題球迷類型、個性分析等。信息從用戶中收集,通過大數(shù)據(jù)分析,最終又以新的內(nèi)容形式呈現(xiàn)在用戶面前,同時提高了用戶的互動率。通過后臺的數(shù)據(jù)調(diào)查,此類方式的瀏覽訪問量遠超同期其他內(nèi)容,體現(xiàn)出大數(shù)據(jù)在職業(yè)足球賽事傳播中具有重要意義。
放眼世界足壇的發(fā)展過程,如何提高轉(zhuǎn)會決策的科學(xué)性是亟須解決的問題。許多俱樂部花費高昂價格引入明星球員的轉(zhuǎn)會,然而球員卻因無法適應(yīng)比賽節(jié)奏、球隊風(fēng)格或生活環(huán)境等問題,導(dǎo)致無法發(fā)揮匹配高額轉(zhuǎn)會費用的實力,對于俱樂部造成損失。外國學(xué)者運用數(shù)據(jù)驅(qū)動的數(shù)學(xué)模型建立了一種為俱樂部提供最優(yōu)球員轉(zhuǎn)會的優(yōu)化模型,為俱樂部如何做出合理決定,如何最優(yōu)分配轉(zhuǎn)會預(yù)算提出建議[6]。該模型預(yù)測了世界各地球員的特性、身價和工資,將預(yù)測值輸入到一個整體規(guī)劃模型中,以俱樂部最大效能為目標,求解最佳轉(zhuǎn)會決策。這種模型是預(yù)測價值的函數(shù),主要關(guān)注于英格蘭足球超級聯(lián)賽,結(jié)果表明該模型推薦的轉(zhuǎn)會信息有助于俱樂部做出更好的轉(zhuǎn)會決策。
我國職業(yè)聯(lián)賽的發(fā)展進程中,經(jīng)常出現(xiàn)引入世界明星球員,但實際比賽效果卻不如人意的現(xiàn)象。因此,如何利用大數(shù)據(jù)技術(shù)提高轉(zhuǎn)會決策的科學(xué)性是我國職業(yè)足球俱樂部需要考慮的問題,要通過建立數(shù)學(xué)模型,將目標地區(qū)或所需位置的球員數(shù)據(jù)與俱樂部需求進行匹配,得出最優(yōu)方案,以提高俱樂部運作效益。
2019 年,《全國青少年校園足球工作報告(2015—2019)》中提出鼓勵和支持學(xué)校引入先進訓(xùn)練方法和高新科學(xué)技術(shù),建設(shè)智慧球場和應(yīng)用智能訓(xùn)練設(shè)施和裝備,強化科學(xué)訓(xùn)練。我國已有2.7萬所校園足球特色學(xué)校,參與足球訓(xùn)練的學(xué)生數(shù)量眾多,利用“大數(shù)據(jù)+校園足球”的發(fā)展模式有助于提高足球訓(xùn)練科學(xué)化,推動我國校園足球事業(yè)的發(fā)展。然而目前大數(shù)據(jù)分析在該領(lǐng)域的應(yīng)用仍處于試點階段,2019年同期,河南大學(xué)成立河南省青少年足球數(shù)據(jù)應(yīng)用指導(dǎo)中心,對當?shù)氐那嗌倌曜闱虬l(fā)展具有重要意義。何為大數(shù)據(jù)、如何進行分析、如何將大數(shù)據(jù)分析結(jié)合到實際訓(xùn)練和比賽中成了基層教師、教練員亟須解決的問題。
注重全國范圍的校園足球智能平臺建設(shè),由政府、教育部門牽頭,各校聯(lián)合打造一站式“互聯(lián)網(wǎng)+”足球智能平臺,將全國各年齡段的校園球隊、學(xué)生信息統(tǒng)一管理。平臺功能可分為五大模塊,包括隊伍信息模塊、訓(xùn)練教學(xué)模塊、比賽數(shù)據(jù)模塊、數(shù)據(jù)分析模塊和人才培養(yǎng)模塊。智能平臺有助于校園足球信息查詢和管理;有助于賽事推廣,增加比賽鍛煉機會;有助于線上的師資培訓(xùn)業(yè)務(wù)、學(xué)生網(wǎng)絡(luò)教學(xué)業(yè)務(wù)的開展;有助于訓(xùn)練、比賽數(shù)據(jù)更簡易化、可視化地呈現(xiàn)給教練員;有助于全國范圍選拔校園足球精英人才,給予學(xué)生更多的發(fā)展路徑;有助于校園足球文化的交流,增加學(xué)校間、師生間和生生之間的交流機會。
目前,表現(xiàn)評估在我國已經(jīng)有了許多研究,信息飛速發(fā)展以及足球運動靈活多變的特點需要大數(shù)據(jù)為球隊提供更多支持。在足球比賽中會產(chǎn)生許多事件(如傳球、攔截、射門等)都可以獲得大量數(shù)據(jù),但沒有一個被廣泛接受的衡量標準去評估運動表現(xiàn)的所有方面。表現(xiàn)評估的方式量化評價、質(zhì)性評價以及視頻捕捉形式等。進行表現(xiàn)評估的前提是,需要進行評估指標體系的建立。在后續(xù)的研究中可以通過常用的方法進行指標確定,如專家訪談法、Ahp層次分析法和特爾菲法進行指標的確定和權(quán)重計算,從而得出評估體系。大數(shù)據(jù)分析的出現(xiàn),可以幫助建立比賽數(shù)據(jù)庫,在所有事件的相同指標中,選取影響比賽表現(xiàn)中有價值、常出現(xiàn)的評價指標,更便于人們?nèi)粘@斫?,從而著重對此類指標進行評估分析,使評估更加便捷。
外國學(xué)者設(shè)計了一個數(shù)據(jù)驅(qū)動框架(PlayeRank)進行多維度評價足球運動員表現(xiàn)[7]。通過部署大量足球日志數(shù)據(jù)集構(gòu)建框架,包含了18個主要足球賽事,4個賽季總共上百萬個比賽事件,通過與其他評估的數(shù)據(jù)對比,發(fā)現(xiàn)該框架更為科學(xué)合理,值得設(shè)計一個可拓展的足球分析平臺。我國學(xué)者使用廣義線性模型與數(shù)據(jù)級數(shù)推斷法對于足球技戰(zhàn)術(shù)表現(xiàn)進行分析,以數(shù)學(xué)建模的方式將480 組技戰(zhàn)術(shù)表現(xiàn)指標以及240 場比賽結(jié)果進行分析,進而判斷足球比賽的制勝因素,為表現(xiàn)評估、比賽信息分析以及備戰(zhàn)計劃制訂提供參考[8]。運動表現(xiàn)分析同樣可以高效應(yīng)用于我國足球聯(lián)賽。學(xué)者使用混合線性模型對7個賽季的中國足球協(xié)會超級聯(lián)賽的1406場比賽進行表現(xiàn)分析,得出不同比賽結(jié)果下,足球運動表現(xiàn)所具備的不同特征[9]。
隨著越來越多的數(shù)據(jù)可以進行更為精確的收集與分析,“大數(shù)據(jù)+足球”的時代正在到來。足球領(lǐng)域有龐大的分支,因此大數(shù)據(jù)技術(shù)應(yīng)用于足球研究,需要更多的思路和解決方案,這意味著需要更多學(xué)科方法進行協(xié)作,不同行業(yè)的從業(yè)者需共同努力,以理解并處理復(fù)雜的數(shù)據(jù)集合??茖W(xué)技術(shù)的結(jié)合為足球發(fā)展帶來驅(qū)動力,“大數(shù)據(jù)+足球”的發(fā)展,仍需要討論技術(shù)與數(shù)據(jù)共享的可行性,注重計算機科學(xué)與體育科學(xué)交叉學(xué)科人才的培養(yǎng),提高大數(shù)據(jù)概念與應(yīng)用在足球人口的普及。