高留紅
(北京體育大學,北京 100084)
AlphaGo與柯潔對弈的啟示
——競技運動項目的2種思維模式
高留紅
(北京體育大學,北京 100084)
AlphaGo的深度學習啟發(fā)我們重新思考競技運動項目的思維模式。競技運動項目的思維模式以比賽規(guī)則為依據(jù),得出從比賽開始到比賽結束,雙方運動員都在隨著對方的變化而做出自我變化的運動項目,屬雙方對弈競技運動項目;從比賽開始到比賽結束,運動員根據(jù)事先編排好的動作,完美完成動作的運動項目,屬自我對弈的競技運動項目。從自我對弈和雙方對弈中產(chǎn)生的思維模式,認識競技運動項目,可以分為自我對弈競技運動項目群和雙方對弈競技運動項目群。
競技運動項目;對弈;思維模式
2016年3月AlphaGo以4:1的比分戰(zhàn)勝了韓國棋手李世石,贏下了人機對弈的第一場。AlphaGo與李世石對戰(zhàn)是使用了初代深度學習法,通過不斷的圖譜和各類棋局的陪練,使得AlphaGo不斷的獲得數(shù)據(jù),具備對抗各類局勢的能力。簡單說AlphaGo訓練時使用了超過16萬個人類棋譜,再加上其建立在數(shù)據(jù)的基礎上,又通過與自身的對戰(zhàn)完成了3 000萬個棋譜的對決,最終得到了幾萬個模式用來對抗人類高手。隨后,AlphaGo轉戰(zhàn)網(wǎng)絡與中日韓高手進行對決,結果豪取60連勝。2017年5月7日AlphaGo 2.0與世界等級分第一的中國棋手柯潔在浙江桐鄉(xiāng)展開比賽。最終柯潔投子認負。深度增強學習是AlphaGo的核心技術:AlphaGo 2.0可自我學習,能從自我對弈中提升自我。其基本原理是通過設定規(guī)則后允許人工智能程序從0開始,不需要依托任何外來數(shù)據(jù)和各種人類棋譜,就是憑借自身內(nèi)部的不斷對弈,然后發(fā)掘各類棋路和變數(shù),從在不斷的攻守之間推導出各類對決的方案和方法。簡單來說,就是贏了一盤之后,它可以在這一基礎上學習對手的長處,發(fā)現(xiàn)對手的弱點,不停的練習,從對戰(zhàn)的博弈中不斷學習和提升?!叭藱C大戰(zhàn)”啟發(fā)我們重新思考競技運動項目的思維模式,為此我們對中央電視臺CCTV5體育頻道上轉播的各類競技運動項目進行觀察并通過北京體育大學圖書館查閱各類競技運動項目期刊、書籍確定了競技運動項目的思維模式。
競技運動項目的思維模式以比賽規(guī)則為依據(jù),得出從比賽開始到比賽結束,雙方運動員都在隨著對方的變化而做出自我變化的運動項目,屬雙方對弈競技運動項目;從比賽開始到比賽結束,運動員根據(jù)事先編排好的動作,完美完成動作的運動項目,屬自我對弈的競技運動項目。
雙方對弈項目的特點是,在雙方對弈中學習,在學習中不斷提升自己的實力,猶如中國成語所說“魔高一尺,道高一丈”,在彼此的較量中提高自我。雙方對弈項目有足球、籃球、排球、乒乓球、羽毛球、網(wǎng)球、臺球、高爾夫、跆拳道、摔跤、拳擊等。他們的共同特點是在場上根據(jù)對手的變化做出判斷,然后做出選擇性動作。完成選擇性動作可以分為,瞬間完成選擇性動作和考慮完成選擇性動作兩種。籃球、排球、足球等運動項目,屬瞬間完成選擇動作的項目。它對運動員的反應能力以及力量和速度有極高的要求。反應能力、速度、力量等綜合能力,是運動員通過長時間訓練后在賽場上做出的本能反應,又可以稱為運動員的能量場。這個能量場是同場對手能夠明顯感受得到的,并能給對手以強大的心理壓力,這種壓力是運動員成長的動力。臺球、高爾夫等運動項目,屬考慮完成選擇性動作的項目。它對運動員計算能力以及控制肌肉的能力有極高的要求。計算能力、肌肉控制能力,是運動員通過長時間訓練后在賽場上做出的控制性反應??刂菩苑磻沁\動員自我成長的動力。雙方對弈項目的訓練模型,是通過兩種方式建立的。(1)通過一代又一代的教練員和運動員在訓練、比賽和相關視頻中總結出的經(jīng)驗并結合相關學科理論,而建立的基本功訓練模型;(2)通過對成千上萬場高手比賽實況分析后,而建立的戰(zhàn)略、戰(zhàn)術上的訓練基本模型。 通過場上比賽驗證模型的好壞,接著對戰(zhàn)略戰(zhàn)術的模型進行修改,所以這種戰(zhàn)略戰(zhàn)術上的訓練基本模型,同常被視為“魔與道”較量的過程。
在“魔與道”較量的過程中,可能會出現(xiàn)“常勝將軍”的現(xiàn)象。一旦“常勝將軍”現(xiàn)象出現(xiàn),那么就會產(chǎn)生兩種結果:(1)如果失去了競爭對手,那么“常勝將軍”的水平將會逐漸衰退。(2)觀眾喜歡看的是旗鼓相當?shù)母偧急荣?,一場一邊倒的競賽將會失去很多觀眾。NBA球隊很早就意識到了,強大的對手才能提升整體球隊的水平,才能博得觀眾。為此,他們于1979年建立了每年一度的“NBA新秀選拔制度”?!癗BA新秀選拔制度”的建立,不僅是美國NBA球技不斷提高,使美國籃球保持世界領先地位的原因之一,同時也是讓NBA球賽非常好看,贏得了大量的觀眾主要原因??梢娭贫ㄆ旃南喈?shù)膶囊?guī)則,是創(chuàng)造提升平臺的有效手段。
如果說有一套訓練模型,有旗鼓相當?shù)膶闹贫龋覀兙湍苓_到世界頂級水平,那么我們就無法解釋中國足球為什么不能走向世界,中國足球難以走向世界,背后還應該有其他原因。如果我們承認從對弈中提升自我是雙方對弈思維模式的核心,那么一套好的訓練模型、旗鼓相當?shù)膶闹贫龋荒苷f是為達到世界頂級水平奠定了基礎,在此基礎上應該有一個推動人前行的能量,那就是對手的實力,如果沒有頂級對手與你對抗,你就不能真正體會到頂級球員的能量。事實證明,我們請來過很多世界級的足球教練員,而我們的足球水平離國際水平還是有一定的差距。為什么世界頂級足球教練能將他們的球隊訓練成世界頂級球隊,而用同樣的模型來訓練中國足球隊,則沒有多大的效果。可見這中間的核心原因在于——對手的實力。中國足球隊員在打球的過程中,沒有體會到頂級球員瞬間選擇并完成的動作所帶來的能量場,這種能量場是對手的實力,是推動自我進化的能量。這就解釋了為什么在對弈項目中,中國女子選手能夠走向國際頂級水平,那是因為有男運動員的陪練,她們體會到了頂級球員瞬間選擇并完成的動作所帶來的能量場。可見,只聘請外籍教練中國足球難以走向世界,而營造頂級球員瞬間選擇并完成的動作所帶來的能量場,才是王道。
自我對弈項目中的“對弈”是,人體主動肌和被動肌相互制約而達到人體動作的平衡,也稱自控平衡能力。自我對弈項目的特點是,在賽場上全神貫注完成預先設計的高難度動作,動作的難度在于克服自然對人體的限制,也就是人類運動的極限。自我對弈項目有體操、田徑、蹦床、跳水、游泳、花樣游泳、花樣滑冰、藝術體操、健美操、舉重、武術等競技運動項目。這些項目的共同特征都是,在自我對弈中學習,在學習中不斷提升自己的實力。為什么我們要從自我對弈中學習,并不斷提升自己的實力,這可能有兩個原因,第一有物質(zhì)獎勵,第二是某種心里需求,成語“孤獨求敗”就是這種在自我對弈中成長的心理需求。自我對弈項目的訓練模型是,通過一代又一代的教練員和運動員在訓練、比賽和相關視頻中總結出的經(jīng)驗與相關學科的理論相結合,而建立的基本功訓練模型。這一模型在中國稱為青少年訓練大綱。
運動員在賽場上全神貫注完成的每一個動作,都是在場下經(jīng)過千錘百煉而獲得的。自我對弈項目的訓練中,體現(xiàn)的是我們常說的“工匠精神”。在運動訓練中“工匠精神”所追求的是,對肌肉進行長期的精益求精的訓練,訓練的結果是運動員完成的每一個動作都高度的協(xié)調(diào),都具有“高效節(jié)能”的特點?!案咝Ч?jié)能”也是自我對弈項目思維模式的價值所在。在對自我對弈項目的世界冠軍和世界紀錄保持者進行統(tǒng)計,結果表明:亞洲人中在體操、跳水、蹦床等運動項目中占有優(yōu)勢;而舉重的優(yōu)勢在歐洲人中;跑步的優(yōu)勢在非洲人中。為什么有如此明顯的分類,遺傳基因是不可忽視的原因。可見“高效節(jié)能”有可能有遺傳的價值。
自我對弈思維模式下的訓練,使練習者能夠?qū)⒆晕铱刂萍∪獾哪芰_到“高效節(jié)能”的境界。運動之母田徑中的跑步是我們?nèi)粘I钪胁豢苫蛉钡囊粋€動作,怎樣才能做到“高效節(jié)能”那就在小學校開展田徑運動項目吧。
自主控制平衡是人類最重要的能力之一,將自主控制平衡的能力做到“高效節(jié)能”是運動之父體操的價值所在。體操動作與田徑動作正好相反,它主要是日常生活不使用的動作。日常生活中不使用的動作有何用處?答案是:日常生活不使用的動作,不一定是人體系統(tǒng)不需要的能力。例如,前庭分析器是人體運動很重要的系統(tǒng),目前除了某些競技運動項目外,需要前庭分析器高度發(fā)達的職業(yè)還有飛行員、航天員。因為飛行員、航天員需要在高速運動的飛行器中完成各種動作。對這一系列的訓練,必須采用日常生活不使用的動作。如目前航天員、飛行員的技能與素質(zhì)已通過先進的設施和先進的裝備進行訓練來獲得。體操目前在中小學校中開展得不盡人意,這是因為體操目前任沿用著半個世紀之前的單雙杠教學器械。翻開體操訓練的歷史,我們看到在早期的體操教學中,體操保護幫助設施受到了廣泛的重視,在1977年全國體操通用教材中還有專門的一章介紹體操場地器械,北京體育大學體操教師陳寶義還專門研究體操保護幫助器械。體操保護幫助器械,從某種意義上講是體操教學中科技含量最高的輔助手段??梢娨朐谥行W開展體操,體操保護幫助器械的研究需要得到應有的重視。
從自我對弈和雙方對弈,產(chǎn)生的思維模式來認識競技運動項目,可以分為:從自我對弈中學習,在學習中不斷提升自我的競技運動項目群;與雙方對弈從對手中學習,在學習中不斷提升自我的競技運動項目群。自我對弈項目群,是以精益求精的態(tài)度改善肌肉的協(xié)調(diào)性,最終達到“高效節(jié)能”的實現(xiàn)向人類極限挑戰(zhàn)的目的項目群。雙方對弈項目群,是以對手的存在,從對手的能量場中獲得能量,進而達到提升自我的目的項目群。
以比賽規(guī)則為依據(jù),雙方對弈競技運動項目是,從比賽開始到比賽結束,運動員雙方都在隨著對方的變化而做出自我變化的運動項目。自我對弈競技運動項目是,從比賽開始到比賽結束,運動員根據(jù)事先編排好的動作,完美完成動作的運動項目。運動之母、運動之父地位不可動搖;從自我對弈和雙方對弈中產(chǎn)生的思維模式,認識競技運動項目,可以分為自我對弈競技運動項目群和雙方對弈競技運動項目群。
[1] 2017圍棋人機大戰(zhàn)[EB/OL]. https://baike.so.com/doc/25878675-27028806.html.
[2](英)大衛(wèi).戈德布拉特,等.足球百科[M].劉晶捷,譯.北京:中國地圖出版社,2016.
[3](日 )日高哲朗.籃球基礎訓練與實踐[M].北京:人民郵電出版社,2017.
[4] 2005—2008中國排球協(xié)會審定.排球競賽規(guī)則[M].北京:人民體育出版社,2006.
[5] 張予南,等.體操初級教程[M].北京:北京體育大學出版社,2011.
G808
A
1674-151X(2017)20-006-02
10.3969/j.issn.1674-151x.2017.20.003
投稿日期:2017-07-21
高留紅(1961—),副教授,碩士。研究方向:體育教育學。