(青島農(nóng)業(yè)大學(xué),山東青島, 266109)
數(shù)據(jù)挖掘在籃球技術(shù)動(dòng)作中的應(yīng)用分析
姜 帥
(青島農(nóng)業(yè)大學(xué),山東青島, 266109)
本文在研究中,通過(guò)對(duì)籃球技術(shù)動(dòng)作數(shù)據(jù)采集和預(yù)處理的分析應(yīng)用,又研究了基于Apriori算法的關(guān)聯(lián)規(guī)則挖掘,進(jìn)而對(duì)籃球技術(shù)動(dòng)作之間的關(guān)聯(lián)性進(jìn)行研究。
數(shù)據(jù)挖掘;籃球;技術(shù)動(dòng)作
很明顯籃球比賽的最終輸贏是由得分決定的,而從雙方球員的得分中也能夠看出各自籃球技術(shù)動(dòng)作的運(yùn)用情況。通常在籃球比賽中,得分較多的是2分投球、3分投球及罰球等技術(shù)動(dòng)作,但是有關(guān)籃板球、助攻、失誤、犯規(guī)、技術(shù)犯規(guī)、干擾球、故意犯規(guī)、控球、傳球、扣籃、空中接力、快攻技術(shù)動(dòng)作等對(duì)得失分的影響并沒(méi)有十分明確的研究數(shù)據(jù),數(shù)據(jù)挖掘?qū)嶋H上就是從復(fù)雜眾多的數(shù)據(jù)資源中找出與實(shí)際相符合的有用信息,即從大量的不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中,提取隱含在其中,具有潛在用途的信息和知識(shí)的過(guò)程。通過(guò)這些隱藏信息可以幫助教練員和運(yùn)動(dòng)員進(jìn)行科學(xué)的、合理的動(dòng)作技術(shù)學(xué)習(xí),本文通過(guò)預(yù)處理、分類和關(guān)聯(lián)規(guī)則來(lái)分析挖掘籃球常用技術(shù)動(dòng)作,為教練員和運(yùn)動(dòng)員提供更多的數(shù)據(jù)資料,幫助他們有針對(duì)性的進(jìn)行訓(xùn)練。
關(guān)聯(lián)規(guī)則挖掘就是通過(guò)某種方式來(lái)找出眾多數(shù)據(jù)之間有意義的聯(lián)系。我們將數(shù)據(jù)之間存在的某種規(guī)律稱之為關(guān)聯(lián),本次研究使用關(guān)聯(lián)規(guī)則挖掘的目的就是尋找籃球技術(shù)動(dòng)作數(shù)據(jù)庫(kù)中隱含的關(guān)聯(lián)。而Apriori算法是關(guān)聯(lián)規(guī)則挖掘應(yīng)用最廣泛的一種方法,它是一種使用侯選項(xiàng)集找頻繁項(xiàng)集的算法。下面就是通過(guò)對(duì)籃球腳本語(yǔ)言的設(shè)計(jì)方法研究的基礎(chǔ)上,分析了Apriori算法在挖掘籃球技術(shù)動(dòng)作關(guān)聯(lián)規(guī)則中的設(shè)計(jì)與應(yīng)用。
Apriori算法是一個(gè)在事務(wù)數(shù)據(jù)庫(kù)中尋找頻繁項(xiàng)集的典型算法,其中的頻繁項(xiàng)集實(shí)際上就是支持度≥最小支持度的項(xiàng)集,要實(shí)現(xiàn)這一目的需要對(duì)事物數(shù)據(jù)庫(kù)進(jìn)行反腐掃描,因此會(huì)在這一步浪費(fèi)較多的時(shí)間,制約了Apriori算法的運(yùn)行。
Apriori算法可以通過(guò)遞推的方式,將事務(wù)數(shù)據(jù)庫(kù)中全部頻繁項(xiàng)集尋找出來(lái)。具體操作是先將事物數(shù)據(jù)表中的每一項(xiàng)作為候選一項(xiàng)集,用Cm來(lái)表示(m取值可以是1,2,3......),接下來(lái)對(duì)籃球技術(shù)動(dòng)作數(shù)據(jù)庫(kù)進(jìn)行掃描,進(jìn)而統(tǒng)計(jì)出每個(gè)項(xiàng)集的支持度,將支持度≥最小支持度的項(xiàng)集設(shè)置為頻繁1-項(xiàng)集的集合,用Lm來(lái)表示(m取值可以是1,2,3......),并以此類推,直到L為空,算法停止。
3.1 數(shù)據(jù)采集
NBA聯(lián)盟規(guī)定,一場(chǎng)球共48分鐘,分為4節(jié),每節(jié)12分鐘,每一個(gè)回合的進(jìn)攻要在24秒內(nèi)完成,一場(chǎng)球有100~200個(gè)回合。若是超過(guò)24秒就會(huì)失去球權(quán)。如果運(yùn)動(dòng)員技術(shù)動(dòng)作掌握得好,球員之間能夠很好的配合,那么就能夠在24秒內(nèi)完成,反之,就會(huì)因?yàn)槌瑫r(shí)而丟失投籃機(jī)會(huì)。所以,在本次統(tǒng)計(jì)分析中,我們以一個(gè)進(jìn)攻回合為時(shí)間段,統(tǒng)計(jì)了一場(chǎng)籃球比賽第5、20、100個(gè)回合的一般技術(shù)動(dòng)作(如表1)。
表1 NBA籃球比賽技術(shù)動(dòng)作統(tǒng)計(jì)表
3.2 數(shù)據(jù)清理與整合
通過(guò)上述方式采集到的籃球數(shù)據(jù)中存在不完整、不一致的問(wèn)題,因此我們還要糾正這些問(wèn)題,進(jìn)行空缺值的填充。
①填充空缺值。根據(jù)某數(shù)據(jù)項(xiàng)含義,對(duì)缺失的這一數(shù)據(jù)項(xiàng),定義一個(gè)缺省的值來(lái)替換缺少的空缺值。如表1中R5進(jìn)攻回合缺少3分進(jìn)球、蓋帽等,我們用“?”來(lái)代替。
②糾正不一致數(shù)據(jù)。采集到的數(shù)據(jù)有時(shí)會(huì)出現(xiàn)不一致的現(xiàn)象,如表1中R5的“運(yùn)球”與“帶球”是一樣的技術(shù)動(dòng)作,它們就不一致,但是我們可以通過(guò)分析某些數(shù)據(jù)之間的關(guān)聯(lián)性來(lái)確定將他們改成哪一種比較合適,將他們分別用A,B來(lái)表示,那么二者之間的相關(guān)性可以用下式表示:
當(dāng)r=0,A與B獨(dú)立,不相關(guān);r<0,A與B負(fù)相關(guān);r>0,A與B正相關(guān)。那么,應(yīng)該將R5中“運(yùn)球”與“帶球”修正成一致的“運(yùn)球”(表2為修正后的統(tǒng)計(jì)數(shù)據(jù)),修正方法如下:
If action=“帶球”
then action=“運(yùn)球”
If action=“2分進(jìn)”
then action=“2分進(jìn)”
......
表2 修改后的NBA籃球技術(shù)動(dòng)作統(tǒng)計(jì)表
③清理數(shù)據(jù)噪聲。如動(dòng)作技術(shù)犯規(guī)、干擾球等都屬于無(wú)意義的數(shù)據(jù),因此直接清理掉就可以了,不必進(jìn)行數(shù)據(jù)挖掘。又如,每個(gè)進(jìn)攻回合同時(shí)出現(xiàn)2分進(jìn)球和3分進(jìn)球是不合理的,所以就需要清除一個(gè),一般會(huì)清除3分進(jìn)球。
3.3 數(shù)據(jù)集成
數(shù)據(jù)集成就是在同一個(gè)技術(shù)動(dòng)作數(shù)據(jù)庫(kù)中來(lái)存儲(chǔ)很多的相關(guān)數(shù)據(jù),這樣就避免了各種數(shù)據(jù)的零散分布,不利于研究。比如我們可以將表2中多次重復(fù)出現(xiàn)的數(shù)據(jù)(如擋拆、運(yùn)球等)合并為一個(gè)(如表3)。
3.4 數(shù)據(jù)歸約
數(shù)據(jù)歸約可以在保持原數(shù)據(jù)完整的基礎(chǔ)上,減小數(shù)據(jù)量,從而減少數(shù)據(jù)挖掘時(shí)間,具體操作包括:
①堆歸約。將運(yùn)球、傳球等技術(shù)動(dòng)作刪掉,只保留研究意義較大的技術(shù)動(dòng)作,如本次研究中只保留了搶斷、助攻、罰球、擋拆、蓋帽、籃板、2分進(jìn)、3分進(jìn)球和突破9個(gè)籃球技術(shù)動(dòng)作。
②數(shù)據(jù)壓縮。使用a,b,c,d,e,f,g,h,i這9個(gè)英文字母來(lái)代表以上選取得9種技術(shù)動(dòng)作,并一一對(duì)應(yīng)進(jìn)行編碼,以便壓縮數(shù)據(jù)集(如表4)。
表4 歸約后籃球技術(shù)動(dòng)作統(tǒng)計(jì)表
在本次研究中我們選用的是weka挖掘軟件,為了更方便于籃球數(shù)據(jù)挖掘,需要進(jìn)行相關(guān)的格式轉(zhuǎn)換,在上一步的基礎(chǔ)上,一一對(duì)應(yīng)后如果有動(dòng)作,則用y來(lái)表示,如果沒(méi)有動(dòng)作,則用n來(lái)表示(。
表5 格式轉(zhuǎn)換后籃球技術(shù)動(dòng)作統(tǒng)計(jì)表
綜上所述,本文在分析了籃球技術(shù)動(dòng)作數(shù)據(jù)采集和預(yù)處理的應(yīng)用分析的基礎(chǔ)上,通過(guò)基于Apriori算法的關(guān)聯(lián)規(guī)則挖掘方法,研究了數(shù)據(jù)挖掘技術(shù)在籃球技術(shù)動(dòng)作中的應(yīng)用,這是籃球運(yùn)動(dòng)與計(jì)算機(jī)技術(shù)創(chuàng)造性的結(jié)合,為籃球技術(shù)動(dòng)作規(guī)律的研究開(kāi)辟了道路,指明了方向,同時(shí)為教練員和運(yùn)動(dòng)員提供了更準(zhǔn)確的學(xué)習(xí)資源。
遲殿委,周興斌.數(shù)據(jù)挖掘的體育訓(xùn)練決策支持系統(tǒng)[J].微型計(jì)算機(jī),2009(25):190-192.
Application of data mining in basketball action in
Jiang Shuai
(Qingdao Agricultural University,Qingdao,Shandong,266109,China)
In this study,the application of basketball skills by analyzing motion data acquisition and pre-processing,but also studied based on Apriori algorithm for mining association rules,and then on the correlation between basketball technical action research.
data mining;Basketball Skill