【摘要】通過整理體育科學(xué)領(lǐng)域數(shù)據(jù)挖掘方面的研究文獻(xiàn),利用體育統(tǒng)計(jì)的研究方法,把文獻(xiàn)資料按照體育管理、比賽應(yīng)用、訓(xùn)練應(yīng)用、體育教學(xué)、綜述、其他幾個(gè)歸類進(jìn)行分析,結(jié)果發(fā)現(xiàn)當(dāng)前的研究資料主要偏重于簡單的理論分析,而對于體育相關(guān)領(lǐng)域數(shù)據(jù)庫的建立和應(yīng)用則相對較少,這也造成了結(jié)果片面或出現(xiàn)偏差。但是值得肯定的是,國內(nèi)一些專家和學(xué)者已經(jīng)開始把數(shù)據(jù)挖掘技術(shù)引入到體育項(xiàng)目中,雖然目前的研究還不夠深入,但是這對于我們?nèi)蘸笱芯矿w育數(shù)據(jù)挖掘,真正把數(shù)據(jù)挖掘技術(shù)利用到體育技戰(zhàn)術(shù)制定和體育發(fā)展決策,推進(jìn)數(shù)據(jù)挖掘技術(shù)在體育領(lǐng)域的發(fā)展,具有重要意義。
【關(guān)鍵詞】數(shù)據(jù)挖掘;體育科學(xué)研究;體育統(tǒng)計(jì)
引言
近年來,數(shù)據(jù)挖掘技術(shù)已成為計(jì)算機(jī)領(lǐng)域的研究熱點(diǎn),隨著信息化技術(shù)在體育運(yùn)動(dòng)中的廣泛運(yùn)用,逐步收集了大量關(guān)于運(yùn)動(dòng)員成長和選材、訓(xùn)練和比賽等方面的真實(shí)有效數(shù)據(jù),通過對數(shù)據(jù)進(jìn)行整理和分析可得到隱藏的知識和規(guī)則,為服務(wù)于體育各領(lǐng)域的研究、運(yùn)動(dòng)員取得更好的成績以及體育管理部門的決策和管理提供了有益幫助。
體育科學(xué)中擁有大量訓(xùn)練、教學(xué)和競賽中的數(shù)據(jù)信息資源與體育統(tǒng)計(jì),如何利用這些有效數(shù)據(jù),發(fā)現(xiàn)潛在的可以利用的規(guī)律,是體育科學(xué)利用計(jì)算機(jī)技術(shù)亟須解決的問題之一,現(xiàn)有的數(shù)據(jù)挖掘技術(shù)能為此提供幫助,它是指從大型數(shù)據(jù)集中,挖掘隱含在其中的、人們事先不知道的、對決策有用的知識的過程,利用數(shù)據(jù)挖掘技術(shù),在體育教學(xué)、體育訓(xùn)練和體育競賽中可以提升其訓(xùn)練與服務(wù)水平,更好地滿足各級各類體育科研工作者的需求。然而由于基礎(chǔ)數(shù)據(jù)資料填報(bào)不夠完善或準(zhǔn)確,數(shù)據(jù)自身具有不確定性,數(shù)據(jù)倉庫建模規(guī)模過于復(fù)雜,挖掘算法設(shè)計(jì)缺陷等原因,造成了挖掘結(jié)果失真,不能讓教練員和管理人員完全信服,無法在實(shí)際的各環(huán)節(jié)中起到指導(dǎo)作用。
本文查閱近十年來關(guān)于體育數(shù)據(jù)挖掘方面的相關(guān)文獻(xiàn)資料,從文獻(xiàn)計(jì)量角度分析該領(lǐng)域的研究內(nèi)容、存在問題、研究熱點(diǎn),分析數(shù)據(jù)挖掘技術(shù)在各個(gè)領(lǐng)域的研究現(xiàn)狀,對數(shù)據(jù)挖掘技術(shù)的廣泛應(yīng)用情況進(jìn)行客觀的認(rèn)識,促使相關(guān)部門利用這項(xiàng)技術(shù)發(fā)現(xiàn)數(shù)據(jù)中隱含的、有價(jià)值的規(guī)律,本文運(yùn)用體育統(tǒng)計(jì)的研究方法,對當(dāng)前數(shù)據(jù)技術(shù)研究的熱點(diǎn)、技術(shù)瓶頸、研究領(lǐng)域和存在的問題進(jìn)行分析??茖W(xué)規(guī)范地對這些信息資源進(jìn)行整合和集成,實(shí)現(xiàn)教育信息化、決策科學(xué)化和管理規(guī)范化。
1數(shù)據(jù)挖掘的定義
數(shù)據(jù)挖掘起源于從數(shù)據(jù)庫中發(fā)現(xiàn)知識,它首次出現(xiàn)在1989年8月在底特律舉行的第十一屆國際聯(lián)合人工智能學(xué)術(shù)會議上。在1996年出版的總結(jié)該領(lǐng)域進(jìn)展的權(quán)威論文集《知識發(fā)現(xiàn)與數(shù)據(jù)進(jìn)展》中,F(xiàn)ayyd、Piatetsky-Shapiro和smyth給出了知識發(fā)現(xiàn)和數(shù)據(jù)挖掘的最新定義,將二者加以區(qū)分〔1〕。
數(shù)據(jù)挖掘(Data Mining)的定義為:數(shù)據(jù)挖掘是知識發(fā)現(xiàn)中通過特定的算法在可接受的計(jì)算效率限制內(nèi)生成特定模式的一個(gè)步驟。數(shù)據(jù)挖掘技術(shù)在技術(shù)上又有著這樣的定義:從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的,但又是潛在有用的信息和知識的過程〔2〕。
數(shù)據(jù)挖掘是通過分析每個(gè)數(shù)據(jù),從大量數(shù)據(jù)中尋找其規(guī)律的技術(shù),主要有數(shù)據(jù)準(zhǔn)備、規(guī)律尋找和規(guī)律表示3個(gè)步驟。數(shù)據(jù)挖掘的任務(wù)有關(guān)聯(lián)分析、聚類分析、分類分析、異常分析、特異群組分析和演變分析等。
數(shù)據(jù)挖掘的步驟會隨不同領(lǐng)域的應(yīng)用而有所變化,每一種數(shù)據(jù)挖掘技術(shù)也會有各自的特性和使用步驟,針對不同問題和需求所制定的數(shù)據(jù)挖掘過程也會存在差異。此外,數(shù)據(jù)的完整程度、專業(yè)人員支持的程度等都會對建立數(shù)據(jù)挖掘過程有所影響。這些因素造成了數(shù)據(jù)挖掘在各不同領(lǐng)域中的運(yùn)用、規(guī)劃,以及流程的差異性,即使同一產(chǎn)業(yè),也會因?yàn)榉治黾夹g(shù)和專業(yè)知識的涉入程度不同而不同,因此對于數(shù)據(jù)挖掘過程的系統(tǒng)化、標(biāo)準(zhǔn)化就顯得格外重要。如此一來,不僅可以較容易地跨領(lǐng)域應(yīng)用,也可以結(jié)合不同的專業(yè)知識,發(fā)揮數(shù)據(jù)挖掘的真正精神。
2研究對象與方法
2.1研究對象
以體育相關(guān)領(lǐng)域數(shù)據(jù)挖掘的研究文獻(xiàn)資料為研究對象。
2.2研究方法
本研究通過中國知網(wǎng)、維普數(shù)據(jù)庫和萬方數(shù)據(jù)庫等平臺,分別以數(shù)據(jù)挖掘和體育相關(guān)運(yùn)動(dòng)項(xiàng)目或比賽對1998-2014年的文獻(xiàn)資料進(jìn)行檢索,以“數(shù)據(jù)挖掘”為關(guān)鍵詞,并以“體育”為主題檢索詞進(jìn)行檢索,經(jīng)篩選后得到96篇該主題相關(guān)文獻(xiàn),其中博士論文3篇,碩士論文17篇,核心期刊29篇,一般刊物及會議47篇。運(yùn)用體育統(tǒng)計(jì)的研究方法,對相關(guān)文獻(xiàn)進(jìn)行分類和整理,進(jìn)行定量綜合的研究方法,目的是試圖確定研究變量間關(guān)系的“真實(shí)”值。
研究的重點(diǎn)是對收集到的文章做特征編碼,包括以下變量論文領(lǐng)域、期刊級別、發(fā)表時(shí)間、學(xué)歷職稱、研究方向、備注。
3數(shù)據(jù)檢索分析
3.1年度數(shù)量分布統(tǒng)計(jì)
從論文年代數(shù)量分布表分析,該研究領(lǐng)域的發(fā)展可分為兩個(gè)階段(如表1):(1)起始階段(1998-2003年),發(fā)文6篇,占文獻(xiàn)總量的6.25%,雖然該階段的研究成果不是很大,但是隨著計(jì)算機(jī)領(lǐng)域數(shù)據(jù)挖掘技術(shù)的運(yùn)用,也促進(jìn)了體育科學(xué)領(lǐng)域?qū)?shù)據(jù)挖掘的關(guān)注。(2)快速發(fā)展階段(2004-2014年),隨著數(shù)據(jù)挖掘理論的成熟和體育科學(xué)領(lǐng)域研究的深入,特別是計(jì)算機(jī)和體育交叉學(xué)科應(yīng)用范圍越來越廣,體育科學(xué)研究領(lǐng)域掀起數(shù)據(jù)挖掘研究熱潮,特別是近五年關(guān)于體育數(shù)據(jù)挖掘的研究成果明顯增多。
田野在中國體育科學(xué)發(fā)展現(xiàn)狀與展望中第一次為體育科學(xué)的發(fā)展指明了方向,文章提到建立中國體育科學(xué)數(shù)據(jù)平臺,這也為數(shù)據(jù)挖掘技術(shù)在體育科學(xué)研究領(lǐng)域更好地應(yīng)用提供了前提保障〔3〕。
3.2論文來源分布統(tǒng)計(jì)
檢索論文中,學(xué)術(shù)期刊類論文共67篇,分布在51種期刊上,從期刊的分布來看,核心期刊有29篇,說明國內(nèi)在本交叉學(xué)科領(lǐng)域研究的一般為高端學(xué)者,利用數(shù)據(jù)挖掘技術(shù)對體育科學(xué)的研究具有一定的提升意義。根據(jù)統(tǒng)計(jì),本主題研究人數(shù)為136人,說明該領(lǐng)域還沒有形成有力的研究群體。
3.3文章主題分布統(tǒng)計(jì)
把搜集到的96篇文獻(xiàn)資料進(jìn)行統(tǒng)計(jì)分析,從統(tǒng)計(jì)的文獻(xiàn)資料情況來看,研究的側(cè)重點(diǎn)主要在體育管理、比賽應(yīng)用、訓(xùn)練應(yīng)用、體育教學(xué)、研究綜述以及其他相關(guān)研究(數(shù)據(jù)分布見表2)。
從以往的研究來看,研究的重點(diǎn)主要是體育管理、訓(xùn)練應(yīng)用和其他方面,主要集中在數(shù)據(jù)挖掘技術(shù)在體育系統(tǒng)的開發(fā)或理論研究上,而關(guān)于比賽的研究還相對比較薄弱,關(guān)于體育教學(xué)的研究就更少〔4〕。
從以上的數(shù)據(jù)情況來看,這可能跟數(shù)據(jù)挖掘技術(shù)中數(shù)據(jù)庫建立不足密切相關(guān)。體育管理、體育訓(xùn)練近些年來積累了一定數(shù)量有效的數(shù)據(jù),可以通過數(shù)據(jù)挖掘技術(shù)分析得到相關(guān)的參考數(shù)據(jù),為體育相關(guān)領(lǐng)域的決策和管理提供參考。然而,體育比賽和教學(xué)方面的數(shù)據(jù)也都是很直接,但是數(shù)據(jù)挖掘技術(shù)在這方面的應(yīng)用則較少,可能是在數(shù)據(jù)搜集和評價(jià)標(biāo)準(zhǔn)上還有待統(tǒng)一〔5〕。我們發(fā)現(xiàn)還有一部分研究主要側(cè)重于數(shù)據(jù)挖掘技術(shù)與體育相關(guān)系統(tǒng)的研制,可以看出這方面的數(shù)據(jù)挖掘在體育領(lǐng)域已經(jīng)得到重視,但是研究的成果如何開發(fā)和應(yīng)用應(yīng)得到研究者的重視。
4歸類現(xiàn)狀分析
4.1體育管理的相關(guān)研究
數(shù)據(jù)挖掘技術(shù)能夠?yàn)轭I(lǐng)導(dǎo)科學(xué)決策提供強(qiáng)有力的保障。探討數(shù)據(jù)挖掘技術(shù)對體育管理系統(tǒng)中鍛煉者、場地設(shè)施、鍛煉效果和心理體驗(yàn)等方面的調(diào)查數(shù)據(jù)發(fā)現(xiàn)體育利用及需求的規(guī)律和模式,輔助體育管理部門決策。錢強(qiáng)、李英〔6〕用關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘技術(shù)在體育領(lǐng)域的相關(guān)研究文獻(xiàn)進(jìn)行挖掘,分析數(shù)據(jù)挖掘技術(shù)運(yùn)用的特征,找出其規(guī)律,為數(shù)據(jù)挖掘技術(shù)在體育領(lǐng)域更好地利用提出建議。劉麗等〔7〕認(rèn)為利用數(shù)據(jù)挖掘技術(shù),建立了一個(gè)統(tǒng)一的體育考試成績科學(xué)化管理框架,擴(kuò)展了考試管理模塊的管理能力,加強(qiáng)了考試管理模塊的輔助決策能力。
近些年,體育管理部門對國民體質(zhì)的監(jiān)控和監(jiān)測相當(dāng)重視,特別是2008年北京奧運(yùn)會后,體育管理部門逐漸認(rèn)識到提高全民體育素質(zhì)才是體育管理工作的關(guān)鍵,因此每年都有很多相關(guān)的體質(zhì)測試。測試的數(shù)據(jù)可橫向和縱向?qū)Ρ葏⒖?,基本能代表我國各個(gè)民族、各個(gè)地區(qū)和各種人群的總體特征,并且可以使決策管理部門真實(shí)掌握國民體質(zhì)和健康狀況,進(jìn)而不斷改善和增強(qiáng)國民體質(zhì),是體育強(qiáng)國戰(zhàn)略的一項(xiàng)重要任務(wù)。體質(zhì)數(shù)據(jù)的分析為體育管理部門正確決策和管理提供一定的幫助,但是我們從研究的內(nèi)容來看,其作用也只能局限于數(shù)據(jù)本身的大小比較。在實(shí)際操作過程中很多人認(rèn)為很難得到有效的操作,如喬克滿〔8〕等在《關(guān)聯(lián)規(guī)則挖掘技術(shù)在體質(zhì)指標(biāo)分析中的應(yīng)用研究》中認(rèn)為,挖掘技術(shù)無法實(shí)現(xiàn)對結(jié)果的最終解析,永遠(yuǎn)不會替代有經(jīng)驗(yàn)的體育科研人員所起的作用,它只是更科學(xué)、更容易地根據(jù)純數(shù)據(jù)間的關(guān)系挖掘出一定模式的一種工具。
4.2比賽應(yīng)用的相關(guān)研究
關(guān)于數(shù)據(jù)挖掘技術(shù)在比賽應(yīng)用的研究主要從比賽現(xiàn)場統(tǒng)計(jì)的真實(shí)的、大量的、不完全的、隨機(jī)的數(shù)據(jù)中,提取出隱含在其中的、有價(jià)值的,對改進(jìn)戰(zhàn)術(shù)有幫助的信息,找出比賽過程中制勝或失利的關(guān)鍵因素,這種挖掘方法的應(yīng)用可使第一時(shí)間獲得準(zhǔn)確的信息,提高比賽過程控制的可靠性和靈敏度。如趙會群〔9〕等的《數(shù)據(jù)挖掘技術(shù)在體育比賽技戰(zhàn)術(shù)分析中的應(yīng)用研究》是基于馬爾科夫模型系統(tǒng)關(guān)鍵因素分析方法,通過狀態(tài)轉(zhuǎn)移概率和狀態(tài)可靠性靈敏度分析兩種途徑,對乒乓球比賽制勝關(guān)鍵因素進(jìn)行分析,把乒乓球比賽中的常見技戰(zhàn)術(shù)進(jìn)行分類和編碼,運(yùn)用技術(shù)手段從而使得技戰(zhàn)術(shù)采集更加快速,為進(jìn)一步挖掘關(guān)鍵因素奠定了基礎(chǔ)。
如唐藝在研究中提到,數(shù)據(jù)挖掘是利用數(shù)據(jù)模型建模,通過在比賽現(xiàn)場輸入現(xiàn)場數(shù)據(jù)參數(shù)后,體育比賽現(xiàn)場決策支持系統(tǒng)能夠?qū)@些數(shù)據(jù)進(jìn)行分析對比,計(jì)算出各種情況出現(xiàn)的概率并篩選最優(yōu)的換人名單、最佳的戰(zhàn)術(shù)組合等數(shù)據(jù)。這一結(jié)果也顯示出數(shù)據(jù)挖掘技術(shù)的功能,通過挖掘無規(guī)律、極為復(fù)雜的原始數(shù)據(jù)進(jìn)行合理的分析整理,從而為比賽過程控制提供有效的幫助。
4.3訓(xùn)練應(yīng)用的相關(guān)研究
運(yùn)動(dòng)員的訓(xùn)練過程日益受到廣大體育科研工作者的重視,訓(xùn)練的形式、強(qiáng)度、頻率呈現(xiàn)出精細(xì)化控制,一些世界高水平運(yùn)動(dòng)員的訓(xùn)練過程一直處于封閉狀態(tài),傳統(tǒng)的訓(xùn)練手段和方法很難滿足高水平運(yùn)動(dòng)員的需求。那么在訓(xùn)練中引進(jìn)數(shù)據(jù)挖掘技術(shù)成為教練員和科研人員通過建立訓(xùn)練數(shù)據(jù)的分析模型,來發(fā)現(xiàn)不同個(gè)體、不同肌群、不同用力方式之間的細(xì)微差異,并把這些差異進(jìn)行科學(xué)分析,從而總結(jié)出訓(xùn)練的規(guī)律。正如黃謙等在論文中從實(shí)例入手,通過使用神經(jīng)網(wǎng)絡(luò)對運(yùn)動(dòng)成績的預(yù)測,可以挖掘出運(yùn)動(dòng)成績或訓(xùn)練狀態(tài)跟訓(xùn)練指標(biāo)之間的關(guān)系。
4.4體育教學(xué)的相關(guān)研究
體育教學(xué)中引入數(shù)據(jù)挖掘技術(shù)的相關(guān)研究還不多,這可能與體育教學(xué)的對象和重視程度有一定關(guān)系。體育教學(xué)中主要是以學(xué)生的體育測試成績和上課質(zhì)量數(shù)據(jù)庫,統(tǒng)計(jì)出學(xué)生身體素質(zhì)發(fā)展的規(guī)律和體育學(xué)習(xí)興趣等方面的問題,從而有助于體育教師改進(jìn)教學(xué)方法,掌握學(xué)生身體素質(zhì)的基本規(guī)律。目前,在體育教學(xué)中運(yùn)用比較多的是運(yùn)動(dòng)處方的制定,由于學(xué)生群體較大,身體素質(zhì)發(fā)展存在很大的差異性,所以根據(jù)學(xué)生的不同個(gè)體特點(diǎn)制定運(yùn)動(dòng)處方是體育教學(xué)中學(xué)生身體素質(zhì)發(fā)展的良好手段,如何把這些龐大的數(shù)據(jù)制訂出個(gè)性化的方案,數(shù)據(jù)挖掘技術(shù)可以根據(jù)每個(gè)學(xué)生的各項(xiàng)指標(biāo)預(yù)測體育鍛煉成績的好壞,以此為依據(jù)建立起學(xué)生的運(yùn)動(dòng)處方。
4.5體育比賽預(yù)測
當(dāng)前,隨著社會上博彩行業(yè)的發(fā)展,一些體育和娛樂賽事預(yù)測比賽結(jié)果的行為不斷泛濫,我們暫且不論這種行業(yè)是否違法,至少這個(gè)行業(yè)的確帶動(dòng)了體育相關(guān)產(chǎn)業(yè)的發(fā)展,更重要的是帶動(dòng)數(shù)據(jù)挖掘技術(shù)在體育數(shù)據(jù)分析領(lǐng)域的發(fā)展。正如余金山〔10〕在其研究中提到,比賽預(yù)測的主要目的和作用包括兩大方面:驗(yàn)證和發(fā)現(xiàn)對成績有意義的影響因素;對賽事的結(jié)果進(jìn)行預(yù)測。比賽預(yù)測不同于比賽現(xiàn)場數(shù)據(jù)挖掘技術(shù),因?yàn)樗麄兯玫臄?shù)據(jù)庫是完全不同的,比賽預(yù)測也就是在比賽之前,利用以往的比賽或訓(xùn)練數(shù)據(jù)作為基礎(chǔ),從而判斷獲勝的概率,能解決參賽群體的多樣性、多變性、影響因素的復(fù)雜性和預(yù)測的困難性等問題。
該技術(shù)已經(jīng)在彩票等體育產(chǎn)業(yè)領(lǐng)域廣泛應(yīng)用,但是其預(yù)測的準(zhǔn)確性和穩(wěn)定性很難得到控制,僅能作為一種參考。
5存在問題
5.1研究缺乏深度與廣度
5.1.1理論研究不足
目前數(shù)據(jù)挖掘理論相對來講還比較抽象,特別是體育領(lǐng)域缺乏一些計(jì)算機(jī)專業(yè)人才,從而導(dǎo)致該領(lǐng)域的研究不夠深入。通過縱向?qū)Ρ龋覀儼l(fā)現(xiàn)其他學(xué)科領(lǐng)域數(shù)據(jù)挖掘技術(shù)的研究相對較多,這得益于他們對數(shù)據(jù)挖掘應(yīng)用原理與技術(shù)的研究相對比較深入。黃謙和石勇在數(shù)據(jù)挖掘在體育訓(xùn)練指導(dǎo)中的應(yīng)用研究中,使用神經(jīng)網(wǎng)絡(luò)預(yù)測運(yùn)動(dòng)員訓(xùn)練成績,并很逼近地預(yù)測運(yùn)動(dòng)員真實(shí)成績。但是由于數(shù)據(jù)挖掘需要大量的樣本數(shù)據(jù),這樣就導(dǎo)致測試可能有一定的噪音,因此往往導(dǎo)致預(yù)測結(jié)果有一定的失真,其準(zhǔn)確性和可靠性也受到一定影響。因此在體育訓(xùn)練和比賽中僅僅作為一種參考。國內(nèi)雖有很多學(xué)者已投入該領(lǐng)域研究中,但至今未出現(xiàn)有影響力的挖掘模型,同時(shí)成果的數(shù)量與內(nèi)容都反映出對體育數(shù)據(jù)挖掘的理解還停留在較淺層面。
5.1.2應(yīng)用研究缺乏針對性
目前國內(nèi)該領(lǐng)域研究文獻(xiàn)基本停留在將數(shù)據(jù)挖掘方法搬過來應(yīng)用,在體育領(lǐng)域,通??梢岳孟嚓P(guān)分析和主成分分析確定與運(yùn)動(dòng)成績相關(guān)的指標(biāo),然后利用回歸分析建立運(yùn)動(dòng)成績和這些指標(biāo)之間的回歸方程。目前,多元統(tǒng)計(jì)分析的技術(shù)在訓(xùn)練數(shù)據(jù)的分析中使用比較普遍〔11〕,其他應(yīng)用挖掘方法則比較少見。研究沒有針對實(shí)際需求進(jìn)行深入分析與研究,方法原理與應(yīng)用上缺乏創(chuàng)新。筆者認(rèn)為只有通過搜集一線運(yùn)動(dòng)隊(duì)的實(shí)際有效數(shù)據(jù),建立龐大的數(shù)據(jù)庫,根據(jù)有利條件來確定數(shù)據(jù)挖掘的方向和測試方法,從而創(chuàng)造性、靈活性地運(yùn)用數(shù)據(jù)挖掘,為運(yùn)動(dòng)員的成長成才服務(wù),為全面提高體育素質(zhì)服務(wù)。
5.2結(jié)果有效性與確定性
數(shù)據(jù)挖掘處理對象是海量樣本,而且數(shù)據(jù)搜集、歸類、整理、分析是一系列繁瑣的過程,一旦一個(gè)環(huán)節(jié)出現(xiàn)錯(cuò)誤將會影響預(yù)測效果,并且數(shù)據(jù)挖掘必須建立在海量樣本的基礎(chǔ)之上,只有提高數(shù)據(jù)分析量,才能提高結(jié)果的有效性與科學(xué)性。我們從大部分研究論文中發(fā)現(xiàn),實(shí)際分析案例數(shù)據(jù)量小,且有些還是模擬數(shù)據(jù),并非真實(shí)數(shù)據(jù)對小樣本數(shù)據(jù),尋找的規(guī)律或結(jié)果可能不具有統(tǒng)計(jì)顯著意義,不能反映體育變化規(guī)律或結(jié)果的有效性。
5.3 研究的手段和方法缺乏靈活性
目前數(shù)據(jù)挖掘技術(shù)在體育領(lǐng)域的運(yùn)用還基本是依靠計(jì)算機(jī)領(lǐng)域的傳統(tǒng)研究方法和手段,當(dāng)研究者需要哪一部分?jǐn)?shù)據(jù)和參考值,就會臨時(shí)搜集部分?jǐn)?shù)據(jù)庫,根本不對數(shù)據(jù)庫的信息進(jìn)行有效分析,有些甚至不懂得哪些是重要因子,哪些數(shù)據(jù)具有對參考值比較高的響應(yīng)率等,數(shù)據(jù)挖掘的方法和手段只是模仿和照搬。但事實(shí)上數(shù)據(jù)挖掘技術(shù),是依靠多方面的數(shù)據(jù)資料庫,來分析體育領(lǐng)域存在的問題和優(yōu)勢,進(jìn)一步推進(jìn)體育領(lǐng)域與計(jì)算機(jī)領(lǐng)域的交叉和融合,有利于產(chǎn)生更合理、更科學(xué)的研究手段和方法,對促進(jìn)數(shù)據(jù)挖掘技術(shù)、體育技能的發(fā)展和普及具有重要意義。
6小結(jié)
?,|東在《當(dāng)代體育研究中數(shù)據(jù)挖掘技術(shù)的應(yīng)用》中認(rèn)為,當(dāng)今計(jì)算機(jī)的計(jì)算能力正日益提高,各領(lǐng)域業(yè)務(wù)復(fù)雜性也不斷提升,數(shù)據(jù)的類型越來越多、越來越復(fù)雜。數(shù)據(jù)挖掘的服務(wù)內(nèi)容是為體育科研人員提供有效的數(shù)據(jù),如何提高服務(wù)質(zhì)量,如何將有價(jià)值的知識資源提供給有需求的用戶是我們研究的出發(fā)點(diǎn)。
我國體育領(lǐng)域積累并不斷擴(kuò)充著大量的數(shù)據(jù),我們的體育科研人員要充分重視這些數(shù)據(jù)的整理,建立有效的數(shù)據(jù)倉庫和數(shù)據(jù)集,并運(yùn)用數(shù)據(jù)挖掘進(jìn)行分析,創(chuàng)造新的價(jià)值,這是體育科研人員今后運(yùn)用數(shù)據(jù)挖掘技術(shù)的重要任務(wù)。
參考文獻(xiàn)
〔1〕〔3〕田野,等.中國體育科學(xué)發(fā)展現(xiàn)狀與展望〔J〕.體育科學(xué),2005,25(1):5-10.
〔2〕趙新輝,郭瑞.基于數(shù)據(jù)挖掘技術(shù)的網(wǎng)絡(luò)輿情智能監(jiān)測與引導(dǎo)平臺設(shè)計(jì)研究〔J〕.電腦知識與技術(shù),2012,8(1):1-4.
〔4〕?,|東.當(dāng)代體育研究中數(shù)據(jù)挖掘技術(shù)的應(yīng)用
〔J〕.南京體育學(xué)院學(xué)報(bào)(自然科學(xué)版),2010,9(1):132-134.
〔5〕〔11〕黃謙,石勇.數(shù)據(jù)挖掘在體育訓(xùn)練指導(dǎo)中的應(yīng)用研究〔J〕.廣州體育學(xué)院,2009,29(6):106-110.
〔6〕錢強(qiáng),李英.數(shù)據(jù)挖掘技術(shù)在圖書館讀者分析中的應(yīng)用〔J〕.圖書情報(bào)工作,2009.6:121-124
〔7〕劉麗.基于數(shù)據(jù)挖掘的體育考試成績科學(xué)化管理〔J〕.時(shí)代教育,2009,5:97-98.
〔8〕喬克滿,歐陽為民,等.關(guān)聯(lián)規(guī)則挖掘技術(shù)在體質(zhì)指標(biāo)分析中的應(yīng)用研究〔J〕.天津體育學(xué)院學(xué)報(bào),2010,25(5):453-455.
〔9〕趙會群,孫晶,等.數(shù)據(jù)挖掘技術(shù)在體育比賽技戰(zhàn)術(shù)分析中的應(yīng)用研究〔J〕.北京體育大學(xué)學(xué)報(bào),2008,31(5):712-715.
〔10〕余金山.賽事分析與預(yù)測的KDD建?!睯〕.計(jì)算機(jī)應(yīng)用與軟件,2005,22(8):15-16.
(責(zé)任編輯:李宏斌)