魏鑫
摘 要:當(dāng)今時代,數(shù)據(jù)已成為國家基礎(chǔ)性戰(zhàn)略資源,黨中央、國務(wù)院高度重視大數(shù)據(jù)發(fā)展及創(chuàng)新應(yīng)用。不過,目前在體育中特別是田徑領(lǐng)域中大數(shù)據(jù)還未展現(xiàn)出其應(yīng)有的戰(zhàn)略價值。其主要原因在于缺乏反映田徑本質(zhì)的大規(guī)?;A(chǔ)數(shù)據(jù)。我國現(xiàn)有的田徑信息數(shù)據(jù)均不能滿足大數(shù)據(jù)的相關(guān)要求。因此,建立符合大數(shù)據(jù)時代田徑信息采集數(shù)據(jù)庫事關(guān)重要。其實在田徑領(lǐng)域中存在一個天然數(shù)據(jù)庫:成績冊與秩序冊。本研究將立足于大數(shù)據(jù)時代對數(shù)據(jù)采集的相關(guān)要求,構(gòu)建一套基于競賽端的以競賽成績信息為目標(biāo)數(shù)據(jù)的采集方法體系。
關(guān)鍵詞:大數(shù)據(jù) 競賽 數(shù)據(jù)采集
中圖分類號:G806 文獻標(biāo)識碼:A 文章編號:2095-2813(2018)08(b)-0206-03
當(dāng)今時代,數(shù)據(jù)已成為國家基礎(chǔ)性戰(zhàn)略資源,大數(shù)據(jù)正對全球經(jīng)濟運行機制、社會生活方式和國家管理能力產(chǎn)生重要影響。黨中央、國務(wù)院高度重視大數(shù)據(jù)發(fā)展及創(chuàng)新應(yīng)用,十八屆五中全會明確提出實施國家大數(shù)據(jù)戰(zhàn)略。國務(wù)院印發(fā)的《促進大數(shù)據(jù)發(fā)展行動綱要》指出,大數(shù)據(jù)已成為“提升政府管理能力的新途徑”。這就要求各級管理部門樹立大數(shù)據(jù)思維,借助大數(shù)據(jù)手段推動政府管理理念和社會治理模式進步。然而,當(dāng)天的大數(shù)據(jù)仍屬于新興事物,在體育中的運用也僅僅在足球、網(wǎng)球、高爾夫、棒球等項目中,且主要進行技術(shù)選材訓(xùn)練等方面應(yīng)用。針對更為宏觀的競技相關(guān)管理運用尚未展開,其主要原因在于缺乏大規(guī)模競賽數(shù)據(jù)的獲取方法。因此,本研究將在大數(shù)據(jù)視角下,以田徑項目為例探究競賽數(shù)據(jù)信息的全樣本采集方法。
1 目前我國體育數(shù)據(jù)庫現(xiàn)狀
高德納咨詢公司對大數(shù)據(jù)的定義是:大數(shù)據(jù)是全樣本、大容量、高速度和形式多樣的信息資產(chǎn),它需要低成本的、形式創(chuàng)新的信息處理,以增強洞察力和輔助決策。但是,目前我國體育數(shù)據(jù)庫主要存在以下幾個問題。
1.1 國家競技體育信息數(shù)據(jù)庫信息全面多樣但覆蓋面狹窄
國家競技體育信息數(shù)據(jù)庫主要包括運動成績庫、實時數(shù)據(jù)庫、奧運實力分析庫三個部分,收集參加全國以上級別比賽的運動員信息。盡管其內(nèi)容齊全,但其對全體運動員覆蓋比例估算約在2.7%。
1.2 全國運動員注冊信息數(shù)據(jù)庫信息單一、覆蓋面小、數(shù)據(jù)割裂
國家于2003年制定了《全國運動員注冊與交流管理辦法》,以杜絕和減少比賽中假年齡假資格等不良現(xiàn)象。但由于行政體制及重視程度的問題,經(jīng)過14年發(fā)展當(dāng)前我國的青少年運動員注冊僅在省級以上比賽執(zhí)行。且由于管理體質(zhì)問題各省、教育部、國家體育總局?jǐn)?shù)據(jù)相互分割,并且相當(dāng)多的注冊信息與成績信息互相割裂,大大限制其作用價值。此外,由于其只涵蓋參加省級以上比賽的運動員,僅占參加市級比賽總?cè)藬?shù)的23.8%,仍有近8成基層運動員并未統(tǒng)計。
1.3 《體育事業(yè)統(tǒng)計年鑒》統(tǒng)計范圍狹窄、無個人信息、信度較低
該信息采集是由低級訓(xùn)練單位一層層上報而來,由于現(xiàn)在運動員的多元化培養(yǎng),培養(yǎng)單位由體育系統(tǒng)擴展到包括體育系統(tǒng)、教育系統(tǒng)、社會系統(tǒng)以及家庭系統(tǒng)的多種培養(yǎng)形式。以前的訓(xùn)練單位已經(jīng)遠遠不能涵蓋新增的后備運動員。此外,由于上報數(shù)據(jù)牽扯到經(jīng)費發(fā)放,該數(shù)據(jù)公信力存疑,且無法鎖定個人運動員與競賽成績。
綜上所述,這些信息庫均無法滿足當(dāng)前對大數(shù)據(jù)的定義要求,即無法做到全樣本、高效快速的信息收集,對數(shù)據(jù)的采集處理需要消耗大量的人力物力與時間,且對于運動員微觀數(shù)據(jù)的人群覆蓋極為狹小。由于數(shù)據(jù)結(jié)果的時間延遲、覆蓋面狹窄、缺乏精度,其輔助決策效果大打折扣。
2 當(dāng)前田徑競賽數(shù)據(jù)收集存在問題
我國競技體育數(shù)據(jù)庫有關(guān)田徑項目(不僅僅是田徑項目)的數(shù)據(jù)信息主要針對于頂層運動員,即能參加高級別比賽的運動員信息才會得到錄入。這會導(dǎo)致幾個問題:無法對全國整個田徑訓(xùn)練情況進行把握,如有多少運動員,多少教練員等;無法對優(yōu)秀運動員整個運動生涯進行時間序列的研究,錄入的僅是其成績達到一定水平后的信息;無法對全國青少年運動員狀況進行把握;無法對基層教練員情況進行了解;整體數(shù)據(jù)以橫截面為主,對大部分優(yōu)秀運動員個體的記錄無連續(xù)性,進而導(dǎo)致信息利用率較低,無法在相關(guān)預(yù)測方面進行深入分析。目前我國的競技體育數(shù)據(jù)庫包含的信息僅僅是一個金字塔的頂端,而支持金字塔矗立的基礎(chǔ),我們尚未掌握。當(dāng)然,這是由于當(dāng)時信息技術(shù)的限制,收集全國性的信息成本巨大,在當(dāng)時進行全國性的信息采集是不現(xiàn)實的。但是,大數(shù)據(jù)時代的到來,使得進行全國性的信息采集成為可能。
為了解決我國競技體育數(shù)據(jù)信息紀(jì)錄過于狹窄的問題,將信息紀(jì)錄對象向基礎(chǔ)延伸是必須的。當(dāng)前,隨著體育信息化的發(fā)展,很多團隊開發(fā)類似于“競技體育數(shù)據(jù)管理平臺”的軟件,下放到各個訓(xùn)練單位進行信息收集,也就是將運動員、教練員信息收集放在訓(xùn)練單位端進行。使用上述方法進行全國性的信息采集會產(chǎn)生如下問題:(1)當(dāng)前的信息平臺除了進行運動員、教練員信息收集外,還設(shè)計了訓(xùn)練過程、辦公自動化等一些列功能,整體軟件是一個運動員管理訓(xùn)練的輔助軟件,軟件操控有一定難度性,需要經(jīng)過一定培訓(xùn)才能順利應(yīng)用;(2)需要專職人員進行軟件的管理與信息輸入,一旦出現(xiàn)人員變動就可能產(chǎn)生軟件停用的情況,無法保證信息收集的連續(xù)性;(3)許多中西部地區(qū)基礎(chǔ)訓(xùn)練單位的硬件設(shè)施與人員配置達不到相應(yīng)的要求;(4)全國性的運動訓(xùn)練單位向市區(qū)級別下分,數(shù)量龐大。除此之外,這種信息的采集時效性差,在實踐中很多數(shù)據(jù)的錄入都是在年終統(tǒng)一進行,從而使信息的價值大大降低。另外,人工錄入難免犯錯,又缺乏有效的監(jiān)督,數(shù)據(jù)的準(zhǔn)確性略低。最重要的一點,即使這種信息采集分布到全國各個運動訓(xùn)練單位,并且能夠全部及時的進行數(shù)據(jù)收集,也會遺漏相當(dāng)比例的田徑運動員,因為,很多的田徑運動員是學(xué)校內(nèi)的。上述問題極大的阻礙了這種采集方式的迅速推廣。
因此,需要找到一種采集方法,這種方法須符合以下要求:能夠獲得數(shù)據(jù)的總體;數(shù)據(jù)具有較高的精確性;數(shù)據(jù)的更新及時;采集成本低;采集方法簡單易于推廣;硬件設(shè)備與人員操作要求相對較低;無需額外工作(如專門錄入人員)。
3 田徑項目大數(shù)據(jù)采集方法構(gòu)建
針對在單位端進行數(shù)據(jù)采集的弊端,不應(yīng)將訓(xùn)練單位端作為大數(shù)據(jù)收集的平臺,而應(yīng)當(dāng)從比賽端進行大數(shù)據(jù)收集。從比賽端進行大數(shù)據(jù)收集,就是對國家體育總局信息數(shù)據(jù)庫,在田徑國家級比賽信息收集方式上,向下級比賽的延伸。為了更好的對田徑項目中大數(shù)據(jù)采集方法的理解,這里結(jié)合一個比喻說明。
假如一個池塘里面有很多魚,其中有大魚也有小魚。之前我們使用大網(wǎng)眼的漁網(wǎng)進行捕魚,則很多體積小于網(wǎng)眼的魚就無法捕捉到。為了捕捉到更多的魚,最好的辦法就是把網(wǎng)眼縮小。當(dāng)網(wǎng)眼縮到足夠小的時候就可以捕捉到所有進入網(wǎng)的魚,當(dāng)我們把這張網(wǎng)做的面積做的足夠大,就能一次捕捉到池塘里所有的魚。我們用這種方法在這個池塘里捕一次魚,我們可以知道池塘里有多少魚,不同大小的魚分別有多少。當(dāng)我們每隔一定時間(一年)捕一次魚并對這些魚進行標(biāo)記,就可以知道每條魚的成長速度是多少。當(dāng)我們把這些魚和與之飼養(yǎng)的漁民建立起來聯(lián)系,就能知道哪些漁民養(yǎng)魚的水平高一些,最終我們需要選出那些好的魚苗和優(yōu)秀的漁民。魚:運動員。魚的大?。哼\動員競技成績。漁民:教練員。網(wǎng)眼大?。罕荣惣墑e網(wǎng)的面積:舉行比賽范圍。
從上面的比喻可以很好的理解田徑項目中大數(shù)據(jù)采集方法的基本原理,就是通過比賽這個平臺,對全國的田徑運動員和教練員信息進行收集。關(guān)于田徑大數(shù)據(jù)信息采集的實施。
大數(shù)據(jù)評價對田徑相關(guān)信息采集的具體方式,如圖1所示。根據(jù)田徑比賽層級及可行性可對于田徑競賽數(shù)據(jù)采集應(yīng)分三步進行。
第一步:采集并匯總?cè)珖骷墑e田徑運動會的成績冊與報名信息(主要包括:比賽舉行時間、運動員身份證號、比賽項目與成績)。各級別田徑比賽包括全國性的田徑相關(guān)比賽、省市級的(以湖北省為例,省級田徑高水平運動員比賽(4次/年)、湖北省大學(xué)生田徑運動會、湖北省中小學(xué)生田徑運動會(2次/年)、各地市州中小學(xué)生田徑運動會)。每年參加這些比賽的運動員可以涵蓋擁有系統(tǒng)訓(xùn)練經(jīng)歷的田徑運動員,之后每年進行相同的信息采集,可以形成時間序列的相關(guān)信息,并發(fā)布相關(guān)信息年報。
第二步:使用田徑運動會編排系統(tǒng)軟件,對全國各級別田徑運動會進行聯(lián)網(wǎng)(直接采用網(wǎng)上報名),集中設(shè)立一個服務(wù)器,進而使田徑比賽信息及時傳遞到田管中心數(shù)據(jù)庫,在報名系統(tǒng)中增添教練員相關(guān)信息必選項目(身份證號、性別、年齡),以增加對教練員信息的采集。
第三步:將該編排系統(tǒng)向大學(xué)、中學(xué)校內(nèi)田徑運動會進行深入,以更廣泛的進行信息采集。
這里強調(diào):使用同一軟件是一個理想化的狀態(tài),可以根據(jù)不同的比賽級別使用不同的軟件,只要信息可以同時上傳同一服務(wù)器即可,如國家級比賽一套系統(tǒng),省市級一套,學(xué)校使用一套。此外,第一步與第二步應(yīng)同時進行,慢慢從第一步完全過渡到第二步。
該采集方法擁有以下優(yōu)點:(1)研發(fā)成本低:現(xiàn)有軟件已可以勝任當(dāng)前的要求。(2)信息采集效率高:同一級別賽事,組織方數(shù)量要遠少于參賽方,通過一場比賽可以采集幾十個參賽單位的信息。(3)硬件設(shè)施及人員要求低:當(dāng)前田徑運動會的組織方都擁有和會使用電腦。(4)準(zhǔn)確性高:很多大型田徑運動會的成績輸入是電腦電子計時自動進行,人工輸入的情況下由于牽扯到比賽名次,成績輸入的準(zhǔn)確率也會很高。(5)易于大規(guī)模推廣:田徑運動會的開展十分廣泛,此外進行網(wǎng)上報名與電腦成績錄入,可以推動全國田徑運動會組織編排的科技含量,大大提高工作效率,方便基層運動會的開展。
4 結(jié)語
當(dāng)前我國競技田徑數(shù)據(jù)信息采集主要方法有三種,但均存在一些問題:(1)國家競技體育信息數(shù)據(jù)庫信息全面多樣但覆蓋面狹窄;(2)全國運動員注冊信息數(shù)據(jù)庫信息單一、覆蓋面小、數(shù)據(jù)割裂;(3)《體育事業(yè)統(tǒng)計年鑒》統(tǒng)計范圍狹窄、無個人信息、信度較低。
針對目前關(guān)于田徑大數(shù)據(jù)信息采集,不應(yīng)將訓(xùn)練單位端作為信息收集平臺,而應(yīng)當(dāng)從比賽端進行大數(shù)據(jù)收集。也就是對現(xiàn)有國家體育總局信息數(shù)據(jù)庫在田徑國家級比賽信息收集方式上,向下級比賽延伸。
目前關(guān)于田徑競賽大數(shù)據(jù)采集方法應(yīng)當(dāng)分三步進行:首先,采集并匯總?cè)珖骷墑e田徑運動會的成績冊與報名信息。其次,使用田徑運動會編排系統(tǒng)軟件,對全國各級別田徑運動會進行聯(lián)網(wǎng)。最后,該編排系統(tǒng)向大學(xué)、中學(xué)校內(nèi)田徑運動會進行深入,以更廣泛的進行信息采集。
參考文獻
[1] 李國杰.大數(shù)據(jù)研究的科學(xué)價值[J].中國計算機學(xué)會通訊,2012,8(9):8-15.
[2] 李國杰,程學(xué)旗.大數(shù)據(jù)研究:未來科技及經(jīng)濟社會發(fā)展的重大戰(zhàn)略領(lǐng)域[J].中國科學(xué)院院刊,2012,27(6):647-657.
[3] 王珊,王會舉,覃雄派,等.架構(gòu)大數(shù)據(jù):挑戰(zhàn)、現(xiàn)狀與展望[J].計算機學(xué)報,2011(10):1741-1752.
[4] 方巍,鄭玉,徐江.大數(shù)據(jù):概念、技術(shù)及應(yīng)用研究綜述[J].南京信息工程大學(xué)學(xué)報:自然科學(xué)版,2014,6(5):405-417.