于岱峰,鐘亞平,于亞光
基于數(shù)據(jù)挖掘技術(shù)在人體肌肉力量數(shù)據(jù)分析中的應(yīng)用
——以人體握力肌肉力量測試數(shù)據(jù)研究為例
于岱峰,鐘亞平,于亞光
為了科學(xué)地評價(jià)人體握力肌肉力量測試數(shù)據(jù),應(yīng)用人體肌肉力量測試系統(tǒng)和數(shù)據(jù)挖掘技術(shù),對人體握力肌肉力量數(shù)據(jù)進(jìn)行分析。研究發(fā)現(xiàn),采用肌肉力量 F-T變化過程曲線,可定量地反映人體握力的最大力量、啟動力量、相對力量等參數(shù),通過應(yīng)用 ID3算法、決策樹,可以確定出不同測試參數(shù)的根節(jié)點(diǎn),為選擇人體握力 Gain(K3)指標(biāo),作為評價(jià)人體握力肌肉力量指標(biāo),提出科學(xué)依據(jù)。
數(shù)據(jù);挖掘;分析;決策樹;人體握力肌肉力量
肌肉力量是指肌肉緊張或收縮時(shí)對抗阻力的能力,也是人體能夠產(chǎn)生運(yùn)動的惟一動力來源,因此,力量能力是在競技體育中決定運(yùn)動成績的體能要素之一。
近年來,國內(nèi)、外在研究人體肌肉力量的方面,主要集中在對人體肌肉力量的測試方法、測試儀器等方面的研究,而對測試結(jié)果的數(shù)據(jù)分析、數(shù)據(jù)處理,仍停留在一般性的分析和統(tǒng)計(jì)性處理、相關(guān)性的比較和檢驗(yàn)上。對于體育科學(xué)研究中采集到的大量原始數(shù)據(jù)結(jié)果,缺乏更深層次的數(shù)據(jù)挖掘研究和決策分析,更無法發(fā)現(xiàn)測試數(shù)據(jù)中隱含著的東西。雖然,統(tǒng)計(jì)學(xué)方法在體育科學(xué)研究中取得了有目共睹的成果,但在應(yīng)用數(shù)據(jù)分析過程中,暴露出了統(tǒng)計(jì)方法自身的局限性,使我們在解決和分析大量實(shí)際測試數(shù)據(jù)中,顯得不盡人意。數(shù)據(jù)挖掘技術(shù)的出現(xiàn),為人們從大量的數(shù)據(jù)中,抽取隱藏在數(shù)據(jù)之間的有用信息,提供了科學(xué)的方法[2]。
本文在前期對人體背力、握力數(shù)據(jù)的采集方法的研究基礎(chǔ)上[4,5],將數(shù)據(jù)挖掘技術(shù)應(yīng)用于測試人體肌肉力量的數(shù)據(jù)分析中,為探討人體握力肌肉力量參數(shù)的結(jié)構(gòu)特征、相互關(guān)系,以及應(yīng)用 ID3算法對測試數(shù)據(jù)進(jìn)行決策分析,提出理論依據(jù)。
隨機(jī)抽取山東體育學(xué)院不同專業(yè)學(xué)生為實(shí)驗(yàn)對象,其中男性23名,女性15名,應(yīng)用人體肌肉力量計(jì)算機(jī)數(shù)據(jù)分析系統(tǒng)[5],對研究對象進(jìn)行測試與數(shù)據(jù)分析。
1.2.1 測量方法
測試受試者的握力時(shí),要求受試者充分做好準(zhǔn)備活動,測試過程中要求受試者的雙手下垂置體側(cè),掌心向內(nèi),上臂稍向外,但不能超過30°。并用力握住握力計(jì)的測力部分,手臂不得左右擺動,左、右手各握3次,記錄測試結(jié)果。
1.2.2 測試儀器
人體肌肉力量測試裝置,采用兩只CZL-Y B型應(yīng)變式拉壓負(fù)荷傳感器組成,測力范圍:握力 0~100 kg;背力0~300 kg,最大橋壓為5 v,測試靈敏度2 mv/v,其非線性F·S為±0.02%。信號放大電路,采用了高性能、超低漂移運(yùn)算放大器作為輸入級放大,模擬信號輸出范圍0~5 v,測試精度:0.3級。
數(shù)據(jù)采集由M-8051為核心的單片機(jī)組成,采用12位高精度的A/D作為轉(zhuǎn)換芯片,轉(zhuǎn)換時(shí)間間隔35μs,轉(zhuǎn)換精度≤0.05%。
系統(tǒng)分析軟件采用Visul C++6.0作為開發(fā)工具,以SQL SERVER-2000數(shù)據(jù)庫作為數(shù)據(jù)庫管理工具。
1.2.3 數(shù)據(jù)挖掘
數(shù)據(jù)挖掘(DatAMining簡稱DM),是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程,為使人們發(fā)現(xiàn)有用的新規(guī)律、新概念,提高研究人員對大量原始數(shù)據(jù)的深層理解、認(rèn)識和應(yīng)用[2,3]。數(shù)據(jù)挖掘分析方法很多,其中決策樹算法作為數(shù)據(jù)挖掘的一種重要方法,該方法可通過對大量數(shù)據(jù)有目的地分類,并從中發(fā)現(xiàn)或找出潛在的,有價(jià)值的信息,從而得到分析結(jié)果。而數(shù)據(jù)可視化挖掘,可加深對測試數(shù)據(jù)的理解,并用形象、直觀的計(jì)算機(jī)圖形技術(shù)表示測試過程,為準(zhǔn)確表達(dá)原始數(shù)據(jù)和測試過程,以達(dá)到深入剖析測試數(shù)據(jù)的目的。
數(shù)據(jù)挖掘過程,并非是采用一個(gè)簡單的數(shù)據(jù)→模型→結(jié)果套用公式過程,通常針對不同的研究問題,應(yīng)用數(shù)據(jù)挖掘過程對數(shù)據(jù)進(jìn)行分析,其過程主要包括:數(shù)據(jù)理解、數(shù)據(jù)預(yù)處理、模型建立、評估與分析等幾部分組成,其步驟見圖1所示。
本研究以人體握力肌肉力量測試數(shù)據(jù)為例,對相關(guān)測試參數(shù)進(jìn)行可視化處理與測試參數(shù)決策分析。
圖1 本研究數(shù)據(jù)挖據(jù)流程圖
展現(xiàn)大量測試數(shù)據(jù),是數(shù)據(jù)挖掘的重要內(nèi)容。數(shù)據(jù)挖掘可視化為支持多維數(shù)據(jù)的可視化提供了工具。數(shù)據(jù)可視化并不是把不同內(nèi)容、不同層次抽象問題,以及不同性質(zhì)的數(shù)據(jù)、觀察數(shù)據(jù)進(jìn)行相互結(jié)合,而是將不同屬性的數(shù)據(jù)進(jìn)行可視化映射,并把數(shù)據(jù)表轉(zhuǎn)換為可視化結(jié)構(gòu)的過程,然后通過坐標(biāo)定位、縮放比例等方法,創(chuàng)建可視化結(jié)構(gòu)圖,并通過人機(jī)交互動作,控制這些參數(shù)的變換和顯示。將豐富的測試數(shù)據(jù)結(jié)果應(yīng)用圖像方法展現(xiàn)出來,為科學(xué)研究和決策者提供了幫助。
2.1.1 肌肉力量的F-T曲線及相關(guān)參數(shù)
根據(jù)測力和時(shí)間的關(guān)系,將肌肉力量測試過程,局限到特定力與時(shí)間框架中,采用 F-T曲線的方法來描述、或解釋肌肉力量變化特征,其結(jié)果見圖2所示。
圖2 本研究肌肉力量F-T曲線圖
2.1.1.1 肌肉最大力量
根據(jù)力和時(shí)間函數(shù)關(guān)系,假若f(x)∈[0,t],因?yàn)閒(x)在[0,t]區(qū)間內(nèi)連續(xù)(見圖 2-A),所以,根據(jù)閉區(qū)間上連續(xù)函數(shù)的有界定理可知,f(x)在[0,t]上存有最大值。又因?yàn)閒′(x)≥0,所以,f(x)在[0,t]上是單調(diào)遞增的,從而,f(x)的最大值應(yīng)在右端點(diǎn)X=t處取得,即:
其中fmax為肌肉力量最大值,根據(jù)F-T曲線和數(shù)學(xué)計(jì)算,可以認(rèn)為:最大力是指,神經(jīng)肌肉系統(tǒng)通過最大隨意收縮所表現(xiàn)出的最高力值的能力[7]。但是肌肉最大力不等于絕對力量。
2.1.1.2 肌肉最大速率參數(shù)
人體握力肌肉力量變化速度V的最大值表示為:
2.1.1.3 肌肉力量變化率
我們認(rèn)為:通過對F-T曲線中力與時(shí)間的變化率的比值,可以定量反映和評定人體肌肉力量的變化率,其數(shù)學(xué)表示關(guān)系為:
2.1.1.4 其他肌肉力量參數(shù)
通過F-T曲線的關(guān)系,可以挖掘出其他肌肉力量參數(shù)(表 1)。
2.1.2 人體握力肌肉力量測試數(shù)據(jù)的分析
我們采用人體握力肌肉力量測試系統(tǒng),對4名男、女研究對象的右手握力進(jìn)行測試,其測試數(shù)據(jù)結(jié)果見表2所示。
表1 本研究測試參數(shù)一覽表
表2 本研究男、女右手握力測試參數(shù)一覽表
通過以上測試數(shù)據(jù)結(jié)果可以看出,男子右手的握力絕對力量一般要大于女子,這說明由于男性雄性激素分泌增多,促進(jìn)了男性肌肉和骨骼體積的增大,因此,使男子的肌肉力量增長速度要明顯高于女性,另外,大多數(shù)的男性喜歡參加一些具有發(fā)展力量和爆發(fā)力的體育運(yùn)動項(xiàng)目,例如:籃球、足球、田徑的投擲、中長跑項(xiàng)目等,而這些活動的開展,對促進(jìn)男性的肌肉力量的增長,具有十分重要的幫助。而大多數(shù)的女性比較喜歡從事一些非力量性的,或者力量水平較低的活動,這在一定的程度上影響了女性肌肉力量的增長。
在完成爆發(fā)性的動作中,快慢肌纖維開始收縮的時(shí)間差最短(只有幾毫秒),兩種肌纖維的開始收縮時(shí)間幾乎是同時(shí)進(jìn)行的。據(jù)精確計(jì)算,快肌纖維較慢肌纖維要早些達(dá)到最大值(快肌為49~90 ms,慢肌為90~100 ms)。具體來說,在50~120 ms內(nèi)就可達(dá)到最大爆發(fā)力[11]。我們通過對不同男子和女子的啟動力量 STK50的測試可以看出[5]:男子右手啟動力量為0.830±0.077 kg,而女子的右手啟動力量為0.540±0.079 kg。這說明:男子的啟動力量要大于女子。
男子的右手握力測試的曲線短,且峰值突出,而女子的測試曲線長,且波峰較低,呈逐漸下降趨勢,但是,下降的速度要比男子慢。男子在絕對力量、爆發(fā)力、啟動力量等參數(shù)方面均優(yōu)于女子。
在利用 F-T曲線,通過計(jì)算 EXK參數(shù),(即:EXK=Δf/Δt)作為評價(jià)人體肌肉量變化率,即:通過測試同一時(shí)刻的 EXK參數(shù),可以看出:若ΔEXK的值>0,說明人體肌肉力量的變化率處于增加狀態(tài),反之,則處于下降狀態(tài)。因此,通過測試不同專項(xiàng)運(yùn)動員的 F-T曲線,可以定量地反映人體肌肉力量的變化狀況。在表2所示數(shù)據(jù)中,可以根據(jù)不同測試對象的變化率值進(jìn)行直接比較,如測試對象01的肌肉力量變化率為19.11,02的肌肉力量變化率為13.00,通過變化率數(shù)值可以判斷01的快速力量優(yōu)于02。
傳統(tǒng)測試人體握力肌肉力量的方法,僅能一般性的對測試數(shù)據(jù)的局部或表面分析,缺乏對數(shù)據(jù)中更深層次的挖掘研究,以及對測試數(shù)據(jù)的整體特征的描述。因此,如何對大量數(shù)據(jù)資料進(jìn)行仔細(xì)篩選,從中找出或發(fā)現(xiàn)隱含規(guī)律和聯(lián)系,并應(yīng)用決策樹和 ID3方法快速分析、清理相似數(shù)據(jù),確定最終分析目標(biāo),對提高分析測試樣本的分類的準(zhǔn)確率,起到重要作用。
2.2.1 數(shù)據(jù)挖掘決策
采用決策樹和 ID3算法,評價(jià)人體肌肉力量測試參數(shù),對測試結(jié)果制約公平性的若干因素分析,進(jìn)行優(yōu)化評價(jià)。
2.2.1.1 決策樹
決策樹是一種樹狀的結(jié)構(gòu)圖,根據(jù)不同的研究問題,將數(shù)據(jù)樣本劃分成不同的數(shù)據(jù)樣本子集,并在每個(gè)數(shù)據(jù)樣本子集上構(gòu)成一子節(jié)點(diǎn),對測試數(shù)據(jù)結(jié)果進(jìn)行分類的過程。構(gòu)造決策樹是為了快速找出或發(fā)現(xiàn)不同屬性和類別的關(guān)系,并用它來預(yù)測將來未知類別的類型。
2.2.1.2 ID3算法
ID3算法是將樹的每個(gè)節(jié)點(diǎn)上使用的信息增益度量進(jìn)行選擇測試屬性,將具有最高信息增益的屬性作為當(dāng)前節(jié)點(diǎn)的測試屬性。由于該屬性對結(jié)果劃分中的樣本分類所需的信息量較少,可使分析結(jié)果找到一棵更簡單的樹。
設(shè)定S是s個(gè)數(shù)據(jù)樣本的集合,其標(biāo)號為Ci(i=1,…,m)具有m個(gè)不同值,由于si是Ci中的樣本數(shù),則所需信息為:其中Pi=Si/S為任意樣本屬于Ci的概率事件。
由期望信息和熵值可以得到對應(yīng)的信息增益,其計(jì)算公式為:
通過對計(jì)算每個(gè)屬性的信息增益,并選取具有較高增益的屬性作為給定集合S的測試屬性。并產(chǎn)生相應(yīng)的分支結(jié)點(diǎn)。
2.2.2 決策樹和ID3算法在人體握力肌肉力量分析中的應(yīng)用
通過對人體握力的絕對力量、握力/身高、握力/體重等參數(shù)指標(biāo)的評價(jià),可以反映出人體握力的多項(xiàng)特征,但是,隨著測試數(shù)據(jù)的增多,如何有效地使用測試結(jié)果進(jìn)行科學(xué)研究和對測試數(shù)據(jù)進(jìn)行優(yōu)化,發(fā)現(xiàn)數(shù)據(jù)內(nèi)在的相互關(guān)系和說明問題,或者從大量數(shù)據(jù)結(jié)果提煉出不易察覺的關(guān)系,并給出一個(gè)合理的理論解釋,傳統(tǒng)的數(shù)據(jù)分析方法無法得以解決,而數(shù)據(jù)挖掘技術(shù)為此問題的解決提供了方法上的依據(jù)。
本研究應(yīng)用人體肌肉力量測試系統(tǒng),通過對23名男運(yùn)動員和15名女子運(yùn)動員的人體肌肉力量測試參數(shù),如性別、身高、體重、握力絕對力量測試值、握力/身高 等參數(shù)。通過數(shù)據(jù)挖掘技術(shù)的決策算法,針對不同變量進(jìn)行分裂選擇。下面以人體握力參數(shù)為例說明決策算法的應(yīng)用(表 3)。
表3 本研究測試數(shù)據(jù)結(jié)果一覽表
2.2.2.1 數(shù)據(jù)特征提取
根據(jù)表1測試結(jié)果,對測試數(shù)據(jù)進(jìn)行概念化抽取,以重新構(gòu)建新的屬性表。根據(jù)全國體質(zhì)監(jiān)測標(biāo)準(zhǔn)設(shè)定“優(yōu)”測試設(shè)定為A,等級為“Ⅲ”,“良”測試設(shè)定為B,等級為“Ⅱ”,“差”測試設(shè)定為C,等級為“Ⅰ”。統(tǒng)計(jì)樣本數(shù)為S。握力成績 =K1;握力/身高成績 =K2;握力/體重 ×100=K3。重新構(gòu)建概念化數(shù)據(jù)表,見表4所示。
我們應(yīng)用ID3算法對以上數(shù)據(jù)進(jìn)行信息增益的特征屬性檢驗(yàn),選擇出信息增益最大特征,以提取出決策樹的根結(jié)點(diǎn)。
由表2給出的樣本所需的期望信息為:
同理屬性K2、K3的信息增益分別為:
所以信息增益結(jié)果為:Gain(K3)>Gain(K2)>Gain(K1)
根據(jù)以上結(jié)果可以看出,K3的信息增益最大,因此選K3屬性為根節(jié)點(diǎn),并在對應(yīng)的每個(gè)根節(jié)點(diǎn)下創(chuàng)建分枝。其決策樹見圖4所示。
表4 本研究概念化數(shù)據(jù)成績集一覽表
圖4 決策樹
2.2.2.2 對決策樹的解釋
通過對握力參數(shù)分析,可以得出3個(gè)指標(biāo)參數(shù)的信息增益為 Gain(K3)>Gain(K2)>Gain(K1),結(jié)果表明,在所選擇的3個(gè)握力評價(jià)指標(biāo)參數(shù)中,使用 Gain(K3)對人體握力進(jìn)行評價(jià)具有更高的效度。通過理論推演的方法也可對這一結(jié)果進(jìn)行佐證。體重大的人一般具有較大的絕對力量,并隨著體重增大,絕對力量值增大。這可以解釋為什么那些必須克服外部阻力項(xiàng)目(如投擲、摔跤等)運(yùn)動員的身材一般都較大。而對于那些僅克服自身體重,但對速度、靈敏等素質(zhì)要求較高的項(xiàng)目(如體操、跳高等),運(yùn)動員必須具備較高的相對力量,不同類型的運(yùn)動項(xiàng)目對力量素質(zhì)有不同的要求。由此可知,絕對力量與體重是一種函數(shù)關(guān)系,體重的改變就會引起絕對力量的改變。但在有些情況下,僅僅對絕對力量評價(jià)是不合理的,會大大影響力量評價(jià)結(jié)果的信度。這是因?yàn)?肌肉力量不僅僅與肌肉的橫斷面積有關(guān),而且還與肌纖維類型與募集、神經(jīng)系統(tǒng)的機(jī)能狀態(tài),對抗肌與主動肌的協(xié)調(diào)性有關(guān),如果僅對絕對力量進(jìn)行評價(jià),其實(shí)質(zhì)就是僅僅對肌肉的橫斷面積(體重)進(jìn)行了評價(jià),評價(jià)內(nèi)容的缺失造成了評價(jià)信度的降低,繼而導(dǎo)致決策失誤。而采用 Gain(K3)評價(jià)指標(biāo)就會消除了體重這一重要協(xié)變量的影響,使評價(jià)結(jié)果更具有可比性。因此,選擇人體握力 Gain(K3)即:握力/體重指標(biāo)參數(shù),作為評價(jià)人體肌肉力量的能力,要比單一選擇人體握力的“絕對力量”,作為評價(jià)人體肌肉力量的條件,更為合理、科學(xué)。
評價(jià)指標(biāo) Gain(K2)的評價(jià)效果基于二者之間也存在其合理性。多數(shù)研究表明,身高與體重具有很高的相關(guān)性[7],因此,Gain(K2)在一定程度上也可消除體重這一協(xié)變量的影響,盡管如此,但在消除協(xié)變量影響的效果上不如 Gain(K3),但優(yōu)于 Gain(K1)。上述分析表明,通過數(shù)據(jù)挖掘技術(shù),可以發(fā)現(xiàn)隱藏在大量測試數(shù)據(jù)后面的信息資源,為信息評定和思維決策提供更加合理的思路。
1)采用肌肉力量 F-T曲線,可定量地反映人體的最大力量、啟動力量、相對力量等參數(shù)和肌肉力量變化過程;2)應(yīng)用數(shù)據(jù)挖掘技術(shù)、ID3算法和決策樹分析方法,可快速發(fā)現(xiàn)不同測試參數(shù)的根節(jié)點(diǎn),為數(shù)據(jù)進(jìn)行科學(xué)優(yōu)化評價(jià),提出依據(jù);3)選擇人體握力 Gain(K3)即:握力/體重指標(biāo)參數(shù),作為評價(jià)人體肌肉力量的能力,要比單一選擇人體握力的“絕對力量”,作為評價(jià)人體肌肉力量的條件,更為合理、科學(xué);4)通過數(shù)據(jù)挖掘技術(shù)在人體握力測試參數(shù)分析的應(yīng)用,為科學(xué)評價(jià)人體握力測試結(jié)果和決策分析,以及發(fā)現(xiàn)測試數(shù)據(jù)后面的隱藏信息,提出新的探索思路,數(shù)據(jù)挖掘技術(shù)可作為體育測量與評價(jià)的方法加以推廣。
[1]陳小平.競技運(yùn)動訓(xùn)練實(shí)踐發(fā)展的理論思考[M].北京:北京體育大學(xué)出版,2008.
[2]陳小平.力量訓(xùn)練的發(fā)展動向與趨勢 [J].體育科學(xué),2004,24(9):36-40.
[3]國家體育總局群體司.2000年國民體質(zhì)研究報(bào)告[M].北京:人民體育出版社,2003.
[4]胡可云,田鳳占,黃厚寬.數(shù)據(jù)挖掘理論與應(yīng)用[M].北京:清華大學(xué)出版社,2008.
[5]毛國君,段立娟,王實(shí),等.數(shù)據(jù)挖掘原理與算法[M].北京:清華大學(xué)出版社,2007.
[6]山東省體育局.2000年山東省國民體質(zhì)監(jiān)測報(bào)告[M].濟(jì)南:山東大學(xué)出版社,2003.
[7]王清.我國優(yōu)秀運(yùn)動員競技能力狀態(tài)診斷和監(jiān)測系統(tǒng)的研究與建立[M].北京:人民體育出版社,2004.
[8]萬德光,萬猛.現(xiàn)代力量訓(xùn)練[M].北京:人民體育出版社,2003.
[9]于岱峰,田彤,何偉.精確測試人體肌肉力量的新方法 [C].第6屆全國體育科學(xué)大會論文摘要匯編,2000.
[10]于岱峰,張建平,官文強(qiáng).人體背力、握力肌肉力量數(shù)據(jù)分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].體育科學(xué),2006,26(9):40-13.
[11]BUHRLE M.Maximalkraft-schnellkraft-reaktivkraft[J].Sport-wissenschaft,1989,(19):311-325.
[12]GRESSMANN M.Fahrradtraining[M].Verlag Sport Buch Strauss Koln,2001.
Application of DatAMining Technology in Human Muscle Power Data Analysis—Taking the Testing Data of Muscle Power of Grip Strength as Example
YU Dai-feng,ZHONGYa-ping,YU Ya-guang
In order to value the testing data of muscle power of human grip strength scientifically,this paper,applying the testing system of human muscle power and the datAMining technology,analyzes the data of human muscle power.The results show that F-T curve reflects the parameters of human body’s maximum power,starting power,relative power and the changing process of muscle power,sets the different root nodes of the parameters by using ID3 algorithm and decision tree.It provides the scientific basis for choosing the targets of human grip power Gain(K3)and alsofor valuing the human muscle power.
data;mining;analysis;decision tree;muscle power ofgrip strength
G804.8
A
1000-677X(2010)02-0070-05
2009-10-10;
2010-01-08
山東省科學(xué)技術(shù)廳項(xiàng)目(2007GG20008002);山東體育學(xué)院自然科學(xué)資助項(xiàng)目(071104)。
于岱峰(1955-),男,山東青島人,副教授,研究方向?yàn)檫\(yùn)動生物力學(xué)、體育儀器器材,E-mail:YDF90971@163.com;鐘亞平(1968-),男 ,湖北武漢人 ,教授 ,博士 ,研究方向?yàn)轶w育信息技術(shù),E-mail:zhongyap@tom.com;于亞光(1986-),男,山東濟(jì)南人,研究方向?yàn)檫\(yùn)動訓(xùn)練,E-mail:23896156@qq.com。
山東體育學(xué)院,山東濟(jì)南250063
Shandong Institute of Physical Education,Jinan 250063,China.