周 群, 周正卿,周 超
(1.濟(jì)南市歷下區(qū)教育和體育局,山東 濟(jì)南 250014; 2.3.北京大學(xué),北京 100871)
中國青少年面臨嚴(yán)峻的體質(zhì)健康狀況下滑問題,我國青少年體質(zhì)健康主要指標(biāo)連續(xù)二十多年下降,[1]大學(xué)生體質(zhì)健康同樣普遍堪憂,甚至映射出未來國防安全隱患。[2]當(dāng)前政府非常重視青少年體質(zhì)健康,視大學(xué)體育教育是改善青少年體質(zhì)健康的關(guān)鍵一環(huán),《關(guān)于教育部加強(qiáng)學(xué)校體育工作的若干意見》《國家學(xué)生體質(zhì)健康標(biāo)準(zhǔn)》,《“健康中國 2030”規(guī)劃綱要》再次明確改善青少年體質(zhì)為國家戰(zhàn)略。然而當(dāng)前大學(xué)生體質(zhì)健康下滑趨勢依然未得到有效遏制,甚至在很多指標(biāo)上不如中學(xué)生??紤]運(yùn)動(dòng)風(fēng)險(xiǎn)、健康隱患以及校方無法免責(zé)的現(xiàn)實(shí)問題,學(xué)生體質(zhì)薄弱反倒成為體育教育過程中不敢增加運(yùn)動(dòng)量的掣肘因素。
近10年來局部區(qū)域的數(shù)據(jù)快速積累以及數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)方法的普及,催生了運(yùn)用大數(shù)據(jù)技術(shù)對(duì)體質(zhì)健康監(jiān)測方面的研究熱潮。在風(fēng)險(xiǎn)預(yù)警方面,謝紅光和戴霞較早地將運(yùn)動(dòng)風(fēng)險(xiǎn)與體質(zhì)健康預(yù)警機(jī)制相聯(lián)系,力圖通過體育課堂教化對(duì)大學(xué)生健康行為養(yǎng)成起到促進(jìn)作用,[3]石巖和霍炫伊使用知識(shí)圖譜分析了1990-2016年間相關(guān)文獻(xiàn)強(qiáng)調(diào)未來研究趨勢中運(yùn)動(dòng)風(fēng)險(xiǎn)預(yù)警的重要性,[4]楊帆靜和陳志輝認(rèn)為基于運(yùn)動(dòng)信息分析技術(shù)和數(shù)據(jù)挖掘方法對(duì)大眾體質(zhì)健康風(fēng)險(xiǎn)監(jiān)測具有指導(dǎo)意義。[5]在算法應(yīng)用方面,李文杰和周慶豐較早提出通過建立數(shù)學(xué)模型對(duì)女大學(xué)生體質(zhì)狀況分類并在教學(xué)過程中加以實(shí)施;[6]杜云梅和劉東通過設(shè)定12項(xiàng)體質(zhì)特征并使用樸素貝葉斯分類算法預(yù)測了21664名在校大學(xué)的體質(zhì)健康狀態(tài),成功率達(dá)到78%;[7]李寶國和陳鳳對(duì)183名青少年的體質(zhì)突變數(shù)據(jù)進(jìn)行計(jì)算機(jī)仿真模擬,使用5個(gè)維度指標(biāo)提升模型擬合準(zhǔn)確性;[8]汪志勝和劉承宜討論了拓?fù)鋵W(xué)在體質(zhì)測試的差異程度方面的Sigma算法分析。[9]上述研究雖然應(yīng)用不同算法能夠做到較為準(zhǔn)確預(yù)測結(jié)果,但模型解釋度與實(shí)踐指導(dǎo)場景還有待完善,特別對(duì)測試等級(jí)提升路徑難以提出有效建議,缺少現(xiàn)實(shí)性意義。
正是基于預(yù)防運(yùn)動(dòng)風(fēng)險(xiǎn)和科學(xué)運(yùn)動(dòng)干預(yù)的考量,本研究嘗試應(yīng)用大數(shù)據(jù)與機(jī)器學(xué)習(xí)技術(shù),對(duì)學(xué)生體質(zhì)監(jiān)測數(shù)據(jù)進(jìn)行建模與分析。具體而言,將機(jī)器學(xué)習(xí)中的分類算法運(yùn)用于學(xué)生體質(zhì)健康測試各項(xiàng)素質(zhì)中,并對(duì)自身屬性特征進(jìn)行擬合以獲得預(yù)測值。本文的重點(diǎn)在于依照決策樹算法構(gòu)建體測數(shù)據(jù)映射規(guī)則,在2015-2020年M校全校學(xué)生的體質(zhì)健康監(jiān)測數(shù)據(jù)中,選取BMI、肺活量、爆發(fā)力、耐力、速度、柔韌、靈敏度等指標(biāo),分析個(gè)人體質(zhì)健康特征,目的在于在高校局部環(huán)境中構(gòu)建屬于該校特點(diǎn)的體測健康等級(jí)預(yù)測與運(yùn)動(dòng)風(fēng)險(xiǎn)預(yù)警指標(biāo),進(jìn)而提出具有實(shí)踐指導(dǎo)意義的體質(zhì)鍛煉干預(yù)建議。
本文研究對(duì)象以M高校2015-2020年春秋兩學(xué)期的參加公共體育課程的學(xué)生。選取樣本的身體素質(zhì)特質(zhì)向量包括:BMI、肺活量、柔韌素質(zhì)(體前屈)、爆發(fā)力素質(zhì)(立定跳遠(yuǎn))、耐力素質(zhì)(男生1000/女生800米)、速度素質(zhì)(50米)、力量素質(zhì)(女生仰臥起坐/男生引體向上);樣本標(biāo)記為體質(zhì)健康測試成績等級(jí)。根據(jù)2014年修訂的《國家學(xué)生體質(zhì)健康標(biāo)準(zhǔn)》(以下簡稱《標(biāo)準(zhǔn)》)將體測成績分成優(yōu)秀、良好、及格和不及格五個(gè)等級(jí)。劃分訓(xùn)練集與測試集,采用最常用的“留出法”(hold-out),訓(xùn)練集用于建立分類決策樹模型,測試集用于評(píng)估模型的有效性:以70%作為訓(xùn)練集,30%作為測試集。全樣本共40076個(gè)有效數(shù)據(jù),其中訓(xùn)練集包含28054個(gè)樣本;測試集包含12022個(gè)樣本,具體情況參見表 1。
表1 訓(xùn)練集和測試集的體質(zhì)健康測試等級(jí)分布
檢驗(yàn)?zāi)P陀行砸蕾囉谠u(píng)估指標(biāo)的選定。以二分類問題為例,分類的結(jié)果和樣例的真實(shí)類別組合可以構(gòu)成以下四類情況:真陽性(true positive, TP)、假陽性(false positive, FP)、真陰性(true negative, TN)和假陰性(false negative, FN)。筆者選擇準(zhǔn)確率Accuracy=(TP+TN)/(TP+TN+FP+FN)、精確率Precision=(TP)/(TP+FP)、敏感度Sensitivity=(TP)/(TP+FN)與F1值指F1=(Precision×Sensitivity)/(Precision+Sensitivity)標(biāo)評(píng)判模型有效性。
由于決策樹屬于監(jiān)督的機(jī)器學(xué)習(xí)范疇,本文采用的實(shí)證設(shè)計(jì)流程參見圖1。經(jīng)過清洗環(huán)節(jié)數(shù)據(jù)集被分為具有類別標(biāo)記和特征屬性的兩個(gè)部分。在訓(xùn)練環(huán)節(jié),使用算法對(duì)模型訓(xùn)練,讓模型自動(dòng)建立類別標(biāo)記和特征屬性之間的聯(lián)系;在預(yù)測環(huán)節(jié),面對(duì)新的只有特征屬性而沒有類別標(biāo)記的數(shù)據(jù)集時(shí),模型可自動(dòng)判別樣本的類別標(biāo)記。
圖1 有監(jiān)督機(jī)器學(xué)習(xí)模型一般實(shí)證設(shè)計(jì)路徑
本文使用R(4.1.2版本)的rpart包進(jìn)行決策樹模型訓(xùn)練,使用CART算法構(gòu)建分類決策樹,并用測試集數(shù)據(jù)進(jìn)行評(píng)估。得到結(jié)果如下:
考慮大一大二和大三大四測試等級(jí)評(píng)價(jià)標(biāo)準(zhǔn)差異以及性別因素,本文將樣本分為大一大二男生、大三大四男生、大一大二女生、大三大四女生四個(gè)組別。整體準(zhǔn)確率、精確率、敏感度和F1值計(jì)算結(jié)果如表 2所示。經(jīng)過剪枝后的分類決策樹模型在上述四組的整體準(zhǔn)確率為0.83、0.81、0.78和0.82,模型整體測評(píng)結(jié)果較好。由于優(yōu)秀等級(jí)在除大一大二男生以外的樣本中相對(duì)較少,故模型對(duì)體質(zhì)測試優(yōu)秀等級(jí)無法識(shí)別。
參考《新編藥物學(xué)》(第17版)對(duì)發(fā)生嚴(yán)重ADR/ADE的藥品歸類。將中藥制劑歸屬于“中藥制劑”項(xiàng)中。共涉及藥品14類,抗感染藥物發(fā)生率最高(115例,32.12%),其次為腫瘤藥物(80例,22.35%),見表2??垢腥舅幬镏?,抗生素所占比例最高(91例,25.42%)。
表2 分類決策樹在預(yù)測集的準(zhǔn)確率、精確率、敏感度與F1值指標(biāo)
從男生組別來看,無論大一大二還是大三大四組別中的在及格和不及格的標(biāo)記組別的精確度、敏感度和F1值均超過0.85;對(duì)女生組別而言,分類決策樹模型對(duì)良好和及格標(biāo)記組別的評(píng)估指標(biāo)較好,分別高于0.68和0.81,相對(duì)較高。考慮到模型的剪枝策略不相同,分類決策樹在上述四組樣本的評(píng)估結(jié)果并不可比。
對(duì)上述四個(gè)組別的樣本進(jìn)行體質(zhì)健康測試等級(jí)樹形表示,見圖2、圖3、圖4、圖5。樹形結(jié)構(gòu)使用R的partykit包繪制。圖中對(duì)每個(gè)結(jié)點(diǎn)進(jìn)行了數(shù)字標(biāo)記,葉節(jié)點(diǎn)使用Node標(biāo)號(hào)。在葉節(jié)點(diǎn)中,展示了分類決策樹根據(jù)特征向量對(duì)標(biāo)記進(jìn)行分類的分布信息。從定性角度看,每個(gè)葉結(jié)點(diǎn)中分布最多的標(biāo)記代表該結(jié)點(diǎn)的定性分類信息。
圖2 大一大二男生組別剪枝后的體測等級(jí)分類決策樹結(jié)構(gòu)
圖3 大三大四男生組別剪枝后的體測等級(jí)分類決策樹結(jié)構(gòu)
圖4 大一大二女生組別剪枝后的體測等級(jí)分類決策樹結(jié)構(gòu)
圖 5 大三大四女生組別剪枝后的體測等級(jí)分類決策樹結(jié)構(gòu)
總體來看,以男生和女生為劃分的組別,體測總分等級(jí)為“不及格”的各單項(xiàng)風(fēng)險(xiǎn)閾值的類別有顯著差異,如表3所示。對(duì)男生而言,除耐力素質(zhì)外,主要是爆發(fā)力素質(zhì)和力量素質(zhì)影響體質(zhì)測試不及格;對(duì)女生而言,除耐力素質(zhì)外,主要是速度素質(zhì)對(duì)體質(zhì)測試成績不及格影響。
表3 不同組別的體測不及格男生、女生對(duì)應(yīng)不同素質(zhì)的風(fēng)險(xiǎn)閾值
從單項(xiàng)風(fēng)險(xiǎn)閾值來看,大一大二男生的耐力素質(zhì)風(fēng)險(xiǎn)閾值為4′52″,該風(fēng)險(xiǎn)值對(duì)應(yīng)單項(xiàng)成績50分,小于50分意味著體質(zhì)測試不及格;當(dāng)1000米跑進(jìn)4′52″但未快于4′20″時(shí),立定跳遠(yuǎn)風(fēng)險(xiǎn)閾值為189.5厘米,同時(shí)引體向上10.5個(gè)。大三大四男生耐力素質(zhì)風(fēng)險(xiǎn)閾值同樣為4′52″,但對(duì)比大一大二的單耐力因素風(fēng)險(xiǎn)類別而言,風(fēng)險(xiǎn)項(xiàng)目需同時(shí)關(guān)注立定跳遠(yuǎn)和引體向上和肺活量。在相同條件下,引體向上小于8.5個(gè)與引體向上小于15.5且肺活量小于2746.6,具有替代關(guān)系。對(duì)于女生而言,大一大二女生耐力素質(zhì)風(fēng)險(xiǎn)閾值為3′50″,該成績已經(jīng)達(dá)到及格檔的中上水平,明顯優(yōu)于男生成績,但速度素質(zhì)風(fēng)險(xiǎn)閾值為10″51,處于不及格檔的40分位。大三大四女生耐力素質(zhì)若處于風(fēng)險(xiǎn)閾值3′52″以上,則速度風(fēng)險(xiǎn)閾值為10″45略低于大一大二同類型水平,但另一組風(fēng)險(xiǎn)閾值組合為耐力素質(zhì)大于4′59″、速度素質(zhì)小于10″45和立定跳遠(yuǎn)小于155.5,該組數(shù)值的特點(diǎn)是耐力素質(zhì)和速度素質(zhì)均小于不及格檔的40分值,僅立定跳遠(yuǎn)跨過及格檔。
分類決策樹模型不僅能夠計(jì)算不及格等級(jí)的風(fēng)險(xiǎn)閾值,而且為具有不同體質(zhì)特征類型的學(xué)生提供提升路徑作為參考。進(jìn)一步將圖2、圖3、圖4、圖5中呈現(xiàn)的葉結(jié)點(diǎn)歸納為耐力偏弱型、力量偏弱型和速度偏弱型,進(jìn)一步對(duì)三類體質(zhì)類型學(xué)生的測試目標(biāo)提升路徑進(jìn)行歸納,如表4所示。
表4 男、女組不同體質(zhì)類型體質(zhì)測試等級(jí)提升路徑
對(duì)于男生而言,分為耐力偏弱和力量偏弱兩種類型,均以分叉特性歸納得出。前者在不及格區(qū)多以1000米未達(dá)到4分52為成績,要達(dá)到及格區(qū)最應(yīng)先將1000米跑提升至4分20,在此基礎(chǔ)上若達(dá)到良好區(qū)先強(qiáng)化立定跳遠(yuǎn)到206.5厘米,最后優(yōu)秀區(qū)引體向上需達(dá)到23個(gè)以上;后者雖為力量偏弱型,但仍需保證1000米能夠在4分20以上才可能有進(jìn)一步體質(zhì)提升,在及格區(qū)和良好區(qū)按大一大二和大三大四加以區(qū)分,大一大二引體向上應(yīng)達(dá)到5個(gè)以上、大三大四要求略有提高為8個(gè)以上,在良好區(qū)大一大二男生必須在10個(gè)以上,而大三大四則提高到15個(gè)以上,從實(shí)際經(jīng)驗(yàn)來看對(duì)不少男生上肢力量提出嚴(yán)峻考驗(yàn)。對(duì)于女生而言,分為耐力偏弱和速度偏弱型,同樣以決策樹葉結(jié)點(diǎn)的樣本分布和分叉規(guī)則歸納得出。前者類型女生離開不及格區(qū)800米需跑到4分59以內(nèi),這對(duì)大部分女生而言不難,但離開及格區(qū)該項(xiàng)目需提高到3分52分以上,已屬不易,離開良好區(qū)更需要50米跑進(jìn)9秒09以內(nèi);速度偏弱型女生達(dá)到及格區(qū)50米至少要進(jìn)入10秒51,離開及格區(qū)和良好區(qū)50米需提高到9米03且仰臥起坐最少為33個(gè)??梢?,不同類型的男女生體質(zhì)測試等級(jí)提升路徑有所差異,耐力偏弱型男生主要應(yīng)先發(fā)展耐力素質(zhì),隨后到腿部爆發(fā)力,再到上肢力量;力量偏弱型男生在具備一定耐力素質(zhì)基礎(chǔ)上,優(yōu)先發(fā)展上肢力量;耐力偏弱型女生重點(diǎn)發(fā)展耐力素質(zhì),之后過渡到腿部爆發(fā)力素質(zhì);速度偏弱型女生在具備一定耐力素質(zhì)基礎(chǔ)上,除要練習(xí)腿部爆發(fā)力以外,還應(yīng)注意核心肌群的訓(xùn)練。
本文依M高校2015-2020年每學(xué)年春、秋兩個(gè)學(xué)期的體質(zhì)健康測試數(shù)據(jù),選取學(xué)生的體型指標(biāo)、肺活量、爆發(fā)力、耐力、速度、柔韌、靈敏度等特征指標(biāo),預(yù)測體質(zhì)健康測試等級(jí)結(jié)果。應(yīng)用CART分類算法對(duì)大一大二男、女生和大三大四男、女生四個(gè)組分別建構(gòu)決策樹模型,整體預(yù)測準(zhǔn)確較好,依次為0.83、0.78、0.81和0.82。經(jīng)由訓(xùn)練集形成的決策樹評(píng)估規(guī)則直觀呈現(xiàn)了樣本在不同體質(zhì)測試等級(jí)標(biāo)記的葉結(jié)點(diǎn)分布方式。應(yīng)用機(jī)器學(xué)習(xí)的決策算法與樹形結(jié)構(gòu)兼顧了模型預(yù)測的準(zhǔn)確性和模型本身的解釋性,相較于以往研究能為大學(xué)生體質(zhì)測試提供指導(dǎo)建議。在進(jìn)一步的討論中,筆者發(fā)現(xiàn)體質(zhì)測試是否不及格的身體素質(zhì)決定性影響因素有顯著差異,主要表現(xiàn)為對(duì)男生而言,除耐力素質(zhì)外,主要是爆發(fā)力素質(zhì)和力量素質(zhì)決定體質(zhì)測試不及格;對(duì)女生而言,除耐力素質(zhì)外,主要是速度素質(zhì)對(duì)體質(zhì)測試成績是否不及格有決定影響。另外,對(duì)耐力偏弱型、力量偏弱型和速度偏弱型三類不同體質(zhì)類型的學(xué)生給出了具體提升路徑建議。