摘要:研究旨在通過對CNKI數(shù)據(jù)庫中2004-2023年的有關(guān)“青少年體質(zhì)健康”的1781篇文獻進行文本分析,深入探討中國青少年體質(zhì)健康領(lǐng)域的研究狀況,從主題聚類、關(guān)鍵影響因素和未來研究趨勢等角度出發(fā),以促進青少年體質(zhì)健康在社會結(jié)構(gòu)中的積極影響。研究采用文本分析法,結(jié)合Word2Vec算法、TF-IDF權(quán)重算法和K-means聚類算法,對文獻進行多維度分析。研究發(fā)現(xiàn):青少年體質(zhì)健康研究主題主要集中在體質(zhì)健康指標、現(xiàn)狀對比與啟示、干預(yù)策略與健康促進、政策背景與改革以及政府政策指導(dǎo)等方面,反映了對青少年健康的全面關(guān)注。
關(guān)鍵詞:青少年" 體質(zhì)健康" Word2vec" 可視化
中圖分類號:G804 文獻標識碼:A 文章編號:1006-8902-(2024)-16-090-4-ZQ
1、引言
青少年健康是社會文明進步的前提,是祖國富強昌盛的重要標志,是努力創(chuàng)造健康、可持續(xù)發(fā)展社會的變革引擎,對于建立健康的、有活力的社會組成具有重要意義。然而隨著青少年兒童的學(xué)業(yè)壓力加大,內(nèi)卷嚴重,存在一些學(xué)校和家長過于重視文化課成績而忽視體質(zhì)健康發(fā)展的現(xiàn)象,導(dǎo)致青少年兒童出現(xiàn)如近視、肥胖等較嚴重的體質(zhì)健康問題。因此,長期以來,青少年體質(zhì)健康問題一直是國家和社會關(guān)注的焦點?!兜诎舜稳珖鴮W(xué)生體質(zhì)與健康調(diào)研結(jié)果》顯示:我國學(xué)生體質(zhì)健康達標優(yōu)良率逐漸上升,形態(tài)發(fā)育指標、身體素質(zhì)持續(xù)出現(xiàn)好轉(zhuǎn)。這不僅歸功于國家頒布的一系列針對青少年體質(zhì)健康問題的政策,同時也得益于專注提升青少年體質(zhì)健康的研究人員取得的成果。
本文首次將Word2Vec算法引入體育領(lǐng)域,它不僅可以實現(xiàn)CiteSpace的基本功能,還能夠通過深度學(xué)習(xí)將詞語映射到高維向量空間,從而實現(xiàn)上下文信息的有效表示與詞向量的計算,是自然語言處理領(lǐng)域的一項重要成果。
本研究集中研究了近20年來在中國進行的有關(guān)“青少年體質(zhì)健康”的學(xué)術(shù)研究,總計包括1788篇學(xué)術(shù)論文。首先,我們運用TF-IDF算法和單詞頻率分析,選取關(guān)鍵詞列表;隨后結(jié)合Word2Vec和K-MEANS聚類算法對關(guān)鍵詞進行了深入分析,以揭示研究的主要主題和內(nèi)在聯(lián)系;接著,我們根據(jù)詞頻制作了關(guān)鍵詞的詞云圖,以直觀地展示研究熱點隨時間的演化變化;然后進行了基于合理推測的未來研究趨勢分析;最后,從六個主要層面分析了青少年體質(zhì)健康發(fā)展影響因素。
2、研究過程
2.1、數(shù)據(jù)采集與文本預(yù)處理
(1)數(shù)據(jù)采集。
以“青少年體質(zhì)健康”為搜索式對CNKI數(shù)據(jù)庫進行文獻檢索,時間跨度2004年1月1日—2023年8月19日(數(shù)據(jù)收集當(dāng)日)。共檢索到1787篇論文,其中1392篇來源于期刊、199篇來源于中國會議、30篇來源于國際會議、97篇來源于碩士論文、15篇來源于博士論文、53篇來源于報紙、1篇來源于輯刊。下載這1787篇論文的“題目、關(guān)鍵詞、摘要、發(fā)表時間”用于后續(xù)分析。
(2)文本預(yù)處理。
將所有論文的“題目、關(guān)鍵詞、摘要”部分作為文本語料庫。為了便于后續(xù)選取關(guān)鍵詞,以及Word2Vec“讀取”文本語料,“學(xué)習(xí)”單詞含義,我們需要清理文本語料庫并分離單詞。考慮到去除停詞可以提高文本挖掘的準確性,我們選擇了以下目前廣泛使用的停詞列表:中文停詞列表、百度停詞列表、哈爾濱工業(yè)大學(xué)停詞列表和四川大學(xué)停詞列表。去除列表中的停詞后,我們使用Python中的jieba分詞庫對文本文檔進行分詞。
將預(yù)處理后的“題目、關(guān)鍵詞、摘要”作為背景語料庫,用于訓(xùn)練Word2Vec模型。預(yù)處理后的“摘要”部分作為目標語料庫,用于后續(xù)關(guān)鍵詞選取和分析。
2.2、一級關(guān)鍵詞選取
本文采取TF-IDF權(quán)值與單詞頻率相結(jié)合的方法選取一級關(guān)鍵詞。首先,逐一計算目標語料庫中每個單詞的TF-IDF權(quán)值。根據(jù)對全部單詞權(quán)值的觀察,選擇0.0003作為權(quán)值閾值;然后,計算權(quán)值高于閾值的單詞在目標語料庫中出現(xiàn)的頻率,確定詞頻閾值為25;最后,把目標語料庫中TF-IDF權(quán)值高于0.0004,同時詞頻高于25的單詞作為一級關(guān)鍵詞。
2.3、Word2Vec建模與主題聚類
本文基于背景語料庫訓(xùn)練Word2Vec模型,考慮到數(shù)據(jù)特點、計算效率和相似性建模的準確性,我們選擇Skip-gram模型。并且根據(jù)現(xiàn)有研究,將搜索窗口設(shè)置為10,單詞向量維度設(shè)置為400,忽略詞頻小于5的單詞。利用Word2Vec模型將背景語料庫中的單詞映射到高維詞向量上。由此得到每個一級關(guān)鍵詞的詞向量。然后運用K-means算法對一級關(guān)鍵詞對應(yīng)的詞向量進行聚類操作,參考知網(wǎng)的主要主題分布將類別數(shù)設(shè)定為5。由于詞向量的相似程度能夠反映詞序列的語義信息,所以K-means算法會把具有相似語義或經(jīng)常在相同語境出現(xiàn)的詞向量聚為一類。為了更好地理解向量(關(guān)鍵詞)的分布,我們采用t-SNE方法,利用二維圖進行約簡和可視化,并把聚類結(jié)果顯示在圖1中,實現(xiàn)對一級關(guān)鍵詞的聚類可視化。
由圖1,可以看出所有一級關(guān)鍵詞根據(jù)語義向量被聚類為五類,分別對應(yīng)著以下五個主題:
■——“體質(zhì)健康指標”主題;
▲——“現(xiàn)狀對比與啟示”主題;
●——“干預(yù)策略與健康促進”主題;
◆——“政策背景與改革”主題;
▼——“政府政策指導(dǎo)”主題。
3、研究主題分析
3.1、體質(zhì)健康指標主題類團
從圖1中我們可以看出,在“■”區(qū)域中,“身高、體重、肺活量”距離較近;“力量、耐力、速度”距離較近;“超重、肥胖、視力”距離較近。相對距離較近暗示了這些詞匯在語義上相關(guān)度較高,通常會同時出現(xiàn)。說明了在研究青少年體質(zhì)健康指標時,學(xué)者們常常將這些詞匯進行綁定研究。
《青少年體質(zhì)健康發(fā)展報告》指出,評估青少年健康的關(guān)鍵指標包括BMI、爆發(fā)力、速度、力量和耐力。然而,我國青少年仍面臨著肺功能較差、近視率高和肥胖率上升等問題。此外,青少年的速度和力量素質(zhì)增長停滯,這也是學(xué)校體育教育的挑戰(zhàn)之一。采用以輕度有氧運動為主,輔以有限量的無氧運動的封閉式運動計劃,能夠更容易被青少年肥胖者接受并持之以恒地堅持下去。通過這種封閉式運動減肥計劃,青少年肥胖者的身體健康狀況將明顯改善,反映在BMI指數(shù)、肺活量指數(shù)、體質(zhì)量、耐力素質(zhì)以及柔韌性指標上都會有顯著的提高。這樣的計劃不僅有效,還可以避免中途放棄的情況。在健康指標的評價標準方面,季瀏、吳慧攀等人根據(jù)“體教融合”的背景,分析了我國兒童青少年體質(zhì)健康評價指標,并探索制定了新的體質(zhì)健康評價標準。
3.2、現(xiàn)狀對比與啟示主題類團
根據(jù)圖1不難發(fā)現(xiàn),國內(nèi)研究青少年體質(zhì)健康時側(cè)重于對青少年兒童體質(zhì)的監(jiān)測、數(shù)據(jù)、特征和現(xiàn)狀的分析,對體質(zhì)健康問題進行評價,并探索問題下降的因素。同時,針對問題提出了相應(yīng)的對策、啟示和相關(guān)措施。此外,在進行國內(nèi)外青少年體質(zhì)健康的對比研究時,主要關(guān)注美國和日本這兩個國家,并作為比較對象。
相關(guān)研究顯示,美國、加拿大、歐洲和日本已經(jīng)將學(xué)生體質(zhì)健康測試的范疇擴展,不僅僅關(guān)注學(xué)生體質(zhì)和運動成績的評估,還強調(diào)培養(yǎng)健康的生活理念和終身體育意識,以全面促進健康。他們在肯定體質(zhì)健康測試的重要性和測試結(jié)果反饋的基礎(chǔ)上,全面激發(fā)學(xué)生參與體育運動的積極性,倡導(dǎo)學(xué)生養(yǎng)成健康的生活方式。相比之下,中國的學(xué)生體質(zhì)健康測試更側(cè)重于整體數(shù)據(jù)統(tǒng)計,以便國家了解學(xué)生的體質(zhì)健康狀況,促進學(xué)校體育工作的開展以及測試標準的頂層設(shè)計。然而,中國的體質(zhì)健康測試在將測試結(jié)果個體化分析并反饋給學(xué)生和家長方面存在不足。此外,學(xué)生達標測試所反映的身體素質(zhì)與體質(zhì)水平等方面的關(guān)聯(lián)也需要更多地關(guān)注。在運動參與層面,從中學(xué)過渡到大學(xué)階段,美國青少年自愿增加鍛煉時間并減少體重的比例顯著上升,而中國青少年則隨著年級增加,參與體育活動的比例和時間減少。通過監(jiān)測和測試青少年的體質(zhì)健康,可以清晰地了解不同階段青少年體質(zhì)健康數(shù)據(jù)和變化情況,以便在不同時期為不同情況提供干預(yù)和指導(dǎo)。國內(nèi)關(guān)于青少年體質(zhì)健康狀況的研究也都基于對青少年體質(zhì)的監(jiān)測和調(diào)查結(jié)果展開。
3.3、干預(yù)策略與健康促進主題類團
在提升青少年體質(zhì)健康的干預(yù)策略研究中,普遍認為從學(xué)校和家庭兩個方面入手是關(guān)鍵的。家長和教師在這個過程中起著重要作用。提升方案主要包括有氧、運動、健身等,而在提升過程中,注意運動時間的安排、科學(xué)合理的方法與方式,以及干預(yù)效果的評估也都是重要的因素。
運動訓(xùn)練、合理飲食和心理矯正對于提升青少年體質(zhì)健康能夠發(fā)揮較為積極的作用。運動訓(xùn)練是一種直接有效的非醫(yī)療干預(yù)方式。有氧運動在時間上可以明顯改善肥胖的青少年的體質(zhì)健康,短至3周的有氧運動即可顯著改善肥胖青少年的身體形態(tài)、提高脂代謝和身體素質(zhì),而6周的有氧運動可以顯著提高中度和重度肥胖者的體質(zhì)健康水平。合理的飲食結(jié)構(gòu)不但可以確保青少年獲得足夠的營養(yǎng)物質(zhì),包括蛋白質(zhì)、碳水化合物、脂肪、維生素和礦物質(zhì)等,以支持身體正常的生長和發(fā)育,還有助于增強免疫系統(tǒng),提高抵抗疾病的能力,減少感染和疾病的發(fā)生率。心理矯正的干預(yù)能夠促進青少年的目標設(shè)定和自律,培養(yǎng)自律性格,有助于他們堅持鍛煉和健康飲食習(xí)慣,從根本上為體質(zhì)健康的提升夯實基礎(chǔ)。針對上述干預(yù)策略,需要學(xué)校、家庭和社會三方協(xié)同合作,因為從青少年活動的場所和資源角度來看,僅依靠學(xué)校是遠遠不夠的,更需要家庭和社會的共同參與,以確保青少年有充足的時間和必要的物質(zhì)支持來進行體育鍛煉。
3.4、政策背景與改革主題類團
如圖1可以看出提升青少年體質(zhì)健康的相關(guān)措施的重點開始轉(zhuǎn)向政府、學(xué)校和俱樂部?!熬銟凡俊敝赶蝮w育活動和課外俱樂部的角色,這可能涉及學(xué)校外的體育鍛煉機會和社交團體?!爸锌肌焙汀案呖肌钡奶峒氨砻髟谇嗌倌牦w質(zhì)健康領(lǐng)域,教育體制的安排可能對學(xué)生的體質(zhì)狀況產(chǎn)生影響。“政府”和“制度”作為關(guān)鍵詞出現(xiàn)暗示政府在促進體質(zhì)健康方面可能扮演著重要角色,也可能與政府相關(guān)政策的影響有關(guān)。此外,“雙減”“體教融合”“政策”“挑戰(zhàn)”“機遇”“前景”等詞語則表明在推動青少年體質(zhì)健康方面仍然可能存在政策障礙或挑戰(zhàn)。然而,伴隨著相關(guān)政策的推出和改進,同時也出現(xiàn)了一些機遇,以及通過改革和創(chuàng)新可以實現(xiàn)的前景。這個主題突顯了在青少年體質(zhì)健康領(lǐng)域中各種因素的相互影響,政府、學(xué)校和社會俱樂部等方面的相關(guān)措施對于提升青少年體質(zhì)健康的發(fā)展具有重要作用。
“雙減”政策的實施減輕了學(xué)生學(xué)業(yè)負擔(dān),增加了他們的空閑時間,從而使體育在學(xué)生生活中的地位得到重新審視。為了促進青少年體質(zhì)健康,需要在學(xué)校和家庭兩個層面采取措施。學(xué)校應(yīng)優(yōu)化體育教學(xué)資源,提供適合的場地和設(shè)施,提高體育課堂的教學(xué)質(zhì)量,確保學(xué)生在安全的環(huán)境下接受科學(xué)的體育指導(dǎo)。家庭則需要轉(zhuǎn)變“重文輕體”的觀念,為青少年的體育鍛煉提供有力的支持和鼓勵?!半p減”政策為促進青少年體質(zhì)健康創(chuàng)造了有利的教育背景和條件,而“體教融合”政策提供了科學(xué)的指導(dǎo)方法和路徑。然而,目前我國的“體教融合”仍然面臨著一些體制性障礙。具體來說,政府、學(xué)校和社會在共同推動青少年體育發(fā)展方面的合作機制尚未完善,缺乏協(xié)調(diào)、協(xié)同、共育、共建、共享和共治的有效運行機制。
3.5、政府政策指導(dǎo)主題類團
在政府政策指導(dǎo)主題中,高度相關(guān)的詞匯可能指向衛(wèi)生和教育部門發(fā)布的政策文件、指導(dǎo)意見等,突顯了相關(guān)部門對青少年體質(zhì)健康的關(guān)注和規(guī)劃?!爸醒搿焙汀爸泄仓醒搿眲t突顯了國家層面領(lǐng)導(dǎo)對青少年體質(zhì)健康問題的高度重視。“高度重視”和“貫徹落實”則表明領(lǐng)導(dǎo)層對該議題的認知和政策推行的堅決態(tài)度,也突顯在政策實施方面的實際行動。同時,“教育部”和“素質(zhì)教育”指向了教育領(lǐng)域的作用,可能意味著將體質(zhì)健康融入素質(zhì)教育中的趨勢,從而實現(xiàn)青少年在多個方面的全面成長。
4、結(jié)論
通過運用自然語言處理(NLP)技術(shù),能夠深入挖掘青少年體質(zhì)健康文獻的內(nèi)在模式和相互作用。在這項研究中,我們利用Word2Vec將文獻中的單詞轉(zhuǎn)化為向量表示。這些向量不僅代表了單詞的語義信息,還能夠捕捉到單詞之間的關(guān)聯(lián)性。通過對文獻中的單詞和術(shù)語進行向量化,能夠更好地理解研究主題之間的相似性和差異性。這種方法不僅提供了對青少年體質(zhì)健康領(lǐng)域內(nèi)不同主題的定量度量,還有助于識別那些與期刊典型資源相關(guān)的主題。并且此方法以詞云圖的形式展現(xiàn)了每個階段的研究重點轉(zhuǎn)移,從側(cè)面也反映出了我國青少年體質(zhì)健康的變化趨勢。本研究的主要研究成果概括如下:
(1)我國近二十年關(guān)于青少年體質(zhì)健康的相關(guān)研究主題主要集中在“體質(zhì)健康指標”“現(xiàn)狀對比與啟示”“干預(yù)策略與健康促進”“政策背景與改革”“政府政策指導(dǎo)”等方面;
(2)國內(nèi)的相關(guān)文獻在探索青少年體質(zhì)健康方面的研究時,主要關(guān)注全國范圍內(nèi)的中小學(xué)生群體。研究內(nèi)容側(cè)重于對青少年兒童體質(zhì)的監(jiān)測、數(shù)據(jù)、特征和現(xiàn)狀的分析,對體質(zhì)健康問題進行評價,并探索問題下降的因素。同時,針對問題提出了相應(yīng)的對策、啟示和相關(guān)措施;
(3)在提升青少年體質(zhì)健康的干預(yù)策略研究中,普遍認為從學(xué)校和家庭兩個方面入手是關(guān)鍵。家長和教師在這個過程中起著重要作用。提升方案主要包括有氧運動、健身等,而在提升過程中,注意運動時間的安排、科學(xué)合理的方法與方式,以及干預(yù)效果的評估也都是重要的因素;
(4)青少年體質(zhì)健康研究領(lǐng)域正朝著更綜合、多維度和政策驅(qū)動的方向發(fā)展。這對于培養(yǎng)健康的新一代和減少肥胖等健康問題具有重要意義,并有望在未來為制定更有效的政策和實踐提供有力支持。
參考文獻:
[1]姜蘇航,趙偉科,朱從麗.全國第八次學(xué)生體質(zhì)與健康調(diào)研現(xiàn)狀及對策研究[J].文體用品與科技,2022(16).
[2]張青松,張繼生, 周惠新,等.我國青少年體質(zhì)健康的研究熱點與發(fā)展趨勢[J].企業(yè)經(jīng)濟,2020,39(09).
[3]CHURCH K W.Word2Vec[J].Natural Language Engineering,2017,23(1).
[4]鄧君,孫紹丹,王阮,等.基于Word2Vec和SVM的微博輿情情感演化分析[J].情報理論與實踐,2020,43(08).
[5]ZHU J-J,REN Z J. The evolution of research in resources, conservation amp; recycling revealed by Word2vec-enhanced data mining[J].Resources, Conservation and Recycling,2023.
[6]AIZAWA A. An information-theoretic perspective of tf-idf measures[J].Information Processing amp; Management,2003,39(1).
[7]NOVIANTI P, SETYORINI D, RAFFLESIA U. K-Means cluster analysis in earthquake epicenter clustering[J].International Journal of Advances in Intelligent Informatics,2017,3(2).
[8]史德平,趙宏雯.青少年體質(zhì)健康存在的主要問題及體育保健發(fā)展趨勢研究[J].青少年體育,2020(10).
[9]劉庭友.封閉式運動減肥對肥胖青少年體質(zhì)健康的影響[J].信陽師范學(xué)院學(xué)報(自然科學(xué)版),2019,32(03).
[10]季瀏,尹小儉,吳慧攀,等.“體教融合”背景下我國兒童青少年體質(zhì)健康評價標準的探索性研究[J].體育科學(xué),2021,41(03).
[11]郭瑞芃,徐建方,李良,等.中外青少年體質(zhì)健康測評體系對比研究[J].中國體育科技,2019,55(06).
[12]何玲.中美青少年體質(zhì)健康與運動促進比較[J].中國青年研究,2016(06).
[13]潘燕,侯春光.聯(lián)合干預(yù)法改善青少年體質(zhì)健康的效果評價[J].中國學(xué)校衛(wèi)生,2014,35(08).
[14]潘麗英,馬春蓮,谷涌泉.6周有氧運動改善不同程度肥胖青少年體質(zhì)健康的研究[J].武漢體育學(xué)院學(xué)報,2022,56(07).
[15]李龍.學(xué)校家庭社會協(xié)同促進青少年體質(zhì)健康研究[J].體育文化導(dǎo)刊,2014(10).
[16]劉瑩,苑廷剛,敬龍軍,等.“雙減”政策下促進青少年體質(zhì)健康發(fā)展機遇、挑戰(zhàn)與路徑[J].體育文化導(dǎo)刊,2022(04).
[17]李愛群,呂萬剛,漆昌柱,等.理念·方法·路徑:體教融合的理論闡釋與實踐探討——“體教融合:理念·方法·路徑”學(xué)術(shù)研討會述評[J].武漢體育學(xué)院學(xué)報,2020,54(07).