朱 春
(蕪湖職業(yè)技術(shù)學(xué)院 體育教學(xué)部,安徽 蕪湖 241003)
關(guān)聯(lián)規(guī)則是數(shù)據(jù)挖掘中所要遵循的重要規(guī)則,關(guān)聯(lián)規(guī)則以原始資料作為處理對象,在高頻項目組的控制下,利用項目組中的高頻項建立規(guī)則,并結(jié)合不同的最小支持度,逐步搜索形成數(shù)據(jù)項目組[1].關(guān)聯(lián)規(guī)則能夠使用已知的數(shù)據(jù)推算出其他與其有關(guān)聯(lián)的數(shù)據(jù),并以此為對比標(biāo)準(zhǔn),構(gòu)建形成一個科學(xué)化的判斷過程[2].
在計算機技術(shù)的參與下,大學(xué)生體質(zhì)測試模式逐漸發(fā)展,進(jìn)而形成一個健康數(shù)據(jù)分析系統(tǒng),將學(xué)生各項體質(zhì)測試指標(biāo)輸入該系統(tǒng)后,系統(tǒng)能夠以特定的健康數(shù)值,生成個體或總體的身體健康分析結(jié)果,校方據(jù)此調(diào)整實際的教學(xué)方向,增強大學(xué)生的身體素質(zhì)[3].
在境外,分析大學(xué)生體質(zhì)測試健康數(shù)據(jù)的研究起步較早,其大多應(yīng)用了數(shù)據(jù)挖掘算法后,數(shù)據(jù)分析系統(tǒng)逐漸向精準(zhǔn)化、關(guān)聯(lián)化發(fā)展,可高效分析大學(xué)生群體的體質(zhì)健康狀況[4-7];而我國,相關(guān)數(shù)據(jù)分析系統(tǒng)起步較晚,文獻(xiàn)[8]以學(xué)生體質(zhì)健康測試區(qū)塊鏈為研究對象,在"省級-地級-縣級"的三級結(jié)構(gòu)下,從矯正利害相關(guān)者的關(guān)注點出發(fā),從平臺架構(gòu)、應(yīng)用前景與現(xiàn)實挑戰(zhàn)3個向度對學(xué)生體質(zhì)健康測試現(xiàn)狀進(jìn)行分析.文獻(xiàn)[9]采用聚類分析法評價醫(yī)學(xué)院校學(xué)生體質(zhì)健康成績結(jié)構(gòu)特征,揭示學(xué)生體質(zhì)結(jié)構(gòu)特征的內(nèi)在聯(lián)系,為醫(yī)學(xué)院校學(xué)生體質(zhì)健康科學(xué)訓(xùn)練工作提供理論依據(jù),有助于快速提高體質(zhì)健康成績.
綜合各國的研究現(xiàn)狀來看,設(shè)計一種基于關(guān)聯(lián)規(guī)則的大學(xué)生體質(zhì)測試健康數(shù)據(jù)分析系統(tǒng)是很有必要的.因為其在體質(zhì)測試指標(biāo)輸入后,通過給定的最小置信度,在每個最大頻繁項集中尋找置信度不小于設(shè)定的最小置信度的關(guān)聯(lián)規(guī)則,便于確定數(shù)據(jù)項數(shù)量數(shù)值、降低迭代次數(shù)、減少實際響應(yīng)時間.
在構(gòu)建分析系統(tǒng)的硬件層結(jié)構(gòu)時,選擇數(shù)據(jù)采集設(shè)備和上位機作為主要組成部分,在獲取實際的大學(xué)生體質(zhì)物理量數(shù)據(jù)后(如身高、體重等),通過傳感器將其傳輸?shù)接布?硬件層采用NI Compact RIO機箱作為數(shù)據(jù)采集核心器件,搭建形成的硬件層結(jié)構(gòu)如圖1所示.
在圖1所示的硬件層結(jié)構(gòu)下,控制數(shù)據(jù)采集模塊內(nèi)設(shè)置1個FPGA芯片,芯片外部連接1個可拆卸的工業(yè)I/O模塊后,外部串聯(lián)1個嵌入式控制器NI cRIO-9075,配置1個4通道的電壓輸入模塊NI9215后,外部串聯(lián)1個8通道的電流輸入模塊NI9275.在控制器內(nèi)形成同步采樣電壓過程,緩沖處理硬件結(jié)構(gòu)中的模數(shù),形成模數(shù)轉(zhuǎn)換器,在模擬輸入通道的控制下,在硬件結(jié)構(gòu)內(nèi)形成一個數(shù)據(jù)傳輸通道,實現(xiàn)對大學(xué)生體側(cè)數(shù)據(jù)的傳輸.
圖1 搭建的硬件層結(jié)構(gòu)
設(shè)置NI cRIO-9075設(shè)備的工作溫度范圍為40~-30 ℃之間,固定其工作頻率為300 MHz后,在設(shè)備上放置1個4槽接口并連接1個串行端口.在I/O串口功能的支持下,實現(xiàn)硬件結(jié)構(gòu)的定時功能,設(shè)定的工作參數(shù)如表1所示.
表1 設(shè)定的器件工作參數(shù)
在表1所示的器件工作參數(shù)下,在硬件層結(jié)構(gòu)外部設(shè)定無線WIFI感應(yīng)器,控制感應(yīng)器內(nèi)集成數(shù)據(jù)信號監(jiān)聽、數(shù)據(jù)預(yù)處理以及數(shù)據(jù)通信3個模塊.數(shù)據(jù)信號監(jiān)聽模塊內(nèi)部放置一個1GB、支持RAM功能的四核處理器,利用處理器板上的USB端口,外部連接一個LPDDR2 SDRAM作為儲存預(yù)處理數(shù)據(jù)的元件,元件外部連接一個微型天線,接收體測過程產(chǎn)生的各項數(shù)據(jù).
采用光電傳感器( EE-SX1042,深圳中勤拓展實業(yè)有限公司)作為數(shù)據(jù)采集電路的核心,光電傳感器將激光束用偏振片遮擋后,串聯(lián)一個放大器,形成的信號采集電路結(jié)構(gòu)如圖2所示.
在圖2所示的信號采集電路結(jié)構(gòu)下,以控制電路中的無線傳輸芯片(NRF24L01)為核心,并在其內(nèi)部集成晶振和頻率合成器.為了控制芯片的發(fā)射功率,在頻率合成器外部連接一個調(diào)制器后,控制芯片的工作電流在10 mA左右,并在芯片上配置1個天線,同時調(diào)控相同接收數(shù)據(jù)頻道內(nèi)的數(shù)據(jù)信號.在外圍電路內(nèi)設(shè)定10個元器件后,控制器件的工作電壓為3.3V.通信器件采用單邊天線,調(diào)控采集電路中產(chǎn)生的電感與電容間的參數(shù)值.
圖2 設(shè)計得到的信號采集電路結(jié)構(gòu)
為了控制硬件電路的功率輸出,在信號采集電路外部并聯(lián)1個橋式電路結(jié)構(gòu),電路內(nèi)部設(shè)定3個二極管和2個濾波電容.實際控制硬件結(jié)構(gòu)時,通過控制二極管間接控制數(shù)據(jù)采集電路中的電流大小,形成的橋式電路結(jié)構(gòu)如圖3所示.
圖3 構(gòu)建得到的橋式電路結(jié)構(gòu)
在圖3所示的橋式電路結(jié)構(gòu)下,當(dāng)電阻R4輸入高電平時,控制Q1接口流入電流,在線圈U-V的控制下,電流流經(jīng)Q4端口流入到地端,定義上述電流流經(jīng)過程為正方向.定義VCC為電容C3的充電電源后,將C9電容作為繼電器的調(diào)和電容.控制電容C8工作時兩端充電,將電路中的碰撞滑塊直接發(fā)射到碰撞銅板上,在RV1接口上調(diào)節(jié)電壓的輸出.在上述硬件結(jié)構(gòu)的控制下,設(shè)計數(shù)據(jù)分析系統(tǒng)的軟件結(jié)構(gòu).
在構(gòu)建體質(zhì)測試健康數(shù)據(jù)關(guān)聯(lián)規(guī)則時,以硬件結(jié)構(gòu)采集得到的初始體質(zhì)數(shù)據(jù)作為處理對象[10],設(shè)定I={I1,I2,...,Im}是m個測試項目的數(shù)據(jù)集合,此時體質(zhì)測試項目為Ik,也就是長度為k的項集.假設(shè)數(shù)據(jù)集合中存在一個健康數(shù)據(jù)子集T,此時子集在測試集上的映射就可定義為關(guān)聯(lián)性,關(guān)聯(lián)性數(shù)量關(guān)系可表示為:
(1)
其中,|D|表示事務(wù)總數(shù)量;σ(Ik∪k)表示存在的健康數(shù)據(jù)數(shù)量.在上述數(shù)量關(guān)系下,構(gòu)建健康數(shù)據(jù)在體質(zhì)測試數(shù)據(jù)中出現(xiàn)的概率,數(shù)值關(guān)系可表示為:
(2)
其中,sup_count(Ik∪k)表示包含數(shù)據(jù)長度的事件,sup_count(k)表示含有健康數(shù)據(jù)的體測事物數(shù).根據(jù)上述計算公式,概率值可以反映大學(xué)生體質(zhì)測試健康數(shù)據(jù)在總數(shù)據(jù)集中的比例.當(dāng)概率數(shù)據(jù)值較大時,可作為健康數(shù)據(jù)之間相互規(guī)則的最小置信度.以最小置信度為篩選準(zhǔn)則,對數(shù)據(jù)中的數(shù)據(jù)項進(jìn)行反復(fù)篩選,然后對健康數(shù)據(jù)進(jìn)行檢驗.將健康數(shù)據(jù)不斷集成到一個健康數(shù)據(jù)集中,設(shè)置身體素質(zhì)情況判斷的體質(zhì)測試指標(biāo),逐步提取滿足要求的規(guī)則,作為健康數(shù)據(jù)的篩選規(guī)則.如圖4所示.
圖4 體質(zhì)測試健康數(shù)據(jù)間的對應(yīng)關(guān)系示意圖
圖4中,構(gòu)造關(guān)聯(lián)規(guī)則后,對體質(zhì)測試數(shù)據(jù)輸出的關(guān)聯(lián)結(jié)果進(jìn)行分類,形成健康數(shù)據(jù)測試組,將其分為訓(xùn)練數(shù)據(jù)組和驗證數(shù)據(jù)組.在數(shù)據(jù)比例的控制下,構(gòu)建數(shù)據(jù)訓(xùn)練模型,對項目的預(yù)測數(shù)據(jù)進(jìn)行測量,并按照過程構(gòu)建實際的健康函數(shù)[11].為了控制評價形成的分類函數(shù)精度,采用二元模型將算法模型、計算出的數(shù)據(jù)劃分為不同類型的數(shù)據(jù),在確保都是真實類數(shù)據(jù)的情況下,即可保證數(shù)據(jù)訓(xùn)練模型的實際精度滿足要求.
大學(xué)生體質(zhì)測試數(shù)據(jù)的種類較為復(fù)雜,所以在實現(xiàn)其數(shù)據(jù)分析功能時,將其劃分為登錄模塊、數(shù)據(jù)管理模塊、數(shù)據(jù)分析模塊以及數(shù)據(jù)回調(diào)模塊等.在JAVA語言工具的幫助下,用戶登錄模塊設(shè)定用戶賬號以及用戶密碼,當(dāng)密碼與賬號間符合設(shè)定的代碼邏輯關(guān)系時,開放數(shù)據(jù)分析系統(tǒng)內(nèi)部設(shè)定的權(quán)限[12].數(shù)據(jù)管理模塊的主要功能是更新或更正大學(xué)生個人信息和體質(zhì)測試數(shù)據(jù),按照當(dāng)前大學(xué)生體質(zhì)測試項目名稱作為數(shù)據(jù)管理批次.數(shù)據(jù)分析模塊主要對分析系統(tǒng)硬件中的健康數(shù)據(jù)進(jìn)行采集、壓縮和存儲,方便高校對大學(xué)生體質(zhì)數(shù)據(jù)進(jìn)行調(diào)用與分析[13].數(shù)據(jù)回調(diào)模塊以構(gòu)建的分析模塊作為基礎(chǔ).具體實現(xiàn)過程如下:
第1步,在上述所示的模塊劃分下,據(jù)實際測試的大學(xué)生體質(zhì)數(shù)據(jù)選擇健康數(shù)據(jù)值,建立相同測試批次的數(shù)據(jù)分析任務(wù),同時配合學(xué)生自身體質(zhì)參數(shù),一定程度上增加或是刪除操作[14].根據(jù)設(shè)定的關(guān)聯(lián)規(guī)則,在線分析體質(zhì)測試數(shù)據(jù)在健康標(biāo)準(zhǔn)中所處的位置,計算得到體測數(shù)據(jù)項的流形程度,計算公式可表示為:
(3)
其中,Lift(k?T)表示體測數(shù)據(jù)在健康數(shù)據(jù)關(guān)聯(lián)關(guān)系中形成的提升度,在提升度數(shù)值的控制下,方便體育教師對學(xué)生的體測數(shù)據(jù)進(jìn)行體質(zhì)健康數(shù)據(jù)分析.
第2步,進(jìn)入健康數(shù)據(jù)分析模塊后,選擇不同種類的體質(zhì)測試通道,采集獲取得到大學(xué)生體質(zhì)測試數(shù)據(jù),控制此時對數(shù)據(jù)信號的壓縮以及分析,使用壓縮處理后的信號進(jìn)行數(shù)據(jù)回調(diào)分析,同時實現(xiàn)體測數(shù)據(jù)的在線健康分析過程.
第3步,在數(shù)據(jù)信號的獲取過程中,選定數(shù)據(jù)分析模塊的回調(diào)功能時,要壓縮實際獲取的體質(zhì)數(shù)據(jù)信號,并結(jié)合實際的數(shù)據(jù)分析要求,生成實際所需的健康數(shù)據(jù)分析規(guī)則[15],實現(xiàn)對大學(xué)生體質(zhì)測試健康數(shù)據(jù)的分析.
綜合上述軟、硬件的設(shè)計,最終完成對基于關(guān)聯(lián)規(guī)則的大學(xué)生體質(zhì)測試健康數(shù)據(jù)分析系統(tǒng)的設(shè)計.
為測試數(shù)據(jù)分析系統(tǒng)的性能,采用文獻(xiàn)資料法、數(shù)理統(tǒng)計法和比較分析法,全面了解某大學(xué)學(xué)生體質(zhì)健康現(xiàn)狀[16].以該學(xué)校期末工作總結(jié)報告中提供的學(xué)生體質(zhì)健康狀況量化數(shù)據(jù)為數(shù)據(jù)樣本,設(shè)定其為采集得到的大學(xué)生體質(zhì)測試健康數(shù)據(jù)集,采集得到的數(shù)據(jù)集結(jié)果如表2所示.
表2 實驗采集得到的數(shù)據(jù)集
使用表2準(zhǔn)備的實驗數(shù)據(jù)集下,使用文獻(xiàn)[3]、[8]中以及設(shè)計的分析系統(tǒng)進(jìn)行實驗,對比3種數(shù)據(jù)分析系統(tǒng)的性能.
在上述實驗準(zhǔn)備下,控制3種數(shù)據(jù)分析系統(tǒng)在相同的時間段處理準(zhǔn)備的大學(xué)生體質(zhì)健康數(shù)據(jù),以時間段內(nèi)可處理的數(shù)據(jù)峰值作為統(tǒng)計目標(biāo),將10組數(shù)據(jù)集作為處理對象,最終3種數(shù)據(jù)分析系統(tǒng)分析數(shù)據(jù)的峰值結(jié)果如表3所示.
表3 3種數(shù)據(jù)分析系統(tǒng)可處理的最大數(shù)據(jù)量結(jié)果
根據(jù)表3所示的最大數(shù)據(jù)量結(jié)果可知,在相同的實驗環(huán)境下控制3種數(shù)據(jù)分析系統(tǒng)同時處理相同數(shù)據(jù)集,文獻(xiàn)[3]中數(shù)據(jù)分析系統(tǒng)可處理的最大數(shù)據(jù)量在300項左右,實際可處理的數(shù)據(jù)項數(shù)量較少;文獻(xiàn)[8]中的數(shù)據(jù)分析系統(tǒng)可處理的最大數(shù)據(jù)量在與實驗準(zhǔn)備的數(shù)據(jù)量少50項,可處理的最大數(shù)據(jù)量較大;而設(shè)計的數(shù)據(jù)分析系統(tǒng)幾乎能夠處理實驗準(zhǔn)備的所有體質(zhì)測試數(shù)據(jù)項,數(shù)據(jù)處理能力最強.
保持上述實驗環(huán)境不變,控制3種數(shù)據(jù)分析系統(tǒng)采集數(shù)據(jù)的頻率為500 Hz,將實驗數(shù)據(jù)集中的數(shù)據(jù)項作為數(shù)據(jù)分析中的最小網(wǎng)(mm),統(tǒng)計在不同采樣速度下,3種數(shù)據(jù)分析系統(tǒng)能分辨數(shù)據(jù)項的個數(shù),實驗結(jié)果如表4所示.
表4 3種數(shù)據(jù)分析系統(tǒng)分辨數(shù)據(jù)項結(jié)果
在3種數(shù)據(jù)分析系統(tǒng)控制下,將實驗數(shù)據(jù)集中的數(shù)據(jù)項視為不同的數(shù)據(jù)網(wǎng)格.根據(jù)表中數(shù)值,文獻(xiàn)[3]中數(shù)據(jù)分析系統(tǒng)可分辨的數(shù)據(jù)項在20項左右,可分辨健康數(shù)據(jù)項的數(shù)量最多;文獻(xiàn)[8]中的數(shù)據(jù)分析系統(tǒng)可分辨的數(shù)據(jù)項要少于實際健康數(shù)據(jù)5項左右,實際可分辨的健康數(shù)據(jù)集數(shù)量較多;設(shè)計的數(shù)據(jù)分析系統(tǒng)可分辨的數(shù)據(jù)項數(shù)量與實際的健康數(shù)據(jù)項數(shù)值相等,可分辨的數(shù)據(jù)項數(shù)量最多.這是因為本文應(yīng)用關(guān)聯(lián)規(guī)則算法,最高精準(zhǔn)度地確定了數(shù)據(jù)項數(shù)量數(shù)值,為響應(yīng)時間的減少奠定基礎(chǔ).
保持上述實驗環(huán)境不變,設(shè)定數(shù)據(jù)分析系統(tǒng)內(nèi)的功能項,設(shè)定觀測的操作項名稱如表5所示.
在表5設(shè)定的操作下,控制3種數(shù)據(jù)分析系統(tǒng)處理表中的操作,定義操作在數(shù)據(jù)分析系統(tǒng)中表現(xiàn)與預(yù)期效果一致時,表示數(shù)據(jù)分析系統(tǒng)完成一次數(shù)據(jù)分析過程.統(tǒng)計并分析不同操作產(chǎn)生的響應(yīng)時間,并將其作為系統(tǒng)的響應(yīng)時間,3種數(shù)據(jù)分析系統(tǒng)的響應(yīng)時間結(jié)果如表6所示.
表5 設(shè)定的觀測操作項名稱
表6 3種數(shù)據(jù)分析系統(tǒng)對操作的響應(yīng)時間
控制3種數(shù)據(jù)分析系統(tǒng)同時處理設(shè)定的操作后,根據(jù)統(tǒng)計得到的響應(yīng)時間可知,文獻(xiàn)[3]中數(shù)據(jù)分析系統(tǒng)實際的響應(yīng)時間在5.5s左右,系統(tǒng)的響應(yīng)時間最長;文獻(xiàn)[8]中的數(shù)據(jù)分析系統(tǒng)的響應(yīng)時間在4.2 s左右,系統(tǒng)的響應(yīng)時間較長;而設(shè)計的分析系統(tǒng)對操作的響應(yīng)時間在1.3 s左右,與兩種文獻(xiàn)中的數(shù)據(jù)分析相比,設(shè)計得到的數(shù)據(jù)分析系統(tǒng)的響應(yīng)時間最短.綜合上述系統(tǒng)測試結(jié)果可知,與現(xiàn)有數(shù)據(jù)分析系統(tǒng)相比,設(shè)計得到的數(shù)據(jù)分析系統(tǒng)的性能最佳.這是因為本文方法將整個系統(tǒng)軟件部分的數(shù)據(jù)分析功能模塊化處理,根據(jù)設(shè)定的關(guān)聯(lián)規(guī)則,在線分析體質(zhì)測試數(shù)據(jù)在健康標(biāo)準(zhǔn)中所處的位置,計算得到體測數(shù)據(jù)項的流形程度,有針對性地生成實際所需的健康數(shù)據(jù)分析規(guī)則,提高響應(yīng)時間.
在關(guān)聯(lián)規(guī)則的支持下,設(shè)計一種大學(xué)生體質(zhì)測試健康數(shù)據(jù)分析系統(tǒng),在硬件優(yōu)化的基礎(chǔ)上,將大學(xué)生體質(zhì)測試健康數(shù)據(jù)分析系統(tǒng)劃分為登錄模塊、數(shù)據(jù)管理模塊、數(shù)據(jù)分析模塊以及數(shù)據(jù)回調(diào)模塊等.根據(jù)設(shè)定的關(guān)聯(lián)規(guī)則,以最小置信度為篩選準(zhǔn)則,對數(shù)據(jù)中的數(shù)據(jù)項進(jìn)行反復(fù)篩選,設(shè)置身體素質(zhì)情況判斷的體質(zhì)測試指標(biāo),在線分析體質(zhì)測試數(shù)據(jù)在健康標(biāo)準(zhǔn)中所處的位置,有針對性地生成實際所需的健康數(shù)據(jù)分析規(guī)則,確定了數(shù)據(jù)項數(shù)量數(shù)值,能夠改善現(xiàn)有數(shù)據(jù)分析系統(tǒng)響應(yīng)時間過長的問題,為今后判斷大學(xué)生體測數(shù)據(jù)健康狀態(tài)提供一定的理論參考.