馮其明
(四川文理學院,體育學院, 四川,達州 635000)
目前,教育數據預測領域的熱點研究方向之一是體育成績預測研究[1],以相關已知信息預測未來的學習成績數據,在成績、分數、排名等方面均有應用[2]。近年來,在體育精神的弘揚及體育運動員的擴招下,體育教學規(guī)模不斷變大,導致相關數據及信息不能及時、準確地獲取[3],在很大程度上阻礙了教學質量的提升。在此條件下,分析和研究更可行、更有效率的學生成績預測方法在體育教學的發(fā)展中更有應用性和實踐性。
普遍使用的成績預測方法大體上可分為基于神經網絡的預測方法[4]和基于融合知識圖譜和協(xié)同過濾的預測方法[5]。前者利用神經網絡建立預測模型進行目標預測,后者分別使用基于鄰節(jié)點的方法和基于知識圖譜表示學習的方法進行目標預測。兩種預測方法在預測過程中均未考慮預測時間序列的非平穩(wěn)性[6],導致預測結果存在明顯誤差。針對這一問題,本文提出了基于時間序列分析法的體育成績預測方法,有效提升預測結果精度。
基于時間序列分析法的體育成績預測原理框圖見圖1。體育成績預測過程中,針對體育成績時間序列的非平穩(wěn)性,利用奇異值分解濾波算法(SVDFA)將其劃分成隨機成分和趨勢成分。利用GM模型以及PSO-RBFNN(粒子群優(yōu)化—徑向基函數神經網絡)模型分別對2種成分進行預測,最終融合兩種成分的預測結果,得到體育成績預測結果。
圖1 體育成績預測原理框圖
SVDFA的主要優(yōu)勢體現在數值穩(wěn)定性、降維壓縮性等方面[7]。因此,利用該算法在貯存的體育成績記錄中優(yōu)選相關信息時可獲取較好的數據分離和去噪效果。矩陣能量分布情況可體現奇異值大小[8],奇異值對應的成分占據矩陣的比重隨著奇異值的變化而變化,并在變化中得出體育成績數據的趨勢信息。若以達成對弱信號的分離和去噪為目的,需運用較大的特征值重組數據[9]。均值化的貯存體育成績數據序列{A1,A2,…,An}的SVDFA過程如下。
1.1.1 構造矩陣
利用一個N×h的體育成績數據矩陣描述一組n元數據序列:
(1)
式中,N和h分別等于n-h+1和[(n+1)/2],[]表示取整。
1.1.2 奇異值分解
存在正交矩陣U∈RN×N、V∈Rh×h和對角陣Σ,運用奇異值分解體育成績數據序列A可得:
A=UΣVT
(2)
(3)
其中,Δq×q=diag(σ1,σ2,…,σq),σ1,≥σ1,≥…≥σq>0和q=min(N,h)分別為矩陣A奇異值和秩。
1.1.3 門限控制
將濾波門限設定為η(0<η<1),在求解關于r的方程時運用最小平方和近似矩陣:
(4)
其中,r為正整數,將q-r個較小的奇異設0,得出:
(5)
由式(5)可得,Δr×r=diag(σ1,σ2,…,σr)。
1.1.4 濾波輸出
對矩陣A′=UΣ′VT進行重組,運用求平均的方法對A′中時刻對應元素進行運算[10],以此得出濾波輸出序列{T1,T2,…,Tn}。
對已知的體育成績數據序列A(0)={A(0)(1),A(0)(2),…A(0)(n)}中A(0)一次累計生成,得出生成序列A(1)={A(1)(1),A(1)(2),…A(1)(n)},由此獲取原時間序列:
(6)
此時由A(1)構造背景值序列Z(1)={Z(1)(2),Z(1)(3),…Z(1)(n)},得出:
Z(1)(k)=a′A(1)(k-1)+(1-a′)A(1)(k)
(7)
其中,k=2,3,…,n,發(fā)展系數a′=0.5。
若設定A(1)存在近似指數變化規(guī)律[11],可得出白化方程為
(8)
對式(8)進行離散化處理,令其由微分改變?yōu)椴榉?,得出GM(1,1)灰微分方程:
A(0)(k)+aZ(1)(k)=i
(9)
由式(9)可知,序列A(0)的增長速度由發(fā)展系數a的大小體現,灰作用量(內生變量)為i。為確定式(9)中參數a、i,運用最小二乘法求解式中參數a、i。由此可得出A(1)的預測公式:
(10)
式中,k=0,1,2,…,n。則預測公式A(0)為
(11)
由輸入層、隱含層、輸出層組成的RBFNN是前向神經網絡[12]。隱含層空間構建是將徑向基函數作為隱含層單元的基,以此令數據在低維空間內的線性不可分轉換為高維空間中的線性可分[13]。設1為RBFNN內輸入層和隱含層的連接權值,隱含層的作用是優(yōu)化激活函數的參數,輸出層的作用是優(yōu)化連接權值。基函數的中心、隱含層的寬度、隱含層到輸出層的連接權值是RBFNN需要求解的3個參數[14]。RBFNN中常用基函數是高斯函數,利用式(12)可表示RBFNN的激活函數:
(12)
式中,輸入樣本為xp,p=1,2,3,…,N,樣本總數為N,隱層網絡節(jié)點的中心為ci,i=1,2,3,…,H,其中H表示隱含層節(jié)點數。
利用式(13)可表示神經網絡輸出yp:
(13)
高斯函數的方差σ可描述隱含層的寬度參數,RBFNN中的難點為隱含層與輸出層權值的確定,可采用粒子群算法確定。利用粒子群算法確定RBFNN內隱含層與輸出層權值的過程如圖2所示。
圖2 粒子群訓練法
濾波的關鍵是確定門限η,以保證隨機成分穩(wěn)定性為基礎,最大限度提升趨勢成分的平滑性。具體步驟如下:
(1) 以Δη∈(0,0.01]表示較小步長;
(2) 對濾波門限η=1-Δη進行初始化處理,k=1為循環(huán)次數;
(3) 為了分解序列,運用奇異值分解算法,{T1,T2,…,Tn}為趨勢成分的標記,{R1,R2,…,Rn}為隨機成分標記;
(4) 在檢驗隨機成分的平穩(wěn)性時選取“逆序”法,如{R1,R2,…,Rn}為不平穩(wěn)狀態(tài),則直接轉入步驟(6);
(5)k=k+1,η=1-k·Δη,重復步驟(3)至步驟(5);
(6) 獲取最終選定的濾波門限η=1-(k-1)·Δη,并輸出該值。
為驗證本文所提出的基于時間序列分析法的體育成績預測方法的適用性,以某體育學校為研究對象,對本文方法進行實例分析。在研究對象內隨機選取1個游泳運動員體育成績時間序列進行分析,以該體育成績時間序列內的前50個成績數據作為樣本序列,利用本文方法中的GM(1,1)模型和PSO-RBFNN模型分別實施訓練,利用后15個成績數據檢測本文方法的預測性能,預測結果與均方差描述。設定初始Δη為0.003,在本文方法的濾波門限算法下獲取η=0.92。利用本文分析獲取體育成績時間序列的趨勢成分和隨機成分,如圖3所示。
利用本文方法中的GM(1,1)模型和PSO-RBFNN模型分別對圖3(a)所示的隨機成分和圖3(b)所示的趨勢成分進行預測,綜合2個模型的預測結果,即可得到本文方法的最終預測結果。對比本文方法所得預測結果與所選體育成績時間序列內后15個數據間的均方差,結果如圖4所示。分析圖4得到,本文方法預測結果的均方差控制在1.54×10-5至2.03×10-5之間,誤差均值約為1.78×10-5。實驗結果充分說明本文方法能夠較高地預測體育成績。
(a) 隨機成分
為進一步說明本文方法的預測性能,用文獻[4]方法和文獻[5]預測方法進行對比實驗,利用對比方法對所選體育成績時間序列進行分析,預測數據序列內后15個數據,所得預測結果的均方差如圖5所示。分析圖5得到,文獻[4]方法和文獻[5]方法2種方法預測結果的均方誤差分別為2.42×10-5和2.08×10-5。雖然文獻[5]方法預測結果的均方差均值低于文獻[4]方法,但文獻[5]方法預測結果的均方差波動較為劇烈。對比圖4和圖5中不同預測方法所預測結果的均方差能夠得到,本文方法的預測精度顯著優(yōu)于2種對比方法。
圖4 本文方法預測結果
圖5 對比方法預測結果
采用本文方法進行成績預測過程中,基于已有數據得到不同η值下的預測結果均方差,所得結果如圖6所示。分析圖6得到,隨著η值的提升,體育成績預測結果的均方差整體表現為下降趨勢。在η值低于6的條件下,本文方法預測結果均方差從1.94×10-5下降至1.8×10-5;當η值由6提升至11時,本文方法預測結果均方差從1.8×10-5下降至1.74×10-5。在η值高于11的條件下,本文方法預測結果均方差維持在1.74×10-5不變。實驗結果表明,采用本文方法預測體育成績,η取值為11時,本文方法預測精度最高。
圖6 不同η值下的預測結果均方差
為了獲得理想的體育成績預測結果,本文提出了基于時間序列分析法的體育成績預測方法,分別利用GM模型和PSO-RBFNN模型對時間序列數據的隨機成分和趨勢成分進行預測,綜合預測結果得到最終預測結果,并通過實例分析證明了本文方法的可行性。