程麗娟
(嶺南師范學院數(shù)學與計算科學學院,廣東湛江524048)
基于部分函數(shù)型線性回歸模型的上證指數(shù)預測
程麗娟
(嶺南師范學院數(shù)學與計算科學學院,廣東湛江524048)
在金融數(shù)據(jù)的研究中,經(jīng)常遇到函數(shù)型數(shù)據(jù).本文主要建立部分函數(shù)型線性回歸模型,分析函數(shù)型數(shù)據(jù)在上證指數(shù)預測中的應用,根據(jù)函數(shù)型數(shù)據(jù)分析的原理及其求解主成分分析的方法,使用Matlab對上證指數(shù)進行預測.
部分函數(shù)型線性回歸模型;函數(shù)型數(shù)據(jù);預測
本文主要建立部分函數(shù)型線性回歸模型,根據(jù)文獻[1]通過把L2空間的函數(shù)型數(shù)據(jù)進行K-L展開,得到部分函數(shù)型線性模型中系數(shù)的估計量,給出其在上證指數(shù)預測中的實證分析,根據(jù)函數(shù)型數(shù)據(jù)分析的原理及其求解主成分分析的方法,使用Matlab軟件對上證指數(shù)進行預測.
對于定義在概率空間(Ω,B,P)上的實值隨機變量Y和(z,X),滿足如下的線性關系
則稱該模型為部分函數(shù)型線性回歸模型,其中:z=(z1,z2,…,zp)T為P維隨機向量,Ez=0,EzzT存在且有限;{X(t)}∈L2[0,1]為隨機過程,均值為零,
E‖X‖2=E<X(t),X(t)>=EX2(t)dt<∞;ε與z,X相互獨立,且Eε=0,Varε=σ2;θ(t)∈L2[0,1],且‖θ‖2<∞,β為p維隨機向量.
特別地,當β=0時,模型(1)為Y=<θ(t),X(t)>+ε,即為函數(shù)型線性模型,當θ=0時,模型(1)為Y=βTz+ε,即為多元線性模型.
記過程X的協(xié)方差函數(shù)KX(s,t)=Cov(X(S),X(t)),{(λj,φj)}j為協(xié)方差算子K(x)(t)=<x (s),KX(s,t)>的特征值和特征函數(shù),即滿足K(φj)=λjφj.同樣的,記KYX(·)=Cov(Y,X(·)),
KzX(·)=Cov(z,X(·))=(Kz1X(t),…,KzpX(t))T,Kz=Var(z),KzY=Cov(z,Y).
假設已觀測了n組樣本(Yi,zi,Xi(t))n
i=1,由模型(1)有
其中εi獨立同分布.從而可得KX(s,t)的樣本估計值為
根據(jù)文獻[2],使用函數(shù)型數(shù)據(jù)主成分分析方法,選擇前m個最大特征值對應的主成分將X(t)進行Karhunen一Loève正交展開,使用最小二乘方法得到估計量
其中:
建立上證指數(shù)的函數(shù)型數(shù)據(jù)預測模型,F(xiàn)=μ+Y+ε,其中μ為上證指數(shù)的日收益率的均值,Y=βTz +<θ(t),X(t)>+ε為部分函數(shù)型線性回歸模型,本文選取我國上證指數(shù)作為研究對象,其中Y為2015年4月21日至6月8日的日收益率減去其均值后的數(shù)據(jù),z~N34(0,I),{X(t)}為2015年4月21日至6月8日的5分鐘收益率減去其均值后的數(shù)據(jù).這里,z~N34(0,I),則其為隨機向量,Ez=0,EzzT存在且有限;{X(t)}∈L2[0,1]為隨機過程,均值為零,
ε與z,X相互獨立,且Eε=0,Varε=σ2;θ(t)∈L2[0,1],且‖θ‖2<∞,β為p維隨機向量.從而,該模型符合部分函數(shù)型線性回歸模型的條件,可以進行上證指數(shù)預測.
為了避免“隔夜效應”的影響,在進行數(shù)據(jù)分析時,舍棄每天的第一個數(shù)據(jù)(即9:35時刻),把每天的5分鐘收益率數(shù)據(jù)視為其對應函數(shù)產(chǎn)生的一組樣本觀測值,使用B樣條插值法對這些樣本觀測值進行擬合,并進行套準和平滑處理,然后根據(jù)得到的光滑曲線求出其變化速度曲線,即一階導數(shù)曲線,如下圖所示.圖1表示的是收益率曲線及其平滑曲線,其中綠線表示的原數(shù)據(jù),藍線表示的是B樣條插值法得到的曲線,紅線表示對B樣條插值法得到的曲線平滑處理后得到的新曲線.圖2表示的是B樣條插值法得到曲線的一階導數(shù)曲線[3-6].
圖1 收益率曲線及其平滑曲線
圖2 一階導數(shù)曲線
得到平滑函數(shù)后,對該收益率函數(shù)進行函數(shù)型主成分分析,得到主成分權重函數(shù),如下圖3所示.
圖3 主成分權重函數(shù)
得到主成分特征值與貢獻率,如下表1所示.
表1 主成分特征值與貢獻率
根據(jù)表1中的方差貢獻率,選取前四個最大特征值對應的主成分將X(t)進行Karhunen一Loève正交展開,使用最小二乘方法得到估計量:
將觀測到的真實值、模型估計出的預測值及由兩者得到的誤差百分比如下表2所示.
表2 真實值與預測值
由表2可以看出,除6月11日誤差百分比較大以外,絕大部分的誤差百分比都較小.因此說明建立的部分函數(shù)型線性回歸模型具有很好的準確性.綜上知,建立函數(shù)型主成分預測模型對我國上證指數(shù)收益率進行預測,預測的準確程度較高.
本文對部分函數(shù)型線性回歸模型在上證指數(shù)中的應用進行了研究,介紹了函數(shù)型數(shù)據(jù)分析的研究意義,研究了函數(shù)型數(shù)據(jù)的主成分分析方法以及如何使用部分函數(shù)型線性回歸模型對上證指數(shù)進行預測.通過對上證指數(shù)收益率進行預測的實證分析,得到建立部分函數(shù)型線性回歸模型對我國上證指數(shù)收益率進行預測,預測的準確程度較高.
[1]Shin H.Partial Functional Linear Regression[J].Journal of Statistical Planning and Inference,2009,139(10):3405-34l8.
[2]Ferraty F,GonzMez-Manteiga W,Martinez-Calvo A,et a1.Presmoothing in Functional Linear Regression[J].Statistica Sinica,2012 (22):69-94.
[3]Ramsay J O.When the data are functions[J].Psychometrika,1982(47):379-396.
[4]Ramsay J O,Hooker G.Functional Data Analysis with R and MATLAB[M].New York:Springer,2009.
[5]Mallor F,Leon T,Gaston M.Changes in power curve shapes as an indicator of fatigue during dynamic contractions[J].Journal of Biomechanics,2010(43):1627-1631.
[6]Berrendero J.R.Principal components for multivariate functional data[J].Computational Statistics and Data Analysis,2011,55(9): 2619-2634.
Prediction for the Shanghai Stock Index Based on the Partial Functional Linear Regression Model
CHENG Li-juan
(School of Mathematics and Computation Science,Lingnan Normal University,Zhanjiang,524048,China)
In the research of financial data,the functional data is often encountered.In this paper,the partial functional linear regression model is established to predict the Shanghai stock index.Based on the principal component analysis theory and calculation method,the Shanghai Composite Index is predicted by Matlab.
partial functional linear regression model;functional data;prediction
F224;F830.91
A
1672-2590(2016)03-0014-04
2016-04-05
嶺南師范學院自然科學青年項目(QL1407)
程麗娟(1986-),女,安徽阜陽人,嶺南師范學院數(shù)學與計算科學學院助教.