章涵
(復(fù)旦大學經(jīng)濟學院 上海 200433)
近半個世紀以來,隨著計算機科學、機器學習方法、概率論學科、計量經(jīng)濟學的高速發(fā)展,證券投資領(lǐng)域的量化分析方法與程序化交易在全球金融市場獲得一席之地。量化投資最顯著的優(yōu)勢是可以實現(xiàn)投資決策最大程度與投資人主觀分離,通過對一、二級市場信息的整合,做出優(yōu)秀的二級市場交易決策。在理論均衡市場和實際交易市場中,常常有可識別的較大套利空間。然而,隨著計算機算力的飛速提高和人工智能、機器學習理論的進一步完善,量化投資存在過于依賴機器學習的問題。知網(wǎng)數(shù)據(jù)顯示,近年來應(yīng)用于量化投資的機器學習模型與策略數(shù)量快速上升。
利用機器學習通常能夠?qū)崿F(xiàn)對訓(xùn)練集(即歷史數(shù)據(jù))的最好擬合,但仍會帶來一定的問題:(1)容易出現(xiàn)過擬合,在測試集中效果不佳。(2)模型過于黑盒,脫離經(jīng)濟學原理,遭遇特殊事件時抗風險能力差。(3)機器學習對算力和時間要求高,限制了交易頻率與交易即時性。(4)學習方法大同小異,容易出現(xiàn)量化策略雷同、交易算法近似、邏輯通道重疊,在有利行情下可預(yù)估的市場利潤被過度瓜分,市場策略的競賽變?yōu)橛布O(shè)備的競賽,現(xiàn)有的穩(wěn)定性與利潤空間受到較大制約。市場對非學習性的交易策略有日益提高的需求。
均值回歸在量化投資策略中占有重要地位,均值回歸效應(yīng)一般指當觀察的目標量偏離其價值中樞(或均值)較遠時,有較大概率向價值中樞回歸的趨勢。廣義均值回歸的目標量形式多樣,包括單標的的資產(chǎn)價格、雙標的的價格差值、一攬子投資組合的價格或差值等形式;均值回歸的方式也十分多樣,既包括基本面基本不變的短期內(nèi)價格回歸,又包含基本面本身圍繞事物客觀發(fā)展規(guī)律上下波動的長期趨勢。
本文試圖從創(chuàng)新的角度,以均值回歸理論為底層邏輯,尋找合適的權(quán)重指數(shù),構(gòu)造符合客觀事實的超額價差模型,設(shè)計包含帶有移動權(quán)重的量化交易策略。首先,在實證分析環(huán)節(jié),通過對某一標的(本文選取商品期貨-螺紋鋼rb)2013—2020年的歷史數(shù)據(jù)進行測算,計算其使收益率最優(yōu)化的參數(shù),并對參數(shù)進行橫向比較以檢驗其穩(wěn)健性。其次,以該參數(shù)構(gòu)建具體化的交易策略,投入2013—2020年的歷史數(shù)據(jù)進行回測計算,并對結(jié)果進行分析。最后,在不改變參數(shù)的前提下,模擬其在2021年內(nèi)的收益情況,并進一步評價策略的可行性。
為避免模型的過擬合和策略的失效,本文依次在各個階段采取了一定的措施。在初步設(shè)計模型階段,從理論出發(fā)而非從統(tǒng)計數(shù)據(jù)出發(fā),在無監(jiān)督環(huán)境下構(gòu)建模型架構(gòu)。在獲取計算螺紋鋼品種的最優(yōu)參數(shù)時,利用Matlab計量工具,通過循環(huán)算法以較小或連續(xù)的步長計算最優(yōu)解,通過梯度下降算法并加入噪音模擬其生成過程;通過可視化手段,盡量保證取得參數(shù)是全階段最優(yōu)而非全局最優(yōu)(即參數(shù)在所有歷史階段原則上不會出現(xiàn)調(diào)整傾向)。在歷史回測過程中,模擬真實情景,加入一定的滑點和適度的交易失敗概率。在真實模擬中,利用開源交易平臺,在不改變參數(shù)的前提下模擬實際交易,避免理論不可知信息的誤用。
經(jīng)濟學家通過對不同經(jīng)濟領(lǐng)域的實證研究發(fā)現(xiàn)了一定程度的均值回歸現(xiàn)象,并依據(jù)此提出了有效可行的均值回歸交易策略。
Gailliot和Henry(1970) 通過對1900—1904年和1963—1967年主要資本主義國家的匯率實證研究中發(fā)現(xiàn)并驗證,匯率在長期中存在趨穩(wěn)的特征。但是隨后關(guān)于匯率均值回歸與購買力平價的實證分析受到了質(zhì)疑。隨著計量經(jīng)濟學的發(fā)展,Box、George和Jenkins(1990) 通過對非平穩(wěn)序列的匯率與利率數(shù)據(jù)進行一次差分后,得到相對穩(wěn)定的均值和方差,從側(cè)面印證了貨幣領(lǐng)域的均值回歸特征,由此衍生了一系列的外匯CTA策略,出現(xiàn)了許多以中短線交易套利的對沖基金組織,其中包括Winton、Man AHL等知名基金。
Malliaropulos和Priestley(1999)在對以東南亞七個國家或地區(qū)的股票市場為主的證券交易市場進行回歸分析后發(fā)現(xiàn),其價格指數(shù)與收益率存在顯著的均值回歸現(xiàn)象。Groppdu (2004) 對美國納斯達克、紐約等交易所的收盤數(shù)據(jù)進行分析后,得出了相似的結(jié)論?;诰祷貧w理論,投資員開發(fā)了和傳統(tǒng)布林線動量策略相反的布林線均值回歸策略(通過不同的參數(shù)和止盈止損條件)。此外,衍生出了收益更有說服力且風險更低的同板塊價差均值回歸策略、綜合三因子模型的大小股市值股價差均值回歸策略。
商品期貨市場的均值回歸似乎是顯而易見的:現(xiàn)貨價格圍繞市場價值均值回歸,期、貨現(xiàn)貨價格互相均值回歸,品類間遠近期價差圍繞0上下波動。由于有較強的邏輯依據(jù),學術(shù)界圍繞期貨市場的均值回歸實證研究并不多,但是有較多的衍生策略,其中包括雙均線策略(Joseph E.Granville,1962)、反向菲阿里四價策略、網(wǎng)格交易策略、R Breaker回轉(zhuǎn)策略等。商品期貨市場由于其市場深度大、兼具標的基本面信息和技術(shù)面信息、允許T+0交易和賣空交易(特指國內(nèi))等原因,成為各類量化交易策略的實驗田?;诩夹g(shù)性原因和法律合規(guī)性原因,本文在策略的實證與回測階段將主要基于我國期貨市場進行。
均值回歸經(jīng)典邏輯為,當構(gòu)造標的價格遠高于或遠低于其價值中樞時,有較大概率發(fā)生向價值中樞回歸的事件,基本模型為:
其中:D為該標的在期的價格;為均值回歸因子參數(shù),為參數(shù)。
該式也可寫為:
因此,可以理解為,*為價值中樞,(1-)*D為不完全回歸部分價格。當均值回歸因子>2時,具有過回歸趨勢,下期價格通常突破價值中樞壓力,且價格不具有收斂趨勢;當2>>1時,具有過回歸趨勢,也通常突破但是收斂于價值中樞;當均值回歸因子α取1時,期價格D完全回歸至價值中樞*,并保持穩(wěn)定;當均值回歸因子取0時,D=D,價格穩(wěn)定偏離其價值中樞;當取負值時,均值回歸趨勢不成立,價格遠離價值中樞。
迄今為止,主要針對A股、中國期貨市場、美股、美國期貨市場的實證分析中,或其等價含義的回歸因子主要分布于0~1,且顯著性水平較高,說明在現(xiàn)實市場中確實存在一定的回歸現(xiàn)象。
經(jīng)典價差回歸標的選取為:
本文選取兩資產(chǎn)帶移動權(quán)重的超額價差作為回歸標的:
其中:D為標的;P為主資產(chǎn)在期價格;P為次資產(chǎn)在期價格;P為主資產(chǎn)在-1期價格;P為次資產(chǎn)在-1期價格。
本文對原有模型做出了權(quán)重的修改嘗試,原本的價差均值回歸模型經(jīng)濟含義為價差自身的均值回歸,兩資產(chǎn)完全等權(quán)重且為1;在修改之后,引入上一期價格作為當期權(quán)重,經(jīng)濟含義演變?yōu)閯討B(tài)增長的均值回歸。
進行移動的賦權(quán)之后,模型表層的經(jīng)濟意義減弱了,價差從直觀可視的資產(chǎn)價差變成沒有直接意義的價差,但是模型的系統(tǒng)性經(jīng)濟意義增強了,原有價差在一定程度上無視兩者資產(chǎn)本身屬性的差異,弱化了價格較低資產(chǎn)的變動幅度;修改后適用范圍得到擴寬,原本回歸標的通常只能用于期貨單一品種的價差跨期套利,或一籃子商品的組合跨期套利,現(xiàn)在可以在同類標的不同品種間,甚至是不同品類間實踐運用。
從統(tǒng)計學意義來說,帶移動權(quán)重的價差回歸標的更易分布在0的兩側(cè),從而具有更高的平穩(wěn)性;從實際操作來說,操作難度提高了,為了滿足其對應(yīng)的交易策略,次資產(chǎn)的數(shù)量仍然需要和最小交易單位達成最小公倍數(shù),從而對賬戶的容量、交易手數(shù)、市場深度提出了新要求。
移動權(quán)重的超額價差均值回歸模型的邏輯圖如圖1所示。
圖1
圖中,P表示價格;w表示前一期價格以權(quán)重形式介入下一期的D中;表示之間存在以為回歸因子的相關(guān)關(guān)系;ols ·表示在經(jīng)過一階差分后進行最小二乘OLS回歸,得到α估計值。
表1
此外,建立適用于交易判斷的超額價差套利收益解釋模型:
其中,等號左側(cè)的R為資產(chǎn)組合在期的收益,如果在-1期做多1份主資產(chǎn),做空P/P份次資產(chǎn),將在第期獲得的損益。實際回歸中,參數(shù)的選取取決于ADF檢驗中l(wèi)ag order的參數(shù)返回。為理論上的收益截距,在長期市場中,均值為0。
由于該模型完全以指導(dǎo)策略開發(fā)為目的進行設(shè)計,因此等號左側(cè)需要嚴格保持實際損益水平,且若進行差分,需要實際交易所考慮的殘差項、截距項等信息會被忽略,因此縱使該式被解釋變量與解釋變量均為不平穩(wěn),也不進行一階差分。模型中,假設(shè)的交易體量為做多(做空)1單位主資產(chǎn),同時做空(做多)P/P單位次資產(chǎn)。
根據(jù)平穩(wěn)性分析結(jié)果,考慮以較大的lag order值9作為回歸的值,即以D至D為獨立的自變量,對第期的實際收益(等號左側(cè))進行多項OLS回歸,若能得到顯著性水平較高的D項,則可據(jù)此開發(fā)相應(yīng)的策略。除了顯著性之外,并不關(guān)心^2和常數(shù)項的顯著性水平。
超額價差套利收益模型回歸結(jié)果符合預(yù)期:中高頻交易數(shù)據(jù)中,歷史超額價差信息對交易結(jié)果具有很顯著的負相關(guān)關(guān)系,中低頻交易收益結(jié)果對歷史超額價差信息同樣呈負相關(guān)關(guān)系。
前文顯示,可以構(gòu)建有效的超額價差均值回歸套利模型,利用主次合約進行跨期、跨品種、跨幣種套利。其中的邏輯是,由于前一期超額價差的系數(shù)顯著為負,故將在構(gòu)建量化投資策略時,考慮以前一期帶移動權(quán)重的超額價差信號做反向操作,且利用顯著性次之的前2~5期做協(xié)助構(gòu)建交易信號,進行交易信號的增強或適當?shù)窒?/p>
通過上一部分引入的超額價差均值回歸理論,在實際應(yīng)用中有著復(fù)雜的約束條件。首先,融資約束,在我國能夠進行合規(guī)的賣空操作僅有期貨期權(quán)交易與融券。其次,交易流動性,融券的長期性和二級市場缺乏顯然不適用量化,因此本文將從期貨出發(fā)進行策略構(gòu)建和回測展示。最后,交易體量,在理想的交易模型中,交易體量為:
其中,為交易的手數(shù),但是實際上大部分交易不是無限可分的,因此交易體量可等價變?yōu)樽钚」s數(shù)下的整數(shù)手:
其中,代表最小公倍數(shù),由于現(xiàn)實中資金量的限制和交易深度的限制,將交易手數(shù)進一步萎縮為:
式中,[ ]為向下取整符號,為交易金額,觸發(fā)交易的條件為:
其中:μ為品種交易中為了穩(wěn)健或降低手續(xù)費的阻尼常數(shù);*為交易調(diào)整后的目標倉位(手);*為交易時的資產(chǎn)總額;為持倉比例,有=W*;,和為非對稱的參數(shù);為每手價格;依舊服從于:
基于此策略邏輯,對目標資產(chǎn)螺紋鋼期貨進行驗算,選定參數(shù)(,,)與超參數(shù)()。選定參數(shù)過程中,在追求收益最大化的基礎(chǔ)上,為避免選取的過擬合,遵循三個原則:
(1)參數(shù)簡單,盡量避免追求歷史收益而過擬合。
(2)模型簡單,盡量選取使模型結(jié)構(gòu)對稱的參數(shù)。
(3)全局最優(yōu),不僅關(guān)注參數(shù)的歷史總收益最高,還盡量選取全程相對最優(yōu)。
最終,根據(jù)2013—2020年的歷史高頻(5min)與低頻(1day)數(shù)據(jù),選定最終交易策略為:
結(jié)果最優(yōu)的模型中,阻尼常數(shù)萎縮,歷史權(quán)重趨同于1/3,在不具有額外效用假設(shè)下,最優(yōu)幾何均值的持倉比例趨向1。策略的文字性描述為,逐期測算前三期的超額價差的平均數(shù),并根據(jù)當期的超額價差與其大小關(guān)系,若當期大于前三期平均,則做空主資產(chǎn)(螺紋鋼主力合約),持有次資產(chǎn)(螺紋鋼次主力合約);若當期小于前三期平均,則持有主資產(chǎn),做空次資產(chǎn),幾乎不存在空倉位情況。
本文對模型的實證分析與回測將從螺紋鋼期貨rb的主力合約與次主力合約出發(fā),分別研究其中高頻與中低頻的模擬交易。
期貨數(shù)據(jù)由上海期貨交易所給出,以主力合約作為主資產(chǎn),以次主力合約作為次資產(chǎn)。中高頻數(shù)據(jù)選擇2013年1月4日09:05—2021年10月15日15:00所有的五分鐘數(shù)據(jù),取每個五分鐘bar內(nèi)收盤價作為價格,取買一價賣一價均值作為統(tǒng)一價格。盡管涉及休日與隔夜,但出于對實際交易策略指導(dǎo)的目的,不對隔夜價格進行前后復(fù)權(quán)操作,即對隔夜數(shù)據(jù)當做連續(xù)數(shù)據(jù)處理。2014年12月26日及其后上期所螺紋鋼品種增設(shè)夜市,同樣按照連續(xù)數(shù)據(jù)處理;法定節(jié)假日閉市,缺省值直接剔除處理。中低頻數(shù)據(jù)選擇2013年1月4日—2021年10月15日所有開盤的日數(shù)據(jù),不考慮夜盤,取每日14:59收盤價買一價與賣一價均值作為價格,同樣將法定節(jié)假日直接跳過。此外,由于期貨存在主次合約交替的問題,因此根據(jù)每日持倉量與交易量(以上期所公布數(shù)據(jù)為準)滾動選取主合約與次合約,當主次合約發(fā)生交替時直接銜接,不做前后賦權(quán)處理。
整個實證與回測分為兩部分組成,歷史回測部分采用2013—2020年數(shù)據(jù),不考慮交易是否能被市場深度吸納,采用統(tǒng)一價,不考慮買賣價差;真實回測部分采用2021年內(nèi)數(shù)據(jù),利用AutoTrader回測平臺,抓取模擬真實交易場景下客觀存在的可交易對手掛單價(并非成交價)與掛單量,具有更強的現(xiàn)實意義。但是由于真實回測數(shù)據(jù)點較少,不進行中低頻的日頻回測,且全程不調(diào)整系數(shù)。如表2所示。
表2
歷史回測過程采用Matlab自編寫的回測程序進行。
針對現(xiàn)實交易中的摩擦現(xiàn)象,本文采用跳點形式進行模擬,分別引入0跳點、0.5跳點、1跳點、1.5跳點、2跳點進行穩(wěn)健性測試。為了應(yīng)對現(xiàn)實中較高的交易摩擦,選擇在交易間引入一定的step區(qū)間,即程序判定的交易周期,以降低發(fā)生交易的頻率。區(qū)間分別考慮10倍運算周期(50min)、20倍運算周期(100min)、50倍交易周期(250min)、100倍交易周期(500min)。歷史回測結(jié)果如圖2所示。
由圖2可以看出,當市場摩擦較小,深度充足的情況下,較短的交易周期有著明顯更好的收益情況,而較長的交易周期在大部分情況下都表現(xiàn)出較好的穩(wěn)定性。
圖2
針對交易周期250、1跳的回測進行描述性分析,如表3所示。
表3
結(jié)果顯示,勝率69.48%并不算特別優(yōu)秀(明顯低于一些機器學習的結(jié)果),但是夏普比率、年化收益率、最大回撤相對可觀。因此傳達的信息是,在該策略下,并不能非常準確地識別交易方向,但是可以有效地把握交易時機,通過“贏大輸小”賺取穩(wěn)健的利潤。
真實回測階段,利用AutoTrader回測平臺進行可執(zhí)行的交易模擬。由于在模擬過程中采用了市場中可得的賣一價與買一價、賣一量與買一量進行計算,此時的策略模型有一定修改,交易量由于受到深度影響,將根據(jù)主次合約中可得的交易量更小的一方?jīng)Q定目標倉位。雖然已經(jīng)包含實際數(shù)據(jù),但是為了模擬在交易過程中可能出現(xiàn)的網(wǎng)絡(luò)延遲情況,出于穩(wěn)健考量,依然引入2個跳點進行模擬。歷史回測結(jié)果如圖3所示。
圖3
且有交易指,如表4所示。
表4
沒有統(tǒng)計勝率是由于在交易中,由于價差套利的性質(zhì),平臺給出的勝率數(shù)據(jù)包含了一多一空的組合,幾乎處于50%。通過觀察發(fā)現(xiàn),該策略與市場走向關(guān)系極小,不受大宗商品整體市場的漲跌制約,同時適合在波動市場與單邊行情采用。模擬結(jié)果顯示,在真實回測中,相比歷史回測有著明顯更優(yōu)的收益情況,可能是由于歷史回測相對高估了交易的摩擦與損失(對滑點做了單邊假設(shè));回撤數(shù)據(jù)明顯差于歷史回測,僅在一年中就超過了原有的最大回撤1%,說明該策略值得在更長的時間段進行真實回測的檢驗。
隨著學習類策略的大量采用,機構(gòu)的量化決策者逐漸重新重視“先決知識少、欠擬合”的簡單模型策略。本文在此訴求的基礎(chǔ)上,試圖通過表層的市場規(guī)律進行一次量化策略設(shè)計。
為了最大程度地達到避免巴菲特說的“看著后視鏡開車”過多后驗信息介入模型建立,本文做出了許多努力,這些努力也為最終模型的效果做出了貢獻:
(1)根據(jù)歷史數(shù)據(jù)選定簡單、穩(wěn)定的超參數(shù)。
(2)復(fù)雜模型到簡單策略的萎縮過程中盡量采用對稱參數(shù)。
(3)選取參數(shù)盡量關(guān)注全局曲線而非最終值。
(4)采用較大的模擬跳點。
(5)在復(fù)雜的真實回測中采用可得的交易數(shù)量與價格,而非簡單采用統(tǒng)一價。
此外,由于策略“一多一空”的架構(gòu)設(shè)計,極少會面對極端風險,但是仍需要對可能出現(xiàn)的單邊爆倉做出一定的風險管理。由于交易的連續(xù)性質(zhì)和出于節(jié)省手續(xù)費考慮,可以視本策略為連續(xù)策略,而不像一般日內(nèi)策略需要在收盤時平空倉位。
值得一提的是,由于合規(guī)的需要,本文策略的回測建立在螺紋鋼期貨的基礎(chǔ)上,但是并不代表該策略有這方面的局限。讀者在復(fù)現(xiàn)或付諸實踐的過程中,可以考慮將該策略嫁接于外匯交易、虛擬貨幣交易等領(lǐng)域內(nèi):
(1)外匯交易具有可分割性強的特點,能更好地執(zhí)行移動權(quán)重下倉位控制的策略優(yōu)勢。
(2)外匯交易中貨幣間的價值量由第三方的隱含匯率確定,因而在這種主次資產(chǎn)真實價值懸殊的市場中,更能發(fā)揮本策略權(quán)重靈活的優(yōu)勢。
(3)外匯與虛擬貨幣市場深度遠超期貨市場,目標價格更可得,交易摩擦更小。
(4)虛擬貨幣市場還具有連續(xù)性好的特點,且對量化交易者等交易量大的還有較大的費率優(yōu)惠。
本策略在研發(fā)過程中,在外匯與虛擬貨幣的歷史回測、真實回測、實盤交易中均取得了較好的效果,在回撤極小的情況下,構(gòu)建增長迅速且平穩(wěn)的收益曲線。