1. 程式人生 > >基於短周期價量特征的多因子選股體系

基於短周期價量特征的多因子選股體系

過程 全部 誤差 同時 足夠 介紹 處理過程 運行 打折

本篇報告中,我們將開創性的構建全新的多因子模型體系——短周期交易型多因子阿爾法選股體系。

通過交易型阿爾法策略的研究,我們發現在A股市場,與傳統多因子模型所獲取的股票價值阿爾法收益相比,交易型阿爾法收益的空間更大、收益穩定性也更強。

即便是最純粹的價值投資者也不得不承認,交易行為在短期內對股票價格起著幾乎是決定性的影響,而發掘這種交易型套利空間正是量化投資的優勢所在,因此量化模型在這一領域內應有著廣泛的運用空間。

在本篇報告所構建的交易體系中,我們總共構建、運用了將近200個短周期阿爾法因子,其中因子數據則均來自於個股日頻率的價格與成交量數據。在此基礎上,我們構建了基於短周期價量特征的風格中性多因子選股策略。

策略自2012年1月至2017年4月,在扣除所有交易成本後,較之中證500指數,實現年化超額收益率50.2%,最大回撤5.9%,信息比率4.67。

對交易成本的敏感性分析結果表明,由於對換手率與交易成本進行了最優平衡過程的處理,因此策略可容納的極限交易成本接近雙邊1%,模型實戰能力較強。

短周期交易型阿爾法體系既是對傳統多因子體系的補充,也可以說是全新思路、獨立設計的交易體系。在這其中,量化模型不再僅僅是低風險低收益的投資策略,同樣也可獲得高額的收益回報,而盡管我們在這其中還只是看到了冰山一角。

短周期交易型阿爾法策略體系的構建,希望對投資者的研究思路有所拓展,在量化模型最擅長的領域發揮其真正的威力。

一 引言

傳統多因子模型在A股量化投資領域被廣泛運用,在過去若幹年內模型也獲得較為穩健的超額收益。然而,由於市值效應在A股市場的影響過於明顯,導致傳統多因子模型或多或少都受其影響。

尤其是自2017年以來,隨著市場風格發生的急劇變化,策略穩定性受到了一定沖擊,其中主要原因不外乎以下3點:首先,阿爾法因子體系與市值因子相關性過高;其次,組合對風格的暴露控制力不足;最後,選股域與比較基準域之間的不匹配。總而言之,市場風格的變化對策略的影響遠大於阿爾法因子本身所產生的波動,因此在當前市場環境下,對傳統多因子模型的風格控制能力提出了更高的要求,即使沒有顯著的風格預判能力,那至少也需具備風格中性的控制能力。從目前市值因子的波動情況而言,小盤因子超額收益的黃金時代可能已經過去。

在本篇報告中,我們將開創性的構建全新的多因子模型體系----短周期交易型多因子阿爾法選股體系。這將是對原有傳統多因子模型的極大補充,我們將從收益來源、有效周期、因子體系特征、組合換手率、策略設計等多個方面來分析我們所構建的新體系。

通過交易型阿爾法策略的研究,我們發現在A股市場,與傳統多因子模型所獲取的股票價值阿爾法收益相比,交易型阿爾法收益的空間更大、收益穩定性也更強,這與A股市場的投資者結構、交易制度、投資者交易特征有著很大的關系。在A股市場中,即便是最純粹的價值投資者也不得不承認,交易行為在短期內對股票價格起著幾乎是決定性的影響,而挖掘這種交易型套利空間正是量化投資的優勢所在,因此量化模型在這一領域內應有著廣泛的運用空間。

在本篇報告中,我們總共構建、運用了將近200個短周期阿爾法因子,其中因子數據則均來自於個股日頻率的價格與成交量數據。在此基礎上,我們構建了基於短周期價量特征的風格中性多因子選股策略。模型自2012年1月至2017年4月,在扣除所有交易成本後,較之中證500指數,實現年化超額收益率50.2%,最大回撤5.9%,信息比率4.67。策略設計以T+2日頻率調倉,組合每期持股約為50-60只。

短周期交易型阿爾法體系既是對傳統多因子體系的補充,也可以說是全新思路、獨立設計的交易體系。在這其中,量化模型不再僅僅是低風險低收益的投資策略,同樣也可獲得高額的收益回報,而盡管我們在這其中還只是看到了冰山一角。

短周期交易型阿爾法策略體系的構建,希望對投資者的研究思路有所拓展,在量化模型最擅長的領域發揮其真正的威力。

二 阿爾法模型的評價標準

2.1 阿爾法模型的評價標準

在介紹交易型阿爾法策略新體系之前,我們有必要對阿爾法模型的評價標準再做些許的梳理,而這樣的標準既適用於交易型阿爾法體系,同樣也適用於傳統阿爾法模型。

毫無疑問,投資必然是以結果為導向的,因此策略最後實現的收益風險特征是衡量阿爾法模型好壞的最終標準。但是,阿爾法模型的本質即是預測收益,因此在觀察策略實際收益率之前,我們可以通過一些定量的方法,計算阿爾法模型的收益預測是否精確、是否顯著,這樣的判斷將更有利於我們了解自己阿爾法模型的特性,提高投資成功的概率。

在我們的因子模型體系中,收益率分解是基本的假設前提。我們認為任意股票在同一時刻暴露於多種不同的風險因素下,它們之間的共同作用形成了股票價格的波動。因此,我們致力於尋找對絕大部分股票價格波動都有影響的共同因素,稱其為風格因子,這部分收益則稱為風格收益。而風格因子不可解釋的部分,則認為是個股自身特有的屬性,稱其為特質因子,這部分收益則自然稱為阿爾法收益。

即,股票收益率 = 風格收益+ 阿爾法收益。

其中,A股市場最為典型的風格收益包括行業風格、市值風格等。對於各大類風格因子(行業、貝塔、動量、市值、盈利、波動、成長、價值、杠桿、流動性)的定義,我們在之前的報告中已經做了詳細的闡述,或詳見附錄1。

風格收益的特點在於顯著但不可預測(或者說在我們的因子模型體系中不對風格收益進行預測),而阿爾法收益的特點是顯著並且一定程度上可預測。

因此,阿爾法模型的目標應是針對阿爾法收益的預測,而不是針對股票整體收益率的預測。而評價阿爾法模型的標準也應是計算其對阿爾法收益的預測是否可靠。

從建模的角度而言,假設Rt是所有個股在某一期內的收益向量,Xindustry是定義的行業啞變量矩陣,Xstyle為定義的風格因子載荷矩陣(其中包括Beta、Momentum、Size、Earnings_Yield、Volatilty、Growth、Value、Leverage、Liquidity),我們通過回歸方程的計算,可以得到:

其中,f industry和f style分別為行業因子和風格因子的因子收益率factor return,e則為當期個股阿爾法收益率截面。

值得註意的是,假設站在投資時點t時刻,我們可獲得的變量僅為Xstyle和Xindustry,因此未來一期的阿爾法收益率截面et+1是需要預測的。

因而,無論我們選擇何種因子定義、何種因子加權方式、何種收益率轉化方式等,最後產生的計算結果都是阿爾法收益率的預測值,即

換言之,我們在t時刻末通過阿爾法模型計算得到t+1期的阿爾法收益率預測值E{et+1},而到了t+1時刻末,我們通過回歸建模得到t+1期阿爾法收益率的實際值et+1,我們通過預測阿爾法截面與實際阿爾法截面之間的相關系數計算,即可對阿爾法模型該期的預測效果得到定量的評估,我們稱其為阿爾法模型預測系數(IC of Alpha Model),即

那麽,對於足夠長的一段時間T,我們可以計算得到每期阿爾法模型預測系數的時間序列,接下來通過一些簡單的統計檢驗就可以判斷,阿爾法模型的預測性是否顯著,例如T檢驗,即

顯著性檢驗的結果即可視為對一個阿爾法模型的定量評價,那麽對於若幹不同的阿爾法模型就可以有嚴格的好壞區分。並且,從經驗上而言,預測能力較強的阿爾法模型,其所對應的實際組合獲取超額收益的概率也越高。當然,如果阿爾法模型預測能力的檢驗非顯著,那麽甚至都沒有必要去嘗試構造組合,因為最終即便實現的超額收益,若不是風格收益,那麽也只是運氣而已。

遺憾的是,傳統阿爾法因子所構建的阿爾法模型體系,其預測能力在剔除市值因子的效用之後究竟有多強的顯著性,值得深思。

2.2 阿爾法模型的預測一致性問題

至今為止,沒有任何一個投資模型可以解釋市場運行的一切變化規律。投資不需要真理,但是需要邏輯和依據。

在整個多因子模型體系中,策略的構建分為選股和組合兩個步驟。選股即為預測阿爾法收益,組合則為實現阿爾法收益,兩者互相獨立卻又一脈相承。

所謂阿爾法模型預測的一致性問題,指的是阿爾法因子的預測目標與組合實現的收益目標相一致。也就是說,阿爾法模型的預測過程與組合構造的實現過程需要有共同的目標。

舉一些典型的例子來說明這個問題。我們經常利用分組計算收益的方式來考察因子的單調性,而這一過程其實是在對個股的整體收益率進行預測(風格收益+阿爾法收益),即選股目標為預測個股整體收益。而到了構建組合的時候,為了控制回撤降低波動率,我們加入了行業中性、市值中性等約束手段,即組合過程希望獲取較為純粹的阿爾法收益。顯然,此時預測過程與組合實現過程出現了目標不一致的情況,在最後實現的超額收益中,因子的預測作用究竟體現了多少,便不得而知了。

另一種情況則恰恰相反,我們利用一些統計回歸、截面正交等方式,在檢驗因子的時候就盡可能多的剔除各種風格的影響,最後得到因子對純阿爾法收益的預測結果。但在組合構建過程中,沒有對上述剔除的各種風格因子進行嚴格的中性約束,導致組合仍有一定的風格敞口暴露。此時預測過程與組合實現過程仍有不一致性的問題,因子預測的作用又大打折扣。

因此,在我們的多因子體系中,無論是傳統多因子模型,還是本篇報告要介紹的交易型阿爾法體系,都盡可能的做到在因子檢驗、收益預測的過程中,剔除所有風格因素的影響,而在組合構建過程中,保持所有大類風格的中性化處理,最大程度的體現阿爾法模型的預測作用。

盡管,這種方式不一定是最優的,許多投資者或許認為承擔風格收益的風險,獲得的同樣也是阿爾法收益。但正如我們上述提到的,投資需要的是邏輯和依據。對風格收益的預測就需要有獨立的風格輪動模型,對市場漲跌的預測則需要有獨立的擇時模型。在我們的多因子體系中,我們大膽假設風格收益、市場收益難以預測,因此根據這樣的邏輯,得到了因子模型和組合模型的推導結果,所有的策略設計過程做到邏輯嚴謹、有理可依、有據可靠。

阿爾法模型的定量評估和一致性問題是我們因子模型的理念基礎,在此基礎上,我們下面將介紹具體的交易型阿爾法新體系。

基於短周期價量特征的多因子選股體系

3.1 短周期交易型阿爾法策略的構建思路

傳統多因子模型的收益來源,往往集中於財務數據的挖掘、分析師一致預期數據的挖掘,而只有一小部分是中低頻價量特征的數據,因此傳統多因子模型亦可稱為價值型阿爾法模型。

而在A股市場交易行為具有很強的隨機性,機構投資者的交易效率較之成熟市場亦不十分有效,加之T+0、融券賣空等交易機制的缺乏,導致在短周期由於交易行為所產生的定價非有效十分常見。只要是投資者交易產生的價格序列,就一定不是隨機序列,而這一特征在A股更為明顯。

因此,在這一領域內,超額收益有著更大的空間,量化模型也應該發揮其優勢。我們將交易型阿爾法體系與傳統阿爾法模型體系的特點做了簡單的對比,具體為:

1. 超額收益來源:傳統多因子模型的超額收益來源多為股票內在價值,而交易型阿爾法體系的超額收益來源則是交易行為;

2. 因子數據來源:傳統多因子模型的因子數據來源集中於財務報表、分析師報告、及少部分中低頻價量數據,而交易型阿爾法體系的因子數據則全部來自價格、成交領數據(本篇報告中,我們僅采用日頻率價量數據,在後續的研究中日內價量數據也將被廣泛運用);

3. 因子有效周期:傳統多因子模型的因子有效周期較長,財務類因子的預測周期超過1個月甚至更長;而交易型阿爾法體系的因子有效周期則較短,一般都在1周以內,但是因子預測的顯著性更強;

4. 有效因子數量:傳統多因子模型的因子數量較少,並且更習慣於將多個有一定相關性的因子合成處理;而交易型阿爾法體系的因子數量則較多,不同因子貢獻的邊際收益較為獨立;

5. 策略交易頻率:傳統多因子模型的交易頻率為季度、月頻率、周頻率等中低交易頻率,而交易型阿爾法體系的交易頻率則為日內、日度、隔日等中高頻率(本篇報告中,我們將策略設計為T+2日換倉);

6. 組合換手率:傳統多因子模型的整體換手率偏低,策略年化雙邊換手率約為10倍左右,而交易型阿爾法體系的整體換手率偏高,策略年化雙邊換手率約為30-50倍左右(換手率與客觀交易成本呈負相關,我們將在後面的研究中具體介紹);

7. 受市場風格影響:傳統多因子模型的收益與市場風格有一定的相關性,這不僅是由於因子選擇、組合構建的偏差所導致,同樣與市場環境、因子底層邏輯有關,而交易型阿爾法體系與市場風格的相關性則相對較低;

8. 策略內在收益率:傳統多因子模型的內在收益率較低,而交易型阿爾法體系的因子預測顯著性更強,因而策略內在收益率較高。

9. 策略可容納規模:傳統多因子模型的容量規模較大,而交易型阿爾法體系的策略容量相對較低,對交易效率的要求相對較高。

技術分享圖片

3.2 一些顯著的價量特征舉例

本節中,我們將對一些顯著的、便於直觀觀察的價量特征進行舉例說明。在後期的因子構建中,我們將對這些 底層因子進行一些衍生、變化、合成,使得策略更加適應市場的實戰環境。

我們在每一期的股票截面上,計算全部個股的價量特征因子值,隨後進行統計顯著性檢驗。具體的,我們將檢驗風格因子中性後的因子收益率、因子收益率IR、因子相關系數和因子相關系數IR(FactorReturn、Factor Return IR、IC、ICIR),其中檢驗時間均為2010年1月至2017年4月。

舉例1:價量背離

經驗觀察:短周期內成交量逐步提升,價格不斷下降;或成交量逐步下降,價格不斷提升。

因子定義:

技術分享圖片

以短周期內個股均價序列與成交量序列的相關系數衡量價量背離的程度,相關系數越低,後期實現超額收益的概率越高,累計因子收益率僅在股災期間發生波動,其余時間段均較為顯著。

技術分享圖片

舉例2:開盤缺口

經驗觀察:當日個股跳空高開或低開。

因子定義:

技術分享圖片

當日個股開盤缺口,短周期內有較強的動量效應,累計因子收益率較為顯著。

技術分享圖片

舉例3:異常成交量

經驗觀察:當日成交量較短周期均值異常放大、減小。

因子定義:

技術分享圖片

個股成交量的異常變化往往預示著階段性反轉,尤其是異常縮量,是階段底部的特征。成交量的因子處理過程中應註意區分由於漲跌停導致的成交量異常變化。

技術分享圖片

舉例4:量幅背離

經驗觀察:短周期內成交量逐步提升,振幅不斷下降;或成交量逐步下降,振幅不斷提升。

因子定義:

技術分享圖片

以短周期內個股振幅序列(最高價比最低價)與成交量序列的相關系數衡量價量背離的程度,相關系數越低,後期實現超額收益的概率越高,累計因子收益率是所有因子中穩定性最強的。

技術分享圖片

對價量特征進行因子化處理的最大優勢在於,避免了利用單一模式在時間序列上進行買點和賣點的選擇,因為這牽涉到開平倉參數的敏感性問題等,會帶來很大的不確定性和參數過擬合的問題。

價量形態的精髓在於,以當前市場的運行特征,尋找價格運行的規律。如果說傳統多因子模型更加重視因子背後的價值投資邏輯,那麽交易型阿爾法體系則更加重視交易行為背後的規律顯著性,從某種意義上而言,這恰恰是最為直白樸素的投資邏輯。

3.3 短周期價量因子體系的構建

本篇報告中,我們總共構建了191個基於價格和成交量數據的短周期阿爾法因子,其中數據維度均為日頻率交易數據。本節中,我們對所有因子的構建給出了詳細的定義方式,而在之後的章節中,我們將對因子體系的特征進行分析。因子明細詳見下表,部分函數表達詳見附錄2:

技術分享圖片

技術分享圖片

技術分享圖片

技術分享圖片

技術分享圖片

技術分享圖片

3.4 因子檢驗及相關特征

本節,我們將通過一些特征分析,使得投資者對我們的短周期交易型因子體系有更深入的認識。

3.4.1 因子體系的顯著性檢驗、相關性及有效周期

首先,我們對所有單因子進行有效性及預測周期檢驗,進而判斷整個因子體系的可靠程度以及可預測的未來極限周期。其中,單因子顯著性及有效周期檢驗的具體步驟如下:

技術分享圖片

我們統計了全部因子分別在預測周期為1天、2天、3天、4天、5天的情況下,年化因子收益率及信息比率。

其中FR_DAY1表示預測未來1天收益率的所有因子收益率分布,預測周期以此類推;IR_DAY1表示預測未來1天收益率的所以因子收率信息比率分布,預測周期同樣以此類推,具體分布及統計情況如下:

技術分享圖片

技術分享圖片

技術分享圖片

技術分享圖片

技術分享圖片

從上述因子收益率的分布情況而言,大部分因子的年化因子收益率在2%-10%左右,極少部分因子收益率超過15%。從平均收益情況而言,因子體系對未來2天的收益預測平均收益最高,T+3日之後收益情況遞減。

而從上述因子收益率的顯著性水平情況而言,平均來說因子體系對越短周期的預測顯著性越強,呈現明顯的單調變化。而在T+4日之後,整體因子收益率IR均值未達到95%統計顯著性水平。換言之,因子體系的預測周期極限即為T+4日。

對於因子體系的相關性問題,由於短周期因子體系的因子數量較多,我們則不再對任意兩兩因子做正交處理,而選擇在構建完畢所有因子後統一處理,即在我們得到所有因子收益率f之後,我們分別計算任意兩個因子k和k‘的因子收益率相關系數,即ICkk‘ = corr(fk,fk‘),若ICkk‘大於某一給定閾值y,則剔除因子收益率IR較低的因子,保留IR較高的因子。上一節中給出的因子體系,則是我們完成上述計算篩選後的結果。我們對所有因子收益率的相關系數分布情況及均值進行了計算,具體結果如下:

技術分享圖片

經計算,因子收益率相關系數分布均值僅為-0.0057,並且94%的因子收益率相關系數絕對值小於0.1。

上述因子收益率顯著性、相關性、及預測周期的分析表明,在短周期內(T<4天)因子體系呈現了整體高顯著、低相關的特征,這樣的特點十分有助於因子模型在收益預測和實現組合收益的過程中,獲得較高的較穩定的超額收益。

3.4.2 因子體系的預測能力

我們進一步考察因子體系對收益的預測能力,其中統計方法與我們在第二章中提到的阿爾法模型的評價標準相一致。

我們首先利用一定的轉化方式,將全部因子轉化為對個股阿爾法收益截面的預測值,並進而統計預測值與事後計算可得的實際值進行相關系數計算及其顯著性檢驗。我們考察當預測周期t=1的情況下,模型預測系數(IC of Alpha Model)的計算結果,具體方法如下:

技術分享圖片

按照上述步驟,我們對因子體系的預測顯著性進行了統計計算,其中時間自2010年1月至2017年4月,預測周期為T+1日頻率,股票截面則為全A非St,我們分別統計了每日模型IC及30日IC均值,具體計算結果如下:

技術分享圖片

技術分享圖片

結果表明,因子體系在日度預測阿爾法收益截面的情況下,IC均值為0.057,模型預測系數顯著性高達18.23,整體預測勝率接近90%,僅在2015年股災期間有所波動,其余時間段穩定性較強。

因此從統計結果來看,我們構建的交易型阿爾法因子體系對短周期內阿爾法超額收益具有很強的預測能力,這既符合我們對交易型阿爾法收益特征的判斷,也是隨後構建策略獲取較高超額收益的基礎。

3.4.3 因子個數與模型預測能力的關系

本節討論因子數量的問題,可能有投資者會疑問,是否真的需要運用如此多將近200個阿爾法因子。我們將從因子數量與模型預測能力的角度出發,來考察這個問題。

我們首先根據所有單因子檢驗的Factor Return IR排序,然後分別選取20個、40個、60個因子對阿爾法收益進行預測並計算模型預測系數及其顯著性,以此類推直到用盡全部因子。其中檢驗時間仍為2010年1月至2017年4月,股票截面則為全A非St,具體結果如下所示:

技術分享圖片

技術分享圖片

從上述分析結果中可以看到,隨著有效因子數量的增加,因子體系的預測能力也呈現單調的上升趨勢。由於,我們采用因子收益率IR排序,因此曲線呈現了邊際遞減的形態,但這並不妨礙絕對預測能力的提升。

所以說,目前的因子數量還遠未達到可預測收益的邊界區域,因子體系的空間還是比較大的。其實,在一些海外知名的對沖基金中,也有類似的交易型阿爾法策略體系的布局,其所使用的數據範圍、因子數量和算法種類遠超想象,甚至存在因子數量在百萬、上億級別的情況,可以說是一種嶄新的交易模式。當然,一味追求因子個數的增加是不合理的,關鍵還是在於對任意單個因子,必須達到必要的統計顯著結果才可納入因子體系。

3.5 組合換手率與超額收益

較高的組合換手率會使得投資者對策略實戰效果有所擔憂。對於大部分投資者而言,較高的策略換手率未必會帶來更高的收益率,交易越頻繁虧損越大也成為了較為普遍的現象。但是,對於量化模型獲得較為穩定的阿爾法來源之後,提高投資換手率往往會帶來收益率的顯著提升。在眾多的學術文獻中,我們往往會看到一些選股策略或CTA策略在不考慮交易成本的情況下,實現了驚人的投資勝率和收益率。但是,在實際投資環境中,由於較高的換手率所導致的交易成本將大幅侵蝕策略的收益率,甚至導致最後的虧損。

因此,高換手率、低交易成本與高收益率可以說構成了投資的不可能三角,在策略設計的時候,必須尋找到三者之間的最優平衡狀態。對於一些非常有價值的投資信號或阿爾法源,我們往往由於其所負擔的每期100%的換手率而被迫將其放棄。但是,如果我們通過換手率與交易成本之間的平衡,將信號換手率控制在每月60%、40%甚至20%,那麽該策略所獲取的收益仍然將是非常可觀的。

具體而言,控制組合換手率的方式有很多,大體上分為因子層面、優化目標層面和風險約束層面。

1. 因子層面的換手率平衡,是指在因子構建過程中,就考慮組合過程中的高換手問題,因此做加長周期、平滑等處理,但是這種方式對短期阿爾法損失影響較大,適合於中低頻的傳統多因子模型,不適合短周期交易型阿爾法策略。

2.優化目標層面的換手率平衡,是指在優化構建組合的過程中,以單次交易換手成本作為罰函數加入目標收益中,以實現考慮交易成本後的預期收益率最大化,具體的目標函數形式為:

其中wt為所需要求解的目標組合權重向量,Tc為設定的客觀交易成本。

這種目標函數的構建很大程度的降低了策略對交易成本的敏感程度,尤其是對短周期交易型阿爾法策略。一般情況下,如果只以最大化預期收益率為目標函數,很有可能出現任意單次換倉比率均接近100%的情況,雖然這樣有利於阿爾法的收益空間,但是犧牲的交易成本也過大。因此,上述目標函數的構造實現了阿爾法與交易成本之間的平衡,是組合最優的拐點位置。

當然,這樣的目標函數構建對超額預測E(e)的預測精度要求較高,如果阿爾法模型的預測顯著性不強,則也不適用這樣的方法。

3. 風險約束層面的換手率平衡,是最為直觀、簡便的換手率控制方式,即在優化構建組合的過程中,在約束條件中嚴格控制單次換倉比例,即:

其中,TurnOver為設定的單次換手率上限。

這種方法的優點在於簡潔直觀、效果明顯,並且可以保證換手率的控制效果精確可控。但是其缺陷也非常明顯,換手比例限制過於死板,並未綜合考量超額收益與換手率的關系,在某些情況下,可能會以犧牲較多的阿爾法空間為代價。並且,在規劃求解的過程中,容易出現由於和其他約束條件相沖突導致方程無解的情況發生。

在我們的策略設計中,采用了第2種優化目標層面的換手率平衡方式,因此隨著客觀交易成本Tc的提升,策略的整體換手率將逐步降低,超額收益也將有所降低。我們將在下一節中,對策略的交易成本敏感性做實證分析,考察模型可容忍的極限交易成本。

3.6 基於短周期價量特征的風格中性多因子選股策略

至此,我們已經完成了因子體系構建、阿爾法收益預測、因子預測周期評估、換手率與交易成本的平衡分析。本節,我們將構建基於短周期價量特征的風格中性多因子選股策略。

3.6.1 策略設計

在整個策略的設計過程中,我們保持著2個原則:首先,盡可能的提高策略收益率。由於Alpha正比於,因此在因子體系貢獻了較高較穩定的ICalphamodel的基礎上,我們盡可能的提高嘗試次數sqrt(n)。而在主動風控端sigmatarget,我們並未強行設定目標跟蹤誤差,因此模型在設計上,整體收益的空間較大。

其次,收益端與風險端的分離。我們以交易型阿爾法為超額收益的來源設計組合優化的目標函數,而在風控約束端,保持組合在所有大類風格因子層面的中性處理。這種收益與風險完全分離的做法,使得模型在獲得較高較穩定收益的同時,盡可能的降低了回撤風險。策略具體構建步驟如下所示:

技術分享圖片

3.6.2 實證分析

本節,我們將對策略進行實證回溯分析,其中相關參數設定如下:

1)回測時間從2012年1月至2017年4月;

2)比較基準為中證500指數;

3)股票池選取全A非ST股票;

4)交易成本為單邊0.1%,印花稅0.1%,即Tc=0.3%;

5)行業中性約束中,因子敞口設定為正負5%(相對比例);

6)風格中性約束中,因子敞口設定為正負0.1;

7) 組合以次日開盤價模擬成交,並剔除停牌、漲跌停等異常情況;

策略具體結果及相關績效如下所示:

技術分享圖片

技術分享圖片

技術分享圖片

技術分享圖片

技術分享圖片

上述結果表明,策略自2012年1月至2017年4月,相較中證500指數,實現年化超額收益50.2%,信息比率4.67,最大回撤5.90%,發生在2014年3月至4月之間,組合整體收益表現優異。分年度表現來看,2015年市場波動率大幅增加給予了交易型阿爾法策略更大的空間,當年超額收益超過100%,其余年份超額收益表現均在30%-40%左右。值得註意的是,在市場風格發生較大變化的2017年,截止4月末,策略仍然實現年化35%左右的超額收益,表現出策略收益來源與組合構造均與市場風格較為獨立的特性。

從換手率的角度來看,策略年化雙邊換手率為48.2倍,單次平均換倉比率約為40%,而從分年化的換手情況來看,2015年牛市階段的換手率相對較高,這也是導致該年度策略收益表現較好的直接原因。

整體而言,從我們的測算結果來看,短周期交易型阿爾法策略體系在收益空間方面較之傳統價值型阿爾法策略有巨大的提升,並且在風格中性的配置下組合的穩定性仍然得到了較好的保證。

3.6.3 交易成本敏感性分析

本節,我們將考察策略對交易成本的敏感性問題,以檢驗策略可承受的交易成本(包括沖擊成本)的理論極限空間。

在組合換手率與超額收益一節中,我們提出加入單次換倉成本罰函數作為目標函數的做法,即

其中Tc即為設定的客觀交易成本。

從目標函數的構造來看,為了實現經交易成本調整後的超額收益最大化,策略隨著Tc的不斷提升,組合各期單次換倉比率將逐步降低,而阿爾法也將有所降低。接下來,我們將對Tc進行敏感性分析,設定Tc自0.3%不斷提升至1%,觀測策略整體的收益、風險及換手率等相關情況,具體統計結果如下圖所示:

技術分享圖片

從結果來看,隨著設定的客觀交易成本不斷增加,策略的年化換手率也隨之降低。盡管策略的超額收益也逐漸下降,但是整體而言,由於做了相對平衡的目標函數控制,因此策略對交易成本的敏感程度並不會導致災難性的結果發生。

可以看到,當Tc=0.8%時,組合年化超額收益率仍然接近30%,信息比率接近2.5,收益風險表現依然較為平穩。而當Tc=1%的情況下,策略的整體收益表現接近極限位置,若交易成本再提升,模型將會趨於失效。

當然,對交易成本Tc的估計有許多種方式,不同域的股票所產生的沖擊成本也不盡相同,因此在實際操作中可以根據不同股票的模擬沖擊成本將Tc做向量化處理,使得整體結果更為精確。

3.6.4 策略可容納規模估算

收益、風險和資金容納規模構成投資的不可能三角,在策略實現相對較高收益、較低風險的情況下,可容納的資金規模相對不會很大,因此有必要對這類策略的規模容量做一定的估算。

我們以持倉組合中,各只股票當日成交金額的10%作為個股可容納資金規模上限。同時,為了避免極端小成交金額對組合整體估計的偏差,我們以作用組合權重後所有個股可容納資金規模上限倒序排列的95%分位數,作為當日策略可容納規模上限估計值,測算時間與組合構造時間保持一致,具體結果如下所示:

技術分享圖片

從上述結果可以看到,策略可容納資金規模與市場整體成交量相關,2012年至2014年,由於市場整體成交萎縮,導致策略可容納規模在1億左右。而2014年至2016年牛市階段,市場成交活躍,因此策略可容納規模大幅提升,最高接近7億水平。而在2017年當前市場成交水平,策略可容納規模在2到3億左右。

因此,客觀而言,對於資金量較大的機構投資者而言,完全利用該種交易型策略進行阿爾法投資不太現實,策略比較適合運用於多策略體系中的一支,或大部分資金可以布局於容量較大但收益偏低的傳統價值型阿爾法策略中,而小部分的資金量布局於該類高換手且收益較高的交易型阿爾法策略中,提高策略組合的整體收益水平。

當然,從策略的設計上而言,同樣可以通過降低一定的收益率來獲取更大的資金容納規模,期間的因子運用、組合構造等步驟是相對靈活、開放的。

四 總結與展望

本篇報告,我們開創性的構建了全新的多因子模型體系----短周期交易型多因子阿爾法選股體系。其中,我們將超額收益的來源鎖定在由於交易行為所產生的機會中,試圖獲取與傳統價值型多因子模型相獨立的阿爾法來源。

由於A股市場交易行為隨機性很強,並且機構投資者的交易效率亦不十分高效,加之T+0交易、融券賣空交易模型的缺乏,導致在短周期內由交易產生的定價非有效情況較為常見。通過研究我們發現,與傳統價值型阿爾法策略相比,交易型阿爾法的收益空間更高,穩定性也更強。

在本篇報告所介紹的交易型阿爾法體系中,我們總共構建、運用了將近200個阿爾法因子。研究分析表明,因子體系呈現出了高顯著、低相關的特征,對超額收益具有很強的預測能力,這為後面策略構建提供了堅實的保障。

在策略設計方面,我們通過超額收益的因子化預測轉換、換手率與交易成本的平衡、收益端與風險端的分離等方式,實現了策略整體的設計,回測結果表明,在可接受的交易成本和資金容量的情況下,模型可實現較高且穩定的超額收益。

盡管如此,在整個研究過程中,我們感覺到只是看到了交易型阿爾法空間的冰山一角。在海外成熟市場,類似的統計套利型的阿爾法策略占到了整個量化投資的半壁江山,因此該類策略或許也是量化投資的重要發展方向之一。

並且,隨著近些年來,人工智能、機器學習算法的飛速發展,未來交易型阿爾法模型體系將大量運用該類算法去進行因子挖掘,但是這並不意味著機器將替代人類,對於投資者而言,底層的投資邏輯和策略設計仍然掌握在其邏輯框架中,這是任何技術都無法改變的。

在後期的研究中,數據源的拓展也是一個核心的方向,當前策略體系我們僅僅是利用了日頻率的價量信息,而日內的高頻數據則包含了更為顯著的預測信息,是值得深入研究的方向。此外,場外的數據信息同樣包含大量的預測信息,通過整體的策略設計,模型可提升的空間仍然較大。

短周期交易型阿爾法策略體系的構建,希望對投資者的研究思路有所拓展,在量化模型最擅長的領域發揮其真正的威力。

基於短周期價量特征的多因子選股體系