簡單多樣化,資產配置的優秀基準
摘要
簡單多樣化是一個客觀的比較基準;任何複雜的資產配置方法都需要至少要在統計上顯著戰勝簡單多樣化才能被稱之為有效。
1 引言
資產配置(Asset Allocation) 在量化投資中無處不在。 投資者需要把資金配置在不同的資產中,比如股票、債券、商品期貨等;多因子選股策略需要決定使用哪些因子以及資金在這些因子中的配置比例(每一個因子就是一個投資組合);Fund of Fund(FOF)需要調研大量的基金從而在相關性低的基金之間進行配置。
科學的資產配置對於投資的成功至關重要。
然而由於每種資產的收益存在不確定性(風險),且不同資產之間的相關性也不同,因此在幾十年前人們並不知道應該怎麼“科學”配置,直到馬科維茨的 Modern Portfolio Theory (MPT)橫空出世(Markowitz 1952)。
MPT 使用 mean-variance optimization 確定最佳的配置權重,在數學上十分優雅。然而在實戰中,MPT 卻因在樣本外的表現很差而聲名狼藉。 這是因為優化結果對於輸入異常敏感,而僅使用歷史樣本資料進行均值和協方差進行估計的估計誤差(estimation error)非常大。 如何減少 estimation error 就成了學術界關注的重點。
改進僅使用樣本歷史資料的 mean-variance optimization 的努力主要有以下幾個方向:
- 貝葉斯收縮: 在金融領域,最重要的是 prediction 是否準確,而不是引數估計是否 unbiased。使用歷史資料進行引數估計是 unbiased,但是 estimation error 很大。在貝葉斯方法中,對於收益率均值(以及協方差,主要是均值) 假設有一個先驗,然後採用 shrinkage 的方法得到後驗 。這個先驗往往是基於某種 data generating process 假設的,因此是 biased 的,但是這種方法可以改善 estimation error。(需要貝葉斯收縮背景知識的小夥伴請參考 ofollow,noindex" target="_blank">《收益率預測的貝葉斯收縮》 、 《Black-Litterman 模型 —— 貝葉斯框架下的資產配置利器》 。)
- “猜不出就繞過去”: 名字比較草根、是我起的,但方法絕對靠譜。MPT 最被詬病的是它計算出來的配置權重非常離譜(可能會很大或者很小);往往對均值的一點點改變都能造成權重的劇烈變化。 Chopra and Ziemba(1993)的研究表明,收益率期望的誤差對資產配置的影響比協方差誤差的影響高一個數量級。 但是預測期望是非常難的,所以索性就不猜期望了,而把預測的重點放在協方差矩陣的改進中。著名的 minimum-variance portfolio 就是這樣一個例子,它只需要估計協方差矩陣,並以最小化 variance 為目標構建最優組合。
- “從群眾中來、到群眾中去”: 傳統的 MPT 是無約束優化。當資產間相關性為負或者一些資產的預期收益率為負時,最優的權重可能會出現小於零(做空)的情況。無約束優化給了 mean-variance optimization 更大的出錯空間,且做空在現實中也有很強的限制。為此,在很多研究中都在最優化時加上了 權重非負的限制(shortsale constraint) ,這種貼近實際的做法雖然在數學上的目標函式沒有無約束優化好,但卻大大改善了配置在樣本外的效果。
這些對 MPT 的改進方法在學術期刊的論文中至少都獲得了很好的效果,但是它們在實戰中又如何呢?為了客觀的評價它們的效果,需要選擇一個合適的基準。這個基準就是 —— 簡單多樣化(naïve diversification) 。
簡單多樣化又稱為 1/N 法,即我們把資金平均的分配到 N 個待配置的資產中(配合適當的再平衡)。 簡單多樣化背後的含義是: 不預測不同投資組合或者投資策略未來表現的相對強弱,以期實現樣本外最大的隨機性、到達“最大熵”的狀態,使得配置結果在樣本外的適應性更強。
毫無疑問,簡單多樣化是一個客觀的基準。 任一個複雜的資產配置演算法如果要宣稱有效,至少都要在樣本外、從統計上顯著的戰勝簡單多樣化的配置結果。 這裡,戰勝意味著考慮了更高換手率造成的交易成本後仍能夠帶來更高的風險收益比,如夏普率。
長期以來關注公眾號的小夥伴可能會有印象:我其實非常喜歡簡單多樣化。這一點在《多個因子配置實證》、 《你用因子、他也用因子;你沒賺錢、他卻賺錢了》 均有體現。當然,這種觀點的主觀情緒太濃厚,咱們還要用資料說話。
在金融領域頂刊 Review of Financial Studies 於 2009 年發表的一篇文章中,DeMiguel et al. (2009) 使用了 7 個股票資料集(大部分都是來自美股)比較了簡單多樣化和 14 種基於 MPT 的資產配置方法。孰優孰劣了?一起來看看。
2 資產配置方法與資料集
假設 和
分別代表 N 個資產的收益率均值向量和協方差矩陣、 表示投資者的風險厭惡係數,則 mean-variance optimization 求解如下最優化問題得到最優配置
:
Line"/>
如果考慮所有資產的權重之和加起來等於 1 這個約束條件,則上述問題的最優解為:
其中 。值得一提的是,MPT 是單期資產配置演算法,它假設投資者僅對下一期的最優資產配置感興趣。接下來,本文介紹一些有代表性的改進資產配置方法(更多的可見 DeMiguel et al. 2009)。對它們的描述、分類以及參考文獻如下表所示。

模型 0 和模型 1 無需多言,對其他模型的簡單說明如下:
Bayes-Stein: 貝葉斯收縮的開山鼻祖(Stein 1955),它的收益率均值先驗是 sample global minimum-variance portfolio、收縮以最小化 estimation error 為目標。
Bayesian Data-and-Model: 以給定的資產定價模型(比如 CAPM 或者 Fama-French 三因子模型)為先驗進行收縮。對先驗有很強的結構性假設,具體請參考 Pastor (2000) 及 Pastor and Stambaugh (2000)。這種方法需要指定選為先驗的資產定價模型。
Minimum-variance: 該方法僅需估計協方差矩陣,它的數學描述是:
Value-weighted market portfolio: 對於給定的股票資料集,構建一個“market”組合,通過 buy-and-hold 策略作為這種配置方法。該方法的換手率為零。
Missing-factor model: 該方法由 MacKinlay and Pastor (2000) 提出。它的動機是收益率由 factor 未知 的資產定價模型來決定。因此,在使用 mean-variance optimization 框架時,假設收益率均值仍然來自樣本資料,但是對協方差進行修正,以反映這個未知的 factor 模型。它對 的修正為:
其中 、 都是標量,它們和
一起通過 maximum-likelihood 估計得到。
第 7、8、9 種方法分別為第 1、2、4 種方法加上了 shortsale 約束,即要求配置權重非負。Jagannathan and Ma (2003) 指出, 對 minimum-variance 加上 shortsale 權重相當於收縮協方差矩陣。 因此方法 9 也代表了一大類收縮協方差矩陣的配置方法,例如 Ledoit and Wolf (2004)。
下面再來看看用到的資料集。在考察的 7 個股票資料集中,除了第 3 個之外均來自美股。下表對它們進行了總結。

表中唯一可能造成困惑的地方是,它使用 x + y 的形式表示了資產個數 N。例如,第一個資料集的 N = 10 + 1 = 11。這麼做的原因是 Bayesian Data-and-Model 這個模型需要使用給定的因子模型(資產定價模型)作為先驗。因此上述表示式中加號後面的數字代表了因子的個數。
特別需要說明的是,這些因子投資組合除了在 Bayesian Data-and-Model 模型中計算先驗外;在所有實驗中,它們也都作為獨立的資產參與配置。 舉例來說,在第一個資料集中,參與配置的不僅僅是 10 個 S&P 500 sectors 投資組合,而且也包括了 US equity market portfolio 這個作為因子的組合,因此一共有 11 個資產參與資產配置。
這 7 個數據集中用於計算先驗的因子分別為:
- 資料集 1: US equity market portfolio
- 資料集 2: US equity market portfolio
- 資料集 3: World Index
- 資料集 4: US equity market portfolio
- 資料集 5: MKT(來自 Fama-French 三因子中的市場組合)
- 資料集 6: MKT、SMB、HML(來自 Fama-French 三因子)
- 資料集 7: MKT、SMB、HML、UMD(來自 Fama-French 三因子和 UMD 動量因子)
3 評價指標
除了簡單多樣化外,上述所有這些配置演算法(包括 sample-based mv 和其他 8 個改進方法)都需要使用歷史資料來計算引數。在實證中,DeMiguel et al. (2009) 採用月頻資料並使用長度為 120 個月的滾動視窗進行引數估計,按月調倉以評價不同配置方法在樣本內的表現。
評價指標包括以下三個:
夏普率: 夏普率的定義大家都熟悉,無需過多介紹。這裡想說明的是,不同策略的夏普率都是未知夏普率的一個樣本點,它們的取值自然會有不同。為了檢驗不同策略的效果是否有差別需要在統計上檢驗夏普率是否顯著不同。在統計上檢驗兩個夏普率差別的方法請參考 Jobson and Korkie (1981) 以及 Memmel (2003)。
Certain-equivalent return (CEQ,確定性等值收益率): 它是與給定的風險投資組合等價的無風險收益率。換句話說,對於給定風險偏好的投資者,投資收益為 CEQ 的無風險資產和投資該風險投資組合沒有區別。因此,CEQ 的表示式為(μ 和 σ 均使用樣本外資料):
同樣,為了比較不同策略的 CEQ 是否不同,也需要從統計上進行檢驗。
換手率: mv 以及改進的方法較簡單多樣化來說有更多的主動投資,因此平均來說有更高的換手率。高換手率的直接結果是更高的交易成本。因此,為了評價不同資產配置的效果,換手率也是一個必要的指標。
下一節就來看看實證結果。
4 實證結果
下表顯示了不同資產配置策略在不同資料集上的夏普率。從第二列開始,每一列代表了一個數據集(由於資料集 6 和資料集 5 的效果很接近,因此被省略了);每一行是一個策略,由策略名的縮寫表示。其中 mv (in sample) 代表了在整段資料上開天眼計算均值和協方差矩陣後使用 mean-variance optimization的 表現,因此它是樣本內的表現,相當於所有樣本外表現的上限。其他所有非括號內的數字都是不同策略的 樣本外 夏普率。括號中的數字表示樣本外,給定策略和簡單多樣化策略夏普率差值的 p-value。

以第一個資料集 S&P sectors 為例,簡單多樣化即 1/N 策略的樣本外夏普率是 0.1876,而 mv 樣本內的夏普率高達 0.3848,其樣本外的夏普率僅有 0.0794。0.0794 下方括號內的數字表示 mv 和 1/N 這兩個策略樣本外夏普率差值的 p-value —— 0.12。
觀察表中資料不難發現如下結論:
- 所有策略的樣本外的夏普率都不如開天眼的 mv in-sample 夏普率,這說明 所有這些方法都存在 estimation error 。
- 除了最後一個數據集外,1/N 均戰勝了 mv(大部分 p-value 比較低), 說明僅僅基於歷史樣本資料的、不經任何改進的 mean-variance optimization 確實不好使 ,這也解釋了它為什麼在實戰中名聲不好。
- 基於貝葉斯收縮的方法(bs 和 dm)並沒有顯著的改進 mv。DeMiguel et al. (2009) 觀察到 bs 和 mv 的結果接近,這可能和滾動視窗的長度有關,導致收縮後的權重和 mv 的權重很接近(即先驗的作用很微弱)。 而對於 dm,它是否有效和待配置的資產以及被選為先驗的因子密切相關。 比如,dm 在最後一個四因子為先驗的資料集上戰勝了 1/N,但是同樣的表現並沒有出現在其他資料集上。
- 對於 min、vw、mp 這三個不猜收益率均值的配置方法,min 在 4 個數據集上戰勝了 1/N,不過大部分的 p-value 都不算小。而 vm 以及 mp 這兩個方法基本上都敗給了簡單多樣化。
- mv-c 和 bs-c 的效果可以理解為僅僅加入了不能做空的限制(bs 對收益率的收縮很微弱)。從結果來看, 僅僅加入做空的限制並不能帶來更高的夏普率 。這兩個方法也不如 1/N 法。
- 最後來看看 min-c。它在最小化 variance 的同時加上做空限制,相當於對協方差矩陣進行貝葉斯收縮。 這種“收縮”+“限制”的組合拳在 4 個數據集上戰勝了簡單多樣化,同時也是這幾種改進方法中最好的。
下表是以 CEQ 為評價指標的結果。它傳遞出的資訊和夏普率一致,且結果更加偏向於簡單多樣化策略 —— 如果考慮 CEQ 的話,這些策略更難以戰勝簡單多樣化。

最後是換手率。下表中,1/N 那一行的結果是絕對的換手率,其他策略的結果是相對於 1/N 策略的相對換手率。首先,我們被僅僅基於樣本資料的 mv 策略的相對換手率震驚了。 由於 mean-variance optimization 對輸入資料異常敏感,它經常求解出令人難以理解的“最優權重”。由於馬科維茨的資產配置是單期配置,因此不同期之間的最優權重可能完全不同,這導致了非常不切實際的巨大的換手率。

其他幾種方法有效的降低了換手率,特別是最後三種加上做空限制的方法。它們直接把優化問題變成約束優化,從根兒上限制了求解空間,使得最優權重更加合理、不同期之間的最優權重相對連續,有效的降低了換手率。
即便如此,除了 vm 這種方法是 buy-and-hold 因此換手率為零外,其他配置策略的換手率均高於簡單多樣化。 從夏普率以及 CEQ 的分析可知,複雜配置策略並不能持續的戰勝簡單多樣化;考慮到由此造成的潛在更高的交易成本,它們和簡單多樣化比起來就更難言有優勢了。
實證結果有些令人失望,因為這些複雜配置方法都不能顯著戰勝簡單多樣化。為了研究資產個數 N、引數估計視窗長度 M 對 mean-variance 和 1/N 方法的影響,DeMiguel et al. (2009) 根據 Kan and Zhou (2007) 的思路進行了理論分析。
為此,他們定義了 expected loss 函式:
其中 是未知最優權重
實現的最優夏普率的平方(也是未知的),而
是在給定權重下夏普率的平方。最優夏普率平方和實現的夏普率平方的期望之間差別就是 expected loss。
DeMiguel et al. (2009) 指出 mean-variance 要想戰勝簡單多樣化的前提條件是 M 足夠大,以及 N 足夠小。 這意味著,當引數估計的視窗很大(從 DeMiguel et al. 2009 的結果來看,M 非常大,長過很多實際中資產的歷史資料)以及待配置的資產數量較少時,基於 mean-variance 的配置方法才有希望戰勝簡單多樣化。
DeMiguel et al. (2009) 通過蒙特卡洛模擬模擬收益率資料驗證了上述觀點(下表)。

5 結語
又到了總結的時間了。
有必要強調的是,本文和 DeMiguel et al. (2009) 都沒有主張一定要用簡單多樣化進行資產配置。 如果對未來的判斷很準確,那麼以此為先驗是可以戰勝簡單多樣化的,比如大名鼎鼎的 Black-Litterman 方法。另外,風險平價也是一種資產配置方法,它也是以準確的主觀判斷為前提的(因為需要構建夏普率相當、且相關性很低的不同大類資產,見 《你真的搞懂了風險平價嗎?》 )。
但是,對未來準確判斷談何容易?大部分投資者擅長的僅僅是使用歷史資料外推而已。
DeMiguel et al. (2009) 傳遞出來的兩個清晰的觀點是:
- 僅僅使用歷史樣本資料,即便是改進的基於 mean-variance 的方法也很難戰勝簡單多樣化。
- 簡單多樣化是一個客觀的比較基準;任何複雜的資產配置方法都需要至少要在統計上顯著戰勝簡單多樣化才能被稱之為有效。 比如一個大類資產輪動策略,它的業績比較基準不應該是股票或者債券這種單一投資標的,而應該是基於其投資組合的簡單多樣化策略的效果。如果該策略無法戰勝簡單多樣化,那它就沒有帶來超額收益。
在投資中,資產配置是最核心的問題(沒有之一,相信很多人會認同)。這個問題值得我們持續的探索。

參考文獻
- Chopra, V. K. and W. T. Ziemba (1993). The effort of errors in means, variances, and covariances on optimal portfolio choice. Journal of Portfolio Management , Vol. 19(2), 6 – 11
- DeMiguel, V., L. Garlappi, and R. Uppal (2009). Optimal versus naïve diversification: how inefficient is the 1/N portfolio strategy? Review of Financial Studies , Vol. 22(5), 1915 – 1953.
- Jagannathan, R. and T. Ma (2003). Risk reduction in large portfolios: why imposing the wrong constraints helps. Journal of Finance , Vol. 58(4), 1651 – 1683.
- Jobson, J. D. and R. Korkie (1981). Performance hypothesis testing with the Sharpe and Treynor measures. Journal of Finance , Vol. 36(4), 889 – 908.
- Kan, R. and G. Zhou (2007). Optimal portfolio choice with parameter uncertainty. Journal of Financial and Quantitative Analysis , Vol. 42(3), 621 – 656.
- Ledoit, O. and M. Wolf (2004). A well-conditioned estimator for large-dimensional covariance matrices. Journal of Multivariate Analysis , Vol. 88(2), 365 – 411.
- Markowitz, H. (1952). Portfolio Selection. Journal of Finance , Vol. 7(1), 77 – 91.
- MacKinlay, A. C. and L. Pastor (2000). Asset pricing models: implications for expected returns and portfolio selection. Review of Financial Studies , Vol. 13(4), 883 – 916.
- Memmel, C. (2003). Performance hypothesis testing with the Sharpe ratio. Finance Letters , Vol. 1(1), 21 – 23.
- Pastor, L. (2000). Portfolio selection and asset pricing models. Journal of Finance , Vol. 55(1), 179 – 223.
- Pastor, L. and R. F. Stambaugh (2000). Comparing asset pricing models: an investment perspective. Journal of Financial Economics , Vol. 56(3), 335 – 381.
- Stein, C. (1955). Inadmissibility of the usual estimator for the mean of a multivariate normal distribution . In 3rd Berkeley Symposium on Probability and Statistics, 197 – 206.
原創不易,請保護版權。如需轉載,請聯絡獲得授權,並註明出處,謝謝。已委託“維權騎士”( 維權騎士_免費版權監測/版權保護/版權分發 ) 為進行維權行動。