配置風險收益還是配置噪音?
摘要
使用收益率序列計算夏普率、並比較不同策略時應使用科學的統計檢驗方法並回答正確的問題。這需要合理的先驗和足夠長的資料。
1 引言
資產配置是投資中最重要的課題之一。很多量化手段都被用來進行資產配置,比如人們耳熟能詳的簡單多樣化、風險平價、波動率倒數、最小波動率等方法。
在 《你真的搞懂了風險平價嗎?》 一文中我們指出,當資產之間相互獨立時,應按照每個資產的夏普率平方來分配投資組合的風險,這能夠最大化投資組合的夏普率。令 表示資產的協方差矩陣、
表示資產 i 的夏普率、
表示投資組合的波動率、
為權重向量。容易證明(下圖)當投資品相互獨立時(協方差矩陣是對角陣),根據夏普率平方分配風險得到的權重
和
成正比。這個比例正是大名鼎鼎的 凱利準則(Kelly criterion) 。 在資產相互獨立的假設下,按此權重配置保證了投資組合的夏普率最大。

在實際資產配置中,涉及的資產一般為不同類別的大類資產(如股票、債券、商品、外匯等)或者是相關性很低的投資策略,資產間可近似假設不相關。 量化配置的核心就變成是否能準確的計算不同資產的夏普率(或者其他風險、收益指標)。
下面以滬深 300、美國 7-10 年國債、標普 500 和黃金四種資產比較一下按夏普率平方分配風險配置(下文中簡稱為按夏普率配置)和簡單多樣化配置的效果。這四類資產在回測期內的表現如下(該實證例子來自 2017 年底的《主動風險預算初探》一文,因此回測期僅到 2017 年底)。

對於按夏普率配置策略,選擇月頻交易頻率,每個月末調倉。調倉時排除最近三個月內收益率均值為負以及由於未上市因而不可交易的資產(例如在 2003 年 3 月 31 日,滬深 300 指數尚未推出,不可交易)。對於滿足條件的資產,採用 20 周滾動視窗的周頻收益率資料計算夏普率;按照夏普率的平方來分配風險、計算最佳的配置權重。如果當期所有資產都被排除,則在下個月空倉。非空倉時則要求每月均滿倉配置,即 之和為 1。按夏普率配置和簡單多樣化這兩種策略的表現如下圖所示。

從上述實證結果來看,按夏普率配置完勝簡單多樣化。按夏普率平方分配風險似乎 “理論完美、實證給力”,但現實中真的是這樣嗎?彆著急,繼續往下看。
上述實證結果的前提是能夠對夏普率進行正確的計算。 本文的觀點是通過有限的樣本資料來對總體未知的夏普率進行推斷、以及檢驗不同策略或資產的夏普率是否有顯著差異(從而賦予不同的配置權重)是非常困難的一件事(是可能的,但很困難)。
來看一個假想的例子。
2 兩年 vs 二十年
使用正態分佈獨立構建兩個策略的周頻收益率序列。假設兩個策略的年化真實夏普率分別為 1 和 2;周頻的波動率為 1%,通過夏普率就可以計算這兩個周頻收益率序列各自的均值,從而獲得正態分佈的全部引數。假設對每個策略產生 1000 個樣本點(對應約為二十年的時間) 。
下圖首先展示了這兩個策略在 前 100 個樣本點(對應兩年) 的累積收益率。

你可能猜到了,我一定會故意找一個年化夏普率為 1 的策略在這前 100 周(對應兩年)跑贏那個夏普率為 2 的策略的例子。上圖中的藍色為夏普率為 1 的策略的累積收益率;黃色為夏普率為 2 的策略的累積收益率。
如果我們把時間拉長到全部 1000 個樣本點(二十年),則毫無意外的,黃色策略大幅跑贏了藍色(注意下圖中縱座標是對數座標)。這個例子說明,即便是年化夏普率 1 和 2 這種巨大的差異,如果只有很短的樣本資料也完全能帶給我們錯誤的結論(況且兩年已經不短)。

你可能接著會說我一定是在“cherry picking”,試了半天找出了上面這麼一個有違常理的例子。下面來看看多次模擬的結果。假設進行 5000 次模擬,每次模擬生成年化夏普率分別為 1 和 2 的兩個策略,每個策略長度為 1000 個樣本點。下圖繪製了在前 n 個樣本點下(橫座標為 n 的取值),夏普率為 1 的策略跑贏夏普率為 2 的策略的概率(縱座標)。

上圖表明,如果我們的樣本資料很短(比如 n = 10 或 20 周,對應幾個月的情況),使用樣本資料夏普率來比較兩個策略的錯誤率(即認為真實夏普率為 1 的策略比真實夏普率為 2 的策略更好)高達 30% 以上;即使是使用 100 個樣本點(兩年),判斷的錯誤率也有 16.34%。(所以“cherry picking”並沒有花費我很多時間。)隨著樣本長度增加,錯誤率持續降低。
這個例子說明, 哪怕僅僅是希望定性的判斷兩個策略的夏普率孰高孰低,我們都需要足夠長的樣本資料。 而如果想定量的比較不同策略的夏普率差異,則需要適合的統計檢驗。
3 夏普率檢驗
數學上有很多手段檢驗兩個收益率時間序列的夏普率是否顯著不同。在這方面,最早的研究大概是 Jobson and Korkie (1981)。不過該研究假設兩個策略的收益率滿足二元正態分佈,而實際的收益率時間序列中難以滿足該假設。
針對上述問題,Ledoit and Wolf (2008) 提出了改進的檢驗方法。本文的重點雖然不是介紹這些檢驗方法,但由於下文的舉例研究中將使用 Ledoit and Wolf (2008) 的方法,故在本節對其簡要說明。感興趣的朋友請進一步參考原文;跳過本小節也不影響後面內容的閱讀。
根據夏普率的定義,它是策略超額收益均值和其標準差的比值。而對於一個隨機變數 ,其方差滿足如下關係:
因此,對於(超額)收益率隨機變數 r,對應的夏普率可以表達為:
換句話說,夏普率可以表達為收益率 r 的一階矩(即均值 E[r])和 非中心化 的二階矩(即 E[r^2])的函式。Ledoit and Wolf (2008) 正是採用了上述表示式,極大的簡化了推導。
對於兩個待比較夏普率的收益率序列 和
,它們的真實(但未知)夏普率之差(用
表示)是
、
、
以及
的函式(為簡化表示式,令
、
):
在實際中,我們只有樣本資料,使用樣本資料計算出的夏普率之差為:
為了對夏普率之差進行檢驗,我們必須知道樣本夏普率之差的 standard error。為此,Ledoit and Wolf (2008) 使用了統計學中的delta method。具體的,令 —— 即向量 代表了計算兩個收益率序列夏普率之差的總體(population)未知引數;令向量 對應 的樣本(sample)引數。Ledoit and Wolf (2008) 假設:
上式箭頭上的 表示依分佈收斂; 表示
的協方差矩陣(未知、需估計);
為樣本長度。由於夏普率之差
是 的函式,直接使用 delta method 可得:
其中:
上式就是使用樣本資料計算的夏普率之差需要滿足的分佈。一旦我們能夠得到協方差矩陣 Ψ 的相合估計 ,就可以利用下式求出
的 standard error:
有了 standard error,再假設真實夏普率之差為 ,便可以計算 t-statistic:
有了 t-statistic 就可以進一步計算 p-value 並以此接受或拒絕原假設 。問題的核心由此歸結為估計協方差矩陣
。為此,Ledoit and Wolf (2008) 給出了兩種方法:
第一種方法是基於漸進正態性的假設,使用 heteroskedasticity and autocorrelation (HAC) kernel estimation 對 進行估計。在協方差矩陣的 HAC 估計方面,學術界有很多方法,Ledoit and Wolf (2008) 採用的是 Andrews (1991) 給出的方法。
第二種方法是使用自助法(bootstrap)。Ledoit and Wolf (2008) 認為對於實際中的收益率時間序列,由於分佈未知且樣本數量較短,前一種基於漸進正態性的方法可能無法給出正確的估計。出於這種考慮,Ledoit and Wolf (2008) 採用了 studentized bootstrap 方法(見 《用 Bootstrap 進行引數估計大有可為》 中的第五節)。
由於篇幅所限,本節不再展開介紹協方差矩陣 的估計。感興趣的朋友請參考 Ledoit and Wolf (2008)。在下一節的實驗中,由於使用的假想收益率序列出自正態分佈,因此使用上述第一種方法對夏普率進行檢驗。
4 回答正確的問題
上述夏普率差別的檢驗回答的是 的問題 —— 即在原假設
下,我們觀測到樣本夏普率差異
的概率。 在實際進行資產配置時,即便我們能顯著的拒絕原假設,它也不是我們最關心的問題。
在利用不同夏普率進行資產配置時,正確的問題是計算 —— 即當樣本資料顯示出
的夏普率差異時,這兩個策略真實夏普率差異是 的概率。 由貝葉斯法則可知,
與
的先驗概率以及統計檢驗結果
的乘積成正比:
上式說明,為了計算 需要知道先驗
是多少。在一定程度上,它的取值和主觀經驗判斷密切相關 —— 比如認為兩個策略夏普率沒有差異的概率最大;或者認為某個策略就是風險收益更高,因此它們年化夏普率差異為 1 的概率最大等。
下面,假設真實年化夏普率差異 θ 的取值為 0、0.5 和 1,並假設 、
、
。我們再來看看第二節中的那兩個策略。
當只有前 100 周的樣本資料,通過使用本文第三節介紹的檢驗方法得到如下結果:

從 prob(Δ = θ) 和 prob(\hat Δ | Δ = θ) 的乘積來看,最大的是 θ = 0.0 的情況,這說明僅僅通過 100 期的表現,我們並不能認為這兩個策略中誰更好,儘管實際情況是策略 2 的真實夏普率是策略 1 的兩倍。
當使用全部 1000 個樣本資料時,可得到的結果如下。在足夠長的樣本資料下(二十年),結果顯示兩個策略最有可能的真實夏普率差別是 θ = 1.0。

這個例子雖然從收益率序列到先驗都是假想的,但通過它想要引出的觀點是:
1. 評價不同資產/策略的夏普率差異(進而進行更主動的資產配置)需要一個基於統計手段的科學分析框架,並在這個框架下回答正確的問題;
2. 樣本資料的長短對於總體統計量的推斷至關重要,使用很短的資料計算夏普率或者資產配置也許更傾向於配置噪音。
5 結語
資產配置從來都不是一個容易的課題。
當我們知道不同策略(或者資產)真實夏普率的時候,沒有理由使用簡單多樣化配置;充分利用不同資產的夏普率資訊才可能最大化投資組合的夏普率,達到最優的風險收益特性。可惜,真實夏普率是未知的。
使用收益率序列計算夏普率並比較不同策略時應該使用科學的統計檢驗並回答正確的問題。這需要合理的先驗和足夠長的資料。 而基於有限的資料計算出(不確定性極大的)夏普率來配置相當於擇時。計算夏普率在一定程度上近似於計算收益率;短時間內收益率的外推性是非常差的,因此使用短時間內夏普率進行資產配置(擇時)並不十分合理的。
為什麼第一節中的例子裡按照滾動視窗計算出的夏普率來配置顯著戰勝了簡單多樣化呢?其原因是 A 股中涇渭分明的牛、熊市 —— 任何對著 A 股的擇時策略只要能躲過幾波熊市都會顯著提升樣本內效果。在該例子中,一旦我們把 A 股從資產池中排除,對於餘下幾種資產,使用滾動夏普率並沒有戰勝簡單多樣化(下圖)。

當使用了正確的方法和足夠的資料之後,對於夏普率的判斷(從而改變策略配置權重)是一種改變我們先驗的低頻行為。 如果正確,它將會提高投資組合在未來的風險收益特徵;如果錯誤,它則大概率是在樣本內對著資料過擬合而已。
基於有限的收益率序列、滾動計算夏普率(或其他風險、收益指標)並配置資產,到底是在配置風險收益還是在配置噪音?
參考文獻
- Andrews, D. W. K. (1991). Heteroskedasticity and autocorrelation consistent covariance matrix estimation. Econometrica , Vol. 59(3), 817 – 858.
- Jobson, J. D. and B. M. Korkie (1981). Performance hypothesis testing with the Sharpe and Treynor measures. Journal of Finance , Vol. 36(4), 889 – 908.
- Ledoit, O. and M. Wolf (2008). Robust performance hypothesis testing with the Sharpe ratio. Journal of Empirical Finance , Vol. 15(5), 850 – 859.
原創不易,請保護版權。如需轉載,請聯絡獲得授權,並註明出處,謝謝。已委託“維權騎士”( 維權騎士_免費版權監測/版權保護/版權分發 ) 為進行維權行動。