未知風險,錯誤定價,還是資料遷就?
摘要
通過對比樣本內、外的表現,Linnainmaa and Roberts (2018) 發現從會計資料中挖出的 36 個美股截面收益異象中的大部分都是 data snooping 的產物。這些異象在樣本外的表現令人失望。
1 引言
每當學術界和業界試圖解釋一個新發現的關於股票收益截面差異的異象(anomaly,或者用我們更熟悉的語言來說 —— “因子”;在下文“異象”和“因子”將會交替使用)時, 未知風險(unmodeled risk) 和 錯誤定價(mispricing) 是最主流的兩種角度。誠然,一些長期有效的因子確實是因為上述兩種原因造成的。但是面對如今如雨後春筍般層出不窮的因子,除上述兩者之外的第三種解釋 —— 資料遷就(data snooping) —— 卻慢慢的進入了大眾的視野。
早在 1990 年,Lo and MacKinlay (1990) 就指出 data snooping 在檢驗資產定價模型中會造成一定的問題。而美國金融協會(AFA,American Finance Association)前主席 Campbell Harvey 於 2017 年協會年會上做的主席演講The Scientific Outlook in Financial Economics(Harvey 2017)也指出 data snooping 問題在如今的“因子挖掘界”普遍存在 。關於這篇演講,我寫過一篇讀後感,請參考 ofollow,noindex" target="_blank">《在追逐 p-value 的道路上狂奔,卻在科學的道路上漸行漸遠》 。
Harvey 和他的 co-authors 於 2016 年發表了一篇著名的文章(Harvey et al. 2016),題為 … and the Cross-Section of Expected Returns。我當年看到該文題目中的 … 的第一反應是懵了,以為缺字了。後來讀了才回過味兒來:學術界發現新因子的論文題目一般都是 XXX and the cross-section of expected returns,其中 XXX 代表新因子的名字。因此 Harvey et al. (2016) 這篇文章的題目中用了 … 是為了說明該文的研究物件是眾多解釋股票截面收益的文章。該文分析了學術界發現的 316個 異象,並指出在更嚴格的 multiple hypothesis testing 框架下,絕大多數因子都難言有效。
近日,來自 USC 的 Juhani Linnainmaa 和來自 UPenn Wharton 商學院的 Michael Roberts 在 Review of Financial Studies 上發表了 The History of the Cross-Section of Stock Returns(Linnainmaa and Roberts 2018)。這兩位學者花費了很大的經歷構建了 全新的樣本外資料 ,從而比較了來 美股中 源於 會計資料 中的 36 個異象(下表)在它們各自的樣本內和樣本外的表現。 分析表明,絕大部分異象在樣本外明顯失效,這種現象和未知風險以及錯誤定價兩種解釋嚴重不符,因此它們很有可能僅是 data snooping 的產物。

The History of the Cross-Section of Stock Returns 無疑是學術界關於 data snooping 如何影響因子挖掘的最新探索。因此,本文就對它進行簡要的介紹。該文作者 Linnainmaa 和 Roberts 都是美國 NBER(National Bureau of Economic Research)的學者,他們的發現最早是以 NBER 報告的形式於 2016 年底問世;在 The Jacobs Levy Center’s 2017 Conference,該文也作為三篇入選文章之一得到了與會者的充分討論;最終該文在今年 7 月於頂刊 RFS 發表。
下面馬上進入正題,來聊聊這篇 The History of the Cross-Section of Stock Returns。以下介紹參考 NBER 的這篇論文以及 Roberts 在 2017 年會議上所做的報告。
2 資料構建
讓我們仔細看一下上一節這個大表中彙總的這 36 個來自會計資料的異象。 所有這些論文的 in-sample 回測開始時間都是 1963 年之後 (回測結束時間因論文提交和發表時間而不同)。這是因為標準普爾公司在 1962 年建立了 Compustats 資料庫,它包含了比較理想的會計資料,為各種研究中的回測奠定了基礎。
Linnainmaa and Roberts (2018) 的第一個貢獻是綜合了 CRSP 的收益率資料(1926 年至今)、Compustat 的會計資料(1962 年至今)、以及 Moody’s Industrial and Railroad 手冊中的資料(1918 – 1970),從而構建了從 1926 年至 1963 年之間的會計資料。 這些寶貴的資料對於上述這 36 個異象來說無疑是樣本外資料。由於這些資料存在於這些研究的 in-sample 時期之前,它們被稱為 pre-sample 資料 。雖然這些 pre-sample 資料較 Compustat 有一定不足(比如沒有金融和公用事業這兩個行業的資料,以及一些指標的粒度不如 Compustat),但是 Linnainmaa and Roberts (2018) 指出,pre-sample 的資料在資料質量上不輸給 Compustat 的資料,而且時間足夠長、樣本足夠多,因此使用這些新的資料來檢驗那 36 個異象沒有問題。下表展示了 pre-sample 資料所覆蓋的公司數量。

此外,每個異象的 in-sample 回測期的終點至今這段時間就構成了 post-sample 資料 。Pre-sample 和 post-sample 資料對於這些異象來說就是樣本外資料。 如果這些異象背後的原因不是 data snooping 而是未知風險或者錯誤定價,那麼它們應該在樣本外依然成立。 特別的,考慮到早期更高的交易費用代表著更高的套利成本,那些由錯誤定價解釋的異象應該在 pre-sample 內更加顯著。
3 檢驗框架 —— 以 investment 和 profitability 異象為例
本節以 investment 和 profitability 這兩個異象為例考察它們在樣本外(pre-sample 和 post-sample 時期)的表現。這兩個因子的定義如下(來自 Fama and French 2015 以及 Hou et al. 2015):
- Investment: Change in the Book Value of Total Assets over the Previous Fiscal Year(總資產賬面價值相對於上一財年的變化);
- Profitability: Operating profits over Book Value of Equity(營業利潤與權益賬面價值之比)。
為了排除市值因素的影響,在分析目標因子時使用市值將股票分成大小兩部分(各 50%),然後在這兩組中分別使用目標因子選取因子取值首尾的各 30% 的股票構建多空組合,然後再把這兩組中的多空組合收益率取均值作為該因子的投資組合的收益率。
以 investment 因子為例,上述過程相當於使用 size 和 investment 因子將所有股票分成六份:

在 Small 和 Big 兩組中,使用 investment 因子大小將每組的股票分成 Low(30%),Neutral(40%)和 High(30%)三份。之後按照因子本身的業務含義,使用 Low 減 High 或者 High 減 Low 構建市值加權的投資組合。最後把 Small 和 Big 這兩組的兩個組合的收益率取平均,作為因子投資組合的收益率,以此就可以分析該因子是否能夠解釋預期收益率的截面差異。
對於 investment 因子,按照其業務含義,Low 的組合(投資比較保守)相對於 High 的組合(投資比較激進)能夠獲得超額收益,因此這個因子又稱為 CMA(Conservative Minus Aggressive)。對於 profitability 因子,按照其業務含義,High 的組合(利潤更高)相對於 Low 的組合(利潤較低)能夠獲得超額收益,因此 Fama and French (2015) 稱之為 RMW(Robust Minus Weak)因子。
下表展示了 investment 和 profitability 這兩個因子在 1963 年(pre-sample)之前每月相對於無風險收益率的超額收益(之所以有 1938 年那個進一步細分是為了考慮 1934 年的 Securities and Exchange Act 所帶來的潛在影響):

結果顯示, 這兩個因子在整個 pre-1963 年的回測期內完全失效。 與之形成鮮明對比的是它們在 in-sample 的顯著性(t-statistic 均在 3 以上)。此外,Linnainmaa and Roberts (2018) 指出,在 pre-sample 期間每個投資組合都有不少於 50 支股票,且回測期間長達 37 年,這個級別的資料量保證了統計檢驗的可靠性,從而排除了資料不足造成的兩個因子失效的可能性。
再來看看這兩個因子的 CAPM-α —— 使用因子收益率和市場收益率在時序上回歸,得到的截距就是在截面上市場無法解釋的預期收益率差異,它稱為 CAPM-α。下表顯示了這兩個因子的 CAPM-α 在 1963 年之前的表現,低 t-statistic 同樣說明它們完全失效。

除此之外,這兩個因子的 3-Factor-α —— 使用因子收益率和 Fama-French 三因子收益率在時序上回歸,得到的截距就是在截面上三因子無法解釋的預期收益率差異,它稱為 3-Factor-α —— 在 pre-sample 的表現如下。其中 RMW(profitability 因子)在 1938 年到 1963 年之間依然顯著。對於 profitability 因子來說,它的 3-Factor-α 比 CAPM-α 更顯著是因為 profitability 與 value 因子在回測期內呈現負相關造成的(Novy-Marx 2013)。和它們各自 in-sample 的 3-Factor-α 比較來看,這兩個因子(尤其是 investment 因子)在 pre-sample 的表現依然遠不如它們 in-sample 的表現。

作為比較,下圖展示了 Value(HML),profitability(RMW)以及 investment(CMA)三個因子在 1926 年到 2015 年之間的滾動月收益率均值。其中 RMWO 和 CMAO 代表使用 Fama-French 三因子正交化之後的 RMW 和 CMA 因子。從圖中不難看出, 價值因子幾乎可以持續的獲得正收益(直到最近幾年才開始虧損),說明價值因子(價值投資)確實是長期立於不敗之地的正道。 反觀另外兩個,investment 因子在 1970 年之前幾乎是完全失效的,它的月收益率幾乎持續在 0 以下;而 profitability 的 RMWO 收益率在多數時間位於 0 之上,但其在 1940 年之前以及 1980 年前後也有不少的時間錄得負收益。

最後,Linnainmaa and Roberts (2018) 從投資的角度考察了 investment 和 profitability 因子。使用這二者,以及market、size 和 value 共五個因子 in-sample 的表現計算出預期收益率和標準差,並通過馬科維茨的 mean-variance efficient 策略構建最優投資組合,考察了該組合在 in-sample(1963 年之後)和 pre-sample(1963 年之前)的表現。在 pre-sample,該組合完全無法戰勝市場(下圖比較了市場和最優組合的滾動夏普率):

本節的分析(超額收益、CAPM-α、3-Factor-α、最優投資組合)表明,investment 和 profitability 兩個因子僅在它們被提出的樣本內有效,而在 pre-sample 幾乎完全失效。 它們極有可能是 data snooping 的結果,而非錯誤定價或未知風險能夠解釋的。
4 其他異象
按照上一節介紹的分析思路,Linnainmaa and Roberts (2018) 分析了所有 36 個和會計資料有關的異象。本節簡單介紹一下綜合的結果,對單因子檢驗結果感興趣的小夥伴請閱讀原文。
按照性質,這 36 個異象可以分為七大類:profitability,earnings quality,valuation,investment and growth,financing,distress,以及 composite(複合類,比如 AQR 提出的 QML —— Quality Minus Junk 因子)。這七大類因子在 pre-sample、in-sample 以及 post-sample 的平均表現如下表所示 —— 平均來說,它們在樣本外(包括 pre-sample 和 post-sample)的表現均遠遠不如其在樣本內的表現。

再來看看全部 36 個因子的平均表現(下表)。在樣本內,這些因子獲得的收益率更高、波動率卻更低,因此帶來了更高的夏普率。 而在樣本外,所有的指標都在往壞的方向變化 —— 更低的收益率、更高的波動率以及更低的夏普率。 無論從超額收益,還是從 CAPM-α 或 3-Factor-α 來說,樣本內、外的巨大反差都說明這些因子中有很大一部分難逃 data-snooping 之嫌。

最終,Linnainmaa and Roberts (2018) 發現,在 in-sample,無論從超額收益、CAPM-α 還是 3-Factor-α 來看,這 36 個因子均顯著。這三個指標下顯著因子的個數分別為 36、36 和 36。而在 pre-sample 期間,這三個數字變為 8,8 和 16;在 post-sample 期間,這三個數字變為 1,10 和 9。
在 pre-sample 依然有效的因子和 real investment、equity financing、distress 以及 ROE/ROA 有關;在 post-sample 依然有效的因子和 sales/earnings to price ratio、total financing、distress 以及 ROE/ROA 有關。隨著巨集觀經濟的變化,在整個回測期的前半段,有效的因子和有形投資以及股權融資相關;在回測期的後半段,有效的因子和無形投資以及債券融資有關。可見, 只有那些真正和 economic fundamental 相關的因子背後才可能存在未知風險或錯誤定價的解釋。
5 來自資料遷就的證據
Data snooping 的表現之一是刻意的挑選回測期讓因子看起來更加有效。
雖然 Compustat 資料庫包含了從 1963 年以來的資料,但是這 36 個異象中的很多個回測期的起始點並不是 1963 年,這足以引起我們的不安。

如果把回測期的起點追溯到 1963 年會怎樣呢?通過加入一個 dummy 變數代表 1963 年到因子 in-sample 回測期的起點之間這段時間,Linnainmaa and Roberts (2018) 發現僅僅是這個微小的調整也能讓大部分因子失效(都無需使用 pre-1963 年的資料)。這無疑是 data snooping 的證據之一。

下表顯示了以 1963 年到 1973 年分別為回測起點時,這 36 個異象的收益率、CAPM-α、3-Factor-α 均有所下降。下降幅度分別為收益率下降 40% 到 80%、CAPM-α 下降 50% 到 75%、3-Factor-α 下降 30% 到 90%。

對於因子在被發現後表現失效,學術界有另一種被接受的來自 套利者 的解釋(Mclean and Pontiff 2016): 當因子被發現後,套利者開始交易該因子,導致因子的非有效性較低,表現逐漸失效。
如果這個解釋成立,那麼當因子被發現後,它的收益率應該和其他已經被發現的因子的收益率的相關性更高。這是因為市場上的聰明交易者同時在交易這些不同的因子,使得按這些因子構建的策略的資金流入和流出相對一致,從而造成因子表現的趨同。 為了檢驗這個說法,Linnainmaa and Roberts (2018) 依照 Mclean and Pontiff (2016) 的思路考察瞭如下回歸模型:
這個模型中最核心的就是係數 b_5。其中,post_{i,t} 是一個 binary 變數,取 1 表示目標因子 i 在 post-sample 時期;post-sample index_{-i,t} 則是 post-sample 時期所有其他已有因子的平均收益率。如果 b_5 在統計上顯著大於零,則說明因子被學術界發現後,業界確實開始交易它,從而增加了它和其他已有因子的相關性,並由於交易造成了該因子的效果減弱。迴歸的結果如下表所示,b_5 確實顯著大於零,似乎與上述解釋相符。

不過,先不要高興的太早。
Linnainmaa and Roberts (2018) 將上述迴歸模型中的所有 post- 都換成了 pre- ,分析了 該因子在它被提出之前和其它尚未被提出的因子之間的相關性。
結果(下表)顯示,在這個迴歸中,b_5 依然顯著大於零,說明 目標因子在 pre-sample 期間(被發現前)和其它所有因子在 pre-sample 期間的收益率成正相關。

這就尷尬了。
這種正相關就不能再讓套利者的交易行為“背鍋”了,因為在 pre-sample 期間因子還沒有被發現,套利者又怎麼能交易它們呢? 更不幸的是,由於在 pre-sample 和 post-sample 上觀察到了幾乎一致的現象,我們對於 post-sample 中的套利者這個解說也動搖了。
Linnainmaa and Roberts (2018) 認為, 上述現象的一個合理的解釋是在樣本內,data mining 不僅僅是對異象的一階矩(預期收益)造成了影響,而是對於異象之間的高階矩(相關性)也造成了錯誤的影響。 唯有此才能夠解釋在 pre-sample 和 post-sample 期間都觀測到的因子之間不正常的正相關性。這便是 data snooping 的另一個證據。Data snooping 在樣本內對於收益率的分析到底有怎樣的影響值得今後持續的研究。
以上便結束了我對 Linnainmaa and Roberts (2018) 這篇文章的介紹。
6 結語
下圖高度概括了 Linnainmaa and Roberts (2018) 的結果:78% 的異象在樣本外失效了,它們在樣本內的好結果似乎只能是來自 data snooping 這一種解釋。用一句話來表達 Linnainmaa and Roberts (2018) 所傳達的資訊那就是: 找到一個真正在樣本內、外均有效的因子(異象)其實是非常困難的。

當很多人都在使用同樣的資料來分析大量不同的指標時,最終被髮表在頂級期刊上的那些異象註定是在樣本內表現非常優秀的。
這就好比把 300+ 因子(甚至 1000+ 或更多)分成 10+ 大類,然後一個一個的試,再把挑出來最好的十幾個在組合在一起通過什麼 ICIR 動態選股,那在樣本內的淨值恐怕不上天比上天還難。但是樣本外呢?
即便學者們試圖從未知風險和定價錯誤去解釋這些異象,但它們背後仍然存在著嚴重的 publication bias 以及 data snooping bias。Linnainmaa and Roberts (2018) 指出,對於這些 biases,以提高 t-statistic 閾值為目標的統計調整方法(如 Harvey et al. 2016)由於針對的仍然是樣本內資料,因此作用有限; 最有效的方法仍然是使用樣本外的全新資料進行檢驗。 Harvey et al. (2016) 也指出:
When feasible, out-of-sample testing is the cleanest way to rule out spurious factors.
譯:在條件允許下,使用樣本外資料檢驗是排除虛假因子的最好辦法。
在這方面,Linnainmaa and Roberts (2018) 整理了 1963 年以前美股的財務資料,供學術界和業界使用,可謂貢獻巨大。
2011 年,John Cochrane 教授在美國金融協會主席演講時 調侃 道(Cochrane 2011):
We thought 100% of the cross-sectional variation in expected returns came from the CAPM, now we think that's about zero and a zoo of new factors describes the cross section.
譯:我們曾認為股票預期收益率的截面差異全部來自資本資產定價模型(CAPM);如今我們認為能被 CAPM 解釋的部分約為零,取而代之的是我們有了一攬子全新的描述截面預期收益率的因子。
這就是“因子挖掘界”的現狀,多少有些令人無奈。 但至少(海外)學術界和業界已經意識到了這一點並已經開始採取行動 —— 使用更嚴謹的統計手段和更多的資料來檢驗因子。 對於不依賴於會計資料的因子(比如動量因子),回測資料的可得性要高的多,可以跨市場、跨時空來檢驗;對於依賴於會計資料的因子,相信 Linnainmaa 和 Roberts 兩位教授構建的全新樣本外資料會在未來發揮更大的作用。
雖然越來越多的分析指出 data snooping 的問題很嚴峻,但我們也無需過度悲觀。在研究股票預期收益率截面差異的道路上,所有這些努力都不會白費。
參考文獻
- Abarbanell, J. S. and B. J. Bushee (1998). Abnormal returns to a fundamental analysis strategy. The Accounting Review , Vol. 73(1), 19 – 45.
- Alwathainani, A. M. (2009). Consistency of firms' past financial performance measures and future returns. British Accounting Review , Vol. 41, 184 – 196.
- Asness, C. S., A. Frazzini, and L. H. Pedersen (2013). Quality minus junk. AQR Capital Management working paper.
- Barbee, Jr., W. C., S. Mukherji, and G. A. Raines (1996). Do sales-price and debt-equity explain stock returns better than book-market and firm size? Financial Analysts Journal , Vol. 52(2), 56 – 60.
- Bartov, E. and M. Kim (2004). Risk, mispricing, and value investing. Review of Quantitative Finance and Accounting , Vol. 23(4), 353 – 376.
- Basu, S. (1977). Investment performance of common stocks in relation to their price-earnings ratios: A test of the efficient market hypothesis. Journal of Finance , Vol. 32(3), 663 – 682.
- Bhandari, L. C. (1988). Debt/equity ratio and expected common stock returns: Empirical evidence. Journal of Finance , Vol. 43(2), 507 – 528.
- Bradshaw, M. T., S. A. Richardson, and R. G. Sloan (2006). The relation between corporate financing activities, analysts' forecasts and stock returns. Journal of Accounting and Economics , Vol. 42(1-2), 53 – 85.
- Campbell, J. Y., J. Hilscher, and J. Szilagyi (2008). In search of distress risk. Journal of Finance , Vol. 63(6), 2899 – 2939.
- Cooper, M. J., H. Gulen, and M. J. Schill (2008). Asset growth and the cross-section of stock returns. Journal of Finance , Vol. 63(4), 1609 – 1651.
- Cochrane, J. H. (2011). Presidential address: Discount rates. Journal of Finance , Vol. 66(4), 1047 – 1108.
- Daniel, K. and S. Titman (2006). Market reactions to tangible and intangible information. Journal of Finance , Vol. 61(4), 1605 – 1643.
- Dichev, I. A. (1998). Is the risk of bankruptcy a systematic risk? Journal of Finance , Vol. 53(3), 1131 – 1147.
- Fama, E. F. and K. R. French (1992). The cross-section of expected stock returns. Journal of Finance , Vol. 47(2), 427 – 465.
- Fama, E. F. and K. R. French (2015). A Five-Factor Asset Pricing Model. Journal of Financial Economics , Vol. 116(1), 1 – 22.
- Harvey, C. R. (2017). Presidential Address: the scientific outlook in financial economics. Journal of Finance , Vol. 72(4), 1399 – 1440.
- Harvey, C. R., Y. Liu, and H. Zhu (2016). … and the cross-section of expected returns. Review of Financial Studies , Vol. 29(1), 5 – 68.
- Haugen, R. A. and N. L. Baker (1996). Commonality in the determinants of expected stock returns. Journal of Financial Economics , Vol. 41(3), 401 – 439.
- Hirshleifer, D., K. Hou, S. H. Teoh, and Y. Zhang (2004). Do investors overvalue firms with bloated balance sheets? Journal of Accounting and Economics , Vol. 38, 297 – 331.
- Hou, K., C. Xue, and L. Zhang (2015). Digesting anomalies: An investment approach. Review of Financial Studies , Vol. 28(3), 650 – 705.
- Lakonishok, J., A. Shleifer, and R. Vishny (1994). Contrarian investment, extrapolation and investment risk. Journal of Finance , Vol. 49(5), 1541 – 1578.
- Linnainmaa, J. T. and M. R. Roberts (2018). The history of the cross-section of stock returns. Review of Financial Studies , Vol. 31(7), 2606 – 2649.
- Lo, A. W. and A. C. MacKinlay (1990). Data-snooping biases in tests of financial asset pricing models. Review of Financial Studies , Vol. 3(3), 431 – 467.
- Lockwood, L. and W. Prombutr (2010). Sustainable growth and stock returns. Journal of Financial Research , Vol. 33(4), 519 – 538.
- Loughran, T. and J. W. Wellman (2011). New evidence on the relation between the enterprise multiple and average stock returns. Journal of Financial and Quantitative Analysis , Vol. 46(6), 1629 – 1650.
- Lyandres, E., L. Sun, and L. Zhang (2008). The new issues puzzle: Testing the investment-based explanation. Review of Financial Studies , Vol. 21(6), 2825 – 2855.
- McLean, R. D. and J. Pontiff (2016). Does academic research destroy stock return predictability? Journal of Finance , Vol. 71(1), 5 – 32.
- Novy-Marx, R. (2013). The other side of value: The gross profitability premium. Journal of Financial Economics , Vol. 108 (1), 1 – 28.
- Piotroski, J. D. (2000). Value investing: The use of historical financial statement information to separate winners from losers. Journal of Accounting Research , Vol. 38, 1 – 41.
- Pontiff, J. and A. Woodgate (2008). Share issuance and cross-sectional returns. Journal of Finance , Vol. 63(2), 921 – 945.
- Sloan, R. G. (1996). Do stock prices fully reflect information in accruals and cash flows about future earnings? The Accounting Review , Vol. 71(3), 289 – 315.
- Soliman, M. T. (2008). The use of DuPont analysis by market participants. The Accounting Review , Vol. 83(3), 823 – 853.
- Spiess, D. K. and J. Affleck-Graves (1999). The long-run performance of stock returns following debt offerings. Journal of Financial Economics , Vol. 54(1), 45 – 73.
- Thomas, J. K. and H. Zhang (2002). Inventory changes and future returns. Review of Accounting Studies , Vol. 7(2), 163 – 187.
- Titman, S., K. C. J. Wei, and F. Xie (2004). Capital investments and stock returns. Journal of Financial and Quantitative Analysis , Vol. 39(4), 677 – 700.
- Xing, Y. (2008). Interpreting the value effect through the q-theory: An empirical investigation. Review of Financial Studies , Vol. 21(4), 1767 – 1795.
原創不易,請保護版權。如需轉載,請聯絡獲得授權,並註明出處,謝謝。已委託“維權騎士”( 維權騎士_免費版權監測/版權保護/版權分發 ) 為進行維權行動。