解釋股票截面預期收益差異的獨立因子

發(fā)布時間：2018-12-12 | 來源: 川總寫量化

作者：石川

摘要：Green, Hand and Zhang (2017) 通過 Fama-MacBeth 回歸同時檢驗了 94 個因子，發(fā)現(xiàn)其中 12 個是顯著的。

1 引言

在發(fā)表偏差（publication bias）的驅使下，多重檢驗（multiple testing）已經(jīng)成為學術界在進行 asset pricing 時的普遍做法。然而，很多發(fā)表于頂級期刊的所謂能夠解釋股票截面預期收益差異的因子都是虛假發(fā)現(xiàn)（見《出色不如走運(II)?》）。針對這個問題，2011 年，前美國金融協(xié)會主席 John Cochrane 教授在主席演講中向學術界提出挑戰(zhàn) —— 到底哪些因子能獨立解釋股票預期收益截面差異？

2017 年，一篇發(fā)表于頂刊 Review of Financial Studies 上的文章通過使用 Fama-MacBeth Regression （Fama and MacBeth 1973）同時檢驗 94 個學術界發(fā)表的異象回答了這個問題（Green, Hand and Zhang 2017，下文記為 GHZ）。

事實上，這并不是學術界就此問題的唯一嘗試。比如，Harvey and Liu (2018) 提出了一個基于回歸的框架來排除運氣的成分以便檢驗真正有效的因子。不過 Harvey and Liu (2018) 這篇文章的核心內容是介紹他們提出的方法而非實證結果。而 GHZ 的研究指出了美股上真正有效的因子，具有更高的實證價值。無論是這些因子還是 GHZ 使用的方法對 A 股都有不小的借鑒意義。本文就來介紹 GHZ 這篇論文。

2 數(shù)據(jù)和因子

在研究中，GHZ 利用了 CRSP，Compustat 以及 I/B/E/S 數(shù)據(jù)庫的數(shù)據(jù)首先挑選出了 102 個因子，回測時間是 1980 年 1 月到 2014 年 12 月，頻率為月頻?；販y期之所以從 1980 年開始是由上市公司基本面數(shù)據(jù)的可得性決定的；同時包含 NYSE、AMEX 以及 NASDAQ 的上市公司。除此之外，GHZ 的特別之處是考慮了微小市值公司對評價因子有效性時的影響。為此，他們將所有股票根據(jù)市值分成三擋：

1. 市值超過中位數(shù)的股票為大市值組；

2. 市值在中位數(shù)和 20% 分位數(shù)之間的為小市值組；

3. 市值在 20% 分位數(shù)之下的為微小市值（microcap）組。

微小市值的這些股票的市值之和僅占所有股票總市值的 3%。為了避免回歸分析時對它們過度加權，GHZ 采取了兩種回歸方法：

1. 對所有股票采用市值加權最小二乘法（VWLS）；

2. 對前兩組的股票（即所有股票中排除微小市值組）采取普通最小二乘法（OLS）。

作者認為上述兩種方法能夠更合理的找到有效因子，并通過合并這兩種回歸的結果確定最終的顯著因子。作為比較 —— 同時也是為了說明過度加權微小市值股票的危害 —— GHZ 也同樣對所有的股票進行了 OLS 回歸。不出意外，由于微小市值股票存在造成的偏誤，這種方法能夠發(fā)現(xiàn)更多的“有效”因子，但很多因子在非微小市值股票上并不顯著。

在進行多因子同時回歸時，因子間的共線性是必須考慮的問題。共線性會造成因子收益率標準誤（standard error）的巨大誤差，從而無法有效的評價因子是否顯著（見《為什么要進行因子正交化處理?》）。GHZ 使用 variance inflation factors（VIF）對因子進行了初步篩選，并剔除了 8 個 VIF 高于 7 的因子（下圖），最終從 102 個因子中選出了 94 個待評價的因子。這 94 個因子的平均相關系數(shù)為 0.07。

同時檢驗 94 個因子屬于 multiple testing 的問題。為避免過擬合，GHZ 對回歸分析得到的單個因子 p-value 進行了以控制 false discovery rate為目標的調整，具體使用的方法為 BHY 修正（Benjamini and Yekutieli 2001，見《出色不如走運(II)?》）。GHZ 以調整后的 p-value 小于 0.05 作為因子顯著的準則。

除了調整后的 p-value 之外，GHZ 也同時計算了每個因子的 t-statistic。Harvey et al. (2016) 指出由于 multiple testing 的問題，單個因子的 t-statistic（的絕對值）至少要大于 3 才可能顯著。GHZ 也以此為顯著性準則匯報了顯著性因子的個數(shù)。該準則比調整后 p-value 小于 0.05 要弱一些，因此找到了更多的因子。

下面就來看看實證結果。

3 單個因子檢驗

在同時對 94 個因子進行檢驗之前，GHZ 首先對每個因子進行了單獨檢驗。作者這么做的目的是希望通過單獨檢驗和共同檢驗分別找出顯著性的因子，以此比較這兩種方法找到的因子是否一致，這可能會對未來的 asset pricing 研究帶來一些啟發(fā)和靈感。在單個因子檢驗中，截面回歸方程的左側是個股的收益率，右側是目標因子和其他控制變量。根據(jù)有無控制變量，單個因子的檢驗一共有以下四個版本：

1. 僅有單個目標因子，無其他控制變量；

2. 除了單個目標因子外，還包括四因子模型（Fama and French 1993 的三因子 + Carhart 1997 的動量因子）；

3. 除了單個目標因子外，還包括 Fama-French 五因子模型（Fama and French 2015）;

4. 除了單個目標因子外，還包括 Hou et al. (2015) 的因子模型。

對每一個版本，通過在每期用因子暴露和下一期的個股收益率截面回歸得到因子收益率，然后使用因子收益率的時序對因子顯著性進行分析，計算得到調整后的 p-value 以及 t-statistic，使用 p-value 是否小于 0.05 或 t-statistic 絕對值是否大于 3.0 為基準決定真正顯著的獨立因子。在回歸時，考慮了本文前一節(jié)提到的三種方法 —— 對所有股票進行 VWLS，對非微小市值股票進行 OLS，以及（作為“反面教材”的）對所有股票進行 OLS。為了方便在下文中介紹結果，將前兩種回歸稱為 GHZ 回歸。

單個因子檢驗的結果如下（由于 94 個因子太多，故節(jié)選部分）：

上圖中最重要的部分是紅色標記的地方 —— 即使用調整后 p-value 小于 0.05 為基準確定的顯著因子個數(shù)。在沒有控制變量的模型中（column A），GHZ 回歸一共找到了 12 個顯著因子；作為對比，由于微小市值股票的影響，對所有股票的 OLS 回歸發(fā)現(xiàn)了 30 個顯著因子。這說明 18 個因子在非微小市值股票上是無效的。其他帶控制變量的回歸（columns B to D）也有類似的結果。

在沒有控制變量的模型中，通過單個因子回歸分析發(fā)現(xiàn)的顯著因子包括：

1. 總資產增長率（asset growth）；

2. 經(jīng)行業(yè)調整的銷售收入增長率（growth in industry-adjusted sales）；

3. 流通股本變動百分比（growth in shares outstanding）；

4. 存貨變動（growth in inventory）；

5. 盈余公告宣告收益（earnings announcement return）；

6. 賬面價值增長率（growth in book value of equity）；

7. 資本支出增長率（growth in CAPEX）；

8. 長期凈營運資產增長率（growth in long-term net operating assets）；

9. 機器設備廠房存貨增長率（growth in PP&E plus inventory）；

10. 盈利同比增長的季度數(shù)（number of consecutive quarters with earnings higher than the same quarter a year ago）；

11. 銷售收入與存貨差的增長率（growth in sales less growth in inventory）；

12. 標準化的未預期盈余（standardized unexpected quarterly earnings）。

以上通過單個檢驗從 94 個發(fā)表于學術期刊的顯著因子中選出了 12 個，這些因子是經(jīng)過 multiple testing 調整后仍然有效的。下面就來看看對這 94 個因子同時回歸會得到怎樣的結果。

4 多個因子共同檢驗

在共同檢驗時，GHZ 將所有 94 個因子同時放入回歸方程的右側，進行 Fama-MacBeth regression。和上一節(jié)一樣，仍然使用三種回歸方法。結果（節(jié)選）如下：

根據(jù) p-value 基準，在對所有股票進行 VWLS 時，一共發(fā)現(xiàn)了 6 個顯著因子；在對非微小市值股票進行 OLS 回歸時，一共發(fā)現(xiàn)了 9 個顯著因子。將這兩個回歸的結果合并一共得到 12 個顯著因子。與之相對應的是，在對所有股票進行 OLS 回歸時，由于微小市值的影響，一共發(fā)現(xiàn)了 23 個顯著因子。把 94 個因子共同檢驗也發(fā)現(xiàn)了 12 個顯著因子，它們是：

1. 賬面市值比（book-to-market）；

2. 現(xiàn)金（cash）；

3. 分析師數(shù)量的變化（change in the number of analysts）；

4. 盈余公告宣告收益（earnings announcement return）；

5. 一個月的動量（1-month momentum）；

6. 六個月動量的變化（change in 6-month momentum）；

7. 盈利同比增長的季度數(shù)量（number of consecutive quarters with earnings higher than the same quarter in a year ago）；

8. 年度研發(fā)支出占市值的比重（annual R&D to market cap）；

9. 收益波動性（return volatility）；

10. 股票換手率（share turnover）；

11. 股票換手率的波動性（volatility of share turnover）；

12. 零交易的天數(shù)（zero trading days）。

雖然上一節(jié)的單一因子檢驗和本節(jié)的共同檢驗碰巧都發(fā)現(xiàn)了 12 個因子，但是仔細比較不難看出兩種方法找到的顯著因子中大部分并不相同。根據(jù) McLean and Pontiff (2016) 對因子分類的定義，在單一因子檢驗中，10 個顯著的因子都是基本面因子；而在共同檢驗時，僅有盈利同比增長的季度數(shù)量屬于基本面因子，剩余更多的是交易行為因子。

上述兩種檢驗結果為今后的 asset pricing 傳遞出兩個重要信息：

1. 在排除了微小市值對回歸造成的偏誤以及修正了多重檢驗的數(shù)據(jù)挖掘之后，真正顯著的因子個數(shù)很少；

2. 在 asset pricing 的研究中，在分析一個潛在異象時，應該選擇共同檢驗發(fā)現(xiàn)的這些顯著因子作為控制變量來進行研究。

5 樣本外投資組合收益率分析

在前兩節(jié)的研究中，這些顯著的因子是在整個回測期（1980 到 2014）期間發(fā)現(xiàn)的。它們也許對 asset pricing 有幫助，但是上述結果無法說明它們在實戰(zhàn)中是否有交易的價值 —— 我們不能回到過去交易這些在事后被證明有效的因子。

為了研究它們在交易中是否能夠帶來超額收益，GHZ 采用了滾動窗口使用因子選股并在樣本外構建投資組合的方法。樣本外滾動測試使用過去 10 年（120 個月）的數(shù)據(jù)來回歸，因此從 1990 年開始。在選股時，由于同時考慮了多個因子，因此使用因子收益率來預測個股在下一期的收益率，并使用預期收益率的高低構建多空對沖的投資組合（做多預期收益率最高的 10%、做空預期收益率最低的 10%）。實證中一共考察了三種不同的投資組合（三個組合的區(qū)別是對小市值股票的權重依次提升）。當使用全部 94 個因子進行滾動回歸時，不同投資組合的收益率如下圖所示。隨著小市值比重的增加，投資組合的收益率逐漸增大。

如果不使用全部 94 個因子，而僅僅使用 GHZ 通過共同檢驗找出的 12 個獨立因子會怎樣呢？下圖給出了答案。

可以很明顯的看到，僅僅使用 12 個獨立因子顯著降低了投資組合的收益率。這意味著我們好不容易辛辛苦苦找出了 12 個對解釋 asset pricing 有效的獨立因子，但是從實戰(zhàn)選股的角度來說，這卻不如使用全部 94 個因子 —— 不管它們是不是過擬合。如何解釋這種現(xiàn)象呢？GHZ 這篇文章并沒有對此進行過多的討論。就我的理解，上述結果說明了兩點：

1. 這 12 個因子在整個回測期內顯著；當使用滾動窗口時，不同的因子可能在不同歷史時期顯著，因此使用 94 個因子能夠更好的捕捉因子風格的輪動。

2. 實盤交易的目標是為了獲得超額收益，而不是理解 asset pricing 的機制。對于選股模型來說，最核心的是對未來收益率的預測是否準確，而非因子的收益率估計是否無偏。上面的結果說明使用更多的因子提高了樣本外收益率預測的準確性。

有必要指出的是，上面的實證結果并沒有考慮實際交易中的手續(xù)費等問題，且同時使用 94 個因子一定存在過擬合的問題。因此，雖然數(shù)據(jù)顯示 94 個因子比 12 個因子的效果更好，這也不意味著我們在實際交易中一定能取得顯著的優(yōu)勢。

6 2003 前后的差異

GHZ 這篇文章研究的最后一個部分發(fā)現(xiàn)因子在 2003 年前后截然不同的表現(xiàn) —— 因子對截面收益率差異的解釋力度驟然下降。上一節(jié)提到的三個樣本外投資組合的收益率在 2003 年前后的表現(xiàn)如下圖所示，前后出現(xiàn)了明顯的差異。這些投資組合的凈值曲線在 2003 年之后變得更加平坦。

在 2003 年之后，僅僅有 2 個因子仍然顯著，它們分別為盈利同比增長的季度數(shù)量以及經(jīng)行業(yè)調整后的員工數(shù)。究其原因，GHZ 認為在 2003 年之后，美股上的套利成本大幅降低造成了這種現(xiàn)象。2002 年 7 月，美國股市通過了 Sarbanes-Oxley 法案；同年 10 月，SEC 加速了對上市公司披露 10-Q 和 10-K 文件的要求。與此同時，在 2003 年初（1 月到 5 月），紐交所引入自動報價系統(tǒng)，減少了交易的摩擦成本。這一系列變化極大降低了交易股票市場異象的量化對沖策略的成本和技術難度。無疑，2003 年前后的差異對于今后研究提出了挑戰(zhàn)。GHZ 也呼吁今后 asset pricing 的研究應該給予 2003 年之后的數(shù)據(jù)更多的權重。

7 結語

研究因子時最艱難的部分往往是數(shù)據(jù)的準備。一旦有了高質量的數(shù)據(jù)，各種用于檢驗的回歸及其他統(tǒng)計手段是非常豐富的。作為一篇同時研究 94 個因子的文章，GHZ 的一個巨大貢獻在于因子數(shù)據(jù)的計算，以及為了計算因子而對公司基本面和交易數(shù)據(jù)的收集、整理。此外，GHZ 在截面回歸中用個股的收益率和這 94 個因子進行回歸，可以想見計算量之巨大。這和 Harvey and Liu (2018) 中給出的簡單例子完全不同。簡單總結一下這篇文章給多因子投資實務的啟發(fā)：

1. 分析時應排除過度加權微小市值股票造成的偏差；

2. 真正顯著的因子很少，絕大部分其他因子都是數(shù)據(jù)挖掘的產物、或者能夠被這一小部分獨立因子解釋；

3. 共同檢驗和單一檢驗發(fā)現(xiàn)的顯著因子往往不同，前者的發(fā)現(xiàn)更有效；

4. 因子投資和資產定價的目標不同；前者是為了提高樣本外預測的準確性，后者是為了確保因子收益率的無偏估計；在投資實務中，更應該注重前者，但也要考慮實際的交易限制和成本。

GHZ 通過同時回歸找到的 12 個因子雖然是針對美股，但很多在 A 股上也是有效的。此外，GHZ 使用多個因子同時進行 Fama-MacBeth regression 的做法和 Barra 如出一轍。今后的研究會使用 Barra 中國股票模型中的風格因子進行類似的實證，檢驗不同因子在 A 股上的顯著性，希望以此更好的指導我們在 A 股上實踐因子投資。

參考文獻

Benjamini, Y. and D. Yekutieli (2001). The control of the false discovery rate in multiple testing under dependency.?Annals of Statistics 29, 1165 – 1188.

Carhart, M. M. (1997). On persistence in mutual fund performance. Journal of Finance 52(1), 57 – 82.

Cochrane, J. H. (2011). Presidential address: Discount rates.?Journal of Finance 66(4), 1047 – 1108.

Fama, E. F. and K. R. French (1993). Common risk factors in the returns on stocks and bonds. Journal of Financial Economics 33(1), 3 – 56.

Fama, E. F. and K. R. French (2015). A five-factor asset pricing model. Journal of Financial Economics 116(1), 1 – 22.

Fama, E. F. and J. D. MacBeth (1973). Risk, return, and equilibrium: Empirical tests. Journal of Political Economy 81(3), 607 – 636.

Harvey, C. R., Y. Liu, and H. Zhu (2016). … and the cross-section of expected returns. Review of Financial Studies 29(1), 5 – 68.

Harvey, C. R. and Y. Liu (2018). Lucky Factors. Working paper.

Hou, K., C. Xue, and L. Zhang (2015). Digesting anomalies: An investment approach. Review of Financial Studies 28(3), 650 – 705.

Green, J., J. R. M. Hand, and X. F. Zhang (2017). The characteristics that provide independent information about average U.S. monthly stock returns. Review of Financial Studies 30(12), 4389 – 4436.

McLean, R.D., J. Pontiff. (2016). Does academic research destroy stock return predictability? Journal of Finance 71(1), 5–32.

免責聲明：入市有風險，投資需謹慎。在任何情況下，本文的內容、信息及數(shù)據(jù)或所表述的意見并不構成對任何人的投資建議。在任何情況下，本文作者及所屬機構不對任何人因使用本文的任何內容所引致的任何損失負任何責任。除特別說明外，文中圖表均直接或間接來自于相應論文，僅為介紹之用，版權歸原作者和期刊所有。

亚洲精品国产精品制服丝袜,亚洲欧美日韩精品a∨,97在线热免费视频精品视频,亚洲人成在线观看网站不卡

合格投資者聲明

解釋股票截面預期收益差異的獨立因子