Cross-Section Research, A History

發(fā)布時(shí)間：2021-05-09 | 來源: 川總寫量化

作者：石川

摘要：從 CAPM 到機(jī)器學(xué)習(xí)下的新范式，本文簡(jiǎn)要梳理關(guān)于資產(chǎn)預(yù)期收益截面差異的研究路徑。

Cross-section research（即研究不同資產(chǎn)預(yù)期收益的截面差異）的發(fā)端要追溯到上世紀(jì) 60 年代。在那之前，人們對(duì)于風(fēng)險(xiǎn)、預(yù)期收益以及二者的關(guān)系并無清晰的認(rèn)識(shí)。而金融學(xué)無論是理論還是實(shí)證都處于萌芽階段 —— 理論方面，尚無關(guān)于 cross-section 的模型；實(shí)證方面，尚無高質(zhì)量的數(shù)據(jù)，且計(jì)算機(jī)算力也十分有限。

一切都處于無序之中。直到 60 年代，Treynor (1962)，Sharpe (1964)，Lintner (1965) 以及 Mossin (1966) 分別獨(dú)立提出了資本資產(chǎn)定價(jià)模型（CAPM）[1]，它是關(guān)于資產(chǎn)預(yù)期收益截面差異的第一個(gè)模型：

$\mbox{E}[R_i]-R_f=\beta_i(\mbox{E}[R_M]-R_f)$

CAPM 模型非常優(yōu)雅，背后的金融學(xué)理論也很容易被人接受。Eugene Fama 曾對(duì)其高度評(píng)價(jià)：The arrival of the CAPM was like the time after a thunderstorm, when the air suddenly clears.??根據(jù)資產(chǎn)定價(jià)理論，隨機(jī)折現(xiàn)因子 SDF 和 mean-variance efficient portfolio 是等價(jià)的[2]。因此 CAPM 的隱含假設(shè)就是市場(chǎng)組合是 mean-variance efficient portfolio。如果這個(gè)假設(shè)成立，那么市場(chǎng)組合就可以給其他任意資產(chǎn)定價(jià)。

然而，理想很豐滿，現(xiàn)實(shí)很骨感。CAPM 被統(tǒng)計(jì)檢驗(yàn)拒絕了 —— 資產(chǎn)的預(yù)期收益并不和它們對(duì)市場(chǎng)組合的?? $\beta$ ?大小成正比。在早期的檢驗(yàn)中，最具代表性的要數(shù) Black, Jensen and Scholes (1972)。?該文發(fā)現(xiàn)股票的超額收益?? $\alpha$ ?和市場(chǎng)?? $\beta$ ?負(fù)相關(guān)。在這個(gè)基礎(chǔ)上，他們提出了一個(gè)雙因子模型；新模型中的第二個(gè)因子稱為 zero-beta 因子：

$\mbox{E}[R_i]=(1-\beta_i)\mbox{E}[R_z]+\beta_i\mbox{E}[R_M]$

除此之外，在上世紀(jì) 80 年代前后，學(xué)者們陸續(xù)發(fā)現(xiàn)按照某種風(fēng)格“打包”的股票能夠戰(zhàn)勝市場(chǎng)。這其中最值得一提的是 Basu (1977) 發(fā)現(xiàn)的 EP 效應(yīng)和 Banz (1981) 發(fā)現(xiàn)的小市值效應(yīng)。它們均無法被 CAPM 解釋，因而也被稱為異象（anomalies）。面對(duì)諸多無法被 CAPM 解釋的異象，cross-section research 再一次陷入了無序之中。

直到 Fama and French (1993)。觀察到價(jià)值和規(guī)模有助于解釋股票預(yù)期收益的差異，F(xiàn)ama and French (1993) 在 CAPM 的基礎(chǔ)上加入了 HML 和 SMB 兩個(gè)因子，提出了三因子（FF3）模型：

$\mbox{E}[R_i^e]=\beta_i(\mbox{E}[R_M]-R_f)+h_i\mbox{E}[R_{HML}]+s_i\mbox{E}[R_{SMB}]$

這篇文章以及它的“姊妹篇”Fama and French (1996) 拉開使用多因子模型進(jìn)行實(shí)證資產(chǎn)定價(jià)研究的序幕。如果說 Fama and French (1993) 僅僅是使用三因子對(duì)同樣通過 size 和 BM 雙重排序構(gòu)造的 25 個(gè) portfolios 定價(jià)，因而難以令人信服，那么 Fama and French (1996) 則是利用三因子模型對(duì)其他 CAPM 無法解釋的異象定價(jià)，例如通過 EP、CP 和 five-year sales 等構(gòu)造的 portfolios，一舉奠定了 FF3 的地位。

自此，F(xiàn)F3 扛過了 CAPM 的大旗，成為了最家喻戶曉的多因子定價(jià)模型。當(dāng)然，這也讓它成為眾矢之的，各路學(xué)者紛紛研究能夠拒絕 FF3 的異象。作為第一個(gè)實(shí)證多因子模型，F(xiàn)F3 能夠解釋的異象注定有限。在諸多異象之中，最令 FF3 尷尬的當(dāng)屬 Eugene Fama 自己的學(xué)生 Carhart 提出的動(dòng)量（Carhart 1997）。Fama 對(duì)動(dòng)量的評(píng)價(jià)是：The premier anomaly is momentum.?然而，動(dòng)量?jī)H僅是開始，遠(yuǎn)不是結(jié)束。在過去二十多年中，以 FF3 為基準(zhǔn)，學(xué)術(shù)界提出了成百上千個(gè)形形色色的異象，構(gòu)成了 zoo of anomalies（也就是 John Cochrane 口中的 zoo of factors）。造成這一現(xiàn)象的，主要有兩個(gè)原因。第一個(gè)是 FF3 本身的定價(jià)能力有限，但學(xué)術(shù)界總以異象能夠獲得 FF3 無法解釋的超額收益為提出異象的標(biāo)準(zhǔn)；第二個(gè)原因則是如今已經(jīng)家喻戶曉的 publication bias 導(dǎo)致的 p-hacking（Harvey 2017）[3]。對(duì)于后者，Harvey, Liu and Zhu (2016) 則呼吁研究異象時(shí)考慮多重假設(shè)檢驗(yàn)問題，并將代表顯著性的 t-statistic 的閾值從傳統(tǒng)的 2.0 提升到了 3.0+。

出于上述兩個(gè)原因，大量所謂的異象僅僅是樣本內(nèi)虛假的產(chǎn)物。而學(xué)者們以獲得更高 t-statistic 為目標(biāo)進(jìn)行的各種對(duì)數(shù)據(jù)的“精細(xì)處理”（data snooping）也加劇了這一問題。在一項(xiàng)聽上去 mission impossible 的研究中，Hou, Xue and Zhang (2020) 驚人的復(fù)現(xiàn)了 452 個(gè)學(xué)術(shù)界提出的異象。利用他們的樣本數(shù)據(jù)，其中 62% 個(gè)異象的 t-statistic 不足1.96；如果換成 2.78 的閾值，則有 82% 的異象不再顯著。這些實(shí)證結(jié)果足以說明 p-hacking 問題的嚴(yán)重性，同時(shí)也為 Harvey, Liu and Zhu (2016) 的觀點(diǎn)提供了依據(jù)：Most claimed research findings in financial economics are likely false.

此外，Linnainmaa and Roberts (2018) 花費(fèi)了很大的經(jīng)歷構(gòu)建了全新的樣本外數(shù)據(jù)，并通過它們檢驗(yàn)了源于會(huì)計(jì)數(shù)據(jù)的 36 個(gè)異象。實(shí)證結(jié)果表明，絕大部分異象在樣本外失效，因而它們僅是 data snooping 的產(chǎn)物。盡管 replication crisis 是學(xué)術(shù)界目前的共識(shí)，但一項(xiàng)來自 AQR 的最新研究卻提出了不同的看法：Jensen, Kelly and Pedersen (2021) 認(rèn)為大量的異象是可以被復(fù)現(xiàn)的。面對(duì)諸多異象和構(gòu)造異象的變量（firm characteristics），John Cochrane 在 AFA 主席演講中提出了三個(gè)至關(guān)重要的問題（Cochrane 2011）：

1. 哪些 characteristics 對(duì)解釋預(yù)期收益提供了增量信息？

2. 異象變量是否可以被用來構(gòu)造一個(gè)新的因子來解釋其他資產(chǎn)？

3. 到底有多少因子是重要的？

其中第一個(gè)問題是針對(duì)這樣一個(gè)現(xiàn)象，即一篇學(xué)術(shù)論文通常只報(bào)告一個(gè)異象。由于諸多 firm characteristics 是相關(guān)的，因此哪怕確實(shí)存在異象，其中大部分可能都是相似的，唯有在控制了其它變量之后依然能對(duì)解釋預(yù)期收益起作用的才是有用的。為此，Green, Hand and Zhang (2017) 使用 Fama and MacBeth (1973) regression 同時(shí)檢驗(yàn)了 94 個(gè)異象，發(fā)現(xiàn)有用的變量少之又少[4]。不管怎樣，上述諸多實(shí)證結(jié)果訴說著一個(gè)事實(shí)，即確實(shí)存在 FF3 無法解釋的異象。學(xué)術(shù)界關(guān)于 cross-section 的研究又一次陷入了無序。

FF3 定價(jià)能力有限加之其無法解釋的異象確實(shí)存在，學(xué)術(shù)界又一次站在了研究的十字路口。不過這一次的解決辦法遠(yuǎn)不如 CAPM 被提出時(shí)的劃時(shí)代和 FF3 被提出時(shí)的開創(chuàng)性，而是出奇的 straightforward —— 提出新的多因子模型，以能解釋更多的異象為目標(biāo)。自 2010 年之后，學(xué)術(shù)界先后針對(duì)美股提出了至少 5 個(gè)主流多因子模型。再加上 FF3 和 Carhart (1997)，一共有至少 7 個(gè)多因子模型[5]。

在最近十年的實(shí)證研究中，雖然不同的檢驗(yàn)方法被陸續(xù)提出，但評(píng)價(jià)這些多因子模型的核心依然是看誰能夠解釋更多的異象，或者誰的因子能構(gòu)造出夏普率最高的 tangency portfolio。隨著因子個(gè)數(shù)或者構(gòu)造因子所使用的變量個(gè)數(shù)的增多，新提出的模型通常在樣本內(nèi)能夠解釋更多的異象。

綜合最近三年的實(shí)證結(jié)果，某些多因子模型確實(shí)“優(yōu)于”其他模型。然而，實(shí)證研究中的一些問題卻又給轟轟烈烈的因子模型大戰(zhàn)按下了暫停鍵。比如，有些模型能夠解釋其他異象，卻無法解釋構(gòu)造自己因子的 basis portfolios；有些模型中因子高的驚人的預(yù)期收益是以高換手率為代價(jià)，對(duì)實(shí)際投資用處很小[6]；有些模型從行為金融學(xué)出發(fā)，天生就無法解釋一些異象……

正當(dāng)學(xué)界還在討論哪個(gè)模型更好，以期建立新基準(zhǔn)時(shí)，F(xiàn)ama and French (2020) 一文則打破了潛在的秩序[7]。上述所有的模型（包括 FF3，F(xiàn)F5）都是靜態(tài)模型（static models），即資產(chǎn)對(duì)于因子的暴露是通過全樣本內(nèi)資產(chǎn)收益率對(duì)因子收益率做時(shí)序回歸得到的，即每個(gè)股票對(duì)每個(gè)因子的暴露在全樣本內(nèi)是不變的。與之對(duì)應(yīng)的，則是另一個(gè)家喻戶曉的模型，即 Barra 模型。Barra 模型直接使用 firm characteristics 做因子暴露，然后每期通過截面回歸計(jì)算當(dāng)期因子的收益率。和靜態(tài)模型相比，像 Barra 這樣采用時(shí)變因子暴露的模型則被稱為動(dòng)態(tài)模型（dynamic models）。

Fama and French (2020) 通過三個(gè)模型，比較了靜態(tài)模型和動(dòng)態(tài)模型的定價(jià)誤差。這三個(gè)模型包括兩個(gè)靜態(tài)模型和一個(gè)動(dòng)態(tài)模型。第一個(gè)靜態(tài)模型就是傳統(tǒng)的 FF5 這種；第二個(gè)靜態(tài)模型是首先使用個(gè)股收益率對(duì) firm characteristics 截面回歸取代 portfolio sort 構(gòu)造 factor mimicking portfolios，然后再通過全樣本時(shí)序回歸估計(jì)因子暴露；動(dòng)態(tài)模型是直接用 firm characteristics 做因子暴露，截面回歸計(jì)算因子收益率。

實(shí)證結(jié)果顯示，以資產(chǎn)定價(jià)誤差來評(píng)判，動(dòng)態(tài)模型的效果最好，其次是第二個(gè)靜態(tài)模型，最后才是傳統(tǒng)的靜態(tài)模型。這意味著（1）使用時(shí)變的 firm characteristics 作為因子暴露比時(shí)序回歸系數(shù)更優(yōu)；（2）截面回歸的因子收益率優(yōu)于通過 portfolio sort 計(jì)算的因子收益率。毫無疑問，F(xiàn)ama and French (2020) 對(duì)傳統(tǒng)的多因子模型提出了巨大的挑戰(zhàn)，而如何得到更好的動(dòng)態(tài)模型就成為了學(xué)術(shù)界關(guān)于 cross-section 研究在當(dāng)下需要解決的難題。

雖然和學(xué)術(shù)界的傳統(tǒng)模型相比，Barra 模型由于考慮了時(shí)變的因子暴露，看上去更先進(jìn)。但是，有必要說明的是，Barra 模型的目標(biāo)是解釋股票收益率時(shí)序波動(dòng)，而非股票預(yù)期收益的截面差異；此外，采用 firm characteristics 直接做因子暴露也是很粗糙的，且模型也可能存在遺漏變量/無關(guān)變量的問題。另一方面，越來越多的研究表明，firm characteristics 和股票收益率之間的關(guān)系是非線性的。而直接使用單個(gè) firm characteristics 作為?? $\beta$ ?無法考慮這種非線性。令問題更加棘手的是，人們并不清楚不同的 firm characteristics 之間有怎樣的交互作用 —— 因此通過遍歷交叉項(xiàng)來考慮是不切實(shí)際的。好消息是，在挖掘非線性關(guān)系方面，機(jī)器學(xué)習(xí)或大有可為。人們急需找到機(jī)器學(xué)習(xí)時(shí)代關(guān)于動(dòng)態(tài)模型的研究范式。

在這里，首先介紹一下 Bryan Kelly（Yale 少壯派教授且擔(dān)任 AQR 的 Head of Machine Learning）對(duì)將機(jī)器學(xué)習(xí)在實(shí)證資產(chǎn)定價(jià)方面的應(yīng)用的看法。Kelly 認(rèn)為，機(jī)器學(xué)習(xí)雖然算法復(fù)雜，但是能夠很好地應(yīng)對(duì)過擬合的問題，且樣本外的結(jié)果非常穩(wěn)健，非常適合于實(shí)證資產(chǎn)定價(jià)。對(duì)于如何應(yīng)用機(jī)器學(xué)習(xí)研究動(dòng)態(tài)模型，Kelly 給出了一個(gè)研究框架，十分精彩：

$R_{i,t+1}^e=\beta(c)_{i,t}^{\prime}F_{t+1}+e_{i,t+1}$

在這個(gè)框架中，因子被視為 latent factors（即不像傳統(tǒng)模型那樣，事先指定價(jià)值、盈利或動(dòng)量等因子），機(jī)器學(xué)習(xí)建模的對(duì)象是資產(chǎn)對(duì)因子的暴露? $\beta$ ?，而? $\beta$ ?是 firm characteristics 的線性或非線性函數(shù)，函數(shù)的具體形式和參數(shù)可以通過機(jī)器學(xué)習(xí)算法，以最小化資產(chǎn)的定價(jià)誤差為目標(biāo)函數(shù)來估計(jì)。一旦知道了? $\beta(c)$ ?，也就同時(shí)得到了因子收益率：

$F_{t+1}=\left(\beta_t^{\prime}\beta_t\right)^{-1}\beta_t^{\prime}R_{t+1}^e$

在這個(gè)研究框架下，Kelly, Pruitt and Su (2019) 和 Gu, Kelly and Xiu (2021) 分別提出了 IPCA（工具變量 PCA）和 autoencoder 算法。前者視? $\beta$ ?為 firm characteristics 的線性函數(shù)；后者則采用 autoencoder 神經(jīng)網(wǎng)絡(luò)，將? $\beta$ ?視作 firm characteristics 的非線性函數(shù)。實(shí)證結(jié)果表明，利用機(jī)器學(xué)習(xí)算法構(gòu)造的動(dòng)態(tài)模型，不僅條件定價(jià)誤差更低，哪怕是非條件定價(jià)誤差（即像 Fama and French (2020) 的第二個(gè)靜態(tài)模型那樣）也比傳統(tǒng)靜態(tài)模型更小。

近年來，學(xué)術(shù)界在利用機(jī)器學(xué)習(xí)進(jìn)行實(shí)證資產(chǎn)定價(jià)方面取得了很多新的進(jìn)展[8]，無論是研究多因子模型，還是研究它的另一面（即 SDF），機(jī)器學(xué)習(xí)均發(fā)揮了巨大的作用。這些研究無疑為 cross-section 打開了全新的大門。寫到這里且又恰逢五月，我想起了 RFS 2020 年五月的特刊 New methods in the cross-section[9]，它所覆蓋的三大趨勢(shì)也和本文的梳理相契合。

回顧過去半個(gè)世紀(jì)的相關(guān)研究，不禁讓人感慨，學(xué)術(shù)研究也許就是這樣，在無序中建立秩序，秩序又被新的問題打破并重新被建立，周而復(fù)始。而我們也在這個(gè)循環(huán)往復(fù)中不斷加深對(duì) cross-section 的理解和認(rèn)知。

最后，一圖勝千言。

備注：

[1] 見《CAPM 的一小段歷史》。

[2] 見《尋找 Mean-Variance Frontier》。

[3] 見《在追逐 p-value 的道路上狂奔，卻在科學(xué)的道路上漸行漸遠(yuǎn)》。

[4] 見《解釋股票截面預(yù)期收益差異的獨(dú)立因子》。

[5] 見《主流多因子模型巡禮》。

[6] 見《Toward a better factor model》。

[7] 見《A new norm?》。

[8] 見《實(shí)證資產(chǎn)定價(jià)理論新進(jìn)展》。

[9] 見《出色不如走運(yùn)(IV)?》。

參考文獻(xiàn)

Banz, R. W. (1981). The relationship between return and market value of common stocks.?Journal of Financial Economics 9(1), 3 – 18.

Basu, S. (1977). Investment performance of common stocks in relation to their price–earnings ratios: A test of the effi-cient market hypothesis.?Journal of Finance 32(3), 663 – 682.

Carhart, M. M. (1997). On persistence in mutual fund performance.?Journal of Finance 52(1), 57 – 82.

Cochrane, J. H. (2011). Presidential address: Discount rates. Journal of Finance 66(4), 1047 – 1108.

Daniel, K. D., D. A. Hirshleifer, and L. Sun (2020). Short- and long-horizon behavioral factors.?Review of Financial Studies 33(4), 1673 – 1736.

Fama, E. F. and K. R. French (1993). Common risk factors in the returns on stocks and bonds.?Journal of Financial Economics?33(1), 3 – 56.

Fama, E. F. and K. R. French (1996). Multifactor explanations of asset pricing anomalies.?Journal of Finance?51(1), 55 – 84.

Fama, E. F. and K. R. French (2015). A five-factor asset pricing model.?Journal of Financial Economics 116(1), 1 – 22.

Fama, E. F. and K. R. French (2020). Comparing cross-section and time-series factor models.?Review of Financial Studies 33(5), 1891 – 1926.

Fama, E. F. and J. D. MacBeth (1973). Risk, return, and equilibrium: Empirical tests.?Journal of Political Economy 81(3), 607 – 636.

Green, J., J. R. M. Hand, and X. F. Zhang (2017). The characteristics that provide independent information about average U.S. monthly stock returns.?Review of Financial Studies 30(12), 4389 – 4436.

Gu, S., B. T. Kelly, and D. Xiu (2021). Autoencoder asset pricing models. Journal of Econometrics 222(1), 429 – 450.

Harvey, C. R. (2017). Presidential Address: The scientific outlook in financial economics.?Journal of Finance 72(4), 1399 – 1440.

Harvey, C. R., Y. Liu, and H. Zhu (2016). … and the cross-section of expected returns.?Review of Financial Studies 29(1), 5 – 68.

Hou, K., C. Xue, and L. Zhang (2015). Digesting anomalies: An investment approach.?Review of Financial Studies 28(3), 650 – 705.

Hou, K., C. Xue, and L. Zhang (2020). Replicating anomalies.?Review of Financial Studies 33(5), 2019 – 2133.

Jensen, T. I., B. T. Kelly, and L. H. Pedersen (2021). Is there a replication crisis in finance? Working paper.

Kelly, B. T., S. Pruitt, and Y. Su (2019). Characteristics are covariances: A unified model of risk and return. Journal of Financial Economics 134(3), 501 – 524.

Linnainmaa, J. T. and M. R. Roberts (2018). The history of the cross-section of stock returns.?Review of Financial Studies 31(7), 2606 – 2649.

Lintner, J. (1965). The valuation of risk assets and the selection of risky investments in stock portfolios and capital budgets.?Review of Economics and Statistics 47, 13 – 37.

Mossin, J. (1966). Equilibrium in a capital asset market.?Econometrica 34(4), 768 – 783.

Novy-Marx, R. (2013). The other side of value: The gross profitability premium.?Journal of Financial Economics 108(1), 1 – 28.

Sharpe, W. F. (1964). Capital asset prices: A theory of market equilibrium under conditions of risk.?Journal of Finance 19(3), 425 – 442.

Stambaugh, R. F. and Y. Yuan (2017). Mispricing factors.?Review of Financial Studies 30(4), 1270 – 1315.

Treynor, J. L. (1962). Toward a theory of market value of risky assets. Unpublished manuscript. “Rough Draft” dated by Treynor to the fall of 1962. A final version was published in 1999, in?Asset Pricing and Portfolio Performance.?R. A. Korajczyk (editor), London: Risk Books, 15 – 22.

免責(zé)聲明：入市有風(fēng)險(xiǎn)，投資需謹(jǐn)慎。在任何情況下，本文的內(nèi)容、信息及數(shù)據(jù)或所表述的意見并不構(gòu)成對(duì)任何人的投資建議。在任何情況下，本文作者及所屬機(jī)構(gòu)不對(duì)任何人因使用本文的任何內(nèi)容所引致的任何損失負(fù)任何責(zé)任。除特別說明外，文中圖表均直接或間接來自于相應(yīng)論文，僅為介紹之用，版權(quán)歸原作者和期刊所有。

亚洲精品国产精品制服丝袜,亚洲欧美日韩精品a∨,97在线热免费视频精品视频,亚洲人成在线观看网站不卡

合格投資者聲明

Cross-Section Research, A History