Cross-Section Research, A History
發(fā)布時(shí)間:2021-05-09 | 來源: 川總寫量化
作者:石川
摘要:從 CAPM 到機(jī)器學(xué)習(xí)下的新范式,本文簡(jiǎn)要梳理關(guān)于資產(chǎn)預(yù)期收益截面差異的研究路徑。
1
Cross-section research(即研究不同資產(chǎn)預(yù)期收益的截面差異)的發(fā)端要追溯到上世紀(jì) 60 年代。在那之前,人們對(duì)于風(fēng)險(xiǎn)、預(yù)期收益以及二者的關(guān)系并無清晰的認(rèn)識(shí)。而金融學(xué)無論是理論還是實(shí)證都處于萌芽階段 —— 理論方面,尚無關(guān)于 cross-section 的模型;實(shí)證方面,尚無高質(zhì)量的數(shù)據(jù),且計(jì)算機(jī)算力也十分有限。
一切都處于無序之中。直到 60 年代,Treynor (1962),Sharpe (1964),Lintner (1965) 以及 Mossin (1966) 分別獨(dú)立提出了資本資產(chǎn)定價(jià)模型(CAPM)[1],它是關(guān)于資產(chǎn)預(yù)期收益截面差異的第一個(gè)模型:
CAPM 模型非常優(yōu)雅,背后的金融學(xué)理論也很容易被人接受。Eugene Fama 曾對(duì)其高度評(píng)價(jià):The arrival of the CAPM was like the time after a thunderstorm, when the air suddenly clears.??根據(jù)資產(chǎn)定價(jià)理論,隨機(jī)折現(xiàn)因子 SDF 和 mean-variance efficient portfolio 是等價(jià)的[2]。因此 CAPM 的隱含假設(shè)就是市場(chǎng)組合是 mean-variance efficient portfolio。如果這個(gè)假設(shè)成立,那么市場(chǎng)組合就可以給其他任意資產(chǎn)定價(jià)。
然而,理想很豐滿,現(xiàn)實(shí)很骨感。CAPM 被統(tǒng)計(jì)檢驗(yàn)拒絕了 —— 資產(chǎn)的預(yù)期收益并不和它們對(duì)市場(chǎng)組合的??
除此之外,在上世紀(jì) 80 年代前后,學(xué)者們陸續(xù)發(fā)現(xiàn)按照某種風(fēng)格“打包”的股票能夠戰(zhàn)勝市場(chǎng)。這其中最值得一提的是 Basu (1977) 發(fā)現(xiàn)的 EP 效應(yīng)和 Banz (1981) 發(fā)現(xiàn)的小市值效應(yīng)。它們均無法被 CAPM 解釋,因而也被稱為異象(anomalies)。面對(duì)諸多無法被 CAPM 解釋的異象,cross-section research 再一次陷入了無序之中。
2
直到 Fama and French (1993)。觀察到價(jià)值和規(guī)模有助于解釋股票預(yù)期收益的差異,F(xiàn)ama and French (1993) 在 CAPM 的基礎(chǔ)上加入了 HML 和 SMB 兩個(gè)因子,提出了三因子(FF3)模型:
這篇文章以及它的“姊妹篇”Fama and French (1996) 拉開使用多因子模型進(jìn)行實(shí)證資產(chǎn)定價(jià)研究的序幕。如果說 Fama and French (1993) 僅僅是使用三因子對(duì)同樣通過 size 和 BM 雙重排序構(gòu)造的 25 個(gè) portfolios 定價(jià),因而難以令人信服,那么 Fama and French (1996) 則是利用三因子模型對(duì)其他 CAPM 無法解釋的異象定價(jià),例如通過 EP、CP 和 five-year sales 等構(gòu)造的 portfolios,一舉奠定了 FF3 的地位。
自此,F(xiàn)F3 扛過了 CAPM 的大旗,成為了最家喻戶曉的多因子定價(jià)模型。當(dāng)然,這也讓它成為眾矢之的,各路學(xué)者紛紛研究能夠拒絕 FF3 的異象。作為第一個(gè)實(shí)證多因子模型,F(xiàn)F3 能夠解釋的異象注定有限。在諸多異象之中,最令 FF3 尷尬的當(dāng)屬 Eugene Fama 自己的學(xué)生 Carhart 提出的動(dòng)量(Carhart 1997)。Fama 對(duì)動(dòng)量的評(píng)價(jià)是:The premier anomaly is momentum.?然而,動(dòng)量?jī)H僅是開始,遠(yuǎn)不是結(jié)束。在過去二十多年中,以 FF3 為基準(zhǔn),學(xué)術(shù)界提出了成百上千個(gè)形形色色的異象,構(gòu)成了 zoo of anomalies(也就是 John Cochrane 口中的 zoo of factors)。造成這一現(xiàn)象的,主要有兩個(gè)原因。第一個(gè)是 FF3 本身的定價(jià)能力有限,但學(xué)術(shù)界總以異象能夠獲得 FF3 無法解釋的超額收益為提出異象的標(biāo)準(zhǔn);第二個(gè)原因則是如今已經(jīng)家喻戶曉的 publication bias 導(dǎo)致的 p-hacking(Harvey 2017)[3]。對(duì)于后者,Harvey, Liu and Zhu (2016) 則呼吁研究異象時(shí)考慮多重假設(shè)檢驗(yàn)問題,并將代表顯著性的 t-statistic 的閾值從傳統(tǒng)的 2.0 提升到了 3.0+。
出于上述兩個(gè)原因,大量所謂的異象僅僅是樣本內(nèi)虛假的產(chǎn)物。而學(xué)者們以獲得更高 t-statistic 為目標(biāo)進(jìn)行的各種對(duì)數(shù)據(jù)的“精細(xì)處理”(data snooping)也加劇了這一問題。在一項(xiàng)聽上去 mission impossible 的研究中,Hou, Xue and Zhang (2020) 驚人的復(fù)現(xiàn)了 452 個(gè)學(xué)術(shù)界提出的異象。利用他們的樣本數(shù)據(jù),其中 62% 個(gè)異象的 t-statistic 不足1.96;如果換成 2.78 的閾值,則有 82% 的異象不再顯著。這些實(shí)證結(jié)果足以說明 p-hacking 問題的嚴(yán)重性,同時(shí)也為 Harvey, Liu and Zhu (2016) 的觀點(diǎn)提供了依據(jù):Most claimed research findings in financial economics are likely false.
此外,Linnainmaa and Roberts (2018) 花費(fèi)了很大的經(jīng)歷構(gòu)建了全新的樣本外數(shù)據(jù),并通過它們檢驗(yàn)了源于會(huì)計(jì)數(shù)據(jù)的 36 個(gè)異象。實(shí)證結(jié)果表明,絕大部分異象在樣本外失效,因而它們僅是 data snooping 的產(chǎn)物。盡管 replication crisis 是學(xué)術(shù)界目前的共識(shí),但一項(xiàng)來自 AQR 的最新研究卻提出了不同的看法:Jensen, Kelly and Pedersen (2021) 認(rèn)為大量的異象是可以被復(fù)現(xiàn)的。面對(duì)諸多異象和構(gòu)造異象的變量(firm characteristics),John Cochrane 在 AFA 主席演講中提出了三個(gè)至關(guān)重要的問題(Cochrane 2011):
1. 哪些 characteristics 對(duì)解釋預(yù)期收益提供了增量信息?
2. 異象變量是否可以被用來構(gòu)造一個(gè)新的因子來解釋其他資產(chǎn)?
3. 到底有多少因子是重要的?
其中第一個(gè)問題是針對(duì)這樣一個(gè)現(xiàn)象,即一篇學(xué)術(shù)論文通常只報(bào)告一個(gè)異象。由于諸多 firm characteristics 是相關(guān)的,因此哪怕確實(shí)存在異象,其中大部分可能都是相似的,唯有在控制了其它變量之后依然能對(duì)解釋預(yù)期收益起作用的才是有用的。為此,Green, Hand and Zhang (2017) 使用 Fama and MacBeth (1973) regression 同時(shí)檢驗(yàn)了 94 個(gè)異象,發(fā)現(xiàn)有用的變量少之又少[4]。不管怎樣,上述諸多實(shí)證結(jié)果訴說著一個(gè)事實(shí),即確實(shí)存在 FF3 無法解釋的異象。學(xué)術(shù)界關(guān)于 cross-section 的研究又一次陷入了無序。
3
FF3 定價(jià)能力有限加之其無法解釋的異象確實(shí)存在,學(xué)術(shù)界又一次站在了研究的十字路口。不過這一次的解決辦法遠(yuǎn)不如 CAPM 被提出時(shí)的劃時(shí)代和 FF3 被提出時(shí)的開創(chuàng)性,而是出奇的 straightforward —— 提出新的多因子模型,以能解釋更多的異象為目標(biāo)。自 2010 年之后,學(xué)術(shù)界先后針對(duì)美股提出了至少 5 個(gè)主流多因子模型。再加上 FF3 和 Carhart (1997),一共有至少 7 個(gè)多因子模型[5]。
在最近十年的實(shí)證研究中,雖然不同的檢驗(yàn)方法被陸續(xù)提出,但評(píng)價(jià)這些多因子模型的核心依然是看誰能夠解釋更多的異象,或者誰的因子能構(gòu)造出夏普率最高的 tangency portfolio。隨著因子個(gè)數(shù)或者構(gòu)造因子所使用的變量個(gè)數(shù)的增多,新提出的模型通常在樣本內(nèi)能夠解釋更多的異象。
綜合最近三年的實(shí)證結(jié)果,某些多因子模型確實(shí)“優(yōu)于”其他模型。然而,實(shí)證研究中的一些問題卻又給轟轟烈烈的因子模型大戰(zhàn)按下了暫停鍵。比如,有些模型能夠解釋其他異象,卻無法解釋構(gòu)造自己因子的 basis portfolios;有些模型中因子高的驚人的預(yù)期收益是以高換手率為代價(jià),對(duì)實(shí)際投資用處很小[6];有些模型從行為金融學(xué)出發(fā),天生就無法解釋一些異象……
正當(dāng)學(xué)界還在討論哪個(gè)模型更好,以期建立新基準(zhǔn)時(shí),F(xiàn)ama and French (2020) 一文則打破了潛在的秩序[7]。上述所有的模型(包括 FF3,F(xiàn)F5)都是靜態(tài)模型(static models),即資產(chǎn)對(duì)于因子的暴露是通過全樣本內(nèi)資產(chǎn)收益率對(duì)因子收益率做時(shí)序回歸得到的,即每個(gè)股票對(duì)每個(gè)因子的暴露在全樣本內(nèi)是不變的。與之對(duì)應(yīng)的,則是另一個(gè)家喻戶曉的模型,即 Barra 模型。Barra 模型直接使用 firm characteristics 做因子暴露,然后每期通過截面回歸計(jì)算當(dāng)期因子的收益率。和靜態(tài)模型相比,像 Barra 這樣采用時(shí)變因子暴露的模型則被稱為動(dòng)態(tài)模型(dynamic models)。
Fama and French (2020) 通過三個(gè)模型,比較了靜態(tài)模型和動(dòng)態(tài)模型的定價(jià)誤差。這三個(gè)模型包括兩個(gè)靜態(tài)模型和一個(gè)動(dòng)態(tài)模型。第一個(gè)靜態(tài)模型就是傳統(tǒng)的 FF5 這種;第二個(gè)靜態(tài)模型是首先使用個(gè)股收益率對(duì) firm characteristics 截面回歸取代 portfolio sort 構(gòu)造 factor mimicking portfolios,然后再通過全樣本時(shí)序回歸估計(jì)因子暴露;動(dòng)態(tài)模型是直接用 firm characteristics 做因子暴露,截面回歸計(jì)算因子收益率。
實(shí)證結(jié)果顯示,以資產(chǎn)定價(jià)誤差來評(píng)判,動(dòng)態(tài)模型的效果最好,其次是第二個(gè)靜態(tài)模型,最后才是傳統(tǒng)的靜態(tài)模型。這意味著(1)使用時(shí)變的 firm characteristics 作為因子暴露比時(shí)序回歸系數(shù)更優(yōu);(2)截面回歸的因子收益率優(yōu)于通過 portfolio sort 計(jì)算的因子收益率。毫無疑問,F(xiàn)ama and French (2020) 對(duì)傳統(tǒng)的多因子模型提出了巨大的挑戰(zhàn),而如何得到更好的動(dòng)態(tài)模型就成為了學(xué)術(shù)界關(guān)于 cross-section 研究在當(dāng)下需要解決的難題。
4
雖然和學(xué)術(shù)界的傳統(tǒng)模型相比,Barra 模型由于考慮了時(shí)變的因子暴露,看上去更先進(jìn)。但是,有必要說明的是,Barra 模型的目標(biāo)是解釋股票收益率時(shí)序波動(dòng),而非股票預(yù)期收益的截面差異;此外,采用 firm characteristics 直接做因子暴露也是很粗糙的,且模型也可能存在遺漏變量/無關(guān)變量的問題。另一方面,越來越多的研究表明,firm characteristics 和股票收益率之間的關(guān)系是非線性的。而直接使用單個(gè) firm characteristics 作為??
在這里,首先介紹一下 Bryan Kelly(Yale 少壯派教授且擔(dān)任 AQR 的 Head of Machine Learning)對(duì)將機(jī)器學(xué)習(xí)在實(shí)證資產(chǎn)定價(jià)方面的應(yīng)用的看法。Kelly 認(rèn)為,機(jī)器學(xué)習(xí)雖然算法復(fù)雜,但是能夠很好地應(yīng)對(duì)過擬合的問題,且樣本外的結(jié)果非常穩(wěn)健,非常適合于實(shí)證資產(chǎn)定價(jià)。對(duì)于如何應(yīng)用機(jī)器學(xué)習(xí)研究動(dòng)態(tài)模型,Kelly 給出了一個(gè)研究框架,十分精彩:
在這個(gè)框架中,因子被視為 latent factors(即不像傳統(tǒng)模型那樣,事先指定價(jià)值、盈利或動(dòng)量等因子),機(jī)器學(xué)習(xí)建模的對(duì)象是資產(chǎn)對(duì)因子的暴露?
在這個(gè)研究框架下,Kelly, Pruitt and Su (2019) 和 Gu, Kelly and Xiu (2021) 分別提出了 IPCA(工具變量 PCA)和 autoencoder 算法。前者視?
近年來,學(xué)術(shù)界在利用機(jī)器學(xué)習(xí)進(jìn)行實(shí)證資產(chǎn)定價(jià)方面取得了很多新的進(jìn)展[8],無論是研究多因子模型,還是研究它的另一面(即 SDF),機(jī)器學(xué)習(xí)均發(fā)揮了巨大的作用。這些研究無疑為 cross-section 打開了全新的大門。寫到這里且又恰逢五月,我想起了 RFS 2020 年五月的特刊 New methods in the cross-section[9],它所覆蓋的三大趨勢(shì)也和本文的梳理相契合。
回顧過去半個(gè)世紀(jì)的相關(guān)研究,不禁讓人感慨,學(xué)術(shù)研究也許就是這樣,在無序中建立秩序,秩序又被新的問題打破并重新被建立,周而復(fù)始。而我們也在這個(gè)循環(huán)往復(fù)中不斷加深對(duì) cross-section 的理解和認(rèn)知。
最后,一圖勝千言。
備注:
[1] 見《CAPM 的一小段歷史》。
[2] 見《尋找 Mean-Variance Frontier》。
[3] 見《在追逐 p-value 的道路上狂奔,卻在科學(xué)的道路上漸行漸遠(yuǎn)》。
[4] 見《解釋股票截面預(yù)期收益差異的獨(dú)立因子》。
[5] 見《主流多因子模型巡禮》。
[6] 見《Toward a better factor model》。
[7] 見《A new norm?》。
[8] 見《實(shí)證資產(chǎn)定價(jià)理論新進(jìn)展》。
[9] 見《出色不如走運(yùn)(IV)?》。
參考文獻(xiàn)
Banz, R. W. (1981). The relationship between return and market value of common stocks.?Journal of Financial Economics 9(1), 3 – 18.
Basu, S. (1977). Investment performance of common stocks in relation to their price–earnings ratios: A test of the effi-cient market hypothesis.?Journal of Finance 32(3), 663 – 682.
Carhart, M. M. (1997). On persistence in mutual fund performance.?Journal of Finance 52(1), 57 – 82.
Cochrane, J. H. (2011). Presidential address: Discount rates. Journal of Finance 66(4), 1047 – 1108.
Daniel, K. D., D. A. Hirshleifer, and L. Sun (2020). Short- and long-horizon behavioral factors.?Review of Financial Studies 33(4), 1673 – 1736.
Fama, E. F. and K. R. French (1993). Common risk factors in the returns on stocks and bonds.?Journal of Financial Economics?33(1), 3 – 56.
Fama, E. F. and K. R. French (1996). Multifactor explanations of asset pricing anomalies.?Journal of Finance?51(1), 55 – 84.
Fama, E. F. and K. R. French (2015). A five-factor asset pricing model.?Journal of Financial Economics 116(1), 1 – 22.
Fama, E. F. and K. R. French (2020). Comparing cross-section and time-series factor models.?Review of Financial Studies 33(5), 1891 – 1926.
Fama, E. F. and J. D. MacBeth (1973). Risk, return, and equilibrium: Empirical tests.?Journal of Political Economy 81(3), 607 – 636.
Green, J., J. R. M. Hand, and X. F. Zhang (2017). The characteristics that provide independent information about average U.S. monthly stock returns.?Review of Financial Studies 30(12), 4389 – 4436.
Gu, S., B. T. Kelly, and D. Xiu (2021). Autoencoder asset pricing models. Journal of Econometrics 222(1), 429 – 450.
Harvey, C. R. (2017). Presidential Address: The scientific outlook in financial economics.?Journal of Finance 72(4), 1399 – 1440.
Harvey, C. R., Y. Liu, and H. Zhu (2016). … and the cross-section of expected returns.?Review of Financial Studies 29(1), 5 – 68.
Hou, K., C. Xue, and L. Zhang (2015). Digesting anomalies: An investment approach.?Review of Financial Studies 28(3), 650 – 705.
Hou, K., C. Xue, and L. Zhang (2020). Replicating anomalies.?Review of Financial Studies 33(5), 2019 – 2133.
Jensen, T. I., B. T. Kelly, and L. H. Pedersen (2021). Is there a replication crisis in finance? Working paper.
Kelly, B. T., S. Pruitt, and Y. Su (2019). Characteristics are covariances: A unified model of risk and return. Journal of Financial Economics 134(3), 501 – 524.
Linnainmaa, J. T. and M. R. Roberts (2018). The history of the cross-section of stock returns.?Review of Financial Studies 31(7), 2606 – 2649.
Lintner, J. (1965). The valuation of risk assets and the selection of risky investments in stock portfolios and capital budgets.?Review of Economics and Statistics 47, 13 – 37.
Mossin, J. (1966). Equilibrium in a capital asset market.?Econometrica 34(4), 768 – 783.
Novy-Marx, R. (2013). The other side of value: The gross profitability premium.?Journal of Financial Economics 108(1), 1 – 28.
Sharpe, W. F. (1964). Capital asset prices: A theory of market equilibrium under conditions of risk.?Journal of Finance 19(3), 425 – 442.
Stambaugh, R. F. and Y. Yuan (2017). Mispricing factors.?Review of Financial Studies 30(4), 1270 – 1315.
Treynor, J. L. (1962). Toward a theory of market value of risky assets. Unpublished manuscript. “Rough Draft” dated by Treynor to the fall of 1962. A final version was published in 1999, in?Asset Pricing and Portfolio Performance.?R. A. Korajczyk (editor), London: Risk Books, 15 – 22.
免責(zé)聲明:入市有風(fēng)險(xiǎn),投資需謹(jǐn)慎。在任何情況下,本文的內(nèi)容、信息及數(shù)據(jù)或所表述的意見并不構(gòu)成對(duì)任何人的投資建議。在任何情況下,本文作者及所屬機(jī)構(gòu)不對(duì)任何人因使用本文的任何內(nèi)容所引致的任何損失負(fù)任何責(zé)任。除特別說明外,文中圖表均直接或間接來自于相應(yīng)論文,僅為介紹之用,版權(quán)歸原作者和期刊所有。