Cross-Section Research, Looking Forward
發(fā)布時(shí)間:2024-08-23 | 來(lái)源: 川總寫(xiě)量化
作者:石川
摘要:機(jī)器學(xué)習(xí)和大數(shù)據(jù)時(shí)代,資產(chǎn)預(yù)期收益截面差異研究的統(tǒng)一框架。
早先的文章《Cross-Section Research, A History》回顧了自上世紀(jì) 60 年代以來(lái)關(guān)于股票預(yù)期收益率 cross-section 的研究,包括 CAPM 以及后來(lái)的 FF3、q-factor model 這些 ad-hoc 多因子模型。該文的最后同時(shí)引出了當(dāng)下流行的動(dòng)態(tài) latent beta factor model 框架:
?
在這個(gè)框架中,因子是 latent,建模的對(duì)象是資產(chǎn)對(duì)因子的暴露?
鑒于 beta pricing model 和 stochastic discount factor(SDF)的等價(jià)性,本文從 SDF 的角度進(jìn)一步梳理這個(gè)統(tǒng)一的研究框架,它能夠?qū)?dāng)下眾多基于機(jī)器學(xué)習(xí)的實(shí)證資產(chǎn)定價(jià)模型納入其中,代表了 cross-section research 的未來(lái)。
1
在解讀框架之前,首先要回答的是為什么需要框架。這個(gè)問(wèn)題的答案是:新時(shí)代的實(shí)證資產(chǎn)定價(jià)研究是以大數(shù)據(jù)為依托、以機(jī)器學(xué)習(xí)算法為工具,圍繞資產(chǎn)定價(jià)理論展開(kāi);而非將數(shù)據(jù)無(wú)腦扔進(jìn)高級(jí)算法,單純指望數(shù)據(jù)發(fā)聲。因此,唯有放在框架下探討前沿進(jìn)展,才能理解不同方法之間的共性和差異,從而將學(xué)術(shù)研究的最新發(fā)現(xiàn)映射到投資實(shí)務(wù)之中。
讓我們從條件 SDF 說(shuō)起:
?
將權(quán)重?
?
式中?
?
式中,?
利用 managed portfolios,將原始 SDF 轉(zhuǎn)化成如下靜態(tài)模型:
?
其中
?
上述模型之所以是靜態(tài)的,是因?yàn)橄禂?shù)?
在這個(gè)框架下,新時(shí)代實(shí)證資產(chǎn)定價(jià)的研究目標(biāo)為:以最大化 MVE 組合樣本外夏普比率為目標(biāo),選擇含有收益率預(yù)測(cè)信息的公司特征?
以下兩節(jié)分別探討?
2
關(guān)于?
第一,針對(duì)多重假設(shè)檢驗(yàn)問(wèn)題進(jìn)行調(diào)整(Harvey 2017,Harvey, Liu and Zhu 2016)。在這方面,盡管這幾年更多的聲音是學(xué)術(shù)發(fā)現(xiàn)大部分 are likely true(Jensen, Kelly, and Pedersen 2023),但我個(gè)人更支持 Harvey and Liu 的觀點(diǎn)。對(duì)這個(gè)問(wèn)題,根據(jù)經(jīng)驗(yàn)和對(duì)數(shù)據(jù)的理解、使用合理的先驗(yàn)(即真實(shí)因子的百分比)才能得到對(duì)于投資實(shí)踐有益的結(jié)論。而基于 ensemble null 假設(shè)的數(shù)學(xué)推導(dǎo)游戲(Chen 2021)毫無(wú)意義。
第二,投資者面臨的高維學(xué)習(xí)問(wèn)題(Martin and Nagel 2022)。理性預(yù)期假設(shè)投資者知道真實(shí)的估值模型。然而,投資者面臨高維學(xué)習(xí)問(wèn)題,不可能知道真實(shí)的估值模型。這會(huì)造成均衡狀態(tài)下資產(chǎn)價(jià)格和理性預(yù)期情況下相比出現(xiàn)偏差。因此,在事后(ex post)分析中,已實(shí)現(xiàn)收益率中包含一部分因估計(jì)誤差導(dǎo)致的可預(yù)測(cè)成分。而對(duì)投資者來(lái)說(shuō),事前(ex ante)無(wú)法利用上述可預(yù)測(cè)性。事后分析中發(fā)現(xiàn)的可預(yù)測(cè)性是虛假的。在這方面,最直觀的例子就是將當(dāng)下的技術(shù)手段所進(jìn)行的高級(jí)數(shù)據(jù)分析應(yīng)用于歷史數(shù)據(jù)中,而歷史數(shù)據(jù)那個(gè)時(shí)期并不存在同樣的分析手段或者投資者使用該手段的成本極高。
第三,由 APT 可知,解釋資產(chǎn)預(yù)期收益率的協(xié)變量應(yīng)能解釋資產(chǎn)的共同運(yùn)動(dòng)(Kozak, Nagel, and Santosh 2018)。所以,協(xié)變量應(yīng)該和資產(chǎn)收益率的一階矩以及二階矩都有關(guān)。在這個(gè)背景下,同時(shí)考慮一階矩和二階矩信息的方法(例如 risk-premium PCA)取得了很好的實(shí)證結(jié)果。
3
再來(lái)看?
傳統(tǒng)的構(gòu)造方法以來(lái) portfolio sort(這主要?dú)w功于 Fama and French 的開(kāi)創(chuàng)性工作)。而顯然,在協(xié)變量的高維數(shù)時(shí)代,進(jìn)行高維的 portfolio sort 是不切實(shí)際的。所以,當(dāng)下的解決方案是 embrace machine learning。
然而,由于金融數(shù)據(jù)的信噪比極低以及不滿足平穩(wěn)性(即 alpha 會(huì)因?yàn)楸唤灰椎舳В?,?dǎo)致 parameter scaling, regularization, cost function……每個(gè)選擇都可能影響機(jī)器學(xué)習(xí)模型在樣本外風(fēng)險(xiǎn)收益特征(Nagel 2021)。對(duì)此,學(xué)術(shù)界的一致觀點(diǎn)是 off-the-shelf 的機(jī)器學(xué)習(xí)算法難以成功,而是要通過(guò)適當(dāng)?shù)耐緩阶⑷虢?jīng)濟(jì)學(xué)理論(例如使用貝葉斯框架)。例如,實(shí)證分析表明 ridge regression 比 OLS 在樣本外能夠獲得更高的?
此外,No-Free-Lunch 定理對(duì)于資產(chǎn)定價(jià)研究同樣適用。不同的模型和不同的協(xié)變量選擇,代表了研究者關(guān)于 SDF 的不同先驗(yàn),也會(huì)有不同的實(shí)證結(jié)果。僅僅以實(shí)證結(jié)果為依據(jù)來(lái)挑選模型只能陷入 model-hacking。
4
在本文所描述的框架下,我們很容易理解并比較近年來(lái)實(shí)證資產(chǎn)定價(jià)研究的最新發(fā)現(xiàn)。例如 Bryzgalova, Pelger and Zhu (2020) 的 asset pricing tree。該文通過(guò) decision tree 構(gòu)造 managed portfolios,而在估計(jì)權(quán)重系數(shù)?
讓我們重申一下機(jī)器學(xué)習(xí)時(shí)代的實(shí)證資產(chǎn)定價(jià)研究。和傳統(tǒng)的 ad-hoc 多因子模型以最小化樣本內(nèi)的 pricing errors 不同,它們以最大化樣本外條件夏普比率為目標(biāo)。機(jī)器學(xué)習(xí)算法可以同時(shí)處理大量解釋變量、考慮變量和預(yù)期收益率的非線性關(guān)系,但使用時(shí)需施加經(jīng)濟(jì)學(xué)推理。近年來(lái),學(xué)術(shù)界利用 SDF 框架或隱性因子模型范式,提出包含大量公司特征的定價(jià)模型,這種趨勢(shì)代表了實(shí)證研究的未來(lái)。
最后,once again,一圖勝千言。
參考文獻(xiàn)
Bryzgalova, S., M. Pelger, and J. Zhu (2020). Forest through the trees: Building cross-sections of stock returns. Working paper.
Chen, A. Y. (2021). The limits of p-hacking: Some thought experiments. Journal of Finance 76(5), 2447–2480.
Chen, L., M. Pelger, and J. Zhu (2020). Deep learning in asset pricing. Management Science forthcoming.
Harvey, C. R. (2017). Presidential Address: The scientific outlook in financial economics.?Journal of Finance 72(4), 1399–1440.
Harvey, C. R., Y. Liu, and H. Zhu (2016). … and the cross-section of expected returns.?Review of Financial Studies 29(1), 5–68.
Jensen, T. I., B. T. Kelly, and L. H. Pedersen (2023). Is there a replication crisis in finance? Journal of Finance 78(5), 2465–2518.
Kozak, S., S. Nagel, and S. Santosh (2018). Interpreting factor models. Journal of Finance 73(3), 1183–1223.
Martin, I. and S. Nagel (2022). Market efficiency in the age of big data. Journal of Financial Economics 145(1), 154–177.
Nagel, S. (2021). Machine Learning in Asset Pricing. Princeton University Press.
免責(zé)聲明:入市有風(fēng)險(xiǎn),投資需謹(jǐn)慎。在任何情況下,本文的內(nèi)容、信息及數(shù)據(jù)或所表述的意見(jiàn)并不構(gòu)成對(duì)任何人的投資建議。在任何情況下,本文作者及所屬機(jī)構(gòu)不對(duì)任何人因使用本文的任何內(nèi)容所引致的任何損失負(fù)任何責(zé)任。除特別說(shuō)明外,文中圖表均直接或間接來(lái)自于相應(yīng)論文,僅為介紹之用,版權(quán)歸原作者和期刊所有。