尋找 Mean-Variance Frontier (II)
發(fā)布時(shí)間:2022-04-08 | 來源: 川總寫量化
作者:石川
摘要:實(shí)證層面,我們也許永遠(yuǎn)找不到“最優(yōu)”的 MVE 組合,但理論的突破和實(shí)證的推進(jìn)對(duì)投資實(shí)務(wù)而言依然非常有益。
Any asset pricing model is the same as the statement that there is some return on the mean-variance frontier.?
—— Cochrane (2005)
1
最近幾年,機(jī)器學(xué)習(xí)在實(shí)證資產(chǎn)定價(jià)方面的應(yīng)用愈加深入。學(xué)術(shù)界提出了很多利用機(jī)器學(xué)習(xí)方法構(gòu)造的隱性多因子模型,例如 Kelly, Pruitt and Su (2019) 的 IPCA 模型、Chen, Pelger and Zhu (2019) 的深度學(xué)習(xí)模型、Kozak, Nagel and Santosh (2020) 的 PCA方法、Bryzgalova, Pelger and Zhu (2020) 的隨機(jī)森林方法、以及 Gu, Kelly and Xiu (2021) 的 autoencoder 模型等。
和傳統(tǒng)的 Fama and French (1993, 2015) 以及 Hou, Xue and Zhang (2015) 模型相比,這些新方法沒有強(qiáng)加 ad-hoc 稀疏性假設(shè),而是選擇直面協(xié)變量(公司特征)的高維數(shù)問題。實(shí)證結(jié)果顯示,新模型均能獲得傳統(tǒng)模型無法解釋的超額收益,且它們?cè)跇颖就?span 出的最大夏普比率也遠(yuǎn)超傳統(tǒng)模型。
雖說每個(gè)新模型都能遠(yuǎn)勝傳統(tǒng)模型,但我們并不清楚這些新模型之間又會(huì)是孰優(yōu)孰劣。是否會(huì)有某個(gè)機(jī)器學(xué)習(xí)方法構(gòu)造的模型會(huì)優(yōu)于其他模型?回答這個(gè)問題的意義絕非“factor (model) war”的升級(jí)版,而是對(duì)理論和實(shí)證、對(duì)學(xué)界和業(yè)界都意義重大。
直到 Baba-Yara, Boyer and Davis (2021) 出現(xiàn)。
該文把傳統(tǒng)模型和基于機(jī)器學(xué)習(xí)方法構(gòu)造的新模型放在一起進(jìn)行了比較。然而有意思的是,該文通過詳盡的實(shí)證分析發(fā)現(xiàn)沒有哪個(gè)新模型是“最優(yōu)”的。正因如此,三位作者給論文的題目選為 The factor model failure puzzle(在更早先的版本中,該文的標(biāo)題為 Evaluating the anomaly zookeepers)。
那么出現(xiàn)上述現(xiàn)象背后的原因是什么呢?是機(jī)器學(xué)習(xí)領(lǐng)域中“沒有免費(fèi)的午餐”定理?又或者是什么其他的原因?Baba-Yara, Boyer and Davis (2021) 的創(chuàng)新之處在于不止進(jìn)行了實(shí)證分析,而是通過理論模型解釋了上述現(xiàn)象背后的原因。他們把這個(gè)現(xiàn)象稱為 Impossibility result。
2
為了合理地比較不同的模型,我們首先來借助一些理論的指引。實(shí)證資產(chǎn)定價(jià)理論表明了(線性)隨機(jī)貼現(xiàn)因子、多因子模型以及均值方差有效(MVE)投資組合之間的等價(jià)關(guān)系。此外,一旦我們找到 mean-variance frontier 上的一個(gè)組合,就可以用它構(gòu)造一個(gè)單因子模型,并通過它來為其他任意資產(chǎn)定價(jià)(Roll 1977):
上述結(jié)果為我們比較不同的模型指明了方向。對(duì)于不同的模型,我們只需要利用它們的因子構(gòu)造出各自的 MVE 投資組合,然后考察這些 MVE 組合是否能夠?yàn)楸舜硕▋r(jià)。如果某個(gè)模型是“最優(yōu)”模型,則意味著其他模型的 MVE 組合無法獲得相較于該模型 MVE 組合的超額收益。
當(dāng)然,上述“只需要”背后隱含著巨大的實(shí)證挑戰(zhàn)。這是因?yàn)槲覀冊(cè)诤醯氖窃跇颖就鈽?gòu)造 MVE 組合,而非在樣本內(nèi)進(jìn)行事后分析。對(duì)于后者,我們只需要使用?
利用因子權(quán)重,就可以構(gòu)造 MVE 組合;而一旦有了所有模型各自的 MVE 組合,接下來只需要令它們互為 test assets 和基準(zhǔn)模型進(jìn)行回歸分析,求出每個(gè) test assets 相對(duì)選定基準(zhǔn)(即某個(gè)因子模型的 MVE 組合)的超額收益?
3
下面我們來看看參加 PK 的各路選手。
首先是傳統(tǒng)選手,包括 CAPM、FF3(Fama and French 1993)、FF6(Fama and French 2015 + Mom)、HXZ(Hou, Xue and Zhang 2015)、DMRS(Daniel et al. 2020 通過對(duì)沖后構(gòu)造的因子,詳見此處)以及 SY(Stambaugh and Yuan 2016)。至于通過機(jī)器學(xué)習(xí)方法構(gòu)造的新模型,主要就是本文一開始提到的那些,不再贅述。下表總結(jié)了 Baba-Yara, Boyer and Davis (2021) 考察的全部模型以及每個(gè)模型所使用的用于估計(jì) MVE 權(quán)重的方法。
接下來看實(shí)證結(jié)果。該文考察的時(shí)間區(qū)間自 1963 到 2020,為了在樣本外比較上述模型,該文樣本內(nèi)區(qū)間截止 Dec 1989;之后為樣本外。下圖展示了這些模型各自的 MVE 組合在樣本內(nèi)和樣本外的相關(guān)系數(shù)。無論是樣本內(nèi)還是樣本外,絕大多數(shù) MVE 組合似乎都頗為不同(此處為本文第四節(jié)的討論埋個(gè)伏筆)。
此外,再來看看這些 MVE 組合在樣本外的 CAPM-α 以及年化夏普比率。不出意外,基于機(jī)器學(xué)習(xí)方法、擁抱協(xié)變量高維數(shù)的新模型在樣本外的風(fēng)險(xiǎn)收益特征均優(yōu)于傳統(tǒng)模型。在我看來,這個(gè)結(jié)果對(duì)業(yè)界有很大的意義:(1)雖然在本文一開始,我劇透了 factor model failure 這個(gè)結(jié)論,但是對(duì)業(yè)界而言關(guān)注的是最大化樣本外投資組合的風(fēng)險(xiǎn)收益特征,因此這個(gè)結(jié)果表明在協(xié)變量的高維數(shù)時(shí)代,機(jī)器學(xué)習(xí)方法(如果用對(duì)的話)大有可為;(2)傳統(tǒng)強(qiáng)加 ad-hoc 稀疏性假設(shè)的模型(比如 FF3、FF6)所代表的投資機(jī)會(huì)非常弱(體現(xiàn)在很低的 CAPM-α 以及年化夏普比率),所以對(duì)未來任何以它們?yōu)榛鶞?zhǔn)的顯著實(shí)證結(jié)果都無需太興奮。
預(yù)熱得差不多了,下面我們來看 Baba-Yara, Boyer and Davis (2021) 的 main results —— 是否有哪個(gè)模型的 MVE 組合能給其他 MVE 組合定價(jià)。為此,該文同時(shí)考察了無條件模型以及條件模型(即?
因此,如果有某個(gè)模型是“最優(yōu)”的話,那么我們應(yīng)該能夠看到某一列的顏色都是淺色。然而,事與愿違,以樣本外為例,放眼望去是一片深紫色,說明哪怕以機(jī)器學(xué)習(xí)方法構(gòu)造的模型,也沒有哪個(gè)能為所有其他模型定價(jià)。進(jìn)一步通過 GRS test 聯(lián)合檢驗(yàn)每個(gè)基準(zhǔn)下的 pricing errors,對(duì)應(yīng)的?F-statistic 都非常大,說明這些 pricing errors 不為零。
以上結(jié)果說明,實(shí)證層面,盡管近年來新的模型層出不窮,但依然沒有所謂的“最優(yōu)”模型。面對(duì)這樣的結(jié)果,人們不禁要問:為什么?
4
實(shí)證方面細(xì)致的工作無疑是 Baba-Yara, Boyer and Davis (2021) 一文的重要貢獻(xiàn),然而關(guān)于理論模型的討論才是該文畫龍點(diǎn)睛的一筆。
由前文論述可知,站在 MVE 投資組合的視角,一個(gè)多因子模型可以被視為一個(gè)以因子為標(biāo)的構(gòu)造的 MVE 組合的權(quán)重向量。從理論上說,用于構(gòu)造真實(shí) MVE 組合的因子可能會(huì)有很多,而所有給定的多因子模型都帶有某種程度的降維處理。比如,最簡單的 FF3 使用市值和 Book-to-Market Ratio 構(gòu)造因子。這意味著該模型認(rèn)為這兩個(gè)組合在 MVE 組合中的權(quán)重非零,而其他潛在因子的權(quán)重都為零(假設(shè)不考慮市場因子)。類似的,其他傳統(tǒng)模型則是人為地選擇了盈利、投資、動(dòng)量等因子,并認(rèn)為它們的 MVE 權(quán)重不為零;而機(jī)器學(xué)習(xí)方法則更多的通過數(shù)據(jù)驅(qū)動(dòng)的方式來選擇 firm characteristics(以及它們的交互作用)、構(gòu)造因子,并決定因子在 MVE 組合中的權(quán)重。
在這個(gè)視角下,不同的多因子模型可以被理解為對(duì)真實(shí) MVE 組合中的權(quán)重施加了不同的先驗(yàn)(先驗(yàn)的差異造成了第三節(jié)展示的不同模型的 MVE 組合的相關(guān)系數(shù)并不高)。沿著這個(gè)思路,Baba-Yara, Boyer and Davis (2021) 提出了一個(gè)貝葉斯框架的理論模型,并發(fā)現(xiàn)當(dāng)潛在的因子個(gè)數(shù)非常大時(shí),使用不同先驗(yàn)的模型無法為彼此定價(jià)。此外,哪怕某個(gè)模型是真正的模型(即它的先驗(yàn)是正確的),另外一個(gè)使用不同先驗(yàn)的模型也注定能夠產(chǎn)生該模型無法解釋的超額收益。這就是本文一開始提到的 impossibility result。在協(xié)變量的高維數(shù)時(shí)代,不存在“最優(yōu)”的模型 —— 對(duì)于給定的任意模型,總能找到能夠獲得其無法解釋的超額收益的新模型。
In other words, it is impossible to establish a dominant or best asset pricing model in a high dimensional world. Any model that claims dominance can invariably be dominated by a new model with a slight tweak.
—— Baba-Yara, Boyer and Davis (2021)
近年來,factor (model) war 愈演愈烈。而 Baba-Yara, Boyer and Davis (2021) 一文的實(shí)證結(jié)果和理論模型無疑給人們帶來了全新的思考。至少對(duì)我來說,再看傳統(tǒng)模型在那里 PK 來 PK 去實(shí)在是不痛不癢。對(duì)于業(yè)界實(shí)務(wù)來說,人們使用多因子模型降維是為了減少估計(jì)誤差對(duì) MVE 組合權(quán)重的影響。因此,回答更關(guān)鍵的問題,即應(yīng)該使用何種的先驗(yàn)(回想一下《稀疏性幻覺》)以及如何更合理的使用機(jī)器學(xué)習(xí)方法構(gòu)造因子以及計(jì)算它們的 MVE 權(quán)重,這些才是有價(jià)值的研究。
期待 Baba-Yara, Boyer and Davis (2021) 早日見刊。
參考文獻(xiàn)
Baba-Yara, F., B. Boyer, and C. Davis (2021). The factor model failure puzzle. Working paper.
Bryzgalova, S., M. Pelger, and J. Zhu (2020). Forest through the trees: Building cross-sections of stock returns. Working paper.
Chen, L., M. Pelger, and J. Zhu (2019). Deep learning in asset pricing. Working paper.
Cochrane, J. H. (2005).?Asset Pricing (Revised Edition). Princeton, NJ: Princeton University Press.
Daniel, K., L. Mota, S. Rottke, and T. Santos (2020). The cross-section of risk and returns.?Review of Financial Studies?33(5), 1927 – 1979.
Fama, E. F. and K. R. French (1993). Common risk factors in the returns on stocks and bonds.?Journal of Financial Economics?33(1), 3 – 56.
Fama, E. F. and K. R. French (2015). A five-factor asset pricing model.?Journal of Financial Economics?116(1), 1 – 22.
Gu, S., B. T. Kelly, and D. Xiu (2021). Autoencoder asset pricing models.?Journal of Econometrics?222(1), 429 – 450.
Hou, K., C. Xue, and L. Zhang (2015). Digesting anomalies: An investment approach.?Review of Financial Studies?28(3), 650 – 705.
Kelly, B. T., S. Pruitt, and Y. Su (2019). Characteristics are covariances: A unified model of risk and return.?Journal of Financial Economics?134(3), 501 – 524.
Kozak, S., S. Nagel, and S. Santosh (2020). Shrinking the cross-section.?Journal of Financial Economics?135(2), 271 – 292.
Roll, R. (1977). A critique of the asset pricing theory’s tests Part I: On past and potential testability of the theory.?Journal of Financial Economics?4(2), 129 – 176.
Stambaugh, R. F. and Y. Yuan (2017). Mispricing factors.?Review of Financial Studies?30(4), 1270 – 1315.
免責(zé)聲明:入市有風(fēng)險(xiǎn),投資需謹(jǐn)慎。在任何情況下,本文的內(nèi)容、信息及數(shù)據(jù)或所表述的意見并不構(gòu)成對(duì)任何人的投資建議。在任何情況下,本文作者及所屬機(jī)構(gòu)不對(duì)任何人因使用本文的任何內(nèi)容所引致的任何損失負(fù)任何責(zé)任。除特別說明外,文中圖表均直接或間接來自于相應(yīng)論文,僅為介紹之用,版權(quán)歸原作者和期刊所有。