尋找 Mean-Variance Frontier (II)

發(fā)布時(shí)間：2022-04-08 | 來源: 川總寫量化

作者：石川

摘要：實(shí)證層面，我們也許永遠(yuǎn)找不到“最優(yōu)”的 MVE 組合，但理論的突破和實(shí)證的推進(jìn)對(duì)投資實(shí)務(wù)而言依然非常有益。

Any asset pricing model is the same as the statement that there is some return on the mean-variance frontier.?

—— Cochrane (2005)

最近幾年，機(jī)器學(xué)習(xí)在實(shí)證資產(chǎn)定價(jià)方面的應(yīng)用愈加深入。學(xué)術(shù)界提出了很多利用機(jī)器學(xué)習(xí)方法構(gòu)造的隱性多因子模型，例如 Kelly, Pruitt and Su (2019) 的 IPCA 模型、Chen, Pelger and Zhu (2019) 的深度學(xué)習(xí)模型、Kozak, Nagel and Santosh (2020) 的 PCA方法、Bryzgalova, Pelger and Zhu (2020) 的隨機(jī)森林方法、以及 Gu, Kelly and Xiu (2021) 的 autoencoder 模型等。

和傳統(tǒng)的 Fama and French (1993, 2015) 以及 Hou, Xue and Zhang (2015) 模型相比，這些新方法沒有強(qiáng)加 ad-hoc 稀疏性假設(shè)，而是選擇直面協(xié)變量（公司特征）的高維數(shù)問題。實(shí)證結(jié)果顯示，新模型均能獲得傳統(tǒng)模型無法解釋的超額收益，且它們?cè)跇颖就?span 出的最大夏普比率也遠(yuǎn)超傳統(tǒng)模型。

雖說每個(gè)新模型都能遠(yuǎn)勝傳統(tǒng)模型，但我們并不清楚這些新模型之間又會(huì)是孰優(yōu)孰劣。是否會(huì)有某個(gè)機(jī)器學(xué)習(xí)方法構(gòu)造的模型會(huì)優(yōu)于其他模型？回答這個(gè)問題的意義絕非“factor (model) war”的升級(jí)版，而是對(duì)理論和實(shí)證、對(duì)學(xué)界和業(yè)界都意義重大。

直到 Baba-Yara, Boyer and Davis (2021) 出現(xiàn)。

該文把傳統(tǒng)模型和基于機(jī)器學(xué)習(xí)方法構(gòu)造的新模型放在一起進(jìn)行了比較。然而有意思的是，該文通過詳盡的實(shí)證分析發(fā)現(xiàn)沒有哪個(gè)新模型是“最優(yōu)”的。正因如此，三位作者給論文的題目選為 The factor model failure puzzle（在更早先的版本中，該文的標(biāo)題為 Evaluating the anomaly zookeepers）。

那么出現(xiàn)上述現(xiàn)象背后的原因是什么呢？是機(jī)器學(xué)習(xí)領(lǐng)域中“沒有免費(fèi)的午餐”定理？又或者是什么其他的原因？Baba-Yara, Boyer and Davis (2021) 的創(chuàng)新之處在于不止進(jìn)行了實(shí)證分析，而是通過理論模型解釋了上述現(xiàn)象背后的原因。他們把這個(gè)現(xiàn)象稱為 Impossibility result。

為了合理地比較不同的模型，我們首先來借助一些理論的指引。實(shí)證資產(chǎn)定價(jià)理論表明了（線性）隨機(jī)貼現(xiàn)因子、多因子模型以及均值方差有效（MVE）投資組合之間的等價(jià)關(guān)系。此外，一旦我們找到 mean-variance frontier 上的一個(gè)組合，就可以用它構(gòu)造一個(gè)單因子模型，并通過它來為其他任意資產(chǎn)定價(jià)（Roll 1977）：

上述結(jié)果為我們比較不同的模型指明了方向。對(duì)于不同的模型，我們只需要利用它們的因子構(gòu)造出各自的 MVE 投資組合，然后考察這些 MVE 組合是否能夠?yàn)楸舜硕▋r(jià)。如果某個(gè)模型是“最優(yōu)”模型，則意味著其他模型的 MVE 組合無法獲得相較于該模型 MVE 組合的超額收益。

當(dāng)然，上述“只需要”背后隱含著巨大的實(shí)證挑戰(zhàn)。這是因?yàn)槲覀冊(cè)诤醯氖窃跇颖就鈽?gòu)造 MVE 組合，而非在樣本內(nèi)進(jìn)行事后分析。對(duì)于后者，我們只需要使用? $\pmb{\Sigma}^{-1}\pmb{\mu}$ ?即可得到因子在各自 MVE 組合之中的權(quán)重。但是對(duì)事前進(jìn)行樣本外估計(jì)而言，如何防止過擬合、得到更合理的權(quán)重估計(jì)至關(guān)重要。為此，Baba-Yara, Boyer and Davis (2021) 使用了 Bryzgalova, Pelger and Zhu (2020) 的方法。該方法在估計(jì)權(quán)重時(shí)同時(shí)對(duì)協(xié)方差矩陣和預(yù)期收益率進(jìn)行了收縮，是已有估計(jì)方法中比較穩(wěn)健的代表。

利用因子權(quán)重，就可以構(gòu)造 MVE 組合；而一旦有了所有模型各自的 MVE 組合，接下來只需要令它們互為 test assets 和基準(zhǔn)模型進(jìn)行回歸分析，求出每個(gè) test assets 相對(duì)選定基準(zhǔn)（即某個(gè)因子模型的 MVE 組合）的超額收益? $\alpha$ ?，最后再聯(lián)合檢驗(yàn)所有? $\alpha$ ?是否為零。如果某個(gè)模型下，其他的? $\alpha$ ?為零，則它就是“最優(yōu)”的模型。

下面我們來看看參加 PK 的各路選手。

首先是傳統(tǒng)選手，包括 CAPM、FF3（Fama and French 1993）、FF6（Fama and French 2015 + Mom）、HXZ（Hou, Xue and Zhang 2015）、DMRS（Daniel et al. 2020 通過對(duì)沖后構(gòu)造的因子，詳見此處）以及 SY（Stambaugh and Yuan 2016）。至于通過機(jī)器學(xué)習(xí)方法構(gòu)造的新模型，主要就是本文一開始提到的那些，不再贅述。下表總結(jié)了 Baba-Yara, Boyer and Davis (2021) 考察的全部模型以及每個(gè)模型所使用的用于估計(jì) MVE 權(quán)重的方法。

接下來看實(shí)證結(jié)果。該文考察的時(shí)間區(qū)間自 1963 到 2020，為了在樣本外比較上述模型，該文樣本內(nèi)區(qū)間截止 Dec 1989；之后為樣本外。下圖展示了這些模型各自的 MVE 組合在樣本內(nèi)和樣本外的相關(guān)系數(shù)。無論是樣本內(nèi)還是樣本外，絕大多數(shù) MVE 組合似乎都頗為不同（此處為本文第四節(jié)的討論埋個(gè)伏筆）。

此外，再來看看這些 MVE 組合在樣本外的 CAPM-α 以及年化夏普比率。不出意外，基于機(jī)器學(xué)習(xí)方法、擁抱協(xié)變量高維數(shù)的新模型在樣本外的風(fēng)險(xiǎn)收益特征均優(yōu)于傳統(tǒng)模型。在我看來，這個(gè)結(jié)果對(duì)業(yè)界有很大的意義：（1）雖然在本文一開始，我劇透了 factor model failure 這個(gè)結(jié)論，但是對(duì)業(yè)界而言關(guān)注的是最大化樣本外投資組合的風(fēng)險(xiǎn)收益特征，因此這個(gè)結(jié)果表明在協(xié)變量的高維數(shù)時(shí)代，機(jī)器學(xué)習(xí)方法（如果用對(duì)的話）大有可為；（2）傳統(tǒng)強(qiáng)加 ad-hoc 稀疏性假設(shè)的模型（比如 FF3、FF6）所代表的投資機(jī)會(huì)非常弱（體現(xiàn)在很低的 CAPM-α 以及年化夏普比率），所以對(duì)未來任何以它們?yōu)榛鶞?zhǔn)的顯著實(shí)證結(jié)果都無需太興奮。

預(yù)熱得差不多了，下面我們來看 Baba-Yara, Boyer and Davis (2021) 的 main results —— 是否有哪個(gè)模型的 MVE 組合能給其他 MVE 組合定價(jià)。為此，該文同時(shí)考察了無條件模型以及條件模型（即? $\beta$ ?是時(shí)變的）。以無條件模型為例，下圖展示了樣本內(nèi)外 pricing errors 的檢驗(yàn)結(jié)果（p-value）。其中，每一行模型的 MVE 組合是 test asset，每一列模型的 MVE 組合是基準(zhǔn)，顏色越深說明 test asset 相對(duì)基準(zhǔn)的超額收益越顯著。

因此，如果有某個(gè)模型是“最優(yōu)”的話，那么我們應(yīng)該能夠看到某一列的顏色都是淺色。然而，事與愿違，以樣本外為例，放眼望去是一片深紫色，說明哪怕以機(jī)器學(xué)習(xí)方法構(gòu)造的模型，也沒有哪個(gè)能為所有其他模型定價(jià)。進(jìn)一步通過 GRS test 聯(lián)合檢驗(yàn)每個(gè)基準(zhǔn)下的 pricing errors，對(duì)應(yīng)的?F-statistic 都非常大，說明這些 pricing errors 不為零。

以上結(jié)果說明，實(shí)證層面，盡管近年來新的模型層出不窮，但依然沒有所謂的“最優(yōu)”模型。面對(duì)這樣的結(jié)果，人們不禁要問：為什么？

實(shí)證方面細(xì)致的工作無疑是 Baba-Yara, Boyer and Davis (2021) 一文的重要貢獻(xiàn)，然而關(guān)于理論模型的討論才是該文畫龍點(diǎn)睛的一筆。

由前文論述可知，站在 MVE 投資組合的視角，一個(gè)多因子模型可以被視為一個(gè)以因子為標(biāo)的構(gòu)造的 MVE 組合的權(quán)重向量。從理論上說，用于構(gòu)造真實(shí) MVE 組合的因子可能會(huì)有很多，而所有給定的多因子模型都帶有某種程度的降維處理。比如，最簡單的 FF3 使用市值和 Book-to-Market Ratio 構(gòu)造因子。這意味著該模型認(rèn)為這兩個(gè)組合在 MVE 組合中的權(quán)重非零，而其他潛在因子的權(quán)重都為零（假設(shè)不考慮市場因子）。類似的，其他傳統(tǒng)模型則是人為地選擇了盈利、投資、動(dòng)量等因子，并認(rèn)為它們的 MVE 權(quán)重不為零；而機(jī)器學(xué)習(xí)方法則更多的通過數(shù)據(jù)驅(qū)動(dòng)的方式來選擇 firm characteristics（以及它們的交互作用）、構(gòu)造因子，并決定因子在 MVE 組合中的權(quán)重。

在這個(gè)視角下，不同的多因子模型可以被理解為對(duì)真實(shí) MVE 組合中的權(quán)重施加了不同的先驗(yàn)（先驗(yàn)的差異造成了第三節(jié)展示的不同模型的 MVE 組合的相關(guān)系數(shù)并不高）。沿著這個(gè)思路，Baba-Yara, Boyer and Davis (2021) 提出了一個(gè)貝葉斯框架的理論模型，并發(fā)現(xiàn)當(dāng)潛在的因子個(gè)數(shù)非常大時(shí)，使用不同先驗(yàn)的模型無法為彼此定價(jià)。此外，哪怕某個(gè)模型是真正的模型（即它的先驗(yàn)是正確的），另外一個(gè)使用不同先驗(yàn)的模型也注定能夠產(chǎn)生該模型無法解釋的超額收益。這就是本文一開始提到的 impossibility result。在協(xié)變量的高維數(shù)時(shí)代，不存在“最優(yōu)”的模型 —— 對(duì)于給定的任意模型，總能找到能夠獲得其無法解釋的超額收益的新模型。

In other words, it is impossible to establish a dominant or best asset pricing model in a high dimensional world. Any model that claims dominance can invariably be dominated by a new model with a slight tweak.

—— Baba-Yara, Boyer and Davis (2021)

近年來，factor (model) war 愈演愈烈。而 Baba-Yara, Boyer and Davis (2021) 一文的實(shí)證結(jié)果和理論模型無疑給人們帶來了全新的思考。至少對(duì)我來說，再看傳統(tǒng)模型在那里 PK 來 PK 去實(shí)在是不痛不癢。對(duì)于業(yè)界實(shí)務(wù)來說，人們使用多因子模型降維是為了減少估計(jì)誤差對(duì) MVE 組合權(quán)重的影響。因此，回答更關(guān)鍵的問題，即應(yīng)該使用何種的先驗(yàn)（回想一下《稀疏性幻覺》）以及如何更合理的使用機(jī)器學(xué)習(xí)方法構(gòu)造因子以及計(jì)算它們的 MVE 權(quán)重，這些才是有價(jià)值的研究。

期待 Baba-Yara, Boyer and Davis (2021) 早日見刊。

參考文獻(xiàn)

Baba-Yara, F., B. Boyer, and C. Davis (2021). The factor model failure puzzle. Working paper.

Bryzgalova, S., M. Pelger, and J. Zhu (2020). Forest through the trees: Building cross-sections of stock returns. Working paper.

Chen, L., M. Pelger, and J. Zhu (2019). Deep learning in asset pricing. Working paper.

Cochrane, J. H. (2005).?Asset Pricing (Revised Edition). Princeton, NJ: Princeton University Press.

Daniel, K., L. Mota, S. Rottke, and T. Santos (2020). The cross-section of risk and returns.?Review of Financial Studies?33(5), 1927 – 1979.

Fama, E. F. and K. R. French (1993). Common risk factors in the returns on stocks and bonds.?Journal of Financial Economics?33(1), 3 – 56.

Fama, E. F. and K. R. French (2015). A five-factor asset pricing model.?Journal of Financial Economics?116(1), 1 – 22.

Gu, S., B. T. Kelly, and D. Xiu (2021). Autoencoder asset pricing models.?Journal of Econometrics?222(1), 429 – 450.

Hou, K., C. Xue, and L. Zhang (2015). Digesting anomalies: An investment approach.?Review of Financial Studies?28(3), 650 – 705.

Kelly, B. T., S. Pruitt, and Y. Su (2019). Characteristics are covariances: A unified model of risk and return.?Journal of Financial Economics?134(3), 501 – 524.

Kozak, S., S. Nagel, and S. Santosh (2020). Shrinking the cross-section.?Journal of Financial Economics?135(2), 271 – 292.

Roll, R. (1977). A critique of the asset pricing theory’s tests Part I: On past and potential testability of the theory.?Journal of Financial Economics?4(2), 129 – 176.

Stambaugh, R. F. and Y. Yuan (2017). Mispricing factors.?Review of Financial Studies?30(4), 1270 – 1315.

免責(zé)聲明：入市有風(fēng)險(xiǎn)，投資需謹(jǐn)慎。在任何情況下，本文的內(nèi)容、信息及數(shù)據(jù)或所表述的意見并不構(gòu)成對(duì)任何人的投資建議。在任何情況下，本文作者及所屬機(jī)構(gòu)不對(duì)任何人因使用本文的任何內(nèi)容所引致的任何損失負(fù)任何責(zé)任。除特別說明外，文中圖表均直接或間接來自于相應(yīng)論文，僅為介紹之用，版權(quán)歸原作者和期刊所有。

亚洲精品国产精品制服丝袜,亚洲欧美日韩精品a∨,97在线热免费视频精品视频,亚洲人成在线观看网站不卡

合格投資者聲明

尋找 Mean-Variance Frontier (II)