資產(chǎn)定價中的實證挑戰(zhàn) (IV)
發(fā)布時間:2025-03-17 | 來源: 川總寫量化
作者:石川
摘要:本文解析協(xié)變量的高維數(shù)時代,實證資產(chǎn)定價研究中計量經(jīng)濟(jì)學(xué)的局限性。
0 前文回顧
協(xié)變量的高維數(shù)給傳統(tǒng)計量經(jīng)濟(jì)學(xué)提出了諸多挑戰(zhàn)。首先,過多的預(yù)測變量可能會存在多重共線性問題,從而使得模型參數(shù)估計變得不穩(wěn)定。有時多重共線性可能導(dǎo)致某些變量的系數(shù)估計符號與預(yù)期不符,造成結(jié)果難以被經(jīng)濟(jì)學(xué)理論所解釋。其次,當(dāng)協(xié)變量的數(shù)量接近或超過樣本大小時,模型會過度參數(shù)化(over-parameterization)。如果不施加正則化,模型會過度擬合數(shù)據(jù)中的噪聲,影響其在樣本外的預(yù)測性能。
上述挑戰(zhàn)使得能夠應(yīng)對維數(shù)災(zāi)難(curse of dimensionality)的推斷方法越來越受歡迎和重視。根據(jù) Ng (2013) 和 Chernozhukov et al. (2017) 的建議,這些方法可以被分為兩類。第一類是稀疏建模,旨在通過一些算法從大量協(xié)變量中找到最具預(yù)測信息的變量。第二類是密集建模,即認(rèn)為盡管個體影響可能很小,但所有協(xié)變量都含有預(yù)測信息。因此,密集建模仍然會使用大量協(xié)變量,但會通過正則化來防止過擬合。下文聚焦于實證資產(chǎn)定價中重要的問題,進(jìn)一步說明計量經(jīng)濟(jì)學(xué)的局限性。
1 稀疏性導(dǎo)致投資機(jī)會的損失
傳統(tǒng)的多因子模型毫無疑問屬于稀疏模型。然而最新的實證研究表明,為了獲得更好的表現(xiàn),定價模型中應(yīng)該納入更多的協(xié)變量,那么為什么傳統(tǒng)多因子模型都是稀疏的呢?為了公允的回答這個問題,我們必須意識到一些早期的模型年代久遠(yuǎn)(比如 Fama-French 三因子模型出現(xiàn)在 30 年前),因此現(xiàn)在的實證發(fā)現(xiàn)遠(yuǎn)非當(dāng)時能比。不過,這一事實依然無法解釋自 2010 年之后新出現(xiàn)的傳統(tǒng)模型所帶有的稀疏性約束。究其原因,可以從兩方面來回答。
第一點是對可解釋性的重視而造成的對簡約性的鐘愛。在傳統(tǒng)多因子模型中,每個模型背后都有一個令人信服的動機(jī)。例如,當(dāng) Fama 和 French 將規(guī)模和價值兩因子加入模型之后,這兩位實證研究的先驅(qū)又花費了很多的精力試圖探討它們分別代表了哪種系統(tǒng)性風(fēng)險(Fama and French 1995, 1996)。又比如 Fama and French (2015) 和 Hou et al. (2015) 這兩個最流行的傳統(tǒng)模型,它們背后的動機(jī)分別為股利貼現(xiàn)模型和實體投資經(jīng)濟(jì)學(xué)理論。再或者 Stambaugh and Yuan (2017) 和 Daniel et al. (2020),它們的出發(fā)點則是行為金融學(xué)。從這理論出發(fā),一個自然的結(jié)果就是模型不會包含太多的因子,否則便難以自圓其說。這也造成了不同的模型依賴于特定的(ad-hoc)稀疏性假設(shè),即每個人選擇幾個以及哪些因子,完全是因動機(jī)而異的、缺乏普適性。
這種因人而異的稀疏性假設(shè)還體現(xiàn)在構(gòu)造因子時的變量選擇上。當(dāng) Fama and French (1993) 構(gòu)造價值因子的時候,除了賬面市值比(BM)之外,還有諸如盈利市值比(EP)等變量供選擇,而他們最終使用 BM 而非 EP 更多的是一個數(shù)據(jù)驅(qū)動的選擇。在三因子模型被提出的前一年,F(xiàn)ama and French (1992) 基于排序和回歸法同時指出,盡管 BM 和 EP 都能預(yù)測收益率,但當(dāng)同時控制它們以及公司市值后,EP 不再顯著,表明 EP 的可預(yù)測性可能源自其和 BM 以及市值的相關(guān)性。不過有意思的是,在二十多年后的一篇針對中國股票市場的論文中,Liu et al. (2019) 卻使用 EP 代替了 BM,原因是在中國股票市場中 EP 比 BM 更能顯著地解釋股票預(yù)期收益率的截面差異。站在機(jī)器學(xué)習(xí)的視角,考慮到兩個變量不同且都帶有一定的預(yù)測信息,也許更好的辦法是將它們結(jié)合起來使用,而非強(qiáng)加稀疏性約束。
第二個原因則是偏技術(shù)性的,和實證方法有關(guān)。Fama and French (1993) 的開創(chuàng)性讓它一舉成為實證研究的標(biāo)桿。自此開始,使用投資組合排序來構(gòu)造因子被競相效仿。在構(gòu)造因子時,為了排除市值的影響,通常的做法是使用目標(biāo)協(xié)變量和市值進(jìn)行雙重排序。有時,為了排除變量間的相互影響,甚至?xí)霈F(xiàn)三個變量進(jìn)行三重排序的情況(例如 Hou et al. 2015)。然而,當(dāng)協(xié)變量繼續(xù)增大時,使用投資組合排序構(gòu)造因子將變得無法操作。
為定量描述一個定價模型代表的投資機(jī)會并考察稀疏性假設(shè)造成的損失,我們可以用該模型的因子作為標(biāo)的,并用它們構(gòu)造均值—方差最優(yōu)化(MVE)投資組合,然后通過考察該 MVE 組合的夏普比率來衡量該因子模型代表的投資機(jī)會。為此,Baba-Yara et al. (2021) 比較了傳統(tǒng)模型和近年來基于機(jī)器學(xué)習(xí)方法提出的實證模型在樣本外能夠獲得的最大夏普比率。
表中結(jié)果清晰地傳遞出,即便是考察樣本外,基于機(jī)器學(xué)習(xí)的這些實證模型也能夠獲得較傳統(tǒng)模型更高的夏普比率。例如,在傳統(tǒng)模型大戰(zhàn)中勝出的 Hou et al. (2015),其樣本外的夏普比率為 1.81。然而,同樣是屬于線性模型的 PCA 模型(Kozak et al. 2020)以及 IPCA 模型(Kelly et al. 2019),其樣本外的夏普比率則高達(dá) 2.77 和 3.21。這些結(jié)果表明了帶有稀疏性假設(shè)的模型在投資機(jī)會方面的不足,也意味著學(xué)術(shù)界數(shù)十年來指望用帶有特定稀疏性約束的簡約因子模型來為資產(chǎn)定價的嘗試注定是徒勞的。
2 測試資產(chǎn)選擇
在實證資產(chǎn)定價中,測試資產(chǎn)(test assets),即用來檢驗定價模型的資產(chǎn)(或為個股,或為由個股構(gòu)造的投資組合),和因子就像是一枚硬幣的兩面,缺一不可。在實證中,因子溢價的強(qiáng)弱在很大程度上依賴于測試資產(chǎn)的選擇,而非因子的固有屬性(Giglio et al. 2025)。然而,在過去的三十年中,雖然學(xué)術(shù)界先后提出了諸多實證模型,但在測試資產(chǎn)方面卻鮮有進(jìn)展。為什么?因為 Fama and French (1993)。
正如前所述,這篇文章不僅僅是多因子模型的開山鼻祖,更是為學(xué)術(shù)界之后近三十年的實證研究鋪墊了一系列基礎(chǔ)的方法論,其中就包括構(gòu)造測試資產(chǎn)的方法。在 Fama and French (1993) 中,二位作者通過雙重排序法不僅構(gòu)建了價值和規(guī)模兩個因子,也同樣構(gòu)造了用于檢驗該模型的測試資產(chǎn)。自此之后,使用市值和另一個協(xié)變量,通過 5 × 5 雙重排序構(gòu)造出 25 個投資組合作為測試資產(chǎn)就成為學(xué)術(shù)界的標(biāo)配。但是,將個股按照某個協(xié)變量排序分組實際上是一種降維處理,所產(chǎn)生的投資組合會丟失掉很多個股收益率在截面上的信息(Lewellen et al. 2010)。如果待檢驗的因子和這些測試資產(chǎn)的分組屬性正交,這種處理方法將不能保證測試資產(chǎn)對于待檢驗的因子有足夠的暴露,進(jìn)而導(dǎo)致無關(guān)因子(或弱因子)問題(Giglio et al. 2025)。以有限個通過雙重排序法構(gòu)造的投資組合作為測試資產(chǎn),大大降低了檢驗多因子模型的門檻。
面對這種困局,通常有兩種解決辦法。第一種是擴(kuò)充作為測試資產(chǎn)的投資組合,即使用更多協(xié)變量作為排序變量來構(gòu)造投資組合(并同時將行業(yè)組合也加入進(jìn)來),從而構(gòu)造上百個測試資產(chǎn)。后續(xù)的很多實證研究都采取了這種方法(例如 Fama and French 2020)。但第種做法仍難言完美。當(dāng)使用協(xié)變量對股票排序時,往往最多同時考慮三個變量進(jìn)行三重排序。如果繼續(xù)增多排序變量的個數(shù)可能導(dǎo)致不合理的結(jié)果,例如無法保證每個組里面有足夠多的股票。
第二個解決辦法是直接使用個股作為測試資產(chǎn)。不過,這給因子暴露的參數(shù)估計帶來了巨大的挑戰(zhàn)。人們之所以鐘愛使用投資組合作為測試資產(chǎn),是因為比起個股,它們的因子暴露估計不容易受到變量誤差(EIV)問題的影響。反觀個股,EIV 問題是個無法逃避的挑戰(zhàn)。為此,Jegadeesh et al. (2019) 通過引入工具變量的方法,在一定程度上降低了 EIV 問題的影響。此外,Clarke and Momeni (2021) 使用雙層自助法實現(xiàn)了利用個股作為測試資產(chǎn)的目標(biāo)。盡管使用投資組合作為測試資產(chǎn)時,因子暴露的估計更加準(zhǔn)確,但是 Ang et al. (2020) 從指出,這個好處并不能直接導(dǎo)致在估計因子溢價時獲得更低的標(biāo)準(zhǔn)誤(standard error)。這是由于因子風(fēng)險溢價的標(biāo)準(zhǔn)誤是由因子暴露的截面分布以及殘差風(fēng)險決定的。使用投資組合作為測試資產(chǎn)破壞了因子暴露的分散度所涵蓋的信息,從而導(dǎo)致了較大的標(biāo)準(zhǔn)誤。
3 模型設(shè)定偏誤
模型設(shè)定偏誤往往是帶有稀疏性約束的實證模型所面臨的問題。模型設(shè)定偏誤包括遺漏變量和無關(guān)變量兩方面。例如,F(xiàn)ama and French (2015) 曾指出 Fama and French (1993) 三因子模型是不完整的,以及加入了盈利和投資兩因子后,價值因子似乎變得多余。
首先來看前者。遺漏變量問題指的是模型中遺漏了重要的解釋變量。對實證資產(chǎn)定價而言,遺漏變量可導(dǎo)致因子溢價的估計存在偏差,且偏差的方向可正可負(fù)。為理解這一點,考慮下面這個簡單的模型,即假設(shè)在真實數(shù)據(jù)生成過程中?
?
接下來,假設(shè)我們分析中遺漏了變量?
式中?
為了檢驗一個給定的多因子模型中是否存在遺漏變量,Gagliardini et al. (2019) 提出了一個簡單有效的方法。如果不存在遺漏變量問題,則測試資產(chǎn)對多因子模型回歸的殘差中就不應(yīng)該存在殘留的因子結(jié)構(gòu)。殘留的因子結(jié)構(gòu)可以通過分析殘差協(xié)方差矩陣最大的特征值來確定。若該特征值超過了一定閾值就可以認(rèn)為殘差并不獨立,存在遺漏變量問題。不過很顯然,這種方法也在很大程度上受到測試資產(chǎn)選擇的影響。
再來看后者,即無關(guān)變量問題。由計量經(jīng)濟(jì)學(xué)的知識可知,回歸模型中存在不相關(guān)的變量雖然不會影響其他解釋變量回歸系數(shù)的無偏性,但是會增大回歸系數(shù)的標(biāo)準(zhǔn)誤,從而降低估計量的效率。在多因子模型的場景下,上述過度識別問題的表現(xiàn)為模型中加入了弱因子,即和資產(chǎn)相關(guān)性非常微弱的因子。在這樣的模型設(shè)定下,一個常見的結(jié)果是弱因子的因子溢價很顯著,而真實的因子的溢價不顯著,從而造成真實的因子被舍棄(Gospodinov et al. 2014)。就這一問題,Bryzgalova et al. (2023) 通過貝葉斯方法給出了弱因子存在的前提下如何準(zhǔn)確估計因子溢價的方法。
4 What's Next
上述分析表明,當(dāng)面對時序和截面收益率數(shù)據(jù)量有限、同時存在大量具有預(yù)測信息的協(xié)變量、并且協(xié)變量之間可能通過交互作用對收益率產(chǎn)生非線性影響時,傳統(tǒng)的計量經(jīng)濟(jì)學(xué)方法往往顯得低效甚至難以適用。在這種背景下,機(jī)器學(xué)習(xí)算法或許不再是錦上添花,而是成為解決問題的關(guān)鍵工具。
那么,機(jī)器學(xué)習(xí)將如何應(yīng)對上述計量經(jīng)濟(jì)學(xué)所面臨的種種困難?而其自身在實證資產(chǎn)定價中的應(yīng)用又將遇到哪些挑戰(zhàn)?且聽下回分解。
參考文獻(xiàn)
Ang, A., J. Liu, and K. Schwarz (2020). Using stocks or portfolios in tests of factor models. Journal of Financial and Quantitative Analysis 55(3), 709–750.
Baba-Yara, F., B. H. Boyer, and C. Davis (2021). The factor model failure puzzle. Working paper, Indiana University, Brigham Young University.
Bryzgalova, S., J. Huang, and C. Julliard (2023). Bayesian solutions for the factor zoo: We just ran two quadrillion models. Journal of Finance 78(1), 487–557.
Chernozhukov, V., C. Hansen, and Y. Liao (2017). A lava attack on the recovery of sums of dense and sparse signals. The Annals of Statistics 45(1), 39–76.
Clarke, C. and M. Momeni (2021). Testing asset pricing models on individual stocks. Technical report, University of Kentucky.
Daniel, K. D., D. A. Hirshleifer, and L. Sun (2020). Short- and long-horizon behavioral factors. Review of Financial Studies 33(4), 1673–1736.
Fama, E. F. and K. R. French (1992). The cross-section of expected stock returns. Journal of Finance 47(2), 427–465.
Fama, E. F. and K. R. French (1993). Common risk factors in the returns on stocks and bonds. Journal of Financial Economics 33(1), 3–56.
Fama, E. F. and K. R. French (1995). Size and book-to-market factors in earnings and returns. Journal of Finance 50(1), 131–155.
Fama, E. F. and K. R. French (1996). Multifactor explanations of asset pricing anomalies. Journal of Finance 51(1), 55–84.
Fama, E. F. and K. R. French (2015). A five-factor asset pricing model. Journal of Financial Economics 116(1), 1–22.
Fama, E. F. and K. R. French (2020). Comparing cross-section and time-series factor models. Review of Financial Studies 33(5), 1891–1926.
Gagliardini, P., E. Ossola, and O. Scaillet (2019). A diagnostic criterion for approximate factor structure. Journal of Econometrics 212(2), 503–521.
Giglio, S., D. Xiu, and D. Zhang (2025). Test assets and weak factors. Journal of Finance 80(1), 259–319.
Gospodinov, N., R. Kan, and C. Robotti (2014). Misspecification-robust inference in linear asset-pricing models with irrelevant risk factors. Review of Financial Studies 27(7), 2139–2170.
Hou, K., C. Xue, and L. Zhang (2015). Digesting anomalies: An investment approach. Review of Financial Studies 28(3), 650–705.
Jegadeesh, N., J. Noh, K. Pukthuanthong, R. Roll, and J. Wang (2019). Empirical tests of asset pricing models with individual assets: Resolving the errors-in-variables bias in risk premium estimation. Journal of Financial Economics 133(2), 273–298.
Kelly, B. T., S. Pruitt, and Y. Su (2019). Characteristics are covariances: A unified model of risk and return. Journal of Financial Economics 134(3), 501–524.
Kozak, S., S. Nagel, and S. Santosh (2020). Shrinking the cross-section. Journal of Financial Economics 135(2), 271–292.
Lewellen, J., S. Nagel, and J. Shanken (2010). A skeptical appraisal of asset pricing tests. Journal of Financial Economics 96(2), 175–194.
Liu, J., R. F. Stambaugh, and Y. Yuan (2019). Size and value in China. Journal of Financial Economics 134(1), 48–69.
Ng, S. (2013). Variable selection in predictive regressions. In Handbook of Economic Forecasting, Vol. 2, pp. 752–789. Amsterdam: Elsevier.
Stambaugh, R. F. and Y. Yuan (2017). Mispricing factors. Review of Financial Studies 30(4), 1270–1315.
免責(zé)聲明:入市有風(fēng)險,投資需謹(jǐn)慎。在任何情況下,本文的內(nèi)容、信息及數(shù)據(jù)或所表述的意見并不構(gòu)成對任何人的投資建議。在任何情況下,本文作者及所屬機(jī)構(gòu)不對任何人因使用本文的任何內(nèi)容所引致的任何損失負(fù)任何責(zé)任。除特別說明外,文中圖表均直接或間接來自于相應(yīng)論文,僅為介紹之用,版權(quán)歸原作者和期刊所有。