Factor War 外傳
發(fā)布時間:2020-10-27 | 來源: 川總寫量化
作者:石川
摘要:Novy-Marx 又出來搞事情。無論你同意與否,他都成功敲響了 wake-up call。
1?引言
自 Cochrane (2011) 的鏗鏘三問以及 Harvey (2017) 的大聲疾呼之后,學界在 factor zoo 的問題上有所收斂,但卻將戰(zhàn)場引到了模型之間的比拼。近年來,學術界圍繞哪家多因子模型更勝一籌展開了激烈的競爭。從 Barillas and Shanken (2018) 到 Fama and French (2018),從 Hou et al. (2019, 2020) 到 Fama and French (2020),各路神仙斗的不亦樂乎。需要背景知識的小伙伴請參考《從 Factor Zoo 到 Factor War:實證資產(chǎn)定價走向何方》以及《A New Norm ?》。一場轟轟烈烈的 factor war 絲毫沒有要停歇的意思。而在這場變革中,一位資深學者也不甘寂寞,他就是憑借 gross profitability 盈利因子一舉成名的 Robert Novy-Marx。
最近幾年,Novy-Marx 一直通過寫作參與 factor war 這個話題。而他的很多 empirical findings,雖然不一定所有人都同意,也足夠引起人們的重視:在 p-hacking 之風盛行的當下,多因子模型之間的 pk 到底產(chǎn)生了多少價值?今天這篇小文以《Factor War 外傳》為題,圍繞 Novy-Marx 的一些發(fā)現(xiàn)來再次審視 factor war 這個問題。我個人的觀點是,無論你是否同意他的發(fā)現(xiàn),Novy-Marx 都成功敲響了 wake-up call。
2?為什么 q-factor model 能解釋動量 ?
最近幾年,Hou, Xue, and Zhang (2015) 基于 q-theory 提出的 q-factor model 可謂大放異彩。無論是以定價 anomalies 還是不同模型的因子之間相互解釋而言,q-factor model 都吊打包括 Fama and French (1993, 2015) 三/五因子模型在內(nèi)的諸多對手(關于不同模型的介紹,見《主流多因子模型巡禮》)。q-factor model 包括市場、規(guī)模、投資和盈利四個因子;其中后兩者直接從 q-theory 推導而來。在 Hou, Xue, and Zhang (2015) 一文中,三位作者花了不少筆墨通過檢驗不同模型下異象的定價錯誤高低,并以此說明 q-factor model 的優(yōu)秀。而其中一個令人印象深刻的結果是,q-factor model 能夠輕而易舉的解釋動量。下圖節(jié)選自該文的表 4,其中 R6-6 以及 R11-1 代表兩個常見的(中期)動量異象。在 q-factor 模型下,這兩個異象 abnormal return 的 t-值僅分別為 0.71 和 0.54。
與其形成鮮明對比的是這兩個異象在 Fama-French 模型上的 abnormal returns,它們的 t-值均超過 4.0。眾所周知,由于無法被解釋,動量一直是 Fama-French 三、五因子模型的“痛”,而這也是為什么 Eugene Fama 在 Fama and French (2018) 中將動量視作一個因子加入了模型,這才有了后來的 Fama-French 六因子模型之說(盡管如此,F(xiàn)ama 依然提倡謹慎地對待動量)。然而,動量異象在 q-factor model 之下神奇的消失了。更令人感到費解的是,F(xiàn)ama and French (2015) 五因子模型同樣包含投資和盈利因子,但卻對動量無能為力。那么為什么 q-factor model 能夠解釋動量?是否 q-theory 和股票的 price momentum 有什么瓜葛?對此,Novy-Marx (2018b) 給出了自己的看法:q-factor model 能夠解釋動量,僅僅是個美麗的錯誤。
要搞清楚為什么 q-factor model 能夠解釋動量,就必須從理解它的因子出發(fā),而這里起到關鍵作用的就是其中基于單季度 ROE 來構造的盈利因子。這也成為 Novy-Marx 抨擊的對象。根據(jù)定義,Novy-Marx 將單季度 ROE 做了如下分解:
式中 E 為當季的 earnings,B_{-1} 為滯后了一個季度的 book value,E_{-4} 為滯后 4 個季度的 earnings。根據(jù)上述分解,單季度 ROE 被分解成兩部分:第一部分為 lagged-E/B,第二部分為 ΔE/B。如何理解這兩個部分呢?不妨先來看一張圖。
上圖顯示了和單季度 ROE 有著千絲萬縷關聯(lián)的幾個變量構造的異象投資組合的累計收益曲線。這些變量包括:PEAD(依照學術界定義、使用 SUE 構造)、ΔE/B、E/B 以及 lagged-E/B,其中 E/B 是每年 6 月末使用年報中的 earnings 和 book value 計算的盈利的低頻分量。實證數(shù)據(jù)顯示,PEAD 和 ΔE/B 收益率的相關性非常高(80.9%;且回歸結果顯示 ΔE/B 其實就是一個 PEAD 因子),而 E/B 和 lagged-E/B 收益率的相關性也非常高(89.9%)?;仡?Novy-Marx (2018b) 對單季度 ROE 的分解,并結合上述實證結果,Novy-Marx 認為單季度 ROE 中所包含的兩項分別為低頻盈利分量(lagged-E/B)和高頻的 earnings innovation(ΔE/B)。而他認為這種混搭搞砸了一切。
回歸分析顯示,單季度 ROE 之所以能夠解釋動量是因為其中的 ΔE/B 發(fā)揮了作用;由于 ΔE/B 是一個 PEAD 因子,PEAD 也應能夠解釋動量。這些結論在美股的實證分析中均得到了確認。然而,這卻引出了另一個問題,為什么 PEAD 能夠解釋動量?對于這個問題,Novy-Marx (2018a) 也早有研究,該文的標題簡潔的概括了他的觀點:Fundamentally, momentum is fundamental momentum。他認為股價的動量是基本面動量的體現(xiàn),其內(nèi)在的核心是基本面的動量,而 PEAD 是基本面動量的一個很好的 measure,因此 PEAD 可以解釋動量。基于上述結果,單季度 ROE 之所以能夠解釋動量,是因為其中的 ΔE/B 部分,而非低頻盈利分量。這個結果似乎合情合理,它能夠很好地回答為什么 Fama-French 的盈利因子對動量無能為力,因為他們的 RMW 盈利因子使用的年報數(shù)據(jù),僅對應單季度 ROE 中的低頻盈利分量,而不包含 earnings innovation 部分。
除了動量外,另一個不能被 Fama-French 模型解釋但卻在 q-factor model 前面“敗下陣來”的因子則是 Novy-Marx (2013) 自己提出的 gross profitability 盈利因子(以下記為 PMU)。該因子在 q-factor model 下的 abnormal return 的 t-值僅為 0.71。為此,Novy-Marx (2018b) 也對此進行了分(pi)析(pan)。Again,q-factor model 能夠解釋 PMU 也是一個錯誤。為了說明這一點,仍然將 ROE 拆成低頻盈利 + 高頻 earnings innovation 兩部分,并通過不同的解釋變量來解釋 PMU。下表給出了實證結果。模型(3)-(5)顯示加入了 ROE 之后,確實可以解釋 PMU(α 的 t-值不超過 1.60)。然而在模型(6)和(7)中,當使用 lagged-E/B 和 ΔE/B 替代 ROE 時,結果卻出乎意料 —— PMU 無法被解釋,其 abnormal return 的 t-值在這兩個模型設定下分別為 2.19 和 3.24。
為什么會出現(xiàn)這種背離,即單季度 ROE 作為一個整體可以解釋 PMU,但當把它拆開稱為低頻盈利 + 高頻 earnings innovation 后卻不再能解釋 PMU 了呢?實證結果顯示,單季度 ROE 中的低頻分量很大程度上和 PMU 因子 co-vary(這很好理解,因為 PMU 也用的年報的數(shù)據(jù)),而單季度 ROE 中的高頻 ΔE/B 自身有很高的溢價(它就是個 PEAD 嘛,它也是 ROE 高溢價的來源)。二者的共同作用導致單季度 ROE 和 PMU 有很強的相關性(來自低頻分量),且 ROE 的高溢價(來自高頻分量)又很大程度上解釋了 PMU 的高溢價,二者疊加造成單季度 ROE 解釋 PMU。一旦將二者的混搭拆開,變成兩個單獨的因子,由于 PMU 僅和低頻分量高度相關、但低頻分量沒有什么溢價,因此 PMU 無法再被解釋。綜上所述,單季度 ROE 能夠解釋 PMU 只是個錯誤。
結合上面的實證結果和討論可知,雖然單季度 ROE 能夠解釋動量和 gross profitability,但發(fā)揮作用的均是其中的 earnings innovation 部分(前者的原因是價格動量由基本面動量驅(qū)動;后者的原因僅僅是混搭造成的錯誤),而非真正的低頻盈利分量。因此,Novy-Marx 指出 q-factor model 中基于單季度 ROE 構造的因子并非盈利因子,而是一個 PEAD 因子(ΔE/B 背后的驅(qū)動原因是 PEAD),它和 q-theory 沒什么關系。這挑戰(zhàn)了 q-factor model 的根基。
3?Cost Matters
相比于 Novy-Marx (2018b) 僅僅針對 q-factor model 來分析,他和兩位合作者的另一篇新作(Detzel, Novy-Marx, and Velikov 2019)則討論了所有常見的多因子模型。該文比較了下表中的模型。需要說明的是,這篇文章目前還沒被掛在 SSRN 上,但從網(wǎng)上依然能找到一些頗有意思的結果。
在研究多因子模型時,test assets 和 factor model 同樣重要。一般來說,各種異象被用來當作 test assets(見《Which test assets ?》)。從資產(chǎn)定價的角度來說,在檢驗多因子模型時,無論異象和因子的收益率均不需要考慮交易成本(學術界也是這么做的)。然而,由于 p-hacking 的問題,大量挖出的異象都是虛假的,在樣本外以及考慮了合理的交易成本后根本無法獲得顯著的超額收益。
為此,不少學者主張考慮了成本之后的異象才對投資實務有價值。在這個背景下,一個關聯(lián)的問題是,當 test assets 的收益率考慮了交易成本后,多因子模型中的 factor returns 是否也應該扣掉交易費用?顯然,使用理論的 on paper 因子收益率檢驗扣除交易成本的異象收益率并不合理。因此,這個問題的答案應該是肯定的。Campbell Harvey 教授也強調(diào)過這一點。(順便提一句:順著這個思路,使用理論的因子收益率分析基金經(jīng)理實際交易出來的策略的收益率,也會造成基金經(jīng)理超額收益結果被低估,因此不夠合理。)
因此,任你一個多因子模型中的因子的理論收益率再高,由因子 span 得到的 tangency portfolio 的夏普率再大,若沒有考慮交易成本也是白搭。正是在上述背景下,Detzel, Novy-Marx, and Velikov (2019) 一文分析了不同模型在考慮了交易成本之后的效果。結果嘛,至少在該文的樣本中,F(xiàn)ama and French 依然笑到了最后;而 q-factor model 真是情何以堪。
為了確保結果的客觀性,我也查到了另外一篇文獻(Chabi-Yo, Goncalves, and Loudis 2020),它也得到了類似的結果(僅看下圖中 panel a 即可)。有意思的是,雖然 q-factor model(圖中 q4)在考慮了成本后和 Fama-French 系列模型沒啥差異,但是 q5(Hou et al. 2020)依然很優(yōu)秀。
不管怎樣,本小節(jié)介紹問題為多因子模型的比較提出了新的挑戰(zhàn)。在《因子投資:方法與實踐》的第 4.4 節(jié)中,我們討論了多因子模型的簡約性問題,并指出隨著模型復雜度的提升,模型總能解釋越來越多的異象。當更高的交易成本伴隨更復雜的因子(使用多個變量構造)或包含更多因子的模型而來時,人們就不得不考慮它的影響。而當考慮了交易成本之后,很多先前的認知和實證結果就會被打破。
4?思考
本文的二、三小結以 Novy-Marx 和其合作者的兩篇論文為背景,介紹了 factor war 的最新進展。除此之外,還有一個小插曲值得品味。在 Novy-Marx (2018b) 的腳注 1 中,他也對 q-factor model 的 ROE 因子是否存在使用未來數(shù)據(jù)也有質(zhì)疑。這里的未來數(shù)據(jù)指的是在歷史時點錯誤使用事后修正的數(shù)據(jù)。
對美股而言,Compustat 有很多數(shù)據(jù)庫(下圖)。根據(jù)不同數(shù)據(jù)庫的說明,Snaphot、Point-in-Time、Unrestated Quarterly 應不存在上述未來數(shù)據(jù)問題。但如果使用 Historical 數(shù)據(jù)庫,由于它使用修正的數(shù)據(jù)覆蓋原始數(shù)據(jù),且不保留原始數(shù)據(jù),因此就會出現(xiàn)上述問題。從官方介紹可知,不存在問題的數(shù)據(jù)庫的季度數(shù)據(jù)僅能追溯到 1987 年。
而另一方面,Hou, Xue, and Zhang (2015) 的實證區(qū)間從 1972 年開始。這意味著其僅能使用 Historical 數(shù)據(jù)庫,因此也就難逃修正造成的未來數(shù)據(jù)的問題,一如 Novy-Marx (2018b) 指出的那樣。
前文《q-factor model 往事》曾介紹過 q-factor model 誕生背后的種種,也提到了 Novy-Marx 在其中發(fā)揮的微妙作用。因此,實在不理解為什么他對 q-factor model 這么大“意見”。當然,我們關心的也不是他和 q-factor model 的恩怨情仇,而是從這些實證研究中到底能夠獲得怎樣的啟發(fā)。
作為本文的結尾,下面就簡要談談對 factor war 的思考(特別感謝 [因子動物園] 園長和我進行的深入探討)。首先來說 Novy-Marx (2018b) 對單季度 ROE 的拆解以及實證結果。無論人們是否同意他的做法,該文的結果都在呼吁不應該僅僅因為一個模型能夠解釋更多的異象就簡單粗暴的理解它更好。如果從模型提出的機制出發(fā),它不應該能解釋某個異象(比如 Daniel, Hirshleifer, and Sun 2020 三因子模型從原理上就不應該解釋 size,而它也確實無法解釋 size)但實證結果卻矛盾,那么就值得深思。而這其實也引出了更一般的問題,即多因子模型的評價很大程度上取決于 test assets 的選擇。而使用各種異象作為 test assets 也并非最合理的處理方式(見《Which test assets ?》)。當評價結果非常依賴 test assets 而 test assets 本身又沒有定論時,以此為判定依據(jù)的 factor war 就沒有價值。拋開 test assets 不說,如果以 tangency portfolio 的夏普率來評判,那就要考慮本文第三節(jié)提到的問題:cost matters。在這個問題上,學界顯然也還有很長的路要走。而 Fama and French (2018) 也曾呼吁,以最大化 tangency portfolio 夏普率來挑選因子實在是本末倒置。
除了上述幾點,[因子動物園] 園長還補充了 Bryzgalova, Huang, and Julliard (2020) 一文,對 factor war 提出了新的見解。該文基于 51 個因子的所有可能組合,構造了 2.25 × 10^15 個模型(對,10 的 15 次方……),然后使用貝葉斯方法發(fā)現(xiàn)概率最大的 1000 個模型的概率之和非常低,即真實模型的分布相當離散。如果有相對占優(yōu)的模型,參照一般的統(tǒng)計規(guī)律,不同模型為真的概率應該是冪律變化的,但候選因子模型的表現(xiàn)顯然并非如此。也許,factor war 永遠不會有答案,而我們也不應在這個問題上糾結下去。
參考文獻
Barillas, F. and J. Shanken (2018). Comparing asset pricing models.?Journal of Finance 73(2), 715 – 754.
Bryzgalova, S., J. Huang, and C. Julliard (2020). Bayesian solutions for the factor zoo: We just run two quadrillion models. Working paper.
Chabi-Yo, F., A. S. Goncalves, and J. Loudis (2020). An intertemporal risk factor model. Working paper.
Cochrane, J. H. (2011). Presidential address: Discount rates. Journal of Finance 66(4), 1047 – 1108.
Daniel, K. D., D. A. Hirshleifer, and L. Sun (2020). Short- and long-horizon behavioral factors.Review of Financial Studies 33(4), 1673 – 1736.
Detzel, A., R. Novy-Marx, and M. Velikov (2019). Model selection with transaction costs. Working paper.
Fama, E. F. and K. R. French (1993). Common risk factors in the returns on stocks and bonds. Journal of Financial Economics 33(1), 3 – 56.
Fama, E. F. and K. R. French (2015). A five-factor asset pricing model. Journal of Financial Economics 116(1), 1 – 22.
Fama, E. F. and K. R. French (2018). Choosing factors. Journal of Financial Economics 128(2), 234 – 252.
Fama, E. F. and K. R. French (2020). Comparing cross-section and time-series factor models.Review of Financial Studies 33(5), 1891 – 1926.
Harvey, C. R. (2017). Presidential address: The scientific outlook in financial economics.Journal of Finance 72(4), 1399 – 1440.
Hou, K., H. Mo, C. Xue, and L. Zhang (2019). Which factors? Review of Finance 21(1), 1 – 35.
Hou, K. H. Mo, C. Xue, and L. Zhang (2020). An augmented q-factor model with expected growth.?Review of Finance forthcoming.
Hou, K., C. Xue, and L. Zhang (2015). Digesting anomalies: An investment approach. Review of Financial Studies 28(3), 650 – 705.
Novy-Marx, R. (2013). The other side of value: The gross profitability premium. Journal of Financial Economics 108(1), 1 – 28.
Novy-Marx, R. (2018a). Fundamentally, momentum is fundamental momentum. Working paper.
Novy-Marx, R. (2018b). How can a q-theoretic model price momentum? Working paper.
免責聲明:入市有風險,投資需謹慎。在任何情況下,本文的內(nèi)容、信息及數(shù)據(jù)或所表述的意見并不構成對任何人的投資建議。在任何情況下,本文作者及所屬機構不對任何人因使用本文的任何內(nèi)容所引致的任何損失負任何責任。除特別說明外,文中圖表均直接或間接來自于相應論文,僅為介紹之用,版權歸原作者和期刊所有。