p-Hacked Earnings Beta
發(fā)布時間:2020-11-10 | 來源: 川總寫量化
作者:石川
摘要:一頓操作猛如虎,全看 p-value 有沒有。
1?引言
有日子沒有用整篇推文介紹單篇學術(shù)論文了。但今天,有篇文章還是值得拿來說道說道。近日,會計學知名期刊?Review of Accounting Studies? 刊載了一篇題為 Earnings Beta 的文章(Ellahie 2020)。眾所周知,CAPM 使用 market beta 來描述資產(chǎn)的市場風險,但是 CAPM 并不好使,其中部分原因是 market beta 并不能很好的描述公司的基本面風險。Ellahie (2020) 認為 earnings beta 可以取代 market beta 的作用。Earnings beta 被定義為公司特有的 earnings 相對于市場整體 earnings 的敏感程度。
以此為動機,該文研究了基本面風險和資產(chǎn)預期收益的關(guān)系,并以 earnings beta 作為 factor loading,通過常見的 portfolio sort test 和 regression test 進行了實證資產(chǎn)定價研究。結(jié)果表明 earnings beta 的 risk premium 顯著大于零,在控制了常見的因子后依然能夠為解釋資產(chǎn)預期收益率的截面差異提供增量信息。然而這樣一篇內(nèi)容詳實、實證豐富、行文流暢、為人們理解財務信息如何影響預期收益率開辟了新思路的論文卻沒有出現(xiàn)在金融學期刊,而是發(fā)表在會計學期刊。為什么?
因為上面的“然而”并不成立。這篇文章讀下來,必須肯定和認可作者在數(shù)據(jù)處理和實證檢驗方面做的大量細致的工作;該文的實證內(nèi)容的豐富性在同類論文中名列前茅,且使用了一些最新的基于機器學習構(gòu)造的多因子模型作為定價模型。但是,無論是其用來計算 earnings beta 的變量之多、還是實證檢驗結(jié)果的不一致性、以及作者對于矛盾結(jié)果討論的輕描淡寫,都給人強烈的 p-hacking 之感,很難想象它能發(fā)表在 RAS 這個級別的期刊上。
本文就來介紹?Ellahie (2020),只不過這次它不是作為正面的例子,而是作為 p-hacking 的反面教材。下文第二節(jié)將解讀該文中定義的變量 —— 我將它稱作 variable zoo;第三節(jié)將闡述該文中不一致的實證結(jié)果和十分蒼白的解釋;本文第四節(jié)是由此引發(fā)的思考。
頗有意思的是,最近有不少 working paper 研究結(jié)果幾年前就出現(xiàn)了,但輾轉(zhuǎn)多年后都沒能發(fā)在金融學期刊上而是搖身一變出現(xiàn)在會計學期刊上(比如,大名鼎鼎的那啥,對吧)。相較于金融學三大頂刊的影響因子,RAS 著實弱了不少(在會計學細分領(lǐng)域,RAS 大概排在第 4 的位子)。不知這是否預示著文章的 empirical findings 不那么靠譜。
2?Variable Zoo
要想有足夠抓眼球的結(jié)果,變量個數(shù)要保證。
Ellahie (2020) 一文中考慮了 11 個 earnings 變量(每個變量最終衍生出一個 earnings beta) —— 總有一款是顯著的。下面就來看看該文如何“合理地”讓變量的個數(shù)翻倍、再翻倍。首先是最容易想到的,即歷史的 earnings(realized earnings)數(shù)據(jù),為了讓公司之間可比,該文用 book value of equity 以及 market value 做了標準化,因此得到兩個變量:realized ROE 和 realized earnings yield。
下面來看第一個變量翻倍的方法 —— 一階差分。前述兩個變量都是基于 earnings level 計算的;憑什么不能基于 earnings changes,即 earnings growth?“當然可以”。為此,該文還找出了參考文獻 Penman (1991) 和 Penman and Zhang (2002) 來支持 earnings level 可能并不是最好的變量的說法,這讓計算一階差分變得“名正言順”。在這個基礎上,variable zoo 又加入了三個新成員:realized earnings growth、book-scaled realize earnings growth 和 price-scaled realized earnings growth(后兩個分別用 book value 和 market value 標準化 earnings growth)。到現(xiàn)在,一共有了五個變量。(我好奇的問一下:要不要考慮二階差分?其實前不久另一個會計學頂刊 Journal of Accounting and Economics 就刊載了一篇二階差分的論文。)
馬上來看第二個變量翻倍的方法 —— 把 realized earnings 換成 expected earnings,然后把上面的步驟重復一遍。誰說非要用歷史 earnings,尤其考慮到歷史 earnings 包含的信息不完整,為啥不能用未來預期 earnings?“當然可以”。
當把 realized earnings 換成分析師一致預期之后,如法炮制,又可以得到五個 earnings 變量(兩個 level 變量、三個 change 變量),它們是 expected ROE、expected earnings yield、earnings-scaled expectations shock、book-scaled expectations shock 以及 price-scaled expectations shock。
經(jīng)過上述一番操作,一下從最初的 2 個變量變成 10 個。此外,該文指出它們都是短時間尺度的 earnings 變量,雖然它們和預期收益更相關(guān)(話外音就是這些就夠了),但是由于基本面的估值模型需要考慮 infinite horizon 的 earnings,因此出于研究的完整性,又加入了第 11 個長時間尺度的 earnings 的變量。最終,variable zoo 一共包括了 11 個變量。不知道你是否被這么多的變量繞暈了。好在 Ellahie (2020) 的 introduction 部分還貼心的為讀者進行了梳理(其中第四點對應那個長時間尺度的變量),只不過我看后唯一的感受就是 p-hacking。
有了這 11 個變量,Ellahie (2020) 通過五年數(shù)據(jù)的滾動時序回歸計算每個變量的 earnings beta,得到 11 個 earnings beta 變量。在時序回歸中,作為解釋變量的是市場整體的 earnings 變量(由所有公司的 earnings 變量加權(quán)得到):
根據(jù) Ellahie (2020) 提出的假設,如果 earnings beta 能夠代替 market beta 來更好的描述公司的(基本面)風險,那么 earnings beta 應該和公司的預期收益率正相關(guān);從實證資產(chǎn)定價角度來說,earnings beta 的 risk premium 應該顯著為正。結(jié)果如何呢?
3?實證結(jié)果
Ellahie (2020) 這篇文章中的實證結(jié)果不可謂不豐富,該文同時考慮了 portfolio level 和 firm level 的實證分析,但讓人糾結(jié)的是結(jié)果的不一致性以及作者對這些矛盾結(jié)果的蒼白解釋。在 portfolio level,首先是 regression test。這里面又分為好幾組實證。第一組實證是使用 50 個投資組合作為 test assets,然后進行一波 cross-sectional regression test(在此處沒有采用 Fama and MacBeth 1973 regression,而是先求了不同資產(chǎn)的平均收益率,然后只做了一次截面回歸)。這 50 個投資組合分別是使用 size、book-to-price、earnings-to-price、asset growth 以及 long-term return reversal 為變量將股票排序分成 10 組構(gòu)造的。回歸結(jié)果如下(下表中第一個變量為 CAPM 中的 market beta,用來和其他 11 個 earnings beta 比較)。
在 11 個 earnings beta 中,有三個的回歸系數(shù)是負的(其中兩個顯著),這和理論所暗示的正相關(guān)不符。作為讀者,在閱讀到這里其實非常希望看到作者對結(jié)果的探討。然而,Ellahie (2020) 僅表示這可能和 test assets 的選擇有關(guān),而且還把這個解釋放在了 footnote 中。這么草率嗎?
為了解決 test assets 的問題,在第二組實證中,該文使用 Giglio and Xiu (2019) 提出的 three-pass regression estimator(具體介紹見這里)。該方法從 202 個作為 test assets 的投資組合中提取出六個主成分,然后使用它們估計這些 earnings beta 的 risk premium。結(jié)果如下。“好消息”是,這些 earnings beta 的 risk premium 全都是正的了。
比較上面兩個 regression test 結(jié)果,當使用不同的 test assets 時,earnings beta 的 risk premium 估計時而正,時而負;時而顯著,時而不顯著。不禁讓人想起 Lewellen, Nagel, and Shanken (2010) 對使用 portfolios 作為 test assets 進行檢驗的抨擊。遺憾的是,Ellahie (2020) 并沒有對上述不一致的結(jié)果進行過多討論。除了 regression test 之外,portfolio sort 自然也不能少。下圖來自 Ellahie (2020) 的表 7,匯報了使用不同 earnings beta 排序構(gòu)造多空對沖的投資組合 —— 做多 earnings beta 高的、做空 earnings beta 低的 —— 的絕對收益以及相對常見基準模型的超額收益。
表中,VW excess returns 是多空對沖組合的絕對收益;在計算超額收益時,被選作基準的六因子模型是 Fama and French (2015) 五因子 + Carhart (1997) 的動量,另一個基準是 Kelly, Pruitt, and Su (2019) 使用 IPCA 構(gòu)造的五因子模型。令人感到意外的是,在 11 個 earnings beta 中,有 7 個的收益率(無論是絕對收益還是超額收益)都是負的(盡管都并不顯著),和理論相悖;僅有 4 個的收益率為正,其中僅有 2 個是顯著的。這兩個 beta 背后的變量都是通過“變量翻倍”的方法得到的。為什么要用 11 個變量?看到這里我們恍然大悟。
當使用 three-pass regression 時,全部 11 個 earnings beta 的 risk premium 都是正的;然而這個結(jié)果卻輕易的被 portfolio sort test 推翻了。如果說單看 portfolio sort 中不顯著的負收益還不能說明問題,那么當把 portfolio sort 和前述的 regression test 之間的不一致性就不能不令人引起懷疑。畢竟,portfolio sort 只是一種無參數(shù)化的 regression。但該文似乎把不同方法下 Earnings beta 的 risk premium estimate 的巨大差異留給讀者去體會。這么草率嗎?
除使用投資組合檢驗外,Ellahie (2020) 也使用個股收益率,通過 Fama and MacBeth (1973) regression 對 earnings beta 的 risk premium 進行了檢驗。得到的結(jié)果嘛,同樣是有正有負,滿滿的不一致性。不一致性并不可怕,但沒有對結(jié)果的不一致性進行深入的探討卻很可怕。該文的行為之中傳遞給讀者這樣一種(錯誤)信息:只需要采納和理論一致且結(jié)果最顯著的變量。最終,基于大量的 empirical test 以及 11 個變量的表現(xiàn),Ellahie (2020) 得出了如下結(jié)論:
1. Earnings beta 比起 market beta,對資產(chǎn)定價更有幫助;
2. Earnings changes 比 earnings levels 更好使;
3. Expected earnings 比 realized earnings 更有用;
4. 用 market value 來 scaling 比用 book value 來 scaling,結(jié)果更顯著。
如果實證結(jié)果是另一番景象,大概只需要把上述幾條中文字的順序稍加改動。依照上述四點發(fā)現(xiàn),在全部 11 個 earnings beta 里面,最顯著的 earnings beta 是以?price-scaled expectations shock?作為 earinngs 變量計算的 beta,它是一個 earnings change,屬于成長類指標。關(guān)于 earnings change 還有一塊不得不提的研究就是 PEAD。
一旦加入 PEAD,是否僅剩的幾個 earnings beta 也無法獲得顯著的 risk premium 呢?由《Factor War 外傳》的介紹可知,Hou, Xue, and Zhang (2015) 的 q-factor model 中的季度 ROE 和 PEAD 密切相關(guān),那么如果 Ellahie (2020) 使用 q-factor model 作為定價模型,上述 earnings beta 還能否獲得超額收益呢?又或者 Ellahie (2020) 使用了 q-factor model 但是因為不顯著所以沒有匯報呢?
全是疑問。
4?思考
公允的說,Ellahie (2020) 一文沒有試圖隱瞞 empirical test 的不一致性,而是匯報了所有的結(jié)果,這是它的優(yōu)點;然而它通過各種測試、從不同的變量中找到了最顯著的那個來支持提出的觀點,而不去深入探討其他不支持假設的結(jié)果,這不是 p-hacking 又是什么?我似乎看到了 Harvey (2017) 中所描繪的場景。自 Jegadeesh et al. (2019) 和 Fama and French (2020) 發(fā)表以來,我感覺檢驗 time series beta 的 risk premium 已經(jīng)蓋棺定論了,所以各種 earnings beta 的不一致結(jié)果并不令人意外。在面對這些不一致結(jié)果時,“為什么不一致?”而非“如何從不一致中挑出一個最好的?”才是更應該回答的問題。然而就是這么一篇論文,被發(fā)表在了 Review of Accounting Studies 上。
近日,經(jīng)濟學頂刊 The American Economic Review 上刊載了一篇分析 p-hacking 的文章(Brodeur, Cook, and Heyes 2020)。該文分析了經(jīng)濟學領(lǐng)域 top 25 期刊(金融學三大頂刊赫然在列)中使用不同計量經(jīng)濟學方法進行經(jīng)濟學實證分析時的 p-hacking 問題。結(jié)論有三:(1)所有這些期刊上均有 p-hacking 問題;(2)審稿過程一定程度上減弱了 p-hacking 傾向;(3)隨著時間的推移,這個問題有所改進。
但無論如何,學術(shù)界在整改 p-hacking 的問題上還有很長的路要走,而 Ellahie (2020) 只是其中的一個縮影。對于看上去特別顯著的 empirical asset pricing 結(jié)果,use with care。
Earnings beta? Yes, p-hacked earnings beta.
參考文獻
Brodeur, A., N. Cook, and A. Heyes (2020). Methods matter: p-hacking and publication bias in causal analysis in economics. The American Economic Review 110(11), 3634 – 3660.
Carhart, M. (1997). On persistence in mutual fund performance. Journal of Finance 52(1), 57 – 82.
Ellahie, A. (2020). Earnings beta. Review of Accounting Studies forthcoming.
Fama, E. F. and K. R. French (2015). A five-factor asset pricing model. Journal of Financial Economics 116(1), 1 – 22.
Fama, E. F. and K. R. French (2020). Comparing cross-section and time-series factor models. Review of Financial Studies 33(5), 1891 – 1926.
Fama, E. F. and J. D. MacBeth (1973). Risk, return, and equilibrium: Empirical tests. Journal of Political Economy 81(3), 607–636.
Giglio, S. and D. Xiu (2019). Asset pricing with omitted factors. Working paper, Chicago Booth Research Paper No. 16-21.
Harvey, C. R. (2017). Presidential address: The scientific outlook in financial economics. Journal of Finance 72(4), 1399 – 1440.
Hou, K., C. Xue, and L. Zhang (2015). Digesting anomalies: An investment approach. Review of Financial Studies 28(3), 650 – 705.
Jegadeesh, N.,?J. Noh, K. Pukthuanthong, R. Roll, and J. Wang?(2019). Empirical test of asset pricing models with individual assets:?Resolving the errors-in-variables bias?in risk premium estimation. Journal of Financial Economics 133(2), 273?–?298.
Kelly, B., S. Pruitt, and Y. Su (2019). Characteristics are covariances: A unified model of risk and return. Journal of Financial Economics 134(3), 501 – 524.
Lewellen, J., S. Nagel, and J. Shanken (2010). A skeptical appraisal of asset pricing tests. Journal of Financial Economics 96(2), 175 – 194.
Penman, S. (1991). An evaluation of accounting rate-of-return. Journal of Accounting, Auditing and Finance 6(2), 233 – 255.
Penman, S., and X. Zhang (2002). Accounting conservatism, the quality of earnings, and stock returns. The Accounting Review 77(2), 237 – 264.
免責聲明:入市有風險,投資需謹慎。在任何情況下,本文的內(nèi)容、信息及數(shù)據(jù)或所表述的意見并不構(gòu)成對任何人的投資建議。在任何情況下,本文作者及所屬機構(gòu)不對任何人因使用本文的任何內(nèi)容所引致的任何損失負任何責任。除特別說明外,文中圖表均直接或間接來自于相應論文,僅為介紹之用,版權(quán)歸原作者和期刊所有。