出色不如走運 (IV)?

發(fā)布時間：2020-04-27 | 來源: 川總寫量化

作者：石川
摘要：繼 Harvey, Liu, and Zhu (2016) 把因子顯著性 t-statistic 閾值提升到 3.0 之后，如今它又被提升到 3.4 以上？

00?引言

上周，Review of Financial Studies 發(fā)布了最新的一刊（2020 年五月刊）。令人頗為驚喜的是，它是一個關(guān)于股票截面收益率研究新方法的特刊（Special Issue: New methods in the cross-section）。下圖是這期的封面，羅列它所包含的文章。除了第一篇是來自編輯的介紹軟文外，從第二篇 Eugene Fama 和老搭檔 Ken French 的文章開始就是被收錄的論文。大咖云集、眾星閃耀。

關(guān)于這 9 篇論文，本公眾號和 [因子動物園] 之前零星介紹過一些（因為有些能夠在 SSRN 上拿到早期的研究手稿），例如 Fama and French (2020)，Daniel et al. (2020) 以及 Gu, Kelly, and Xiu (2020) 等；另外相信各位小伙伴對于 Hou, Xue, and Zhang (2020) 的 Replicating Anomalies 也一定不陌生（這篇文章終于見刊了?。?。

本文的目的并非逐一介紹這個特刊收錄每篇論文，而是重點關(guān)注其中的一篇。也許各位已經(jīng)從本文的題目猜到了，它是《出色不如走運》系列的最新一篇，而這一系列所闡述的都是到底如何排除運氣的成分、找到真正顯著的異象。因此，本文的主要內(nèi)容就是介紹 Chordia, Goyal, and Saretto (2020) 這篇題為 Anomalies and false rejections 的論文。

當然，由于特刊過于精彩，它精彩的勾勒出關(guān)于截面預(yù)期收益率研究的三個趨勢。因此本文也會對其進行簡要介紹。下文的第一節(jié)將會深入淺出的解讀 Chordia, Goyal, and Saretto (2020)；第二節(jié)會介紹特刊中的三大趨勢；第三節(jié)總結(jié)。

需要背景知識的小伙伴，請參考本系列的前幾篇文章《出色不如走運?》、《出色不如走運(II)?》以及《出色不如走運(III)?》。

01?Chordia, Goyal, and Saretto (2020)

本節(jié)簡要介紹 Chordia, Goyal, and Saretto (2020) 一文的核心思想和結(jié)論。行文會盡可能采用直白的方式，輔以少量的公式。對技術(shù)細節(jié)感興趣的小伙伴請直接閱讀論文原文。

近年來，學(xué)術(shù)界越來越重視多重假設(shè)檢驗（multiple hypothesis testing，簡稱 MHT 問題）對異象顯著性的影響。所謂 MHT 問題，就是說當很多學(xué)者對著同樣的數(shù)據(jù)（過去幾十年的美股數(shù)據(jù)）挖異象的時候，僅靠運氣就能發(fā)現(xiàn)很多顯著的異象。舉個具象一些的例子，比如同時測了 100 個異象，其中最高的那個的 t-statistic 就會很高 —— 哪怕從金融學(xué)角度來說它可能和股票收益率根本沒什么關(guān)聯(lián)。MHT 問題的存在使得單一檢驗的 t-statistic 被高估了，即里面有運氣的成分。當排除了運氣成分后，該異象很可不再顯著。如果仍然按照傳統(tǒng)意義上的 2.0 作為 t-statistic 閾值來評價異象是否顯著，一定會有很多 false rejections。MHT 問題的核心就是控制 false rejections 發(fā)生的概率。這意味著，單一異象的 t-statistic 只有比傳統(tǒng)意義上的 2.0 要高的多，那么這個異象才在控制了 false rejections 概率之后仍然有可能是真實的。

因此，問題的核心就是：t-statistic 的閾值應(yīng)該是多少？關(guān)于這個問題，統(tǒng)計學(xué)和醫(yī)學(xué)界做過大量的研究。而金融領(lǐng)域開始（格外）重視它大概是在近 5 年。其中的代表是 Harvey, Liu, and Zhu (2016) 這篇同樣發(fā)表在 Review of Financial Studies 上的論文，它把 t-statistic 從 2.0 提升至 3.0。而今天的這篇 Chordia, Goyal, and Saretto (2020) 從某種程度上正是對標了 Harvey, Liu, and Zhu (2016)。為了回答 t-statistic 閾值是多少，需要有兩個問題需要解決。先來看第一個，即使用何種算法來控制 false rejections 的概率。就這個問題，學(xué)術(shù)界提出了很多不同的方法，下面借助下表來解釋它們。

假設(shè)一共研究了 S 個異象，其中 S_0 個在原假設(shè)下為真（即不能預(yù)測收益率），S_1 個在原假設(shè)下為假（即能夠預(yù)測收益率）。接下來，按 5% 的顯著性水平對每個 hypothesis 進行檢驗，并一共拒絕了 R 個假設(shè)，其中 F_1 個 false rejections（因為它們的原假設(shè)為真）。使用 F_1 和 R 可以定義一些不同的統(tǒng)計量，而不同的 MHT 算法是以控制不同的統(tǒng)計量為目標。這些統(tǒng)計量包括三大類：FWER、FDR 和 FDP。

FWER 是 familywise error rate，控制它相當于：

其中 α 為顯著性水平。由定義可知，F(xiàn)WER 是控制出現(xiàn) 1 個 false rejection 的概率。常見的算法包括 Bonferroni 和 Holm 方法（見《出色不如走運(II)?》），以及 White (2000) 的 bootstrap reality check 算法和 Romano and Wolf (2005) 的 StepM 算法等。毫無疑問，這個控制太過嚴苛，不適用于分析異象。

FDR 是 false discover rate，它是 F_1/R 的期望。因此控制它相當于：

從定義可知，F(xiàn)DR 比 FWER 要溫和得多，它允許 F_1 著 R 的增大而成比例上升。常見的算法為 BHY 方法（見《出色不如走運(II)?》）。

FDP 是 false discovery proportion，它和 FDR 類似，控制它相當于：

它的含義是控制偽發(fā)現(xiàn)比例（F_1/R）超過 γ 的概率低于顯著性水平 α。這其中著名的算法包括 Romano and Wolf (2007) 以及 Romano, Shaikh, and Wolf (2008)。

Chordia, Goyal, and Saretto (2020) 選擇的控制 false rejections 的對象是控制 FDP（他們并非“憑空想象”而是給出了理由）。該文采用了 Romano and Wolf (2007) 以及 Romano, Shaikh, and Wolf (2008) 的算法，并結(jié)合 bootstrap 方法以保留異象之間的相關(guān)性。具體方法本文暫且不表，感興趣的朋友請參考論文原文，因為選擇哪種控制算法并不是 Chordia, Goyal, and Saretto (2020) 一文的核心貢獻。

前文說過，要找到正確的閾值，需要解決兩個問題。第一個問題是選擇如何控制 false rejections。但是，這并不是問題的關(guān)鍵。計算 t-statistic 閾值的關(guān)鍵是下面馬上要介紹的第二個問題 —— 學(xué)術(shù)界到底挖了多少個異象？為什么說這個問題重要？因為這個基數(shù)決定了運氣的多寡。這就好比，檢驗 100 個和 10000 個異象相比，萬里挑一的肯定要比百里挑一的更顯著。所以，只有知道學(xué)術(shù)界到底挖了多少異象，才有可能正確給出 t-statistic 的閾值，而這個問題比如何控制 false rejections 重要的多。

有的小伙伴可能會說 —— 不就那 300 來個嗎，就是 Harvey, Liu, and Zhu (2016) 考慮的那些；或者 450 個左右，就是 Hou, Xue, and Zhang (2020) 復(fù)現(xiàn)的那些。答案并沒有這么簡單。其原因是，一個異象之所以被發(fā)表，顯然因為它本身達到了傳統(tǒng)意義上的顯著性水平（如 2.0）。如果一個學(xué)者研究出來的異象不顯著，那么他也不會針對它寫篇論文，或者即便寫了也不會被發(fā)表。令 P 代表被發(fā)表的異象的集合，R 代表被挖出來的異象的集合，由上述的論述可知 P 是 R 的一個子集。且我們可以合理的假設(shè)它們大約滿足如下的關(guān)系：

由于 P 僅僅是 R 的子集（“下界”），使用 P 來進行 false rejections 控制只能低估了運氣的成分，因此 Harvey, Liu, and Zhu (2016) 找到的 3.0 閾值只可能是真實 t-statistic 閾值的下限。有了 R 的“下界”，再來看看“上界”。Chordia, Goyal, and Saretto (2020) 使用財務(wù)三大表中的指標，經(jīng)過“無腦”加減乘除運算，構(gòu)建了 2,393,641 個異象。令集合 E 代表這些異象，它就是 R 的上界。兩百多萬個異象，哇咔咔，但需要說明的是，這些只是通過“無腦”加減乘除得到的，這可以理解成從 econometrician（計量經(jīng)濟學(xué)家）的角度找到的異象個數(shù)。

那么，能不能用 E 當作異象集來控制 false rejections 呢？答案也是否定的。Chordia, Goyal, and Saretto (2020) 指出，和 econometrician 們不同，金融學(xué)教授那都是有 domain knowledge 的，顯然不會胡亂找一個看著就不太可能預(yù)測收益率的變量構(gòu)建異象。因此，金融學(xué)者們研究的異象肯定（遠）小于 2,393,641 個，所以 R 是 E 的子集。綜合上述討論得到：

繞了一大圈似乎啥也沒解決，還是不知道 R 有多大。別著急，確定 R 的統(tǒng)計特征、從而依據(jù)其特征控制 false rejections 計算 t-statistic 閾值就是 Chordia, Goyal, and Saretto (2020) 一文最大的亮點。而他們采用的方法則是 simulation。Simulation 的好處是 data generating process 是已知的，因此能夠知道哪些 H_0 為真、哪些 H_0 為假，從而計算出正確的 t-statistic 閾值。

為了進行 simulation，就要有模型。該文假設(shè)股票收益率在時序上滿足如下多因子模型：

其中 α_i 是模型無法解釋的超額收益。此外，在所有能夠構(gòu)建異象的變量中，模型假設(shè)顯著變量的概率為 π。對于該變量，simulation 中假設(shè)其在 t 期的取值滿足以下模型：

式中 η 滿足正態(tài)分布 N(0, σ^2)，是隨機擾動。如果變量是真的異象（發(fā)生概率 π），則它對于股票 i 在 t 期的取值為 α_i + η_{it}。值得說明的是，simulation 中當然無從知道異象變量到底應(yīng)該怎么取值，但既然真正的異象能夠獲得超額收益，那么異象變量的取值一定和個股的 α_i 相關(guān)（否則按 portfolio sort 排序就沒法獲得超額收益了），因此令 s_{it} = α_i + η_{it} 是合理的。如果變量是假的異象（發(fā)生概率 1 - π），則 s_{it} = η_{it} 是隨機噪聲。

除了關(guān)于收益率的模型和異象變量的模型外，simulation 中還有一個至關(guān)重要的參數(shù) —— Ω。它代表了金融學(xué)者們挖出真正異象的能力。怎么理解呢？前面已經(jīng)說了 π 是異象的概率，但這只不過是隨機抽取的概率。對于金融學(xué)教授來說，因為有先驗知識，因此他們獲得異象的條件概率要高于非條件概率 π。這個參數(shù) Ω 就是衡量金融學(xué)教授挖出異象的概率，這個概率為 Ωπ，即二者的乘積。

OK！現(xiàn)在有了模型，只要知道參數(shù)取值就可以跑仿真了。參數(shù)如何取值呢？對于收益率模型中的因子收益率、因子暴露以及超額收益，Chordia, Goyal, and Saretto (2020) 采用了真實美股市場數(shù)據(jù)的分布進行估計，而對于異象變量模型的參數(shù) π、Ω 以及 σ，他們使用了校準。既然要校準，就要給定 target quantities，用它們作為校準參數(shù)來逼近的對象。為了解釋這些 target quantities，先介紹一個概念。如果某個 H_0 在單一檢驗下被拒絕了，但是在考慮了多重假設(shè)檢驗后沒有被拒絕，則稱它為 single, but not multiple（SnM）rejection。

通過控制 FDP，Chordia, Goyal, and Saretto (2020) 發(fā)現(xiàn)不帶任何先驗的計量經(jīng)濟學(xué)家集合 E 中，SnM 的比例為 97.9% —— 如此之高，說明不帶金融學(xué)先驗去挖異象確實不靠譜?；氐?simulation，這個 SnM 值顯然和無條件的異象概率 π 有關(guān)，因此它就是對 π 校準的 target quantity。接下來如法炮制，對于發(fā)表的異象集合 P，它的 SnM 的比例為 27.0% —— 看來金融學(xué)教授們要靠譜得多。這個數(shù)值顯然和異象的條件概率 Ωπ 有關(guān)。但是注意這個 SnM 是針對集合 P 的，它是被發(fā)表的異象，而 Ωπ 所代表的是學(xué)者們在研究中挖出顯著異象的概率。因此，使用 SnM = 27.0% 來校準 Ωπ 的思路是正確的，但是必須帶上 P 和 R 的關(guān)系，即 P = {s \in R, t ≥ 2.0}。最后是隨機擾動的波動 σ。為了校準它，Chordia, Goyal, and Saretto (2020) 選擇了兩個 target quantities。為了便于理解，在此介紹其中一個。由于 σ 控制隨機擾動的波動，因此它直接影響著信噪比。該文采用下式來衡量信噪比：

其中分子是顯著異象組合超額收益 α_s 絕對值的期望；分母是顯著股票超額收益 α_i 絕對值的期望。該比值來自真實美股數(shù)據(jù)，大小為 0.12。

有了上述這些，Chordia, Goyal, and Saretto (2020) 通過全局優(yōu)化算法求解，并平均了 1000 次 simulation 結(jié)果確定了 π、Ω 以及 σ 的取值。再次強調(diào)的是，有了這些取值，就相當于整個學(xué)者挖異象的 data generating process 是已知的了！利用這些參數(shù)，和前述的股票收益率和異象變量模型，他們又進行了 1000 次 simulation —— 這次是為了模擬 R 集合下（學(xué)者們挖掘異象的集合），當控制了 FDP 之后 t-statistic 應(yīng)該是多少。最后，Chordia, Goyal, and Saretto (2020) 發(fā)現(xiàn)，如果以 portfolio sort 的超額收益（時序回歸，用多因子模型作為解釋變量）為研究對象，其 t-statistic 閾值高達 3.8；如果以 Fama-MacBeth 回歸斜率（即在控制了其他變量后異象的收益率）為研究對象，其 t-statistic 閾值高達 3.4。一般來說，比起 portfolio sort，F(xiàn)ama-MacBeth 回歸更不容易受多重假設(shè)檢驗影響，因此其 t-statistic 閾值略低。但無論如何，這兩個數(shù)值均高于 Harvey, Liu, and Zhu (2016) 提出的 3.0，符合預(yù)期。以上這兩個閾值就是 Chordia, Goyal, and Saretto (2020) 一文的核心結(jié)論。除此之外，該文還通過 simulation 計算了 false rejections 比例（即 F_1/R），高達 45.3%。

呼！我希望你沒有 get lost！

02?截面研究新趨勢

本節(jié)簡要介紹本期 RFS 特刊中關(guān)于截面收益率研究的三個趨勢（下圖）。

本期一共收錄 9 篇文章，每個趨勢下三篇。第一個趨勢是 extracting information from both the cross-section and time series。其實，用白話說，它的意思就是 portfolio sort vs cross-sectional regression。

從 Fama-French 三因子模型開始，用 portfolio sort 構(gòu)建因子投資組合，計算其收益率作為因子便是多因子模型中采用的做法，無一例外。然而，越來越多的研究，包括 Fama 自己都發(fā)現(xiàn)，截面回歸的純因子組合似乎更能解釋截面預(yù)期收益率的差異。因此，從這兩個角度去理解因子就是第一個趨勢。這個話題下的三篇文章是：

對于上面第一篇，《Which Beta (II)?》一文做過詳細解讀；而第二篇，[因子動物園] 的《對沖：獲取更純粹的 CP》一文進行了系統(tǒng)說明。第三篇嘛，還沒看……不過排上號了。

第二個趨勢是 replicating anomalies, multiple hypothesis testing, and transaction costs，包括如下三篇：

其中 Replicating anomalies 不用做太多介紹了，而本文重點梳理了其中第二篇。至于第三篇嘛，again，還沒看……不過也排上號了。

最后一個趨勢是 machine-learning tools，它關(guān)注如何將機器學(xué)習(xí)算法科學(xué)的應(yīng)用在古老的實質(zhì)資產(chǎn)定價之中。這個話題下包含的三篇文章為：

其中第一篇 Gu, Kelly, and Xiu (2020) 是最近一兩年非?；鸬囊黄撐?。[因子動物園] 的《因子投資中的機器學(xué)習(xí)》一文對它進行了梳理。第二篇提出了一個 PCA estimator，在降維的同時保留主成分對截面收益率的預(yù)測能力。第三篇則提出了一個非參數(shù)的方法，從 62 個常見的收益率預(yù)測變量中找到 13 個真正有效的。今后會找機會介紹這些新的方法。

03?結(jié)語

本期 RFS 特刊在描述三大趨勢的同時也給出了四個展望，不妨以它們作為本文的結(jié)尾：

1. 重視 multiple hypothesis testing 問題，形成科研中更好的研究流程，避免 publication bias，data snooping 以及 p-hacking。

2. 不同降維方法極大減少了因子的個數(shù)（通常不超過 10 個）。不過有意思的是，不同方法得到的因子可能差異很大，在這方面學(xué)術(shù)界需要尋求 common ground across methods。

3. 根據(jù)資產(chǎn)定價理論，SDF（隨機折現(xiàn)因子）其實是 factors 的某種線性組合。因此只有 factors 有意義，SDF 才有意義。從這個意義上說，無論采用傳統(tǒng)方法還是新的機器學(xué)習(xí)算法，都要重視因子的經(jīng)濟學(xué)含義。

4. 將源于預(yù)測股票收益率的這些新方法應(yīng)用于金融學(xué)的其他領(lǐng)域，比如預(yù)測其他資產(chǎn)，或者用于評價基金經(jīng)理以及公司決策等領(lǐng)域。

毫無疑問，這期 RFS 特刊十分過癮。而我們也有理由相信，未來關(guān)于實證資產(chǎn)定價和因子投資的研究會更加精彩。

感謝閱讀，預(yù)祝各位五一快樂。

參考文獻

Chordia, T., A. Goyal, and A. Saretto (2020). Anomalies and false rejections. Review of Financial Studies 33(5), 2134 – 2179.

Daniel, K., L. Mota, S. Rottke, and T. Santos (2020). The cross-section of risk and returns. Review of Financial Studies 33(5), 1927 – 1979.

Fama, E. F. and K. R. French (2020). Comparing cross-section and time-series factor models. Review of Financial Studies 33(5), 1891 – 1926.

Gu, S., B. Kelly, and D. Xiu (2020). Empirical asset pricing via machine learning. Review of Financial Studies 33(5), 2223 – 2273.

Harvey, C. R., Y. Liu, and H. Zhu (2016). … and the cross-section of expected returns. Review of Financial Studies 29(1), 5 – 68.

Hou, K., C. Xue, and L. Zhang (2020). Replicating anomalies. Review of Financial Studies 33(5), 2019 – 2133.

Romano, J. P., A. M. Shaikh, and M. Wolf (2008). Formalized data snooping based on generalized error rates. Econometric Theory 24(2), 404 – 447.

Romano, J. P. and M. Wolf (2005). Stepwise multiple testing as formalized data snooping. Econometrica 73(4), 1237 – 1282.

Romano, J. P. and M. Wolf (2007). Control of generalized error rates in multiple testing. The Annals of Statistics 35(4), 1378 – 1408.

White, H. (2000). A reality check for data snooping. Econometrica 68(5), 1097 – 1126.

免責聲明：入市有風(fēng)險，投資需謹慎。在任何情況下，本文的內(nèi)容、信息及數(shù)據(jù)或所表述的意見并不構(gòu)成對任何人的投資建議。在任何情況下，本文作者及所屬機構(gòu)不對任何人因使用本文的任何內(nèi)容所引致的任何損失負任何責任。除特別說明外，文中圖表均直接或間接來自于相應(yīng)論文，僅為介紹之用，版權(quán)歸原作者和期刊所有。

亚洲精品国产精品制服丝袜,亚洲欧美日韩精品a∨,97在线热免费视频精品视频,亚洲人成在线观看网站不卡

合格投資者聲明

出色不如走運 (IV)?