Which Test Assets?
發(fā)布時(shí)間:2020-08-04 | 來源: 川總寫量化
作者:石川
摘要:傳統(tǒng)的 double/triple sort 構(gòu)建 test assets 已經(jīng)過時(shí)。機(jī)器學(xué)習(xí)中的非線性模型為檢驗(yàn)多因子模型提供新思路?
1?Test Assets 之痛
檢驗(yàn)一個(gè)多因子模型分幾步?三步:定義模型使用的因子、定義 test assets、檢驗(yàn)。Test assets 和因子就像是一枚硬幣的兩面,缺一不可。在過去的三十年中,學(xué)術(shù)界先后提出了差不多十個(gè)主流的多因子模型。然而,在 test assets 方面卻鮮有進(jìn)展。為什么?因?yàn)?Fama and French (1993)。
這篇文章不僅僅是多因子模型的開山鼻祖,更是為學(xué)術(shù)界之后近 30 年的研究鋪墊了一系列基礎(chǔ)的方法論(雖然多數(shù)在今天看來已經(jīng)過時(shí)了……),其中就包括 test assets 的構(gòu)造方法。在 Fama and French (1993) 中,二位作者不僅通過 double sort 構(gòu)建了因子,也同樣使用 double sort 構(gòu)建了投資組合作為 test assets。從那之后,使用市值和某個(gè) firm characteristic 進(jìn)行 5 × 5 double sort 得到 25 個(gè) portfolios 作為 test assets 就成為學(xué)術(shù)界的標(biāo)配。
不難想象,使用 size 和 BM(book-to-market ratio)構(gòu)建 SMB 以及 HML 因子,再同樣使用 size 和 BM 構(gòu)建 test assets 來檢驗(yàn)上述因子構(gòu)造的多因子模型是多么“完美”……然而有大佬坐不住了。Lewellen, Nagel, and Shanken (2010) 指出,如此 double sort 得到 test assets 有很強(qiáng)的 factor structure(嚴(yán)重依賴于用來排序的 firm characteristics),并不能有效的檢驗(yàn)多因子模型。
面對這種困局,通常有兩種解決辦法。第一種就是直接用個(gè)股作為 test assets。不過這對因子暴露的參數(shù)估計(jì)帶來了挑戰(zhàn),詳見《Which beta?》一文。另一種方法就是使用大量不同的 firm characteristics 來進(jìn)行各種 double 以及 triple sort,得到上百個(gè) portfolios 作為 test assets。Fama and French (2020) 就是這么做的。但這第二種做法仍有問題。這種 sorting 操作,往往最多同時(shí)考慮三個(gè) firm characteristics 進(jìn)行 triple sort,再增加更多的 sorting variable 就難言合理了 —— 比如獨(dú)立的排序根本無法保證每個(gè)組里有足夠多的股票,而更重要的是這些分出來的 portfolios 組可能根本不合理。問題來了:怎么才算合理?
從使用 test assets 的目的出發(fā),它們是為了評價(jià)多因子模型,因此應(yīng)該能夠最好的反映股票預(yù)期收益率在截面上的差異。只有滿足上述目標(biāo)的 test assets,才是好的 test assets。在這方面,三十年前的 Fama and French (1993) 雖然是一個(gè)好的出發(fā)點(diǎn),但如今還是落伍了。最近十年,越來越多的研究發(fā)現(xiàn)股票預(yù)期收益率和 firm characteristics 之間的非線性關(guān)系。就用 size 和 BM 舉個(gè)最簡單的例子。下表展示了基于 A 股、使用 size 和 BM 進(jìn)行 double sort 的實(shí)證結(jié)果(表中匯報(bào)了不同 portfolios 的月均收益率 %,括號內(nèi)為 t-statistics)。不難看出,BM 在小市值中更加有效,而在大市值中幾乎沒啥作用,說明 conditional on 市值,BM 對預(yù)期收益率的影響不同。
以上僅以一個(gè) toy story 說明了預(yù)期收益率和 firm characteristics 之間的非線性關(guān)系。它對檢驗(yàn)多因子模型的指導(dǎo)意義是:不應(yīng)再用三十年前的方法去構(gòu)造 test assets 了,因?yàn)樵摲椒y以捕捉上述非線性關(guān)系,而是應(yīng)該尋找更好的構(gòu)造 test assets 的方法。在這方面,一篇尚未發(fā)表的 working paper 提供了全新的思路,它就是前不久在 SFS 年會上報(bào)告過的 Bryzgalova, Pelger, and Zhu (2020),以下簡稱 BPZ。下面就對其簡要說明。
2?Bryzgalova, Pelger, and Zhu (2020)
簡單的說:BPZ 以給定的 firm characteristics 為劃分依據(jù),通過構(gòu)建 decision tree 構(gòu)成了大量的 portfolios,然后以它們?yōu)橘Y產(chǎn),以 mean-variance efficiency 為目標(biāo)從中挑選出最能代表股票收益率截面差異的若干個(gè) portfolios(稱為 basis assets),并以基于它們的 tangency portfolios 作為 test assets。好吧,聽上去似乎沒有那么簡單……
下面一步步的說(本節(jié)和下節(jié)所有圖表均出自 BPZ 或其在 SFS 會議上的報(bào)告 slides,不單獨(dú)說明了)。仍然考慮最常見的 size 和 BM 這兩個(gè) firm characteristics。假設(shè)選擇 size-BM-size 的順序?qū)⑺泄善边M(jìn)行劃分,每次新的劃分都將前次得到的所有 nodes 一分為二,這樣就得到下面這顆 tree:
按照 size-BM-size 的順序每次一分為二,一共得到 8 個(gè) portfolios。當(dāng)然了,除了上述順序外,還可以有其他的順序,比如 BM-size-BM。而理論上,在不加任何約束的前提下,對于一個(gè) depth = d 的 tree 來說,一共有 2^d 種構(gòu)造 tree 的順序(即每一層都可以從 size 和 BM 中任選;理論上允許出現(xiàn) size-size-size 或 BM-BM-BM 這種沒什么意義的劃分)。和傳統(tǒng)的使用 size 和 BM 進(jìn)行 double sort 相比,decision trees 會產(chǎn)生更多的 portfolios。下圖展示了 depth = 4 時(shí),使用 decision tree 和 4 × 4 double sort 得到的 portfolios 的差異。從圖中不難看出,采用傳統(tǒng) double sort 得到的 16 個(gè) portfolios 是不重疊的;而使用 decision tree 得到的成百上千個(gè) portfolios 中很多都是重疊的。
推廣一下,如果參與構(gòu)造 decision trees 的不僅僅是 size 和 BM,而是有 M 個(gè) firm characteristics,那么對于一個(gè) depth = d 的 tree,一共有 M^d 種構(gòu)造 tree 的順序,毫無疑問這將得到非常多的 portfolios。此外需要強(qiáng)調(diào)的是,為了更好的捕捉股票收益率和 firm characteristics 的關(guān)系,BPZ 不僅考慮每棵樹的 final nodes,還考慮 intermediate nodes,妥妥的維數(shù)災(zāi)難。因此,接下來就要進(jìn)行 pruning(剪枝)。
由于 pruning 的目標(biāo)是為了得到更好的 test assets,因此該文作者將其稱為 asset pricing pruning。如何通過 pruning 留下最重要的 nodes?下圖給出了說明。概括一下那就是:每個(gè) tree 中的每個(gè) node(無論是最終的還是中間的)就是一個(gè) portfolio;為了通過所有的 portfolios 得到 mean-variance efficient portfolio,就必須使用它們的預(yù)期收益率以及協(xié)方差矩陣。這也意味著 pruning 必須通過全局優(yōu)化的形式實(shí)現(xiàn)。
在數(shù)學(xué)上,BPZ 在傳統(tǒng)的 mean-variance optimization 之中加入了 elastic net,同時(shí)考慮了套索回歸(lasso)和嶺回歸(ridge)。加入 lasso 的目的是限制最終挑出 nodes 的個(gè)數(shù),而加入 ridge 使得最優(yōu)解實(shí)現(xiàn)了 mean-variance(tangency)portfolio 和 minimum-variance portfolio 的某種線性組合,降低了樣本外的方差。
在具體數(shù)學(xué)求解最優(yōu)化問題時(shí),通過歷史數(shù)據(jù)計(jì)算的 portfolios平均收益率和協(xié)方差矩陣作為已知輸入,而以下三個(gè)變量則是通過搜索得到:
為此,BPZ 將數(shù)據(jù)在時(shí)序上分為 training set 和 validation set,使用前者估計(jì)收益率和協(xié)方差矩陣,并以最大化后者中的夏普率為目標(biāo)搜索上述三個(gè)變量的取值。具體方法和說明請參考 BPZ 原文。簡單小節(jié)一下,BPZ 的思路還是十分清晰的:(1)首先構(gòu)造了大量的 trees(每顆 tree 都代表了某種給定的 firm characteristic 劃分順序)、得到很多 nodes;(2)然后以 mean-variance efficiency 為目標(biāo)從中選擇最重要的 nodes 作為 basis assets;在優(yōu)化時(shí)加入了 lasso 和 ridge 懲罰。
不過我對其的擔(dān)憂是,第一步得到了非常多的 nodes,而且很多是高度重疊的(即高度相關(guān)的 portfolios),因此估計(jì)它們的協(xié)方差矩陣毫無疑問十分困難。如果 nodes 個(gè)數(shù)太多,顯然使用歷史數(shù)據(jù)來估計(jì)是不可行的(歷史數(shù)據(jù)長度是有限的)。這似乎說明使用該方法也會有一定的限制。
另外一個(gè)值得思考的地方是,為什么 BPZ 在挑選最優(yōu) nodes 時(shí),同時(shí)考慮最終以及中間的 nodes。對此,BPZ 給出了一個(gè)例子。使用某個(gè) firm characteristic,傳統(tǒng)的 sort(假設(shè)分 8 組)得到 8 個(gè) portfolios;而他們的方法最終得到 5 個(gè)大小不一樣的 portfolios。對此,BPZ 的解釋是最終哪些 portfolios 被選出是優(yōu)化問題在 estimation error 和 bias 之間權(quán)衡的結(jié)果。
3?一個(gè)例子
本節(jié)通過 BPZ 給的例子說明 decision tree 如何優(yōu)于傳統(tǒng)的 sort??紤] 10 個(gè)美股上常見的 firm characteristics。然后關(guān)鍵的來了。BPZ 說,為了進(jìn)行 apple-to-apple 的比較,每次從這 10 個(gè)里面挑出 3 個(gè) firm characteristics(且其中一個(gè)必須是 size),來進(jìn)行分析。這么做的原因是傳統(tǒng)的 sort 最多就到 triple sort。這個(gè)理由雖然合理,但是它也巧妙的躲開了使用更多 firm characteristics 來構(gòu)建 decision trees 帶來的 nodes 的激增 —— 在最優(yōu)化問題中,nodes 的收益率和協(xié)方差矩陣是輸入,nodes 激增會造成實(shí)際應(yīng)用中躲不過的困難。
回到 10 個(gè)里面挑 3 個(gè)。正常的話,這會得到 120 個(gè)組合;但是 BPZ 限制了 size 必須是其中一個(gè) firm characteristic,因此實(shí)際把實(shí)驗(yàn)設(shè)定轉(zhuǎn)化為 9 選 2,一共 36 種組合:比如 size、BM、momentum;或 size、profitability、IVOL 等。關(guān)于這一點(diǎn),BPZ 在 SFS 年會作報(bào)告的時(shí)候被討論者質(zhì)疑了。不過 BPZ 巧妙的使用“Fama and French 分組的時(shí)候永遠(yuǎn)帶著 size”給回答了。這個(gè)時(shí)候又想起 Fama and French 了,讓人情何以堪。
回到例子本身。對于選出的三個(gè) firm characteristics,例如 size、BM、momentum,BPZ 使用它們構(gòu)建 decision trees,并通過 pruning 從全部 nodes 中選出 40 個(gè) nodes(作者也探討了最終保留 nodes 的個(gè)數(shù),發(fā)現(xiàn) 10 個(gè)以上結(jié)果就非常穩(wěn)健了),并以這 40 個(gè) basis assets 構(gòu)造的 tangency portfolio 作為代表上述三個(gè) firm characteristics 的 test asset。這里需要強(qiáng)調(diào)一下:并不是使用 40 個(gè) nodes 作為 test assets(這 40 個(gè) nodes 是 basis assets),而是使用通過它們構(gòu)造的最大夏普率組合來作為一個(gè) test asset。
類似的,對于傳統(tǒng)方法,使用三個(gè)選出的 firm characteristics(例如 size,BM,momentum)通過 triple sort 構(gòu)建 32(2 × 4 × 4 劃分)或 64(4 × 4 × 4 劃分)個(gè) portfolios,并以它們?yōu)橘Y產(chǎn) basis assets 求出夏普率最大的投資組合,作為傳統(tǒng) triple sort 方法下的 test asset。
由上述介紹可知,對于每三個(gè) firm characteristics,都可以使用 decision trees 以及某個(gè) triple sort 方法構(gòu)造出各自的一個(gè) test asset。回顧前文的描述,9 選 2 問題 + size 一共得到 36 個(gè) firm characteristics 的組合,因此每種方法共有 36 個(gè) test assets。BPZ 將它們稱為 36 cross-sections。按照 BPZ 的理論,decision trees + asset pricing pruning 很好的捕捉了收益率和 firm characteristics 之間的非線性關(guān)系。因此,對于任意三個(gè) firm characteristics,使用 decision trees 得到的 test asset 都應(yīng)該比使用傳統(tǒng) triple sort 得到的 test asset 有更高的夏普率。下圖很好的證實(shí)了這一點(diǎn)(注意,下圖完全是樣本外的測試結(jié)果)。
除此之外,使用 decision trees 得到的 test assets 也應(yīng)該比傳統(tǒng)方法有更大的 pricing errors。以 Fama and French (2015) 五因子模型(FF5)為例,上述觀點(diǎn)得到了證實(shí)(同樣完全是樣本外的結(jié)果)。
以上結(jié)果確實(shí)說明 decision trees 比 triple sort 能挖出預(yù)期收益率和 firm characteristics 之間更多的關(guān)系。如果非要找茬的話,那就是 asset pricing test 中使用了 FF5,而 FF5 已經(jīng)被 q-factor model(Hou, Xue, and Zhang 2015)打成了篩子,因此在該模型下的 pricing errors 更大傳遞出來的信息可能也有限。出于篇幅考慮,對于 BPZ的介紹到此結(jié)束,更多的例子和說明請參考原文。
4?結(jié)語
BPZ 技術(shù)性很強(qiáng),本文也僅僅是概述了一下其核心思想。照例總結(jié)一下:傳統(tǒng)的 sort 方法指導(dǎo)人們使用 firm characteristics 構(gòu)造 portfolios 來檢驗(yàn)多因子模型;而 BPZ 說該方法無法有效挖掘出收益率和 firm characteristics 的非線性關(guān)系,因而提出了 decision trees + asset pricing pruning 的方法,利用這些 firm characteristics 構(gòu)造了更好(意味著包含更多 cross-section 信息)的 portfolios(basis assets),并在它們的基礎(chǔ)上構(gòu)造了更好的 test assets。值得一提的是,BPZ 仍然是一篇 working paper,因此其最終發(fā)表的版本可能還會變化,其歷史地位也需要時(shí)間來檢驗(yàn)。然而它所代表的研究方向則是值得在未來重點(diǎn)關(guān)注的。
在這方面,另一篇代表性的論文要數(shù) Kirby (2020)。該文通過多項(xiàng)式模型進(jìn)行回歸得到 portfolios,捕捉預(yù)期收益率和 firm characteristics 之間的非線性關(guān)系,指出主流的多因子模型并不能解釋 portfolios 收益率的差異。如今,越來越多人認(rèn)可上述非線性關(guān)系。而這種經(jīng)驗(yàn)事實(shí)顯然為傳統(tǒng)的時(shí)序多因子模型提出了非常大的挑戰(zhàn)。當(dāng)選擇能夠充分反映非線性關(guān)系的 test assets 時(shí),可以預(yù)計(jì)過去 30 年主流的時(shí)序多因子模型都會被拒絕。但是,在截面多因子模型吊打時(shí)序多因子模型的今天(見《A New Norm?》),這未嘗不是一件好事。
So, which test assets?
參考文獻(xiàn)
Bryzgalova, S., M. Pelger, and J. Zhu (2020). Forest through the trees: Building cross-sections of stock returns. Working paper.
Fama, E. F. and K. R. French (1993). Common risk factors in the returns on stocks and bonds.?Journal of Financial Economics 33(1), 3 – 56.
Fama, E. F. and K. R. French (2015). A five-factor asset pricing model.?Journal of Financial Economics 116(1), 1 – 22.
Fama, E. F. and K. R. French (2020). Comparing cross-section and time-series factor models.?Review of Financial Studies 33(5), 1891 – 1926.
Kirby, C. (2020). Firm characteristics, cross-sectional regression estimates, and asset pricing test. Review of Asset Pricing Studies 10(2), 290 – 334.
Lewellen, J., S. Nagel, and J. Shanken (2010). A skeptical appraisal of asset pricing tests. Journal of Financial Economics 96(2), 175 – 194.
Hou, K., C. Xue, L. Zhang (2015). Digesting anomalies: an investment approach. Review of Financial Studies 28(3), 650 – 705.
免責(zé)聲明:入市有風(fēng)險(xiǎn),投資需謹(jǐn)慎。在任何情況下,本文的內(nèi)容、信息及數(shù)據(jù)或所表述的意見并不構(gòu)成對任何人的投資建議。在任何情況下,本文作者及所屬機(jī)構(gòu)不對任何人因使用本文的任何內(nèi)容所引致的任何損失負(fù)任何責(zé)任。除特別說明外,文中圖表均直接或間接來自于相應(yīng)論文,僅為介紹之用,版權(quán)歸原作者和期刊所有。