Portfolio Sort 的源起、中興和未來
發(fā)布時(shí)間:2024-02-23 | 來源: 川總寫量化
作者:石川
摘要:Portfolio Sort 是實(shí)證資產(chǎn)定價(jià)和因子投資中的常見方法。本文帶你了解 Portfolio Sort 的源起,中興和未來。
1 源起
資產(chǎn)定價(jià)的研究目標(biāo)是解釋不同資產(chǎn)的預(yù)期收益率在截面上的差異。為了構(gòu)造因子、或者為了檢驗(yàn)給定的定價(jià)模型,選擇適當(dāng)?shù)馁Y產(chǎn)(被稱為 test assets)十分關(guān)鍵。在這方面,一個(gè)自然的想法是使用 individual assets,比如個(gè)股。但是個(gè)股層面巨大的 idiosyncratic noise 使得估計(jì)得到的 beta 誤差很大,造成?errors-in-variables(EIV)等問題。
正因如此,在最早檢驗(yàn) CAPM 的時(shí)候,無論是 Black, Jensen, and Scholes (1972) 還是 Fama and MacBeth (1973) 都選擇使用投資組合代替?zhèn)€股。具體而言,他們將個(gè)股按照其歷史 beta 的大小排序,然后構(gòu)成不同的投資組合,并檢驗(yàn)這些投資組合的收益率和 beta 的關(guān)系。這背后隱含的邏輯是,個(gè)股 beta 的估計(jì)誤差相互抵消,因此投資組合的 beta 估計(jì)值更準(zhǔn)確。
這就是最早的 portfolio sort。
2 中興
然而,真正讓 portfolio sort 成為實(shí)證研究標(biāo)配的是?Fama?and French (1992, 1993)。Fama 和 French 利用 portfolio sort 分別研究了 size、value 等異象并提出了 Fama-French?三因子模型。頗為有意思的是,在研究異象的時(shí)候,股票被分為 10 組;然而在構(gòu)造因子的時(shí)候,股票則是依照市值和 BM 分別被分為了兩組和三組(下圖展示了 SMB 和 HML 兩個(gè)因子的構(gòu)造方法)。
構(gòu)造因子時(shí)的分組數(shù)通常小于研究異象時(shí)的分組數(shù)。這背后的邏輯并不難理解:為了控制市值的影響,構(gòu)造因子往往使用目標(biāo)變量和市值獨(dú)立雙重排序。如果每個(gè)變量下分的組太多,那么一些投資組合可能就沒有足夠數(shù)量的股票。
作為實(shí)證研究的典范,F(xiàn)ama 和 French 開創(chuàng)的傳統(tǒng)被自然而然地延續(xù)了下來。后續(xù)的一眾實(shí)證研究,在通過 portfolio sort 研究異象時(shí),無不采用 10 組的劃分;而當(dāng)構(gòu)造因子時(shí),使用的組數(shù)則要少得多。John Cochrane?在 AFA 主席演講時(shí),關(guān)于 portfolio sort 曾評(píng)價(jià)道:
上述選擇組數(shù)的做法聽上去是如此的理所應(yīng)當(dāng),以至于沒有誰會(huì)質(zhì)疑它的合理性。然而事實(shí)真的如此嗎?從數(shù)學(xué)上說,portfolio sort 其實(shí)就是 nonparametric cross-sectional regression estimator。Cochrane (2011) 里面的這張圖清晰地表明了這一點(diǎn)。
作為一個(gè) nonparametric/kernel estimator,portfolio sort 卻是一個(gè)非標(biāo)準(zhǔn)化的方法。比如,從 kernel estimator 的角度來理解,每個(gè)分組中的 asset 的收益率估計(jì)值就由其所在組的所有 assets 的收益率均值決定。然而,portfolio sort 的非標(biāo)準(zhǔn)之處在于臨界資產(chǎn)的分組。比如,以上圖中的 log(B/M) 為例,如果某個(gè)公司的數(shù)值稍稍小了一點(diǎn),那么它就可能被劃分到第 1 組,如果它的數(shù)值稍稍高了一些,它就會(huì)被劃分到第 2 組。這種跳變和 kernel regression 中常見的 kernel 完全不同(比如 Gaussian kernel)。因此,盡管 portfolio sort 簡(jiǎn)單好用且在實(shí)證研究中發(fā)揮了重要的作用,但人們對(duì)它的統(tǒng)計(jì)特性卻知之甚少。
除了上面提到的問題之外,另一個(gè)問題是股票數(shù)據(jù)是 unbalanced data,意味著截面上的股票個(gè)數(shù)會(huì)隨時(shí)間會(huì)發(fā)生巨大的變化。以下圖為例,它展示了 CRSP 中所有股票以及 NYSE 上市的股票的數(shù)量隨時(shí)間的變化。就全部股票而言,在 1960 年之前截面上不足 2000 支股票;然后在 70 年代發(fā)生了跳變,并在 90 年代上升至將近 8000 支;最近 20 年又逐漸下降至 4000 支。面對(duì)如此巨變的截面股票數(shù)量,我們不禁要問,忽視股票數(shù)量的變化而一直采用 10 分組是否合理?如果不甚合理,那么應(yīng)該如何確定最優(yōu)的分組數(shù)?這個(gè)最優(yōu)的分組數(shù)又是否和截面上的股票數(shù)量有關(guān)?
毫無疑問,繼承自 Fama and French 的 portfolio sort 承載和見證了實(shí)證研究的過去。但展望未來,通過將 portfolio sort 視為 nonparametric estimator,了解其性質(zhì),并回答上面提到的那些問題,才代表著實(shí)證研究方法的進(jìn)步。
3 未來
Cattaneo et al. (2020) 對(duì)上述問題進(jìn)行了系統(tǒng)的回答。該文通過將 portfolio sort 視為一個(gè) nonparametric estimator,提出了一個(gè)關(guān)于它的估計(jì)和推斷的通用框架,并介紹了有效的漸近推斷方法。它通過最小化估計(jì)量的均方誤差,為挑選最優(yōu)分組數(shù)提供了理論依據(jù)。他們的研究發(fā)現(xiàn),最優(yōu)的分組數(shù)和總的期數(shù)以及截面上的資產(chǎn)個(gè)數(shù)二者皆密切相關(guān)。我們借用該文的圖 1 從直覺上理解一下背后的原因。
為了簡(jiǎn)化討論,假設(shè)截面上資產(chǎn)個(gè)數(shù)不隨時(shí)間變化。先看圖中的第一行,顯示了?
另一方面,圖中第二行考察了?
最終,Cattaneo et al. (2020) 給出了如下結(jié)果:?
?
其中?
在實(shí)證方面,該文以 size 和 momentum 為例,對(duì)比了他們的方法和傳統(tǒng)的分 10 組方法(下圖展示了動(dòng)量的結(jié)果,左側(cè)為該文的方法,右側(cè)為常規(guī)的 portfolio sort 結(jié)果)。從結(jié)果可知,1980 到 2015 這個(gè)實(shí)證區(qū)間中,投資于過去的輸家所導(dǎo)致的損失在增大:在整個(gè)實(shí)證區(qū)間內(nèi),輸家組的平均收益率約為?
除單變量排序外,Cattaneo et al. (2020) 還對(duì)他們的 estimator 進(jìn)行了擴(kuò)展,使其可以同時(shí)考慮多個(gè)變量,進(jìn)行多變量排序。鑒于雙重排序在構(gòu)造因子時(shí)十分常見,這種擴(kuò)展顯得尤為必要。但另一方面,和傳統(tǒng)的多變量排序一樣,他們的 estimator 也受到維數(shù)災(zāi)難的影響,即隨著用于排序的變量的數(shù)量的增加,其性能會(huì)下降。為了解決這個(gè)問題,他們進(jìn)一步允許其他條件變量以參數(shù)的形式進(jìn)入模型。這種拓展在 portfolio sort 和 cross-sectional regression 之間實(shí)現(xiàn)了一定程度的融合,但又不像純粹的 regression 那樣施加了參數(shù)化的假設(shè),因此更加靈活。
無論是構(gòu)造定價(jià)因子,還是構(gòu)造 test assets 來檢驗(yàn)多因子模型,portfolio sort 都至關(guān)重要。優(yōu)秀的 test assets 應(yīng)該能體現(xiàn)出資產(chǎn)收益率在 cross-section 的差異。從這個(gè)角度上說,忽視數(shù)據(jù)的特征而對(duì)所有變量都一視同仁、分成 10 組的做法確實(shí)略顯粗糙。Cattaneo et al. (2020) 為 portfolio sort 確定最優(yōu)分組數(shù)量提供了一種數(shù)據(jù)驅(qū)動(dòng)方法,并表明最優(yōu)分組數(shù)量隨期數(shù)以及截面上資產(chǎn)的個(gè)數(shù)而變化,為今后關(guān)于異象和因子的研究提供了新的啟發(fā)。
參考文獻(xiàn)
Black, F., M. C. Jensen, and M. Scholes (1972). The capital asset pricing model: Some empirical tests. In M. C. Jensen (Ed.),?Studies in the Theory of Capital Markets. New York, NY: Praeger.
Cattaneo, M. D., R. K. Crump, M. H. Farrell, and E. Schaumburg (2020). Characteristic-sorted portfolios: Estimation and inference.?Review of Economics and Statistics 102(3), 531 – 551.
Cochrane, J. H. (2011). Presidential address: Discount rates.?Journal of Finance 66(4), 1047 – 1108.
Fama, E. F. and J. D. MacBeth (1973). Risk, return, and equilibrium: Empirical tests.?Journal of Political Economy 81(3), 607 – 636.
免責(zé)聲明:入市有風(fēng)險(xiǎn),投資需謹(jǐn)慎。在任何情況下,本文的內(nèi)容、信息及數(shù)據(jù)或所表述的意見并不構(gòu)成對(duì)任何人的投資建議。在任何情況下,本文作者及所屬機(jī)構(gòu)不對(duì)任何人因使用本文的任何內(nèi)容所引致的任何損失負(fù)任何責(zé)任。除特別說明外,文中圖表均直接或間接來自于相應(yīng)論文,僅為介紹之用,版權(quán)歸原作者和期刊所有。