亚洲精品国产精品制服丝袜,亚洲欧美日韩精品a∨,97在线热免费视频精品视频,亚洲人成在线观看网站不卡

出色不如走運 (III)?

發(fā)布時間:2019-02-01  |   來源: 川總寫量化

作者:石川

摘要:本文使用隨機因子的實證結(jié)果定量說明了僅靠運氣就能夠達到的選股效果,幫助判斷選股因子是否真正有效。


1 引言


使用因子選股的邏輯是因子 —— 無論是來自基本面、量價還是宏觀經(jīng)濟等 —— 都對股票未來的收益率有預測性。在定量評價一個因子是否有效時,主要的考察方式之一是計算該因子的收益率是否顯著不為零(原假設)。假設因子的預期收益率和該預期收益率的 standard error 分別為 E[f] 和 s.e.(E[f]),則假設檢驗的 t-statistic 為:



在進行單因子檢驗時,一般要求該因子的 t-statistic 大于 2,從而以 5% 的顯著性水平拒絕原假設,并認為該因子確實有預測股票收益率的能力。然而,如果同時考慮眾多因子(多重假設檢驗,multiple hypothesis testing)并從里面挑出來最好的,由于 data mining 的問題(即運氣),即便最好因子的 t-statistic 大于 2,也不能認為它是有效的。之前的兩篇文章《出色不如走運?》以及《出色不如走運(II)?》對這個問題進行了探討。今天這篇是《出色不如走運(III)?》。


假設同時考察 n 個因子、這些因子對于股票收益率的預測能力滿足 Uniform distribution。如果從這 n 個因子中挑出效果最好的,這個“最好的”因子的 t-statistic 和 p-value 有哪些性質(zhì)呢?我們想要回答的問題是:在多重檢驗的 n 選 1 問題中,對于給定的顯著性水平 p(比如 5%),單一因子的 p-value 或 t-statistic 應滿足什么條件才能拒絕原假設。根據(jù) order statistic 的概率知識可知,這 n 個因子中第 i 好的滿足 Beta distribution:



從 n 個里面挑出最好的相當于令 i = n。根據(jù) Beta distribution 的定義和簡單計算有:



令 x = (1 – p)^{1/n} 并利用 prob(U < x) = 1 – prob(U ≥ x) 可知:



在因子分析中,通常關(guān)注的是因子收益率是否顯著不為零 —— 可正可負 —— 因此一般使用雙邊檢驗。對于給定的 p-value(單邊 p/2),由上式可知(將 p 換成 p/2),這 n 個因子中最好的那個的 t-statistic 的絕對值需不小于以下閾值才能拒絕原假設:



當 n 很大時,從上式可進一步推導出單一因子的 p-value 需要小于 p/n 才能在 n 選 1 的 multiple hypothesis testing 下拒絕原假設。舉例來說,我們考察 10 個因子并希望以 5% 的顯著性水平找到真正有效的因子,則這些因子各自的 p-value 只有小于 5%/10 = 0.5% 才能拒絕原假設。這正是大名鼎鼎的?Bonferroni correction(邦費羅尼校正)。實際因子選股面臨更復雜的問題:如何從 n 個因子中選出最好的 k 個,而非 1 個;如何配置選出來的這 k 個因子 —— 等權(quán)配置還是按照它們樣本內(nèi)的表現(xiàn)好壞配置。如果不妥善解決 multiple hypothesis?testing 的問題,上述這些做法會導致選擇偏差(selection bias)以及過擬合偏差(overfitting bias)。


2 選擇偏差和過擬合偏差


在選擇因子時,通常的做法是在回測中使用因子定期構(gòu)建投資組合,然后分析因子預期收益率的 t-statistic。如果該 t 值小于零(且顯著為負)則把該因子反過來使用。假設同時考察 n 個因子,并根據(jù)因子 t-statistic 絕對值的大小采用下列做法之一:


1. 按照樣本內(nèi) n 個因子 t-statistics 的正負同時使用全部因子,按照等權(quán)或者樣本內(nèi)因子效果賦權(quán)來選股(n 選 n 問題) —— 這種做法引入 overfitting bias;


2. 從這 n 個因子中挑出樣本內(nèi) t-statistic 絕對值最大的 1 個(n 選 1 問題),使用該因子選股 —— 這種做法引入 selection bias;


3. 從這 n 個因子中挑出樣本內(nèi) t-statistic 絕對值最大的 k 個(n 選 k 問題),并按等權(quán)或樣本內(nèi)效果賦權(quán)選股 —— 這種做法同時引入 selection bias 和 overfitting bias。


Novy-Marx (2015) 研究了多因子選股回測中的 selection bias 和 overfitting bias 問題。本文第一節(jié)中的數(shù)學推導正是來自 Novy-Marx (2015),而它僅僅是 n 選 1 的一種簡化情況。在投資實務中,更常見的是上述第二種 n 選 k 的問題,它面臨“因子怎么選”“因子如何配”這兩個嚴峻的問題,一不小心就會引入大量的噪聲。


毫無疑問,multiple hypothesis testing 下的數(shù)據(jù)挖掘是因子選股的大敵。通過 data mining,僅僅依靠運氣,挑出來的因子 —— 哪怕再沒有業(yè)務含義 —— 也會在樣本內(nèi)獲得顯著不為零的選股收益率,但它只是過擬合而已。針對 multiple hypothesis testing 中的 data mining,Novy-Marx (2015) 從理論和實證經(jīng)驗兩個角度分析了上述 n 選 n、n 選 1、n 選 k 三個問題中,多因子策略的 t-statistic 的分布問題。該文使用純隨機產(chǎn)生的因子 —— 理論上沒有任何預測性 —— 在美股上選股、以美股的真實收益率計算這些隨機因子的因子收益率,從而定量分析上述三個問題中多因子選股策略的 t-statistic 的閾值。這些 t-statistic 的閾值遠超單因子檢驗中的 2.0,而如此之高的閾值更是僅僅來自于運氣和 data mining。在實際選股中,使用多因子構(gòu)建的策略的 t-statistic 唯有超過這些閾值才意味著它們真的對收益率有統(tǒng)計上非顯著為零的預測性。


本文下一節(jié)借鑒 Novy-Marx (2015) 的思路產(chǎn)生隨機因子,使用中證 500 指數(shù)的成分股進行實證分析。


3 實證研究


本節(jié)針對中證 500 進行實證。實證中的回測期從 2010 年 1 月到 2019 年 1 月,考察 n 個隨機因子的選股能力。具體的:


1. 對于每一個因子,在每月末,隨機生成 500 支成分股在該因子上的取值并從高到低排列,選擇取值最高的 10% 做多、取值最低的 10% 做空,以該多空組合的收益率作為該期因子的收益率;


2. 計算回測期內(nèi)每個因子的 t-statistic,如果某個因子的 t-statistic 為負,則把該隨機因子反過來使用;


3. 按照每個隨機因子 t-statistic 絕對值的大小,挑選絕對值最大的 k (≤ n) 個因子,并按照等權(quán)或者正比于它們 t-statistics 的絕對值大小配置因子;


4. 以最終多個因子的配置結(jié)果作為最終的選股結(jié)果,計算該策略在整個回測期內(nèi)的 t-statistic;


5. 上述 1 – 4 步完成了 n 選 k(當 k = 1 和 n 時,問題分別變?yōu)?n 選 1 和 n 選 n)的一次實驗。為了得到 n 選 k 問題中 t-statistic 的經(jīng)驗分布并計算 5% 顯著性水平下的 t-statistic 的閾值,對于每一組 n 和 k,將上述 4 步進行 5000 次仿真,從而計算 t-statistic 的閾值。


舉個例子。下圖是當 n = 20,k = 3(即從 20 個隨機因子中選出樣本內(nèi) t-statistic 絕對值最大的 3 個,并按 t-statistic 絕對值大小配置)時,5000 次仿真得到的該策略的 t-statistic 的經(jīng)驗分布,其均值為 3.2,其 5% 顯著性水平下對應的 t-statistic(即該分布中 95% 分位數(shù))高達 4.16。


f6.png


該結(jié)果表明,如果我們從 20 個源于業(yè)務邏輯(或者很多人樂此不疲的 data mining)的因子中選擇 3 個最好的來選股時,該策略的 t-statistic 要超過 4.16 才能認為這 3 個因子的選股效果不僅僅是運氣。接下來看看不同 n 和 k 的取值下,5% 顯著性水平對應的 t-statistic 的閾值的情況。下圖比較了不同 n 取值下,n 選 1 和 n 選 n 兩種極端情況 —— n 選 1 代表僅有 selection bias;n 選 n 代表僅有 overfitting bias。下圖傳遞出以下信息:


1. 隨著考察的隨機因子個數(shù)(n)的增加,策略 t-statistic 的閾值逐漸遞增;


2. 選 n 個因子比選 1 個因子有更高的閾值;按樣本內(nèi)表現(xiàn)配置比等權(quán)配置有更高的閾值;它們說明 overfitting bias 比 selection bias 更容易在樣本內(nèi)產(chǎn)生過擬合。


f7.png


再來看看更一般的 n 選 k 的情況。下圖顯示了 n = 10、20、40 和 100 時,不同 k 取值下的選股策略的 t-statistic 閾值。在一般的投資實務中,嘗試 100 甚至幾百個因子并選擇其中某些好的是十分常見的。從該實證結(jié)果中可以觀察到:


1. 隨著 n 和 k 的增加,對于按照隨機因子 t-statistic 絕對值賦權(quán)配置的策略,它們的 t-statistic 閾值遞增;

2. 隨著 n 的增加,等權(quán)配置和按因子樣本內(nèi)表現(xiàn)配置的效果越來越接近;

3. 對于等權(quán)配置因子的情況,能夠觀察到策略的效果并不隨 k 遞增;比如當 n = 10 時,t-statistic 的閾值隨 k 先增大后減小。


f8.png


上述實證結(jié)果中,最有意思的大概是第三條。對于等權(quán)配置的情況,在一開始,使用更多的因子可以降低策略的波動率,從而提升 t-statistic 的閾值;而一旦因子個數(shù)超過最優(yōu)值,越來越多排名靠后的因子被選入,它們會降低策略的收益率,從而降低 t-statistic 的閾值。這是在因子投資實務中需要考慮的問題。從圖中可以看到,對于實證中考察的最極端情況,即“從 100 個因子選 10 個最好的”,僅僅靠運氣,以隨機因子構(gòu)建的策略在中證 500 成分股的樣本內(nèi)回測中就能取得高達 7 以上的 t-statistic 閾值。Data mining 造成的 selection bias 和 overfitting bias 不容小視。


4 結(jié)語


近年來,海外學術(shù)界越來越意識到 multiple hypothesis testing 造成的因子分析中 data mining 的問題。一些先進的統(tǒng)計手段被提出以幫助鑒別哪些是真正有效的因子,哪些僅僅是運氣。這些文獻包括《出色不如走運(II)?》中介紹的那些,以及本文提及的 Novy-Marx (2015)。


在 empirical asset pricing 和 factor investing 方面,我們都是 data mining 的好手。拿來一個因子,如果不好使,可以對它進行差分 —— 美其名曰增長率;再不好使,二階差分 —— 美其名曰加速度;還不好使,行業(yè)中性、市值中性試一下、用各種其他因子回歸得到殘差再試一下;對于選出的因子,等權(quán)配如果效果不理想,可以按照事后夏普率配一下;還不理想?使用滾動窗口進行動態(tài)因子擇時……


誠然,對于有嚴謹金融邏輯的因子 —— 比如 ROE —— 我們沒有必要把它和一幫其他“邪門”因子一起比較,然后要求 ROE 也有非常高的 t-statistic,這是對統(tǒng)計手段的走火入魔。但是,對于很多純粹靠 data mining 加工出來的因子,本文使用隨機因子的實證結(jié)果定量說明了僅靠運氣就能夠達到的效果,從而幫助判斷選股因子是否真正有效。


While one should combine multiple signals they believe in, one should not believe in a combination of signals simply because they backtest well together.



參考文獻?

Novy-Marx, R. (2015). Backtesting strategies based on multiple signals. NBER Working Paper, No. 21329.



免責聲明:入市有風險,投資需謹慎。在任何情況下,本文的內(nèi)容、信息及數(shù)據(jù)或所表述的意見并不構(gòu)成對任何人的投資建議。在任何情況下,本文作者及所屬機構(gòu)不對任何人因使用本文的任何內(nèi)容所引致的任何損失負任何責任。除特別說明外,文中圖表均直接或間接來自于相應論文,僅為介紹之用,版權(quán)歸原作者和期刊所有。