過度數(shù)據(jù)挖掘之“一月晴雨表”
發(fā)布時間:2017-05-04 | 來源: 川總寫量化
作者:石川
摘要:華爾街流行的“一月晴雨表”策略缺乏令人信服的業(yè)務(wù)依據(jù),僅僅來自樣本內(nèi)的過度數(shù)據(jù)挖掘,在樣本外效果非常差。
1 一月晴雨表
華爾街流行著一句老話“As January goes, so goes the year”。它的意思是一月份股票的漲跌往往和全年股票的漲跌一致:如果一月份上漲,那么全年大概率會上漲;如果一月份下跌,那么全年大概率也會下跌。華爾街有很多這個諺語的忠實(shí)信徒,并以此形成了一個流傳甚廣的擇時信號:January Barometer(一月晴雨表,又稱一月指標(biāo) January Indicator)。
追根溯源,這個現(xiàn)象于 1972 年被 Yale Hirsch 發(fā)現(xiàn)。后來,其子 Jeffrey Hirsch 統(tǒng)計了從 1950 年到 2006 年間該現(xiàn)象在標(biāo)普 500 指數(shù)上的正確率,發(fā)現(xiàn)其正確率達(dá)到驚人的 91.2%(下圖)。小 Hirsch 聲稱,在 57 年里,該信號僅有 5 次重大錯誤(他稱之為 major errors),這個 91.2% 的正確率就是這么來的,即 52 / 57。
然而,仔細(xì)想來,這么高的正確率頗有爭議。首先,這位仁兄選擇性的“失明”,剔除了另外 9 次該信號的非重大失誤。如果我們加上這 9 次,則該信號在 57 年間一共失效 14 次(5 次重大失誤 + 9 次非重大失誤),正確率驟然降為 75.4%。第二,他爹 Yale Hirsch?于 1972 年發(fā)現(xiàn)這個現(xiàn)象,這說明理論上任何人都不能在 1972 年之前運(yùn)用這個策略。因此,小 Hirsch 從 1950 開始回測也值得推敲。如果我們僅考察 1973 到 2006 年這 34 年間,該信號一共錯誤 9 次,正確率 73.5%。
上面這兩個錯誤就是過度數(shù)據(jù)挖掘的典型例子。在數(shù)據(jù)挖掘中,有一種非常普遍的錯誤做法:
Slicing and dicing the data until they produce the desired conclusion.
人們很容易找到一月指標(biāo)的反例。就拿剛剛過去的 2016 年來說,標(biāo)普 500 在 2016 年一月下跌 5% 以上,而其全年來看上漲 9.54%。如果按照一月指標(biāo),那么我們將會錯過從二月份開始高達(dá) 14% 以上的反彈!The Wall Street Journal 也曾刊文《Sorry, the ‘January Barometer’ is a Market Myth》批判了一月指標(biāo)。其核心觀點(diǎn)是嚴(yán)格的統(tǒng)計分析并不支持一月走勢預(yù)測全年走勢這種說法:
The idea that the direction stocks take in January will be their direction for the full year?isn't?supported by strict statistical analysis.
下面就來看看一月晴雨表指標(biāo)到底存不存在。
2 樣本內(nèi)的激動人心
利用一月指標(biāo)、并以標(biāo)普 500 指數(shù)為投資標(biāo)的,構(gòu)建一個簡單的擇時策略,稱為一月晴雨表策略:
每年一月買入標(biāo)普 500,如果一月上漲,則在該年內(nèi)全年持有;如果一月下跌,則在一月最后一個交易日清倉,在該年的二到十二月空倉(為了簡化我們假設(shè)空倉,實(shí)際中可以購買債券等低風(fēng)險資產(chǎn))。不考慮任何交易成本。
為檢驗(yàn)一月指標(biāo),首先考察該策略能否跑贏指數(shù)本身。其次,考察兩組收益率之間的相關(guān)系數(shù)以及相關(guān)系數(shù)的顯著性水平。這兩組收益率分別為:
第一組:一月收益率 和 年收益率
第二組:一月收益率 和 當(dāng)年二月到十二月份的累積收益率
下面的小貼士介紹了如何檢驗(yàn)兩個時間序列(在本文是上面每組中的兩個收益率序列)的樣本相關(guān)系數(shù)的顯著性水平。
檢驗(yàn)相關(guān)系數(shù)的顯著性水平
對于兩個長度為 n 的時間序列,假設(shè)這兩個序列的樣本相關(guān)系數(shù)是 r,則 r 對于總體(population)的真實(shí)但未知的相關(guān)系數(shù)的標(biāo)準(zhǔn)誤差(standard error)為:
SE = sqrt(1 - r^2) / sqrt(n - 2)
SE?越大說明由樣本計算出來的相關(guān)系數(shù)越無法準(zhǔn)確的反應(yīng)總體的真實(shí)相關(guān)系數(shù)。SE 和樣本大小 n 成反比,這說明樣本點(diǎn)越多,得到的誤差越小。在統(tǒng)計學(xué)中,通過假設(shè)檢驗(yàn)來判斷這兩個序列的相關(guān)系數(shù)是否顯著;原假設(shè)為“兩個時間序列沒有線性相關(guān)性(即它們的相關(guān)系數(shù)為 0)”。是否接受這個原假設(shè)可以利用 t 分布來檢驗(yàn)。相關(guān)系數(shù) r 和標(biāo)準(zhǔn)誤差 SE 的比值,即 r/SE,是一個滿足自由度為 n - 2 的 t 分布的隨機(jī)變量。因此,只要考察 r/SE 的值,就能知道在給定的置信水平下是否能夠拒絕原假設(shè)。
我們將樣本內(nèi)回測區(qū)間設(shè)為 1972 年 1 月 1 日到 2006 年 12 月 31 日。(1972 年是一月效應(yīng)被提出的年份;而 2006 年是小?Hirsch 在他的計算中考察的結(jié)束時點(diǎn)。)在該區(qū)間內(nèi),策略和標(biāo)普 500 同期的指標(biāo)如下圖所示。不可否認(rèn),策略確實(shí)跑贏了指數(shù)。圖中的最后一個指標(biāo)是收益率檢驗(yàn)。該檢驗(yàn)的原假設(shè)是策略收益率序列和基準(zhǔn)指數(shù)收益率序列的均值相同,以此考察策略的高夏普率是否具備統(tǒng)計意義。然而,結(jié)果表明我們不能拒絕原假設(shè)(p-value高達(dá) 0.975)。因此,策略的高夏普率不具備統(tǒng)計意義。事實(shí)上,稍后會看到,策略的高夏普率僅僅來自個別年份指數(shù)大跌然而策略在一月底清倉而逃過大跌。
回測期內(nèi),一月收益率和年收益率的相關(guān)系數(shù)相關(guān)指標(biāo)為:
從以上結(jié)果不難發(fā)現(xiàn),策略確實(shí)在樣本內(nèi)確實(shí)跑贏指數(shù),且一月份的收益率和年收益率的相關(guān)系數(shù)高達(dá) 0.54(正相關(guān))并且在統(tǒng)計上顯著。這一切似乎說明一月指標(biāo)在樣本內(nèi)確實(shí)有效。
然而一個不能忽視的事實(shí)是,在樣本內(nèi)的回測期之中,指數(shù)在一月份上漲的比例高達(dá) 61.8%。下圖展示了回測期內(nèi)不同月份的平均收益率,一月份是 12 個月份中表現(xiàn)最好的,平均收益率高達(dá) 1.76%!這說明策略選擇一月份持股的前提下,凈值就有了基本的保障。
注意,一月份收益率在回測期內(nèi)冠絕群雄僅僅是數(shù)據(jù)挖掘出來的一個現(xiàn)象,但人們并沒有提出任何業(yè)務(wù)依據(jù)來為解釋該現(xiàn)象。因此,為了避免數(shù)據(jù)遷就(data snooping),我們對原有的策略進(jìn)行微調(diào),將一月份作為觀察期,而非直接于一月份持股:
如果一月上漲,則在該年內(nèi)二到十二月買入并持有標(biāo)普 500;如果一月下跌,則在該年其他月份空倉(同樣,為了簡化我們假設(shè)空倉,實(shí)際中可以購買債券等低風(fēng)險資產(chǎn))。不考慮任何交易成本。
為了區(qū)分這兩個策略,稱原始策略為“一月晴雨表策略(一月持倉)”;稱改進(jìn)策略為“一月晴雨表策略(一月觀望)”。改進(jìn)策略的凈值和基準(zhǔn)指數(shù)相比,效果如下,策略跑輸了指數(shù),但兩個收益率序列均值的差異仍然不顯著(p-value 為 0.292)。
此外,我們更加關(guān)注一月份收益率和同年后 11 個月(即二月到十二月)的累積收益率之間是否存在統(tǒng)計意義上顯著的正相關(guān)。結(jié)果(下圖)表明,這兩個收益率序列的相關(guān)性并不顯著、無法拒絕原假設(shè)。
下圖展示了兩個策略和基準(zhǔn)指數(shù)在回測期內(nèi)每年的收益率。可以看到,兩個策略之所以取得了更高的夏普率,僅僅是因?yàn)樵趥€別年份躲過了整年的大跌,或是因?yàn)橛捎谝辉轮笜?biāo)的錯誤而錯過了指數(shù)的上漲。這兩個效應(yīng)疊加使得策略的收益率波動更低,這便是高夏普率的直接原因。然而策略收益率和基準(zhǔn)收益率的均值并無統(tǒng)計意義上的顯著差異。
作為小結(jié),本節(jié)的實(shí)證得到如下觀點(diǎn):
1. 原始一月晴雨表策略(即一月持倉)在回測期內(nèi)跑贏指數(shù);一月份收益率和全年收益率存在統(tǒng)計上顯著的正相關(guān)。
2. 回測期內(nèi),基準(zhǔn)指數(shù)大概率在一月份上漲,且一月份的平均漲幅雄冠全年;因此原始策略存在數(shù)據(jù)遷就。
3. 改進(jìn)的一月晴雨表策略(即一月觀望)在回測期內(nèi)無法跑贏指數(shù);一月份收益率和二月到十二月的累積收益率不存在統(tǒng)計上顯著的正相關(guān)。
4. 兩個策略均取得比基準(zhǔn)指數(shù)更高的夏普率,然而策略收益率序列和基準(zhǔn)指數(shù)收益率序列的均值在統(tǒng)計上無顯著差異。
3 樣本外的心灰意冷
第 2 節(jié)的實(shí)證雖然說明一月晴雨表策略在樣本內(nèi)效果不錯,但縱觀學(xué)術(shù)界和業(yè)界對一月指標(biāo)的研究,業(yè)務(wù)解釋非常牽強(qiáng)。當(dāng)一個所謂的數(shù)據(jù)模式(data pattern)僅僅來自過度數(shù)據(jù)挖掘,而缺乏合理的業(yè)務(wù)依據(jù)時,這樣的模式往往是虛假的、難以令人信服的。因?yàn)樗緹o法保證對樣本外的數(shù)據(jù)同樣有效。
一月指標(biāo)在樣本外恰恰中招。假如我們錯信一月晴雨表策略真正有效,而滿懷信心地在樣本外(2007 年 1 月 1 至今)運(yùn)用該策略時,那一定會懷疑人生。無論一月是持倉還是觀望,兩個策略均跑輸指數(shù)本身。尤其是原始的一月持倉策略,可以看到最近三年(2014 至 2016),一月指標(biāo)接連發(fā)出錯誤信號導(dǎo)致我們在一月下跌后離場,而指數(shù)本身在當(dāng)年的后 11 個月發(fā)生了不同程度的反彈。值得注意的是,在樣本外的年份中,一月上漲的比例僅為 40%, 和樣本內(nèi)的 61.8% 千差萬別。這有力的說明了樣本內(nèi)的一月晴雨表策略存在數(shù)據(jù)遷就。
在樣本外,無論是一月收益率和全年收益率,還是一月收益率和二月至十二月的累積收益率,這兩組收益率之間均無統(tǒng)計意義上顯著的正相關(guān)性。
如果一月晴雨表策略不是過度數(shù)據(jù)挖掘的產(chǎn)物,而存在合理的業(yè)務(wù)解釋。那么我們有理由相信,它在樣本外的表現(xiàn)應(yīng)該和回測期內(nèi)類似。然而,樣本內(nèi)外大相徑庭的結(jié)果表明,一月晴雨表策略僅僅是樣本內(nèi)數(shù)據(jù)挖掘的一廂情愿。
這進(jìn)一步證實(shí)了《為什么機(jī)器學(xué)習(xí)在投資領(lǐng)域不好使》一文的結(jié)論:任何被數(shù)據(jù)挖掘出來的數(shù)據(jù)模式都必須能夠被從業(yè)務(wù)上合理地解釋,否則它就是數(shù)據(jù)遷就的產(chǎn)物。
4 一月晴雨表在其他國家無明顯效果
最后考察一月指標(biāo)是否存在于其他一些主流市場中。這些市場包括:英國富時 100,日經(jīng) 225,德國 DAX,法國 CAC,瑞士 SSMI,新加坡海峽時報、韓國綜合、俄羅斯 RTS 以及我國的上證指數(shù)。我們得到的結(jié)論是,一月指標(biāo)在這些國家中并無明顯支撐:
1. 在所有考察的國家中,一月收益率和后 11 個月的收益率之間均無統(tǒng)計意義上顯著的相關(guān)性。
2. 僅在個別國家(包括上證指數(shù)),一月收益率和全年收益率存在統(tǒng)計意義上顯著正相關(guān)。然而由于我們使用的是能得到的全部數(shù)據(jù)進(jìn)行回測,因此即便如此也不能保證這些正相關(guān)在樣本外繼續(xù)有效(畢竟對于一月指標(biāo)缺乏業(yè)務(wù)上的支撐)。
3. 在絕大多數(shù)國家,一月晴雨表策略無法跑贏基準(zhǔn)指數(shù)。
特別的,對于我們最關(guān)心的中國股市,對上證指數(shù)的實(shí)證結(jié)果如下。
5 結(jié)語
實(shí)證表明,被華爾街津津樂道的一月指標(biāo)僅僅是過度數(shù)據(jù)挖掘的結(jié)果,其在樣本內(nèi)外的表現(xiàn)截然不同。無數(shù)人前仆后繼的試圖從歷史數(shù)據(jù)中挖掘出可以盈利的數(shù)據(jù)模式。不可否認(rèn),這樣的模式一定存在,但是真正經(jīng)得起檢驗(yàn)的模式必須是那些能夠從業(yè)務(wù)上被合理解釋的。否則,樣本內(nèi)的過度數(shù)據(jù)挖掘必將導(dǎo)致數(shù)據(jù)遷就,而如此得到的數(shù)據(jù)模式在樣本外必然只是空歡喜一場。
數(shù)據(jù)挖掘、人工智能、機(jī)器學(xué)習(xí)這些計算機(jī)和數(shù)學(xué)手段無一不擅長挖掘所謂的數(shù)據(jù)模式。而去偽存真才是一個合格的(量化投資)基金經(jīng)理必須具備的能力。
免責(zé)聲明:入市有風(fēng)險,投資需謹(jǐn)慎。在任何情況下,本文的內(nèi)容、信息及數(shù)據(jù)或所表述的意見并不構(gòu)成對任何人的投資建議。在任何情況下,本文作者及所屬機(jī)構(gòu)不對任何人因使用本文的任何內(nèi)容所引致的任何損失負(fù)任何責(zé)任。除特別說明外,文中圖表均直接或間接來自于相應(yīng)論文,僅為介紹之用,版權(quán)歸原作者和期刊所有。