過度數(shù)據(jù)挖掘之“一月晴雨表”

發(fā)布時間：2017-05-04 | 來源: 川總寫量化

作者：石川

摘要：華爾街流行的“一月晴雨表”策略缺乏令人信服的業(yè)務(wù)依據(jù)，僅僅來自樣本內(nèi)的過度數(shù)據(jù)挖掘，在樣本外效果非常差。

1 一月晴雨表

華爾街流行著一句老話“As January goes, so goes the year”。它的意思是一月份股票的漲跌往往和全年股票的漲跌一致：如果一月份上漲，那么全年大概率會上漲；如果一月份下跌，那么全年大概率也會下跌。華爾街有很多這個諺語的忠實(shí)信徒，并以此形成了一個流傳甚廣的擇時信號：January Barometer（一月晴雨表，又稱一月指標(biāo) January Indicator）。

追根溯源，這個現(xiàn)象于 1972 年被 Yale Hirsch 發(fā)現(xiàn)。后來，其子 Jeffrey Hirsch 統(tǒng)計了從 1950 年到 2006 年間該現(xiàn)象在標(biāo)普 500 指數(shù)上的正確率，發(fā)現(xiàn)其正確率達(dá)到驚人的 91.2%（下圖）。小 Hirsch 聲稱，在 57 年里，該信號僅有 5 次重大錯誤（他稱之為 major errors），這個 91.2% 的正確率就是這么來的，即 52 / 57。

然而，仔細(xì)想來，這么高的正確率頗有爭議。首先，這位仁兄選擇性的“失明”，剔除了另外 9 次該信號的非重大失誤。如果我們加上這 9 次，則該信號在 57 年間一共失效 14 次（5 次重大失誤 + 9 次非重大失誤），正確率驟然降為 75.4%。第二，他爹 Yale Hirsch?于 1972 年發(fā)現(xiàn)這個現(xiàn)象，這說明理論上任何人都不能在 1972 年之前運(yùn)用這個策略。因此，小 Hirsch 從 1950 開始回測也值得推敲。如果我們僅考察 1973 到 2006 年這 34 年間，該信號一共錯誤 9 次，正確率 73.5%。

上面這兩個錯誤就是過度數(shù)據(jù)挖掘的典型例子。在數(shù)據(jù)挖掘中，有一種非常普遍的錯誤做法：

Slicing and dicing the data until they produce the desired conclusion.

人們很容易找到一月指標(biāo)的反例。就拿剛剛過去的 2016 年來說，標(biāo)普 500 在 2016 年一月下跌 5% 以上，而其全年來看上漲 9.54%。如果按照一月指標(biāo)，那么我們將會錯過從二月份開始高達(dá) 14% 以上的反彈！The Wall Street Journal 也曾刊文《Sorry, the ‘January Barometer’ is a Market Myth》批判了一月指標(biāo)。其核心觀點(diǎn)是嚴(yán)格的統(tǒng)計分析并不支持一月走勢預(yù)測全年走勢這種說法：

The idea that the direction stocks take in January will be their direction for the full year?isn't?supported by strict statistical analysis.

下面就來看看一月晴雨表指標(biāo)到底存不存在。

2 樣本內(nèi)的激動人心

利用一月指標(biāo)、并以標(biāo)普 500 指數(shù)為投資標(biāo)的，構(gòu)建一個簡單的擇時策略，稱為一月晴雨表策略：

每年一月買入標(biāo)普 500，如果一月上漲，則在該年內(nèi)全年持有；如果一月下跌，則在一月最后一個交易日清倉，在該年的二到十二月空倉（為了簡化我們假設(shè)空倉，實(shí)際中可以購買債券等低風(fēng)險資產(chǎn)）。不考慮任何交易成本。

為檢驗(yàn)一月指標(biāo)，首先考察該策略能否跑贏指數(shù)本身。其次，考察兩組收益率之間的相關(guān)系數(shù)以及相關(guān)系數(shù)的顯著性水平。這兩組收益率分別為：

第一組：一月收益率和年收益率

第二組：一月收益率和當(dāng)年二月到十二月份的累積收益率

下面的小貼士介紹了如何檢驗(yàn)兩個時間序列（在本文是上面每組中的兩個收益率序列）的樣本相關(guān)系數(shù)的顯著性水平。

檢驗(yàn)相關(guān)系數(shù)的顯著性水平

對于兩個長度為 n 的時間序列，假設(shè)這兩個序列的樣本相關(guān)系數(shù)是 r，則 r 對于總體（population）的真實(shí)但未知的相關(guān)系數(shù)的標(biāo)準(zhǔn)誤差（standard error）為：

SE = sqrt(1 - r^2) / sqrt(n - 2)

SE?越大說明由樣本計算出來的相關(guān)系數(shù)越無法準(zhǔn)確的反應(yīng)總體的真實(shí)相關(guān)系數(shù)。SE 和樣本大小 n 成反比，這說明樣本點(diǎn)越多，得到的誤差越小。在統(tǒng)計學(xué)中，通過假設(shè)檢驗(yàn)來判斷這兩個序列的相關(guān)系數(shù)是否顯著；原假設(shè)為“兩個時間序列沒有線性相關(guān)性（即它們的相關(guān)系數(shù)為 0）”。是否接受這個原假設(shè)可以利用 t 分布來檢驗(yàn)。相關(guān)系數(shù) r 和標(biāo)準(zhǔn)誤差 SE 的比值，即 r/SE，是一個滿足自由度為 n - 2 的 t 分布的隨機(jī)變量。因此，只要考察 r/SE 的值，就能知道在給定的置信水平下是否能夠拒絕原假設(shè)。

我們將樣本內(nèi)回測區(qū)間設(shè)為 1972 年 1 月 1 日到 2006 年 12 月 31 日。（1972 年是一月效應(yīng)被提出的年份；而 2006 年是小?Hirsch 在他的計算中考察的結(jié)束時點(diǎn)。）在該區(qū)間內(nèi)，策略和標(biāo)普 500 同期的指標(biāo)如下圖所示。不可否認(rèn)，策略確實(shí)跑贏了指數(shù)。圖中的最后一個指標(biāo)是收益率檢驗(yàn)。該檢驗(yàn)的原假設(shè)是策略收益率序列和基準(zhǔn)指數(shù)收益率序列的均值相同，以此考察策略的高夏普率是否具備統(tǒng)計意義。然而，結(jié)果表明我們不能拒絕原假設(shè)（p-value高達(dá) 0.975）。因此，策略的高夏普率不具備統(tǒng)計意義。事實(shí)上，稍后會看到，策略的高夏普率僅僅來自個別年份指數(shù)大跌然而策略在一月底清倉而逃過大跌。

回測期內(nèi)，一月收益率和年收益率的相關(guān)系數(shù)相關(guān)指標(biāo)為：

從以上結(jié)果不難發(fā)現(xiàn)，策略確實(shí)在樣本內(nèi)確實(shí)跑贏指數(shù)，且一月份的收益率和年收益率的相關(guān)系數(shù)高達(dá) 0.54（正相關(guān)）并且在統(tǒng)計上顯著。這一切似乎說明一月指標(biāo)在樣本內(nèi)確實(shí)有效。

然而一個不能忽視的事實(shí)是，在樣本內(nèi)的回測期之中，指數(shù)在一月份上漲的比例高達(dá) 61.8%。下圖展示了回測期內(nèi)不同月份的平均收益率，一月份是 12 個月份中表現(xiàn)最好的，平均收益率高達(dá) 1.76%！這說明策略選擇一月份持股的前提下，凈值就有了基本的保障。

注意，一月份收益率在回測期內(nèi)冠絕群雄僅僅是數(shù)據(jù)挖掘出來的一個現(xiàn)象，但人們并沒有提出任何業(yè)務(wù)依據(jù)來為解釋該現(xiàn)象。因此，為了避免數(shù)據(jù)遷就（data snooping），我們對原有的策略進(jìn)行微調(diào)，將一月份作為觀察期，而非直接于一月份持股：

如果一月上漲，則在該年內(nèi)二到十二月買入并持有標(biāo)普 500；如果一月下跌，則在該年其他月份空倉（同樣，為了簡化我們假設(shè)空倉，實(shí)際中可以購買債券等低風(fēng)險資產(chǎn)）。不考慮任何交易成本。

為了區(qū)分這兩個策略，稱原始策略為“一月晴雨表策略（一月持倉）”；稱改進(jìn)策略為“一月晴雨表策略（一月觀望）”。改進(jìn)策略的凈值和基準(zhǔn)指數(shù)相比，效果如下，策略跑輸了指數(shù)，但兩個收益率序列均值的差異仍然不顯著（p-value 為 0.292）。

此外，我們更加關(guān)注一月份收益率和同年后 11 個月（即二月到十二月）的累積收益率之間是否存在統(tǒng)計意義上顯著的正相關(guān)。結(jié)果（下圖）表明，這兩個收益率序列的相關(guān)性并不顯著、無法拒絕原假設(shè)。

下圖展示了兩個策略和基準(zhǔn)指數(shù)在回測期內(nèi)每年的收益率。可以看到，兩個策略之所以取得了更高的夏普率，僅僅是因?yàn)樵趥€別年份躲過了整年的大跌，或是因?yàn)橛捎谝辉轮笜?biāo)的錯誤而錯過了指數(shù)的上漲。這兩個效應(yīng)疊加使得策略的收益率波動更低，這便是高夏普率的直接原因。然而策略收益率和基準(zhǔn)收益率的均值并無統(tǒng)計意義上的顯著差異。

作為小結(jié)，本節(jié)的實(shí)證得到如下觀點(diǎn)：

1. 原始一月晴雨表策略（即一月持倉）在回測期內(nèi)跑贏指數(shù)；一月份收益率和全年收益率存在統(tǒng)計上顯著的正相關(guān)。

2. 回測期內(nèi)，基準(zhǔn)指數(shù)大概率在一月份上漲，且一月份的平均漲幅雄冠全年；因此原始策略存在數(shù)據(jù)遷就。

3. 改進(jìn)的一月晴雨表策略（即一月觀望）在回測期內(nèi)無法跑贏指數(shù)；一月份收益率和二月到十二月的累積收益率不存在統(tǒng)計上顯著的正相關(guān)。

4. 兩個策略均取得比基準(zhǔn)指數(shù)更高的夏普率，然而策略收益率序列和基準(zhǔn)指數(shù)收益率序列的均值在統(tǒng)計上無顯著差異。

3 樣本外的心灰意冷

第 2 節(jié)的實(shí)證雖然說明一月晴雨表策略在樣本內(nèi)效果不錯，但縱觀學(xué)術(shù)界和業(yè)界對一月指標(biāo)的研究，業(yè)務(wù)解釋非常牽強(qiáng)。當(dāng)一個所謂的數(shù)據(jù)模式（data pattern）僅僅來自過度數(shù)據(jù)挖掘，而缺乏合理的業(yè)務(wù)依據(jù)時，這樣的模式往往是虛假的、難以令人信服的。因?yàn)樗緹o法保證對樣本外的數(shù)據(jù)同樣有效。

一月指標(biāo)在樣本外恰恰中招。假如我們錯信一月晴雨表策略真正有效，而滿懷信心地在樣本外（2007 年 1 月 1 至今）運(yùn)用該策略時，那一定會懷疑人生。無論一月是持倉還是觀望，兩個策略均跑輸指數(shù)本身。尤其是原始的一月持倉策略，可以看到最近三年（2014 至 2016），一月指標(biāo)接連發(fā)出錯誤信號導(dǎo)致我們在一月下跌后離場，而指數(shù)本身在當(dāng)年的后 11 個月發(fā)生了不同程度的反彈。值得注意的是，在樣本外的年份中，一月上漲的比例僅為 40%，和樣本內(nèi)的 61.8% 千差萬別。這有力的說明了樣本內(nèi)的一月晴雨表策略存在數(shù)據(jù)遷就。

在樣本外，無論是一月收益率和全年收益率，還是一月收益率和二月至十二月的累積收益率，這兩組收益率之間均無統(tǒng)計意義上顯著的正相關(guān)性。

如果一月晴雨表策略不是過度數(shù)據(jù)挖掘的產(chǎn)物，而存在合理的業(yè)務(wù)解釋。那么我們有理由相信，它在樣本外的表現(xiàn)應(yīng)該和回測期內(nèi)類似。然而，樣本內(nèi)外大相徑庭的結(jié)果表明，一月晴雨表策略僅僅是樣本內(nèi)數(shù)據(jù)挖掘的一廂情愿。

這進(jìn)一步證實(shí)了《為什么機(jī)器學(xué)習(xí)在投資領(lǐng)域不好使》一文的結(jié)論：任何被數(shù)據(jù)挖掘出來的數(shù)據(jù)模式都必須能夠被從業(yè)務(wù)上合理地解釋，否則它就是數(shù)據(jù)遷就的產(chǎn)物。

4 一月晴雨表在其他國家無明顯效果

最后考察一月指標(biāo)是否存在于其他一些主流市場中。這些市場包括：英國富時 100，日經(jīng) 225，德國 DAX，法國 CAC，瑞士 SSMI，新加坡海峽時報、韓國綜合、俄羅斯 RTS 以及我國的上證指數(shù)。我們得到的結(jié)論是，一月指標(biāo)在這些國家中并無明顯支撐：

1. 在所有考察的國家中，一月收益率和后 11 個月的收益率之間均無統(tǒng)計意義上顯著的相關(guān)性。

2. 僅在個別國家（包括上證指數(shù)），一月收益率和全年收益率存在統(tǒng)計意義上顯著正相關(guān)。然而由于我們使用的是能得到的全部數(shù)據(jù)進(jìn)行回測，因此即便如此也不能保證這些正相關(guān)在樣本外繼續(xù)有效（畢竟對于一月指標(biāo)缺乏業(yè)務(wù)上的支撐）。

3. 在絕大多數(shù)國家，一月晴雨表策略無法跑贏基準(zhǔn)指數(shù)。

特別的，對于我們最關(guān)心的中國股市，對上證指數(shù)的實(shí)證結(jié)果如下。

5 結(jié)語

實(shí)證表明，被華爾街津津樂道的一月指標(biāo)僅僅是過度數(shù)據(jù)挖掘的結(jié)果，其在樣本內(nèi)外的表現(xiàn)截然不同。無數(shù)人前仆后繼的試圖從歷史數(shù)據(jù)中挖掘出可以盈利的數(shù)據(jù)模式。不可否認(rèn)，這樣的模式一定存在，但是真正經(jīng)得起檢驗(yàn)的模式必須是那些能夠從業(yè)務(wù)上被合理解釋的。否則，樣本內(nèi)的過度數(shù)據(jù)挖掘必將導(dǎo)致數(shù)據(jù)遷就，而如此得到的數(shù)據(jù)模式在樣本外必然只是空歡喜一場。

數(shù)據(jù)挖掘、人工智能、機(jī)器學(xué)習(xí)這些計算機(jī)和數(shù)學(xué)手段無一不擅長挖掘所謂的數(shù)據(jù)模式。而去偽存真才是一個合格的（量化投資）基金經(jīng)理必須具備的能力。

免責(zé)聲明：入市有風(fēng)險，投資需謹(jǐn)慎。在任何情況下，本文的內(nèi)容、信息及數(shù)據(jù)或所表述的意見并不構(gòu)成對任何人的投資建議。在任何情況下，本文作者及所屬機(jī)構(gòu)不對任何人因使用本文的任何內(nèi)容所引致的任何損失負(fù)任何責(zé)任。除特別說明外，文中圖表均直接或間接來自于相應(yīng)論文，僅為介紹之用，版權(quán)歸原作者和期刊所有。

亚洲精品国产精品制服丝袜,亚洲欧美日韩精品a∨,97在线热免费视频精品视频,亚洲人成在线观看网站不卡

合格投資者聲明

過度數(shù)據(jù)挖掘之“一月晴雨表”