收益率到底能不能預(yù)測(cè)（模型篇）？

發(fā)布時(shí)間：2018-03-15 | 來源: 川總寫量化

”

作者：石川

摘要：“不要把時(shí)間序列中的長期漂移率項(xiàng)當(dāng)成可預(yù)測(cè)性?！辟Y產(chǎn)的收益率可預(yù)測(cè)嗎？本文介紹檢驗(yàn)時(shí)間序列隨機(jī)性的統(tǒng)計(jì)模型。

1 引言

不要把時(shí)間序列中的長期漂移率項(xiàng)當(dāng)成可預(yù)測(cè)性。

這是我近期看到的頗受啟發(fā)的一句話，它出自經(jīng)濟(jì)計(jì)量學(xué)的一本經(jīng)典著作 Campbell et al. (1996)。在量化投資領(lǐng)域，人們較勁腦汁兒想要分析、預(yù)測(cè)收益率這個(gè)時(shí)間序列。從時(shí)間序列分析到各種機(jī)器學(xué)習(xí)算法，越來越復(fù)雜的非線性模型都被拿來，對(duì)著收益率序列就是一通比劃，就是為了提高對(duì)未來收益率預(yù)測(cè)的準(zhǔn)確性。

但是，可能人們都忽視了一個(gè)核心的問題：收益率到底可預(yù)測(cè)嗎？學(xué)術(shù)界和業(yè)界比較主流的看法是，資產(chǎn)的價(jià)格可以由隨機(jī)游走（random walk）過程來描述，這對(duì)應(yīng)的是收益率無法預(yù)測(cè)。當(dāng)然，如果價(jià)格是純粹的隨機(jī)游走，那我們也不需要開發(fā)各種復(fù)雜的數(shù)學(xué)模型了，就每天扔硬幣、猜漲跌就行了。但是，這不妨礙隨機(jī)游走成為研究價(jià)格和收益率序列的一個(gè)很好的出發(fā)點(diǎn)。

談及隨機(jī)游走，人們第一個(gè)想到的大概是布朗運(yùn)動(dòng)（見《寫給你的金融時(shí)間序列分析：初級(jí)篇》或《布朗運(yùn)動(dòng)、伊藤引理、BS 公式（前篇）》）。由于要求不重疊但等長的時(shí)間區(qū)間內(nèi)的過程增量（對(duì)數(shù)價(jià)格的增量就是對(duì)數(shù)收益率）符合 IID 分布（獨(dú)立且同分布），布朗運(yùn)動(dòng)這個(gè)版本的隨機(jī)游走的局限性非常強(qiáng)。因此在這個(gè)版本的基礎(chǔ)上，人們又提出了另外兩個(gè)版本。算上布朗運(yùn)動(dòng)，一共有三個(gè)版本，它們的定義如下：

隨機(jī)游走模型一：假設(shè)不同期的（對(duì)數(shù)）收益率之間滿足 IID 分布。

隨機(jī)游走模型二：假設(shè)不同期的（對(duì)數(shù)）收益率之間滿足獨(dú)立分布，但可以是不同的分布。

隨機(jī)游走模型三：假設(shè)不同期的（對(duì)數(shù)）收益率之間滿足線性相關(guān)性為零（但可以在更高階上非獨(dú)立）。

模型二在模型一的基礎(chǔ)上，放松了同分布這個(gè)限制；而模型三更是僅假設(shè)不同的收益率之間滿足一階（線性）的獨(dú)立性，而允許收益率在高階上非獨(dú)立。我們經(jīng)常觀察到資產(chǎn)收益率的波動(dòng)率聚類，這說明收益率的二階就不是獨(dú)立的，因此模型三似乎更符合現(xiàn)實(shí)。

雖然現(xiàn)實(shí)中收益率很難滿足模型一的假設(shè)，但只有先對(duì)它有個(gè)正確的理解才能更好的搞清楚后續(xù)的復(fù)雜模型。為此，我們用兩期文章來介紹相關(guān)內(nèi)容。本篇（模型篇）介紹兩種檢驗(yàn)方法以判斷一個(gè)時(shí)間序列是否滿足模型一。下篇（實(shí)證篇）使用這兩個(gè)方法對(duì)A股幾大股指的對(duì)數(shù)收益率序列進(jìn)行實(shí)證檢驗(yàn)，并說明實(shí)證結(jié)果對(duì)于構(gòu)建量化策略有何種借鑒意義。

這兩種檢驗(yàn)分別為順序和反轉(zhuǎn)檢驗(yàn)以及游程檢驗(yàn)。它們都是非參數(shù)化檢驗(yàn)。

2 順序和反轉(zhuǎn)檢驗(yàn)

為了將對(duì)檢驗(yàn)方法的介紹和研究對(duì)象結(jié)合起來，假設(shè)我們考察的是資產(chǎn)的對(duì)數(shù)價(jià)格序列的隨機(jī)性。因此，它的增量就是對(duì)數(shù)收益率。我們假設(shè)對(duì)數(shù)收益率的分布是對(duì)稱的。第一種檢驗(yàn)對(duì)數(shù)收益率是否為 IID 的方法是順序和反轉(zhuǎn)檢驗(yàn)（sequences and reversals test），由Cowles and Jones (1937) 提出。對(duì)一個(gè)對(duì)數(shù)收益率，首先對(duì)其按如下轉(zhuǎn)換變成 0、1 序列：

其中 r_t ~ IID(0, σ^2) 和 p_t 分別為某資產(chǎn)在 t 時(shí)刻的對(duì)數(shù)收益率和對(duì)數(shù)價(jià)格。經(jīng)過上述變換后，一個(gè)收益率序列就轉(zhuǎn)化為一組由 0 和 1 組成的序列，例如 1001110101011000011010。在這樣一個(gè)序列中，任意相鄰的兩個(gè)數(shù)如果同為 0 或者同為 1，則稱它們?yōu)橐粋€(gè)順序（sequence）；反之，如果任意相鄰的兩個(gè)數(shù)為 0 和 1、或者 1 和 0，則稱它們?yōu)橐粋€(gè)反轉(zhuǎn)（reversals）。根據(jù)這個(gè)定義，我們可以在上面那個(gè)序列中用紅色和綠色標(biāo)出一些順序和反轉(zhuǎn)的例子：1001110101011000011010。（注意，在前面我們僅僅標(biāo)出一些示例。在實(shí)際計(jì)算時(shí)，應(yīng)該逐一考慮相鄰的每對(duì)數(shù)是一個(gè)順序還是一個(gè)反轉(zhuǎn)。例如在 010 這三個(gè)數(shù)中，就有 01 和 10 兩個(gè)反轉(zhuǎn)對(duì)兒、沒有順序?qū)骸＃?/span>

在數(shù)學(xué)上，上述定義可以轉(zhuǎn)化為如下簡單的數(shù)學(xué)公式，通過它們可以計(jì)算出一個(gè)長度為 n 的時(shí)間序列中，順序和反轉(zhuǎn)各自的總個(gè)數(shù)：

其中 N_s 是順序?qū)旱膫€(gè)數(shù)，N_r 是反轉(zhuǎn)對(duì)兒的個(gè)數(shù)。有了 N_s 和 N_r 之后，就可以定義待檢驗(yàn)的變量了。為了向發(fā)明者致敬，稱這個(gè)檢驗(yàn)量為 CJ 統(tǒng)計(jì)量，那是 N_s 和 N_r 的比值：

先來考慮最簡單的情況，即對(duì)數(shù)收益率沒有長期漂移率項(xiàng)（即長期均值為 0）。這當(dāng)然不符合大多數(shù)實(shí)際情況，因?yàn)樗馕吨L期來看買入和持有某種投資品是不掙錢的（在商品期貨市場基本符合，但對(duì)于股市和債市，這個(gè)假設(shè)很難成立）。在這種情況下，如果收益率序列滿足 IID，則我們可以預(yù)期漲、跌出現(xiàn)的次數(shù)也應(yīng)該基本一樣，因此這個(gè)序列中的順序和反轉(zhuǎn)對(duì)兒數(shù)也應(yīng)該基本一樣。因此，如果假設(shè)漂移率項(xiàng)為零，則隨著序列個(gè)數(shù) n 的增大，CJ 統(tǒng)計(jì)量應(yīng)該逐漸逼近 1。

然而，一旦考慮了漂移率項(xiàng)，一切就變了。我們不能再假設(shè) CJ 統(tǒng)計(jì)量的極限值為 1。無論是一個(gè)正的漂移率（意味著長期來看持有該資產(chǎn)是能掙錢的）還是一個(gè)負(fù)的漂移率（意味著長期來看持有該資產(chǎn)是注定虧損的），這個(gè)非零的漂移率都將使收益率序列中順序?qū)旱膫€(gè)數(shù)多余反轉(zhuǎn)對(duì)兒的個(gè)數(shù)，即 CJ 應(yīng)該大于 1。為了量化非零漂移量對(duì) CJ 統(tǒng)計(jì)量的影響，我們需要已知增量的具體分布，為此選擇正態(tài)分布。在考慮漂移率的情況下，對(duì)數(shù)價(jià)格的隨機(jī)過程可描述為：

其中 μ 是非零的漂移率。由上述定義可知，對(duì)數(shù)收益率為 r_t ~ N(μ, σ^2)。在這種情況下，經(jīng)過必要的數(shù)學(xué)推導(dǎo)可以證明 CJ 統(tǒng)計(jì)量應(yīng)近似的滿足如下正態(tài)分布：

其中

因此，實(shí)際的檢驗(yàn)可依如下步驟進(jìn)行：

1. 將對(duì)數(shù)收益率序列變換為 0、1 序列；

2. 計(jì)算新序列中順序?qū)汉头崔D(zhuǎn)對(duì)兒的個(gè)數(shù) N_s 以及 N_r，計(jì)算 CJ 統(tǒng)計(jì)量；

3. 計(jì)算對(duì)數(shù)收益率序列的均值和標(biāo)準(zhǔn)差，作為 μ 和 σ 的估計(jì)；

4. 計(jì)算 π = Φ(μ/σ)，這里 Φ 是標(biāo)準(zhǔn)正態(tài)分布的累積密度函數(shù)；計(jì)算 π_s；

5. 計(jì)算 CJ 統(tǒng)計(jì)量應(yīng)滿足的正態(tài)分布的均值和標(biāo)準(zhǔn)差；

6. 根據(jù)第 5 步中的正態(tài)分布計(jì)算 CJ 統(tǒng)計(jì)量的 p-value，以此判斷對(duì)數(shù)收益率序列是否滿足 IID。

3 游程檢驗(yàn)

第二個(gè)可用于 IID 的檢驗(yàn)稱為 runs test（游程檢驗(yàn)，也譯作連貫檢驗(yàn)），由 Mood (1940) 提出。在這個(gè)檢驗(yàn)中，我們同樣先將對(duì)數(shù)收益率序列轉(zhuǎn)換成由 0 和 1 構(gòu)成的序列（0 代表負(fù)收益、1 代表正收益）。在這個(gè)新的序列中，由連續(xù)的“0”或者連續(xù)的“1”構(gòu)成的子序列稱為一個(gè)“run”。比如，在 1001110100 這個(gè)序列中，連續(xù)的“1”構(gòu)成的 runs 有 3 個(gè)（長度分別為 1，3 和 1），連續(xù)的“0”構(gòu)成的 runs 同樣為 3 個(gè)（長度分別為 2，1 和 2）。作為對(duì)比，在 0000011111 這個(gè)序列中，連續(xù)的“0”和“1”各自僅僅構(gòu)成 1 個(gè) run。

如果一個(gè)時(shí)間序列的增量滿足 IID 且沒有非零漂移率，那么我們可以預(yù)期它的“熵最大”，即 0 和 1 雜亂的隨機(jī)出現(xiàn)、表現(xiàn)出最大的隨機(jī)性。在這種情況下，對(duì)于一個(gè)長度為 n 的序列，它的期望 runs 個(gè)數(shù)等于 (n+1)/2。比如一個(gè)由 0 和 1 構(gòu)成的長度為 1000 的時(shí)間序列，如果它是純隨機(jī)的，那么“0”和“1”構(gòu)成的 runs 的總個(gè)數(shù)的期望為 500.5。顯然，在上面的兩個(gè)例子中，那兩個(gè)序列都各有 10 個(gè)數(shù)，但是第一個(gè)序列的 runs 個(gè)數(shù)為 6 而第二個(gè)序列的 runs 個(gè)數(shù)僅僅為 2；顯然第二個(gè)序列（0000011111）更不具備隨機(jī)性（它看上去也確實(shí)更有規(guī)律）。

和前一種方法一樣，我們需要警惕非零漂移率對(duì) runs 個(gè)數(shù)的影響。由于它的存在，我們不能僅憑 runs 的個(gè)數(shù)大大偏離 (n+1)/2 就說這個(gè)序列不具備隨機(jī)性。這是因?yàn)?/span>非零漂移率會(huì)減少 runs 的個(gè)數(shù)。為了定量分析非零漂移率的影響，讓我們?cè)俅渭僭O(shè)對(duì)數(shù)收益率 r_t 滿足 N(μ, σ^2)。在這個(gè)假設(shè)下，下表給出了當(dāng) n = 1000，σ = 21%時(shí)，不同的漂移率 μ 對(duì)應(yīng)的 runs 個(gè)數(shù)的期望。不難看出，runs 個(gè)數(shù)的期望隨 μ 遞減。

為了使用 runs test 檢驗(yàn)對(duì)數(shù)收益率的隨機(jī)性，構(gòu)建如下統(tǒng)計(jì)量：

其中 N_runs 是由“0”和“1”構(gòu)成的 runs 數(shù)量的總和（每個(gè) run 的長度在這個(gè)檢驗(yàn)中不重要），n 為時(shí)間序列長度，π = Φ(μ/σ)。數(shù)學(xué)上可證 z 在極限情況下近似的符合標(biāo)準(zhǔn)正態(tài)分布。因此，實(shí)際的檢驗(yàn)可依如下步驟進(jìn)行：

1. 將對(duì)數(shù)收益率序列變換為 0、1 序列；

2. 計(jì)算新序列中由“0”和“1”構(gòu)成的 runs 的總個(gè)數(shù)，記為 N_runs；

3. 計(jì)算對(duì)數(shù)收益率序列的均值和標(biāo)準(zhǔn)差，作為 μ 和 σ 的估計(jì)；

4. 計(jì)算 π = Φ(μ/σ)，這里 Φ 是標(biāo)準(zhǔn)正態(tài)分布的累積密度函數(shù)；

5. 計(jì)算 z 統(tǒng)計(jì)量；

6. 計(jì)算 z 統(tǒng)計(jì)量在正態(tài)分布假設(shè)下的 p-value，以此判斷對(duì)數(shù)收益率序列是否滿足 IID。

4 一個(gè)例子

下面使用一個(gè)假想的例子來考察上文介紹的兩個(gè)檢驗(yàn)方法。為此，我們使用標(biāo)準(zhǔn)正態(tài)分布產(chǎn)生一個(gè)隨機(jī)游走過程如下，序列的長度為 1000。

盡管這是一個(gè)標(biāo)準(zhǔn)的隨機(jī)游走，但局部隨機(jī)趨勢(shì)（local stochastic trend）的存在會(huì)給我們?cè)斐梢环N假象，即認(rèn)為它是有趨勢(shì)的。使用本文介紹的兩種檢驗(yàn)方法考察這個(gè)時(shí)間序列的隨機(jī)性，得到如下結(jié)果：

順序和反轉(zhuǎn)檢驗(yàn)：CJ 統(tǒng)計(jì)量 = 1.064，p-value = 0.311，結(jié)論為該序列滿足隨機(jī)游走。

游程檢驗(yàn)：z 統(tǒng)計(jì)量 = -0.917，p-value = 0.359，結(jié)論同樣為該序列滿足隨機(jī)游走。

雖然該序列在局部存在趨勢(shì)，但在整個(gè)時(shí)間尺度上看，它滿足隨機(jī)游走。（這當(dāng)然也是必然的結(jié)果，因?yàn)檫@個(gè)序列就是用 IID 的標(biāo)準(zhǔn)正態(tài)分布增量產(chǎn)生的。）但我們想通過它說明的問題是，哪怕是一個(gè)隨機(jī)性很高的時(shí)間序列在其局部也會(huì)因?yàn)殡S機(jī)趨勢(shì)給我們?cè)斐梢环N錯(cuò)覺 —— 它的隨機(jī)性很弱、是可以預(yù)測(cè)的。

根據(jù)這個(gè)錯(cuò)覺來構(gòu)建策略是非常危險(xiǎn)的。這是因?yàn)槿魏钨Y產(chǎn)的實(shí)際價(jià)格走勢(shì)都是某個(gè)未知分布的一個(gè)realization（實(shí)現(xiàn)）而已。如果抓住這個(gè)錯(cuò)覺、認(rèn)為該資產(chǎn)的價(jià)格走勢(shì)有一定的預(yù)測(cè)性（即收益率有預(yù)測(cè)性），并針對(duì)它開發(fā)了一個(gè)策略，我們根本無法預(yù)期該策略在樣本外有同樣的表現(xiàn)。

由于僅有一個(gè)實(shí)現(xiàn)（過去這段時(shí)間的價(jià)格走勢(shì)只發(fā)生一遍），我們無法在統(tǒng)計(jì)上正確的評(píng)價(jià)該策略的參數(shù)對(duì)這個(gè)未知收益率分布是否有效，正如我們不知道在樣本外，隨機(jī)趨勢(shì)有多大以及它什么時(shí)候出現(xiàn)。策略在樣本外的表現(xiàn)很有可能和其在樣本內(nèi)的表現(xiàn)大相徑庭。

當(dāng)然，先不用急著“過度悲觀”，畢竟上面這個(gè)例子中使用的時(shí)間序列就是一個(gè)隨機(jī)游走。在本系列的下篇（實(shí)證篇）我們會(huì)使用真實(shí)的來自 A 股指數(shù)的價(jià)格序列，分析它們的對(duì)數(shù)收益率是否存在非隨機(jī)性，以及分析結(jié)果對(duì)構(gòu)建量化策略有哪些重要的推論。

5 結(jié)語

作為系列的模型篇，本文介紹了兩種檢驗(yàn)時(shí)間序列隨機(jī)性的方法。在下篇中，我們將使用這些方法分析 A 股的股指（如滬深 300 指數(shù)）對(duì)數(shù)收益率的隨機(jī)性。為了和開篇的那句引用相呼應(yīng)，不妨來個(gè)劇透。在大多數(shù)時(shí)間內(nèi)，指數(shù)的對(duì)數(shù)收益率均滿足 IID；只有當(dāng)明顯的大牛、大熊市的時(shí)候，才能觀察到統(tǒng)計(jì)上顯著的非隨機(jī)性。

無論是時(shí)間序列分析還是復(fù)雜的機(jī)器學(xué)習(xí)算法，都是為了分析收益率的殘差項(xiàng)（即排除了收益率中的長期漂移率、周期性等之后所剩余的部分）是否存在預(yù)測(cè)性。如果殘差滿足非隨機(jī)性，這些復(fù)雜算法自然大有可為。但是不要忘記，在大牛、大熊市中，收益率的漂移率項(xiàng)也顯著的不為零。那么，在一個(gè)很強(qiáng)的非零漂移率項(xiàng)面前，殘差中的非隨機(jī)性到底是“錦上添花”還是“畫蛇添足”呢（反正不是“雪中送炭”）？下篇中將給出我們的思考。

參考文獻(xiàn)

Campbell, J. Y., A. W. Lo, and C. MacKinlay (1996). The econometrics of financial markets. Princeton University Press.

Cowles, A. and H. E. Jones (1937). Some a posterior probabilities in stock market action. Econometrica 5, 280 – 294.

Mood, A. (1940). The distribution theory of runs. Annals of Mathematical Statistics 11, 367 – 392.

免責(zé)聲明：入市有風(fēng)險(xiǎn)，投資需謹(jǐn)慎。在任何情況下，本文的內(nèi)容、信息及數(shù)據(jù)或所表述的意見并不構(gòu)成對(duì)任何人的投資建議。在任何情況下，本文作者及所屬機(jī)構(gòu)不對(duì)任何人因使用本文的任何內(nèi)容所引致的任何損失負(fù)任何責(zé)任。除特別說明外，文中圖表均直接或間接來自于相應(yīng)論文，僅為介紹之用，版權(quán)歸原作者和期刊所有。

亚洲精品国产精品制服丝袜,亚洲欧美日韩精品a∨,97在线热免费视频精品视频,亚洲人成在线观看网站不卡

合格投資者聲明

收益率到底能不能預(yù)測(cè)（模型篇）？

亚洲精品国产精品制服丝袜,亚洲欧美日韩精品a∨,97在线热免费视频精品视频,亚洲人成在线观看网站不卡

合格投資者聲明

收益率到底能不能預(yù)測(cè)（模型篇）？

收益率到底能不能預(yù)測(cè)（模型篇）？