亚洲精品国产精品制服丝袜,亚洲欧美日韩精品a∨,97在线热免费视频精品视频,亚洲人成在线观看网站不卡

收益率到底能不能預(yù)測(cè)(模型篇)?

發(fā)布時(shí)間:2018-03-15  |   來源: 川總寫量化

作者:石川

摘要:“不要把時(shí)間序列中的長期漂移率項(xiàng)當(dāng)成可預(yù)測(cè)性?!辟Y產(chǎn)的收益率可預(yù)測(cè)嗎?本文介紹檢驗(yàn)時(shí)間序列隨機(jī)性的統(tǒng)計(jì)模型。


1 引言


不要把時(shí)間序列中的長期漂移率項(xiàng)當(dāng)成可預(yù)測(cè)性。


這是我近期看到的頗受啟發(fā)的一句話,它出自經(jīng)濟(jì)計(jì)量學(xué)的一本經(jīng)典著作 Campbell et al. (1996)。在量化投資領(lǐng)域,人們較勁腦汁兒想要分析、預(yù)測(cè)收益率這個(gè)時(shí)間序列。從時(shí)間序列分析到各種機(jī)器學(xué)習(xí)算法,越來越復(fù)雜的非線性模型都被拿來,對(duì)著收益率序列就是一通比劃,就是為了提高對(duì)未來收益率預(yù)測(cè)的準(zhǔn)確性。


但是,可能人們都忽視了一個(gè)核心的問題:收益率到底可預(yù)測(cè)嗎?學(xué)術(shù)界和業(yè)界比較主流的看法是,資產(chǎn)的價(jià)格可以由隨機(jī)游走(random walk)過程來描述,這對(duì)應(yīng)的是收益率無法預(yù)測(cè)。當(dāng)然,如果價(jià)格是純粹的隨機(jī)游走,那我們也不需要開發(fā)各種復(fù)雜的數(shù)學(xué)模型了,就每天扔硬幣、猜漲跌就行了。但是,這不妨礙隨機(jī)游走成為研究價(jià)格和收益率序列的一個(gè)很好的出發(fā)點(diǎn)。


談及隨機(jī)游走,人們第一個(gè)想到的大概是布朗運(yùn)動(dòng)(見《寫給你的金融時(shí)間序列分析:初級(jí)篇》《布朗運(yùn)動(dòng)、伊藤引理、BS 公式(前篇)》)。由于要求不重疊但等長的時(shí)間區(qū)間內(nèi)的過程增量(對(duì)數(shù)價(jià)格的增量就是對(duì)數(shù)收益率)符合 IID 分布(獨(dú)立且同分布),布朗運(yùn)動(dòng)這個(gè)版本的隨機(jī)游走的局限性非常強(qiáng)。因此在這個(gè)版本的基礎(chǔ)上,人們又提出了另外兩個(gè)版本。算上布朗運(yùn)動(dòng),一共有三個(gè)版本,它們的定義如下:


隨機(jī)游走模型一:假設(shè)不同期的(對(duì)數(shù))收益率之間滿足 IID 分布。


隨機(jī)游走模型二:假設(shè)不同期的(對(duì)數(shù))收益率之間滿足獨(dú)立分布,但可以是不同的分布。


隨機(jī)游走模型三:假設(shè)不同期的(對(duì)數(shù))收益率之間滿足線性相關(guān)性為零(但可以在更高階上非獨(dú)立)。


模型二在模型一的基礎(chǔ)上,放松了同分布這個(gè)限制;而模型三更是僅假設(shè)不同的收益率之間滿足一階(線性)的獨(dú)立性,而允許收益率在高階上非獨(dú)立。我們經(jīng)常觀察到資產(chǎn)收益率的波動(dòng)率聚類,這說明收益率的二階就不是獨(dú)立的,因此模型三似乎更符合現(xiàn)實(shí)。


雖然現(xiàn)實(shí)中收益率很難滿足模型一的假設(shè),但只有先對(duì)它有個(gè)正確的理解才能更好的搞清楚后續(xù)的復(fù)雜模型。為此,我們用兩期文章來介紹相關(guān)內(nèi)容。本篇(模型篇)介紹兩種檢驗(yàn)方法以判斷一個(gè)時(shí)間序列是否滿足模型一。下篇(實(shí)證篇)使用這兩個(gè)方法對(duì)A股幾大股指的對(duì)數(shù)收益率序列進(jìn)行實(shí)證檢驗(yàn),并說明實(shí)證結(jié)果對(duì)于構(gòu)建量化策略有何種借鑒意義。


這兩種檢驗(yàn)分別為順序和反轉(zhuǎn)檢驗(yàn)以及游程檢驗(yàn)。它們都是非參數(shù)化檢驗(yàn)。


2 順序和反轉(zhuǎn)檢驗(yàn)


為了將對(duì)檢驗(yàn)方法的介紹和研究對(duì)象結(jié)合起來,假設(shè)我們考察的是資產(chǎn)的對(duì)數(shù)價(jià)格序列的隨機(jī)性。因此,它的增量就是對(duì)數(shù)收益率。我們假設(shè)對(duì)數(shù)收益率的分布是對(duì)稱的。第一種檢驗(yàn)對(duì)數(shù)收益率是否為 IID 的方法是順序和反轉(zhuǎn)檢驗(yàn)(sequences and reversals test),由Cowles and Jones (1937) 提出。對(duì)一個(gè)對(duì)數(shù)收益率,首先對(duì)其按如下轉(zhuǎn)換變成 0、1 序列:


f2.png


其中 r_t ~ IID(0, σ^2) 和 p_t 分別為某資產(chǎn)在 t 時(shí)刻的對(duì)數(shù)收益率和對(duì)數(shù)價(jià)格。經(jīng)過上述變換后,一個(gè)收益率序列就轉(zhuǎn)化為一組由 0 和 1 組成的序列,例如 1001110101011000011010。在這樣一個(gè)序列中,任意相鄰的兩個(gè)數(shù)如果同為 0 或者同為 1,則稱它們?yōu)橐粋€(gè)順序(sequence);反之,如果任意相鄰的兩個(gè)數(shù)為 0 和 1、或者 1 和 0,則稱它們?yōu)橐粋€(gè)反轉(zhuǎn)(reversals)。根據(jù)這個(gè)定義,我們可以在上面那個(gè)序列中用紅色和綠色標(biāo)出一些順序和反轉(zhuǎn)的例子:1001110101011000011010。(注意,在前面我們僅僅標(biāo)出一些示例。在實(shí)際計(jì)算時(shí),應(yīng)該逐一考慮相鄰的每對(duì)數(shù)是一個(gè)順序還是一個(gè)反轉(zhuǎn)。例如在 010 這三個(gè)數(shù)中,就有 01 和 10 兩個(gè)反轉(zhuǎn)對(duì)兒、沒有順序?qū)骸#?/span>


在數(shù)學(xué)上,上述定義可以轉(zhuǎn)化為如下簡單的數(shù)學(xué)公式,通過它們可以計(jì)算出一個(gè)長度為 n 的時(shí)間序列中,順序和反轉(zhuǎn)各自的總個(gè)數(shù):


f3.png


其中 N_s 是順序?qū)旱膫€(gè)數(shù),N_r 是反轉(zhuǎn)對(duì)兒的個(gè)數(shù)。有了 N_s 和 N_r 之后,就可以定義待檢驗(yàn)的變量了。為了向發(fā)明者致敬,稱這個(gè)檢驗(yàn)量為 CJ 統(tǒng)計(jì)量,那是 N_s 和 N_r 的比值:


f4.png


先來考慮最簡單的情況,即對(duì)數(shù)收益率沒有長期漂移率項(xiàng)(即長期均值為 0)。這當(dāng)然不符合大多數(shù)實(shí)際情況,因?yàn)樗馕吨L期來看買入和持有某種投資品是不掙錢的(在商品期貨市場基本符合,但對(duì)于股市和債市,這個(gè)假設(shè)很難成立)。在這種情況下,如果收益率序列滿足 IID,則我們可以預(yù)期漲、跌出現(xiàn)的次數(shù)也應(yīng)該基本一樣,因此這個(gè)序列中的順序和反轉(zhuǎn)對(duì)兒數(shù)也應(yīng)該基本一樣。因此,如果假設(shè)漂移率項(xiàng)為零,則隨著序列個(gè)數(shù) n 的增大,CJ 統(tǒng)計(jì)量應(yīng)該逐漸逼近 1。


然而,一旦考慮了漂移率項(xiàng),一切就變了。我們不能再假設(shè) CJ 統(tǒng)計(jì)量的極限值為 1。無論是一個(gè)正的漂移率(意味著長期來看持有該資產(chǎn)是能掙錢的)還是一個(gè)負(fù)的漂移率(意味著長期來看持有該資產(chǎn)是注定虧損的),這個(gè)非零的漂移率都將使收益率序列中順序?qū)旱膫€(gè)數(shù)多余反轉(zhuǎn)對(duì)兒的個(gè)數(shù),即 CJ 應(yīng)該大于 1。為了量化非零漂移量對(duì) CJ 統(tǒng)計(jì)量的影響,我們需要已知增量的具體分布,為此選擇正態(tài)分布。在考慮漂移率的情況下,對(duì)數(shù)價(jià)格的隨機(jī)過程可描述為:


f5.png


其中 μ 是非零的漂移率。由上述定義可知,對(duì)數(shù)收益率為 r_t ~ N(μ, σ^2)。在這種情況下,經(jīng)過必要的數(shù)學(xué)推導(dǎo)可以證明 CJ 統(tǒng)計(jì)量應(yīng)近似的滿足如下正態(tài)分布:


f6.png


其中


f7.png


因此,實(shí)際的檢驗(yàn)可依如下步驟進(jìn)行:


1. 將對(duì)數(shù)收益率序列變換為 0、1 序列;


2. 計(jì)算新序列中順序?qū)汉头崔D(zhuǎn)對(duì)兒的個(gè)數(shù) N_s 以及 N_r,計(jì)算 CJ 統(tǒng)計(jì)量;


3. 計(jì)算對(duì)數(shù)收益率序列的均值和標(biāo)準(zhǔn)差,作為 μ 和 σ 的估計(jì);


4. 計(jì)算 π = Φ(μ/σ),這里 Φ 是標(biāo)準(zhǔn)正態(tài)分布的累積密度函數(shù);計(jì)算 π_s;


5. 計(jì)算 CJ 統(tǒng)計(jì)量應(yīng)滿足的正態(tài)分布的均值和標(biāo)準(zhǔn)差;


6. 根據(jù)第 5 步中的正態(tài)分布計(jì)算 CJ 統(tǒng)計(jì)量的 p-value,以此判斷對(duì)數(shù)收益率序列是否滿足 IID。


3 游程檢驗(yàn)


第二個(gè)可用于 IID 的檢驗(yàn)稱為 runs test游程檢驗(yàn),也譯作連貫檢驗(yàn)),由 Mood (1940) 提出。在這個(gè)檢驗(yàn)中,我們同樣先將對(duì)數(shù)收益率序列轉(zhuǎn)換成由 0 和 1 構(gòu)成的序列(0 代表負(fù)收益、1 代表正收益)。在這個(gè)新的序列中,由連續(xù)的“0”或者連續(xù)的“1”構(gòu)成的子序列稱為一個(gè)“run”。比如,在 1001110100 這個(gè)序列中,連續(xù)的“1”構(gòu)成的 runs 有 3 個(gè)(長度分別為 1,3 和 1),連續(xù)的“0”構(gòu)成的 runs 同樣為 3 個(gè)(長度分別為 2,1 和 2)。作為對(duì)比,在 0000011111 這個(gè)序列中,連續(xù)的“0”和“1”各自僅僅構(gòu)成 1 個(gè) run。


如果一個(gè)時(shí)間序列的增量滿足 IID 且沒有非零漂移率,那么我們可以預(yù)期它的“熵最大”,即 0 和 1 雜亂的隨機(jī)出現(xiàn)、表現(xiàn)出最大的隨機(jī)性。在這種情況下,對(duì)于一個(gè)長度為 n 的序列,它的期望 runs 個(gè)數(shù)等于 (n+1)/2。比如一個(gè)由 0 和 1 構(gòu)成的長度為 1000 的時(shí)間序列,如果它是純隨機(jī)的,那么“0”和“1”構(gòu)成的 runs 的總個(gè)數(shù)的期望為 500.5。顯然,在上面的兩個(gè)例子中,那兩個(gè)序列都各有 10 個(gè)數(shù),但是第一個(gè)序列的 runs 個(gè)數(shù)為 6 而第二個(gè)序列的 runs 個(gè)數(shù)僅僅為 2;顯然第二個(gè)序列(0000011111)更不具備隨機(jī)性(它看上去也確實(shí)更有規(guī)律)。


和前一種方法一樣,我們需要警惕非零漂移率對(duì) runs 個(gè)數(shù)的影響。由于它的存在,我們不能僅憑 runs 的個(gè)數(shù)大大偏離 (n+1)/2 就說這個(gè)序列不具備隨機(jī)性。這是因?yàn)?/span>非零漂移率會(huì)減少 runs 的個(gè)數(shù)。為了定量分析非零漂移率的影響,讓我們?cè)俅渭僭O(shè)對(duì)數(shù)收益率 r_t 滿足 N(μ, σ^2)。在這個(gè)假設(shè)下,下表給出了當(dāng) n = 1000,σ = 21%時(shí),不同的漂移率 μ 對(duì)應(yīng)的 runs 個(gè)數(shù)的期望。不難看出,runs 個(gè)數(shù)的期望隨 μ 遞減。


f8.png


為了使用 runs test 檢驗(yàn)對(duì)數(shù)收益率的隨機(jī)性,構(gòu)建如下統(tǒng)計(jì)量:


f9.png


其中 N_runs 是由“0”和“1”構(gòu)成的 runs 數(shù)量的總和(每個(gè) run 的長度在這個(gè)檢驗(yàn)中不重要),n 為時(shí)間序列長度,π = Φ(μ/σ)。數(shù)學(xué)上可證 z 在極限情況下近似的符合標(biāo)準(zhǔn)正態(tài)分布。因此,實(shí)際的檢驗(yàn)可依如下步驟進(jìn)行:


1. 將對(duì)數(shù)收益率序列變換為 0、1 序列;


2. 計(jì)算新序列中由“0”和“1”構(gòu)成的 runs 的總個(gè)數(shù),記為 N_runs;


3. 計(jì)算對(duì)數(shù)收益率序列的均值和標(biāo)準(zhǔn)差,作為 μ 和 σ 的估計(jì);


4. 計(jì)算 π = Φ(μ/σ),這里 Φ 是標(biāo)準(zhǔn)正態(tài)分布的累積密度函數(shù);


5. 計(jì)算 z 統(tǒng)計(jì)量;


6. 計(jì)算 z 統(tǒng)計(jì)量在正態(tài)分布假設(shè)下的 p-value,以此判斷對(duì)數(shù)收益率序列是否滿足 IID。


4 一個(gè)例子


下面使用一個(gè)假想的例子來考察上文介紹的兩個(gè)檢驗(yàn)方法。為此,我們使用標(biāo)準(zhǔn)正態(tài)分布產(chǎn)生一個(gè)隨機(jī)游走過程如下,序列的長度為 1000。


f10.png


盡管這是一個(gè)標(biāo)準(zhǔn)的隨機(jī)游走,但局部隨機(jī)趨勢(shì)(local stochastic trend)的存在會(huì)給我們?cè)斐梢环N假象,即認(rèn)為它是有趨勢(shì)的。使用本文介紹的兩種檢驗(yàn)方法考察這個(gè)時(shí)間序列的隨機(jī)性,得到如下結(jié)果:


順序和反轉(zhuǎn)檢驗(yàn):CJ 統(tǒng)計(jì)量 = 1.064,p-value = 0.311,結(jié)論為該序列滿足隨機(jī)游走。


游程檢驗(yàn):z 統(tǒng)計(jì)量 = -0.917,p-value = 0.359,結(jié)論同樣為該序列滿足隨機(jī)游走。


雖然該序列在局部存在趨勢(shì),但在整個(gè)時(shí)間尺度上看,它滿足隨機(jī)游走。(這當(dāng)然也是必然的結(jié)果,因?yàn)檫@個(gè)序列就是用 IID 的標(biāo)準(zhǔn)正態(tài)分布增量產(chǎn)生的。)但我們想通過它說明的問題是,哪怕是一個(gè)隨機(jī)性很高的時(shí)間序列在其局部也會(huì)因?yàn)殡S機(jī)趨勢(shì)給我們?cè)斐梢环N錯(cuò)覺 —— 它的隨機(jī)性很弱、是可以預(yù)測(cè)的。


根據(jù)這個(gè)錯(cuò)覺來構(gòu)建策略是非常危險(xiǎn)的。這是因?yàn)槿魏钨Y產(chǎn)的實(shí)際價(jià)格走勢(shì)都是某個(gè)未知分布的一個(gè)realization(實(shí)現(xiàn))而已。如果抓住這個(gè)錯(cuò)覺、認(rèn)為該資產(chǎn)的價(jià)格走勢(shì)有一定的預(yù)測(cè)性(即收益率有預(yù)測(cè)性),并針對(duì)它開發(fā)了一個(gè)策略,我們根本無法預(yù)期該策略在樣本外有同樣的表現(xiàn)。


由于僅有一個(gè)實(shí)現(xiàn)(過去這段時(shí)間的價(jià)格走勢(shì)只發(fā)生一遍),我們無法在統(tǒng)計(jì)上正確的評(píng)價(jià)該策略的參數(shù)對(duì)這個(gè)未知收益率分布是否有效,正如我們不知道在樣本外,隨機(jī)趨勢(shì)有多大以及它什么時(shí)候出現(xiàn)。策略在樣本外的表現(xiàn)很有可能和其在樣本內(nèi)的表現(xiàn)大相徑庭。


當(dāng)然,先不用急著“過度悲觀”,畢竟上面這個(gè)例子中使用的時(shí)間序列就是一個(gè)隨機(jī)游走。在本系列的下篇(實(shí)證篇)我們會(huì)使用真實(shí)的來自 A 股指數(shù)的價(jià)格序列,分析它們的對(duì)數(shù)收益率是否存在非隨機(jī)性,以及分析結(jié)果對(duì)構(gòu)建量化策略有哪些重要的推論。


5 結(jié)語


作為系列的模型篇,本文介紹了兩種檢驗(yàn)時(shí)間序列隨機(jī)性的方法。在下篇中,我們將使用這些方法分析 A 股的股指(如滬深 300 指數(shù))對(duì)數(shù)收益率的隨機(jī)性。為了和開篇的那句引用相呼應(yīng),不妨來個(gè)劇透。在大多數(shù)時(shí)間內(nèi),指數(shù)的對(duì)數(shù)收益率均滿足 IID;只有當(dāng)明顯的大牛、大熊市的時(shí)候,才能觀察到統(tǒng)計(jì)上顯著的非隨機(jī)性。


無論是時(shí)間序列分析還是復(fù)雜的機(jī)器學(xué)習(xí)算法,都是為了分析收益率的殘差項(xiàng)(即排除了收益率中的長期漂移率、周期性等之后所剩余的部分)是否存在預(yù)測(cè)性。如果殘差滿足非隨機(jī)性,這些復(fù)雜算法自然大有可為。但是不要忘記,在大牛、大熊市中,收益率的漂移率項(xiàng)也顯著的不為零。那么,在一個(gè)很強(qiáng)的非零漂移率項(xiàng)面前,殘差中的非隨機(jī)性到底是“錦上添花”還是“畫蛇添足”呢(反正不是“雪中送炭”)?下篇中將給出我們的思考。



參考文獻(xiàn)

Campbell, J. Y., A. W. Lo, and C. MacKinlay (1996). The econometrics of financial markets. Princeton University Press.

Cowles, A. and H. E. Jones (1937). Some a posterior probabilities in stock market action. Econometrica 5, 280 – 294.

Mood, A. (1940). The distribution theory of runs. Annals of Mathematical Statistics 11, 367 – 392.



免責(zé)聲明:入市有風(fēng)險(xiǎn),投資需謹(jǐn)慎。在任何情況下,本文的內(nèi)容、信息及數(shù)據(jù)或所表述的意見并不構(gòu)成對(duì)任何人的投資建議。在任何情況下,本文作者及所屬機(jī)構(gòu)不對(duì)任何人因使用本文的任何內(nèi)容所引致的任何損失負(fù)任何責(zé)任。除特別說明外,文中圖表均直接或間接來自于相應(yīng)論文,僅為介紹之用,版權(quán)歸原作者和期刊所有。