黑天鵝建模的正確姿勢
發(fā)布時(shí)間:2016-12-21 | 來源: 川總寫量化
作者:石川
摘要:本文介紹了對虧損極值和虧損分布尾部建模的方法。
1 風(fēng)險(xiǎn)控制和尾部建模
2016 年全球金融市場不太平,從英國脫歐到 Trump 當(dāng)選美國總統(tǒng)再到意大利公投,“黑天鵝”事件頻出,就連美聯(lián)儲(chǔ)也跟著添亂,嚷嚷了一年加息、故意擾亂市場對美國經(jīng)濟(jì)數(shù)據(jù)的解讀。未來兩年,潛在的黑天鵝更是一個(gè)接一個(gè)。
在這種背景下,風(fēng)險(xiǎn)控制再次回到人們的視線中。在金融領(lǐng)域,風(fēng)險(xiǎn)控制的目的是為了計(jì)算極端黑天鵝事件對金融資產(chǎn)造成的潛在損失(負(fù)收益率)的可能性以及沖擊的大小。先來看一個(gè)分布。下圖為上證指數(shù)在過去 15 年內(nèi)日收益率的分布。我們計(jì)算出日收益率的均值和標(biāo)準(zhǔn)差,便可以得到一個(gè)基于該均值和標(biāo)準(zhǔn)差的正態(tài)分布。下圖比較了收益率的直方圖和該正態(tài)分布。
不難看出,上證指數(shù)日收益率的分布表現(xiàn)出明顯的尖峰和肥尾特點(diǎn),尤其是在負(fù)收益率部分。比較日收益率分布和標(biāo)準(zhǔn)正態(tài)分布的分位圖(下圖),也可以清晰地驗(yàn)證這個(gè)結(jié)論。肥尾意味著上證指數(shù)實(shí)際發(fā)生極端收益率(從上圖來看,尤其是極端跌幅)的概率要遠(yuǎn)遠(yuǎn)大于正態(tài)分布對應(yīng)的概率。換句話說,如果算出收益率的均值和標(biāo)準(zhǔn)差,然后構(gòu)建一個(gè)正態(tài)分布來近似描述日收益率分布,這會(huì)造成很大的誤差。
除了尖峰、肥尾的特點(diǎn)之外,另一個(gè)困擾“黑天鵝建?!钡膯栴}是,發(fā)生極端虧損(真正的黑天鵝)的歷史樣本太少了。比如說,我們想回答“上證指數(shù)每十年一遇的日收益率最大跌幅是多少”這個(gè)問題,回看上證指數(shù)過去 20 幾年的歷史,我們僅僅有可憐的 2 個(gè)樣本點(diǎn),根本無法根據(jù)它們構(gòu)建有效的模型。
那么應(yīng)該怎么辦呢?在統(tǒng)計(jì)學(xué)上,廣義極值分布(Generalized Extreme Value Distribution)可以用來對極端虧損建模。
2 極值建模
假設(shè)隨機(jī)變量 X_i?代表某投資品的負(fù)收益率(虧損),它滿足某未知分布 F(x) = Pr(X_i ≤ x)。在下文中,我們用負(fù)收益率的絕對值代表虧損的大小(即 X_i?的取值為正數(shù))。在這種描述下,當(dāng) X_i?的取值在其分布的右尾(right tail)時(shí),便意味著該投資品發(fā)生了極端的虧損。
假設(shè)不同時(shí)間的虧損?X_i?是獨(dú)立同分布的,并令 M_n?= max(X_1, …, X_n),即 M_n?是 n 個(gè)樣本中最壞的情況。廣義極限分布理論解決的問題就是對?M_n?分布的建模。有了 M_n?的分布,我們就可以輕松的回答上面諸如“上證指數(shù)每十年一遇的日收益率最大跌幅是多少”的問題。根據(jù)獨(dú)立同分布的假設(shè),我們可以寫出 M_n?的 CDF 為:
由于分布 F 是未知的,F(xiàn)^n?自然也是未知的,而經(jīng)驗(yàn)分布函數(shù)對與 F^n?的估計(jì)也是非常差的。但是,我們可以根據(jù) Fisher-Tippet 理論(Fisher and Tippett 1928)來漸進(jìn)逼近 F^n,并以此得到 M_n?的分布。特別的,F(xiàn)isher-Tippet 理論證明,將 M_n?標(biāo)準(zhǔn)化后,即 Z_n?= (M_n?–?μ_n) /?σ_n,Z_n?的分布收斂于形式如下的廣義極限分布:
因此,只要我們有足夠多的原始負(fù)收益率樣本數(shù)據(jù) X_i,我們可以用下式求出極端虧損 M_n?的分布:
在實(shí)際使用中,廣義極限分布 H 的參數(shù)(ξ, μ,?σ)可以通過極大似然估計(jì)(maximum likelihood estimation)得到。為了估計(jì)這些參數(shù),我們必須有足夠多個(gè) M_n?的樣本。為此,我們可以將總長為 T 期的歷史數(shù)據(jù)等分成單位長度為 n 的 m 個(gè)區(qū)間。每個(gè)區(qū)間中的最大虧損便是 M_n?的一個(gè)樣本。這樣我們就可以得到 m 個(gè)樣本。這樣,便可以根據(jù)這些樣本得到廣義極限分布 H 的參數(shù)的估計(jì)。Embrechts?et. al. (1997) 給出了詳細(xì)的數(shù)學(xué)推導(dǎo)。
3 閾值外數(shù)據(jù)建模
在風(fēng)險(xiǎn)管理中,在險(xiǎn)價(jià)值(Value at Risk)是人們常說的一個(gè)概念。比如,當(dāng)我們說 1% 的日收益率的 VaR = 6.8%,它的意思是,我們的目標(biāo)投資品(或者投資組合)在當(dāng)天有 1% 的概率可能產(chǎn)生超過 6.8% 的虧損。在給定的概率下,VaR 越大,投資品的風(fēng)險(xiǎn)越大。然而,如果想計(jì)算 VaR 的大小,上一節(jié)中對極值分布的模型并無法發(fā)揮作用。這是因?yàn)樵谟?jì)算 VaR 時(shí),我們必須對虧損分布的右尾進(jìn)行建模、而不單單是關(guān)注某一個(gè)極值(注意,在本文中我們用虧損的絕對值來描述虧損的大小,因此虧損都是正數(shù),所以這里我們是對分布的右尾建模)。為此,我們可以采用廣義帕累托分布(Generalized Pareto Distribution)。
和上節(jié)一樣,X_i 表示某投資品的一系列虧損,并假設(shè)它們獨(dú)立且滿足某未知分布 F。同樣的,定義 M_n?= max(X_1, …, X_n)。假設(shè) u 為某一個(gè)給定的虧損閾值。在所有這些 X_i?中,我們感興趣的是那些大于 u 的樣本,即那些虧損超過閾值的樣本點(diǎn),我們希望用它們來對 X_i?分布的右尾進(jìn)行建模。超過給定閾值的虧損部分,即 X_i?– u > 0 的部分,可以由如下條件概率表示:
Embrechts et. al. (1997) 證明,如果虧損 X_i?的極值 M_n?收斂于上節(jié)介紹的廣義極限分布 H,那么存在一個(gè) u 的函數(shù) β(u),使得 X_i?–?u 滿足如下形式的廣義帕累托分布 G:
在實(shí)際應(yīng)用中,如果我們想對?X_i?的右尾建模,只需確定閾值 u。然后在?X_i?的所有樣本中找出所有大于 u 的樣本(注:我們用?X_i?的絕對值表示虧損的大小,所以虧損在上述數(shù)學(xué)表達(dá)式中是正數(shù)),將這些滿足的樣本各自減去 u 后得到超過 u 的部分,然后用這些數(shù)據(jù)擬合廣義帕累托分布 G,G 的參數(shù)由極大似然估計(jì)得到。
廣義帕累托分布 G 的形狀隨著形狀參數(shù) ξ 的不同而不同。特別的,當(dāng) ξ = 0 時(shí),G 就化簡為指數(shù)分布。我們以過去 15 年上證指數(shù)日頻的負(fù)收益率樣本為例,取閾值 u = 2.65%(即考察日收益率虧損超過 2.65% 的尾部分布),得到了 G 的參數(shù)。其中形狀參數(shù)的取值非常接近 0。下圖為擬合得到帕累托分布和同比例的指數(shù)分布對比超額虧損的直方圖的結(jié)果??梢钥吹郊t色的帕累托分布和綠色的指數(shù)分布非常接近。
此外,我們也可以用超額虧損和標(biāo)準(zhǔn)的指數(shù)分布放在一起做分位圖,得到的結(jié)果如下。結(jié)果顯示分位圖近似的滿足線性,說明超額虧損的分布和指數(shù)分布十分接近。
利用超額虧損對尾部分布建模后,我們便可以方便的求解在險(xiǎn)價(jià)值。
4 在險(xiǎn)價(jià)值
上一節(jié)曾經(jīng)說過,在險(xiǎn)價(jià)值描繪的是投資品在某一個(gè)指定的概率下虧損程度的閾值。在我們的定義下(即使用正數(shù)來代表虧損的大?。陔U(xiǎn)價(jià)值就是某一給定概率下虧損 X_i?分布中右尾的某一個(gè)分位數(shù)。換句話說,只要根據(jù)給定的概率求出分位數(shù),它的值就是這個(gè)概率對應(yīng)的在險(xiǎn)價(jià)值。因此,通過廣義帕累托分布 G,我們便可以簡單的推導(dǎo)出在險(xiǎn)價(jià)值的公式。假設(shè) 1 – q 代表我們考慮的概率(比如我們想知道 5% 的概率對應(yīng)的虧損,那么 1 - q = 0.05),則其對應(yīng)的在險(xiǎn)價(jià)值為:
其中,n 是虧損樣本的總個(gè)數(shù),k 是超過 u 的虧損樣本的個(gè)數(shù)。u 是對應(yīng)的閾值,它可以由 q = F(u) 求出。在應(yīng)用中,(n-k)/n 可以作為對 F(u) 的估計(jì)。因此,對于給定的概率 1 – q,計(jì)算在險(xiǎn)價(jià)值的步驟為:
1.?根據(jù) q 和 q = (n-k)/n 求出 k;
2.?根據(jù) k 求出 u,即在所有虧損的樣本中,找到對應(yīng)的閾值 u,使得滿足 X_i?大于 u 的個(gè)數(shù)為 k;
3.?用上一步找到的 X_i?– u 建模,得到廣義帕累托分布;
4.?將參數(shù)帶入在險(xiǎn)價(jià)值的公式中,求出在險(xiǎn)價(jià)值。
由于在險(xiǎn)價(jià)值關(guān)注的往往是 5% 甚至 1% 的虧損閾值,它們對應(yīng)的是虧損分布中非??课膊康哪切颖?,因此只有當(dāng) n 足夠大時(shí),我們才可能得到足夠多的超額虧損來建模??上У氖?,在這方面中國 A 股的年份太短了。即便如此,我們?nèi)匀煌ㄟ^下面簡單的實(shí)驗(yàn)來說明如何計(jì)算在險(xiǎn)價(jià)值。這里我們考慮標(biāo)普 500 指數(shù)(從 1930 年至今)和上證指數(shù)(從 2000 年至今)。此外,為了增加樣本個(gè)數(shù),我們考慮的在險(xiǎn)價(jià)值對應(yīng)的概率為 10%,而非極端的 5% 或者 1%。對于標(biāo)普 500,我們用每 15 年的數(shù)據(jù)來滾動(dòng)建模,得到日收益率在 10% 概率下的在險(xiǎn)價(jià)值。作為比較,我們用日收益率均值和標(biāo)準(zhǔn)差對應(yīng)的正態(tài)分布同樣求出 10% 概率下的在險(xiǎn)價(jià)值。結(jié)果如下圖所示。
上圖說明以下幾點(diǎn):
1.?由于收益率存在明顯的肥尾效應(yīng),正態(tài)分布嚴(yán)重低估了在險(xiǎn)價(jià)值(綠線持續(xù)的在紅線之下);
2.?在 1929 年股災(zāi)之后的有一段時(shí)間,在險(xiǎn)價(jià)值都在高位,這是因?yàn)橛?jì)算的樣本中有大量的高虧損樣本;
3.?進(jìn)入 21 世紀(jì)以來,在險(xiǎn)價(jià)值有兩次明顯的躍升,分別對應(yīng)著 2000年的 .com 泡沫和 2008 年的次貸危機(jī)。
同樣的,我們對上證指數(shù)建模。由于數(shù)據(jù)年份太短,我們用每 10 年的數(shù)據(jù)來滾動(dòng)建模。結(jié)果如下所示。同樣的,正態(tài)分布建模嚴(yán)重低估了在險(xiǎn)價(jià)值。此外,由于上證指數(shù)比標(biāo)普 500 有更加明顯的肥尾,因此正態(tài)分布對潛在虧損的低估更加顯著。此外,2010 年到 2015 年股災(zāi)之前,10% 概率對應(yīng)的日收益率在險(xiǎn)價(jià)值并無太大波動(dòng);股災(zāi)之后,在險(xiǎn)價(jià)值明顯上升。
我們可以用更短的時(shí)間(即更少的樣本)對上證指數(shù)進(jìn)行滾動(dòng)建模。但是樣本少一定會(huì)帶來建模的誤差。下圖為我們使用 5 年窗口進(jìn)行滾動(dòng)建模的結(jié)果。結(jié)果表明從 2008 年股災(zāi)開始后一直到 2014 年,上證指數(shù)的風(fēng)險(xiǎn)都非常大(注意,正態(tài)分布建模無法很好的描述在險(xiǎn)價(jià)值的變化,且存在嚴(yán)重的低估)。在最近兩年,隨著 2015 年股災(zāi)和 2016 年 1 月份熔斷引發(fā)的二次災(zāi)害,在險(xiǎn)價(jià)值出現(xiàn)了兩次迅速的躥升。
5 結(jié)語
做投資時(shí),如何強(qiáng)調(diào)風(fēng)險(xiǎn)控制都不過分。然而,做好風(fēng)控的前提就是能用正確的數(shù)學(xué)手段對其量化。為了控制風(fēng)險(xiǎn),有人刻意限制倉位,有人“把雞蛋放在不同的籃子里”。然而分散投資不完全等價(jià)于分散風(fēng)險(xiǎn)?!鞍央u蛋放在不同的籃子里”不如“把雞蛋放在一個(gè)籃子里,然后看好這個(gè)籃子”。從這個(gè)意義上說,對虧損的正確建模格外重要。
參考文獻(xiàn)
Embrechts, P. C. Kloppelberg, and T. Mikosch (1997). Modelling Extremal Events. Springer-Verlag, Berlin.
Fisher, R. and L. Tippett (1928). Limiting Forms of the Frequency Distribution of the Largest or Smallest Member of a Sample. Proceedings of the Cambridge Philosophical Society 24, 180-190.
免責(zé)聲明:入市有風(fēng)險(xiǎn),投資需謹(jǐn)慎。在任何情況下,本文的內(nèi)容、信息及數(shù)據(jù)或所表述的意見并不構(gòu)成對任何人的投資建議。在任何情況下,本文作者及所屬機(jī)構(gòu)不對任何人因使用本文的任何內(nèi)容所引致的任何損失負(fù)任何責(zé)任。除特別說明外,文中圖表均直接或間接來自于相應(yīng)論文,僅為介紹之用,版權(quán)歸原作者和期刊所有。