黑天鵝建模的正確姿勢

發(fā)布時(shí)間：2016-12-21 | 來源: 川總寫量化

作者：石川

摘要：本文介紹了對虧損極值和虧損分布尾部建模的方法。

1 風(fēng)險(xiǎn)控制和尾部建模

2016 年全球金融市場不太平，從英國脫歐到 Trump 當(dāng)選美國總統(tǒng)再到意大利公投，“黑天鵝”事件頻出，就連美聯(lián)儲(chǔ)也跟著添亂，嚷嚷了一年加息、故意擾亂市場對美國經(jīng)濟(jì)數(shù)據(jù)的解讀。未來兩年，潛在的黑天鵝更是一個(gè)接一個(gè)。

在這種背景下，風(fēng)險(xiǎn)控制再次回到人們的視線中。在金融領(lǐng)域，風(fēng)險(xiǎn)控制的目的是為了計(jì)算極端黑天鵝事件對金融資產(chǎn)造成的潛在損失（負(fù)收益率）的可能性以及沖擊的大小。先來看一個(gè)分布。下圖為上證指數(shù)在過去 15 年內(nèi)日收益率的分布。我們計(jì)算出日收益率的均值和標(biāo)準(zhǔn)差，便可以得到一個(gè)基于該均值和標(biāo)準(zhǔn)差的正態(tài)分布。下圖比較了收益率的直方圖和該正態(tài)分布。

不難看出，上證指數(shù)日收益率的分布表現(xiàn)出明顯的尖峰和肥尾特點(diǎn)，尤其是在負(fù)收益率部分。比較日收益率分布和標(biāo)準(zhǔn)正態(tài)分布的分位圖（下圖），也可以清晰地驗(yàn)證這個(gè)結(jié)論。肥尾意味著上證指數(shù)實(shí)際發(fā)生極端收益率（從上圖來看，尤其是極端跌幅）的概率要遠(yuǎn)遠(yuǎn)大于正態(tài)分布對應(yīng)的概率。換句話說，如果算出收益率的均值和標(biāo)準(zhǔn)差，然后構(gòu)建一個(gè)正態(tài)分布來近似描述日收益率分布，這會(huì)造成很大的誤差。

除了尖峰、肥尾的特點(diǎn)之外，另一個(gè)困擾“黑天鵝建?！钡膯栴}是，發(fā)生極端虧損（真正的黑天鵝）的歷史樣本太少了。比如說，我們想回答“上證指數(shù)每十年一遇的日收益率最大跌幅是多少”這個(gè)問題，回看上證指數(shù)過去 20 幾年的歷史，我們僅僅有可憐的 2 個(gè)樣本點(diǎn)，根本無法根據(jù)它們構(gòu)建有效的模型。

那么應(yīng)該怎么辦呢？在統(tǒng)計(jì)學(xué)上，廣義極值分布（Generalized Extreme Value Distribution）可以用來對極端虧損建模。

2 極值建模

假設(shè)隨機(jī)變量 X_i?代表某投資品的負(fù)收益率（虧損），它滿足某未知分布 F(x) = Pr(X_i ≤ x)。在下文中，我們用負(fù)收益率的絕對值代表虧損的大小（即 X_i?的取值為正數(shù)）。在這種描述下，當(dāng) X_i?的取值在其分布的右尾（right tail）時(shí)，便意味著該投資品發(fā)生了極端的虧損。

假設(shè)不同時(shí)間的虧損?X_i?是獨(dú)立同分布的，并令 M_n?= max(X_1, …, X_n)，即 M_n?是 n 個(gè)樣本中最壞的情況。廣義極限分布理論解決的問題就是對?M_n?分布的建模。有了 M_n?的分布，我們就可以輕松的回答上面諸如“上證指數(shù)每十年一遇的日收益率最大跌幅是多少”的問題。根據(jù)獨(dú)立同分布的假設(shè)，我們可以寫出 M_n?的 CDF 為：

由于分布 F 是未知的，F(xiàn)^n?自然也是未知的，而經(jīng)驗(yàn)分布函數(shù)對與 F^n?的估計(jì)也是非常差的。但是，我們可以根據(jù) Fisher-Tippet 理論（Fisher and Tippett 1928）來漸進(jìn)逼近 F^n，并以此得到 M_n?的分布。特別的，F(xiàn)isher-Tippet 理論證明，將 M_n?標(biāo)準(zhǔn)化后，即 Z_n?= (M_n?–?μ_n) /?σ_n，Z_n?的分布收斂于形式如下的廣義極限分布：

因此，只要我們有足夠多的原始負(fù)收益率樣本數(shù)據(jù) X_i，我們可以用下式求出極端虧損 M_n?的分布：

在實(shí)際使用中，廣義極限分布 H 的參數(shù)（ξ, μ,?σ）可以通過極大似然估計(jì)（maximum likelihood estimation）得到。為了估計(jì)這些參數(shù)，我們必須有足夠多個(gè) M_n?的樣本。為此，我們可以將總長為 T 期的歷史數(shù)據(jù)等分成單位長度為 n 的 m 個(gè)區(qū)間。每個(gè)區(qū)間中的最大虧損便是 M_n?的一個(gè)樣本。這樣我們就可以得到 m 個(gè)樣本。這樣，便可以根據(jù)這些樣本得到廣義極限分布 H 的參數(shù)的估計(jì)。Embrechts?et. al. (1997) 給出了詳細(xì)的數(shù)學(xué)推導(dǎo)。

3 閾值外數(shù)據(jù)建模

在風(fēng)險(xiǎn)管理中，在險(xiǎn)價(jià)值（Value at Risk）是人們常說的一個(gè)概念。比如，當(dāng)我們說 1% 的日收益率的 VaR = 6.8%，它的意思是，我們的目標(biāo)投資品（或者投資組合）在當(dāng)天有 1% 的概率可能產(chǎn)生超過 6.8% 的虧損。在給定的概率下，VaR 越大，投資品的風(fēng)險(xiǎn)越大。然而，如果想計(jì)算 VaR 的大小，上一節(jié)中對極值分布的模型并無法發(fā)揮作用。這是因?yàn)樵谟?jì)算 VaR 時(shí)，我們必須對虧損分布的右尾進(jìn)行建模、而不單單是關(guān)注某一個(gè)極值（注意，在本文中我們用虧損的絕對值來描述虧損的大小，因此虧損都是正數(shù)，所以這里我們是對分布的右尾建模）。為此，我們可以采用廣義帕累托分布（Generalized Pareto Distribution）。

和上節(jié)一樣，X_i 表示某投資品的一系列虧損，并假設(shè)它們獨(dú)立且滿足某未知分布 F。同樣的，定義 M_n?= max(X_1, …, X_n)。假設(shè) u 為某一個(gè)給定的虧損閾值。在所有這些 X_i?中，我們感興趣的是那些大于 u 的樣本，即那些虧損超過閾值的樣本點(diǎn)，我們希望用它們來對 X_i?分布的右尾進(jìn)行建模。超過給定閾值的虧損部分，即 X_i?– u ＞ 0 的部分，可以由如下條件概率表示：

Embrechts et. al. (1997) 證明，如果虧損 X_i?的極值 M_n?收斂于上節(jié)介紹的廣義極限分布 H，那么存在一個(gè) u 的函數(shù) β(u)，使得 X_i?–?u 滿足如下形式的廣義帕累托分布 G：

在實(shí)際應(yīng)用中，如果我們想對?X_i?的右尾建模，只需確定閾值 u。然后在?X_i?的所有樣本中找出所有大于 u 的樣本（注：我們用?X_i?的絕對值表示虧損的大小，所以虧損在上述數(shù)學(xué)表達(dá)式中是正數(shù)），將這些滿足的樣本各自減去 u 后得到超過 u 的部分，然后用這些數(shù)據(jù)擬合廣義帕累托分布 G，G 的參數(shù)由極大似然估計(jì)得到。

廣義帕累托分布 G 的形狀隨著形狀參數(shù) ξ 的不同而不同。特別的，當(dāng) ξ = 0 時(shí)，G 就化簡為指數(shù)分布。我們以過去 15 年上證指數(shù)日頻的負(fù)收益率樣本為例，取閾值 u = 2.65%（即考察日收益率虧損超過 2.65% 的尾部分布），得到了 G 的參數(shù)。其中形狀參數(shù)的取值非常接近 0。下圖為擬合得到帕累托分布和同比例的指數(shù)分布對比超額虧損的直方圖的結(jié)果?？梢钥吹郊t色的帕累托分布和綠色的指數(shù)分布非常接近。

此外，我們也可以用超額虧損和標(biāo)準(zhǔn)的指數(shù)分布放在一起做分位圖，得到的結(jié)果如下。結(jié)果顯示分位圖近似的滿足線性，說明超額虧損的分布和指數(shù)分布十分接近。

利用超額虧損對尾部分布建模后，我們便可以方便的求解在險(xiǎn)價(jià)值。

4 在險(xiǎn)價(jià)值

上一節(jié)曾經(jīng)說過，在險(xiǎn)價(jià)值描繪的是投資品在某一個(gè)指定的概率下虧損程度的閾值。在我們的定義下（即使用正數(shù)來代表虧損的大?。陔U(xiǎn)價(jià)值就是某一給定概率下虧損 X_i?分布中右尾的某一個(gè)分位數(shù)。換句話說，只要根據(jù)給定的概率求出分位數(shù)，它的值就是這個(gè)概率對應(yīng)的在險(xiǎn)價(jià)值。因此，通過廣義帕累托分布 G，我們便可以簡單的推導(dǎo)出在險(xiǎn)價(jià)值的公式。假設(shè) 1 – q 代表我們考慮的概率（比如我們想知道 5% 的概率對應(yīng)的虧損，那么 1 - q = 0.05），則其對應(yīng)的在險(xiǎn)價(jià)值為：

其中，n 是虧損樣本的總個(gè)數(shù)，k 是超過 u 的虧損樣本的個(gè)數(shù)。u 是對應(yīng)的閾值，它可以由 q = F(u) 求出。在應(yīng)用中，(n-k)/n 可以作為對 F(u) 的估計(jì)。因此，對于給定的概率 1 – q，計(jì)算在險(xiǎn)價(jià)值的步驟為：

1.?根據(jù) q 和 q = (n-k)/n 求出 k；

2.?根據(jù) k 求出 u，即在所有虧損的樣本中，找到對應(yīng)的閾值 u，使得滿足 X_i?大于 u 的個(gè)數(shù)為 k；

3.?用上一步找到的 X_i?– u 建模，得到廣義帕累托分布；

4.?將參數(shù)帶入在險(xiǎn)價(jià)值的公式中，求出在險(xiǎn)價(jià)值。

由于在險(xiǎn)價(jià)值關(guān)注的往往是 5% 甚至 1% 的虧損閾值，它們對應(yīng)的是虧損分布中非?？课膊康哪切颖?，因此只有當(dāng) n 足夠大時(shí)，我們才可能得到足夠多的超額虧損來建模?？上У氖?，在這方面中國 A 股的年份太短了。即便如此，我們?nèi)匀煌ㄟ^下面簡單的實(shí)驗(yàn)來說明如何計(jì)算在險(xiǎn)價(jià)值。這里我們考慮標(biāo)普 500 指數(shù)（從 1930 年至今）和上證指數(shù)（從 2000 年至今）。此外，為了增加樣本個(gè)數(shù)，我們考慮的在險(xiǎn)價(jià)值對應(yīng)的概率為 10%，而非極端的 5% 或者 1%。對于標(biāo)普 500，我們用每 15 年的數(shù)據(jù)來滾動(dòng)建模，得到日收益率在 10% 概率下的在險(xiǎn)價(jià)值。作為比較，我們用日收益率均值和標(biāo)準(zhǔn)差對應(yīng)的正態(tài)分布同樣求出 10% 概率下的在險(xiǎn)價(jià)值。結(jié)果如下圖所示。

上圖說明以下幾點(diǎn)：

1.?由于收益率存在明顯的肥尾效應(yīng)，正態(tài)分布嚴(yán)重低估了在險(xiǎn)價(jià)值（綠線持續(xù)的在紅線之下）；

2.?在 1929 年股災(zāi)之后的有一段時(shí)間，在險(xiǎn)價(jià)值都在高位，這是因?yàn)橛?jì)算的樣本中有大量的高虧損樣本；

3.?進(jìn)入 21 世紀(jì)以來，在險(xiǎn)價(jià)值有兩次明顯的躍升，分別對應(yīng)著 2000年的 .com 泡沫和 2008 年的次貸危機(jī)。

同樣的，我們對上證指數(shù)建模。由于數(shù)據(jù)年份太短，我們用每 10 年的數(shù)據(jù)來滾動(dòng)建模。結(jié)果如下所示。同樣的，正態(tài)分布建模嚴(yán)重低估了在險(xiǎn)價(jià)值。此外，由于上證指數(shù)比標(biāo)普 500 有更加明顯的肥尾，因此正態(tài)分布對潛在虧損的低估更加顯著。此外，2010 年到 2015 年股災(zāi)之前，10% 概率對應(yīng)的日收益率在險(xiǎn)價(jià)值并無太大波動(dòng)；股災(zāi)之后，在險(xiǎn)價(jià)值明顯上升。

我們可以用更短的時(shí)間（即更少的樣本）對上證指數(shù)進(jìn)行滾動(dòng)建模。但是樣本少一定會(huì)帶來建模的誤差。下圖為我們使用 5 年窗口進(jìn)行滾動(dòng)建模的結(jié)果。結(jié)果表明從 2008 年股災(zāi)開始后一直到 2014 年，上證指數(shù)的風(fēng)險(xiǎn)都非常大（注意，正態(tài)分布建模無法很好的描述在險(xiǎn)價(jià)值的變化，且存在嚴(yán)重的低估）。在最近兩年，隨著 2015 年股災(zāi)和 2016 年 1 月份熔斷引發(fā)的二次災(zāi)害，在險(xiǎn)價(jià)值出現(xiàn)了兩次迅速的躥升。

5 結(jié)語

做投資時(shí)，如何強(qiáng)調(diào)風(fēng)險(xiǎn)控制都不過分。然而，做好風(fēng)控的前提就是能用正確的數(shù)學(xué)手段對其量化。為了控制風(fēng)險(xiǎn)，有人刻意限制倉位，有人“把雞蛋放在不同的籃子里”。然而分散投資不完全等價(jià)于分散風(fēng)險(xiǎn)?！鞍央u蛋放在不同的籃子里”不如“把雞蛋放在一個(gè)籃子里，然后看好這個(gè)籃子”。從這個(gè)意義上說，對虧損的正確建模格外重要。

參考文獻(xiàn)

Embrechts, P. C. Kloppelberg, and T. Mikosch (1997). Modelling Extremal Events. Springer-Verlag, Berlin.

Fisher, R. and L. Tippett (1928). Limiting Forms of the Frequency Distribution of the Largest or Smallest Member of a Sample. Proceedings of the Cambridge Philosophical Society 24, 180-190.

免責(zé)聲明：入市有風(fēng)險(xiǎn)，投資需謹(jǐn)慎。在任何情況下，本文的內(nèi)容、信息及數(shù)據(jù)或所表述的意見并不構(gòu)成對任何人的投資建議。在任何情況下，本文作者及所屬機(jī)構(gòu)不對任何人因使用本文的任何內(nèi)容所引致的任何損失負(fù)任何責(zé)任。除特別說明外，文中圖表均直接或間接來自于相應(yīng)論文，僅為介紹之用，版權(quán)歸原作者和期刊所有。

亚洲精品国产精品制服丝袜,亚洲欧美日韩精品a∨,97在线热免费视频精品视频,亚洲人成在线观看网站不卡

合格投資者聲明

黑天鵝建模的正確姿勢