亚洲精品国产精品制服丝袜,亚洲欧美日韩精品a∨,97在线热免费视频精品视频,亚洲人成在线观看网站不卡

從飲食習(xí)慣知天氣冷暖 —— 淺談隱馬爾可夫模型

發(fā)布時(shí)間:2017-08-02  |   來(lái)源: 川總寫(xiě)量化

作者:石川

摘要:無(wú)記憶性使得很多復(fù)雜的問(wèn)題變得易于分析和計(jì)算。今天通過(guò)氣溫和飲食的例子來(lái)介紹馬爾可夫和隱馬爾可夫模型。


1 引言


明天的世界只與今天有關(guān),而與昨天無(wú)關(guān)。


這句話是對(duì)馬爾可夫模型的一個(gè)很好的詮釋。在概率論中,馬爾可夫模型是一個(gè)非常重要的狀態(tài)空間隨機(jī)模型(stochastic state space model)。該模型假設(shè)一個(gè)系統(tǒng)或隨機(jī)變量在下一時(shí)刻的狀態(tài)僅和當(dāng)前的狀態(tài)有關(guān),而與任何過(guò)去的歷史狀態(tài)都無(wú)關(guān),即當(dāng)前的狀態(tài)已經(jīng)包括了預(yù)測(cè)未來(lái)所需的所有信息。這個(gè)特性被稱為馬爾可夫性質(zhì)(Markov property),也被稱為無(wú)記憶性(memorylessness)。馬爾可夫模型由俄羅斯數(shù)學(xué)家安德雷 ? 馬爾可夫(Андрей Андреевич Марков)提出。該模型在預(yù)測(cè)建模方面有著廣泛的應(yīng)用。近年來(lái),也有越來(lái)越多的人將它用在量化投資領(lǐng)域。


根據(jù)在時(shí)間上以及在狀態(tài)空間中是否連續(xù),馬爾可夫模型又有不同的版本,比如連續(xù)的馬爾可夫過(guò)程(Markov process)和離散的馬爾可夫鏈(Markov chain)。本文中,為了便于介紹,我們考慮最簡(jiǎn)單的離散模型,即模型在時(shí)間和狀態(tài)上都是離散的。時(shí)間上離散意味著系統(tǒng)僅在特定的時(shí)間點(diǎn)上發(fā)生狀態(tài)的變化(比如每小時(shí)或者每天發(fā)生一次變化);狀態(tài)空間上離散意味著系統(tǒng)狀態(tài)的取值是非連續(xù)的。此外我們假設(shè)狀態(tài)的取值個(gè)數(shù)是有限的。離散模型雖然簡(jiǎn)單,但在本文最后一節(jié)可以看出,它在量化投資領(lǐng)域同樣有重要的應(yīng)用價(jià)值。


在正常的馬爾可夫模型中,系統(tǒng)的狀態(tài)對(duì)于觀察者來(lái)說(shuō)是直接可見(jiàn)的,我們關(guān)心的是諸如系統(tǒng)在不同時(shí)刻處于不同狀態(tài)的概率這類問(wèn)題。遺憾的是,在一些應(yīng)用中(比如量化投資中的一些問(wèn)題),我們并不能直接觀測(cè)到系統(tǒng)的狀態(tài)——這些狀態(tài)對(duì)我們來(lái)說(shuō)是隱形的。雖然無(wú)法直接觀測(cè)到狀態(tài),但是受這些狀態(tài)影響的觀測(cè)量的取值對(duì)我們來(lái)說(shuō)是可見(jiàn)的;我們需要透過(guò)這些觀測(cè)量的取值來(lái)推測(cè)系統(tǒng)所處的狀態(tài)。這樣的模型稱為馬爾可夫模型(Hidden Markov Models,簡(jiǎn)稱 HMM)。


2 馬爾可夫模型的一個(gè)例子


假設(shè)我們要分析的系統(tǒng)是城市 S 的每天的氣溫。為了簡(jiǎn)化問(wèn)題,令氣溫分為冷和熱兩個(gè)狀態(tài)。在馬爾可夫模型的框架下,該系統(tǒng)有兩個(gè)狀態(tài),且狀態(tài)間的轉(zhuǎn)移由下面四個(gè)條件概率來(lái)表示:


prob( 明天天冷 | 今天天熱 ) = α

prob( 明天天熱 | 今天天熱 ) = 1 - α

prob( 明天天熱 | 今天天冷 ) = β

prob( 明天天冷 | 今天天冷 ) = 1 - β


這個(gè)系統(tǒng)可以由下面這個(gè)馬爾可夫鏈表示,其中 1 和 2 分別代表了熱和冷兩個(gè)狀態(tài),箭頭表明了狀態(tài)之間的轉(zhuǎn)移、旁邊的數(shù)字表明了轉(zhuǎn)移發(fā)生的概率。


f2.png


這四個(gè)條件概率又被稱為狀態(tài)之間的轉(zhuǎn)移概率。一般的,一個(gè)具有 K 個(gè)狀態(tài)的馬爾可夫過(guò)程,對(duì)于所有的 i, j ∈ {1, 2, …, K},其在 t – 1 到 t 時(shí)刻從狀態(tài) i 到狀態(tài) j 的轉(zhuǎn)移概率便構(gòu)成了轉(zhuǎn)移矩陣(transition matrix)中。因此轉(zhuǎn)移矩陣中第 i 行第 j 列的元素為:


image.png


對(duì)于一個(gè)離散的馬爾可夫過(guò)程來(lái)說(shuō),轉(zhuǎn)移矩陣包括了刻畫(huà)其狀態(tài)變換隨機(jī)性的全部信息。有了轉(zhuǎn)移矩陣,我們可以方便的求解各種關(guān)于系統(tǒng)狀態(tài)的概率問(wèn)題。比如,在本節(jié)的例子中,如果城市 S 今天的天氣是熱,那么我們可以方便的計(jì)算出明天(乃至任意若干天之后)天氣情況的概率;我們也可以回答例如未來(lái)五天連續(xù)出現(xiàn)天冷(或熱)的概率??傊?,有了這個(gè)轉(zhuǎn)移矩陣,一切關(guān)于系統(tǒng)狀態(tài)的問(wèn)題都可以計(jì)算。


3 隱馬爾可夫模型的一個(gè)例子


馬爾可夫模型中,系統(tǒng)的狀態(tài)并不是直接可見(jiàn)的,但受狀態(tài)影響的某些觀測(cè)量則是可見(jiàn)的。這些觀測(cè)量受不同狀態(tài)的影響不同,即不同狀態(tài)下,這些觀測(cè)量有著不同的概率分布。因此通過(guò)分析觀測(cè)量序列,我們可以對(duì)系統(tǒng)的狀態(tài)做出判斷。為了解釋隱馬爾可夫模型,仍然考慮城市 S 的天氣的例子。假設(shè)天氣仍然只有冷、熱兩個(gè)狀態(tài)。但與前面例子不同的是,你無(wú)法直接獲得關(guān)于 S 的天氣信息(比如你不生活在該城且沒(méi)有它的天氣預(yù)報(bào))。 所幸的是,你有一個(gè)好朋友 c 居住在 S 城。他根據(jù)當(dāng)天的天氣情況,每天從火鍋、拉面和冰激凌三種食品中以不同的概率挑選一種來(lái)吃,并把吃了什么告訴你。具體的,在不同天氣下,朋友 c 選擇這三種食品的概率如下。


f3.png


因此,雖然你不知道 S 城的天氣, 但是知道 c 每天的飲食。因此你可以通過(guò)朋友的飲食信息判斷 S 城的冷暖。比如 ?c 告訴你他連續(xù)吃了五天火鍋,那么你可以判斷出過(guò)去五天 S 城的天氣很可能都處于冷的狀態(tài),因?yàn)樵谔炖鋾r(shí) c 吃火鍋的概率遠(yuǎn)大于天熱時(shí)。這就是隱馬爾可夫模型要解決的問(wèn)題之一。


在數(shù)學(xué)上,隱馬爾可夫模型如下圖所示。其內(nèi)在的馬爾可夫過(guò)程仍然由轉(zhuǎn)移矩陣 A 來(lái)刻畫(huà),只不過(guò)狀態(tài)對(duì)你來(lái)說(shuō)它是不可見(jiàn)的。除了 A 之外,狀態(tài)與觀測(cè)值之間的關(guān)系——即觀測(cè)值在不同狀態(tài)下不同的概率分布——由發(fā)散概率(emission probability)B 來(lái)決定。值得一提的是,雖然在本例中,觀測(cè)值(火鍋、拉面、冰激凌)在不同狀態(tài)(天冷、熱)下的概率分布是離散的,但是這個(gè)概率分布也完全可以是連續(xù)的。這完全由待考察的問(wèn)題決定。


f4.png

在任意時(shí)刻 ?t,系統(tǒng)處于未知的狀態(tài) X_t,根據(jù)對(duì)應(yīng)的發(fā)散概率產(chǎn)生相應(yīng)的觀測(cè)值 O_t,這對(duì)于你來(lái)說(shuō)是可見(jiàn)的。如何根據(jù)觀測(cè)值序列來(lái)推測(cè)狀態(tài)序列,或者如何根據(jù)轉(zhuǎn)移概率和發(fā)散概率計(jì)算某個(gè)觀測(cè)值出現(xiàn)的概率,這些都是隱馬爾可夫模型想要回答的問(wèn)題。


4 三類問(wèn)題


在隱馬爾可夫模型(HMM)中,視要解決的問(wèn)題而定,A 和 B 對(duì)你來(lái)說(shuō)可以是已知的或未知的。具體的,我們可以解決三類問(wèn)題。


問(wèn)題一(似然性 —— Likelihood):假設(shè) HMM 的參數(shù) A 和 B 已知,并且知道觀測(cè)序列 O,計(jì)算觀測(cè)序列產(chǎn)生的概率。


問(wèn)題二(解碼 —— Decoding):假設(shè) HMM 的參數(shù) A 和 B 已知,并且知道觀測(cè)序列 O,計(jì)算最有可能產(chǎn)生該觀測(cè)序列的狀態(tài)序列。


問(wèn)題三(學(xué)習(xí) —— Learning):假設(shè)觀測(cè)序列 O 已知,且知道馬爾可夫過(guò)程的狀態(tài)個(gè)數(shù)(但是 A 和 B 未知),從數(shù)據(jù)中學(xué)習(xí)并推測(cè)出 HMM 模型中 A 和 B 的參數(shù)。


對(duì)于量化投資來(lái)說(shuō),在建模時(shí),A 和 B 基本上都是未知的,因此第三類問(wèn)題是我們最關(guān)心的。下面分別對(duì)這三類問(wèn)題做簡(jiǎn)要介紹。前兩類問(wèn)題看似非常接近,都是知道 A,B 和 O,然后求一個(gè)概率。但是他們又略有不同。我們用上一節(jié)的那個(gè)氣溫和飲食的例子做一個(gè)解釋。假設(shè)連續(xù)三天 c 的飲食都是火鍋;而這三天的天氣冷、熱狀態(tài)一共有 8 種可能,如下表所示。


f5.png


在這 8 中情況下,朋友 c 均有可能連續(xù)吃三天火鍋,只不過(guò)在不同的狀態(tài)序列下,他連續(xù)吃三天火鍋的概率不同(概率見(jiàn)上表)。如果連續(xù)三天都很冷,那么他都吃火鍋的概率為 0.125,如果三天都很熱,那么他吃火鍋的概率則僅為 0.001。在第一類問(wèn)題中,我們不關(guān)心產(chǎn)生吃三天火鍋這個(gè)觀測(cè)序列的具體狀態(tài)序列;我們關(guān)心的是在所有可能的狀態(tài)序列下,發(fā)生這個(gè)觀測(cè)序列的總的概率。這個(gè)概率就是上面八種情況的加權(quán)總和,權(quán)重為每個(gè)狀態(tài)序列出現(xiàn)的概率,這個(gè)概率可以通過(guò)狀態(tài)的初始概率分布以及轉(zhuǎn)移矩陣 A 求出。在第二類問(wèn)題中,我們關(guān)心的是,在所有能夠產(chǎn)生連吃三天火鍋這個(gè)觀測(cè)序列的狀態(tài)序列中,產(chǎn)生該觀測(cè)序列的可能性最大的那個(gè)——即在何種狀態(tài)序列下,發(fā)生這個(gè)觀測(cè)序列的概率最高。例如在上面這個(gè)問(wèn)題中,最有可能產(chǎn)生連吃三天火鍋的氣溫狀態(tài)序列是冷冷冷。


對(duì)于這兩類問(wèn)題的求解,上面這個(gè)例子也許也許給你一個(gè)錯(cuò)覺(jué):只要羅列出狀態(tài)所有的排列組合就行了。但不要忘了,這個(gè)例子中僅考慮了兩個(gè)狀態(tài)和三個(gè)觀測(cè)值,因此僅有 2^3 = 8 種情況。在實(shí)際問(wèn)題中,如果有 N 個(gè)狀態(tài)和 T 個(gè)觀測(cè)值,可能的狀態(tài)序列為 N^T 個(gè)。因此,對(duì)于計(jì)算機(jī)來(lái)說(shuō),窮舉法的計(jì)算量級(jí)為 O(N^T),當(dāng) N 和/或 T 很大時(shí),列出所有的可能是低效甚至是不切實(shí)際的。好消息是,我們可以使用更有效的算法來(lái)代替窮舉法。對(duì)于第一類問(wèn)題,一個(gè)有效的算法為向前算法(forward algorithm);對(duì)于第二類問(wèn)題,一個(gè)有效的算法為維特比算法(Viterbi algorithm)。這兩種算法都屬于動(dòng)態(tài)規(guī)劃算法,計(jì)算量級(jí)要比窮舉的計(jì)算量級(jí)小得多。感興趣的讀者可以進(jìn)一步參考相關(guān)資料。


最后,來(lái)看第三類問(wèn)題。它事實(shí)上是一個(gè)模型訓(xùn)練問(wèn)題。HMM 就是我們的模型,觀測(cè)序列就是我們的數(shù)據(jù)。機(jī)器學(xué)習(xí)需要通過(guò)數(shù)據(jù)訓(xùn)練模型,得到 HMM 的最佳參數(shù) A 和 B。比如,在上面這個(gè)例子中,我們的飲食觀測(cè)序列可以是 { 火鍋、拉面、拉面、火鍋、冰激凌、冰激凌、……、拉面、火鍋 },另外我們知道天氣的狀態(tài)有兩個(gè)。這些信息便是我們所有的輸入,機(jī)器學(xué)習(xí)將通過(guò)它們訓(xùn)練 HMM 模型。訓(xùn)練 HMM 模型的標(biāo)準(zhǔn)算法是 Baum-Welch 算法(又稱為 forward-backward 算法),它屬于一種最大期望算法(Expectation-Maximization algorithm,EM 算法)。它通過(guò)迭代算法,不斷的改進(jìn)對(duì) A 和 B 的估計(jì),直到參數(shù)收斂。得到 A 和 B 之后,就可以用它們計(jì)算和回答有關(guān)狀態(tài)序列的一系列問(wèn)題。下面就來(lái)看一個(gè)量化投資領(lǐng)域的例子。


5 HMM 在量化投資領(lǐng)域的應(yīng)用


HMM 在量化投資中有哪些作用呢?也許我們最關(guān)心的問(wèn)題是:它能否被用來(lái)預(yù)測(cè)收益率或者價(jià)格呢?從馬爾可夫性質(zhì)出發(fā),我并不看好這種可能性。雖然 HMM 的無(wú)記憶性可以支持(弱)有效市場(chǎng)假說(shuō)(即當(dāng)前價(jià)格就包含了對(duì)其未來(lái)做預(yù)測(cè)所需的全部信息),但種種經(jīng)驗(yàn)表明,弱有效市場(chǎng)假說(shuō)并不成立。由于信息對(duì)不同投資者的擴(kuò)散速度不同,以及行為金融學(xué)中的反應(yīng)過(guò)度和反應(yīng)不足,價(jià)格或收益率的歷史數(shù)據(jù)在預(yù)測(cè)未來(lái)時(shí)也能起到一定的作用。這顯然與 HMM 的無(wú)記憶性不符合。


舉例來(lái)說(shuō),如果已知今天上漲了 1% 來(lái)預(yù)測(cè)明天的收益率,我們?nèi)匀粫?huì)看一看過(guò)去一段時(shí)間的漲跌情況:連漲 3 天和連跌 5 天后發(fā)生的 1% 的上漲對(duì)投資者的感受顯然是不同的,收益率的歷史軌跡將影響未來(lái)的收益率。雖然也許無(wú)法直接預(yù)測(cè)收益率,但是 HMM 模型可以被用來(lái)進(jìn)行市場(chǎng)狀態(tài)監(jiān)測(cè)(market regime detection)。每當(dāng)新的監(jiān)管或政策的出臺(tái),市場(chǎng)的狀態(tài)可能發(fā)生系統(tǒng)性的轉(zhuǎn)變。這將對(duì)投資策略產(chǎn)生本質(zhì)的影響。從這個(gè)意義上說(shuō),監(jiān)測(cè)市場(chǎng)狀態(tài)十分必要。由于市場(chǎng)的“真實(shí)狀態(tài)”對(duì)于我們來(lái)說(shuō)是未知的——其實(shí)就連市場(chǎng)有幾個(gè)狀態(tài)都需要我們?cè)诮V薪o定 —— 因此它是一個(gè)無(wú)監(jiān)督學(xué)習(xí)問(wèn)題。


下面僅以一個(gè)非常簡(jiǎn)單的例子說(shuō)明 HMM 在這方面的應(yīng)用。假設(shè)市場(chǎng)有兩個(gè)狀態(tài);觀測(cè)序列為上證指數(shù)的日對(duì)數(shù)收益率(觀測(cè)期為 2011 年 1 月到 2017 年 7 月)。此外,我們需要指定發(fā)散概率分布的形態(tài)。由于對(duì)數(shù)收益率近似的滿足正態(tài)分布,因此我們假設(shè)在給定的市場(chǎng)狀態(tài)下,觀測(cè)值滿足不同參數(shù)的正態(tài)分布(即它是連續(xù)的分布,這與上面那個(gè)天氣和飲食例子中離散的發(fā)散概率分布不同)。我們希望通過(guò)訓(xùn)練 HMM 模型,根據(jù)收益率序列來(lái)估計(jì) HMM 的參數(shù),并以此判斷每個(gè)交易日市場(chǎng)所處的狀態(tài)。這無(wú)疑屬于第三類問(wèn)題。使用最大期望算法,得到的結(jié)果如下圖所示。


f6.png


從圖中可以推測(cè)出 HMM 將市場(chǎng)劃分為平靜(狀態(tài) 1)和高波動(dòng)(狀態(tài) 2)兩個(gè)狀態(tài)。在 2014 年底之前,市場(chǎng)在絕大多數(shù)時(shí)間處于平靜狀態(tài),但也不時(shí)出現(xiàn)高波動(dòng)狀態(tài)。在 2014 年底開(kāi)始至 2016 年初結(jié)束的牛熊周期中,市場(chǎng)處于高波動(dòng)狀態(tài)之中。自股災(zāi)結(jié)束之后,市場(chǎng)則完全處于平靜狀態(tài)。雖然使用 HMM 直接預(yù)測(cè)收益率并不實(shí)際,但是對(duì)市場(chǎng)狀態(tài)的正確判斷無(wú)疑對(duì)資產(chǎn)配置和風(fēng)險(xiǎn)控制至關(guān)重要。無(wú)獨(dú)有偶,從 2016 年第一季度開(kāi)始,美股也進(jìn)入了“百年不遇”的低波動(dòng)周期,恐慌指數(shù) VIX 屢創(chuàng)新低。在最近的研究中,高盛就對(duì)美股的低波動(dòng)性進(jìn)行了剖析。


無(wú)論我們多么小心,低波動(dòng)率都會(huì)在我們還沒(méi)有準(zhǔn)備好時(shí)戛然停止;unknown unknowns 也一定會(huì)到來(lái)。想要應(yīng)對(duì)這些,首先必須對(duì)市場(chǎng)狀態(tài)有正確的認(rèn)知,這便是 HMM 在量化投資領(lǐng)域的價(jià)值之一。



免責(zé)聲明:入市有風(fēng)險(xiǎn),投資需謹(jǐn)慎。在任何情況下,本文的內(nèi)容、信息及數(shù)據(jù)或所表述的意見(jiàn)并不構(gòu)成對(duì)任何人的投資建議。在任何情況下,本文作者及所屬機(jī)構(gòu)不對(duì)任何人因使用本文的任何內(nèi)容所引致的任何損失負(fù)任何責(zé)任。除特別說(shuō)明外,文中圖表均直接或間接來(lái)自于相應(yīng)論文,僅為介紹之用,版權(quán)歸原作者和期刊所有。