[置頂] 機(jī)器學(xué)習(xí)與資產(chǎn)定價(jià)
發(fā)布時(shí)間:2023-03-20 | 來源: 川總寫量化
作者:石川
摘要:一本大數(shù)據(jù)時(shí)代的實(shí)證資產(chǎn)定價(jià)方法前沿,請(qǐng)查收。
大數(shù)據(jù)時(shí)代,與資產(chǎn)預(yù)期收益率相關(guān)的協(xié)變量數(shù)量與日俱增。資產(chǎn)定價(jià)已然步入了協(xié)變量的高維數(shù)時(shí)代。在這個(gè)背景下,傳統(tǒng)計(jì)量經(jīng)濟(jì)學(xué)方法在利用諸多協(xié)變量以及它們的非線性變換來預(yù)測(cè)預(yù)期收益率方面稍顯遜色,而擅長(zhǎng)處理這類問題的機(jī)器學(xué)習(xí)算法已悄然走進(jìn)了實(shí)證研究和量化投資實(shí)踐之中。
然而,面對(duì)收益率數(shù)據(jù)低信噪比、不滿足平穩(wěn)性等問題,在其他領(lǐng)域大放異彩的機(jī)器學(xué)習(xí)算法在資產(chǎn)定價(jià)中并非即插即用。大到算法選擇,中到超參數(shù)調(diào)優(yōu),小到變量預(yù)處理,每一個(gè)決策都會(huì)影響機(jī)器學(xué)習(xí)算法在資產(chǎn)定價(jià)應(yīng)用中的效果。為了獲得樣本外更好的結(jié)果,人們又應(yīng)該依據(jù)什么來做出上述決策呢?
為了回答這些問題,讓我們從理論和實(shí)證資產(chǎn)定價(jià)的發(fā)展說起。
資產(chǎn)定價(jià)研究的核心目標(biāo)之一是解釋不同資產(chǎn)預(yù)期收益率在截面上的差異。自 20 世紀(jì) 50 年代以來,學(xué)術(shù)界就該問題在理論和實(shí)證兩方面取得了大量的成果。在理論方面,研究表明了隨機(jī)貼現(xiàn)因子、均值—方差有效投資組合以及多因子模型之間的等價(jià)性;而在實(shí)證方面,以資本資產(chǎn)定價(jià)模型和 Fama-French 三因子模型為代表的因子模型更是引領(lǐng)了數(shù)十年的研究。
學(xué)術(shù)界在理論和實(shí)證方面的雙管齊下也為業(yè)界的投資實(shí)務(wù)建立了必要的秩序,使之從最初充斥著華爾街逸聞趣事或者“某某一夜暴富”的頭條故事的雜亂無章,演化至當(dāng)前在金融經(jīng)濟(jì)學(xué)框架內(nèi),使用嚴(yán)謹(jǐn)?shù)臄?shù)據(jù)分析和統(tǒng)計(jì)檢驗(yàn)已經(jīng)成為業(yè)界的研究范式。從多因子模型衍生出來的因子投資在投資實(shí)務(wù)中已經(jīng)占據(jù)了舉足輕重的地位,而利用諸如價(jià)值、規(guī)模、盈利、動(dòng)量等因子區(qū)分不同資產(chǎn)預(yù)期收益率的差異、獲得更高的風(fēng)險(xiǎn)調(diào)整后收益這樣的認(rèn)知更是深入人心。資產(chǎn)定價(jià)已然成為金融領(lǐng)域內(nèi)一個(gè)理論和實(shí)踐緊密聯(lián)系、相互交融的典型代表。
然而,在這片有序之下也并非沒有“暗流涌動(dòng)”。首先,在實(shí)證方面,在過去的 10~20 年中,在發(fā)表偏差所導(dǎo)致的 p-hacking 問題驅(qū)使下,學(xué)術(shù)界制造了大量所謂的“市場(chǎng)異象”,它們中的每一個(gè)都在特定的實(shí)證設(shè)定下獲得了超額收益。仿佛就在一夜之間,成百上千個(gè)能為解釋資產(chǎn)預(yù)期收益率截面差異提供增量貢獻(xiàn)的協(xié)變量便如雨后春筍一般涌現(xiàn)出來。但這諸多變量到底代表了何種系統(tǒng)性風(fēng)險(xiǎn)?它們之間的相關(guān)性和帶有的預(yù)測(cè)信息的冗余度幾何?哪些能夠作為真正的定價(jià)因子?因子的風(fēng)險(xiǎn)價(jià)格又究竟是多少?與眾多協(xié)變量形成鮮明對(duì)比的是,人們對(duì)上述問題的理解卻十分貧瘠,這無疑令人尷尬。
數(shù)據(jù)量的激增進(jìn)一步加劇了上述實(shí)證挑戰(zhàn)。如今,被用來預(yù)測(cè)收益率的潛在協(xié)變量的數(shù)量與日俱增。傳統(tǒng)的包括歷史量?jī)r(jià)數(shù)據(jù)、財(cái)務(wù)報(bào)表數(shù)據(jù)、分析師一致預(yù)期數(shù)據(jù),以及另類的包括新聞?shì)浨閿?shù)據(jù)、文本分析數(shù)據(jù)、衛(wèi)星圖像數(shù)據(jù)等均能夠被拿來加工成各式各樣的預(yù)測(cè)變量。毫不夸張地說,就資產(chǎn)定價(jià)的研究而言,我們已經(jīng)步入了預(yù)測(cè)變量的高維數(shù)時(shí)代。而這樣一個(gè)大數(shù)據(jù)時(shí)代對(duì)傳統(tǒng)的計(jì)量經(jīng)濟(jì)學(xué)方法提出了巨大的挑戰(zhàn)——試想一下當(dāng)協(xié)變量個(gè)數(shù)超過觀測(cè)樣本個(gè)數(shù)時(shí),OLS 的無能為力。為了通過計(jì)量經(jīng)濟(jì)學(xué)方法得出可靠的結(jié)果,人們只能退而求其次在實(shí)證分析中施加人為的稀疏性假設(shè),這意味著在多因子模型中僅考慮有限個(gè)因子,或在研究收益率截面預(yù)測(cè)問題中只同時(shí)考慮很少的變量。
類似的挑戰(zhàn)也存在于資產(chǎn)定價(jià)的理論方面。已有的、被學(xué)界和業(yè)界廣泛認(rèn)可的統(tǒng)計(jì)檢驗(yàn)方法和統(tǒng)計(jì)推斷結(jié)果均是建立在理性預(yù)期假設(shè)(即投資者已知現(xiàn)金流生成模型以及模型的參數(shù))之上的。這意味著事后樣本內(nèi)檢驗(yàn)發(fā)現(xiàn)的收益率可預(yù)測(cè)性可以被安全地歸因?yàn)橄到y(tǒng)性風(fēng)險(xiǎn)補(bǔ)償或由投資者行為偏差而導(dǎo)致的錯(cuò)誤定價(jià)。可是,如果理性預(yù)期假設(shè)不滿足又會(huì)如何呢?在如今的大數(shù)據(jù)時(shí)代,既然對(duì)市場(chǎng)數(shù)據(jù)進(jìn)行事后分析的統(tǒng)計(jì)者們面臨著高維預(yù)測(cè)變量問題,那么我們有同樣的理由相信在金融市場(chǎng)中實(shí)際交易的投資者(他們的交易行為產(chǎn)生了實(shí)實(shí)在在的價(jià)格數(shù)據(jù))也一定面臨類似的高維預(yù)測(cè)問題。而已有的資產(chǎn)定價(jià)理論模型并未將投資者置于如此復(fù)雜的環(huán)境之中,因?yàn)樵谠摥h(huán)境中理性預(yù)期假設(shè)不再成立。面對(duì)這種進(jìn)退兩難的情形,我們是否真的無能為力?一旦在模型中放棄理性預(yù)期假設(shè),對(duì)事后樣本內(nèi)統(tǒng)計(jì)推斷又會(huì)有什么影響呢?除了風(fēng)險(xiǎn)補(bǔ)償和錯(cuò)誤定價(jià),事后檢驗(yàn)中存在的收益率可預(yù)測(cè)性背后的原因是否還有第三種可能?
面對(duì)實(shí)證和理論兩方面的困境,好不容易建立起秩序的資產(chǎn)定價(jià)再一次陷入了無序之中。人們又回到了需要重新建立新秩序的起點(diǎn)。而無論是實(shí)證檢驗(yàn)還是理論建模,為了應(yīng)對(duì)協(xié)變量的高維數(shù)問題,擅于處理高維問題和非線性關(guān)系的機(jī)器學(xué)習(xí)方法自然而然地成為彌補(bǔ)傳統(tǒng)計(jì)量經(jīng)濟(jì)學(xué)方法不足的不二之選。各種機(jī)器學(xué)習(xí)方法已經(jīng)在資產(chǎn)定價(jià)之外的其他領(lǐng)域(如圖像識(shí)別)取得了巨大的成功,讓人們對(duì)它們?cè)谫Y產(chǎn)定價(jià)方面的表現(xiàn)充滿期待。不幸的是,機(jī)器學(xué)習(xí)算法并非“即插即用”。大量實(shí)證結(jié)果表明,將現(xiàn)成的機(jī)器學(xué)習(xí)算法簡(jiǎn)單粗暴地應(yīng)用于資產(chǎn)定價(jià)領(lǐng)域的數(shù)據(jù)并不能在樣本外取得優(yōu)秀的表現(xiàn)。這是否意味著人們的希望破滅了呢?幸運(yùn)的是,答案亦是否定的。
資產(chǎn)定價(jià)領(lǐng)域的數(shù)據(jù),諸如資產(chǎn)收益率,較機(jī)器學(xué)習(xí)擅長(zhǎng)發(fā)揮作用的其他領(lǐng)域的數(shù)據(jù)具有一些與生俱來不同的屬性,例如信噪比極低、難以滿足平穩(wěn)性及預(yù)測(cè)誤差直接影響投資組合的風(fēng)險(xiǎn)收益特征等。這些特殊屬性的存在阻礙著現(xiàn)成機(jī)器學(xué)習(xí)算法發(fā)揮其威力。然而,一旦知道了問題所在,我們便能夠有的放矢,針對(duì)資產(chǎn)定價(jià)數(shù)據(jù)的屬性選擇和調(diào)整機(jī)器學(xué)習(xí)算法及其參數(shù),使它們充分發(fā)揮所長(zhǎng)。
雖然目標(biāo)明確,但這條利用機(jī)器學(xué)習(xí)拓展資產(chǎn)定價(jià)研究的道路仍然十分曲折。好消息是,在這條道路上,已經(jīng)有人為我們勾勒出了系統(tǒng)性的、可操作的藍(lán)圖。這張藍(lán)圖就是由身為芝加哥大學(xué)金融學(xué)教授、金融領(lǐng)域頂級(jí)期刊?Journal of Finance?執(zhí)行主編的 Stefan Nagel 教授所撰寫的?Machine Learning in Asset Pricing。該書高屋建瓴,邏輯縝密,推理嚴(yán)謹(jǐn),得到了 John Campbell、Bryan Kelly、Allan Timmermann 和范劍青四位大咖的聯(lián)袂推薦。
作為資產(chǎn)定價(jià)領(lǐng)域的領(lǐng)軍學(xué)者之一,Stefan Nagel 教授以預(yù)測(cè)股票截面收益率中所遇到的各種問題為例,在書中體系化地討論了如何將機(jī)器學(xué)習(xí)方法成功地引入實(shí)證和理論資產(chǎn)定價(jià)研究之中,從而有效解決前文提到的挑戰(zhàn)。比如,該書通過理論推導(dǎo)和實(shí)證分析表明分別以?
資產(chǎn)定價(jià)應(yīng)用中數(shù)據(jù)的低信噪比意味著人們不應(yīng)指望在靈活的框架下,僅依靠“數(shù)據(jù)自己發(fā)聲”便能取得良好的結(jié)果。因此,為了實(shí)現(xiàn)在實(shí)證和理論方面的突破,需要對(duì)機(jī)器學(xué)習(xí)算法的選擇以及參數(shù)的設(shè)定施加必要的結(jié)構(gòu)性約束。為此,將資產(chǎn)定價(jià)數(shù)據(jù)屬性背后的內(nèi)在經(jīng)濟(jì)學(xué)原理注入機(jī)器學(xué)習(xí)的應(yīng)用就變得尤為重要。在這方面,貝葉斯統(tǒng)計(jì)提供了一個(gè)天然的框架。通過指定關(guān)于風(fēng)險(xiǎn)和收益機(jī)會(huì)的先驗(yàn)分布,該研究框架允許人們?cè)谑找媛暑A(yù)測(cè)問題中加入具有經(jīng)濟(jì)學(xué)動(dòng)機(jī)的約束條件,它們對(duì)機(jī)器學(xué)習(xí)的成功應(yīng)用至關(guān)重要。通過貝葉斯框架使得機(jī)器學(xué)習(xí)在資產(chǎn)定價(jià)中發(fā)揮更大的作用正是?Machine Learning in Asset Pricing?的一大特色。該書的另一個(gè)特色是強(qiáng)調(diào)開放性問題而非提供明確的答案。通過指出尚待解決的重要問題,Stefan Nagel 教授展望了資產(chǎn)定價(jià)研究的未來。
對(duì)業(yè)界投資實(shí)務(wù)來說,該書描繪的理論前沿進(jìn)展極具價(jià)值。當(dāng)下,人們似乎站在這樣一個(gè)十字路口之中,即傳統(tǒng)的基于人為稀疏性假設(shè)的多因子模型越來越難以獲得可觀的風(fēng)險(xiǎn)調(diào)整后收益。這背后的原因是,傳統(tǒng)實(shí)證資產(chǎn)定價(jià)研究和業(yè)界的投資實(shí)務(wù)的目標(biāo)之間存在錯(cuò)配。前者的目標(biāo)是提出簡(jiǎn)約的靜態(tài)模型并為模型中的因子提供合理的依據(jù),而后者的目標(biāo)則是最大化樣本外投資組合的條件風(fēng)險(xiǎn)收益特征。在這種錯(cuò)配下,投資實(shí)務(wù)亟需來自學(xué)術(shù)研究的全新方法的指引,而注入經(jīng)濟(jì)學(xué)推理的機(jī)器學(xué)習(xí)方法就是最好的答案。該書介紹的理論方法以及相應(yīng)的實(shí)證結(jié)果很好地?cái)U(kuò)展了因子投資的前沿。
毫不夸張地說,Machine Learning in Asset Pricing?是一本資產(chǎn)定價(jià)領(lǐng)域劃時(shí)代的引領(lǐng)之作,同時(shí)也我最近兩年的最愛。書中所展示的機(jī)器學(xué)習(xí)在資產(chǎn)定價(jià)中的應(yīng)用前景也極大地開闊了我的研究眼界和思路;而將書中闡述的前沿觀點(diǎn)和實(shí)證結(jié)果介紹給公眾號(hào)的小伙伴也成為我今年最大的心愿。今天,這個(gè)愿望終于實(shí)現(xiàn):我和北大經(jīng)院的王熙老師合作,翻譯出版了該書的中文版:《機(jī)器學(xué)習(xí)與資產(chǎn)定價(jià)》。
作為譯者,特別感謝 Stefan Nagel 教授以及普林斯頓大學(xué)出版社的同意和信任,讓我們有機(jī)會(huì)將其引入國(guó)內(nèi)。能有機(jī)會(huì)參與本書的翻譯,我們深感榮幸,同時(shí)也明白身上擔(dān)負(fù)的使命和責(zé)任。在翻譯過程中,我們反復(fù)討論和修訂,力爭(zhēng)做到在文字意義忠于原著的前提下,行文更加符合中文的表述習(xí)慣。此外,我們還在中文版中加入了大量的譯者注,希望以此起到兩個(gè)作用:(1)給原著提供必要的背景知識(shí),幫助讀者掌握上下文的行文邏輯;(2)原著中的第 3 至 5 章均涉及大量公式,我們?yōu)槠渲薪^大多數(shù)公式提供了推導(dǎo)過程,幫助讀者加深對(duì)貝葉斯統(tǒng)計(jì)框架的理解。為了區(qū)分譯者注和原著自帶的腳注,譯者注采用了獨(dú)立的編號(hào)且使用了楷體。希望這些努力能夠使中文版讀者更好地體會(huì)到原著的魅力。
在翻譯過程中,我們有幸得到了學(xué)界和業(yè)界很多專家的熱情幫助,感謝芝加哥大學(xué)布斯商學(xué)院修大成教授以及嘉實(shí)基金首席科學(xué)家張自力博士為中譯版撰寫精彩的序言。此外,本書的出版也離不開電子工業(yè)出版社的全力支持,在此向各位編輯老師表示感謝。
在各位讀者開始這段令人興奮的機(jī)器學(xué)習(xí)與資產(chǎn)定價(jià)之旅之前,我們還想給出一些小小的忠告。雖然原著旨在介紹機(jī)器學(xué)習(xí)在資產(chǎn)定價(jià)中的應(yīng)用,但它并不涵蓋機(jī)器學(xué)習(xí)方法的最新進(jìn)展,也并沒有在計(jì)算問題方面花費(fèi)太多篇幅。另外,原著也并沒有致力于提供關(guān)于哪個(gè)機(jī)器學(xué)習(xí)方法更好的“神秘配方”或“靈丹妙藥”。機(jī)器學(xué)習(xí)不是純粹的調(diào)包,不是幻想能毫無阻礙地揭示數(shù)據(jù)中的規(guī)律。毫無章法的使用機(jī)器學(xué)習(xí)會(huì)帶來如辛普森悖論一樣的悖論。唯有基于已有資產(chǎn)定價(jià)理論,將機(jī)器學(xué)習(xí)方法有機(jī)的融合理論視角,才能使得我們?cè)隍?yàn)證既有理論時(shí)有更強(qiáng)大的方法,并且使用理論框架約束機(jī)器學(xué)習(xí)的過擬合過程。
但是,如何有機(jī)的將機(jī)器學(xué)習(xí)融合進(jìn)資產(chǎn)定價(jià),人們并沒有一個(gè)“萬(wàn)能公式”,而是需要根據(jù)所研究問題的特性,創(chuàng)造性的使用機(jī)器學(xué)習(xí)及其思想。原著在如何將機(jī)器學(xué)習(xí)運(yùn)用至數(shù)個(gè)經(jīng)典的資產(chǎn)定價(jià)問題上,給研究者們提供了一系列精美絕倫的設(shè)計(jì),很好地回答了“機(jī)器學(xué)習(xí)方法是否適用于資產(chǎn)定價(jià)”以及“如何基于經(jīng)濟(jì)學(xué)推理更合理地應(yīng)用機(jī)器學(xué)習(xí)方法”這些本質(zhì)的問題。希望通過該書中文版的出版,能夠幫助資產(chǎn)定價(jià)的研究者和量化投資的實(shí)踐者們?cè)谖磥硪娢⒅黄苽鹘y(tǒng)框架約束,為自己所感興趣的研究問題設(shè)計(jì)出有針對(duì)性的機(jī)器學(xué)習(xí)解決方案。
以下是一組中文版實(shí)物的精美圖片。本書為精裝書,紙張選用 80g 純質(zhì)紙,實(shí)物拿到手里的質(zhì)感非常好,希望內(nèi)容和制作能給各位帶來雙重享受。
回顧過去半個(gè)世紀(jì)的資產(chǎn)定價(jià)研究,不禁讓人感慨萬(wàn)千。學(xué)術(shù)研究也許就是這樣,在無序中建立秩序,秩序又被新的問題打破并重新被建立,周而復(fù)始。在大數(shù)據(jù)時(shí)代研究資產(chǎn)定價(jià),我們不僅要擁抱機(jī)器學(xué)習(xí),而且要正確、科學(xué)、有效地?fù)肀C(jī)器學(xué)習(xí)。Stefan Nagel 教授的?Machine Learning in Asset Pricing?使我們朝著這個(gè)目標(biāo)邁出堅(jiān)實(shí)的一步。該書不僅是對(duì)最新前沿成果的精彩梳理,更是一種面對(duì)未來的整裝待發(fā)。相信每個(gè)關(guān)注資產(chǎn)定價(jià)的人都會(huì)因此而深受啟發(fā)。
免責(zé)聲明:入市有風(fēng)險(xiǎn),投資需謹(jǐn)慎。在任何情況下,本文的內(nèi)容、信息及數(shù)據(jù)或所表述的意見并不構(gòu)成對(duì)任何人的投資建議。在任何情況下,本文作者及所屬機(jī)構(gòu)不對(duì)任何人因使用本文的任何內(nèi)容所引致的任何損失負(fù)任何責(zé)任。除特別說明外,文中圖表均直接或間接來自于相應(yīng)論文,僅為介紹之用,版權(quán)歸原作者和期刊所有。