資產(chǎn)定價(jià)中的實(shí)證挑戰(zhàn) (III)
發(fā)布時(shí)間:2025-02-10 | 來源: 川總寫量化
作者:石川
摘要:本文對比傳統(tǒng)計(jì)量經(jīng)濟(jì)學(xué)與機(jī)器學(xué)習(xí)的建模范式。兩種范式在目標(biāo)導(dǎo)向(解釋性 vs 預(yù)測性)與建模邏輯(假設(shè)驅(qū)動 vs 數(shù)據(jù)驅(qū)動)的根本差異,正重塑實(shí)證資產(chǎn)定價(jià)的方法論體系,為應(yīng)對高維非線性定價(jià)難題提供新路徑。
0 前文回顧
前文《資產(chǎn)定價(jià)中的實(shí)證挑戰(zhàn) (I)》和《資產(chǎn)定價(jià)中的實(shí)證挑戰(zhàn) (II)》勾勒了當(dāng)下實(shí)證資產(chǎn)定價(jià)面臨的各種挑戰(zhàn)。作為系列的第三篇,本文探討這種挑戰(zhàn)對統(tǒng)計(jì)建模有怎樣的啟示。對實(shí)證資產(chǎn)定價(jià)來說,以下這組公式描述它的核心問題:
?
其中?
我們暫且將收集和處理?
本文的討論受到了 Mullainathan and Spiess (2017)、Athey and Imbens (2019) 以及 Kelly and Xiu (2023) 這三篇經(jīng)典論文的啟發(fā)。在討論統(tǒng)計(jì)建模時(shí),你無法也不應(yīng)忽視 Breiman 描述的兩種文化。
1 Data Modeling
第一種是數(shù)據(jù)建模(data modeling)文化。它假設(shè)數(shù)據(jù)生成過程是基于某個(gè)隨機(jī)模型,并基于這一假設(shè)進(jìn)行統(tǒng)計(jì)推斷。這種文化的主要目標(biāo)是為了理解數(shù)據(jù)中的結(jié)構(gòu)和關(guān)系。換言之,對于傳統(tǒng)的數(shù)據(jù)建模文化而言,其核心是基于一系列假設(shè)和理論來理解數(shù)據(jù)產(chǎn)生的機(jī)制。
人們熟知的計(jì)量經(jīng)濟(jì)學(xué)方法便屬于這種文化;計(jì)量經(jīng)濟(jì)學(xué)依賴于建立明確的模型來解釋變量之間的關(guān)系,通常模型會假設(shè)線性關(guān)系、誤差的正態(tài)分布等。這種方法的主要目標(biāo)是參數(shù)估計(jì)而非預(yù)測,旨在解釋變量之間的因果關(guān)系。當(dāng)數(shù)據(jù)滿足模型假設(shè)時(shí),這種方法能提供有力的因果關(guān)系解釋。
回到問題 (1),從計(jì)量經(jīng)濟(jì)學(xué)的角度,我們使用協(xié)變量的線性函數(shù)?
?
利用實(shí)際收益率和協(xié)變量數(shù)據(jù),我們可以通過 OLS 估計(jì)上述模型中的參數(shù)?
傳統(tǒng)的實(shí)證研究方法,無論是時(shí)序回歸還是以 Fama and MacBeth (1973) 為代表的截面回歸,都是遵循這種文化。然而,如果人們關(guān)心的是預(yù)測準(zhǔn)確性而非參數(shù)估計(jì)的無偏性會怎樣呢?例如,我們可以以犧牲無偏性為代價(jià)構(gòu)造一些有偏的估計(jì)量,從而保證更低的方差以抵消偏差的上升,并最終達(dá)到整體均方誤差的降低。James and Stein (1961) 提出的收縮估計(jì)量就是這樣一個(gè)例子。因此,具有無偏性質(zhì)的 OLS 估計(jì)量并非均方誤差最小的估計(jì)量。另外,當(dāng)協(xié)變量的個(gè)數(shù)很多、逼近甚至超過樣本個(gè)數(shù)又會怎樣呢?
2 Algorithmic Modeling
第二種是算法建模(algorithmic modeling)文化。這種方法更加注重預(yù)測的準(zhǔn)確性而非模型的解釋性。算法建模通常不會關(guān)于數(shù)據(jù)生成過程做出嚴(yán)格的結(jié)構(gòu)性假設(shè),而是使用數(shù)據(jù)驅(qū)動的方法來直接從數(shù)據(jù)中學(xué)習(xí),即人們常說的``讓數(shù)據(jù)發(fā)聲''。包括決策樹、隨機(jī)森林、神經(jīng)網(wǎng)絡(luò)等機(jī)器學(xué)習(xí)模型就是這種文化的代表。這種方法的優(yōu)勢是它可以靈活地處理復(fù)雜、非線性和高維的數(shù)據(jù),而無需假設(shè)數(shù)據(jù)的結(jié)構(gòu)或關(guān)系。當(dāng)然,機(jī)器學(xué)習(xí)模型常被人詬病的是其黑箱特性,即缺乏傳統(tǒng)模型的可解釋性。
再回到實(shí)證資產(chǎn)定價(jià)。我們可以將機(jī)器學(xué)習(xí)中的監(jiān)督學(xué)習(xí)視為函數(shù)逼近問題,從而去找尋?
為了便于討論,令?
?
然而,對于機(jī)器學(xué)習(xí)來說,建模的核心是最優(yōu)化模型在樣本外的泛化性能,或最小化泛化誤差。因此,為了防止式 (2) 這個(gè)樸素優(yōu)化目標(biāo)過度擬合訓(xùn)練集數(shù)據(jù),伴隨機(jī)器學(xué)習(xí)而來的一個(gè)重要概念就是正則化(regularization)。在式 (2) 中加入正則化項(xiàng)可得:
?
正則化項(xiàng)?
?
式中第一項(xiàng)是隨機(jī)噪聲的方差,不可被消除;第二項(xiàng)表示偏差的平方;第三項(xiàng)表示方差。偏差是模型預(yù)測的期望值與真實(shí)值之間的差異。高偏差意味著模型的預(yù)測值在整體上偏離了真實(shí)值,即模型過于簡單(欠擬合),沒有捕捉到數(shù)據(jù)中潛藏的模式。方差衡量了模型預(yù)測值的變化范圍。高方差意味著模型對于訓(xùn)練集數(shù)據(jù)的小波動非常敏感,即模型過于復(fù)雜(過擬合),捕捉了訓(xùn)練數(shù)據(jù)中的噪聲。最優(yōu)的模型應(yīng)該一方面足夠靈活以捕捉數(shù)據(jù)內(nèi)在關(guān)聯(lián),而另一方面又不至于太過靈活以至于對噪聲建模。
最優(yōu)的正則化強(qiáng)度一般通過超參數(shù)調(diào)優(yōu)(hyperparameter tuning)確定。為此,可以將樣本數(shù)據(jù)劃分成訓(xùn)練集和測試集,并使用交叉驗(yàn)證(cross-validation)來評估不同正則化強(qiáng)度下模型的泛化能力。相對于計(jì)量經(jīng)濟(jì)學(xué),更加靈活的機(jī)器學(xué)習(xí)方法可以逼近非線性、高維和復(fù)雜的函數(shù)關(guān)系,而無需顯式地設(shè)定模型的形式。這也讓機(jī)器學(xué)習(xí)成為應(yīng)對當(dāng)下實(shí)證資產(chǎn)定價(jià)挑戰(zhàn)的天然工具。
3 Comment
當(dāng)我們透過兩種文化審視計(jì)量經(jīng)濟(jì)學(xué)和機(jī)器學(xué)習(xí)時(shí),可以清晰地看到二者的差異。正如 Breiman (2001) 所強(qiáng)調(diào)的那樣,傳統(tǒng)統(tǒng)計(jì)方法和機(jī)器學(xué)習(xí)研究目標(biāo)的最根本差異在于,前者在假設(shè)數(shù)據(jù)模型已知的前提下估計(jì)模型參數(shù)并進(jìn)行統(tǒng)計(jì)檢驗(yàn);而后者在未知數(shù)據(jù)模型的前提下最大化預(yù)測準(zhǔn)確性(或最小化泛化誤差)。
換言之,對于計(jì)量經(jīng)濟(jì)學(xué)而言,參數(shù)估計(jì)先于預(yù)測準(zhǔn)確性;而對于機(jī)器學(xué)習(xí)來說,預(yù)測準(zhǔn)確性先于參數(shù)估計(jì)。
如果從資產(chǎn)定價(jià)的實(shí)證研究目標(biāo)來審視這一差異,計(jì)量經(jīng)濟(jì)學(xué)主要關(guān)注于定價(jià)模型能否在樣本內(nèi)(in-sample)為測試資產(chǎn)(test asset)定價(jià) —— 即測試資產(chǎn)在給定定價(jià)模型下的定價(jià)誤差是否在統(tǒng)計(jì)上為零;而機(jī)器學(xué)習(xí)則主要關(guān)注于基于定價(jià)模型預(yù)測而構(gòu)造的投資組合在樣本外(out-of-sample)能否獲得最優(yōu)的風(fēng)險(xiǎn)調(diào)整后收益(如夏普比率)。
本文從兩種文化出發(fā)為實(shí)證研究范式的轉(zhuǎn)變奠定了基礎(chǔ)。在本系列的后續(xù),我將從更微觀的層面探討它們各自所遇到的挑戰(zhàn)。
參考文獻(xiàn)
Athey, S. and G. W. Imbens (2019). Machine learning methods that economists should know about. Annual Review of Economics 11, 685-725.
Breiman, L. (2001). Statistical modeling: The two cultures (with comments and a rejoinder by the author). Statistical Science 16(3), 199-231.
Fama, E. F. and J. D. MacBeth (1973). Risk, return, and equilibrium: Empirical tests. Journal of Political Economy 81(3), 607-636.
Kelly, B. T. and D. Xiu (2023). Financial Machine Learning. Foundations and Trends? in Finance 13(3-4), 205-363.
Mullainathan, S. and J. Spiess (2017). Machine learning: An applied econometric approach. Journal of Economic Perspectives 31(2), 87-106.
免責(zé)聲明:入市有風(fēng)險(xiǎn),投資需謹(jǐn)慎。在任何情況下,本文的內(nèi)容、信息及數(shù)據(jù)或所表述的意見并不構(gòu)成對任何人的投資建議。在任何情況下,本文作者及所屬機(jī)構(gòu)不對任何人因使用本文的任何內(nèi)容所引致的任何損失負(fù)任何責(zé)任。除特別說明外,文中圖表均直接或間接來自于相應(yīng)論文,僅為介紹之用,版權(quán)歸原作者和期刊所有。