資產(chǎn)定價(jià)中的實(shí)證挑戰(zhàn) (III)

發(fā)布時(shí)間：2025-02-10 | 來源: 川總寫量化

作者：石川

摘要：本文對比傳統(tǒng)計(jì)量經(jīng)濟(jì)學(xué)與機(jī)器學(xué)習(xí)的建模范式。兩種范式在目標(biāo)導(dǎo)向（解釋性 vs 預(yù)測性）與建模邏輯（假設(shè)驅(qū)動 vs 數(shù)據(jù)驅(qū)動）的根本差異，正重塑實(shí)證資產(chǎn)定價(jià)的方法論體系，為應(yīng)對高維非線性定價(jià)難題提供新路徑。

0 前文回顧

前文《資產(chǎn)定價(jià)中的實(shí)證挑戰(zhàn) (I)》和《資產(chǎn)定價(jià)中的實(shí)證挑戰(zhàn) (II)》勾勒了當(dāng)下實(shí)證資產(chǎn)定價(jià)面臨的各種挑戰(zhàn)。作為系列的第三篇，本文探討這種挑戰(zhàn)對統(tǒng)計(jì)建模有怎樣的啟示。對實(shí)證資產(chǎn)定價(jià)來說，以下這組公式描述它的核心問題：

? $\begin{array}{rll} r_{i,t+1}&=&\mathbb{E}[r_{i,t+1}|\pmb{x}_{i,t}]+e_{i,t+1},\quad\quad(1)\\ \mathbb{E}[r_{i,t+1}|\pmb{x}_{i,t}]&=&f(\pmb{x}_{i,t}), \end{array}$ ?

其中? $r_{i,t+1}$ ?是? $t+1$ ?期資產(chǎn)? $i$ ?的超額收益率，高維向量? $\pmb{x}_{i,t}$ ?表征了我們在? $t$ ?期能夠獲得的全部信息，? $\mathbb{E}[r_{i,t+1}|\pmb{x}_{i,t}]$ ?是基于? $\pmb{x}_{i,t}$ ?所含信息對資產(chǎn)? $i$ ?的? $t+1$ ?期超額收益率所做的展望（即條件預(yù)期超額收益率），? $e_{i,t+1}$ ?是隨機(jī)噪聲（滿足? $\mathbb{E}[e_{i,t+1}|\pmb{x}_{i,t}]=0$ ?）。問題 (1) 的核心是找到將? $\pmb{x}_{i,t}$ ?映射到? $\mathbb{E}[r_{i,t+1}|\pmb{x}_{i,t}]$ ?的函數(shù)? $f()$ ?。

我們暫且將收集和處理? $\pmb{x}_{i,t}$ ?的問題擱置一旁，而把討論的重點(diǎn)聚焦在找尋? $f()$ ?上。為了給下文的討論定下基調(diào)，讓我們從 Leo Breiman 提出的關(guān)于統(tǒng)計(jì)建模的兩種文化講起。Leo Breiman 在他的著名論文?Statistical Modeling: The Two Cultures?中，詳細(xì)探討了統(tǒng)計(jì)建模的兩種文化（Breiman 2001）。

本文的討論受到了 Mullainathan and Spiess (2017)、Athey and Imbens (2019) 以及 Kelly and Xiu (2023) 這三篇經(jīng)典論文的啟發(fā)。在討論統(tǒng)計(jì)建模時(shí)，你無法也不應(yīng)忽視 Breiman 描述的兩種文化。

1 Data Modeling

第一種是數(shù)據(jù)建模（data modeling）文化。它假設(shè)數(shù)據(jù)生成過程是基于某個(gè)隨機(jī)模型，并基于這一假設(shè)進(jìn)行統(tǒng)計(jì)推斷。這種文化的主要目標(biāo)是為了理解數(shù)據(jù)中的結(jié)構(gòu)和關(guān)系。換言之，對于傳統(tǒng)的數(shù)據(jù)建模文化而言，其核心是基于一系列假設(shè)和理論來理解數(shù)據(jù)產(chǎn)生的機(jī)制。

人們熟知的計(jì)量經(jīng)濟(jì)學(xué)方法便屬于這種文化；計(jì)量經(jīng)濟(jì)學(xué)依賴于建立明確的模型來解釋變量之間的關(guān)系，通常模型會假設(shè)線性關(guān)系、誤差的正態(tài)分布等。這種方法的主要目標(biāo)是參數(shù)估計(jì)而非預(yù)測，旨在解釋變量之間的因果關(guān)系。當(dāng)數(shù)據(jù)滿足模型假設(shè)時(shí)，這種方法能提供有力的因果關(guān)系解釋。

回到問題 (1)，從計(jì)量經(jīng)濟(jì)學(xué)的角度，我們使用協(xié)變量的線性函數(shù)? $\hat f(\pmb{x}_{i,t}) = \pmb{\theta}^\top\pmb{x}_{i,t}$ ?（其中? $\pmb{\theta}$ ?代表未知參數(shù)）近似? $f$ ?，即假設(shè)? $r_{i,t+1}$ ?和? $\pmb{x}_{i,t}$ ?之間滿足如下線性回歸模型：

? $r_{i,t+1} = \pmb{\theta}^\top\pmb{x}_{i,t}+e_{i,t+1}.$ ?

利用實(shí)際收益率和協(xié)變量數(shù)據(jù)，我們可以通過 OLS 估計(jì)上述模型中的參數(shù)? $\pmb{\theta}$ ?。當(dāng)模型滿足 Gauss-Markov 定理的假設(shè)時(shí)，OLS 估計(jì)量是最優(yōu)線性無偏估計(jì)量（BLUE）。為了進(jìn)行統(tǒng)計(jì)檢驗(yàn)，人們通常假設(shè)隨機(jī)擾動滿足正態(tài)分布，并以此構(gòu)造關(guān)于? $\pmb{\theta}$ ?的檢驗(yàn)統(tǒng)計(jì)量，進(jìn)而對協(xié)變量的預(yù)測信息進(jìn)行統(tǒng)計(jì)推斷。

傳統(tǒng)的實(shí)證研究方法，無論是時(shí)序回歸還是以 Fama and MacBeth (1973) 為代表的截面回歸，都是遵循這種文化。然而，如果人們關(guān)心的是預(yù)測準(zhǔn)確性而非參數(shù)估計(jì)的無偏性會怎樣呢？例如，我們可以以犧牲無偏性為代價(jià)構(gòu)造一些有偏的估計(jì)量，從而保證更低的方差以抵消偏差的上升，并最終達(dá)到整體均方誤差的降低。James and Stein (1961) 提出的收縮估計(jì)量就是這樣一個(gè)例子。因此，具有無偏性質(zhì)的 OLS 估計(jì)量并非均方誤差最小的估計(jì)量。另外，當(dāng)協(xié)變量的個(gè)數(shù)很多、逼近甚至超過樣本個(gè)數(shù)又會怎樣呢？

2 Algorithmic Modeling

第二種是算法建模（algorithmic modeling）文化。這種方法更加注重預(yù)測的準(zhǔn)確性而非模型的解釋性。算法建模通常不會關(guān)于數(shù)據(jù)生成過程做出嚴(yán)格的結(jié)構(gòu)性假設(shè)，而是使用數(shù)據(jù)驅(qū)動的方法來直接從數(shù)據(jù)中學(xué)習(xí)，即人們常說的``讓數(shù)據(jù)發(fā)聲''。包括決策樹、隨機(jī)森林、神經(jīng)網(wǎng)絡(luò)等機(jī)器學(xué)習(xí)模型就是這種文化的代表。這種方法的優(yōu)勢是它可以靈活地處理復(fù)雜、非線性和高維的數(shù)據(jù)，而無需假設(shè)數(shù)據(jù)的結(jié)構(gòu)或關(guān)系。當(dāng)然，機(jī)器學(xué)習(xí)模型常被人詬病的是其黑箱特性，即缺乏傳統(tǒng)模型的可解釋性。

再回到實(shí)證資產(chǎn)定價(jià)。我們可以將機(jī)器學(xué)習(xí)中的監(jiān)督學(xué)習(xí)視為函數(shù)逼近問題，從而去找尋? $f$ ?。在這種文化下，我們不對數(shù)據(jù)做任何結(jié)構(gòu)性假設(shè)，而是選定一類模型（例如神經(jīng)網(wǎng)絡(luò)）? $\hat f\in \mathcal{F}$ ?并在給定的損失函數(shù)（loss function）? $\mathcal{L}$ ?下從數(shù)據(jù)中學(xué)習(xí)模型的參數(shù)（用來供模型學(xué)習(xí)的數(shù)據(jù)被稱為訓(xùn)練集數(shù)據(jù)）。

為了便于討論，令? $(\pmb{x}_i, y_i)$ ?代表訓(xùn)練集的第? $i$ ?個(gè)觀測值（此處下標(biāo)? $i$ ?表示觀測值 ? $i$ ? 而非個(gè)股，即? $(\pmb{x}_i, y_i)$ ?表示某期某個(gè)股票的協(xié)變量以及和它對應(yīng)的該股票下一期的超額收益率），并假設(shè)一共有? $n$ ?個(gè)觀測值（例如，對于期數(shù)為? $T$ ?、資產(chǎn)個(gè)數(shù)為? $N$ ?的面板數(shù)據(jù)，? $n = N\times T$ ?）。機(jī)器學(xué)習(xí)會以最小化所有觀測值的損失函數(shù)均值為目標(biāo)估計(jì)? $\hat f$ ?的參數(shù)，即

? $\displaystyle\text{minimize }\frac{1}{n}\sum_{i=1}^n \mathcal{L}(\hat f(\pmb{x}_i), y_i).\quad\quad (2)$ ?

然而，對于機(jī)器學(xué)習(xí)來說，建模的核心是最優(yōu)化模型在樣本外的泛化性能，或最小化泛化誤差。因此，為了防止式 (2) 這個(gè)樸素優(yōu)化目標(biāo)過度擬合訓(xùn)練集數(shù)據(jù)，伴隨機(jī)器學(xué)習(xí)而來的一個(gè)重要概念就是正則化（regularization）。在式 (2) 中加入正則化項(xiàng)可得：

? $\displaystyle \text{minimize }\frac{1}{n}\sum_{i=1}^n \mathcal{L}(\hat f(\pmb{x}_i), y_i)+\mathcal{R}(\hat f).$ ?

正則化項(xiàng)? $\mathcal{R}(\hat f)$ ?通過約束模型的復(fù)雜度來調(diào)節(jié)偏差（bias）和方差（variance）之間的權(quán)衡（bias-variance tradeoff），進(jìn)而實(shí)現(xiàn)最優(yōu)的泛化性能。令? $(\pmb{x}, y)$ ?表示某個(gè)樣本外的新觀測值，其中? $y$ ?由真實(shí)模型以及噪聲決定，即? $y=f(\pmb{x})+e$ ?（假設(shè)噪聲的方差為? $\sigma^2$ ?）。另一方面，模型? $\hat f$ ?的預(yù)測值為? $\hat f(\pmb{x})$ ?。模型的泛化誤差? $\mathbb{E}[(y-\hat f(\pmb{x}))^2]$ ?經(jīng)過推導(dǎo)可分解為：

? $\begin{array}{rll} \mathbb{E}[(y - \hat{f}(\pmb{x}))^2] &=& \text{var}(e)+(f - \mathbb{E}[\hat{f}])^2+\text{var} [\hat{f}]\\ &=& \sigma^2+\text{bias}[\hat f(\pmb{x})]^2+\text{var} [\hat{f}(\pmb{x})], \end{array}$ ?

式中第一項(xiàng)是隨機(jī)噪聲的方差，不可被消除；第二項(xiàng)表示偏差的平方；第三項(xiàng)表示方差。偏差是模型預(yù)測的期望值與真實(shí)值之間的差異。高偏差意味著模型的預(yù)測值在整體上偏離了真實(shí)值，即模型過于簡單（欠擬合），沒有捕捉到數(shù)據(jù)中潛藏的模式。方差衡量了模型預(yù)測值的變化范圍。高方差意味著模型對于訓(xùn)練集數(shù)據(jù)的小波動非常敏感，即模型過于復(fù)雜（過擬合），捕捉了訓(xùn)練數(shù)據(jù)中的噪聲。最優(yōu)的模型應(yīng)該一方面足夠靈活以捕捉數(shù)據(jù)內(nèi)在關(guān)聯(lián)，而另一方面又不至于太過靈活以至于對噪聲建模。

最優(yōu)的正則化強(qiáng)度一般通過超參數(shù)調(diào)優(yōu)（hyperparameter tuning）確定。為此，可以將樣本數(shù)據(jù)劃分成訓(xùn)練集和測試集，并使用交叉驗(yàn)證（cross-validation）來評估不同正則化強(qiáng)度下模型的泛化能力。相對于計(jì)量經(jīng)濟(jì)學(xué)，更加靈活的機(jī)器學(xué)習(xí)方法可以逼近非線性、高維和復(fù)雜的函數(shù)關(guān)系，而無需顯式地設(shè)定模型的形式。這也讓機(jī)器學(xué)習(xí)成為應(yīng)對當(dāng)下實(shí)證資產(chǎn)定價(jià)挑戰(zhàn)的天然工具。

3 Comment

當(dāng)我們透過兩種文化審視計(jì)量經(jīng)濟(jì)學(xué)和機(jī)器學(xué)習(xí)時(shí)，可以清晰地看到二者的差異。正如 Breiman (2001) 所強(qiáng)調(diào)的那樣，傳統(tǒng)統(tǒng)計(jì)方法和機(jī)器學(xué)習(xí)研究目標(biāo)的最根本差異在于，前者在假設(shè)數(shù)據(jù)模型已知的前提下估計(jì)模型參數(shù)并進(jìn)行統(tǒng)計(jì)檢驗(yàn)；而后者在未知數(shù)據(jù)模型的前提下最大化預(yù)測準(zhǔn)確性（或最小化泛化誤差）。

換言之，對于計(jì)量經(jīng)濟(jì)學(xué)而言，參數(shù)估計(jì)先于預(yù)測準(zhǔn)確性；而對于機(jī)器學(xué)習(xí)來說，預(yù)測準(zhǔn)確性先于參數(shù)估計(jì)。

如果從資產(chǎn)定價(jià)的實(shí)證研究目標(biāo)來審視這一差異，計(jì)量經(jīng)濟(jì)學(xué)主要關(guān)注于定價(jià)模型能否在樣本內(nèi)（in-sample）為測試資產(chǎn)（test asset）定價(jià) —— 即測試資產(chǎn)在給定定價(jià)模型下的定價(jià)誤差是否在統(tǒng)計(jì)上為零；而機(jī)器學(xué)習(xí)則主要關(guān)注于基于定價(jià)模型預(yù)測而構(gòu)造的投資組合在樣本外（out-of-sample）能否獲得最優(yōu)的風(fēng)險(xiǎn)調(diào)整后收益（如夏普比率）。

本文從兩種文化出發(fā)為實(shí)證研究范式的轉(zhuǎn)變奠定了基礎(chǔ)。在本系列的后續(xù)，我將從更微觀的層面探討它們各自所遇到的挑戰(zhàn)。

參考文獻(xiàn)

Athey, S. and G. W. Imbens (2019). Machine learning methods that economists should know about. Annual Review of Economics 11, 685-725.

Breiman, L. (2001). Statistical modeling: The two cultures (with comments and a rejoinder by the author). Statistical Science 16(3), 199-231.

Fama, E. F. and J. D. MacBeth (1973). Risk, return, and equilibrium: Empirical tests. Journal of Political Economy 81(3), 607-636.

Kelly, B. T. and D. Xiu (2023). Financial Machine Learning. Foundations and Trends? in Finance 13(3-4), 205-363.

Mullainathan, S. and J. Spiess (2017). Machine learning: An applied econometric approach. Journal of Economic Perspectives 31(2), 87-106.

免責(zé)聲明：入市有風(fēng)險(xiǎn)，投資需謹(jǐn)慎。在任何情況下，本文的內(nèi)容、信息及數(shù)據(jù)或所表述的意見并不構(gòu)成對任何人的投資建議。在任何情況下，本文作者及所屬機(jī)構(gòu)不對任何人因使用本文的任何內(nèi)容所引致的任何損失負(fù)任何責(zé)任。除特別說明外，文中圖表均直接或間接來自于相應(yīng)論文，僅為介紹之用，版權(quán)歸原作者和期刊所有。

亚洲精品国产精品制服丝袜,亚洲欧美日韩精品a∨,97在线热免费视频精品视频,亚洲人成在线观看网站不卡

合格投資者聲明

資產(chǎn)定價(jià)中的實(shí)證挑戰(zhàn) (III)