Generalized Method of Moments

發(fā)布時(shí)間：2019-11-20 | 來(lái)源: 川總寫(xiě)量化

作者：石川

摘要：GMM 是研究 asset pricing 時(shí)繞不過(guò)的工具。本文介紹 GMM 框架的強(qiáng)大之處，并闡述其背后的數(shù)學(xué)之美。

1 引言

前文《理解資產(chǎn)價(jià)格》已經(jīng)提到，Hansen (1982) 提出的 GMM 在 empirical asset pricing 研究的歷史上起到了舉足輕重的作用，而如今無(wú)論是在經(jīng)濟(jì)學(xué)領(lǐng)域還是金融學(xué)領(lǐng)域，GMM 因其數(shù)學(xué)上的優(yōu)雅和特性上的強(qiáng)大都被廣泛的運(yùn)用。今天這篇文章算是我自己關(guān)于 GMM 的一個(gè)學(xué)習(xí)筆記，而我的學(xué)習(xí)資料（公眾號(hào)的老朋友一定猜到了）正是 John Cochrane 教授的神書(shū) Asset Pricing（Cochrane 2005）以及他在 UChicago 時(shí)做的 Online 課程中對(duì) GMM 的介紹。Cochrane 教授講的實(shí)在是太清楚、到位了，本文是我做對(duì)他所講的內(nèi)容的消化、梳理和再串聯(lián)。

本文的目標(biāo)是試圖從 intuition 出發(fā)揭示 GMM 蘊(yùn)含數(shù)學(xué)之美；試圖把公式掰開(kāi)揉碎講清楚從而幫助感興趣的朋友理解大公式背后的本質(zhì)。Cochrane 教授說(shuō)，學(xué)習(xí) GMM 時(shí)最大的障礙就是它的 notation（數(shù)學(xué)符號(hào)）繁多；只要搞清楚 notation，其實(shí) GMM 背后的數(shù)學(xué)精髓是非常簡(jiǎn)單的，因?yàn)?GMM 的核心最終能夠歸結(jié)為計(jì)算 the variance of the sample mean。希望本文能夠帶給你這種恍然大悟之感。先來(lái)劇透一下，本文希望傳達(dá)以下三方面內(nèi)容：

1. GMM 的框架包括 model、estimate 以及 test 三部分；

2. 學(xué)習(xí) GMM 時(shí)，最大的障礙往往來(lái)自 notation；搞清楚 notation 后，GMM 背后的數(shù)學(xué)非常容易理解；

3. GMM 不應(yīng)被當(dāng)作計(jì)量學(xué)的黑箱。

以我一貫的風(fēng)格，行文中會(huì)“死磕”數(shù)學(xué)公式，因此這注定是一篇十分 technical 的文章。本文的技術(shù)性遠(yuǎn)超《股票多因子模型的回歸檢驗(yàn)》，因此同樣建議在一個(gè)能靜下心來(lái)思考的心境下和環(huán)境中閱讀。對(duì)于不關(guān)心數(shù)學(xué)、僅想快速了解 GMM 是什么的讀者來(lái)說(shuō)，我強(qiáng)烈推薦慧航大神在知乎上關(guān)于 GMM 的回答（參考文獻(xiàn)中最后一條）。那篇回答對(duì)讀者非常友好，涉及到的數(shù)學(xué)恰到好處，深入淺出的介紹了 GMM 的原理。

如果本文能對(duì)你理解 GMM 起到一點(diǎn)幫助，那完全是 Cochrane 教授的功勞；如果你看完后依然困惑，那一定也必須是怪我沒(méi)寫(xiě)好……鑒于寫(xiě)作本文耗時(shí)較長(zhǎng)（消耗腦細(xì)胞過(guò)多），接下來(lái)公眾號(hào)將會(huì)暫停一段時(shí)間。Cochrane 教授說(shuō) GMM 的核心最終能夠歸結(jié)為計(jì)算 the variance of the sample mean；讓我們就從 the variance of the sample mean 說(shuō)起。

2?Variance of the Sample Mean

考慮某隨機(jī)變量 u_t。假設(shè)它在某個(gè)樣本內(nèi)的取值為 0，-1，3，3，-3。我們可以很容易的算出樣本均值：

上式中，E_T = (1/T)Σ(.) 表示對(duì)樣本數(shù)據(jù)求平均，\bar u 表示 u_t 的樣本均值。由于 u_t 是一個(gè)隨機(jī)變量，因此其樣本均值本身（即 \bar u_t）也是一個(gè)隨機(jī)變量。雖然它在我們這個(gè)樣本中的取值為 0.4，但如果我們能夠乘坐時(shí)光機(jī)回到過(guò)去“重寫(xiě)歷史”，得到不同的樣本，那么在不同樣本中，樣本均值的取值也會(huì)有所變化。比如在下面這個(gè)表中，假設(shè)除樣本一（就是上面這個(gè)樣本）之外，還有三個(gè)樣本，而它們的樣本均值 \bar u 的取值分別為 -0.8，0.6 和 1.6。

既然樣本均值本身也是一個(gè)隨機(jī)變量，那么一個(gè)很自然的問(wèn)題就是樣本均值在不同的樣本中是如何變化的，即 variance of the sample mean。從 variance 的定義出發(fā)可得：

在最簡(jiǎn)單的情況中，假設(shè) u_t 序列滿(mǎn)足 i.i.d.，則上式可以簡(jiǎn)化成：

把兩邊開(kāi)方就得到樣本均值的 standard error：

這大概是我們?cè)诮y(tǒng)計(jì)課中學(xué)到的印象最深的一個(gè)式子（假設(shè) u_t 滿(mǎn)足 i.i.d. 條件下樣本均值的 standard error）。在更一般的情況中 —— 尤其是在金融數(shù)據(jù)（比如收益率）數(shù)據(jù)中 —— u_t 序列是前后是有非零的自相關(guān)的，即 cov(u_t, u_{t-j}) ≠ 0，因此需要得到更一般下樣本均值 \bar u 的 variance：

當(dāng) T 趨于無(wú)窮大時(shí)（即 sample size 越來(lái)越大），(T – j)/T 趨于 1，就可以求出 var(\bar u) 的漸進(jìn)（asymptotic）形式：

下面再假設(shè)一個(gè)特殊的情況，即隨機(jī)變量 u_t 的總體均值 E[u_t] = 0，并利用協(xié)方差的定義 cov(X, Y) = E[XY] – E[X]E[Y] 可得：

上式最后一項(xiàng)中的 S 代表了中間項(xiàng)中那一大坨求和項(xiàng)。在 GMM 的術(shù)語(yǔ)中，S 被稱(chēng)作 spectral density matrix at frequency zero of u_t。

OK！整理一下。本小節(jié)從我們熟悉的樣本均值出發(fā)指出樣本均值本身也是一個(gè)隨機(jī)變量，并推導(dǎo)出當(dāng) sample size（T）趨于無(wú)窮且假設(shè) E[u_t] = 0 時(shí)，variance of the sample mean 漸進(jìn)趨于 S/T，其中 S 是無(wú)窮級(jí)數(shù)求和 ΣE[u_tu_{t-j}]。千萬(wàn)不要小看這個(gè) var(\bar u) --> S/T 這個(gè)式子，它在下文 GMM 的數(shù)學(xué)推導(dǎo)中起著至關(guān)重要的作用。用 Cochrane 的話(huà)說(shuō)，GMM 中大絕大部分計(jì)量學(xué)均可歸結(jié)到這個(gè)式子（most econometrics boils down to this）！

3?GMM 框架

回顧了 variance of the sample mean 之后，本小節(jié)就來(lái)直觀的看看 GMM 到底是怎么回事兒。GMM 的作用是為了檢驗(yàn)?zāi)Ｐ汀?/span>模型到底對(duì)不對(duì)？模型的參數(shù)如何估計(jì)？誤差是來(lái)自運(yùn)氣還是因?yàn)槟Ｐ陀姓`？GMM 提供了一個(gè)優(yōu)雅而強(qiáng)大的計(jì)量學(xué)框架來(lái)回答這些問(wèn)題。一般來(lái)說(shuō)，GMM 框架分為以下三個(gè)部分：

第一部分：把待研究的問(wèn)題表達(dá)成一系列總體矩條件（population moment conditions） —— 這是提出 model；

第二部分：使用樣本數(shù)據(jù)得到對(duì)應(yīng)的樣本矩（sample moments），從而對(duì)參數(shù)進(jìn)行估計(jì) —— 這是把 model 和 data 聯(lián)系起來(lái)；

第三部分：計(jì)算 sample moments 的 variance，從而對(duì) population moments 進(jìn)行 statistical test —— 這是檢驗(yàn) model。

所以概括來(lái)說(shuō)就是 GMM 就是用 sample moments 代替 population moments 然后對(duì) population moments 進(jìn)行統(tǒng)計(jì)檢驗(yàn)。

3.1 GMM 第一部分

我們用 x_t 代表 data，b 代表參數(shù)（這些都是 vectors），且存在一系列關(guān)于 x_t 和 b 的函數(shù) f(x_t, b)。f(x_t, b) 的 expected value 即 E[f(x_t, b)] 就是 population moments。在 GMM 中，我們要求 population moments 滿(mǎn)足 E[f(x_t, b)] = 0 的約束，這一系列 E[f(x_t, b)] = 0 約束就是 GMM 中的 population moment conditions（矩條件）。這些 moment conditions 是我們關(guān)于真實(shí)模型（true model）的猜測(cè)。

需要說(shuō)明的是，期望符號(hào) E 表示對(duì)總體求均值；而前面使用的（接下來(lái)也將會(huì)繼續(xù)使用的）期望符號(hào) E_T（有個(gè)下標(biāo) T）表示對(duì)樣本求均值。

GMM 的第一部分是把待研究的問(wèn)題轉(zhuǎn)化成數(shù)據(jù) x_t 和參數(shù) b 的一系列方程 f、且假設(shè)在 true model 下這些方程的 moments 滿(mǎn)足 E[f(x_t, b)] = 0。

仍然晦澀？馬上來(lái)看一些 asset pricing 中的例子。從最基礎(chǔ)的 p = E[mx] 出發(fā)（詳見(jiàn)《理解資產(chǎn)價(jià)格》），其中 m 是 stochastic discount factor（由某些未知參數(shù) b 決定）、x 是回報(bào)、p 是價(jià)格。如果把 x 換成超額收益（用 R^e 表示）則有：

如果把 x 換成 gross risk-free rate R_f（即 t 投入 1，t + 1 得到 R_f）則有：

這些都是 asset pricing 中常見(jiàn)的 moment conditions。

3.2 GMM 第二部分

第一部分雖然把問(wèn)題描述清楚了，但它們都是 population moment conditions，只是我們對(duì)于真實(shí)模型的猜想，我們有的只是樣本數(shù)據(jù)。GMM 的第二部分就是用 sample moments 來(lái)代替 population moments，從而建立起模型和數(shù)據(jù)之間的聯(lián)系，以進(jìn)行參數(shù)估計(jì)。和本文第二節(jié)一樣，用 E_T 代表對(duì)樣本數(shù)據(jù)求平均，則 sample moments 可以寫(xiě)成：

上式中最后引入符號(hào) g_T 僅僅是為了下文中簡(jiǎn)化公式。怎么樣？看著這個(gè)式子有沒(méi)有什么感想？無(wú)論研究的具體問(wèn)題是什么（我們研究的是 asset pricing，而別人也可以研究經(jīng)濟(jì)學(xué)或金融學(xué)中其他的問(wèn)題），不管 f 到底長(zhǎng)什么樣子或數(shù)據(jù) x_t 和參數(shù) b 向量都是什么，上面的 sample moment 實(shí)際上只是 f(x_t, b) 在樣本內(nèi)取平均，因此也是一種?sample mean！從 sample moments 出發(fā)就可以進(jìn)行參數(shù)估計(jì)。來(lái)自總體的 moment conditions 要求 E[f(x_t, b)] = 0；使用樣本數(shù)據(jù)，GMM estimator 的核心是找到 b 的估計(jì) —— 記為 \hat b —— 使得所有 sample moments 都盡可能的等于零：

上式中之所以用了約等于而非等于，是因?yàn)?strong style="box-sizing: border-box;">在實(shí)際問(wèn)題中，sample moments 的個(gè)數(shù)往往超過(guò)參數(shù)的個(gè)數(shù)（這也被稱(chēng)為 overidentification）。假設(shè)一共有 n 個(gè) moments（即 g_T 是 n × 1 階 vector），p 個(gè)參數(shù)（即 b 是 p × 1 階 vector）。當(dāng) n > p 時(shí)，我們無(wú)法讓所有的 sample moments 都等于零，而是選擇讓這其中的 p 個(gè) sample moments 或者這些?sample moments 的 p 個(gè)線(xiàn)性組合等于 0。這就是 GMM estimator：

上式中，a 是?p × n 階矩陣，每一行都代表一個(gè) sample moments 的線(xiàn)性組合。在具體問(wèn)題中，根據(jù) g_T 的具體形式，上式可能有解析解或數(shù)值解。求解上式就可以獲得 \hat b。不過(guò)有的小伙伴可能會(huì)說(shuō)：等一下，你還沒(méi)說(shuō)矩條件的線(xiàn)性組合矩陣 a 是什么！不同的 a 顯然會(huì)得到不同的參數(shù)估計(jì)。沒(méi)錯(cuò)，在 GMM 的框架下，我們可以自由選擇 a。然而，純從計(jì)量學(xué)的角度，有一個(gè)特殊的矩陣 a 會(huì)讓 GMM estimator 成為 efficient estimator。下文第 3.3 節(jié)和第 5 節(jié)將會(huì)就?efficiency 進(jìn)行說(shuō)明。

為了加深理解，仍然用 asset pricing 來(lái)舉例子。假設(shè) consumption-based CAPM（CCAPM）是真正的模型，因此隨機(jī)折現(xiàn)因子 m 由兩個(gè)參數(shù) β 和 γ 決定（CCAPM 的介紹請(qǐng)見(jiàn)《理解資產(chǎn)價(jià)格》），即 b = [β,?γ]'；進(jìn)一步假設(shè)我們有四個(gè)資產(chǎn)來(lái)檢驗(yàn) CCAPM，它們是 risk-free、市場(chǎng)組合以及 Fama and French (1993) 中的 HML 和 SMB。在這個(gè)例子中，n = 4 而 p = 2，因此 a 是一個(gè) 2 × 4 階矩陣，而 GMM estimator 可以寫(xiě)成：

根據(jù)上式就可以使用 sample moments 求出參數(shù)估計(jì) \hat b。

3.3 GMM 第三部分

使用 GMM estimator 得到的 \hat b 僅僅是真實(shí)但未知參數(shù) b_0 的一個(gè)估計(jì)。從統(tǒng)計(jì)學(xué)的角度，我們自然關(guān)心估計(jì)的誤差，即 var(\hat b)。馬上來(lái)回答上面遺留的矩陣 a 的選擇的問(wèn)題。對(duì)于給定的 moments g_T，從計(jì)量學(xué)的角度有一個(gè)特殊的矩陣 a 使得 var(\hat b) 最小，這就是 efficient 的含義。Hansen (1982) 給出了這個(gè) a 的形式。關(guān)于 a 的進(jìn)一步討論將放在本文第五節(jié)。

Var(\hat b) 的大小僅僅告訴我們參數(shù)估計(jì)是否準(zhǔn)確，而對(duì)于研究的問(wèn)題來(lái)說(shuō)，我們更加關(guān)注的是當(dāng)給定 \hat b 時(shí)，sample moments 的 variance?var(g_T(\hat b)) 的大小。在一般的 overidentification 問(wèn)題下（moments 個(gè)數(shù)多于參數(shù)個(gè)數(shù)），sample moments 不可能都是零（如果 moments 個(gè)數(shù) n 等于參數(shù)個(gè)數(shù) p，我們可以令每個(gè) moment 都等于零從而求出全部 p 個(gè)參數(shù)），因此我們關(guān)心 sample moments 聯(lián)合起來(lái)相對(duì)于零的偏離的大小是多少。

我們必須搞清楚 g_T(\hat b) 聯(lián)合起來(lái)相對(duì)于零的偏離是因?yàn)檫\(yùn)氣成分還是因?yàn)檫x擇的 population moment condition 就是錯(cuò)的。如果僅僅因?yàn)檫\(yùn)氣（即偏離的很?。强梢越邮?population moment conditions —— 比如接受一個(gè)選擇的 asset pricing 模型；如果不是因?yàn)檫\(yùn)氣（即偏離很大），那就只能拒絕 population moment conditions —— 即 reject 一個(gè) asset pricing 模型。這就是 statistical test。唯有有了 var(g_T(\hat b))，才能夠進(jìn)行 statistical test。計(jì)算 sample moments 的 variance 并進(jìn)行 statistical test 就是 GMM 的第三部分。

值得一提的是，由于 \hat b 和 g_T(\hat b) 都是向量，因此 var(\hat b) 和 var(g_T(\hat b)) 事實(shí)上都代表了它們各自的 variance-covariance matrix，其中 var(\hat b) 是 p × p 階矩陣（共有 p 個(gè)參數(shù)），而 var(g_T(\hat b)) 是 n × n 階矩陣（共有 n 個(gè) moments）。有了 var(\hat b) 和 var(g_T(\hat b)) 就可以寫(xiě)出 \hat b 和 g_T(\hat b) 的分布。當(dāng) sample size T 趨于無(wú)窮時(shí)，\hat b 的滿(mǎn)足以下漸進(jìn)正態(tài)性：

上式中，-1 表示求逆，’ 表示轉(zhuǎn)置，所以 (ad)^{-1}’ 表示先求 ad 的逆矩陣再轉(zhuǎn)置。這個(gè)式子正是 Hansen (1982) 中的 Theorem 3.1。Hansen (1982) 給出了漸進(jìn)分布成立需要滿(mǎn)足的一系列假設(shè)。在實(shí)際應(yīng)用中，我們需要記住的是數(shù)據(jù) x_t 需要滿(mǎn)足弱平穩(wěn)性，這是因?yàn)?GMM 的基礎(chǔ)是隨著 T 的增大，sample mean 向 population mean 收斂。

此外，g_T(\hat b) 滿(mǎn)足如下漸進(jìn)正態(tài)性：

上式中，I 是 n × n 階單位陣。這個(gè)式子正是 Hansen (1982) 中的 Lemma 4.1。

看到這里，你大概在想：What the hell?! 這又 a 又 d 又 S 又求逆又轉(zhuǎn)置，這都是什么“牛鬼蛇神”？有一種“每個(gè)字都認(rèn)識(shí)、但是放在一起就看不懂了”的既視感。這里的 a 就是上面 sample moments 的線(xiàn)性組合矩陣，但是 d 和 S 還沒(méi)有介紹。別著急，第四節(jié)將會(huì)把這些式子掰開(kāi)了、揉碎了說(shuō)清楚的。

看到 S 你是否想到什么？沒(méi)錯(cuò)，本文第二節(jié)講 the variance of the sample mean 的時(shí)候提到了 S。而上面 var(\hat b) 和 var(g_T(\hat b)) 看似無(wú)比復(fù)雜，但它們的本質(zhì)也都離不開(kāi) the variance of the sample mean！在有了 g_T(\hat b) 的分布后，就可以對(duì) GMM 第一部分中選擇的模型進(jìn)行檢驗(yàn)，從而決定是接受還是拒絕它。以 asset pricing 為例，這些 moments 代表了給定定價(jià)模型下不同資產(chǎn)或投資組合的 pricing errors。我們關(guān)心 pricing errors 是否聯(lián)合起來(lái)顯著不為零，這時(shí)可以用 g_T(\hat b) 的分布構(gòu)建 chi-squared statistic 來(lái)檢驗(yàn)。如果 test statistic 超過(guò)給定顯著性水平的閾值，那么我們就可以拒絕該 asset pricing 模型。

總結(jié)一下，本小節(jié)介紹了 GMM 的三部分：

第一部分是把關(guān)心的問(wèn)題表述成一組 population moment conditions；

第二部分是用 sample moments 代替 population moments 從而把樣本數(shù)據(jù)和模型聯(lián)系起來(lái)，并進(jìn)行參數(shù)估計(jì)；

第三部分是計(jì)算 var(\hat b) 和 var(g_T(\hat b))，從而進(jìn)行 statistical test，決定是否接受第一部分中的模型。

下一節(jié)就來(lái)看看 statistical test 背后的數(shù)學(xué)基礎(chǔ)。

4?數(shù)學(xué)基礎(chǔ)

Let's do the math!

本節(jié)的目標(biāo)是解釋 var(\hat b) 和 var(g_T(\hat b)) 里面的那些 a、d、S、求逆以及轉(zhuǎn)置。我會(huì)力爭(zhēng)把所有涉及到的公式都講清楚。了解本節(jié)的內(nèi)容無(wú)疑會(huì)更好的理解 GMM 背后的數(shù)學(xué)之美（汗），但是從閱讀的角度，跳過(guò)本小節(jié)也不影響對(duì)后文的理解。先說(shuō) S，這是一切的核心。從下式出發(fā)來(lái)解釋 S：

上式中第一個(gè)等價(jià)符號(hào)是 g_T 的定義（參考 3.2 節(jié)），第二個(gè)等號(hào)是使用 U_t 來(lái)代表 f(x_t, b_0)。需要強(qiáng)調(diào)的是，上式中 g_T 的參數(shù)是真實(shí)（但未知）的參數(shù) b_0。而 g_T(b_0) 的方差 var(g_T(b_0)) 就表示 sample moments g_T 在真實(shí)參數(shù) b_0 下的 sampling variance。無(wú)論 f 長(zhǎng)什么樣子，sample moments 的數(shù)學(xué)形式都僅僅取平均，因此 var(g_T(b_0)) 正是 the variance of the sample mean！（這就是本文第二節(jié)的價(jià)值所在。）上面之所以用了 U_t，一是為了簡(jiǎn)化表達(dá)式，二是為了和本文第二節(jié)中的小寫(xiě) u_t 呼應(yīng)起來(lái)：這里的 U_t 對(duì)應(yīng)第二節(jié)的 u_t、g_T(b_0) 就是第二節(jié)的 \bar u，因此馬上得到（當(dāng) T 趨于無(wú)窮）：

這正是 S 的定義（實(shí)際中，它可以用樣本數(shù)據(jù)來(lái)估計(jì)）。上面的計(jì)算中之所以能把方差和協(xié)方差寫(xiě)成 E[XY] 的形式是因?yàn)槲覀兗僭O(shè)真實(shí)模型滿(mǎn)足 E[f(x_t, b_0)] = E[U_t] = 0。（預(yù)期符號(hào) E 沒(méi)有下標(biāo) T，表示 population expectation。）重要的事情說(shuō)三遍：

上面求的 var(g_T(b_0)) 是 g_T 在真實(shí)參數(shù) b_0、而非估計(jì)量 \hat b 下的 variance。

上面求的 Var(g_T(b_0)) 是 g_T 在真實(shí)參數(shù) b_0、而非估計(jì)量 \hat b 下的 variance。

當(dāng)然，我們最終關(guān)心的是當(dāng) b = \hat b 時(shí) g_T 的方差，即 var(g_T(\hat b))。然而，一旦有了 var(g_T(b_0)) = S/T，計(jì)算 var(\hat b) 以及 var(g_T(\hat b)) 就變得迎刃而解。這就是為什么 Cochrane 教授說(shuō)一切都可以歸結(jié)為計(jì)算 the variance of the sample mean。接下來(lái)就看看 var(\hat b) 如何計(jì)算。由 GMM estimator 可知，ag_T(\hat b) = 0。將該式在真實(shí)參數(shù) b_0 進(jìn)行一階泰勒展開(kāi)有：

細(xì)心的小伙伴可能注意到了一階偏導(dǎo)數(shù) ?g_T/?b’ 的分母中 b 右上角有個(gè)十分詭異的轉(zhuǎn)置符號(hào)。在計(jì)算偏導(dǎo)數(shù)時(shí)，g_T 是一個(gè) n × 1 階向量（n 個(gè) moments），而 b 是一個(gè) p × 1 階向量（p 個(gè)參數(shù)），因此偏導(dǎo)數(shù)其實(shí)是一個(gè)矩陣（要么 n × p 階、要么 p × n 階），而這類(lèi)運(yùn)算屬于 matrix calculus。當(dāng)轉(zhuǎn)置符號(hào)出現(xiàn)在分母時(shí)，得到的矩陣是 n × p 階，即每一行代表一個(gè) moment，這種排列方式稱(chēng)作 numerator layout，也稱(chēng)作 Jacobian formulation。而這個(gè)一階偏導(dǎo)數(shù)矩陣也正是我們的 d：

嚴(yán)格來(lái)說(shuō)，d 應(yīng)該由 population moments 的一階導(dǎo)數(shù)計(jì)算（上面的第一個(gè)等價(jià)條件）；但在應(yīng)用中，d 的取值用 sample moments 和 b = \hat b 來(lái)估計(jì)（上面的第二的等式）。用 d 替換??g_T/?b’?并代入上面的泰勒展開(kāi)，進(jìn)行簡(jiǎn)單的代數(shù)運(yùn)算可得：

上式兩邊直接求 variance 就得到 var(\hat b)。值得一提的是，上式右側(cè)的 (ad)^{-1}a 是系數(shù)矩陣而 g_T(b_0) 的 variance 我們之前已經(jīng)求出來(lái)了 —— 沒(méi)錯(cuò)正是 S/T。因此有：

數(shù)學(xué)上雖然通過(guò)泰勒展開(kāi)順理成章的從 var(g_T(b_0)) 得到了 var(\hat b - b_0)，但我們?nèi)匀幌Ｍ麖闹庇X(jué)上了解上面一頓操作猛如虎到底干了什么?？紤]最簡(jiǎn)單的情況，即一個(gè) moment 和一個(gè)參數(shù)（因此 a 是一個(gè)標(biāo)量，令 a = 1），我們可以畫(huà)出 var(g_T(b_0)) 和 var(\hat b - b_0) 的關(guān)系。

圖中，灰色曲線(xiàn)表示不同參數(shù) b 時(shí)的 population moment，用 g(b) 表示。對(duì)于真實(shí)參數(shù) b_0，由假設(shè)有 g(b_0) = E[f(x_t, b_0)] = 0，因此在圖上，灰色曲線(xiàn)經(jīng)過(guò) (b_0, 0) 這個(gè)點(diǎn)；藍(lán)色曲線(xiàn)表示不同參數(shù) b 時(shí)的 sample moment，用 g_T(b) 表示。圖中 g_T(b_0) 和 g(b_0) = 0 之間的距離就是 g_T(b_0) 的 sampling variation，即我們的樣本可能由于 luck 或者 unluck，以至于 g_T(b_0) ≠ 0 而是較 0 有一定的偏離，在統(tǒng)計(jì)上它就是 var(g_T(b_0))。

接下來(lái)，對(duì)于 sample moment g_T，我們令其等于 0 求出的參數(shù)估計(jì)為 \hat b，因此藍(lán)色曲線(xiàn) g_T 經(jīng)過(guò) (\hat b, 0) 這個(gè)點(diǎn)。下面在藍(lán)線(xiàn)上的 \hat b 點(diǎn)計(jì)算其切線(xiàn)（紅色）并計(jì)算切線(xiàn)的斜率 d = dg/db。通過(guò) d 我們就可以把 g_T(b_0) 和 g(b_0) = 0 之間的 sampling variation 轉(zhuǎn)換成 \hat b 和 b_0 之間的 sampling variation，即 var(\hat b – b_0)。這正是 var(g_T(b_0)) 和 var(\hat b - b_0) 關(guān)系的幾何含義。

下面我們?nèi)绶ㄅ谥?，利用一階泰勒展開(kāi)從 var(g_T(b_0)) 求解 var(g_T(\hat b))：

由于 \hat b – b_0 已經(jīng)在之前求出了，因此只需把它代入到上式就可得到：

兩邊同時(shí)求 variance（確切的說(shuō)是 variance-covariance matrix）有：

上式中的第二個(gè)等式用到了我們的老朋友：var(g_T(b_0)) = S/T —— variance of sample mean！關(guān)于 var(g_T(\hat b)) 和 var(g_T(b_0)) 的關(guān)系也可以從直覺(jué)上解釋兩句。不難看出，var(g_T(\hat b)) 是 var(g_T(b_0)) 乘以一個(gè)系數(shù)矩陣，這個(gè)系數(shù)矩陣是單位陣 I 減去這一大坨 d(ad)^{-1}a。因此從直覺(jué)上說(shuō)，g_T 在 b = \hat b 時(shí)的方差 var(g_T(\hat b)) 會(huì)比 g_T 在 b = b_0 時(shí)的方差 var(g_T(b_0)) 要小一些。這是因?yàn)樵?GMM 估計(jì)時(shí)，我們要求 g_T 的 p 個(gè)線(xiàn)性組合等于零 —— ag_T(\hat b) = 0 —— 從而求出 \hat b，因此求解 \hat b 的過(guò)程用掉了 sample moments 的一些 variation，所以當(dāng)?b = \hat b 時(shí) g_T 的方差小于當(dāng) b = b_0 時(shí) g_T 的方差。

無(wú)論是 var(\hat b) 還是 var(g_T(\hat b))，上面一頓泰勒展開(kāi)操作雖然非常熱鬧，但它們其實(shí)都僅是用了統(tǒng)計(jì)學(xué)中的 delta method。所以，其實(shí)我們只是用了 variance of the sample mean（S/T）+ delta method 就求出了我們關(guān)心的 var(\hat b) 和 var(g_T(\hat b))。就是這么簡(jiǎn)單。有了 var(g_T(\hat b))，就可以得到 g_T(\hat b) 的漸近分布（3.3 節(jié)介紹過(guò)），使用它的分布就可以構(gòu)建 chi-squared statistic 來(lái)對(duì)模型進(jìn)行檢驗(yàn)：

上式的第二步是把 var(g_T(\hat b)) 的表達(dá)式代入并求逆；chi-squared statistic 的自由度是 moments 的個(gè)數(shù)減去參數(shù)的個(gè)數(shù)，即 n – p。由于估計(jì) \hat b 的時(shí)候用掉了 p 個(gè)自由度，所以 g_T(\hat b) 的 variance-covariance matrix 不是滿(mǎn)秩的（這也體現(xiàn)在了 chi-squared statistic 的自由度 n – p 上），因此上式中對(duì) var(g_T(\hat b)) 求逆實(shí)際上是 pseudo-inverse。

如果你在 Wikipedia 或者其他書(shū)籍上查閱 GMM 的資料，也許看到的 chi-squared statistic 的表達(dá)式遠(yuǎn)沒(méi)有上面這個(gè)復(fù)雜。上述表達(dá)式是最 general 的情況，因?yàn)槲覀兩形从懻撃莻€(gè)使 GMM estimator 變得 efficient 的特殊的矩陣 a。在那個(gè) a 下，var(g_T(\hat b)) 矩陣以及 chi-squared statistic 表達(dá)式將被大大的簡(jiǎn)化。Efficient GMM 就是下一節(jié)的內(nèi)容。

總結(jié)一下本小節(jié)。上面用了大量的文字和推導(dǎo)把 var(\hat b) 和 var(g_T(\hat b)) 背后的數(shù)學(xué)含義呈現(xiàn)給各位，是希望這個(gè)過(guò)程能幫助小伙伴們加深對(duì) GMM 的理解。站在 notation 的角度來(lái)說(shuō)，雖然這些公式看上去很復(fù)雜（又是轉(zhuǎn)置、又是求逆的），但我們只需給 GMM 框架提供它需要的 a、g_T、d 和 S，剩下的“無(wú)腦”交給 GMM 就可以計(jì)算出各種想要的統(tǒng)計(jì)量并進(jìn)行 test，非常方便。

5?Efficient GMM

本文的 3.2 小節(jié)給出的 GMM estimator 如下：

其中 a 是一個(gè) p × n 階矩陣，每一行都代表一個(gè) sample moments 的線(xiàn)性組合。本節(jié)關(guān)心的問(wèn)題是，如何選取矩陣 a？回答這個(gè)問(wèn)題可以從業(yè)務(wù)上和統(tǒng)計(jì)上兩方面思考 —— 永遠(yuǎn)不要忘記業(yè)務(wù)層面的思考！從經(jīng)濟(jì)學(xué)或金融學(xué)原理出發(fā)，尤其是針對(duì) asset pricing 的問(wèn)題，我們可以選擇一些最 economically important 的 moments，讓它們或它們的線(xiàn)性組合等于零。我們不應(yīng)讓 GMM 成為一個(gè) statistical 黑箱，代替我們的思考。第七節(jié)將會(huì)進(jìn)一步說(shuō)明。

再來(lái)從統(tǒng)計(jì)上說(shuō)，Hansen (1982) 指出了一個(gè)特殊的 a 矩陣，它能確保得到 efficient GMM estimator，即在給定的 moments g_T 下，該矩陣 a 使得 var(\hat b) 最小。這個(gè)特殊的 a 矩陣為：

看到這兒可能又有小伙伴會(huì)問(wèn)：d 見(jiàn)過(guò)、S 見(jiàn)過(guò)、轉(zhuǎn)置明白、求逆矩陣清楚，但是這四個(gè)符號(hào)組合在一起得到的 d'S^{-1} 是個(gè)什么鬼？？這個(gè) a 到底有沒(méi)有什么更直觀的含義？別急，先來(lái)看看 a 的階數(shù)。本文的 3.2 節(jié)已經(jīng)指出 a 是一個(gè) p × n 階矩陣，下面我們來(lái)驗(yàn)證一下。

前面首次提到 d 的時(shí)候說(shuō)過(guò)了，它是一階偏導(dǎo)數(shù) ?g_T/?b'。但由于 g_T（n × 1 階）和 b（p × 1 階）都是 vectors，因此 d 是一個(gè)遵照 numerator layout（也稱(chēng)作 Jacobian formulation）排列的 n × p 階矩陣。因此矩陣 d 的轉(zhuǎn)置 d’ 就是 p × n 的矩陣，它同樣也是一個(gè)一階偏導(dǎo)數(shù) ?g_T'/?b —— 這次轉(zhuǎn)置在 g_T 上，遵循的是 denominator layout（也稱(chēng) Hessian formulation），通常表示求梯度（gradient）。最后，由于 S 是 n × n 階，因此 a 確實(shí)是 p × n 階。

下面我們就來(lái)看看 d'S^{-1} 到底是個(gè)什么鬼。其實(shí)它有著非常清晰的含義。為了解釋 a 就不得不提 GMM estimator 的另一種表達(dá)式，這可能也是之前接觸過(guò) GMM 的小伙伴更熟悉的一種表達(dá)式：

上式中 W 是權(quán)重矩陣（weighting matrix），它是一個(gè)半正定矩陣。這個(gè)式子的含義是，在 overidentification 問(wèn)題中，既然我們無(wú)法讓所有的 g_T 都等于零，那么就讓所有 n 個(gè) g_T 的范數(shù)的加權(quán)之和盡可能的接近零，以此來(lái)確定 \hat b。正如在本文的第一種 GMM estimator 表達(dá)中我們可以隨意選擇矩陣 a 一樣，在上面的第二種 GMM estimator 表達(dá)中我們可以隨意選擇權(quán)重矩陣 W。但是從 efficiency 的角度，最優(yōu)的權(quán)重矩陣 W 滿(mǎn)足：

這從統(tǒng)計(jì)上非常好理解：我們有一組 moments g_T，我們希望它們（非負(fù)）加權(quán)之和最接近零。使用 W = S^{-1} 即 S 的逆矩陣（別忘了 S/T 是 var(g_T(b_0))）相當(dāng)于給那些 sampling variation 大的 g_T 更低的權(quán)重、給那些 sampling variation 小的 g_T 更高的權(quán)重（inverse 的意義）。換句話(huà)說(shuō)，我們更愿意相信那些誤差小的 moments 并使用它們來(lái)得到盡可能準(zhǔn)確的參數(shù)估計(jì) \hat b，從而使 var(\hat b) 最低，這也就是 efficient 的含義。將 W = S^{-1} 代入上面第二個(gè) GMM estimator 并求其 first order condition 有：

怎么樣，看著眼熟不？括號(hào)里的第一項(xiàng)正是 d 的轉(zhuǎn)置 d'，第二項(xiàng)是 S^{-1}，這兩個(gè)放一起 d'S^{-1} 正是第一種 GMM estimator 下最優(yōu)的矩陣 a = d'S^{-1}：

這就是最優(yōu)矩陣 a = d'S^{-1} 的含義。從上面的推導(dǎo)也不難看出這兩種 GMM estimator 表達(dá)式是等價(jià)的：無(wú)論我們?nèi)『畏N W 權(quán)重矩陣，都有一個(gè)與之對(duì)應(yīng)的 a = d'W 矩陣。當(dāng)矩陣 a 或權(quán)重矩陣 W 取統(tǒng)計(jì)上最優(yōu)時(shí)，var(\hat b)、var(g_T(\hat b)) 以及 chi-squared test statistic 的表達(dá)式均可以大大化簡(jiǎn)。Hansen (1982) 給出了它們的形式：

需要強(qiáng)調(diào)的是，以上的這些大大簡(jiǎn)化了的表達(dá)式只有當(dāng) a = d'S^{-1}（或 W = S^{-1}）時(shí)才成立！如果 a 或 W 取別的值，則應(yīng)該使用本文第 4 節(jié)中介紹的更 general 的形式。很多關(guān)于 GMM 的材料中默認(rèn) W = S^{-1} 而給出了這些統(tǒng)計(jì)量的簡(jiǎn)化形式，使用時(shí)應(yīng)搞清楚前提條件。在實(shí)際估計(jì)中，因?yàn)楸仨毾扔?\hat b 才能估計(jì) S，并計(jì)算 W = S^{-1}（或最優(yōu)的 a）；但另一方面只有使用 S^{-1} 才能得到最優(yōu)的 \hat b。這似乎是一個(gè)雞生蛋、蛋生雞的問(wèn)題。因此，實(shí)際中往往采用 two-stage estimates：

First Stage：通常取 W = I 單位陣，估計(jì)出 \hat b；

Second Stage：使用 \hat b 估計(jì) S，令 W = S^{-1} 進(jìn)行再一次估計(jì)得到新的 \hat b。

當(dāng)然，如果愿意，也可以把上面的第二步迭代多次，得到最終的 \hat b。以上就完成了關(guān)于 GMM 的全部介紹。

6?GMM does OLS

GMM 之所以如此強(qiáng)大，是因?yàn)樗詭У摹癳stimate、variance、test”三部曲能夠干很多事兒！對(duì)于很多需要研究的問(wèn)題，只要把它的模型塞進(jìn) GMM 的框架，就可以得到想要的分析結(jié)果。本節(jié)就把我們熟悉的 OLS 放在 GMM 的框架下看看后者的強(qiáng)大之處。由于參數(shù)個(gè)數(shù)和 moments 個(gè)數(shù)相同，因此 OLS 不存在 overidentification 的問(wèn)題，我們沒(méi)有什么可以檢驗(yàn)的。但是 GMM 仍然可以輕松的計(jì)算出參數(shù)的 variance（即完成 estimate 和 variance 兩步），無(wú)論 OLS 的殘差是否存在自相關(guān)或異方差。

想要使用 GMM 框架，只需要把 OLS 表述成 moment conditions?？紤] OLS 問(wèn)題（截距被視作一個(gè)解釋變量，不做區(qū)分；假設(shè)一共有 k 個(gè)解釋變量，因此 x_t 表示 k × 1 階向量）如下：

由 OLS 的性質(zhì)可知，其解釋變量和殘差正交，因此 OLS 的 moment conditions 為：

由于 moments 個(gè)數(shù)和參數(shù)個(gè)數(shù)相同，因此我們只需要令所有 sample moments 都等于零即可，這意味著矩陣 a 是單位陣 I，因此在上式的 GMM estimator 中省略了 a。求解上述 sample moment conditions 就可以得到參數(shù)的估計(jì)：

如果令 X = [x_1 x_2 … x_t]' 表示 data matrix，則有 (1/T)X'X = E_T[x_tx_t']，因此上式又可以寫(xiě)成：

這正是我們熟悉的 OLS estimator。GMM 的強(qiáng)大之處在于輕松的計(jì)算 var(\hat β)。為此，我們需要給 GMM 框架提供它所需要的 d 和 S（已經(jīng)有了 a 和 g_T）。根據(jù) d 和 S 的定義可得：

有了 a、g_T、d、S，直接利用 GMM 中的公式就可以求出?var(\hat β)：

這正是廣義 OLS 下 var(\hat β) 的表達(dá)式（請(qǐng)參考《多因子回歸檢驗(yàn)中的 Newey-West 調(diào)整》對(duì)比）。

We are done!

下面考察幾種情況。首先如果殘差滿(mǎn)足 i.i.d.，var(\hat β) 就可以簡(jiǎn)化成我們最熟悉的樣子：

通常來(lái)說(shuō)，殘差中可能存在異方差、自相關(guān)或者兩者皆有。在 GMM 的框架下，為了計(jì)算 var(\hat β) 僅需要在 S 矩陣中考慮異方差和自相關(guān)造成的影響。當(dāng)殘差僅存在異方差時(shí)，S 的表達(dá)式為：

因此 var(\hat β) 的表達(dá)式變成：

這正是大名鼎鼎的 White (1980) heteroscedasticity consistent estimator。當(dāng)殘差即存在異方差又存在自相關(guān)時(shí)，S 可以寫(xiě)作：

而 var(\hat β) 的表達(dá)式變成：

這正是大名鼎鼎的 Newey and West (1987) autocorrelation consistent covariance estimator（見(jiàn)《多因子回歸檢驗(yàn)中的 Newey-West 調(diào)整》）。無(wú)論殘差具有什么特性，整個(gè) OLS 的求解過(guò)程都可以很好的裝到 GMM 的框架中。而當(dāng)使用 GMM 框架時(shí)，只需按照它的要求來(lái)定義 a、g_T、d 以及 S，就可以“無(wú)腦”的利用 GMM 給出的結(jié)果。這正是 GMM 的強(qiáng)大之處。

7?不應(yīng)成為黑箱

在結(jié)束本文之前，再花一小節(jié)討論一個(gè)很重要的問(wèn)題：GMM 不應(yīng)該成為計(jì)量學(xué)黑箱。這是我聽(tīng)完 Cochrane 教授的講解后印象非常深刻的一點(diǎn)。GMM 如此強(qiáng)大再加上現(xiàn)在各種編程語(yǔ)言（R、Stata 等）都能方便的計(jì)算，這種便捷性似乎把人們都慣壞了；人們習(xí)慣于把問(wèn)題描述成 moment conditions 然后一股腦塞進(jìn) GMM 并純從統(tǒng)計(jì)的角度使用 efficient estimator（即 W = S^{-1}）。Cochrane 教授警告說(shuō)這么做十分危險(xiǎn)。

GMM 的強(qiáng)大之處在于它不僅僅是一個(gè)計(jì)量學(xué)工具來(lái)做 test，而是它足夠 flexible 從而可以讓我們研究我們真正關(guān)心的經(jīng)濟(jì)學(xué)或金融學(xué)問(wèn)題，這體現(xiàn)在我們可以從“先驗(yàn)”出發(fā)去定義最適合待研究問(wèn)題的矩陣 a（或權(quán)重矩陣 W），而非無(wú)腦的選擇 W = S^{-1}。

以 3.2 節(jié)中 asset pricing 的例子來(lái)說(shuō)，我們有四個(gè) moments，兩個(gè)參數(shù)。這四個(gè) moments 來(lái)自四個(gè)資產(chǎn)：risk-free、市場(chǎng)組合以及 HML 和 SMB，我們假設(shè)待檢驗(yàn)的模型是 CCAPM。從經(jīng)濟(jì)學(xué)業(yè)務(wù)出發(fā)，我們可以選擇如下的 ag_T(\hat b) = 0：

在這個(gè)矩陣 a 中，我們令市場(chǎng)超額收益和 R_f 完美滿(mǎn)足兩個(gè) sample moment conditions，并由此進(jìn)行 CCAPM 的參數(shù)估計(jì)，求出兩個(gè)參數(shù)，然后使用另外兩個(gè)資產(chǎn) HML 和 SMB 來(lái)檢驗(yàn) CCAPM。由 GMM 框架可知，最終的 chi-squared test statistic 的自由度為 2（因?yàn)橐还?4 個(gè)資產(chǎn)，2 個(gè)被用來(lái)估計(jì)參數(shù)），因此聯(lián)合檢驗(yàn)的實(shí)際上正是 HML 和 SMB 在 CCAPM 這個(gè)定價(jià)模型下的 pricing errors。如果 pricing errors 聯(lián)合顯著不為零，那么就可以拒絕 CCAPM。這個(gè)例子說(shuō)明，從經(jīng)濟(jì)學(xué)原理出發(fā)選擇合適的 a 或 W 能讓我們回答最感興趣的經(jīng)濟(jì)學(xué)問(wèn)題。GMM 的強(qiáng)大之處正在于此。

純從統(tǒng)計(jì)學(xué)的角度來(lái)說(shuō)，W = S^{-1} 確實(shí)能夠得到 efficient GMM。但不要忘記，這個(gè) efficient 的是以給定的 moments 為前提的 —— 如果換了或者添加了更多的 moments，參數(shù)的 efficient 估計(jì)也會(huì)發(fā)生變化。在金融市場(chǎng)中，有無(wú)數(shù)的資產(chǎn)，包括股票、債券、外匯、商品等，還有無(wú)數(shù)的投資組合，這些資產(chǎn)可以構(gòu)成無(wú)數(shù)的 moments。為了?efficiency，我們應(yīng)該把這成千上萬(wàn)資產(chǎn)的 moments 都塞進(jìn) GMM 才能得到 efficient 的估計(jì)。但從業(yè)務(wù)的角度來(lái)說(shuō)這毫無(wú)意義。在研究資產(chǎn)定價(jià)的時(shí)候，我們應(yīng)該使用最“clever”的資產(chǎn)，比如 HML、SMB 這些投資組合。它們才是我們真正關(guān)心的問(wèn)題。

The quest for efficiency doesn't really drive us as much as the quest for something that is robust and that expresses what the model is supposed to do. —— John Cochrane

GMM 非常好使，但在 asset pricing 的研究中，我們不應(yīng)追求使用 GMM 進(jìn)行一個(gè)僅在統(tǒng)計(jì)上正式但模型卻缺乏含義的 statistical test。GMM 的強(qiáng)大在于它讓我們從經(jīng)濟(jì)學(xué)和金融學(xué)原理出發(fā)，去 measure 和 estimate 最合理的模型、并同時(shí)對(duì) sampling error 保持足夠的認(rèn)識(shí)。不要讓 GMM 成為計(jì)量學(xué)的黑箱。

8?結(jié)語(yǔ)

呼！終于寫(xiě)完了！感謝你看到最后！作為感謝，上點(diǎn)硬貨 —— GMM 的 formula sheet（出自 Cochrane 2005）。它總結(jié)了前文解讀的每一個(gè)公式。網(wǎng)上能找到的 Asset Pricing 的電子版還是 2000 年 6 月的版本，有不少 Typo。這張截圖是來(lái)自 2005 年的修訂版。怎么樣？GMM 其實(shí)并不復(fù)雜，我們只需要提供并計(jì)算 a，g_T，d 和 S；有了它們，GMM 框架 takes care of everything else！

最后對(duì)全文簡(jiǎn)要總結(jié)如下：

1. GMM 的框架下包括 model、estimate 以及 test 三部分；它用 sample moments 代替 population moments 來(lái)檢驗(yàn)后者；GMM 涉及的數(shù)學(xué)（不那么嚴(yán)謹(jǐn)?shù)恼f(shuō)）可以歸結(jié)為 the variance of the sample mean + delta method。

2. 從 notation 的角度，我們只需找到 a、g_T、d 和 S，剩下的交給 GMM 的公式；

3. GMM 允許我們自由挑選矩陣 a（或 W）；從統(tǒng)計(jì)學(xué)的角度存在一個(gè)特定的 a（或 W）是最 efficient 的；但 GMM 不應(yīng)被當(dāng)作計(jì)量學(xué)的黑箱，理解你所研究的問(wèn)題永遠(yuǎn)是最重要的。

寫(xiě)完本文，我的感受和寫(xiě)完《股票多因子模型的回歸檢驗(yàn)》是一模一樣的，對(duì) Cochrane 教授崇拜的五體投地。關(guān)于 GMM 的內(nèi)容，Cochrane 教授在其 UChicago 的課程中介紹的非常生動(dòng)、到位，聽(tīng)完再結(jié)合他的書(shū)仔細(xì)體會(huì)，那收獲就一個(gè)字 —— 爽！

最后，我想用和《股票多因子模型的回歸檢驗(yàn)》一文同樣的結(jié)語(yǔ)作為本文的收尾。在介紹 Asset Pricing 這門(mén)課的時(shí)候，Cochrane 教授談到：

The math in real, academic, finance is not actually that hard. Understanding how to use the equations, and see what they really mean about the world... that's hard, and that's what I hope will be uniquely rewarding about this class.

再一次的，我也真心希望本文在你理解 GMM 以及應(yīng)用它研究 asset pricing 的道路上起到一點(diǎn)點(diǎn)幫助。

參考文獻(xiàn)

Cochrane, J. H (2005).?Asset Pricing (revised edition). Princeton University Press.

Fama, E. F. and K. R. French (1993). Common Risk Factors in the Returns on Stocks and Bonds.?Journal of Financial Economics 33(1), 3 – 56.

Hansen, L. P. (1982). Large sample properties of generalized method of moments estimators. Econometrica 50(4), 1029 – 1054.

Newey, W. K. and K. D. West (1987). A simple, positive semi-definite, heteroskedasticity and autocorrelation consistent covariance matrix.?Econometrica 55(3), 703 – 708.

White, H. (1980). A heteroskedasticity-consistent covariance matrix estimator and a direct test for heteroskedasticity.?Econometrica 48(4), 817 – 838.

https://www.zhihu.com/question/41312883/answer/91484566?

免責(zé)聲明：入市有風(fēng)險(xiǎn)，投資需謹(jǐn)慎。在任何情況下，本文的內(nèi)容、信息及數(shù)據(jù)或所表述的意見(jiàn)并不構(gòu)成對(duì)任何人的投資建議。在任何情況下，本文作者及所屬機(jī)構(gòu)不對(duì)任何人因使用本文的任何內(nèi)容所引致的任何損失負(fù)任何責(zé)任。除特別說(shuō)明外，文中圖表均直接或間接來(lái)自于相應(yīng)論文，僅為介紹之用，版權(quán)歸原作者和期刊所有。

亚洲精品国产精品制服丝袜,亚洲欧美日韩精品a∨,97在线热免费视频精品视频,亚洲人成在线观看网站不卡

合格投資者聲明

Generalized Method of Moments