别再迷信“基准回归”了!——一个老法师的Stata风险建模实战指南
别再迷信“基准回归”了!——一个老法师的Stata风险建模实战指南
“基准”?不过是皇帝的新衣
各位,咱们做计量的,最常听到的就是“基准回归”。啥是基准?说白了,就是大家都在用的、看起来最“标准”的模型。但我要问一句:凭什么它就是基准?就因为大家都这么做?
很多时候,所谓的“基准回归”不过是皇帝的新衣。你辛辛苦苦跑出来的结果,可能只是验证了一个早已被无数人验证过的“常识”,毫无新意。更可怕的是,你可能根本没搞清楚这个模型背后的假设和局限性,就盲目地套用。
所以,第一步,就是要打破对“基准”的迷信。问问自己:
- 这个模型真的能回答我的研究问题吗?
- 有没有其他更合适的模型?
- 我能不能对这个“基准”模型进行改进?
内生性:躲不开的幽灵
计量经济学里,内生性就像一个挥之不去的幽灵,总是在你以为万事大吉的时候跳出来吓你一跳。尤其是在金融风险建模中,内生性问题更是无处不在。举个例子,你想研究宏观经济变量对股票收益率的影响,但宏观经济变量本身可能受到股票市场表现的影响,这就产生了内生性。
“基准回归”最容易忽略的就是内生性问题。很多人跑完一个OLS回归,看到几个显著的系数就沾沾自喜,却根本没意识到这些系数可能是有偏的、不一致的。
解决内生性问题,最常用的方法就是工具变量法(IV)。简单来说,就是找到一个只影响内生变量,而不直接影响因变量的变量作为工具。当然,找到一个好的工具变量并不容易,需要扎实的理论基础和敏锐的洞察力。
在Stata中,可以使用ivregress命令进行工具变量回归。例如:
ivregress 2sls y x1 x2 (x3 = z1 z2), robust
这里,y是因变量,x1和x2是外生变量,x3是内生变量,z1和z2是工具变量。robust选项表示使用稳健标准误,可以有效应对异方差问题。
除了工具变量法,还可以考虑使用GMM(广义矩估计)等方法。GMM的优点是可以处理多个内生变量和多个工具变量的情况,但缺点是计算量较大,对样本容量要求较高。
模型诊断:给你的模型做个“体检”
跑完回归,别急着下结论。先给你的模型做个“体检”,看看它有没有什么毛病。
- 异方差检验: 看看残差的方差是否随自变量的变化而变化。如果存在异方差,可以使用
robust选项或者加权最小二乘法(WLS)进行修正。 - 自相关检验: 看看残差之间是否存在相关性。如果存在自相关,可以使用Newey-West标准误或者广义差分法(GLS)进行修正。
- 多重共线性检验: 看看自变量之间是否存在高度相关性。如果存在多重共线性,可以考虑剔除一些自变量或者使用岭回归等方法。
在Stata中,进行这些检验非常方便。例如,可以使用estat hettest命令进行异方差检验,使用estat bgodfrey命令进行自相关检验,使用vif命令计算方差膨胀因子(VIF)来判断多重共线性。
别只盯着“显著性”!
很多人做回归,只关心系数是否显著。但我要告诉你,显著性并不代表一切。一个系数在0.01水平上显著,并不意味着它对因变量有重要的影响。更重要的是效应量的大小和经济意义。
例如,你发现一个宏观经济变量对股票收益率的影响在统计上显著,但效应量非常小,那么这个结果的实际意义可能并不大。相反,一个系数虽然不显著,但效应量很大,那么这个结果可能更值得关注。
此外,还要关注置信区间的宽度。置信区间越窄,估计的精度越高。如果置信区间很宽,即使系数显著,也说明估计结果存在很大的不确定性。
非线性关系和交互效应:让你的模型更“性感”
现实世界往往比线性模型更复杂。自变量和因变量之间可能存在非线性关系,不同自变量之间可能存在交互效应。如果你的模型只考虑了线性关系和独立效应,那么你可能会错过很多重要的信息。
例如,股票收益率可能与市场风险之间存在非线性关系,或者宏观经济变量对不同行业的股票收益率的影响可能存在差异。要捕捉这些复杂的关系,就需要引入非线性项和交互项。
在Stata中,可以使用xi命令方便地生成非线性项和交互项。例如:
xi: reg y x1 x2 i.x1*x2 x1^2
这里,i.x1*x2表示x1和x2的交互项,x1^2表示x1的平方项。
异质性效应:关注不同群体的差异
“一刀切”的模型往往忽略了不同个体或群体之间的差异。例如,不同规模的企业、不同行业的公司,对风险的承受能力可能存在差异。要了解这些差异,就需要分析异质性效应。
可以使用分组回归、分位数回归等方法来分析异质性效应。分组回归就是将样本分成不同的组,然后分别进行回归。分位数回归则可以估计因变量在不同分位数上的条件分布,从而了解自变量对因变量不同水平的影响。
金融风险建模实战:以CAPM为例
说了这么多,我们来一个实战例子。假设我们要构建一个简单的CAPM模型(资本资产定价模型)作为基准,然后在此基础上加入宏观经济变量,以提高风险预测的准确性。
CAPM模型的公式如下:
$E(R_i) = R_f + \beta_i (E(R_m) - R_f)$
其中,$E(R_i)$是资产$i$的期望收益率,$R_f$是无风险利率,$E(R_m)$是市场组合的期望收益率,$\beta_i$是资产$i$的贝塔系数,表示资产$i$对市场风险的敏感程度。
在Stata中,可以使用以下代码估计CAPM模型:
reg ri rf beta
这里,ri是资产$i$的收益率,rf是无风险利率,beta是贝塔系数。
接下来,我们可以在CAPM模型的基础上加入宏观经济变量,例如GDP增长率、通货膨胀率等。例如:
reg ri rf beta gdp inflation
这里,gdp是GDP增长率,inflation是通货膨胀率。
加入宏观经济变量后,我们可以比较模型的预测能力是否有所提高。可以使用R平方、调整后的R平方等指标来衡量模型的拟合优度。还可以使用信息准则(例如AIC、BIC)来比较不同模型的复杂度。
当然,仅仅比较拟合优度是不够的。更重要的是进行模型验证,看看模型在预测未来风险方面的表现如何。可以使用回溯检验、滚动窗口检验等方法进行模型验证。
别忘了敏感性分析!
最后,也是最重要的一点,就是进行敏感性分析。看看你的结果对不同的模型设定、不同的变量定义、不同的样本选择标准是否敏感。
例如,你可以尝试使用不同的宏观经济变量、不同的滞后阶数、不同的样本期间,看看结果是否发生变化。如果结果对这些因素非常敏感,那么说明你的模型可能不够稳健。
总结:没有万能的“基准”,只有不断探索的精神
“基准回归”只是一个起点,而不是终点。不要迷信“标准答案”,要勇于探索、不断创新,才能找到真正适合你研究问题的模型。记住,计量经济学不是一门“套公式”的学科,而是一门需要思考、需要判断的艺术。
希望这篇文章能帮助你跳出思维定势,写出更有价值的实证分析论文。记住,永远保持批判性思维,永远不要停止探索!
行业分类词: Finance / Modeling