到目前为止,人工智能和机器学习方法的采用率(AI/ML)在整个经济学专业中都非常不平衡。这些方法的吸收已大量集中在微观经济学上,在这些方法中,数据收集的爆炸量,尤其是在个体消费者(认为像亚马逊这样的公司)的水平上,使AI/ML的好处尤其清晰,并且可能这些模型需要这些模型需要大量数据有用。
然而,将AI的工具应用于宏观经济学的前景是什么?那些着眼于整个地区,国家甚至地球之类的大事的经济学分支?宏观经济学家使用的传统统计工具与基于AI/ML的方法之间有什么区别?它比现实更炒作,特别是考虑到宏观经济学不适合与微观经济学相同的数据生产数据 - 毕竟,世界上没有像亚马逊拥有数百万消费者那样拥有数百万个国家
将人工智能工具应用于宏观经济学的前景是什么?那些着眼于整个地区,国家甚至全球等大事的经济学分支?
这个思想作品是三个将通过我回答其中一些问题的猜测来引导读者(无论是否经济学家)中的第一个。这篇文章将列出我所看到的,在我自己作为公共和私营部门的公司经济学家以及他人的写作的经验的指导下,这是传统的宏观经济预测与迄今为止AI所提供的关键区别/ML型方法。
传统计量经济学如何工作 - 宏观经济学的一个例子
对于第一篇文章,让我们考虑一个现实世界中的问题,一种宏观经济学家可能会遇到并将常规计量经济学方法与基于一般机器学习的解决方案进行比较。
我们所有人都对哪种事物导致我们的本地或国民经济发展有一些想法。关于经济增长驱动因素的不同观念影响了整个选举,在某些情况下,会影响更多。例如,是什么解释了为什么在1950 - 73年期间,美国的平均GDP增长率为2.3%,但随后放慢到平均水平低于2.0%的平均水平?或者为什么过去40年中,中国平均每年增长近10%?或在高频方面,明年甚至在接下来的三个月内向您的C套房管理层或股东会议报告的经济增长将是什么?
作为一门社会科学,宏观经济学家开发了许多理论和模型来解释和预测经济增长。我们都可以想到很多推动经济增长的事情。诸如政府或消费者花费的量之类的事情,这两者都与利率有很大关系,或者更难衡量诸如正面或负面市场和消费者情绪之类的事情。但是我们也知道,无数的其他事情包括通货膨胀,贸易动态(包括汇率),进口商品的价格(例如石油)以及一系列影响上述所有政策的各种政策以及更多的政策。Durlauf,Johnson,Temple(2005)的文献评论发现,发表论文的增长回归中包含多达145个不同的变量!
Durlauf,Johnson,Temple(2005)的文献评论发现了发表论文的增长回归中包含多达145个不同的变量
解释变量的数量太大了,因为已经开发了数百种理论来解释经济增长。在应用计量经济学中,主要目标通常是进行练习,例如评估改变一个协变量的影响,同时保持其他协变量的影响。这种解释的愿望 - 既可以推动经济学和指导决策者的理论建设 - 都是传统计量经济学方法的主要目标。
AI/ML的计量经济学方法有何不同 - 另一个查看宏观经济学的示例
另一方面,AI/ML方法更关注预测,而不是解释,并且可以更好地解决它。在大多数情况下,传统的计量经济学模型在预测方面并不那么出色。特别是,当(1)(1)您有很多预测变量时(或相对于观测值的数量,或者很多预测变量)时,基于旧的普通最小二乘(OLS)方法的模型难以做出良好的预测;(2)许多预测变量彼此相关(截然性);(3)您有很多无关的预测变量;或(4)在本质上生成数据的方式是非线性的。基于我们对上述GDP增长建模的示例,听起来是否熟悉?
相比之下,基于AI/ML方法的模型是预测的引擎。如Mullainathan等。(2017)总而言之,AI/ML的成功是:“发现未提前指定的复杂结构。”?首先,AI/ML模型通常没有问题来处理许多预测变量(和很多)之间的复杂和非线性关系。这样做的原因是,这些方法在通过称为正则化和交叉验证的程序之间管理偏见和差异之间的权衡方面要好得多。好的,那里有很多嗡嗡声。首先,让我们开始讨论偏见和差异的含义,因为这非常重要。
让我们回到上面讨论的经济增长模式。假设我们想有效地消除模型的复杂性,并仅使用一个单个预测变量;也许我们只是利用上一年的GDP增长来预测今年的增长。当然,这样的简单模型将不是很好地进行预测,并且会有很大的预测错误。这些错误源于偏见,因为它依赖于错误的假设,即未来的经济增长仅取决于上一年(或季度,月份等)的增长率。Hall(2018)的下图很好地说明了这是如何工作的。
图1.偏差与差异引起的预测错误
中心的水点表示正确的预测,而蓝点显示了四种不同情况的模型预测:高方差或低方差和高偏置的组合。一个简单的模型,例如我们刚刚讨论过的模型,将在该图表的右上角(图1中的高偏差 - 低差异)中的预测错误,因为一般而言,简单模型表现出很高的偏见,因为它们是因为它们在这种情况下,不要捕捉推动经济增长推动经济增长的细微差别。但是,为了换取这种偏见,模型的预测往往具有较低的差异,这意味着它们对数据中的噪声更强大。毕竟,与30个预测变量相比,您将在一个只有一个预测变量的模型中产生多少噪声?模型产生的预测源于偏见,通常是由偏差“不足”数据的。这样的模型不会很好地预测,但是随着时间的流逝,它会非常稳定。
对比是具有源于方差的误差的模型。现在,想象一个模型,而不是仅具有一个预测变量的模型,而是想象一个具有50个预测变量的模型,例如,可以说明一个年度GDP增长时间序列,该序列可能仅运行40年。与我们的预测模型相比,该模型可能更好地反映了推动经济增长的原因,因为它更复杂或“现实”。但是,该模型很有可能“过度合适”,因为它已经学到了一组非常特定的变量集,这些变量对于解释过去的GDP增长很有用,但它可能不足以解释将来的增长(图1中的偏差高差异。考虑到大量变量,将来这些变量的变化很可能会产生较差的预测性能。
偏见与预测差异之间的关系最好将其视为一种权衡,因为通常不可能同时减少同时减少(Bolbuis and Rayner2020。James等,2013),而AI/ML方法是为了管理这一点而建立的更有效地权衡。与传统计量经济学相比,在AI/ML方法中使用的两个过程对此进行了折衷。在我的下一篇文章中,我们将在更具体类型的AI/ML模型的背景下进行更多讨论,但简而言之,它们包括:
交叉验证是通过将数据设置分成多个子组('folds')并在对其他一些子组(“训练折叠”)上训练模型来搜索最佳预测指标的过程(“折叠”)“测试折叠”)。因此,假设您拥有20年的GDP增长数据,您可以将该时期分为不同的折叠(不同年份组合),并应用您的模型(或各种型号),然后在未包括的时间段内进行测试在测试中。这与整个数据集上的模型运行的大部分计量经济学形成鲜明对比。传统方法在测试因果理论方面具有一些优势,但对于预测,不如趋势“过度拟合”该模型。
正则化是一种允许建模者构建相对复杂模型的方法,同时减少过度拟合的机会,从而成功预测。有很多方法可以这样做,我将在下一篇文章中讨论,但一个人直接惩罚了一个模型以使数据过度拟合。这种惩罚可以是通过限制模型中的变量数量或任何给定变量对模型的预测(即模型系数的幅度)的程度。除了降低过度拟合的风险外,正则化还提供了另外有希望的贡献:通过降低不太重要的预测因子的贡献,这种方法可以帮助研究人员发现他们以前未考虑的数据中的关系。因此,从理论上讲,正则化可能有助于经济学的理论建立,尽管我不知道发生这种情况的重要情况。
结论:苹果与橘子比较?
到目前为止,我们已经讨论了相对于传统计量经济学方法,AI/ML方法的优势和缺点,但是我们不一定要推断这些方法必须是竞争对手。首先,这两种方法可以互相借用。例如,在未来所有经验经济学中,交叉验证可能成为标准的标准(Athey andImbens。2019)。另外,有一个论点认为这两种方法可以是补充。AI/ML不是有效的吗?理论构建工具(到目前为止)是一种更好的预测工具。此外,AI/ML允许对传统方法基本上不可能进行高维数据的分析。为此,在我们的下一篇文章中,我们将讨论AI/ML方法可以使用卫星图像,照片和文本来阐明宏观经济问题的方式。
布莱斯Quillin
来源
Athey,Susan和Guido W. Imbens。2019年。经济学家应该知道的机器学习方法。行进。
Bolbuis,Marijn A.和Brett Rayner。2020. Deus Ex Machina?通过机器学习进行宏观预测的框架。IMF工作文件。WP/20/45。
霍尔,亚伦·史密斯特(Aaron Smalter)。2018年。机器学习方法进行宏观经济预测。经济评论。堪萨斯城的美联储银行。
詹姆斯,加雷斯,丹妮拉·维滕,特雷弗·哈斯蒂和罗伯特·蒂布希拉尼。2013年。纽约R.统计学习介绍:施普林格。
Mullainathan,Sendhil和Jann Spiess。2017年。机器学习:一种应用计量经济学方法。经济观点杂志。第31卷,编号2。第pps。87-106