了解将对未来产生巨大影响的AI进步:AI是前沿和中心,企业和政府领导人在想什么正确的举动。但是实验室里发生了什么?在实验室中,学术和企业研究人员的发现将为明年及以后的人工智能发展指明方向。我们自己的研究团队来自普华永道的人工智能加速器,专注于技术人员和商业领袖都应该密切关注的前沿发展。以下是它们的含义以及它们为何重要。也可以在这里查看我们最新的AI商业趋势。1.深度学习理论:揭开神经网络工作原理的神秘面纱:模仿人脑的深度神经网络已经展示了它们从图像、音频和文本数据中“学习”的能力。然而,即使在使用深度学习十多年之后,我们仍然对深度学习有很多不了解的地方,包括神经网络如何学习以及它们为何表现如此出色。由于将信息瓶颈原理应用于深度学习的新理论,这种情况可能正在改变。从本质上讲,它表明在初始拟合阶段之后,深度神经网络将“忘记”并压缩噪声数据——即包含大量附加无意义信息的数据集——同时仍保留有关数据所代表内容的信息。为什么重要:准确了解深度学习如何促进其更大的发展和使用。例如,它可以提供对高级网络设计和架构选择的洞察力,同时为安全关键或监管应用程序提供更大的透明度。期望通过对该理论的探索,可以看到更多的成果,并将其应用到其他类型的深度神经网络和深度神经网络的设计中。2.胶囊网络:模仿大脑的视觉处理能力什么是:胶囊网络一种新型的深度神经网络,以类似于大脑的方式处理视觉信息,这意味着它们可以保持层次关系。这与卷积神经网络形成鲜明对比,卷积神经网络是使用最广泛的神经网络之一,它没有考虑简单和复杂对象之间重要的空间层次,导致错误分类和高错误率。为什么重要:对于典型的识别任务,胶囊网络通过将错误减少50%来保证更高的准确性。他们也不需要太多数据来训练模型。期望看到胶囊网络在许多问题领域和深度神经网络架构中得到广泛采用。3.深度强化学习:与环境互动以解决业务问题它是什么:通过观察、行动和奖励与环境的互动来学习的神经网络。深度强化学习(DRL)已被用于学习Atari和围棋等游戏的策略,包括击败人类冠军的著名AlphaGo程序。为什么重要:DRL是所有学习技术中最通用的,因此它可以应用于大多数商业应用。与其他技术相比,它需要更少的数据来训练其模型。更值得注意的是,它可以通过模拟进行训练,从而完全不需要标记数据。鉴于这些优势,预计明年会看到更多业务应用程序DRL与基于代理的模拟相结合。4.生成对抗网络:成对神经网络促进学习并减少处理负荷它是什么:生成对抗网络GaN(GaN)是一种无监督的深度学习系统,它作为两个竞争神经网络实现。一个网络,即生成器,创建了与真实数据集相同的假数据。第二个网络,鉴别器,接收真实和合成数据。每个网络都随着时间的推移而改进,使这对网络能够学习给定数据集的整个分布。为什么重要:GAN为更广泛的无监督任务打开了深度学习的大门,在这些任务中,标记数据不存在或获取成本太高。它们还减少了深度神经网络所需的负载,因为这两个网络共享负载。预计更多的商业应用,例如网络检测,将采用GANS。5.LeanandAugmentedDataLearning:SolvingtheLabeledDataChallenge什么是机器学习(尤其是深度学习)的最大挑战是提供大量的标记数据来训练系统。两种广泛的技术可以帮助解决这个问题:(1)综合新数据;(2)将针对一项任务或领域训练的模型转移到另一项任务或领域。诸如迁移学习(将学到的见解从一个任务/领域迁移到另一个任务/领域)或一次性学习(将学习迁移到***,只有一个或没有相关示例进行学习)等技术——让他们“依靠数据”学习技术。同样,通过模拟或插值合成新数据有助于获得更多数据,从而增加现有数据以改进学习。为什么重要:使用这些技术,我们可以解决各种各样的问题,尤其是那些历史数据很少的问题。期望看到更多精益和扩展数据,以及应用于广泛业务问题的不同类型的学习。6.概率编程:一种简化模型开发的语言它是什么:一种高级编程语言,使开发人员更容易设计概率模型并自动“求解”这些模型。概率编程语言支持可重用模型库,支持交互式建模和形式验证,并提供必要的抽象层以在通用模型类中促进通用、高效的推理。为什么重要:概率编程语言能够容纳业务领域中常见的不确定和不完整的信息。我们将看到这些语言得到更广泛的采用,并期望它们也能应用于深度学习。7.HybridLearningModel:ACombinationApproachtoModelUncertainty它是什么:不同类型的深度神经网络,如GANS或DRL,在性能上具有很大的前景,并已广泛用于不同类型的数据应用程序。然而,深度学习模型不是模型不确定性的贝叶斯方法,也不是概率方法。混合学习模型结合了这两种方法,以充分利用每种方法的优势。混合模型的一些例子是:贝叶斯深度学习、贝叶斯甘斯和贝叶斯条件甘斯。为什么重要:混合学习模型可以将深度学习扩展到业务问题的多样性,包括不确定性。这可以帮助我们实现更好的性能和模型可解释性,进而可以鼓励更广泛的采用。期待看到更多的深度学习方法获得贝叶斯等价性,概率编程语言的组合开始融入深度学习。8.自动机器学习(AutoML):无需编程即可创建模型它是什么:开发机器学习模型需要一个耗时且由专家驱动的工作流程,其中包括数据准备、特征选择、模式或技术选择、训练、调整。AutoML旨在使用许多不同的统计和深度学习技术来自动化此工作流程。为何重要:AutoML是AI工具大众化的一部分,使企业用户无需深厚的编程背景即可开发机器学习模型。它还将加快数据科学家创建模型的时间。期待在大型机器学习平台中看到更多商业AutoML包和AutoML集成。9.数字双胞胎:超越工业应用的虚拟副本它是什么:数字双胞胎是一种虚拟模型,用于促进对物理或心理系统的详细分析和监控。数字孪生概念起源于工业界,用于分析和监控风车、农场或工业系统等事物。现在,使用基于代理的建模(用于模拟自主代理的行为和交互的计算模型)和系统动力学(一种用于计算机辅助策略分析和设计的方法),数字孪生正被应用于非物质对象和过程,包括预测客户行为。为什么重要:数字孪生有助于促进物联网(IoT)的开发和广泛采用,为物联网系统的预测诊断和维护提供一种手段。展望未来,我们将看到在物理系统和消费者选择模型中更多地使用数字孪生。10.可解释的人工智能:理解黑匣子是什么:今天,有许多机器学习算法在各种不同的应用中使用这种意义、思考和行动。然而,这些算法中有许多被认为是“黑匣子”,无法深入了解它们是如何得出结果的。ExplainableAI是一项开发机器学习技术的运动,该技术可以在保持预测准确性的同时生成更多可解释的模型。为什么重要:可解释、可证明和透明的人工智能对于建立对技术的信任至关重要,并将鼓励更广泛地采用机器学习技术。在开始广泛部署人工智能之前,企业将采用可解释的人工智能作为要求或最佳实践,而政府可能会在未来将可解释的人工智能作为监管要求。
