当前位置: 首页 > 科技观察

读书寂寞?Reddit热议:AI教父YannLeCun提出的“能量模型”是什么?

时间:2023-03-22 12:58:15 科技观察

《能量自监督学习是什么鬼?》不少Reddit网友评论道。刚刚,深度学习教父YannLeCu登上了Reddit热搜。一位不知名的开发者发表了一篇题为《YannLeCun提出的基于能量的自监督学习到底是什么》的帖子,引发了众多网友的讨论。讨论的焦点之一是,基于能量的自监督学习模型能做什么?有什么好处或意义?开发者刚看完LeCun最新的keynote,说YannLeCun好像是要训练一个conditionallatentvariablemodel,根据输入和latentvariable来预测输出(类似于pix2pixGAN或者VAE);同时,它还可以处理图像、视频或音频等不同类型。但是,有很多方法可以优化生成模型。例如,OpenAI使用iGPT预训练来预测缺失像素,使用“对比预测编码法”通过比较损失来预测缺失信息。这些方法在实际应用中取得了很好的效果。相比之下,基于能量的自监督学习似乎没什么特别的,也没有相关的成功应用案例。在Reddit上,超过95%的网友认同这一观点。另外,还有网友透露,在过去的3-4年里,很多专家都为之着迷。他们认为基于能量的模型是深度学习的“未来”。那么,代表ML未来的“能量模型”到底是什么?AI的未来:“能量”SSL模型YannLeCun,2018年图灵奖获得者之一,与GeoffreyHinton、YoshuaBengio并称为深度学习三巨头。同时,他本人也被称为“CNN之父”。LeCun在业界和学术界颇具影响力。目前,他担任Facebook人工智能研究院院长,并在纽约大学、库朗数学科学研究所、神经科学中心以及电气与计算机工程系担任要职。2019年11月,LeCun代表Facebook参加《Using Physical Insights for Machine Learning》主题研讨会,并发表了名为《基于能量的自监督学习(Energy-Based Self-Supervised Learning)》的主旨演讲。在这次演讲中,LeCun详细介绍了基于能量的学习方法在解决现有挑战方面的可能性。近年来,深度学习在计算机感知、自然语言理解和控制等方面取得了重大进展。但这些成功在很大程度上依赖于监督学习或无模型强化学习。其中,监督学习是从标记的训练数据中推断函数的机器学习任务。强化学习分为基于模型和无模型策略。前者和后者的区别在于model-based方法主要学习前向状态转移模型p(st+1|st,at),而model-free方法则没有。从现有研究来看,监督学习和无模型强化学习都存在明显的局限性。前者需要人类提供大量的数据标签,后者需要机器学习来最大化行动的回报。也就是说,监督学习只对特定的任务有好处,即使是学习简单的任务;强化学习还需要与环境进行大量互动。例如,它在游戏和模拟中效果很好,但在现实世界中却很难做到。但如果有一个模型,像人类或动物一样,只需要少量的观察和交互,就能学到很多与任务无关的知识,那么这些现实世界的困境就可以得到很好的解决。而这个模型必须依靠自我监督学习(Self-SupervisedLearning,简称SSL)的方法。LeCun认为SSL是深度学习的“未来”。基于能量的SSL可以处理不确定性,同时避免概率。下面是一个基于能量的SSL模型:一个标量值的能量函数F(x,y)可以被测量,包括:测量x和y之间的相容性。低能量:y是x的最佳预测变量高能量:y是x的最差预测变量此外,它还有一个无条件模型版本。在训练方面,首先将能量函数参数化,得到训练数据,最后计算出新的Shape。在这个过程中通常有两种方法,一种是对比法,另一种是建筑法。其中,比较法涉及三种策略:C1:下推数据点的能量,上推其他位置:最大似然(Maxlikelihood)。C2:数据点能量下推,选择位置上推:最大似然和MC/MMC/HMC,对比发散,度量学习,噪声对比估计,比率匹配,噪声对比估计,最小概率流,对抗生成器GANC3:训练一个函数将数据流形上的点映射到数据流形上的点:denoisingautoencoders,maskedautoencoders(如BERT)构造方法涉及三种策略:,高斯混合模型,平方ICA。A2:使用正则化项来测量低能量的空间体积:SparseCoding,SparseAutoencoder,LISTA,VariationalAutoencoderA3:F(x,y)=C(y,G(x,y)),令G(x,y)关于y尽可能“恒定”:收缩自动编码器,饱和自动编码器。A4:最小化梯度,最大化数据点周围的曲率:scorematching在此基础上,LeCun还演示了一个关于视频预测的应用实例。他表示,未来无监督学习会成为主流,它可以解决很多我们的学习系统难以处理的问题。研究建立无监督和预测的前向模型也将是未来几年的挑战。.(LeCun完整PPT内容文末获取)网友评论:“能量”是什么意思??事实上,LeCun的能量SSL理论还停留在“ppt阶段”。目前还没有大量成功的应用案例,他只是在PPT中展示了自动驾驶预测视频的结果。有网友说,他用能量SSL模型做过测试。如前所述,在能量函数F(x,y)的最小化上,LeCun提供了两种训练方法:比较法和构造法。但在这个过程中,他觉得有很多不合理的地方。例如:自动编码器的潜在变量在哪里?根据建设,是否有可能提前分配样品的权利?如果训练的每个SSL模型都可以解释为基于潜在变量的能量模型,则这可能不是真的。如果你抛开潜变量,认为每个模型都是基于能量的模型,你勉强可以接受,但这有什么意义呢?只能作为解释性理论,似乎没有实用价值。还有网友表示,LeCun做的可能是“基础研究”,就像Hinton对CapsulesNet的研究一样。基础研究成功的可能性很低,通常是其他人在这项研究的基础上创建应用程序。另一位网友表示,Yann的基于能量的学习方法确实启发了深度基于能量的强化学习(RL)研究,SoftActor-Critic(SAC)模型在多个RLbenchmarks上取得了SOTA。那么,你认同这位网友的说法吗?您认为“能量模型”的价值是什么?