当前位置: 首页 > 科技观察

实现人工智能的“想象力”_0

时间:2023-03-15 22:45:12 科技观察

【.com速译】首先,请在脑海中想象一只橘猫。然后,想象一下同一只猫,它的皮毛已变成煤黑色。现在,想象一下这样一只猫昂首阔步地穿过长城。  在上述一系列的想象活动中,你大脑中的一系列神经元会根据你之前对世界的感知迅速呈现出不同的图像。也就是说,作为一个人,其实很容易拥有一个不同属性的对象。但对于计算机来说,虽然深度神经网络在某些任务上取得了可以匹敌甚至超越人类表现的突破,但始终无法与人类的“想象力”抗衡。  现在,南加州大学的一组研究人员开发出一种新型人工智能,可以利用类人能力来想象具有前所未见的不同属性的物体。这篇题为Zero-ShotSynthesiswithGroup-SupervisedLearning的论文于今年5月7日发表在ICLR2021(深度学习领域的顶级学术会议)上。  “受到人类视觉泛化能力的启发,我们试图在机器上模拟人类的想象力,”该研究的第一作者葛云浩说,“人类可以通过不同的属性(例如形状、姿势、位置、颜色)来分离学习到的知识,然后将它们重新组合以想象一个新的对象。我们的论文试图用神经网络来模拟这个过程。”  人工智能的泛化  如果,你想创建一个生成汽车图像的人工智能系统。理想情况下,您可以为算法提供汽车图片,以便它可以从不同角度生成各种品牌、形状和颜色的汽车,从保时捷到庞蒂亚克再到皮卡。  这是人工智能长期追求的目标之一:创建可以推理的模型。实现这一目标意味着,在给定几个示例的情况下,该模型能够提取基本规则并将其应用于大量前所未见的新示例。但是机器通常在样本特征(例如像素)上进行训练,而不考虑对象的属性。  “想象力”的科学  在这项新研究中,研究人员试图用“解开”的概念来克服这一局限。“去纠缠”可以用于“深度伪造(deepfake)”,葛云浩提到,通过“去纠缠”人的面部表情和特征来“换脸”,人可以合成新的图像和视频,用另一个人代替原主人的身份,同时保留原动作。同样,新方法采用一组样本图像——而不是像传统算法那样一次一个样本——并挖掘它们之间的相似性,以实现所谓的“可控分离表示学习”。然后将这些知识重新组合以实现“新图像的可控合成”,或者你可以称之为“想象”。  他举《变形金刚》的例子:可以取自电影——威震天的形状,大黄蜂的颜色,纽约时代广场的背景。合成的结果是一辆大黄蜂色的威震天汽车在时代广场飞驰而过,尽管这个样本在训练期间并没有出现。  这个过程类似于人类的推理:当人类看到一个物体的颜色时,我们可以通过用新颜色替换原始颜色来轻松地将其应用到任何其他物体上。该团队使用他们的技术生成了一个包含156万张图像的新数据集,这将有助于该领域的未来研究。  了解世界  虽然“解耦”并不是一个新想法,但研究人员表示,他们的框架与几乎任何类型的数据或知识都兼容,这扩大了应用的机会。例如,通过从等式中完全删除敏感属性来分解有关种族和性别的知识,从而提高人工智能的公平性。  又比如,在医学领域,它可以帮助医生和生物学家发现更多有用的药物,将药物的功能与其他性质分离,然后重新组合合成新的药物;驾驶汽车在训练过程中想象和避免以前从未见过的危险场景,有助于创造更安全的人工智能。  计算机科学教授LorenItty说:“深度学习在许多领域展示了无与伦比的性能和前景,但这往往是通过浅层模仿实现的,而没有更深入地了解是什么让每个人都具有独特的属性。对于第一个届时,这种“解耦”的新方法真正释放了人工智能系统的想象力,使它们更接近人类对世界的理解。》  原文链接:赋能人工智能的‘想象力’