当前位置: 首页 > 科技观察

更贴近人类对世界的认识:研究人员让AI拥有“想象力”

时间:2023-03-21 16:29:30 科技观察

据外媒报道,先想象一只橙色的猫,现在想象这只猫长着黑色的皮毛,然后再想象另一只猫踏上长城中国。这一系列的想法会导致大脑中的神经元快速放电,根据您之前对世界的了解得出各种图片。换句话说,作为人类,很容易想象一个具有不同属性的物体。然而,虽然深度神经网络在某些任务上已经达到或超过了人类的表现,但计算机一直在与我们人类独特的“想象力”技能作斗争。现在,由计算机科学教授LaurentItti、博士生YunhaoGe、SamiAbu-El-Haija和GanXin组成的南加州大学(USC)研究团队已经开发出一种人工智能,能够想象前所未有的能力-看到具有不同属性的对象。“受人类视觉泛化能力的启发,我们试图在机器上模拟人类的想象力,”该研究论文的第一作者葛说。学到的知识,然后将它们重新组合起来想象出一个新的对象。我们的论文试图用神经网络模拟这个过程。”AI中的泛化问题假设你想创建一个生成汽车图像的AI系统。理想情况下,您可以为算法提供一些汽车图像,以便它可以从多个角度生成各种颜色的汽车。这是AI长期追求的目标之一:创建可以推断的模型。这意味着仅给出几个示例,模型就应该能够提取潜在规则并将它们应用于以前从未见过的大量新示例。但是机器通常是在样本特征(例如像素)上进行训练,而不考虑对象的属性。想象力的科学在这项新研究中,研究人员试图通过一种称为解缠结的概念来克服这一局限性。分离可用于生成深度假货。Ge指出,通过这样做,“人们可以合成新的图像和视频,用另一个人的身份替换原来的人,但保持原来的动作。”同样,新方法获取一组样本图像——而不是像传统算法那样一次获取一个样本——并挖掘它们之间的相似性以实现所谓的“可控分离表示学习”。然后它重新组合这些知识以实现“新图像的可控合成”,或者可以称为想象力。“这类似于我们的人类推理:当人类从一个物体上看到一种颜色时,我们可以通过用新颜色替换原始颜色来轻松地将其应用到其他物体上。”该技术生成了一个包含156万张图像的新数据集,这可能有助于该领域的未来研究。了解世界虽然“解耦”并不是一个新概念,但研究人员表示,他们的框架可以比拟为几乎兼容任何类型的数据或知识。这扩大了应用程序的机会。比如从关于种族和性别的等式中删除敏感属性以创建更公平的AI。在医学上,它可以帮助医生和生物学家发现更有用的药物,将药物的功能与其他性质分开,然后重新组合合成新的药物。赋予机器想象力还有助于创造更安全的AI,例如要求自动驾驶汽车想象并避免在环境中看不到的危险场景。Itti说:“深度学习在许多领域都展示了卓越的性能和前景,但这通常是通过浅层模仿发生的,这种模仿没有对使每个对象独一无二的个别属性有更深入的理解。深入理解。这种新的方法来第一次分离真正释放了人工智能系统的新想象力,使它们更接近人类对世界的理解。”