当前位置: 首页 > 科技观察

人工智能全新突破:神经网络可自主识别图片中的对象

时间:2023-03-13 15:14:02 科技观察

人工智能新突破:神经网络可自主识别图片中的物体图片中的物体,准确率达到75%。人类的大脑是惊人的。经过几十年的研究,人类仍然无法复制人脑超快的运算速度。目前,计算机科学家可用的最大工具是神经网络。如此庞大的计算机网络可以被训练来解决复杂的问题,其机制类似于人类的中枢神经系统,利用不同层次的神经元来解决问题的不同部分,最后融合成一个合适的答案。问题是这样的神经网络需要大量的数据输入和训练才能学会如何解决问题。例如,ImageNet是一个很好的训练数据源,一个巨大的视觉信息数据库,包含100万张人工标记的照片。这被称为“监督学习”,真正的人工智能意味着神经网络需要学习如何自动进行“无监督学习”。这正是芬兰初创公司CuriousAI希望实现的目标。“人脑进行了大量的无监督学习,”CuriousAI的首席技术官AntTIRasmus在赫尔辛基举行的Slush2016科技行业会议上说。“我们不需要告诉婴儿勺子是什么。”.他们可以自动从环境中学习并形成概念。”“对于人脑来说,从一个物体形成一个概念很简单。这在心理学上有研究,被称为“格式塔理论”。人脑会将具有相似形状、颜色、运动状态和模式的事物归为一组。我们采取的第一步是让深度学习系统能够像人脑一样对物体进行分类。”将神经科学应用于人工神经网络在神经科学中,一种称为“速率编码”的理论指出,大脑中神经元的放电率越高,神经元就越活跃。神经元被连续发射。在20世纪80年代,科学家们发现神经元将自己组织在一起以表示不同的信息。这种理论被称为“临时编码”。该理论认为神经元放电的时间很重要,放电的确切时间决定了数万个神经元中哪些神经元属于同一组。因此,一个神经元子集可以同时放电以帮助大脑识别一系列物体中的一个物体,例如一堆办公用品中的一块红布,而另一个神经元子集告诉大脑其他物体是背景信息。Rasmus说:“我们的计算机算法集成了一种临时编码机制。我们在神经网络的每一层保存了多个副本。整个神经网络被复制了4次。这意味着系统可以学习到每个副本代表一个特定的对象,通过将这些对象合并在一起,它可以与原始图像相匹配。”Rasmus之前是Nvidia的软件工程师,目前正在芬兰阿尔托大学进行深度学习的博士研究。“通过将图像分成4个不同的组,神经网络可以对图像本身进行编码。这是无监督学习,我们不需要标记系统。当我们将图像显示给神经网络时,它会自动分解图像成元素(例如图片中的对象)。”神经网络将图片分解成各个元素后,分类和识别对象变得更容易,因为它们不会相互重叠,从而模糊图像。感知分组可以彻底改变深度学习研究人员最初指示神经网络在没有监督的情况下分析图像,组织对象,然后将标记信息添加到图像(监督学习),看看系统学到了什么。他们发现CuriousAI的Tagger系统达到了75.1%的准确率。相比之下,传统的神经网络只有21%的准确率,仅比随机猜测好1%。Rasmus说:“这是一项革命性的研究,让无监督学习更进一步。通过让机器获得物体的概念,我们实现了更类似于人脑的无监督学习。”这可能有助于未来的研究。”,允许神经网络执行更高层次的推理并学习物体与环境之间的相关性。“在当前的系统中,计算机运行在基于统计的世界观中。如果让计算机进入人类生活的世界,那么很重要的一点就是让机器以类似于人类的方式来理解世界。它往往是人们很难理解计算机视觉效果很差,因为人类视觉是我们天生的。”该公司的相应论文《Tagger:深度无监督知觉分组》将于12月7日在巴塞罗那举行的2016年神经信息处理系统深度学习会议上发表。CuriousAI正在寻找行业合作伙伴,以在现实世界的AI系统中试验其深度学习技术。目前,该公司正在与想要开发自动驾驶技术的汽车制造商联系。“通过将图像分为4个不同的组,神经网络可以对图像本身进行编码。这是无监督学习,我们不需要给系统贴标签。当我们将图像展示给神经网络时,它会自动将图像分解成元素(比如图片中的物体)。“在神经网络将图片分解成各个元素后,分类和识别对象变得更加容易,因为它们不会彼此重叠,从而使图像变得模糊。感知分组可以彻底改变深度学习,”研究人员最初指导神经网络分析图片,组织对象,然后以无监督的方式为图像添加标签信息(监督学习),看看系统学到了什么。他们发现CuriousAI的Tagger系统达到了75.1%的准确率。作为对比,传统神经网络的准确率仅为21%,仅比随机猜测的准确率高出1%。Rasmus说:“这是一项革命性的研究,它使无监督学习走得更远。通过让机器获得物体的概念,我们实现了更类似于人脑的无监督学习。这可以通过让神经网络执行更高的性能来帮助未来的研究级推理并了解对象如何与其环境相关。“在当前系统中,计算机在基于统计的世界观中运行。如果允许计算机进入人类生活的世界,让机器以类似于人类的方式认识世界是非常重要的。人们通常很难理解计算机视觉效果不佳,因为人类视觉对我们来说是天生的。该公司的相应论文《Tagger:深度无监督知觉分组》将于12月7日在巴塞罗那举行的2016年神经信息处理系统深度学习会议上发表。CuriousAI正在寻找行业合作伙伴,以在现实世界的人工智能系统中试用其深度学习技术。目前,该公司正在与想要开发自动驾驶技术的汽车制造商接触。