人工智能在过去一年中取得了强劲的增长,为人类带来了越来越多的利益。未来,机器视觉将是人工智能的下一个前沿。随着此类技术的发展,明年将出现新的人工智能设备。为什么机器需要视觉?视觉是第一感觉。为了让机器理解人类并提供他们所需的支持,它们必须能够在视觉领域中看到和表现。它可以采用帮助盲人“看到”并了解周围世界的小型摄像头的形式,或者采用可以准确区分流浪猫、移动的树枝和窃贼的家庭监控系统的形式。随着电子设备在人们的日常生活中越来越重要,我们也发现越来越多的设备应用因为没有足够强大的视觉功能而失败,比如无人机在空中相撞,机器人吸尘器在吸东西。机器视觉是人工智能的一个快速发展的分支,旨在赋予机器与人类相媲美的视觉。随着研究人员应用专门的神经网络来帮助机器识别和理解真实世界的图像,机器视觉在过去几年中取得了巨大进步。今天的计算机能够做任何事情,从视觉识别到识别互联网上的猫,再到识别大量照片中的特定面孔。然而,这类技术还有很长的路要走。目前,机器视觉正走出数据中心,应用于各种用途,从无人机的自动驾驶到食品分拣。基本的图像分类变得简单得多,但在从复杂场景中提取本质或信息时,机器面临着一系列新问题。错视画的问题很好地说明了机器视觉还有很长的路要走。例如,当人们看到两个面孔相对的剪影图像时,他们看到的不仅仅是抽象的形状。他们的大脑会进一步解读它,让他们能够识别图像的多个部分,看到两张脸,或者看到一个花瓶。但是对于机器来说,这样的形象是非常难以理解的。一个基本的分类器无法区分两张脸和一个花瓶,它可以识别诸如斧头、钩子、防弹衣甚至吉他之类的物体。该系统无法确定图像中有哪些物体,这使得识别此类图像对机器来说最具挑战性。另外,就像复杂的图像一样,现实世界是混乱的。里面的正常导航不是光靠开发算法分析数据就能实现的,需要对真实场景有清晰的认识,然后才能做出相应的动作。机器人和无人机面临着许多这样的障碍,克服这些障碍是人工智能革命参与者的首要任务。随着神经网络和专用机器视觉硬件等技术的不断普及,机器视觉与人类视觉之间的差距正在迅速缩小。不久之后,甚至可能出现视力优于人类、能够执行各种复杂任务且完全自主的机器人。
