文章 |轩创日前,加州大学伯克利分校(UC Berkeley)AI实验室推出了一款名为Vestri的机器人。
虽然它没有波士顿动力阿特拉斯那样的后空翻能力,也没有俄罗斯机器人费多尔那样炫酷的射击和驾驶技能,但它却凭借“预见未来”的非凡能力赢得了大家的关注。
所谓“预见未来”并不像幻想的水晶球或塔罗牌。
Vestri只是一个勤奋好学的“孩子”,他用各种可以想象的方式“玩弄”面前的物体,并用相机来预测未来。
通过收集视频信息,Vestri将记录每个移动物体的路线。
当 Vestri 面对一个新物体时,Vestri 无需摆弄它就知道该向哪个方向移动以及该物体的位置将如何变化。
也许你会有点失望。
维斯特里并不像你想象中的人类先知那样具有预见性,但对于现在的机器人来说,这确实是一种非凡的能力。
Vestri之所以拥有如此非凡的能力,来自于伯克利AI实验室开发的一种新的深度学习技术——视觉前瞻。
这是什么技术?谁开发的?这项技术将对机器人行业产生什么影响? 1.“可预见的未来”机器人Vestri。
根据伯克利人工智能实验室发布的视频,Vestri 拥有一条红色机械臂和一个显示面部表情的监视器。
手臂的末端由两半抓钳组成。
从外观上看,Vestri并不像人形机器人那么可爱,也没有工业机器人庞大的身躯。
但这并不妨碍Vestri成为智能机器人。
从视频中我们可以看到,维斯特里像人类婴儿一样玩弄着他面前的玩具。
这样的机器人有什么奇怪的呢? 1. Vestri有两大特点区别于以往的机器人。
Vestri有两大特点:完全自学执行任务和可预测行动结果。
(1) 完全自学执行任务。
许多常见的机器人只会根据给定的程序来处理物体。
他们没有“自己的想法”,与机器没有什么不同。
但维斯特里看到眼前的物体后,就会产生自己的判断和想法,并在此基础上继续探索如何“玩”。
整个过程完全不需要人工监督,可以说是“自学成才”。
Vestri 的开发者之一、加州大学伯克利分校助理教授谢尔盖·莱文 (Sergey Levine) 表示:“虽然机器人的能力仍然非常有限,但它完全自动学习技能。
Vestri 是基于它记录的交互模式。
” (之前的独立学习过程)来预测在与以前从未见过的新对象进行复杂的物理交互时选择不同方法的结果。
》(2)可预测的动作结果。
常见的机器人都是预设好的,执行指令代码,它们只关心“做”或“不做”的动作,而不考虑这些动作是否会带来不好的结果。
Vestri可以预测当然,它能够实现这种“特殊功能”,得益于它之前“玩弄”物体时通过自己的摄像头收集到的大量数据。
Vestri 的系统,它预测图像的像素将如何从一帧移动到下一帧 2. Vestri 背后的新技术 Vestri 机器人本身并没有什么特别的,但它的两个主要功能实际上是基于最新技术 - “视觉”。
该技术由伯克利人工智能实验室开发,其核心技术是基于卷积循环视频预测或动态神经平流(DNA)的深度学习技术。
2.“视觉预测”背后的两位研究人员这项学习技术是关于改变人工智能世界的背后是研究人员的辛勤努力。
目前,Vestri仅使用该技术的早期原型,仅教会机器人如何自行学习一些独立的手动技能。
虽然目前的技术只能让机器人预测几秒钟,但足以让它们计算出如何避开障碍物并成功移动桌子上的物体。
视觉前视技术来自加州大学伯克利分校的AI实验室,这项技术与以下两个人有着密切的关系。
1. Sergey LevineSergey Levine 是加州大学伯克利分校电气工程与计算机科学系的助理教授。
目前,他主要活跃在两大研究中心:伯克利人工智能实验室(BAIR)和加州大学社会兴趣信息技术研究中心(CPAR)人类与机器人部门。
Sergey Levine 于 2001 年在斯坦福大学获得计算机科学学士和硕士学位,并于 2011 年在斯坦福大学获得计算机科学博士学位。
今年秋天,他加入加州大学伯克利分校电气工程与计算机科学系,主要研究用于决策和控制的机器学习技术,重点研究深度学习和强化学习算法。
这项工作的应用包括自主机器人和车辆,以及计算机视觉和图形。
他的研究包括结合感知和控制的深度神经网络策略中的端到端训练算法的开发、逆强化学习的可扩展算法、深度强化学习算法等。
2006年,他与Chelsea合作发表了一篇技术论文关于“视觉预见”。
此外,他今年还被评选为麻省理工学院35岁以下35名顶尖科技创新者之一。
2. Chelsea Finn Chelsea Finn 是 Levine 实验室的博士生。
她发明了最初的DNA模型。
Chelsea Finn 2011年毕业于麻省理工学院电气工程与计算机科学学院,2016年进入加州大学伯克利分校攻读PHD(学术研究博士学位),研究方向为机器人感知与控制。
在加入 BAIR 之前,Chelsea Finn 还曾在 Consyl、Google 和桑迪亚国家实验室工作过。
2011年,Chelsea Finn作为第一作者发表了论文《面向机器人运动规划的深度视觉预见》,并于2018年3月更新为第二版。
3、伯克利人工智能实验室 加州大学伯克利分校成立于2001年,排名美国第21位。
学校有一个专业排名前十,其中土木工程、环境工程、生态学、化学、计算机相关专业均排名全美第一。
此外,该校拥有戈登·摩尔、朱棣文、丘成桐等众多知名校友。
诺贝尔奖、菲尔兹奖、图灵奖等国际知名科学奖项也让伯克利校友受益。
加州大学伯克利分校建立了70多个研究中心和实验室,伯克利人工智能实验室(BAIR)就是其中之一。
伯克利人工智能实验室目前拥有24名教师和多名研究生。
其主要研究领域包括计算机视觉、机器学习、自然语言处理和机器人技术。
2017年,实验室博客BAIR上线。
BAIR 博客文章的作者包括在校学生、博士后研究员和教职员工。
博客内容不仅面向专业人士,也面向普通读者,为他们提供及时的实验室研究动态。
伯克利AI实验室的研究成果也层出不穷。
此前,其实验室主任 Pieter Abbeel 与 OpenAI 的同事合作成立了初创公司“Embodied Intelligence”,并开发了一款使用 AR 训练机器人的软件。
本月2日,其实验室还发布了最新研究论文《基于模型的无模型精调深度强化学习的神经网络动力学》,可以让机器人在17分钟内学会轨迹追踪。
12日,BAIR博客又更新了一条消息。
他们开发了用于机械系统控制(MSC)的机器人安全交互系统。
该系统将确保人机协作过程中人类的安全。
4、视觉前视技术的两大应用前景:“视觉前视”技术利用机器人本身采集的视频信息,这使得该技术具有普遍适用性。
与传统计算机视觉需要人类标记数百万张图像不同,构建视频预测模型只需要机器人本身收集的视频而无需标记。
事实上,视频预测模型也已应用于从人类活动到驾驶的各种数据集,并取得了令人信服的结果。
Vestri集成的技术可用于自动驾驶系统。
目前,自动驾驶是一个非常热门的领域,各大公司都在竞相研发无人驾驶汽车。
让车辆在路上行驶并不是什么大问题。
最重要的问题是车辆如何避开障碍物以及突然出现的障碍物。
视觉前视技术将能够通过预测意外障碍物的轨迹来规划自动驾驶汽车的最佳避让路线,从而保证行驶安全。
除了用于自动驾驶之外,视觉预测技术还可以用于开发更智能的家庭机器人助手。
特别是对于有老人和孩子的家庭,集成视觉预测技术的机器人将能够预测跌倒等危险情况的发生,并及时采取措施,将其消灭在萌芽状态。
但目前这项技术还不够完善。
它只能预测接下来几秒钟内的动作,而这些预测也是基于机器人在之前的自主学习过程中收集的视频信息。
伯克利人工智能实验室的研究人员表示,他们将继续开发更复杂的方法,以便机器人能够收集更集中的视频数据并完成复杂的任务。