当前位置: 首页 > 科技观察

清华大学赵明国:AI芯片+机器人,突破算法瓶颈

时间:2023-03-20 22:11:52 科技观察

本文转载自雷锋网。8月7日,2020全球人工智能与机器人峰会(CCF-GAIR2020)在深圳前海华侨城JW万豪酒店拉开帷幕。会议由中国计算机学会(CCF)主办,香港中文大学(深圳)、雷锋网(公众号:雷锋网)协办,鹏城实验室、深圳研究院协办人工智能和机器人学。从2016年产学研融合,2017年产业落地,2018年垂直细分,到2019年中国人工智能40周年,峰会一直致力于打造规模最大、规格最高、跨度最高的峰会。-中国的边界人工智能和机器人技术。广泛的学术、产业和投资平台。根据大会安排,8月8日,在“机器人前沿专场”上,清华大学研究员、优必选优必选仿人机器人首席科学家赵明国教授作了题为《基于计算的智能机器人控制》的主题演讲。赵明国教授表示,在传统的控制系统中,算法能力往往受到控制器的制约。智能机器人实现多模态非常不方便,要么难以实现,要么耗电大,体积大。如果将AI芯片集成到机器人中,提供算法和算力支持,可以有效解决机器人的运动和感知问题。演讲中,赵明国教授介绍了他最新的机器人案例——无人自行车。该机器人能够在复杂的真实环境中应对变速、不同粗糙度、不同材质路面等干扰因素的影响,实现完全自主行驶。在他看来,无人驾驶自行车的实现需要满足三个基本功能:运动控制:通过在嵌入式系统中运行控制算法来实现。定位导航:通过高频系统的迭代计算实现。交互与感知:利用GPU的并行计算进行识别或算法推理来实现。其中,对应的三种算法需求都可以由芯片完成。赵明国教授表示,他们在无人自行车中内置了一颗“天机芯片”,实现了行驶路径识别、障碍物识别、语音导航、运动控制等多种功能。这款芯片是去年清华大学石路平教授团队发布的一款类脑芯片。它可以同时实现三种不同的算法,并且是动态的、可定义的和可重编程的。基于天机芯片完成的无人自行车演示验证,赵明国教授针对智能机器人未来的研究方向提出了两条新路径:芯片+机器人:以机器人为芯片和AI算法的研究平台。机器人+芯片:以芯片为平台,实现机器人控制和智能算法。在他看来,未来智能机器人将与人工智能技术深度融合,AI芯片将在机器人控制领域释放更多潜力。赵明国教授表示,无人车目前仅完成了地面行驶的初级任务,后续还将进一步探索自行车如何实现腾空、落地等高难度特技。在他看来,只有将控制问题推向极致,探索技术的边界,才能推动整个技术的进步。我们的愿景是让机器人达到甚至超过人类驾驶自行车的水平。此外,赵明国教授还分享了双足机器人的案例研究。他强调,无论是腿式机器人还是轮式机器人,都是测试算法的工具或载体,最终产品不会用于商业化。会后,赵明国教授在接受雷锋网编辑采访时也表示,人形机器人还处于学术研究阶段,距离商业化还有很长的路要走。从行业发展来看,由于研发投入高、技术路线长,很少有企业专注于仿人机器人的研究。在国家政策的支持下,高校团队和部分企业的研发团队工作较多,近年来陆续有突破性的研究成果发表。此外,赵明国教授透露,目前正在开展一些新的研究,预计明年会发表相应的成果。以下为雷锋网(公众号:雷锋网)编辑原意不改整理整理的赵明国教授演讲全文:大家早上好!今天和大家分享一下我们做机器人遇到的问题和思考。我的题目是“智能机器人的基于计算的控制”。在机器人控制过程中,我们需要借助控制器来实现各种算法,但是这里有一个现实的问题,就是控制器的能力决定了算法的能力。长期以来,我们没有办法突破控制器的局限,算法也只能停留在比较初级或中级阶段,很难达到高级阶段。所以我们转变思路,让算法驱动控制器的开发。这里我们做了两个实验案例,无人自行车和双足机器人。应该注意的是,这两个机器人中的一个是轮式的,另一个是腿式的。我做轮式机器人不是为了实用,也不是为了商业化。自动驾驶自行车是我用来测试算法或解决一些问题的实验工具。同样,双足机器人也用于研究实验。它们的实用性有待后续的商业开发。“天机”驱动的无人自行车首先,什么是无人车?能够在无人控制的情况下自主行驶的汽车称为无人驾驶汽车。机器人本身涉及很多动力学。自行车虽然在将近200年前就已经发明,但其机械机构并没有被研究透彻。直到2016年一群学者在《自然》杂志上发表的一篇文章,才对复杂的动力系统进行了透彻的解释。我们在做机器人控制的时候,还需要充分利用自行车的动力。人们对自行车的控制能力很强。例如,每个人都可以在校园内或在没有障碍的道路上轻松骑自行车。那么如何保持自行车的平衡和自主移动呢?实际上,其中涉及许多机械原理。一般来说,有以下几个影响因素。如果自行车在圆形轨道上行驶,就会产生离心力,这种离心力会帮助它保持平衡。自行车特殊的前叉结构——前叉角度和前轮拖距,这两个物理参数的变化都会使车把自动回正,保持平衡发挥重要作用。整个车身质量的均衡分布也是保持平衡的原因之一。人在骑自行车时,上半身的运动会产生一个反作用力,使自行车保持平衡。车轮的陀螺效应,陀螺力矩会帮助汽车保持平衡。加一个反作用轮(常用于航天器),或加一个力矩陀螺,都会产生平衡的效果。上面提到的前两项是我们的研究方向,中间三项需要外接设备,与独立自行车无关,最后一项与研究原理无关。所以我们只选择了前两项。我们在使用前两项进行控制时遇到了一些困难,例如低速和变速行驶影响离心力、风干扰、大坡度、负载变化、车轮与不同地面的相互作用。下面是一个比较简单的自行车动力学模型,其中车身、车把和行驶速度可以用三个变量来描述。描述这三个变量后,我们可以得到一个动力学方程,具有很强的非线性,不同状态下的角度和车速是耦合的,对参数也很敏感。另外,我们可以看到方程中的很多参数都与速度有关。每当速度变化时改变动态方程对我们来说是一个有趣的挑战,如果我们能够考虑速度效应,我们的控制算法可以更进一步。单一速度的车把转向控制可以用普通的控制方法解决。我觉得大二和大三的同学可以尝试做固定速度的自行车实验。我们要做的就是如何解决变速下的车把转向平衡控制。过去,我们尝试通过速度估算+分段控制来实现变速控制。当时我们花了一个多月的时间,人工调整了大约20个参数,随变速切换,更好的解决了车子的稳定性问题;然后用这些数据作为初始参数加强Learning,效果会更好,可以适应地面材质。遗憾的是,零初始知识情况下的学习并没有成功,虽然我们利用了Segway平衡车在零知识情况下的强化学习,实现了正负10度范围内的平衡。因为基础知识是直线部分,自行车上没有用到。因此,我们得出结论,“暴力”强化学习可能不适合这个问题,需要进一步探索。我们的无人自行车是在普通自行车的后轮上加上驱动器,在前车把上加上转向,加上刹车、控制器和相应的传感器,还有电池,这样自行车已经可以实现恒速行驶。事实上,任何控制器都通过反馈控制本身具有一定的鲁棒性,因此在基本路面上行走是没有问题的。只要各种速度下的参数匹配好,平滑切换就可以获得更好的鲁棒性。此外,我们还实现了变速自动导航行走。这是我们在清华校园拍摄的短片。视频中的自行车可以从低速到高速,通过不同粗糙度、不同材质的路面。我们给它加了传感器,进行路面识别,它也可以沿着比较简单的路径导航。无人自行车能达到这样的效果,我们做了几件事情。除了实现机器人控制之外,还增加了一个感知模块,所以这就是我们的动态模型。从图中的两个红圈来看,有的项目是陀螺效应相关的,有的项目是离心力相关的,有的项目是结构相关的,最重要的第一项是重力相关的。这些项目不断变化的速度。传统的方法是使用NI控制器或者任何工业控制器,然后集成大量的传感器来达到这种效果。当然,失败也有一个过程。我们经常摔倒,重新调整参数再做。然而,这是一种相当传统且复杂的机器人控制方法。之后我们没有这样做。传统任务中的运动控制需要嵌入式系统,因为嵌入式系统需要实现控制算法。在同时做定位和导航的时候,我们需要一个高频系统进行迭代运算,比如SLAM或者其他(SLAM也可以在GPU上做)。交互和感知往往需要使用GPU来做一些识别或推理算法。简而言之,它适用于并行计算、高频计算和实时性要求。智能机器人同时需要这三种类型的计算。特别是我们参加RoboCup比赛时做的人形机器人,同时需要这些类型的计算。最简单的方法就是使用三台不同计算能力的电脑,然后用网线连接起来,使用操作系统来维护数据。交流。这次我们没有采取这样的做法。去年,清华大学石路平教授团队发布了一款类脑芯片“天机”,可以在一块芯片上实现三种类型的计算,并且是动态的、可定义的、可重编程的。这是两个或多个学科交叉的结果。我们和做芯片的老师合作。我们使用具有这些功能的芯片完成了三项测试任务。如果这三项任务都能实现,就意味着该芯片具备了这三种计算功能。这对于传统的机器人控制硬件来说是很难实现的,如果能够实现,体积庞大,耗电量大。那么我们希望能够使用混合架构的芯片来实现这个功能。因此,我们把行车路径识别、障碍物识别、语音导航、动作控制等功能全部集成到一个芯片中(当然不是芯片,而是芯片组成的主板)。如上动画所示,芯片实现了所有的计算功能。我们的工作成果于去年8月1日发表在《自然》杂志上。这是我国人工智能领域在Nature上发表的第一篇文章。受这项工作的启发,利用天机芯片完成无人自行车的演示,为自主机器人的发展提供了新的思路。有两种方式:芯片+机器人:用机器人作为芯片或AI算法研究平台,以证明算法的可行性。算法在推进的同时反馈给机器人,最终推动高算力或多性能芯片的实现。机器人+芯片:用芯片解决机器人计算能力不足的问题。这套新思路最早是张博先生2016年在《科学》杂志发表的一篇文章中提到的,其目的是希望人工智能技术与机器人能够相互结合、相互促进。目前,研究成果已得到国际知名杂志和专业人士的认可。另外,值得注意的是,《自然》杂志的编辑告诉我们,通常发表在《自然》上的文章有100篇报道,而我们的文章达到了1400篇报道,是迄今为止最好的。算力支撑的技术挑战到目前为止,对机器人控制和算力的需求还远未结束。我们经常在Youtobe视频中看到一些山地越野挑战。控制能力有多强。我们的愿景是让机器人达到甚至超过人类驾驶自行车的水平。因为这样可以把控制问题推到极限,从而发现技术的边界在哪里,从而推动整个技术的进步。从长远来看,未来的机器人控制可以分为三个发展阶段:第一阶段:自行车可以在低速、变速、崎岖不平的道路上正常行驶。第二阶段:自行车能独立完成腾空、落地等特技任务。第三阶段:在落地应用中,集成了控制和感知系统的自行车可以在极限山地运动员等复杂环境中自由移动。目前,我们已经完成了初期阶段的任务。对于中长期任务,我们还没有做出明确的规划,但可以肯定的是,这些任务必须有强大的计算能力支撑。如果没有计算,其他部分再好。目标达成。双足机器人的被动行走理论早在1990年就被提出,当时的机器人是纯机械结构,只要给定初始条件就可以稳定行走。到2005年,美国康奈尔大学的研究团队根据被动行走的理论,研制出了相当于人类的行走机器人。当时,这一研究成果发表在《科学》杂志上引起了不小的轰动,许多关于被动理论的延伸研究相继发表。然而,除了哈佛研发的机器人软外骨骼外,很少有研究成果能带来实际应用价值。外骨骼研究一直是近年来的热门研究领域,国内已有数十家企业在做。对于功能障碍者和特殊工种确实具有一定的使用价值。看到这些结果,我们对所涉及的理论感到好奇。人的步态到底是什么?许多医学家在分析人的步态后发现,记录下来的行走轨迹就像一团乱麻,有周期性但不重复。起初他们以为是噪音或步态不均匀的结果,但最后发现人走路时步态混乱。1998年发现当参数变化到特定值时,被动模型会表现出混沌特性。后来这一点也在实物中得到了证实。比如我们用被动理论做了一个有腿的机器人,它的行走数据表现出明显的混沌趋势。那么问题来了,人的行走是混乱的,为什么机器人行走被控制在一个周期内呢?TED上有这样一个视频,一个帕金森患者上下楼梯必须扶着扶手。后来,他的孙女做了一个实验,在平坦的地面上画了多个台阶,病人可以在没有扶手的情况下行走。完全独立行走。当然,这与帕金森病的发病机制有关,但也说明与动力学有一定关系。帕金森病的实质是神经系统存在局部障碍和传导障碍。这个案例说明,通过视觉刺激恢复神经系统的正常功能,或许可以解决这个问题。传统步行机器人按照单周期步态进行控制,首要解决的问题是稳定性,而人的步态可能比较混乱。我们能否从被动行走中找到人类步态的一些动态解释,并利用这些动力学来提高机器人或助行器的性能?如果按照混沌的特性来控制,或许会产生完全不同的效果。在这里,我们做了一些动力学轨迹的案例研究。如下图所示:从SK开始,回到下一个登陆状态,是周期性的,重复的。从S0开始,下一个着陆点是S1、S2、S3、S4。红点是最后的地方,是一个稳定的值。单周期步态是一致的,这与我们的系统非常相似。如果给系统这个参数,系统最终会掉到红点。如果我再给系统一个参数,用一个红色的参数欺骗它,结果就是它走到第二步或者某一步的时候会在红点附近经过。.显然,对于目标红色点,使用红色参数比使用黑色参数更好(它有一个逐渐收敛的过程)。如果你用一个虚假的目标来欺骗它,那你就得考虑用哪个目标来欺骗它比较好?这里需要做很多计算。首先,我需要知道红色轨迹和所有可能的黑色轨迹是什么,将它们全部计算出来,从中选择最优轨迹,然后将参数发送给系统。最后,该系统等价于现代控制理论中传统状态方程的反馈控制问题。这个方法来自混沌控制中最经典的OGY方法。在这里,我们提出了一种MPC方法,通过大量计算发现MPC远优于传统的OGY方法。并且如果机器人处于坠落状态,还可以通过电脑寻找合适的轨迹恢复运动,大大扩展了稳定范围。目前我们还不能实现在线计算和预测,但是我们实现了一个只有5组参数的实验。即我们预先计算了5组不同参数的步态,每组参数对应一个稳定的周期性步态,即5组不同速度(草地、斜坡、石狮路等5条不同路径),稳定性是通过计算切换轨迹来实现的。这与我们最初的强力稳定方法不同。我们的控制量不是控制系统的某个指标,而只是控制参数。如果索引发生变化,我会更改参数而不是更改输入值。然后将参数的变化转化为每个关节的电机。这样可以做出替代的结果,不同于传统的控制,属于参数激励方法。此外,我们还制作了一个真正的两条腿两条胳膊的人形机器人。它还需要严格依赖计算方法。目前还没有得到最终的结果,以后有机会向大家展示最终的结果。我今天的报告到此结束。谢谢你们!