当前位置: 首页 > 科技迭代

天眼新知识-来自未来的机器人与大型模型碰撞,擦出“智慧”的火花

时间:2024-02-21 19:01:22 科技迭代

前言:随着我国数字经济的深入发展,工业数字化进程不断加速,大数据在工业决策中的比重——制作越来越高。

天眼查数据研究院特推出“天眼新知”栏目,依托天眼查大数据梳理产业结构和发展脉络,解读行业最新动态和投融资动态,为决策提供参考各方。

本文为天眼新知·产业分析系列文章第三十七篇。

大多数人第一次与机器人的“亲密接触”都来自于科幻电影,来自于超越现实生活的无尽想象。

机器人逐渐从“单纯的工具”演变为“亲密的伙伴”。

年初火爆的“大模型”和再次“火爆”的人形机器人,让人们再次感叹科技给生活方式带来的改变。

未来,随着人工智能技术的不断成熟和人形机器人研发的突破,“机器人走进普通人生活的愿景”将越来越接近现实。

1、机器人:从“自动化”向“智能化”演进 国际机器人联合会(IFR)提出机器人是可以在两个或多个轴上进行编程并具有一定程度自主性的驱动机构。

,在特定环境中移动以执行预定任务。

1、机器人的应用场景逐渐从“简单初级”走向“复杂高级”。

最初,机器人的核心功能是代替人从事重复性、危险性的工作,同时提高效率和准确性;后来,“为人服务”的功能机器人走进了人们的视野,并被应用于接待、接待等更贴近人类的场景。

娱乐/扫地机器人已经大规模走进千家万户。

然后将其高精度特性应用于物流、医疗、自动接送、辅助护理等领域。

机器人开始出现。

2、机器人逐渐从“自动化”向“智能化”演变。

机器人的发展经历了三代的演变。

第一代是程控机器人:通过编程或示教将动作指令输入机器人。

由于缺乏外部传感器,机器人只能僵化地完成程序规定的动作。

一旦环境条件稍有变化,机器人的工作就会出现问题;第二代是自适应机器人:它具有视觉、力等传感器,可以根据传感器获得的信息进行调整。

工作状态:第三代是智能机器人:它拥有更丰富的传感器,不仅可以获取并处理外部的综合信息,甚至可以据此设定自己的行动目标。

其智能主要体现在感知交互、自主决策、自我优化三个方面。

方面。

2、大模型:不少城市持续发力,主攻通用人工智能。

2023年4月中共中央政治局会议指出,要重视通用人工智能发展,打造创新生态系统,注重风险防范。

与中央经济工作会议等以往重要会议普遍提及的“人工智能”不同,本次政治局会议明确强调“通用”,即去年11月以来Chat-GPT主导的通用AI大模型技术路线。

图1主要城市人工智能政策清单(不完全统计) 以人工智能产业发展高地北京为例。

北京《若干措施》的发布,是我国地方政府首次提出的密切跟踪人工智能大模型产业发展的专项举措。

北京打响了本土大型模特大赛的第一枪。

在Chat-GPT引发的“千模大战”即将打响的当下,大模型或将给各行各业带来新的效率革命和体验升级。

随着人工智能第一城北京行动,上海、深圳、成都等地区也相继行动,抢占发展“窗口期”。

3、人形机器人:人与机器的“意外相遇”。

从定义和使用目的来看,人形机器人是具有与人类相似的外观和运动方式的智能机器人。

人形机器人,又译为“人形机器人”,字面意思是为了模仿人类形态和行为而设计和制造的机器人。

目前人形机器人还没有统一的定义,但根据专业书籍《Humanoid Robots》的说法,人形机器人应该能够“在人类工作和生活的环境中工作,操作为人类设计的工具和设备,并与人类进行交流”。

在此前提下,人形机器人最终应具有类似人类的身体结构,包括头部、躯干和四肢,采用双足行走,采用多指手执行各种操作,并具有一定的认知和决策智能。

人形机器人始于20世纪60年代末,其中日本的研究成果最受关注。

1973年,日本早稻田大学加藤一郎教授研制出世界上第一台人形机器人WL-5双足步行机WABOT-1。

严格来说,它是一种仿生机器,是人形机器人的雏形。

1986年,日本本田开始仿人机器人ASIMO的研究,并于2000年成功发布第一代模型。

图2 仿人机器人信息展示(不完全统计) 4. 仿人机器人与AI大模型:共同场景加速人工智能革命性进步C端。

随着集成设计技术、运动管理控制技术、传感器感知技术等关键技术的不断突破,与人工智能、5G等新一代信息技术的融合应用不断深入。

特种机器人在煤矿、深海、极地等场景加速应用,释放出巨大的生产和科研价值。

其中,最让前沿科技公司和普通消费者着迷的“最重要的是以人形机器人为代表的智能移动机器人的出现和迭代。

目前,人工智能技术通过构建智能机器人,让机器人自主操作成为可能。

”全面感知、实时互联、分析决策、自主学习的系统。

AI通过机器人视觉技术增强机器人的感知能力,并通过构建算法模型提高其自主分析、决策、学习的能力,使机器人能够独立完成任务。

1.感知世界的能力(机器人的眼睛)。

在机器人自主运动的传感和定位技术中,激光和视觉导航是主流的应用方案。

计算机视觉的发展经历了以特征描述符为代表的传统视觉方法和以CNN卷积神经网络为代表的深度学习技术。

目前,通用视觉大模型正处于研究探索阶段,人形机器人的场景比工业机器人更加复杂。

通用的、更复杂的大视觉模型All in One多任务训练解决方案可以使机器人更好地适应人类的生活场景。

一方面,大模型强大的拟合能力使得仿人机器人在执行目标识别、避障、三维重建、语义分割等任务时能够获得更高的精度。

另一方面,大型模型解决了过度依赖单一深度学习技术的问题。

任务数据分布问题、场景泛化效果差。

大型通用视觉模型通过大量数据学习更多通用知识,并将其迁移到下游任务中。

基于海量数据的预训练模型具有更好的知识完备性,提高场景泛化效果。

典型产品:特斯拉“擎天柱”感知级,特斯拉机器人头部采用8个摄像头收集视觉信息。

在计算层面,机器人将采用特斯拉汽车目前使用的FSD(全自动驾驶)计算机,并利用神经网络等模型实时处理信息。

特斯拉将使用超级计算机“Dojo”来训练机器人使用的AI模型,使其能够更有效地识别和响应外部物体。

2.思考和决策的能力(机器人的大脑)。

目前的机器人都是专用机器人,只能在有限的场景中使用。

即使是基于计算机视觉的机器人抓取,也仅限于场景有限,算法也仅用于识别。

对象、如何做、做什么仍然需要由人类来定义。

如果你想让一个机器人通用并要求它浇花,它就会知道如何拿到水壶,拿起水,然后浇花。

这是需要常识才能完成的事情。

如何让机器人具备常识?在大型模型出现之前,这个问题几乎是无法解决的。

大模型让机器人拥有常识,从而具有完成各种任务的多功能性,彻底改变通用机器人实现的模型。

人类工具对环境的适应性消除了为机器人构建工具的需要。

典型产品:第一个机器人公民“索菲亚” 2017年,索菲亚成为世界上第一个获得公民身份的机器人。

她说她会用她的智慧帮助人类发展,让我们不要害怕她,她很友好。

2018年,她还成为全球第一位开展在线教育课程的AI老师。

索菲亚表示,未来的机器人完全胜任教师的工作,能够基于与学生的互动,有效解决学生遇到的心理和情感问题。

3、执行能力(机器人肢体)移动能力(腿)+精细操作(手)。

将机器人制作成人形形状,是为了让机器人的执行能力更加全能。

机器人执行任务的环境是根据人体形状构建的:建筑物、道路、设施、工具等。

这个世界是为了方便像人类这样的类人生物而设计的。

如果出现一种新形式的机器人,人们就必须重新设计一个新的环境让机器人适应。

设计一个机器人来执行特定范围内的任务相对容易。

如果想要提高机器人的多功能性,就必须选择能够充当克隆人的人形机器人。

另外,人类更容易与人形机器人进行情感交流,人形机器人会让人们产生亲近感。

典型产品:波士顿动力Atlas 2020年12月,波士顿动力发布了一段Atlas跳舞的视频,动作流畅且富有表现力。

在舞蹈中,机器人需要在空中跳跃的同时调整姿势,以保持平衡并做出精确的动作。

2021年8月,在最新的官方视频中,Atlas可以在障碍环境中“跑酷”,进行跳跃、俯冲、翻滚、翻筋斗等一系列高难度全身动作。

4、“具身智能”+机器人:人工智能的终极形态如何让计算机拥有一岁孩子的感知和行动能力的问题催生了“具身智能”的概念。

可以简单理解为各种不同形态的机器人,让它们在真实的物理环境中执行各种任务,完成人工智能的进化过程,比如:人形机器人、智能驾驶汽车,或者未来的“变形金刚”。

英伟达创始人黄仁勋在 ITF World 2023 半导体大会上表示,Embodied AI 是一种能够理解、推理并与物理世界交互的智能系统。

这是人工智能的下一波浪潮。

具身智能的最大特点是能够从主角的角度自主地感知物理世界,利用拟人化的思维路径进行学习,从而提供人类期望的行为反馈,而不是被动地等待数据的馈送。

仿人机器人提供了基于人类行为的各种学习和反馈系统,为实现更复杂的行为语义提供了迭代基础和试验场。

因此,人形机器人的逐步完善也为体现智能的实现提供了方向。

它是体现智能的重要应用场景,也将为体现智能的迭代优化提供方向和空间。

5、专利技术:机器人、大型模型专利申请量逐年增加。

1、机器人专利:近年来,机器人与大数据、人工智能等前沿科技产业结合更加紧密,尤其是仿人机器人的出现,使机器人成为一种技术的“技术”含量该行业日益壮大。

从数量上看,机器人专利保持稳定增长,2022年专利申请量超过2.3万件;从类型看,发明专利和实用新型占比较高,两者占比90%。

2、大车型专利:大车型的“爆发”并非毫无征兆。

在人工智能领域,自然语言处理作为人工智能领域的“皇冠上的明珠”,是一种理解人类语言、情感和思想的技术。

从它的“三言两语”的介绍中,你就可以了解到它在“机器”中的作用是什么。

“人是什么”的重要性和极高的难度。

从近年来专利申请量来看,保持了较为稳定、较快的增长。

2018年以来,其应用复合增长率达61.2%;从类型来看,发明专利占据绝对领先地位,占比接近98%。

天眼查研究院认为,大模型技术推动人工智能实现历史性跨越,未来仍有广阔的持续创新空间。

中国经济社会高质量发展为大规模模式创新提供了丰富的场景和数据基础。

人工智能在中国发展潜力巨大。