当前位置: 首页 > 科技赋能

启元AI击败中国星际冠军,发布“特工培训云平台”

时间:2024-05-20 01:59:23 科技赋能

6月21日,启元星际AI顶级职业选手挑战赛在北京举行。

启源AI“星帅”以两场2:0的比分击败了《星际争霸 I/II》国民王牌黄慧明(TooDming),以及中国星际最强人类选手、总决赛三连冠冠军李培楠(TIME)。

这是中国星际AI首次在公开比赛中击败国内顶尖职业选手。

本次赛事是国内首次星际AI与人类顶级职业选手的对战直播。

这也是启元世界以《星际争霸 II》为研究平台,苦心打造的智能“星际指挥官”首次以实时对战的形式向业界公开亮相。

战斗中,启元星际AI展示了多种战术和策略,甚至展示了人类职业比赛中从未出现过的战术,给参赛的两位职业选手留下了深刻的印象。

在与TIME的第一场比赛中,启元星际AI采用了大量维京战斗机结合少量坦克的新战术。

利用维京的机动性对TIME基地发起了突然袭击。

TIME不适应这种战术,陷入劣势,输掉了第一局。

在与TIME的第二场比赛中,启元星际AI展现了出色的多线协同进攻。

TIME也展现出了强大的防御能力,出色地应对了启元星际AI的多轮攻击。

然而,由于经济上的劣势,最终在一场精彩而激烈的战斗中落败。

该玩家赛后表示,在对阵启源星际的比赛中,他看到了维京推等新的打法和策略。

虽然是基于暴雪提供的AI专用界面开发的,而且APM略高于人类,但这些玩法还是给了大家很多新的启发。

更高的算力和性价比过去几十年来,人工智能在人类游戏中的表现一直是其发展的标志,是人工智能的“巅峰挑战”。

不仅研究《星际争霸》有难度,更重要的是,以《星际争霸》为平台进行Agent研究更贴近各行业的真实应用场景。

无论是DeepMind、Facebook还是启元世界,都以《星际争霸》为研究重点。

自2019年8月成立以来,启源世界一直致力于打造智能产品,将智能带入每个行业、每个家庭、每个人,提升产业效率和生活体验。

公司团队核心成员来自BAT、Netflix、IBM、香港科技大学、伯克利分校等国内外知名高科技公司和一流大学,多次荣获国际竞赛奖项例如 NeurIPS 和 CVPR。

自2018年4月亮相第38届ACM全球总决赛并推出AI人机协作挑战赛以来,启元AI《星际指挥官》进步神速。

2019年11月,它从零开始学习,在局部战斗中自我对抗,达到了人类大师级别。

2016年9月达到白金级,以3:0击败人类黄金级玩家。

12月达到钻石级别,并在顶级人工智能峰会NeurlPS上进行了现场演示。

此次,启元星际AI以两场2:0的比分击败了中国星际特鲁姆普,用半年时间从钻石级晋级到顶级职业选手级别。

秘诀就在于启元通过小样本学习找到了自主研发路线并优化训练。

平台。

官方表示,团队目前仅使用顶尖科技公司1%的算力就让启元星际AI达到人类顶尖职业选手的水平。

目前的启元星际AI已经具备了在复杂场景、信息不完整的情况下提取信息并做出决策的能力。

它自行开发了数百种战术,其中许多已达到专业标准。

为了在1%算力的条件下达到与顶尖科技公司同等的水平,启元世界从工程和算法层面都进行了深度优化,最终通过乘数的叠加实现了看似不可能的“奇迹”影响。

”。

在工程层面,启源世界打造了一支世界一流的工程团队。

通过独创的“数据生成-传输-消费”一体化计算框架,与传统机器学习框架和开源软件相比,在 ATARI 等标准测试中,智能体训练的数据吞吐量提升了 10 倍以上。

在算法层面,启元世界自主研发的小样本学习算法,实现了仅用数千场比赛数据训练人类中型学生的目标,解决了中非信息完整的复杂博弈、超大决策等难题。

- 制作动作空间和实时对抗。

横向智能。

其自主创新的Agent Commander神经网络结构,结合高效的群体进化训练方法,不仅可以增强Agent的鲁棒性,而且可以在有限算力条件下实现Agent的快速进化。

在这片勇敢科技的“无人区”,启源已积累了不下30项专利和软件著作权。

“特工训练云平台”发布 成功击败人类顶尖职业选手后,《星际指挥官》背后的秘密武器——启元智能训练云平台也闪亮登场。

正是通过智能代理训练云平台,《星际指挥官》只需要几千轮的小样本就可以启动,通过模仿和超越高手就可以达到人类顶尖玩家的水平,并且还可以在远远超过人类玩家的速度。

迭代进化。

《星际争霸》这只是智能代理训练云的一个“试验场”。

其源的目标是通过智能代理培训云平台,帮助各行各业培养适合自己的智能代理,助力产业升级。

智能体训练云平台将为智能体开发者提供便捷的编程接口,调用高效的算法库、网络模型库和训练方法,快速开发和构建自己的智能体。

同时,平台还将根据训练任务进行弹性算力调度,匹配智能体的推导和训练速度,实现高效超大规模并行训练。

目前,启元的“智能座席培训云平台”已广泛应用于全国数十家商业组织和机构,涵盖数字娱乐、公共科技、机器人等行业。

活动结束后的圆桌环节,北京致远人工智能研究院院长、北京大学黄铁军教授、滴滴高级副总裁张文松、快手高级副总裁颜强、高榕资本创始合伙人岳斌、启源世界CEO袁泉共同探讨了智能体在实现工业智能化、重塑虚拟世界、打造沉浸式交互体验方面的无限潜力。

据介绍,启元世界正在与顶尖游戏公司合作开发首款智能代理游戏。

每个角色背后都有一个智能代理,这将大大提升玩家的游戏体验。

北京致远人工智能研究院院长、北京大学教授黄铁军教授认为,智能科学是一片无尽的疆域。

人类智慧是亿万年进化的产物。

机器智能虽然只有几百年的进化过程,但进化速度却非常快。

“今天我们走在正确的道路上,用行为主义的方法训练复杂的神经网络肯定会产生越来越强的智能。

”滴滴出行高级副总裁张文松介绍了智能代理在城市交通调度中的作用以及其应用前景,智能代理可以转型为各行业的调度员,尤其是交通优化。

目前,启元世界正与合作伙伴共同参与智慧城市建设。

通过智能代理,每隔几秒自动调度和优化交通信号灯,极大缓解交通拥堵。

高榕资本创始合伙人岳斌提到,智能体在智慧医疗、新药探索和研发方面有着广阔的前景,将成为人类未来面对疫情时的重要助手。

快手高级副总裁严强表示,智能代理在娱乐内容的制作上还有很大的探索空间,比如创造更真实的虚拟陪伴,展现人文关怀。