今天,在花千树春风吹拂的北京,我们举办了一场盛大而专业的生成式人工智能春季晚会。
智东西网4月18日报道,以“重构世界,走向未来”为主题的中国生成人工智能大会今日正式开幕。
今明两天,54位来自产学研投的重量级嘉宾代表将同台探讨生成式AI的未来。
发展现状及未来趋势。
会议首日,由欧洲人文自然科学院外籍院士、清华大学人工智能研究院常务副所长孙茂松领衔,25位嘉宾围绕大语言模型、视频生成、体现智能、音乐生成、世界模型和垂直行业。
分享大模型、AI全栈软件、加速大模型端侧部署等前沿话题的最新研发和实践经验。
平米的宴会厅内,线下与会者人山人海,开幕式现场座无虚席。
就连下午收费的具身智能技术研讨会分会场也座无虚席。
展区也是人头攒动,交流气氛热烈而激烈。
值得一提的是,在大会上,AI+终端初创公司通科科技正式发布了其自主研发的WAKE-AI多模态大模型,针对眼镜等未来终端进行针对性优化,具有文本生成、语言理解、图像识别和视频生成等功能。
以及其他多模态交互能力。
作为智易科技打造的行业峰会IP,中国生成人工智能大会由智西西和智易联合主办。
它安排了覆盖生成人工智能全产业链的多种主题,并将于明天上午公布中国生成人工智能企业TOP50。
“过去一年,生成式人工智能发展迅速,全产业链已成为全球创新、投资和应用最活跃的领域之一。
”智易科技联合创始人兼CEO龚伦昌代表主办方在大会上致辞,“我们正站在一个历史的转折点,见证并参与由生成技术引领的新一轮技术变革” ▲智易科技联合创始人兼CEO龚伦昌还预告了今年的几场重要会议——中国生成式人工智能上海站将于11月举行,中国智能汽车算力峰会将在上海举行。
6月在深圳举行;第六届全球人工智能芯片峰会和第六届全球自动驾驶峰会将分别于9月和12月举行,欢迎大家参加。
1.高端对话:洞察中国创新机遇,开源与闭源路径选择热点讨论。
高端对话会以“解构生成式人工智能浪潮,洞察中国创新与机遇”为主题。
由智易科技联合创始人、智车信行业媒体主办,Matrix主编张国仁主持,启明创投合伙人周志峰、盛数科技联合创始人兼CEO唐家宇分享了自己的观点生成式AI投资策略、大模型商业化路径等话题。
张国仁表示,近两年来,我们确实发现生成式人工智能从热门话题甚至科技圈外的话题变得越来越务实,开始成为真正的新生产力,助力产业创新和各行各业。
发展。
启明创投的周先生谈到了洞悉趋势的方法。
这三个假设对于他自己的判断来说都是非常有价值的参考。
作为国内前沿大模型技术和应用探索的前沿参与者,圣树科技对技术和趋势的洞察也对行业有价值。
研究。
▲智易科技联合创始人、智车信产业媒体矩阵主编张国仁,“启明创投是国内投资大车型数量最多的创投机构之一。
”启明创投合伙人周志峰表示,启明创投在过去2年、2017年持续布局大模型,是基于三个假设:第一,生成式AI仍处于发展初期,且基础技术创新是主流;其次,大多数模型企业最终都会演变成模型应用综合型企业,其对外输出就是应用。
更容易把握技术边界,推动产品创新;第三,现阶段资金大部分流向大型模型公司,提供更多迭代机会。
周志峰认为,生成式AI应用企业从0阶段到1阶段的成长时间比其他领域更长,需要克服TPF(技术-产品契合)和PMF(产品-市场契合)两大挑战同时,而其他领域通常只需要面对PMF是一座大山。
无论是创业者还是投资者都需要更大的耐心和决心。
▲启明创投合伙人周志峰与圣数科技联合创始人兼CEO唐家宇分享,圣数科技之所以选择原生多模态大模型技术路线,是因为图像、3D、视频相当于视觉模态。
训练中存在着相辅相成的关系。
同时,在商业化方面,通用大模型可以应用于更多场景,能够快速响应场景需求的变化。
当谈到开源和闭源的选择时,他认为各有适合自己的商业路径。
开源最大的价值在于生态建设,但从提升模型能力的角度来看,闭源依然会领先于开源。
▲盛数科技联合创始人兼CEO唐家瑜 2. 多模态生成新范式概述,从视频、音乐、人物到具身智能。
在今天的发布会上,国内视频生成模型先驱爱石科技分享了其积极追求Sora务实思维、体现智能代表玩家的银河万能机器人,理性探讨了当前的局限性和进步方向。
刚刚发布天宫3.0大模型的昆仑万维,带来了对尖端SOTA模型的猜测。
阿里巴巴统一实验室解读人类视频生成新范式。
爱视科技创始人兼CEO王长虎在大会开幕式致辞中表示,《Sora》是“一个能够推动行业发展的卖家秀”,并在视频生成中验证了扩散变压器的缩放定律。
我们很快将见证视频创作者的工作流程、内容生产和消费链被彻底改变。
在他看来,追赶Sora的窗口是在一年前,而不是现在。
中国在短视频领域领先全球,短视频也是最贴近用户的内容形式。
在过去的一年里,大视频模型经历了从量变到质变的转变。
爱视科技于今年1月正式推出PixVerse。
它已生成超过10,000个视频,并被世界各地的创作者广泛应用于AI内容创作。
▲爱石科技创始人兼CEO王长虎于2019年5月创立银河优傲机器人,是中国具身智能代表性初创公司之一。
北京大学助理教授、银河优傲创始人兼CTO、致远具身智能中心主任王鹤表示,目前通用机器人大型具身多模态模型的局限性在于数据来源有限,难以输出动作高频率。
他提到了应对这两大挑战的方向。
一是通过模拟世界提供训练数据,二是利用三维模态模型来提高泛化性和速度。
对此,银河优傲机器人构建了三级大模型系统,包括硬件、模拟合成数据训练的泛化技能、大模型等。
基于该系统,机器人可以实现跨场景、物体的开放语义广义抓取基于人声指令的材料、形状和物体放置,成功率高达 95%。
▲北京大学助理教授、银河优傲机器人创始人&CTO、致远实体智能中心主任王鹤、昆仑万维董事长兼CEO方瀚强调了人工智能领域“技术领先”的重要性,与互联网时代的产品不同。
商业模式导向,大车型时代应该是技术导向。
韩方表示,OpenAI在人工智能初创公司中的地位本质上是由其大文本模型的SOTA(目前技术指标第一)能力带来的。
对于现在的AI创业者来说,只要能够在图像、视频、音乐等任意赛道获得SOTA,就可以通过技术优势获得大量用户,进而通过产品创新和业务在平台上固化用户模式创新形成自己的护城河。
▲昆仑万维董事长兼CEO方瀚阿里同义实验室XR团队负责人薄烈峰通过4大框架解读人类视频生成新范式。
基于这些框架的应用正在逐步在统一钱文APP中落地。
角色动作视频生成框架Animate Anybody可以基于单张图片和动作序列输出稳定可控的角色动作视频;基于服装图片和人物图像的人物穿衣视频生成框架Outfit Anybody;角色视频角色替换框架Motionshop使用Video2Motion,根据视频角色动作驱动3D数字人物;人物唱演视频生成框架Emote Portrait Alive可以基于单图和音频输出准确、生动的人物唱演视频。
▲阿里巴巴同义三实验室XR团队负责人薄烈峰。
大车型进入2.0时代!四大趋势、四种要素、三个实施阶段。
开源大模型领军者Meta为何痴迷于世界模型?大模型应用落地亟待解决哪些挑战? Meta原首席项目负责人胡鲁辉表示,以多模态大模型为主的后GPT-4时代呈现出四大趋势,一是语言模型向多模态大模型转变,二是数据融入向量化数据库,第三个是第一个是Agent到大模型操作系统,第四个是微调到Plugin。
他认为大模型是实现AGI最可靠的方式,并预测AI 2.0的下一个突破点和大方向将是AI for Robotics。
这需要了解物理世界面临的挑战,包括数据标准化、分散的模型和复杂的场景、环境硬件的限制、昂贵的计算能力和较长的训练时间。
▲前Meta首席项目负责人胡鲁辉和云天励飞《云天天书》大模型技术负责人于小吹将大模型比作人类知识的信息压缩器,即压缩海量数据,学习统计规律。
在大模型的四大要素——参数、算力、数据、人才中,他认为人才是最重要的基础,与其他要素结合才能实现海量信息的高效压缩。
于小吹将大模型的落地分为三个阶段:技术找场景、场景反馈技术、场景找技术。
目前在第二阶段,需要挖掘更多深层场景的数据,有针对性地提升算法能力,在技术实现的精度、成本、效率的“三角约束”之间找到平衡点。
云天励飞的解决方案是“基于算法芯片”。
▲宇天力飞《云天天书》大型模型技术总监于小团和万星科技副总裁朱伟表示,目前大型模型正从图文的1.0时代迈向以音视频多媒体为主导的2.0时代载体。
视频创作的需求巨大。
但从长远来看,视频相关模型仅占极少数,大型模型在音视频领域的应用面临着数据集缺失、视频内容结构和层次复杂、视频质量要求高等严峻挑战。
计算能力成本。
进入2020AI视频年,万兴科技将于4月28日正式启动万兴“顶屏”音视频多媒体模型公测。
该模型具有多媒体、垂直解决方案、算力数据、应用三大特点本土化。
它将支持一键生成60秒视频,并具有基于视频的视频、文森音乐、文森音效等多种能力。
▲万星科技副总裁朱伟思联合李未科技推出首个多模态AI大模型。
AI基础设施升级助力提质增效。
进入大模型时代,算法、应用和AI基础设施都在竞相竞争。
。
通高科技合伙人兼AI负责人顾健宣布,通高科技首次发布针对“AI+终端”定向优化而开发的多模态人工智能大模型平台WAKE-AI。
他分享道,相比手机和新硬件,眼镜可以带来极致的轻薄感,更适合AI在户外场景的落地。
WAKE-AI采用MoE架构,针对眼镜用户的使用方式和场景进行了优化。
可实现90%的语音返回速度,ASR错别率低于2%。
可为用户提供户外运动和文化旅游。
、日程管理和实时翻译等多模态AI服务。
古健还透露,通科科技即将推出搭载WAKE-AI的新终端产品。
▲中科曙光智能计算产品事业部副总经理、李未co技术合伙人、AI负责人古剑胡晓东表示,中科曙光通过异构平台和算力网络构建了算力基础和能力。
由于模型规模较大,闭环流程中的各个环节对软件栈的要求不同,构建AI全栈软件也至关重要。
在基础软件栈方面,中科曙光推出了DAS AI Software Stack基础软件栈,通过多种AI组件和性能组件支持大型模型的快速迁移和优化。
此外,中科曙光还聚焦AI开发平台、内容创作平台、训练推理平台等多平台服务,通过WorkSpace整合和调配平台能力,支撑AI能力落地实践。
▲中科曙光智能计算产品部副总经理胡晓东、阳光保险集团人工智能首席科学家杜新凯表示,大模型天然兼容保险底层逻辑,“数字化转型+智能化转型”大模型应用”已成为现阶段。
保险业发展新生产力最应该把握的科技主题。
基于阳光证言GPT大模式,阳光保险正在打造“三智”,即智能销售、智能客服、智能管理,并积极探索通过大模式深度赋能对传统保险业务模式的变革。
▲阳光保险集团人工智能首席科学家杜新凯、安谋科技产品总监杨磊指出,生成式AI正逐渐成为客户端设备上的人机交互界面,亿级参数级别的模型已经出现成为终端设备的最佳匹配规格。
然而,在终端部署如此大规模的模型时,仍然面临成本、功耗、软件生态等多重挑战。
在当前硬件驱动的大模型开发阶段,杨磊表示,异构计算是部署端侧大模型的理想选择,可以最大限度地提高SoC性能、能效和面积利用率。
NPU作为端侧AI应用的关键计算资源,将为大模型的分布式实现演进提供核心动力。
ARM科技自主研发的“周易”NPU针对大型模型场景,在架构、内存墙等方面做了诸多改进。
它采用多核设计,可同时支持卷积神经网络(CNN)和Transformer架构,并成功适配国内外多个主流大型模型。
▲安谋科技产品总监杨雷、联汇科技CEO兼首席科学家赵天成表示,大中型企业普遍存在“知识鸿沟”问题。
专业知识大量转移,检索效率低下,导致行业数字化转型受阻、技术创新遭遇瓶颈。
,这对多模态大模型驱动的新型知识引擎提出了要求。
联慧科技打造“模型+工具+应用”三位一体的产品栈,提供To B全栈AI2.0解决方案,通过智能人机对话、实时数据、自动识别等方式提升员工工作质量和效率。
决策能力。
▲联汇科技CEO兼首席科学家赵天成 5、圆桌对话:实现通用AGI有千种方式,开源至关重要慧模AI创始人兼CEO刘道全担任下午主持人圆桌讨论并带领嘉宾讨论了一系列关键问题,包括:大模型出现之前和之后的人工智能发展有哪些差异?您如何看待闭源和开源模式之间的争论?您在大模型开发过程中经历了哪些成就和挑战?刘道全认为,实现通用AGI的方法有数千种,开源是其中至关重要的一种。
刘道全及其团队于去年9月推出了中国第一个中立、开放的人工智能开源平台wisemodel.cn。
平台已收录国内各大大型模型公司和科研院所发布的最新开源模型。
▲wisemodel创始人兼CEO刘道全、vivo AI解决方案中心总监谢伟勤认为,大规模客户端模型将是未来AGI道路上的重要路径,能够为用户提供个性化服务的同时,更好地保护他们。
,并且还可以支持无网络和弱网络环境下的大型模型应用。
对于大型模型企业来说,还可以节省大量的服务器成本。
vivo自主研发的蓝心大机型率先实现设备侧部署。
大模型和人工智能技术在多个方面提高了人类的能力。
例如,多模态大模型的图文理解和问答能力可以帮助视障用户了解周围的环境和事物,更好地工作和生活。
vivo将持续关注更多类似的大模型应用场景,并将支持更多开源模型。
同时希望借助开源社区的力量迭代大模型效果和产品体验。
▲vivo AI解决方案中心总监谢伟钦和硅基智能CTO林慧杰认为,虽然闭源模式暂时领先,但未来开源肯定会比闭源更好。
回顾互联网时代,领先的搜索引擎公司基于开源软件的力量打造产品。
对于开发者来说,开源无论在体验、效率还是质量上都更胜一筹。
“只有敢于开源的公司才能做出好的大型模型。
” ”。
对于AGI来说,硅基智能的愿景是让代码在数字空间中像人类一样感知、理解、表达和交互,即体现智能。
▲硅基智能CTO林慧杰、联辉科技CEO兼首席科学家赵天成认为,在AI技术前期存在不确定性的情况下,投资基础设施是明智的选择。
2016年回国创业时,他担心定制小模型成本太高,于是转向工具链等基础设施,随后逐步建立了预训练模型和Agent开发路线。
赵天成希望五年内每家公司都拥有自己的数字助理,效率提升10倍以上。
▲链汇科技CEO兼首席科学家赵天成总结:让我们一起探寻中国生成AI产业的脉搏。
除了上述嘉宾之外,下午的黑猩猩具身智能技术闭门研讨会上,还有7位技术专家分享了有用的信息。
继去年在北京举办国内首届备受瞩目的聚焦生成人工智能创新峰会后,今天,智能东西方与智能猩猩连续第二年联合举办聚焦生成人工智能领域的行业盛会。
我们希望通过丰富的议程设置、多元化的嘉宾经验分享、观点碰撞,让大家不虚此行。
明天,精彩还将继续。
来自产学研的29位代表将围绕AI基础设施、AIGC应用、AI代理、智能计算中心等分享相关技术和应用,探讨中国生成人工智能产业脉搏。