10月24日,由声网与RTE开发者社区联合主办的RTE第九届实时互联网大会在北京。
SoundNet与众多RTE领域技术专家、产品精英、创业者、开发者共同围绕“智能·高清”主题展开新的讨论。
本次RTE大会将持续2天,设有1场主论坛和20+场专题活动,包括RTE领域的技术发展、趋势洞察、行业观察、风险投资等多维度内容分享,涵盖时下话题AIGC、海外扩张和数字化转型。
最热门的话题。
在24日的主论坛上,声网创始人和CEO赵斌、声网合伙人和客户成功副总裁·孙雨润发表了《智能·高清 开启实时互动体验新时代》主题演讲。
Space创始人创始人和CEO Steve Hoffman从国际投资者的角度洞察了AI赋能RTE未来的多种可能性。
首席科学家盛旺和CTO钟升聚焦AI时代实时交互趋势,带来最前沿的技术视角和解读。
联合国人口基金驻华代表处副代表兼主任艾拉·奥维森从“技术无国界”的角度介绍了实时交互技术给世界带来的变化。
此外,声网COO刘斌、喜马拉雅首席科学家陆恒、Soul APP技术副总裁张高正、小红书音视频架构负责人陈静、商汤科技数字娱乐事业部业务总监副总裁李兴业也分别谈到了“AI如何运作?”会议以“赋能实时交互体验提升、场景升级”为主题进行圆桌讨论。
智能化、高清化,开启实时交互体验新时代。
回顾这一年,AIGC大模型带动各行业迎来新商机,AR、VR、XR等技术能力的迭代为实时交互在各领域的应用提供了更多可能。
在直播社交领域,弹幕玩法已经成为直播新趋势。
这些变化正在影响 RTE 行业的发展。
智能化、高清化正在将实时交互体验推向新时代。
在大会开幕致辞中,赵斌宣布:“SoundNet在RTE行业首次实现了广播级4K超高清实时交互体验。
”他指出,“4K不仅仅是分辨率的纬度,光强的动态范围、色彩的真实度、亮度、饱和度以及色彩渐变的细腻程度,对于真正的超高清体验来说都是不可或缺的。
”级别超高清可以带来更真实的视觉效果,高对比度和丰富的色彩表现可以让图像更加生动、细节更加清晰,从而提升观影体验。
赵斌认为,虚拟人+AIGC所创造的情感和情感价值未来可能会解决目前社会供需不平衡的问题,并导致交互对象的变化。
另一方面,随着AIGC能力的进一步加强,越来越多的基于应用的开发将被AIGC取代,API+AI的形式将大大提高应用开发效率。
大型模型发展迅速,但交互界面仍仅限于文字聊天交互。
赵斌提到,声网经过一年来的投入和打磨,推出了业界首个AIGC-RTC能力模块,可支持与任意大型模型平台结合,实现更低时延、更自然、更沉浸的实时语音对话,为企业协作、社交、直播、游戏等多种场景提供新玩法、新机遇。
在AI等核心技术的推动下,实时交互QoE体验的变化对用户留存和使用行为的影响越来越大。
孙雨润表示,“根据东南亚领先泛娱乐客户Agora的数据,当视频从标清升级为高清时,停留时间超过30秒的观看人数增加19%,平均观看人数增加19%。
”人均观看时长增加30%,观众打赏率大幅提升。
国内某知名社交应用从CDN升级为声网快直播,送礼率提升12.3%。
“AI如何赋能RTE。
未来,AIGC被认为是当前的技术革命,它与RTE的深度融合会带来哪些变化?”呢绒? Space创始人创始人和CEO史蒂夫·霍夫曼在分享中指出:“人工智能将对很多领域产生影响。
在AI赋能的RTE未来,我们将看到每个人都将拥有更加个性化的体验和更加动态的节目会随着图形、音频和视频的实时变化而改变,人工智能将为我们带来前所未有的连接方式,在更深层次上,人工智能也将为人类增加更多的生产力水平,并带来动态的虚拟世界。
体验更身临其境的体验。
”史蒂夫·霍夫曼表示:“在AI和RTE技术的支持下,新的可穿戴设备可能会进入市场,比如新的皮肤电子设备和感官增强设备等,这使得我们能够听到超出人类听觉范围的频率。
此外,脑机接口还会读取我们的脑电波,帮助我们实现冥想或控制其他设备。
”在工业RTE场景应用。
,人们可以聚集在一起,通过虚拟或真实的工厂实时观看流水线作业、产品生产等。
在AI陪伴场景下,人工智能伴侣的概念将成为人们社交生活、娱乐、事业的一部分。
综上所述,未来可能会出现各类配套应用和新的实时接口方式,甚至可能会出现一套为RTE开发的新硬件,这将极大改变RTE领域的发展前景。
AI时代,实时交互将走向何方? AI时代已经到来,实时交互将走向何方?首席科学家盛旺和CTO钟升为我们带来了技术观点的深度分享。
钟升指出,回顾过去五年,最典型的事件就是大车型的突破。
从2007年的Transformer到今天的ChatGPT-4,人工智能的发展让信息传播和消费智能化的趋势越来越明显。
一切被中心化AGI接管的趋势和威胁越来越明显。
大模型带来发展机遇的同时,也带来了计算需求快速增长、计算能力受能源供应限制、大模型数据资源不足、存储需求增长过快等问题。
未来,除了负责任的AI之外,端边的分布式实时智能将成为公平价值分配的重要技术手段,以及缓解中心化AGI对人类威胁的有效途径。
这注定会成为一种新的技术发展趋势。
钟升认为,AGI将进入实时交互,让每个人都可以成为替身,帮助复制名师、网红、甚至普通人的应用场景,通过AI替身丰富体验,缓解稀缺瓶颈的时间。
此外,他预测,具有端侧实时智能的高清实时交互能力将成为新的趋势和竞争焦点。
钟升介绍,实时高清需要很多终端的实时AI。
在Low Level Vision和Audio层面,SoundNet的SDK 4.1.x和4.2.x版本已经可以支持超分辨率、虚拟化等P/4K视频。
背景、感知编码、降噪、回声去除等底层计算机视觉处理和高质量的计算机听觉处理能力。
在High Level视觉和音频层面,声学网络部分实现了对物体、声音、场景的理解和重构能力,包括人脸捕捉、动作捕捉、情感计算、物体识别、场景重构等,可以极大地提高完善多种应用场景。
用户体验较低。
科技赋能:共建数字包容未来在科技无国界的世界里,人工智能、实时交互技术、生物技术、材料科学等科技创新构建了“数字包容”的世界。
过去一年,联合国人口基金与声网通过实时互动技术,为中国偏远地区一万多名青少年提供了适龄健康教育。
联合国人口基金驻华代表处副代表兼主任欧文山表示:“人工智能和实时交互技术为仍在使用陈旧多媒体设备的学校提供??了量身定制的解决方案。
优化 提高直播分辨率,提升教学过程中的音视频质量,学生和直播老师可以达到与传统课堂一样的沉浸式教学质量和速度。
同时,欧文山宣布,联合国人口基金驻华代表处、声网等合作伙伴共同发起“智慧老龄化”青年创新挑战赛,以科技助老。
她说:“我们希望激励年轻人,特别是大学生和年轻毕业生,为代际数字包容贡献想法并采取积极行动。
”圆桌:AI如何赋能实时交互体验提升和场景升级? AI技术的发展给各行各业带来了用户体验的提升和场景玩法的创新。
就这一话题,喜马拉雅首席科学家卢恒、Soul APP技术副总裁张高正、小红书音视频架构负责人陈静、商汤科技业务总监数字娱乐事业部副总裁李兴业、声网首席运营官刘斌进行了圆桌讨论。
在谈到AI技术对业务发展的影响时,陆恒表示,作为国内最大的音频内容平台,喜马拉雅从文本处理到音频内容生成大量使用了AI技术。
目前,AIGC生成的音频内容日益增加。
平均播放量已超过10000小时。
张高政表示,理解大模型的能力对于UGC平台和用户来说都是非常有利的。
不仅可以快速提高内容生产的效率,还可以降低内容生产的门槛。
大型人工智能模型的发展既带来了机遇,也带来了挑战。
陈静指出,对于很多企业来说,清楚地解释一些大规模AI模型项目的必要性是一个巨大的挑战。
很多项目无法与一些用户留存和转化的指标联系起来,比如使用人工智能来增强体验。
李兴业表示,他看到的挑战有两个。
首先,在为很多C端流量产品提供服务时,与算力、带宽、智能相关的弹性储备是一个非常现实的挑战。
其次,大型模型开发厂商如何平衡投资与预期收入之间的关系也是一个挑战。
嘉宾们还分享了AI大模型在实时交互领域的一些玩法创新。
其中,陈静提到,提高主播收视率的美颜塑身功能,可能是过去AI在实时交互领域贡献最大价值的场景。
他希望未来能看到更多。
尝试更多新事物。
正如刘斌总结的那样,未来无论是挑战还是机遇,我们都应该在各自的行业中努力。
我们也期待看到大模型新范式发展下越来越多的场景落地和商业价值。