当前位置：首页 > 科技赋能

腾讯云智能打造AI+数字智人生产工厂，3分钟样本训练即可定制数字化身

时间：2024-05-19 16:39:53 科技赋能

“大家好，我是刘兴亮，这是我的第一个数字智人克隆体。

” 4月25日，在腾讯云智能“数字智能媒体传播大会”上，数字经济学者、刘兴亮现场展示了他专属的“数字智能”，以及由此输出的短视频“三大亮点” “数字智能克隆”。

刘兴亮分享道：“这张图片很像真人，面部表情和唇形很自然，完美模拟了我独特的口音。

它是腾讯云智能数字智人的一个小样本。

未来，它不会是一样的。

” ”。

我不需要布置拍摄场地，也不需要提前化妆排练。

我不受空间或时间的限制。

数字智能可以帮助我随时随地生成语音视频，解放我的生产力。

” （图：数字经济学者与刘兴亮使用小样本数字智能制作视频）越来越多的数字人进入各行各业并投入实际应用，但高昂的生产运营成本却让很多企业望而却步。

如何让数字人从大企业走向小商家，成为小微企业的“选择”，甚至成为个人创作者的创作工具？过去复杂的训练样本数据采集导致数字人的定制过程漫长且成本高昂，一定程度上限制了数字人的快速应用。

沟通会上，腾讯云智能小样本数字智人生产平台首次发布。

该平台具有训练样本小、生产效率高、自动化生产等特点，可以轻松实现“自助式”数字化智人生产。

依托腾讯自研的AI能力和技术经验，该平台可在24小时内，通过音频和文本多模态数据输入，对真人的口述视频和句子语音素材进行短短3分钟的实时建模和生成高清肖像。

创造一个类似于真人的“数字智人”。

数千元的成本和数小时的制作时间大大降低了数字人的使用门槛。

腾讯云智能小样本数字人为短视频创作、知识分享、带货直播等场景应用提供更多可能。

腾讯云智能数字智能产品总经理陈雷表示，腾讯云智能致力于打造自动化的“AI+数字智能工厂”，以“自助”的一站式平台实现采购、生产、服务。

生产、销售、服务”。

将数字应用于智人。

通过开箱即用的数字智能服务，腾讯云智能还将开展广泛的生态整合合作，与合作伙伴一起在各行业落地更现实、更智能、更高效的数字智能应用。

自主研发的小样本智人驱动技术框架，实现24小时数字化身复制。

腾讯云智能依托其自主研发的小样本智人驱动的前沿技术框架和基于自我监督机制的通用多模态模型，让用户可以提交意见。

利用少量样本数据进行AI训练，如3分钟的真人口语视频和句子语音材料，可以获得与真人图像和声音相似的数字智能人，并将生产周期缩短至日级。

千元的价格和自助服务使数字智能成为“实惠”的数字服务。

陈雷表示，智人小样本支持半身和全身图像显示。

手势和动作会根据内容灵活调整。

还支持录制背景任意变化，适用于直播等更广泛的商业场景。

与2D真人数字人相比，小样本数字人不需要专业录音室录音材料，价格更便宜；与根据照片生成、只能显示面部形状的数字人相比，小样本数字人可以根据文字设计手势、嘴唇动作、嘴形和表情，再现真人的风格。

（小比例数字智人的图像和色调接近真人，支持半身和全身图像显示，适合更广泛的商业场景）以口语广播视频的制作为例以知识共享为例，小型数字智人可以代表医生、律师等专业人士出现在现场，大大节省了视频录制时间。

交流会上，浙江舒兰医院盛国平医生演示了如何利用“数字克隆”输出医学知识科普视频，缓解繁忙工作中的视频录制压力。

按日计算，如果“化妆发型+调试+录音”平均每期两小时，一周可节省14小时，一年可节省近小时，相当于节省30个小时-40天的生产时间。

。

打造数字化AI aPaaS平台，提供“生产、销售、服务”一体化服务。

为了加速数字化AI服务的普及，腾讯云智能还提出了自动化“AI+数字化AI工厂”的方向。

开箱即用的AI制作服务依托腾讯云TI平台，内置10余种AI算法能力。

未来，无需任何算法或研发经验，只要将视频和语音培训材料导入平台，就可以通过“自助”服务完成数字智人形象和音色的大规模定制。

针对数字情报运营，腾讯云智能提供广播级数字情报平台和互动式数字情报平台服务。

广播数智平台支持通过文字、语音输入快速生成数智视频；互动数智平台可打造“超长待机”数智员工，定制专属问答库，提供7*24小时人机双向交互服务。

同时，还可以实现数字智能人的直播服务。

直播间24/7中断，真人的声音可以自由切换，接管并与用户问答互动。

陈雷表示，腾讯云智能重点做强aPaaS数字智能平台，以API接口的形式向合作伙伴开放一体化的“生产、销售、服务”服务，支持合作伙伴开发更多适合垂直行业、垂直领域的数字智能解决方案。

场景。

人员 SaaS 服务。

目前已有数十家合作伙伴依托平台向行业提供数字智能真人直播SaaS和知识口播SaaS应用，覆盖医疗、媒体、金融等多个行业。

作为腾讯云智能的生态整合合作伙伴，医疗微讯创始人兼CEO潘庚表示，腾讯云智能数字人生产运营能力的开放，帮助我们为客户打造了适合医疗行业的数字人服务。

微媒数字大会CEO天虎表示，微媒将努力打造云智能的数字化身解决方案，形成可持续的品牌营销生态系统，为企业和个人打造IP。

恢复“皱纹级”图像，再现“音素级”声音。

腾讯自2016年开始投入数字人的研发和服务，是国内最早投资数字人领域的公司之一，已发表数百篇相关技术会议和期刊论文。

，近百项专利。

在技??术解读分享中，腾讯优图实验室研究总监王成杰表示，2D小样技术的背后是3D技术。

“智人的一个小样本直观上感觉是2D视频，但背后其实是3D人像。

从“文本/音频”信息到“3D人像驱动”再到“2D人像视频”模式，通过3D人脸结构中先验信息的引入，使得人物的身材和表情更加准确，让小样本的图像还原到“皱纹级别”，而“小（样本）”的背后是“”。

基于自监督机制的通用多模态模型已经在大规模数据上进行了训练，可以将语音和文本与肖像的面部表情和嘴型关联起来。

“3分钟”的训练视频基于这种模型，学习每个人的个性化发音和口型特征，王成杰表示，虽然小型数字智人的使用门槛和成本已经大大降低，但他们希望“用跑车的性能来服务家庭用车”。

用户”，通过多种视觉AI技术的综合运用，提高小规模数字智人的质量。

包括高精度人像分割、光照优化、人像美化、视力矫正等。

他举例说，当录制的视频出现黑暗、朦胧等情况时，一小部分智人样本可以通过光照优化来提高亮度技术，还可以通过高精度人像美化来改善皮肤质感。

在声音再现方面，基于腾讯自主研发的新一代小样本音色定制技术，依托深度学习声学模型和神经网络声码器，小样本数字智人改善了传统声学模型单一语音的问题节奏和平调。

，使得语音合成更加精细。

例如，一段文字中哪些地方发音重音、哪些地方有情绪变化等因素，将通过AI训练识别，重现个人音色和表达风格，最终实现接近人的自然表达。

此外，通过构建大规模高质量音色数据的预训练基础模型，未来小样本数字智人还将支持用户仅录制普通话并合成英语和方言语音。

目前，腾讯云智能数字同人已涵盖3D写实、3D半写实、3D卡通、2D真人、2D卡通五种图像风格。

可实现超精细的面部表情和上百种肢体动作，并支持图像资产管理。

、业务服务配置和内容生产相关服务，满足不同场景的服务需求。

作为数智员工，腾讯云智能数智人成功“加入”媒体、金融、旅游、文旅、政务等多个行业，依托新一代多模态人机交互系统，同时连接腾讯丰富的内容并服务生态系统，实现从“数字人”到“数字智能人”的智能化升级。

未来，针对数字智能的应用，腾讯云智能将通过CV、TTS、NLP、ASR等自主研发的AI技术，持续推动数字智能服务更广泛落地，以“普惠”进军千行百业。

服务。

。

上一篇：新消费品牌如何做内容营销？知乎“好品热浪计划”专场答疑

下一篇：“银河星舰”登陆北京车展，吉利亮相科技旗舰SUV

腾讯云智能打造AI+数字智人生产工厂，3分钟样本训练即可定制数字化身相关文章