当前位置: 首页 > 科技赋能

图片一键变成视频,阿里妈妈发布图胜视频技术框架AtomoVideo

时间:2024-05-19 16:18:12 科技赋能

过去一年,国内各大电商AI布局持续加速。

近日,桃天集团旗下阿里妈妈技术团队推出了高保真图片生成视频框架AtomoVideo,可以自动将图片素材转换为高品质视频动画。

目前,该技术已在阿里妈妈万向实验室、广告平台等应用场景落地。

所有商户都可以体验“一键把图片变成视频”的人工智能新技术,快速产生创意短视频。

年初OpenAI公司Sora的发布,让人们看到了智能视频创作的巨大想象力。

事实上,国内很多团队也在文生或土生视频方面进行了很多探索。

今年年初,字节跳动发布了超高清文生视频模型MagicVideo-V2,阿里云Model-Scope社区推出了大型文本生成视频模型。

在淘天旗的领导下,阿里妈妈也一直专注于视频生成技术与电商的融合,为淘宝、天猫商家提供更加智能的视频创作工具,加速视频生成技术在更多真实商业场景的落地。

近日,阿里妈妈发布的AtomoVideo应用让电商们大开眼界:未来,他们可能不再需要聘请专业的拍摄团队来制作产品视频。

记者在AtomoVideo的体验中发现,当用户上传图片并输入动作文字指令时,静态图片可以在各种场景中移动。

例如,上传娃娃图片并输入文字命令:穿着红色衬衫的娃娃正在街上行走。

很快,一段短视频就生成了,娃娃迈开脚步,行走起来,街道场景也随之发生了变化。

此外,静止帆船在输入指令后还可以在海中起航。

海报中的音乐家也开始弹吉他。

场景还原、人物表情和动作都接近专业动画师的水平。

据介绍,上述视频生成功能已在阿里妈妈广告平台上得到广泛应用。

商家可以使用阿里妈妈的电商图片生成工具“万向实验室”,将自己制作的产品图片一键转换为产品视频。

同时,阿里妈妈的设计师还可以应用该技术为企业客户定制和投放视频创意。

据了解,AtomoVideo应用了阿里妈妈技术团队自主研发的多项新技术,包括高质量数据集构建、多粒度图像注入、动作强度逐步增加的多阶段训练等,目前可以支持从任意像素的图片生成 4 秒视频。

具有动态效果,兼容市面上各种文生图模型。

接受阿里妈妈采访的一位技术人士表示,目前的技术还远远没有挖掘出视频生成的真正潜力。

视频画面稳定性、内容创作可控性、视频时长等关键因素仍有非常广阔的探索空间。

该人士认为,虽然目前的应用生成只是一个开始,但随着技术模型的不断迭代,视频生成的准确性和模拟性将会逐渐提高。

在创意生成领域,除了本次发布的AtomoVideo外,阿里妈妈技术团队还开发了可扩展图片和视频的“尺寸魔方”等创意编辑工具,可以对图片的任意目标尺寸进行扩展和填充和视频,同时保持材料的原创性。

一位服装商家表示,目前市面上的AI拍照工具很多,但能把图片变成视频的还很少,能生成高质量视频的就更少了。

很多商家认为图胜、文生视频只是一个工具。

概念,甚至是噱头。

“虽然AtomoVideo生成的视频不是很长,准确率还有待提高,但感觉有好的迹象,是一种趋势。

”该商家表示,很多商家都在讨论AI电商,各界人士也在期待行业杀手级应用的出现。

据介绍,过去一年,淘宝在AI电商领域持续深化探索。

在消费端,淘宝推出“淘宝问”,用户可以与淘宝互动,了解最新的消费趋势。

在商户端,淘宝推出的商户AI创意制作工具万向实验室,可以帮助商户0成本推出新品、0成本适配模型、0成本打造场景,批量生产高标准的产品图像。

年初,淘宝基于大AI模型对智能客服机器人“点小蜜”进行了升级,进一步提高了“点小蜜”回答买家问题的准确性。

近日,淘宝再次推出AI绘图工具“花蛙”,帮助商家生成各种风格的优质图片,降低商家成本。

该应用即将结束内测并全面推广。