当前位置：首页 > 科技赋能

美图公司吴欣鸿：视频模型更新迭代如火如荼

时间：2024-05-19 16:43:13 科技赋能

年初，Sora的出现引发了视频生成领域的一股风潮。

无论是通向AGI的里程碑事件，还是Sora给影视动画行业带来的想象力，文生视频迅速成为AI领域的焦点。

3月28日，第十一届中国在线视听大会在成都举行。

美图公司创始人、董事长和CEO吴欣鸿发表主题演讲《视频大模型如何助力网络视听创作》。

会上，吴欣鸿透露，美图目前正在紧锣密鼓地更新迭代视频模型，准备在视频生成领域大展拳脚。

此前他表示，美图将聚焦图像视频领域，探索垂直场景，打造产品能力非常强的AI原生应用。

发布会上，吴欣鸿展示了一段60秒的视频，主题为“动物赛跑”。

该视频基于美图大视觉模型MiracleVision的图像生成和视频生成能力。

具体来说，它利用了拍摄的“AI脚本”和“AI数字人”功能，WHEE的“文生图片”和“AI视频”功能，以及Wink的“视频编辑”功能，仅用了半天时间就完成了。

涵盖故事脚本、分镜板设计、视频生成、口型同步、视频编辑等视频制作流程。

“以Sora为代表的大型视频模型只是一个开始。

”在吴欣鸿看来，目前还只是大视频模式的2.0阶段。

以Sora为代表的大视频模型试图理解世界，具有一定的突发能力，可以生成30-60秒的视频。

吴欣鸿认为，在视频模型3.0阶段，可以实现更丰富的肢体动作，视频模型还将具备剧情设计、分镜、转场等能力，值得用户和业界的期待。

谈到视频垂直场景，吴欣鸿认为，视频垂直场景与AI原生工作流程的结合，在AI视频生成、AI视频编辑、AI视频渲染等领域拥有巨大的应用机会。

美图正在上述领域探索创新，新品将在今年6月的美图影像节上亮相。

此后，美图通过美图秀秀、眨眼睛、开拍等一系列影像工具持续支持在线视听内容创作。

目前，Wink已进入中国视频剪辑赛道前三名，成为口述博主的新宠。

截至2020年12月，我国网络视听用户规模达10.74亿。

2018年网络视听市场规模首次突破万亿元。

对于网络视听的内容生产和产业发展，吴欣鸿表示，美图将全力推广自研大模的视频能力，提供更好的视频创作在线视听行业的工具。

美图公司吴欣鸿：视频模型更新迭代如火如荼相关文章