当前位置: 首页 > 科技赋能

美图公司吴欣鸿:视频模型更新迭代如火如荼

时间:2024-05-19 16:43:13 科技赋能

年初,Sora的出现引发了视频生成领域的一股风潮。

无论是通向AGI的里程碑事件,还是Sora给影视动画行业带来的想象力,文生视频迅速成为AI领域的焦点。

3月28日,第十一届中国在线视听大会在成都举行。

美图公司创始人、董事长和CEO吴欣鸿发表主题演讲《视频大模型如何助力网络视听创作》。

会上,吴欣鸿透露,美图目前正在紧锣密鼓地更新迭代视频模型,准备在视频生成领域大展拳脚。

此前他表示,美图将聚焦图像视频领域,探索垂直场景,打造产品能力非常强的AI原生应用。

发布会上,吴欣鸿展示了一段60秒的视频,主题为“动物赛跑”。

该视频基于美图大视觉模型MiracleVision的图像生成和视频生成能力。

具体来说,它利用了拍摄的“AI脚本”和“AI数字人”功能,WHEE的“文生图片”和“AI视频”功能,以及Wink的“视频编辑”功能,仅用了半天时间就完成了。

涵盖故事脚本、分镜板设计、视频生成、口型同步、视频编辑等视频制作流程。

“以Sora为代表的大型视频模型只是一个开始。

”在吴欣鸿看来,目前还只是大视频模式的2.0阶段。

以Sora为代表的大视频模型试图理解世界,具有一定的突发能力,可以生成30-60秒的视频。

吴欣鸿认为,在视频模型3.0阶段,可以实现更丰富的肢体动作,视频模型还将具备剧情设计、分镜、转场等能力,值得用户和业界的期待。

谈到视频垂直场景,吴欣鸿认为,视频垂直场景与AI原生工作流程的结合,在AI视频生成、AI视频编辑、AI视频渲染等领域拥有巨大的应用机会。

美图正在上述领域探索创新,新品将在今年6月的美图影像节上亮相。

此后,美图通过美图秀秀、眨眼睛、开拍等一系列影像工具持续支持在线视听内容创作。

目前,Wink已进入中国视频剪辑赛道前三名,成为口述博主的新宠。

截至2020年12月,我国网络视听用户规模达10.74亿。

2018年网络视听市场规模首次突破万亿元。

对于网络视听的内容生产和产业发展,吴欣鸿表示,美图将全力推广自研大模的视频能力,提供更好的视频创作在线视听行业的工具。