年初,Sora的出现引发了视频生成领域的一股风潮。
无论是通向AGI的里程碑事件,还是Sora给影视动画行业带来的想象力,文生视频迅速成为AI领域的焦点。
3月28日,第十一届中国在线视听大会在成都举行。
美图公司创始人、董事长和CEO吴欣鸿发表主题演讲《视频大模型如何助力网络视听创作》。
会上,吴欣鸿透露,美图目前正在紧锣密鼓地更新迭代视频模型,准备在视频生成领域大展拳脚。
此前他表示,美图将聚焦图像视频领域,探索垂直场景,打造产品能力非常强的AI原生应用。
发布会上,吴欣鸿展示了一段60秒的视频,主题为“动物赛跑”。
该视频基于美图大视觉模型MiracleVision的图像生成和视频生成能力。
具体来说,它利用了拍摄的“AI脚本”和“AI数字人”功能,WHEE的“文生图片”和“AI视频”功能,以及Wink的“视频编辑”功能,仅用了半天时间就完成了。
涵盖故事脚本、分镜板设计、视频生成、口型同步、视频编辑等视频制作流程。
“以Sora为代表的大型视频模型只是一个开始。
”在吴欣鸿看来,目前还只是大视频模式的2.0阶段。
以Sora为代表的大视频模型试图理解世界,具有一定的突发能力,可以生成30-60秒的视频。
吴欣鸿认为,在视频模型3.0阶段,可以实现更丰富的肢体动作,视频模型还将具备剧情设计、分镜、转场等能力,值得用户和业界的期待。
谈到视频垂直场景,吴欣鸿认为,视频垂直场景与AI原生工作流程的结合,在AI视频生成、AI视频编辑、AI视频渲染等领域拥有巨大的应用机会。
美图正在上述领域探索创新,新品将在今年6月的美图影像节上亮相。
此后,美图通过美图秀秀、眨眼睛、开拍等一系列影像工具持续支持在线视听内容创作。
目前,Wink已进入中国视频剪辑赛道前三名,成为口述博主的新宠。
截至2020年12月,我国网络视听用户规模达10.74亿。
2018年网络视听市场规模首次突破万亿元。
对于网络视听的内容生产和产业发展,吴欣鸿表示,美图将全力推广自研大模的视频能力,提供更好的视频创作在线视听行业的工具。