当前位置：首页 > 数码发展

OpenAI推出Sora：文字秒变超现实视频，AI视频时代来临

时间：2024-02-24 10:21:14 数码发展

在人工智能领域，OpenAI再次引领潮流。

最近，这家总部位于旧金山的公司推出了一款名为 Sora 的文本到视频模型。

这项创新技术将文本快速转换为超逼真视频，标志着AI视频时代正式到来。

Sora 模型目前仅供专家和创意人员使用，以收集更多反馈并继续改进。

与Google的Lumiere等文本转视频工具相比，Sora在生成视频的长度和内容复杂度方面具有显着优势。

它可以生成长达1分钟的视频，包含详细的场景和多个人物，为创作者提供了更广阔的想象空间。

随着OpenAI、谷歌、微软等公司纷纷进入文本转视频领域，生成式人工智能的竞争日趋激烈。

在此背景下，Sora的推出无疑为OpenAI赢得了更多关注。

公司自2015年底成立以来，一直致力于打造造福全人类的安全通用人工智能（AGI）。

现在，随着Sora的出现，OpenAI又朝着这个目标又迈出了坚实的一步。

Sora 的独特之处在于其强大的文本解析功能，能够处理长达 135 个单词的提示。

这使得创作者可以通过简单的文字描述生成丰富多样的视频内容。

从人和动物到城市景观、自然风光，甚至纽约市淹没在水下的超现实场景，Sora 都能轻松渲染。

这一成绩的背后是OpenAI在Dall-E和GPT模型研究方面的深厚积累。

文本转图像生成器 Dall-E 3 于今年 9 月发布，GPT-4 Turbo 于 11 月推出。

Sora 借用了 Dall-E 3 的再现技术，为视觉训练数据生成高度描述性的字幕，提高了视频生成的准确性和保真度。

然而，尽管Sora取得了重大技术突破，OpenAI仍然坦白承认自己的弱点。

例如，模型在描述复杂场景的物理原理和因果关系方面仍然需要改进。

此外，Sora在区分左右和处理名人肖像方面也存在一定的挑战。

为了确保Sora的广泛应用能够带来积极的社会影响，OpenAI表示将采取一系列安全措施。

这包括满足公司现有的安全标准，禁止极端暴力、性内容、仇恨图像等不当内容。

同时，OpenAI还强调，从现实世界的使用中学习是创建日益安全的人工智能系统的关键。

因此，该公司计划与世界各地的政策制定者、教育工作者和艺术家合作，了解他们对Sora的看法和担忧，以便不断改进和优化模型。

总之，Sora的推出给人工智能领域带来了新的里程碑。

它不仅彰显了OpenAI在生成式AI技术方面的领先地位，也预示着AI视频时代的到来。

随着技术的不断发展和完善，我们有理由相信，未来的视频创作将更多地依赖人工智能的力量。

在此过程中，OpenAI将继续发挥关键作用。

OpenAI推出Sora：文字秒变超现实视频，AI视频时代来临相关文章