巧合的是,他们都是在同一天采取行动的。
两大AI巨头在同一天各自发布了自己的AI新核武器,OpenAI的Vincent视频模型Sora再次夺冠。
Sora的惊艳亮相不仅碾压众多AGI视频同行,更有可能改变电影、电视、广告和游戏行业未来的游戏规则。
谷歌新机型的性能是压倒性的。
周四,谷歌突然发布了新一代多模态大模型Gemini 1.5 Pro,在大模型之战中加速超越OpenAI。
这是迄今为止业界最强大的大型语言模型。
它可以支持多达10,000K Token上下文,直接将性能提升到百万级,在性能上完全击败OpenAI的GPT-4 Turbo。
拥有数百万代币意味着什么?谷歌AI项目负责人Jeff Dean解释说,在Gemini 1.5 Pro百万级上下文窗口的支持下,用户可以完成复杂的内容交互,轻松解析整本书、电影和播客,并理解很长的文档,甚至是一段包含数百个文件和数十万行的代码库。
Gemini 1.5 Pro的发布意味着谷歌在与OpenAI的军备竞赛中拥有强大的性能优势。
相比之下,OpenAI 的 GPT-4 Turbo 只能处理 128k 代币,并且最近出现了性能下降,直到上个月发布更新后才有所改善。
然而,OpenAI 并没有让谷歌孤军奋战。
同一天,他们发布了Sora,一个从文本生成视频的AI模型,它可以仅使用文本自动生成视频。
继文本模型ChatGPT和图像模型Dall-E之后,OpenAI再次开始颠覆视频领域。
相比谷歌Gemini 1.5 Pro基于数据性能的硬实力优势,Sora基于视觉美观的惊艳表现显然更加令人印象深刻,并迅速成为社交网站的热点。
《Sora》的假真细节有何神奇之处? OpenAI展示了Sora制作的几段视频内容。
光是这些片段就足以让人震撼。
OpenAI在官方博客中写道,Sora不仅可以了解用户的需求,还可以知道这些东西在现实世界中是如何存在的。
只需输入一段文字,Sora就会自动生成一段长达一分钟的高清视频。
令人难以置信的是,Sora 不仅能准确掌握用户文本的复杂含义,还能分离出不同的元素,并将其转换成富有创意的视频内容,看起来就像专业的导演、摄像师和剪辑师一样。
undefined毕竟,在虚假信息充斥的互联网中,DeepFake的伦理问题也成为人们关注的焦点。
像Sora这样的假视频一旦被滥用,可能会带来灾难性的后果。
几乎在Sora发布的同时,OpenAI还完成了一项股份出售交易,该交易并非为公司目的筹集资金,而是让员工将现有股份出售给Thrive Capital牵头的风险投资机构以套现。
值得一提的是,作为OpenAI的董事会成员,奥特曼本人并不持有该公司股份,估值的飙升并不会为他带来巨大的财富。
此次交易中OpenAI的整体估值达到800亿美元,较去年初的300亿美元增长了两倍多。
据投融资市场研究公司CB Insights统计,OpenAI已成为全球估值最高的初创公司之一,仅次于字节跳动和SpaceX。
事实上,这笔交易本应在去年11月完成,但因奥特曼与董事会的矛盾而被搁置。
随着Altman重回OpenAI CEO职位,投资者再次给这家AI巨头投了信任票。
显然,Sora正式发布后,OpenAI的估值将进一步飙升。
巨头们纷纷采取行动,碾压 AGI 同行。
那么,令人惊叹的文字视频《Sora》将会带来怎样的影响呢? AGI视频同行无疑是受到最直接影响的。
《Sora》发布后,AI 视频初创公司 Runway 的 CEO Cristóbal Valenzuela 在 X 平台(原 Twitter)上简单发了两个字:“Game On”。
Runway 几个月前刚刚发布了 Gen-2 视频模型。
另一家AI视频公司Stability的首席执行官Emad Mostaque直接感叹,“奥特曼真是一个魔术师。
” Runway成立已五年,在AI视频领域具有先发优势。
被主流好莱坞工作室使用。
去年获得七项奥斯卡奖的年度电影《瞬息全宇宙》使用Runway制作AI视频。
在《瞬息全宇宙》取得巨大成功后,Runway新一轮融资估值也随之提升,达到15亿美元,是一年前估值的三倍。
文森特视频领域是目前最热门的创业领域。
过去几个月,随着生成式人工智能的蓬勃发展,出现了许多利用文本生成视频和利用图片生成视频的初创公司。
A16z AI 投资合伙人 Justin Moore 列出了他关注过的 20 多个 Vincent Video 创业团队,其中不乏 Pika、Zerscope 等一度引起互联网赞叹的新贵。
去年年底,斯坦福华裔毕业生创办的皮卡视频一度引起中美互联网的敬佩。
得益于AI视频的惊人表现,这家只有4人的初创公司在不到半年的时间内完成了三轮超过5500万美元的融资,估值飙升至2.5亿美元。
但现在,AI巨头OpenAI直接甩掉了Sora。
无论是视频的长度、画面的精细度、细节的完整度,还是多镜头拍摄,Sora都远远超越了这些小初创公司的视频,用碾压来形容也不为过。
尽管AI视频领域仍有巨大的改进和增长空间,但这些小公司未来是否能够与OpenAI竞争仍然是一个巨大的问题。
然而,Sora不仅会影响其他AGI视频初创公司的生存空间,还将改变好莱坞以及电影、电视、广告、游戏行业未来的游戏规则。
好莱坞利用人工智能制作图片和视频并不是什么新鲜事。
从CG(计算机动画)、VR到AI,影视娱乐行业一直是高科技的最先采用者。
然而,与其他技术不同的是,AI工具一直是好莱坞从业者的眼中钉。
除了《瞬息全宇宙》使用Runway的AI视频工具之外,21世纪福克斯去年还与IBM Watson合作,利用AI工具为AI主题恐怖电影《摩根》制作了预告片;迪士尼旗下的漫威更是完全采用人工智能制作。
《秘密入侵》的开场动画。
那是在好莱坞演员和作家协会罢工期间。
生成式AI在影视行业的应用也是双方争论的焦点之一。
在双方洽谈过程中,演员和编剧了解到迪士尼和漫威新一季的《秘密入侵》已经完全使用了AI技术来制作开场场景。
这一消息让双方的谈判再次陷入搁置。
为什么人工智能工具在影视行业的运用会引起如此大的争议?业内人士主要担心未来制作者会利用现有素材进行AI训练,并频繁使用AI工具生成内容。
这不仅会侵犯创作者现有作品的版权,无法给他们带来足够的回报,还会影响创作者的未来。
工作机会和空间。
尽管去年编剧和演员不惜关停行业、失业,但制片方做出了临时让步,对人工智能工具的使用制定了更多规定。
但三年后的下一次劳资谈判,面对性能必然大幅升级的AI,演员和编剧的处境可能会更加艰难。
随着文森特视频模特Sora的惊艳亮相,所有好莱坞从业者或许都面临着一个巨大的疑问:按照AI指数级的进化速度,AI或许无需等待太久就能生成完整的剧情。
短片甚至电影从剧本到拍摄到表演到后期制作都可以完全搞定。
那么好莱坞的未来会是什么样子呢?拍摄《当她醒来》恐怖电影的好莱坞导演 Dave Clark 已经在使用 AI 工具来制作电影。
在他看来,Sora等AI技术并不构成威胁。
创作者需要拥抱人工智能技术,创造以前无法实现或想象的内容。
行业研究公司 CVL Economics 上个月发布的一项针对 300 名好莱坞行业领导者的调查显示,“这是改变游戏规则的技术。
你不应该担心自己的工作,而应该担心谁在使用这些工具。
” ,担忧弥漫整个好莱坞。
36% 的受访者表示,生成式人工智能降低了公司对日常工作技能的需求,72% 的受访公司是生成式人工智能工具的早期采用者。
残酷的现实是,75%的受访者承认,生成式AI(工具、软件、模型)促使其业务部门进行了裁员和合并。
掌控好莱坞产业秩序的人士预测,未来三年好莱坞将有超过20万个工作岗位受到人工智能的影响,尤其是视觉效果、音效工程师、平面设计师等后期制作工作岗位。
电影《Shovel Buddies》的编剧Jason Hellerman认为,随着AI工具逐渐完善,未来制作者当然可以使用Sora这样的工具来生成视频,而不再需要向制作团队付费。
AI生成的内容也可能会创造一个全新的流派,但如果任何人都可以使用AI制作视频和电影并成为“内容创作者”,这必然会导致专业水平的降低。
他预测,未来每个人都可以生成自己的视频,就像现在每个人都用手机拍摄和观看TikTok短视频一样。
习惯了短视频的Z世代年轻人未来将逐渐放弃电影、电视等长篇内容。
也许未来AI生成的视频、电影和电视也会变得和TikTok类似短视频。