AI短视频轨道：只需一个提示词，文字，视频，画外音一键搞定

时间：2023-03-17 10:31:38 科技观察

本文经AI新媒体量子位授权转载（公众号ID：QbitAI），转载请联系转载来源。AI配音的主角小美、小帅、丧彪、佛伯乐成为了比“李花”更贴近某声用户的朋友。不过，配音显然不能满足AIGC“大放异彩”的愿望，其对短视频赛道的入侵将追加：生成AI，开始拍视频！或者有画外音的那种。该技术来自一个名为QuickVid的新网站，该网站将多个生成AI组合到一个工具中。创建的短视频适用于YouTube、Instagram、TikTok、Snapchat等，Wow,Unbelievable~QuickVid，明星AI产品混搭QuickVid，是刚成立7天的小宝宝网站（去年12月27日上线）。虽然年纪小，但并不妨碍它大显身手。让我们看看这个网站是如何工作的：首先，用户需要输入一个提示词或一个简短的句子来描述他们想要创建的视频的主题。比如本文开头的视频，就是由“机器学习”这两个提示词生成的。该功能依赖于GPT-3的文本生成能力。然后，根据这些线索，QuickVid从免版税媒体库Pexels中选择一个背景视频，并使用DALL-E2生成叠加图像。然后，QuickVid通过GoogleCloud的文本转语音API输出画外音。这一步可以选择克隆用户自己的声音。因为创始人了解到，很多创作者对自己制作的AI配音视频不是很感兴趣，毕竟视频配音不是用自己的声音。最后一步很简单，就是把上面的元素组合起来。当当当当当当当当当当当当当当！人工智能生成的短视频诞生了。GPT-3、DALLE-2……总而言之，QuickVid就像是现有AI产品的炖菜。而且，通过使用重复的、模板化的B-roll短视频格式，它还避免了必须自己生成视频。值得注意的一点是，微软、GitHub和OpenAI因涉嫌违反版权法而被起诉，因为它们允许Copilot在GitHub的公共存储库上“窃取代码”。这个案例对DALL-E2等AI产品影响深远，因为发现AI可以从训练集中“抄袭”。不过，QuickVid并不太担心。他的创始人DanielHabib大胆表示：如果明天有官司让OpenAI消失，我们并不害怕。因为我们有几个备选方案可以为QuickVid提供AI生产力~这里说的备选方案就是StableDisusion，一个类似于DALL-E2的开源系统，QuickVid已经在测试生成头像图片。Habib是Meta的一名员工，负责FacebookLive和视频基础设施的开发，他在几周内想出了QuickVid。根据一些媒体的实测，QuickVid生成的视频质量参差不齐。生成的背景视频的内容往往非常随机，有些只能和提示词有轻微的联系。但这并不奇怪，因为QuickVids目前仅限于Pexels，而DALL-E2生成的图像本身就存在文字混乱和比例失调的局限性。官方对此的回应是，“我们每天都在修补漏洞”！现在的QuickVid功能比较简单，但是足够制作一个信息量很大的YouTube或者TikTok短视频了。△推特用户使用QuickVid生成短视频本月，QuickVid将维护更新部分个性化功能。QuickVid面临的几个障碍Habib在回复TechCrunch的电子邮件中将QuickVid称为创作者快速制作高质量内容的工具。“（目的是）帮助创作者增加内容产出，降低过度劳累的风险。”创作者在制作短视频时的工作量减少了，但用户和评论者的工作量却在增加。海量内容的一键生成，让目前质量不高、连字、图片的视频内容，有了瞬间挤满整个视频网站的能力。没错，像QuickVid这样的工具可能会用不健康的信息和重复的内容填满本已拥挤的短视频网站和应用程序。在回答相关问题时，哈比卜将相关责任归咎于平台。他认为，决定这些视频是否会被推荐、是否会被放在首屏的是视频平台的算法，而不是QuickVid。“如果人们不想看你的视频，你就不能在像YouTube这样的平台上传播它，”他补充道。“无论你使用QuickVid生成视频，如果内容质量太低，人们就会放弃它。”你的频道。”当然，QuickVid面临的问题不止一个，它面临着很多挑战。比如来自创作者的潜在阻力。无论是因为成本（QuickVid的月费是10美元/月），还是因为与AIGC竞争的困境对于工作，一些重视内容质量的创作者会选择不使用此类工具，再比如版权问题。据Habib称，QuickVid用户可以将他们制作的视频商业化，但AIGC的版权问题已经处于模棱两可的阶段。就在日前，美国专利商标局（USPTO）撤销了AI漫画的版权保护，称需要人工授权才能获得版权保护。不过，Habib认为美国专利商标局的这项行动与QuickVid没有直接关系，因为它只涉及AI产品的“专利性”，而不是创作者使用和商业化其内容的权利。创作者关心的是发布优质内容，帮助频道增加粉丝。除了法律问题，快视还面临着内容审核这个大工程。尽管OpenAI已经使用过滤器来防止极端内容和歪曲事实的内容，但bug仍然存在。GPT-3仍然时不时地提供不正确的信息，尤其是最近发生的事件，因为最近的信息还没有进入它的知识库。ChatGPT也是如此，它已被证明可以“捕捉”性别歧视和种族歧视的内容。当Techcrunch运行测试时，QuickVId提示“对学生进行批判性种族理论教育”，生成了一段视频，暗示可以使用批判性种族理论给学生洗脑。在这方面，QuickVid主要依靠OpenAI的过滤器来避免错误。同时，它也动员了每一位使用QuickVid的用户，宣告每个人都有义务对QuickVid制作的每一个视频进行人工审核，以确保“一切都在法律的范围内”。还有一件事，但QuickVid有一点令人兴奋的消息是，谷歌并没有将人类编写的文本与AI文本区别对待。尽管如此，谷歌还是批准了“旨在操纵搜索排名而不是帮助用户”的内容，因为它“没有足够的价值”。这使得QuickVids需要小心，因为纯自动化流程生成的内容很容易被归类为“无价值”。但归根结底，正如Habib所说，生成式人工智能革命势不可挡。如果AI世代短视频大规模流行，各平台不会也不敢对它做什么——至少不会一刀切地禁止。这么方便的工具，你会成为短视频平台的创造者吗？也许今晚你打开短视频App得到的第一个推荐就是你的（手动狗头）。直接链接：https://www.quickvid.ai/

上一篇：从六步设定谈游戏互动文的编写

下一篇：消息称苹果 AR-VR 头显需连接 iPhone 等设备，已完成 5nm 定制芯片工作

AI短视频轨道：只需一个提示词，文字，视频，画外音一键搞定相关文章