不仅仅是DALL·E！现在AI画师可以建模和制作视频，未来会发生什么？

时间：2023-03-12 02:11:16 科技观察

近日，由EmadMostaque创立并资助的公司Stability.ai宣布公开发布AI创作的艺术作品。你可能认为这只是人工智能在艺术领域的又一次尝试，但实际上远不止于此。有两个原因。首先，与DALL-E2不同，StableDiffusion是开源的。这意味着任何人都可以使用它的骨干免费为特定的文本到图像创作任务构建应用程序。或者，Midjourney的开发人员实施了一项功能，允许用户将其与StableDiffusion结合使用，这导致了一些惊人的结果。想象一下接下来几个月会发生什么。其次，与DALL-Emini和DiscoDiffusion不同，StableDiffusion可以创造出令人惊叹的逼真和艺术作品，这与OpenAI或谷歌的模型没有什么可羡慕的。人们甚至声称它是“生成搜索引擎”中的新SOTA。（除特别注明外，本文所有图片均由StableDiffusion制作）。StableDiffusion体现了AI艺术世界最好的特质：它可以说是现存最好的AI艺术模型，而且它是开源的。这简直是??闻所未闻，而且会产生巨大的影响。更有趣的是，有关这些服务的消息可能会通过最意想不到的渠道传给您。你的父母、你的孩子、你的伴侣、你的朋友或你的同事。这些人通常是AI领域的局外人，他们正处于发现该领域最新趋势的边缘。艺术可能是人工智能最终敲开那些对未来视而不见的人的大门的方式。这不是很有诗意吗？不只是开源DALL·E2Stability.ai的诞生是为了创造“让我们释放潜能的开放人工智能工具”。不仅仅是一个从未进入大多数人手中的研究模型，而是一个具有实际应用程序的工具，供我和你使用和探索。这就是它与其他科技公司的不同之处，例如OpenAI，它小心翼翼地保护其最佳系统（GPT-3和DALL-E2）的秘密，或者谷歌，它甚至从不费心去制造自己的（PaLM，LaMDA）,Imagen或Parti)作为私人测试版发布。Stability.ai的公开发布不仅仅共享模型权重和代码——这对科学和技术的健康至关重要，但大多数人并不关心它们。并且还为我们这些不想或不知道如何编码的人提供了一个无代码、随时可用的网站。该网站名为DreamStudioLite，可免费使用，最多可生成200张图像。与DALL-E2一样，它采用付费订阅模式，以10英镑的价格为您提供1,000张图像（OpenAI每月补充15个积分，但要获得更多积分，您必须以15美元的价格购买115张图片）。DALL-E花费0.03美元/张地图，而StableDiffusion花费0.01英镑/张地图。此外，StableDiffusion可通过API大规模使用（成本呈线性增长，因此您可以花1000英镑获得10万代）。除了图像生成，Stability.ai还将很快发布DreamStudioPro（音频/视频）和Enterprise（工作室）。DreamStudio可能很快实现的另一个功能是能够从其他图像生成图像，而不是通常的文本到图像设置。像这样：在网站上，还有一个关于提示工程的资源，如果您是新手，您可能会发现它很有用。此外，与DALL-E2不同，您可以控制参数以影响结果并保留更多的代理权。Stability.ai已尽一切努力促进对模型的访问。OpenAI是第一个，不得不放慢脚步来评估模型固有的潜在风险和偏差，但他们不需要将模型保持在封闭测试中那么久，也不需要建立这样一个限制模型的商业模型创造力。Midjourney和StableDiffusion都证明了这一点。安全+开源>隐私和控制开源技术有其自身的局限性。开放应该先于隐私和严格控制，而不是安全。正如该公司在公告中所解释的那样，它是“允许商业和非商业使用的许可证”，重点是该模型的开放和负责任的下游使用。它还强制要求衍生作品至少受到相同的基于用户的限制。开源模型本身很好，但如果我们不希望这项技术最终伤害到人们，或者以错误信息的形式在互联网上增加更多的狂妄自大，那么设置合理的护栏同样重要。“因为这些模型是在广泛的互联网抓取的图像文本对上训练的，这些模型可能会重现一些产生不安全内容的社会偏见，因此开放的缓解策略和关于这些偏见的公开讨论可以让每个人都成为这场对话的一部分。”无论如何，开放+安全>隐私和控制。开源改变世界的力量凭借道德价值观和开放性的坚实基础，StableDiffusion有望在现实世界影响方面超越其竞争对手。对于那些想要下载它并在他们的PC上运行它的人，您应该知道它需要6.9Gb的VRAM-这适用于高端消费GPU，使其比DALL-E2更轻，但非常适合更大的对于大多数用户来说仍然遥不可及。其他人和我一样，可以立即开始使用DreamStudio。StableDiffusion被广泛认为是可用的最佳AI艺术模型，它将成为无数应用程序、网络和服务的基础，重新定义我们创造艺术和与艺术互动的方式。但现在，针对不同用例设计的应用程序将从头开始构建，供所有人使用。人们正在改进儿童的绘画、用外部+内部图画制作拼贴画、设计杂志封面、绘制漫画、创建变形和动画视频、从图像生成图像等等。其中一些应用程序已经在DALL-E和Midjourney中实现，但StableDiffusion可以将当前的创意革命推向下一阶段。用前特斯拉AI总监、李飞飞的高徒AndrejKarpathy的话来说，就是让“艺术创作进入人类+AI合作的新时代”。像StableDiffusion这样的AI艺术模型涉及一类新的工具，我们应该在新的思维框架中使用这些工具来理解手头的新现实。我们不能简单地与其他时代类比或类比，就期望能够准确地解释或预测未来。有些事情会相似，有些则不会。我们必须将这个迫在眉睫的未来视为未知领域。写在最后毫无疑问，StableDiffusion的公开发布是人工智能艺术模型领域有史以来最重要、最具影响力的事件，而这仅仅是个开始。其中一位作者EmadMostaque在Twitter上表示：“随着我们发布更快、更好和更具体的模型，预计质量将继续全面提升。不仅仅是图像，下个月将是音频，然后转向3D、视频.语言、代码和更多培训。我们正处于我们互动、连接和理解艺术以及一般创造力的方式的多年革命的边缘。不仅在哲学、知识方面，而且作为每个人的东西现在分享和体验。创意世界将永远改变，我们必须进行开放和尊重的对话，为所有人创造更美好的未来。只有负责任地使用开源技术才能看到变化。

上一篇：2020年最值得关注的10家国外网络安全公司

下一篇：VisualStudioCode的10个令人敬畏的功能

不仅仅是DALL·E！现在AI画师可以建模和制作视频，未来会发生什么？相关文章