当前位置: 首页 > 科技观察

现在的提示项目太像占卜了,跟艺术AI交流就像文字游戏

时间:2023-03-19 22:15:59 科技观察

输入“吃豆人游戏界面,吃豆人,幽灵,墨色,眨眼,克莱德,吃豆迷宫,吃豆人,蒙德里安风格,现代艺术,现代主义,绽放”。输入短语“promptproject”是不是很有趣?当你将文字提示输入DALL-E或Midtravel等AI绘图工具,让它生成图片,或者让自动生成代码的AI工具——Copilot编写一些软件,得到的结果堪称艺术品.我们可以将此过程称为“工程”,听起来很精确且合乎逻辑。但是如果你去Discord平台看看人们在Midjourney应用程序中输入的提示,你会看到这样的东西:星系从大脑中升起,8k,辛烷值渲染,微观细节-upbeta-测试-creativemyteethare黄色,你好世界::如果他们像你一样白,你会更喜欢我吗-s5000-q2-upbeta-v3hg吉格洛夫克拉夫特噩梦般的境界,怪物永远统治着恐怖混乱腐蚀了曾经勇敢的骑士,将他们变成了一个强大的反派。头上长出角,身体两侧长出翅膀和尾巴,手指和脚趾长成爪子。这就是void所做的。人生就是这样输的……合理的写作提示一定要有正确的姿势,现实往往是写起来感觉看不见,就像使用了魔咒一样。如果你不小心放错了咒语中的单词,你很容易把事情搞砸。说来好笑,写提示就像是一个人试图哄“一只急切而困惑的群居动物”去做工作。我们认为它明白我们在说什么,但它通过大喊大叫和跑来跑去进行交流。是什么造成了这种现象?可以说,现在是人工智能发展史上一个非常奇特的时期。几十年来,人工智能一直(不总是,但经常)在图灵测试的“影子”中取得进步,图灵测试认为“聪明”的人工智能的行为和交流方式与聪明人完全相同。例如,根据图灵的说法,如果人造生命可以讨论时事,它就可以被认为是智能的。近年来,我们将这种对清晰、准确、自然语言的期望扩展到我们的日常设备:与苹果的Siri和亚马逊的Alexa交谈,询问天气或设置计时器。但它与产生艺术作品的人工智能“对话”截然不同。我们试图让他们创造一些东西。这意味着,如果AI出错,后果要严重得多。没有人关心在线聊天机器人在聊天时突然退出。如果聊天机器人不直播NBA,那也没什么大不了的。但是,如果我们有特定的创造性需求需要AI来满足怎么办?如果我们想让它写一篇具有特定内容和风格的博客文章怎么办?我们当然需要确保我们可以正确地与它沟通。这意味着我们必须开始思考人工智能在想什么,或者更确切地说,它是如何思考的。我们必须进一步发展心理学家所说的机器“心智理论”。“听起来像是幻想,对吧?”正如OpenAI联合创始人AndrejKarpathy告诉我的Copilot。“这不是你习惯的东西。它不像人类的心智理论。它就像一个外星人的人工制品,它是经过大规模优化过程产生的。”AndrejKarpathy作者并不是说这些人工智能实际上是有意识的、智能的或什么的。它们只是非常微妙的模式识别器和序列补全器,更像是里面一片混乱的数学海洋。但是,因为我们在给他们口头命令,这让我们处于一种奇怪的心理关系中,试图弄清楚里面发生了什么。作者想起了古希腊人如何与德尔菲神谕互动。德尔福神谕被认为知道过去、现在和未来。问题的答案可能很奇怪,因为本质上这就像和外国人交谈,谁知道你会得到什么?与ArtAI交流就像文字游戏研究ArtRobots内部运作的科学家记录了这些机器的一些奇怪内部状态。最近,德克萨斯大学奥斯汀分校的两名研究人员发现,DALL-E2生成了明显混乱的短语,这些短语在模型本身内似乎具有某种一致的含义。他们注意到该模型生成了短语“Apoploevesrreitais”,当他们将其作为提示反馈给DALL-E2时,它吸引了鸟类。同样,在收到“Contarraccetnxniamslurycatanniounons”后绘制昆虫或害虫。使用“Wachzodahakesrea”将制作一张海鲜图片。为什么是这样?模型是如何生成这种奇怪的内部新语言的?科学家对此一无所知,尽管它看起来像是DALL-E2文本编码器的对抗性产物。同样,提示写作专家说一遍又一遍地重复短语是一种技巧,正如迈克尔泰勒在《Prompt Engineering: From Words to Art》中所写的那样。链接:https://www.saxifrage.xyz/post/prompt-engineeringDALL-E2、Midtravel或其他AI艺术工具在生成图像时需要真正捕捉重要特征,其中简单的重复效果出奇地好。就拿这组提示来说,比如:“homersimpson,来自辛普森一家,吃甜甜圈,homersimpson,homersimpson,homersimpson”感觉我们需要催眠AI来专注于我们关心的主题。您还可以从提示作者常用的大量描述性词语中看出这一点。看看XeIaso结合stablediffusion生成的图像:不得不说画面还是有点诗意的。与艺术人工智能交流感觉就像玩文字游戏——就像玩字谜游戏或禁忌游戏一样,你必须通过围绕一个话题进行对话来触发人工智能产生正确的结果。除此之外,我们的目标是找到合适的法术来唤醒居住在灵媒祭坛上的灵魂,并召唤他们听从你的吩咐。正如Xe所说,“我真的不知道为什么人们称提示为‘工程’。我个人更喜欢称其为‘占卜’。”或许,我们需要对提示生成模型做一些严肃的澄清。因为它要求我们用一种完全疯狂的方式来交流,它不太可能满足图灵测试的要求,它在智力上也不“喜欢”我们。作者坚信有一天艺术AI会像我们一样!但现在,他们真的,真的很奇怪。