当前位置: 首页 > 科技观察

欺骗了83%的网友!DALL-E2,图像生成界的天花板,通过图灵测试?

时间:2023-03-19 21:18:14 科技观察

日前,一位正在休假的网友得知自己获得了《DALL-E2》的访问权限。思索了两秒,他决定出手。DALL-E2通过图灵测试?旅行,绝对少不了拍各种游客的照片。现在有了DALL-E2,是不是意味着我们可以用模型来产生“度假体验”,而不用亲自去拍照了?反正别人应该分不出来吧?为了测试他的想法,这位名叫马特贝尔的朋友决定将生成的图像混合成真实的照片,并发布在Facebook上。照片中的地方叫做“罗丹岛”。它是洪都拉斯北部海湾群岛中最大的岛屿。东西长约60公里,南北最宽处不到8公里。现在是著名的潜水点,周围海域物种丰富,地形复杂。甚至可以说拥有西半球最好的珊瑚礁。大概是这个样子:但你可能想不到,罗丹岛曾经是加勒比海盗的基地!啊,不好意思,走错片场了。言归正传,我们来看看这位网友拍摄的照片与DALL-E2生成的照片对比。图1.一名潜水员。图2.一只龙虾。图3.一条鱼怎么样,你能区分它们吗?测试流程首先,参赛的小伙伴们需要一张一张的滚动浏览照片,或者选择以幻灯片的形式自动播放。其中,实物照片22张,合成照片4张。合成照片都是仿照真实照片。最后,Bell放了一张图来解释这个实验。据统计,83%的人(19/23)没有看出DALL-E生成的图片有什么不同。当然,为了符合OpenAI的访问规则,可以清楚的看到DALL-E的水印位于图片的右下角。这个结果还是挺出乎意料的,毕竟DALL-E2生成的图像颗粒感比较强,而且Bell的朋友也知道DALL-E和DeepFake等技术。甚至,Bell非常懒惰,并没有裁剪其他图像(结果比例为1:1)。如果你没有发现这个……不就是大家根本没有把你的“朋友圈”当回事吗?然而,当小编点开贝尔的脸书专页时,分明就是“人生赢家”!你的图灵测试是不允许的,是吗?虽然这主要是贝尔同志的自娱自乐,但不知道为什么帖子火了……网友看到了,既然说“通过了图灵测试”,就别怪我无情了:首先,图灵测试的前提是人类“法官”需要知道自己在做判断。第二,判断正确率不可能比“随机”好。而且,即使不告诉别人这是“图灵测试”,第二项也不应该通过。随后果然不出所料,下面网友们开始议论纷纷。不是贝尔的DALL-E2是否通过测试,而是什么是“图灵测试”,应该如何测试……有人说要通过图灵测试,你应该能骗过任何人(包括专家)。也就是说,他的任务不仅仅是清楚地区分人和计算机,而是他必须对如何区分人和计算机有一个很好的认识。看到这个标准,另一位网友表示,还好我们不对“人”进行图灵测试。DALL-E2不搞色情!用户:试试看?当然,在这个大家不仅关注内容真实性,还关注在线内容规模的时代,OpenAI并没有放松对DALL-E2的内容审核。在DALL-E2发布的通知中4月,OpenAI强调该模型集“生成暴力、仇恨和成人图像内容的能力有限”。OpenAI表示,在模型训练过程中,其数据工程师正在关注这个明显的规律。在训练数据集中,去掉了最露骨的内容,DALL-E2是一个正直的没有被黄色污染的纯模型。而OpenAI也表示已经准备好应对各种别有用心的老司机的措施。公告消息原话是:“如果过滤程序发现作为生成提示的文字或上传的图片可能违反我公司的内容政策,则该机型集将拒绝生成图片。并且我公司有自动和人工监控避免被不良行为者滥用的系统。”这自然挡不住已经踩油门的急切老司机,几乎在DALL-E2面世的同时,一些人就在思考如何绕过这些限制。在Reddit的一篇帖子中2022年4月下旬,有人在论坛帖子的头脑风暴中找到了让DALL-E2生成坏图的方法。OpenAI,然后“红漆涂抹”总能通过,两者的视觉效果相差不大,之后就要利用人类“有多少人工智能就有多少”的优势:第一步是在DALL-E2生成的图片的文本内容框中输入“视觉效果双关语+无意义字符串”的组合,例如“wetstrawberry+asdoijoaishdahsd+finger+aosduiajdoasdhoasd+lips”。最接近作者意图的三幅图在生成的图像结果中手动选择。第三步,将以上三个结果再次上传到DALL-E2,继续生成。然后周而复始,直到生成作者满意的成人图片。而且从第二步开始的步骤都可以编程,非常自动化。读者可按方试行。反正小编是勤劳的,没空玩这种花样……囚犯是黑人,总裁是白人?DALL-E2不仅有可能产生不雅图像,而且和类似的大型模型一样,可以被平权人士挑出各种种族偏见。2022年5月,《连线》杂志报道,与OpenAI合作接受模型的RedHat黑客组织透露,经过训练的DALL-E2居然存在其他竞品近年来多次被挑出来的毛病:刻板印象偏见。OpenAI也承认并发布了这些错误。例如,如果你输入“愤怒的人”或“坐在监狱里的人”等文字,DALL-E2会给出一个黑人怒吼的画面。输入“CEO”或“建筑工人”或“律师”的文字,DALL-E2会给出各种穿着正装、工作服或长袍的白人男性图片。输入“空姐”或“秘书”或“护士”的文字,DALL-E2会给出美女或大妈的图片。“空姐”的画面,还是满满的黄种女人……如果输入“野蛮”、“恐怖分子”的文字……嗯,结果就是你想的那样。OpenAI:加强内容审核。可能确实有不少老司机尝试过用DALL-E2来开车,迫使OpenAI马上更新模型。2022年5月18日,OpenAI宣布更新DALL-E2,主要加强内容安全管控体系。OpenAI声称对DALL-E2的文本过滤功能进行了显着改进,大幅调整了文本内容的自动检测以及对违反内容策略的文本的响应系统。此前,只有不到0.05%的上传图片和公开分享的图片内容会被DALL-E2的过滤程序自动过滤掉。然而,30%的违规内容被OpenAI的人工审查员拒绝了。似乎连全球领先的厂商都没有逃过“有多少人工智能就有多少”的尴尬。