当前位置: 首页 > 科技观察

ChatGPT作弊成普遍担忧,OpenAI:自研复习工具

时间:2023-03-11 22:37:45 科技观察

语言生成模型来了,学校作业从此就没用了吗?纽约市教育官员最近宣布禁止学生在公立学校使用ChatGPT引发争议。语言模型自动生成的内容会“参考”已有的作品,输出速度几乎是无限的。人们对它的担忧已经蔓延到AI学术界本身。关于ChatGPT和其他类似系统生成的内容的论文,以避免“意外后果”。对于这样的情况,ChatGPT的提出者OpenAI已经宣布正在努力开发“缓解措施”来帮助人们检测AI自动生成的文本。“我们使用ChatGPT作为新研究的预览技术,希望从现实世界的应用中学习。我们相信这是开发和部署强大而安全的AI系统的关键部分。我们将继续吸取反馈和经验教训,”A公司发言人说。“在使用AI生成的文本时,OpenAI一直呼吁透明。我们的使用条款要求用户在使用我们的API和创意工具时负责,首先是对他们的目标人群负责......我们期待与教育工作者合作开发有效的解决方案,帮助教师和学生等人找到从中受益的方法人工智能。”如果有算法可以区分人类和机器生成的内容,那么学术界使用生成模型的方式可能会改变。学校将能够更有效地限制AI生成的论文,如果态度发生转变,人们期望这些工具能够帮助学生,或许我们也可以逐渐接受使用AI作为提高工作和学习效率的辅助工具。现在看来,还有很长的路要走。尽管AI生成的文本在新闻发布会和学校禁止机器作弊方面令人印象深刻,但您需要意识到,与真实的人类写作相比,它们往往缺乏真正的理解和逻辑。虽然像GPT-3或ChatGPT这样的工具通过给出令人震惊的详细答案让人们感到惊讶,但也有冷静的专家表示,这证明模型可以编码知识,但当他们没有把事情做对时,给出的答案往往是离谱的。波莫纳学院经济学教授加里史密斯警告我们不要被愚弄。在一篇专栏文章中,GarySmith展示了GPT-3无法有效推理和回答问题的几个例子,“如果你尝试GPT-3,你最初的反应可能会感到惊讶——它似乎是在与一个非常聪明的人一起工作真实对话。然而,深入挖掘,您很快就会发现,虽然GPT-3可以以令人信服的方式将单词串在一起,但它并不知道这些单词的含义。”“预测down这个词可能跟在fall这个词之后,不需要理解这两个词的意思。只有通过统计计算,AI才能认为这些词经常在一起。因此,GPT-3很容易做出完全错误但又武断的陈述。”OpenAI于2022年11月发布了ChatGPT,这是一种在GPT-3的基础上改进的新模型。尽管如此,它仍然存在这些相同的问题,就像所有现有的语言模型一样。如何用AI检测AI生成的文本?曾几何时,AI生成的文字内容还是“一眼看去就是假的”,但自从ChatGPT诞生后,这种辨别就越来越难做了。在教育领域,ChatGPT的争论围绕作弊的可能性展开。在Google上搜索“ChatGPTwritingessays”,您会发现大量教育工作者、记者和学生通过使用ChatGPT进行家庭作业和标准化论文测试来试水的例子。《华尔街日报》的一位专栏作家使用ChatGPT写了一篇及格的AP英语论文,而《福布斯》的一位记者用它在20分钟内完成了两篇大学论文。亚利桑那州立大学教授DanGillmor在接受卫报采访时回忆说,他曾尝试给ChatGPT布置一份学生作业,结果发现AI生成的作文也能取得好成绩。目前,已有开发者制作了一款针对ChatGPT生成内容的检测工具——“GPTZero”。你只需要将内容粘贴到输入框中,几秒钟内就可以得到分析结果,快速检测出一篇文章是ChatGPT还是人工写的。网友评论:全世界的学生看了都哭了。作者是普林斯顿大学的学生EdwardTian,他在假期的一部分时间编写了GPTZero。让我们看一下检测过程,先从文章(100%肯定是人类写的)的例子开始:以及一段由ChatGPT生成的用于检测的内容:GPTZeroapplicationworksbyanalyzingwithsometextattributes.首先是perplexity,即文本对模型的随机性,或者说语言模型对文本的“喜爱”程度;然后是突发性,也就是一段时间内机器写出的文字的复杂度比较统一和恒定,而人写的文字则不然。GPTZero:“同学们,对不起!教授们,不用客气!”据《卫报》了解,目前OpenAI正在开发统计ChatGPT输出结果“水印”的功能,方便读者在AI文本选择隐藏模式下发现。在德克萨斯大学的一次演讲中,OpenAI访问研究员ScottAaronson表示,该公司正在开发一种系统,通过“统计地为输出加水印”来打击作弊行为。Aaronson表示,这项技术将通过微妙地调整ChatGPT选择的特定单词选择来发挥作用,这种方式不会被读者注意到,但对于任何寻找机器生成文本迹象的人来说,在统计上都是可预测的。预料到的。“我们实际上有一个水印方案的工作原型,”Aaronson补充道。“它似乎表现不错——根据经验,几百个单词似乎就足以得到一个信号:是的,这段文字来自GPT。”尽管人们有顾虑,但ChatGPT的应用也在迅速普及。在很多场景下,人们不想和无法理解简单查询的聊天机器人交谈,而能说几句话的ChatGPT可以解决这个问题。总部位于多伦多的Ada与OpenAI合作,将ChatGPT背后的大型模型GPT-3.5应用于已完成45亿次客户服务交互的客户服务聊天机器人。据TheInformation报道,微软还与OpenAI签订了独家许可协议,并计划将该技术整合到Bing搜索引擎中。ChatGPT正在模拟真人的道路上加速前进,这场打假战还将继续。