在上一篇文章中,我描述了AI阅读理解系统的问题和进度。在过去的几年中,由于AI神经网络的出现称为GPT-3,AI写作系统也得到了显着改善。自GPT-3创建以来仅两年了,但数字?用例。它为众多业务初创企业铺平了道路,包括故事写作,博客写作,聊天机器人,新闻报道写作甚至是测验。随着开发人员意识到其潜力,该清单正在继续增长。在本文中,我简要描述了AI写作系统和GPT-3的演变,并表明Internet很快就会被GPT-3生成的内容所吸引。
使用AI的故事写作
使用AI进行故事写作的实验已经尝试了很多年。例如,?它们主要是人与机器之间的合作。但是,这是一位名叫Scott French的程序员,他是第一个声称自己创作了整本AI写小说的人。这部小说被称为“曾经的一次”,并以一种方式仿真了1960年代作家杰奎琳·苏珊(Jacqueline Susann)的风格。斯科特通过使用符号AI明确编写的规则来做到这一点。例如,他的程序使用“如果……然后”规则显示角色对事件的反应。它还将使用规则来展示作者如何用文字描述一些动作。这个AI书籍写作项目对斯科特来说不是很好,因为他后来被杰奎琳·苏珊(Jacqueline Susann)的庄园起诉,因为他复制了她的风格。使用基于规则的AI的问题是,这非常耗时 - 斯科特(Scott)花了八年时间才能完成这本书。其他自动写作项目也遇到了类似的问题。符号AI缺乏神经网络的学习能力。这意味着耗时的人类编程是可以完成此类项目的唯一途径。
这曾经是一部1993年的浪漫小说,凭借Macintosh IICX计算机的Jacqueline Susann的风格与其程序员Scott French合作。学分:Wikimedia
但是,AI现在可以使用机器学习神经网络来编写小说和许多其他类型的文档,有时甚至在几分钟之内。GPT-3彻底改变了AI的写作,并引起了许多涵盖各种应用程序的初创企业。GPT-3是生成预培训的变压器版本3的首字母缩写词3。在许多情况下,其输出使读者很难将其与人类创建的小说区分开。
GPT-3的工作原理
GPT-3是一种机器学习语言模型,这意味着用户可以从提示中输入单词不完整的顺序并生成文本语言作为此提示符的输出。因此,可以将其视为一种自动完成的语言模型 - 就像用户在创建电子邮件时,通过建议单词来完成句子并减少用户的写作工作时被系统中断。GPT-3经过了大量数据集的培训,该数据集约有1750亿个参数(例如神经元重),这些参数是使用Reddit,Wikipedia,Google等网站从互联网中收集的,其文本远远超过任何人类的文字。寿命。生成程序培训通过输入句子或文本部分的一部分,并要求其预测接下来的下一个单词来起作用。然后将此输出与正确的单词匹配。与所有神经网络一样,权重将根据它们匹配正确的单词的程度进行调整。随着更多示例输入,调整了连接的权重,以便网络可以密切预测下一个单词。训练后,用户可以输入一系列单词,并生成一系列单词作为输出。因此,生成的文本可以是句子,段落,甚至是更多的短篇小说。用户可以查看带有输出的分数,以查看使用单词的可能性。GPT-3提供了灵活性,而不仅仅是生成文本。它还可以执行许多其他语言任务,例如评估文本内容,回答有关每个可能的主题的问题,总结文本,甚至翻译语言。
训练后,用户可以输入一系列单词,并生成一系列单词作为输出。
根据Tingiris [2]的说法,据估计,GPT-3的培训是在人类一生中写,阅读和说话的单词数量的57倍。这意味着GPT-3的大小使其无法下载到笔记本电脑或任何商务计算机上。但是,OpenAI通过应用程序可编程界面或API提供了启用。这意味着任何人都可以使用GPT-3访问API。它的用途很多,包括新颖的写作,博客,诗歌写作和商业报告以及笑话发生者。
对GPT-3的局限性和担忧
尽管如此,GPT-3确实有一些局限性。它的窗口大小约为1000个字。对于短篇小说来说,这足够了,但意味着中等长度的故事可能会随着增加产生的内容量而蜿蜒而行。如果给出用户的后续提示或系统遵循模板,则可以在很大程度上解决此问题。GPT-3由于其大小而在运行中也很慢,影响了其解释其输出的能力。由于已用于培训网络的数据,也可能存在偏差。关于GPT-3存在道德问题 - 尤其是假新闻故事的产生以及创建种族敏感内容的可能性。
互联网内容质量的后果
许多研究人员预测,随着GPT-3的出现,大量的互联网内容将不利。有些人认为互联网将会被平庸的内容浮现,因为GPT-3将以使用人类创建内容的成本的一小部分提供大量的数量。大量的平庸内容可能会导致缺乏信任,因为质量可能会被假新闻或虚假内容所稀释。原因是GPT-3还不能反思它所写的内容,因为虽然它可能是一个好词匠,但它不了解它所写的内容。人类内容适度是解决此问题的一种方法。但是,如果GPT-3提供大量的额外内容,那将是不可能的。
人类内容适度是解决GPT-3的问题的一种方法,不了解其写的内容
结论
毫无疑问,GPT-3迎来了新一波的AI语言应用程序,这将导致与计算机通信的改进。这也可能会引发互联网文档自动化的转变 - 例如足球比赛报告。由于GPT-3的结果,AI语言交流的未来已经采取了新的轨迹。但是,尽管它具有惊人的学习能力,但它仍然缺乏对语言的语义理解。尽管出现了外观,但它仍未提供人类水平的长期写作能力,因为GPT-3的神经网络架构提供了学习能力?没有理解其含义。换句话说,人类和人工智能之间的理解鸿沟尚未被桥接。这意味着它没有能力反思它所写的内容 - 即使可能写的东西可能像人类作家一样能够胜任。由于反射是写作的重要组成部分,因此当前版本可以很好地帮助作家生成故事内容,但仍可能需要人类的协作。将来我们将听到更多有关GPT-3的信息。
基思·达林顿
参考
[1] ???????????故事机:Mike Sharples和Rafael Perez Y Perez的计算机如何成为创意作家。
[2] ???????????探索史蒂夫·廷吉里斯(Steve Tingiris)的GPT-3。