当前位置: 首页 > 科技观察

GPT-3:会写的人工智能_0

时间:2023-03-11 20:48:31 科技观察

译者|审稿人崔浩|孙淑娟的开篇文章人工智能(AI)处于早期发展阶段,但它有可能彻底改变人类与技术互动的方式。人工智能简介谈到人工智能,目前主要有两种观点。有人认为人工智能终将超越人类智能,也有人认为人工智能将永远为人类服务。双方都可以同意一件事:人工智能正在以越来越快的速度前进。人工智能(AI)仍处于早期发展阶段,但它有可能彻底改变人类与技术互动的方式。一个简单、广泛的描述是,人工智能是对计算机进行编程以做出自己的决定的过程。这可以通过多种方式实现,但最常见的是通过使用算法。算法是解决问题时可以遵循的一组规则或指令。在人工智能的情况下,算法被用来教计算机如何做出决定。过去,人工智能主要用于下棋或解决数学问题等简单任务。现在,人工智能正被用于更复杂的任务,如面部识别、自然语言处理,甚至自动驾驶。随着人工智能的不断发展,未来它会具备怎样的能力还不得而知。随着人工智能能力的迅速扩展,了解它是什么、它是如何工作的以及它的潜在影响是很重要的。人工智能的好处是巨大的。凭借自主决策的能力,人工智能有可能提高无数行业的效率,并为所有类型的人创造机会。在本文中,我们将讨论GPT-3。什么是GPT-3,它从何而来?GPT-3由位于旧金山的领先人工智能研究公司OpenAI创建。他们将目标定义为“确保人工智能造福全人类”。他们创造人工智能的愿景很明确:人工智能不限于专门的任务,而是像人类一样执行各种各样的任务。几个月前,OpenAI公司向所有用户发布了名为GPT-3的新语言模型。GPT-3是GenerativePretrainedTransformer3的首字母缩写词,它包括通过称为提示的前提生成文本的能力。简单地说,它具有高水平的“自动完成”。例如,您只需针对给定主题提供两到三个句子,GPT-3将完成剩下的工作。你也可以生成对话,GPT-3给出的答案将基于之前问答的上下文。需要强调的是,GPT-3提供的每一个答案都只是一种可能,不会是唯一可能的答案。此外,如果您多次测试同一个前提,它可能会提供不同甚至矛盾的答案。因此,这是一个根据之前所说的内容返回答案的模型,并将其与您所知道的一切相关联以获得最合理的答案。这意味着它没有义务用真实数据给出答案,这是我们必须考虑的事情。这并不意味着用户不能透露相关工作数据,但GPT-3需要将该数据与上下文信息进行比较。上下文越全面,你得到的答案就越可信,反之亦然。OpenAI的GPT-3语言模型是预训练的,训练过程中学习了网上大量的资料。GPT-3被输入到所有公共书籍、维基百科的全部内容以及互联网上数百万的网页和科学论文中。简而言之,它包含了整个人类历史上在网络上发布的最重要的人类知识体系。在阅读和分析这些信息后,语言模型在位于48个16GBGPU上的700GB模型中创建连接。为了让我们理解这个维度,之前的OpenAI模型GPT-2模型的大小是40GB,分析了4500万个网页。差异是巨大的,因为GPT-2有15亿个参数,而GPT-3有1750亿个参数。让我们做个测试好吗?我问GPT-3如何定义自己,结果如下:如何使用GPT-3要能够使用GPT-3并对其进行测试,我们唯一要做的就是访问他们的网站,注册并添加个人信息。在这个过程中你会被问到:你会用人工智能做什么,对于这些例子,我选择了“个人使用”选项。我想指出,根据我的经验,它在英语环境中效果更好。这并不意味着它在其他语言中效果不佳。事实上,它在西班牙语方面做得很好,但我更喜欢它以英语提供的结果,这就是为什么从现在开始我要用英语显示测试和结果。当我们进入时,GPT-3给了我们一份免费礼物。使用电子邮件和电话号码注册后,您将获得18美元的完全免费使用,无需输入付款方式。虽然看起来不多,但实际上18美元已经很多了。为了给你一个想法,我已经用AI测试了五个小时,而且我只付了1美元。稍后,我将解释价格,以便我们更好地理解这一点。进入站点后,我们将不得不转到Playground部分。这就是所有魔法发生的地方。Prompt+Submit(提示+提交)首先,网页上最引人注目的就是超大的文本框。这是我们可以开始向AI输入提示(记住,这些是我们的请求和/或指令)的地方。这就像输入一些东西一样简单,在本例中是一个问题,然后点击下面的提交按钮让GPT-3回答我们并写下我们的问题。预设预设是针对不同任务随时执行的功能。它们位于文本框的右上角。如果我们单击其中的几个,“更多示例”将打开一个新屏幕,我们将在其中提供整个列表。选择预设后,文本区域的内容将更新为默认文本。右侧栏中的设置也将更新。例如,如果我们要使用“语法纠正”预设,我们应该遵循以下结构以获得最佳结果。用于训练GPT-3的大型数据集是GPT-3如此强大的主要原因。然而,更大并不总是意味着更好。由于这些原因,OpenAI提供了四种主要模型。当然还有其他型号,但建议我们使用最新版本,这是我们现在使用的。可用模型称为Davinci、Babbage、Curie和Ada。在这四种型号中,Davinci是最大和最有能力的,因为它可以涵盖其他引擎执行的任何任务。我们将概述该模型以及该模型适用的任务类型。请记住,虽然较小的引擎可能没有接受过那么多数据的训练,但它们仍然是通用模型,对于某些任务来说非常可行且方便。正如Davinci上面提到的,它是最有能力的模型,可以做任何其他模型可以做的一切,而且通常只需要更少的指令。达芬奇能够解决逻辑问题、确定因果关系、理解文本意图、制作创意内容、解释人物动机以及处理复杂的摘要任务。居里模型试图平衡计算能力和速度。它可以做Ada或Babbage可以做的任何事情,但它也可以处理更复杂的分类任务和更细微的任务,如摘要、情感分析、聊天机器人应用程序和问答。Babbage它比Ada稍微有能力,但效率不高。它可以执行与Ada相同的所有任务,但也可以处理稍微复杂一些的分类任务,并且非常适合对文档与搜索查询的匹配程度进行分类的语义搜索任务。Ada最后,这通常是最快和最便宜的模型。它最适合不太微妙的任务,例如解析文本、重新格式化文本和更简单的分类任务。您为Ada提供的上下文越多,它的性能就越好。我们可以调整引擎的其他参数以获得对我们提示的最佳响应,这就是模型。控制GPT-3引擎输出的最重要设置之一是温度。此设置控制生成文本的随机性。值为0时,引擎是确定性的,这意味着它将始终为给定的文本输入产生相同的输出。值1使引擎承担最大的风险并使用大量的创造力。您可能已经注意到,在您能够自己运行的一些测试中,GPT-3会在句子中间停止。要控制我们将允许生成的最大文本量,您可以使用token中指定的“最大长度”设置。我们稍后会解释这个令牌是什么。“TopP”参数可以控制GPT-3文本的随机性和创造性,但在这种情况下与概率范围内的标记(单词)有关,具体取决于我们放置它的位置(0.1为10%)。OpenAI文档建议在Temperature和TopP之间只使用一个函数,所以在使用一个时,确保另一个设置为1。另一方面,我们有两个参数来惩罚GPT-3给出的答案。其中之一是“频率惩罚”,它控制模型进行重复预测的趋势。它还降低了已经生成的单词的概率,并且取决于一个单词在预测中已经出现了多少次。第二个处罚是存在处罚。有一个惩罚参数可以鼓励模型做出新的预测。如果一个词已经出现在预测的文本中,就会有一个惩罚来降低这个词出现的概率。与频率惩罚不同,存在惩罚不取决于单词在过去的预测中出现的频率。最后,我们有一个“最佳”参数,它会为一个查询产生多个答案。Playground会选择最好的一个来回应我们。GPT-3将发出警告,针对提示生成多个完整答案,从而导致花费更多代币。历史为了完成这一部分,“提交”按钮旁边的第三个图标将显示我们对GPT-3的所有历史请求。在这里您会找到最佳回复的提示。费用和代币GPT-3还提供了一种方法,可以在18美元的免费信用额度用完后继续使用其平台,这不是按月订阅或类似的方式。价格将与使用情况直接相关。也就是说,是按token收费的。这是人工智能的术语,代币与产出成本有关。令牌可以是从字母到句子的任何内容。因此,很难确切知道人工智能每次使用的成本是多少。但由于它们通常以美分为单位,通过一些实验,很快就可以看出每件东西的成本是多少。虽然OpenAI只向我们展示了十几个GPT-3使用示例,但我们能够看到在每个示例上花费的代币,让我们更好地了解它是如何工作的。这些是版本及其各自的价格。为了让我们了解一定数量的代币可能要花多少钱,或者给我们一个代币化工作原理的例子,我们有以下工具,称为Tokenizer。它告诉我们GPT系列模型使用标记处理文本,标记是文本中常见的字符序列。该模型了解令牌之间的统计关系,并在生产序列中使用下一个令牌时进行选择。最后,这是一个低级别的例子,看看同样的例子会花费我们多少钱。结论在我看来,GPT-3是用户必须知道如何正确使用的工具,GPT-3不一定给出正确的数据。这意味着如果您想将它用于工作、回答问题或做作业,您必须提供良好的背景提示,以便它给您的答案接近您想要的结果。一些人担心GPT-3是否会改变教育,或者今天存在的某些与写作相关的工作是否会因此而消失。以我的拙见,这将会发生。迟早,我们都会被人工智能取代。这个例子是关于与写作相关的AI,但它们存在于编程、绘图、音频等领域。另一方面,它为许多个人和专业的工作和项目开辟了更多的可能性。例如,你有没有想过写一个恐怖故事?在语法检查器的示例列表中,你可以具体实现这个功能。说了这么多,我想说的是,我们处在人工智能的早期版本。这个世界上还有很多产品需要成长和完善,但不代表没有落地。只要我们学习和使用人工智能,就需要不断地训练它,让它给出最好的反应。译者介绍崔浩,社区编辑,资深架构师。他拥有18年的软件开发和架构经验,以及10年的分布式架构经验。原标题:GPT-3Playground:TheAIThatCanWriteforYou,作者:IsaacAlvarez