当前位置: 首页 > Web前端 > HTML

我所了解的ChatGPT:二次开发;有什么限制;对未来的影响

时间:2023-03-28 19:15:56 HTML

前言ChatGPT其实在去年年底就已经在开发界大放异彩,圈外却鲜为人知。春节过后,公关公司开工,立马开始密集推广,然后开始破圈。现在它已经成为整个公众领域最热门的话题,尤其是在风险投资领域。我最近也收到了一个基于OpenAIAPI开发一个小应用程序的请求,所以我开始详细了解它。现在初步完成了应用,对OpenAI的产品有了更具体的了解。结合之前问过做AI的朋友,总结自己的观察和思考,想写一篇文章分享给大家。希望在未来的AI世界里,我们不会缺席。OpenAI的服务ChatGPT是OpenAI的一项服务。它的内核是GPT-3.5。OpenAI还提供很多其他服务,比如图像生成、文本分析、质量略低于ChatGPT的GPT-3等。使用这些服务需要一些操作或技巧,比如翻墙——这次是OpenAI的第一步。以下是我摸索出来的一些经验,希望能为后来者节省一些时间。注册目前注册OpenAI比较麻烦,因为它不为中国用户提供服务,所以必须要有国外手机号,使用全球代理才能完成整个过程。借号收号平台可以绕过国外手机号码,您可以根据自己的需要选择;如果有在国外的亲戚朋友帮忙,就很容易了。如果只想在网页上使用ChatGPT,暂时可以不绑定卡。如果你想使用API??或其他服务,你必须绑定卡。绑定卡很麻烦,不支持国内信用卡。像Payoneer这样的虚拟信用卡,只对企业开放,需要资质审核,做起来并不容易。至于我,最后还是请了国外的亲戚帮忙。目前有三个月的免费期,足够我暂时跑完设想的应用场景了。GPT-3和GPT-3.5流行的ChatGPT是GPT-3.5,现在只提供web服务。如果要作为API调用,还需要一些转换步骤,比较麻烦。从开发的角度来说,直接使用OpenAIAPI会容易很多,但是只能使用GPT-3模型,质量会低一些。不过ChatGPTAPI好像已经在预约注册了,估计很快就会开放,所以还是先写代码吧,等开放了应该就可以了。目前,我认为官方不希望大家偷偷使用网页界面。近期可以继续尝试。从长远来看,最好准备好切换到API。我的进展我目前正在通过OpenAISDK实现对服务API的本地调用。但是,官方SDK存在一些问题。比如因为使用了axios,所以不能部署在VercelEdgeFunction上,必须放在自己的服务器上。所以接下来我打算做两件事:尽量不使用SDK,将逻辑直接放在VercelEdgeFunction中搭建ChatGPTWebAPI环境,从而直接使用更好的服务ChatGPT限制(以下内容感谢@Gary指导。)4097tokensGPT-3.5的最大长度是4097个令牌。根据我的AI朋友的说法,汉字=2个标记,英文=0.5个标记。也就是说,GPT-3.5的上下文最多可以容纳2k个汉字或8k个英文字符。所有的文本组合起来发送给AI,AI给出答案;我们继续新的文字发送,AI会给出新的答案。直到原有内容被挤出,产生新的上下文。这是什么意思?例如,我们的日常交流有其自身的语境。与父母、同事、恋人的交谈,因语境不同而不同。我会在游戏里和我的朋友们谈论魔兽世界,但是如果我和我的父母说同样的话题,他们是不会理解的。这就是上下文的区别。换句话说,我们跟ChatGPT对话,用中文,教它一件事,积累2k单词后,他会忘记这个请求。为了避免这种情况,我们必须经常重新教授它;或者,以编程方式重构提示,添加先决条件以便维护特定功能。听起来很有道理,但错误百出。我称之为“尴尬聊天之神”。ChatGPT并不是真正的智能。换句话说,当前的人工智能实现是从不同方向模拟人类智能。也许最后我们会成功,但似乎还有一段距离。具体在ChatGPT上,你说什么他都会回复,但是这个回复是否有价值就不好说了。尤其是在一些绝对事实方面,由于训练语料的问题,ChatGPT的表现会比较差。因为对它来说,假或错的语料库,只要语法正确,也是好的语料库。在这方面,Bing中称为GPT-4的模型(我怀疑这个版本号)会表现得更好,因为它将结合网页权重并使用更权威的材料。在编程世界中也是如此。因为开源软件的关系,ChatGPT拥有非常丰富的程序开发知识,可以帮助我们解决很多问题,写出很多代码。不过这些代码是怎么写的,能不能跑起来,现在还不好说。那么,你能把编程工作丢给它吗?目前还不能,甚至连根据语言特性做逻辑推导(语法检查)的能力都没有。——但不代表我们不能用它来提高效率和学习技术。还没有真正的智能,继续学习是不可能的。前面提到,ChatGPT可以在保留一定上下文的基础上,以有状态的方式与当前用户进行通信。所以我们也可以教ChatGPT做一些事情,比如发出指令:“以后提到日期时,使用格式YYYY-MM-DD”。接下来,我们可以使用ChatGPT作为自动格式转换器。或者,我们可以让它使用不同的语气,不同的语法,改变输出内容,适合某种风格。比如著名的胡总编辑模拟器、鲁迅模拟器等。但这些都不是自我意识和学习,它们本质上只是ChatGPT基于完整上下文合成的文本。有很大的局限性:首先,我们必须保留足够的上下文,其次,我们没有办法直接将这种状态传递给其他用户。哪些期货更有前景?ChatGPT的出现让大家非常兴奋,我也是。我们都知道未来是有希望的,但是总的来说,有的未来比较有希望,有的未来则不太乐观。结合上面提到的问题,我觉得有一些领域可能不太好做:养老(x)我有一个朋友上一份工作专注于老年市场,所以他马上问是否可以使用ChatGPT做一个养老软件。我不这么认为。这里涉及到两个问题:上下文约束。AI会丢失大量历史记录,需要用户花费大量时间进行反复训练。对于有经验的用户,可以通过各种方式进行优化,对于老年人来说,可能会屡屡受挫。不够准确。由于训练语料的问题,ChatGPT无法保证内容的准确性。如果老年人寻求医疗建议,他们可能会得到错误的答案。众所周知,AI无可厚非,这也很难解决。但也有一些领域会出现很大的机会:语言、翻译、文档等,这就是ChatGPT的主场。无论是翻译还是文档编写,ChatGPT到目前为止都可以做得很好。4097个代币的限制,可能需要我们在产品层面做一些辅助设计,但在可以想象的空间内,我们可以做出好的产品。包括但不限于:小说生成器说明文字生成器内容/关键词提取器商务邮件辅助工具学习外语辅助工具……太多了就不一一列举了。总之,这个领域几乎肯定会产生很多应用,甚至我们现在也能看到很多。用户界面我认为ChatGPT的最大价值在于新的用户界面。过去,我们的用户界面,无论是命令行还是图形化,都只是针对特定的需求,需要用户有清晰的认识,明确方向,努力钻研。如果用户没有学会,就很难使用现有的产品。想象一下,如果用户可以用自然语言发出命令,那么几乎任何产品界面都可以重建为更有用。比如我们家Siri最常用的功能就是定时,比如煮泡面:嘿,siri,定时4分钟。但是其他的功能就很难实现了,因为其他的功能描述起来太复杂了,表达方式也很多,目前Siri处理不了。ChatGPT可以从用户的文字描述中提取有价值的信息;经过简单的训练,它还可以发出指定的指令。所以我想象未来很多东西都可以用它来重建,比如(GPT没有很好的翻译,所以我改用Muimui):“Muimuyi,callmewater”——我的瓶装水喝了之后,你有打电话给水站要求他们送水——ChatGPT自动拨号,只需与客服沟通,点水即可。“咪咪,帮我叫个外卖,我们吃米线吧”——这个需求会复杂很多。除了外卖,我们还需要AI来区分“吃米粉”的需求,通过历史判断我们经常吃的是哪一款粉丝,然后帮我们完成点外卖的需求。AI公司的未来未来像OpenAI这样的大公司,能提供通用模型的公司会越来越少,因为通用模型的数据量和计算量太大,小公司负担不起。但是做AI的小公司可能会出现,类似于用WordPress建网站。小公司可以帮助客户在大模型的基础上进行微调,帮助客户将AI融入产品。我会怎么做首先,我必须尝试使用??ChatGPT作为产品。我认为这是一个非常重要的产品,也是未来的重要组成部分。去年开始在业界流传的时候,没想到会有这么大的关注度,这对我们来说既是好消息也是坏消息。好消息是未来可以利用品牌推广,坏消息是势必会有更多的竞争者入局。其次是产品方向。我想做简历相关的工作,让ChatGPT帮我们把简历做的更适合京东,更有竞争力。考虑到它在文本分析和生成方面的优势,我认为这个方向有很大的机会。我也打算加入一家主要产品是AI应用层的公司,不要错过。希望找到合适的老板或团队,尊重技术,善于市场,让大家合作共赢。前端怎么做?我觉得现在是前端的好机会,因为ChatGPT目前是提供基于浏览器的服务,所以浏览器扩展有很大的想象空间。建议所有前端小伙伴学习ChatGPT的相关知识,能够实际开发一两个相关产品。比如有人会要求ChatGPT推荐一些配色,如下图所示:ChatGPT只能给出优秀的数值,不方便直接看。我们可以写一个浏览器插件,将页面上的颜色转换成色块显示,并且支持一键保存到我们自己的调色板中。好好利用这段真空期,还有很大的发展空间。综上所述,去年了解了ChatGPT,上周基于ChatGPT开发了一个浏览器扩展,并结合自己的所见所闻,深入分享。希望对所有阅读文章的人有所启发和帮助。如果你对ChatGPT和最近的AI热潮有想法和疑问,欢迎留言讨论。更欢迎对我的文章发表评论和讨论。未来,AI一定会有一席之地,让我们一起为属于我们的新领地而战吧。本文参加了SegmentFault思维写作挑战赛,欢迎正在阅读的你加入。