当前位置: 首页 > 科技赋能

第四范式发布世说大模型,用生成式AI重构企业软件(AIGS)

时间:2024-05-19 15:50:40 科技赋能

4月26日,第四范式首次向公众展示了其大模型产品“世说3.0”,并首次提出AIGS战略( AI 生成软件):利用生成式 AI 重构企业软件。

世说将定位为基于多模态大模型的新型开发平台,提升企业软件的体验和开发效率,实现“AIGS”。

第四范式首席执行官创始人表示:“C端产品已经接近用户体验的上限,而B端企业级软件往往是一个非常复杂的执行系统,有十几层菜单和数千个功能。

戴文渊认为,目前这些B端软件极其复杂的交互体验,以及复杂性带来的极低的开发效率,给生成式AI的重构和改造留下了足够的空间。

“以前,通过人类语言(自然语言)来调用企业软件的功能是很困难的。

现在当我们有了更强的语义理解和生成能力,再加上GPT任务翻译、任务分发和推理能力,我们就可以使用它了。

”更好的“对话框式”交互方式实现了功能调用,不再需要寻找位于十几级菜单目录下的功能。

”这背后是第四范式现场拔掉网线的能力。

理解图片、进行多轮对话、写小说、使用大型世说模型快速绘制图画的能力此外,基础能力演示还展示了世说能够通过推理能力完成更复杂的“拳击”操作。

在戴文渊看来,要实现AIGS,大模型不一定是知识渊博的多面手和十项全能冠军。

更重要的是,该车型有Copilot(副驾驶舱)和CoT(思维链)。

思想、多步推理)能力。

“要改造企业软件,大模型不能只有语言能力。

世说2.0增加了多模态和Copilot,因为很多企业软件中的数据是多模态的,而Copilot可以将人类指令翻译成调用后端哪个API?”在之前发布的食锁2.0演示中,门店员工通过语音、文字等交互方式向食锁下达指令。

石索明白后,联网商店监控软件调出了厨房里没有戴口罩的人的照片。

并将图片以对话框的形式直接输出给员工。

大型模型已经可以通过调用软件内置的函数和数据以“对话式”完成任务来产生巨大的价值。

然而,员工在使用企业软件时也会面临复杂的任务,需要人们按顺序一一执行功能。

因此,世说3.0强调Copilot加思维链CoT拥有更强的推理能力。

在学习大量数据和“策略”后,它可以形成中间逻辑推理步骤,从而拆分和执行复杂的工作。

第四范式将AIGS路径概括为三个阶段:第一阶段,Copilot调动不同的信息、数据和应用程序作为助手来完成用户的指令。

相当于所有企业级软件系统都有一个统帅。

指挥官听取用户的指令,例如“将照片调亮 20%”。

第二阶段,Copilot+基于企业规则的“知识库”。

AI可以参照规则完成复杂的工作,进一步丰富了“对话框”的能力。

例如,AI查询“人像美化”知识库后,可以执行步骤将照片修复得好看。

第三阶段,Copilot+CoT(思维链)。

软件系统的使用行为最终都会被大模型学习,形成AI在该领域的思维链,这意味着诸如“处理照片,让照片看起来更好看”等复杂指令都可以由AI分步自动完成。

第四范式的AIGS策略是指基于大规模模型背后的Copilot+COT能力,将企业软件转变为新的交互范式,并不断学习软件在新交互上的使用过程,形成领域软件的“思维” 。

在我国某航空制造行业代表性企业的实际场景演示中,其与第四范式联合改造了一款基于Copilot技术的工业设计软件。

零件搜索与装配在演示会上某医疗行业的实际场景演示中现场,世说的“思维链”可以清晰地指出销售药品的具体步骤。

最终,由于新的交互形式的出现,企业软件的开发效率变得更高。

每次升级一个功能,都要经过一遍又一遍的原型设计、开发等,至少需要几个月的开发时间,因为“对话”。

style”接口固定,功能和逻辑在数据、API、内容层面进行了重写,开发效率达到天级。

值得一提的是,在世说3.0发布会现场,来自航天制造、金融、医疗等行业的客户代表出席并现场演示了产品。

ChatGPT出现短短两个月时间,已有不少企业和合作伙伴与Paradigm在生成式AI领域开展了深度合作。

作为基于大模型的新型开发平台,世说期待与更多的合作伙伴和企业客户一起探索利用生成式AI重构企业软件的机会,共同提高企业软件的可用性和生产力。

第四范式AIGS大模型战略背景资料: 1、第四范式什么时候开始重点投资GPT和大模型:BERT出来的时候,范式研究院就开始关注和投资这个技术领域。

GPT3出来之后就更加清晰了。

我们必须朝这个方向走。

但与今年的投资相比,前几年肯定是有差距的。

ChatGPT给我们最大的帮助就是整个市场的信心从0提升到满,确定性的投入更大了。

之后将转化为产品和商业化路线推向市场。

2. 你有和同龄人比较过吗?中国目前还没有像OpenAI这样在大型模型上绝对领先的公司,而且还会有更多的大型模型。

大型模型是新的生产力。

每个人都必须有一个大模型作为基础,所以进入的门槛确实变高了。

但达到这个门槛之后,重点就是如何选择方向。

比如,培养了一名大学生后,去企业接受专业培训,积累某一领域的专业能力是非常重要的。

但如果你没有一定的素质,很多事情你就做不了,所以底层的大模型也很重要。

第四范式认为,更大的机会在于变革整个企业软件行业,这也是AIGS的方向。

大模型的技术方向是Copilot可控(执行可控、错误可纠正),以及COT(思路链、多步推理、复杂任务拆分)形成数据飞轮的能力(比如划分时)将某个垂直领域的数据和流程放入一个大模型中,可以快速形成该领域模型的思维链)3、世说在短短两个月内发布了3个版本,从1.0到3.0。

迭代过程是怎样的? 1.0 - ChatGPT 流行之后,大多数客户和合作伙伴并没有真正使用过类似 GPT 的技术。

当时我们发布了第一代具有生成语言和解决问题能力的产品。

应用GPT技术的三大问题是内容可信性、数据安全性和成本。

当时的主要场景是图书馆问答,相当于让GPT可以学习企业知识,解答专业问题,而且在2.0中是可追溯的。

在语言能力的基础上,增加文本、语音、图像、表格、视频等多模态输入输出能力,并增加企业级Copilot能力,与企业内部应用库、企业私有数据等联网。

分析信息和数据、回答员工询问或执行相关任务,从知识助理转变为业务助理。

3.0——基于生成和语言能力,3.0利用Copilot和思维链COT(多步推理,复杂任务拆分,形成数据飞轮)来改造传统B端企业软件的体验和开发效率。

我们称之为AIGS(AI generated software),利用生成式AI来重构企业软件。

关于AIGS: 4.为什么要做AIGS(软件)?什么是 AIGS? C端软件体验在这十几年里已经打磨到了比较高的水平,如果用对话也不一定会更好。

但在B端(想象一下企业报销系统、HR系统、OA系统),体验还是比较差的。

也许你点击菜单中的某个下拉菜单,再次点击该下拉菜单,多点击几次就可以进入某个功能。

过去,通过自然语言调用这些函数是很困难的。

现在当我们对自然语言有了更强的语义理解后,我们就可以通过更好的交互方式来调用函数,从而实现一种新型的语音/对话。

交互模式取代旧的交互方式,从而快速、颠覆性地提升B端企业软件的体验。

二是开发效率提升。

最初,B端企业软件是高度定制化、基于菜单式开发的。

基本上一次升级一个功能,需要产品经理画界面、设计、开发等,至少需要一个月级别的开发时间。

由于新的交互形式的出现,原来的功能和执行逻辑都安排在软件界面中,而现在功能和逻辑在数据、API和内容层面进行了重写,开发效率达到了天价。

就像ChatGPT不再是一个复杂的菜单和一堆功能一样,你只需要一个对话框就可以做很多事情。

而且每天都在迭代,但你却感觉不到它界面的变化。

过去软件是在接口层面进行升级,未来是在数据层面进行升级。

我们看到大模型可以提高用户体验和开发效率,所以它们一定会形成软件行业的飞跃。

问题是谁能先做到。

这是一个巨大的市场。

大型模型是新的生产力。

以大模型基础设施作为整个软件产业转型的试点,整个行业的商业价值和商业模式将实现飞跃。

5、AIGS如何实现?要改造大型软件模型,仅靠语言技能是不够的。

世说2.0增加了多模态和Copilot,因为很多企业软件中的数据是多模态的,Copilot支持使用对话来调用软件内置的功能/数据来完成任务。

2.0中,员工可以通过语音、图像、表格、视频等多模态方式向师索发起询问或指令。

石索理解后,联网企业软件就会调用相关功能,并以所需的形式输出答案。

当我们完成一项任务时,它往往并不完全是一个功能。

例如,在图像处理软件中,如果要调整亮度和对比度,就是这些功能。

但如果把字符P做得细一些,则无法通过单一的功能来实现。

这背后,需要人们根据经验执行软件的每一个功能来实现。

人们在接到复杂的任务时,会在大脑中一步步推理出要执行的子任务,然后一步步执行。

切换到机器。

如果对于同一个工作,机器过去已经见过足够多的人(积累的数据)通过步骤一、二、三、四来完成这项工作,它已经可以在这个例程中总结出来,形成一条思维链。

因此,世说3.0强调Copilot加CoT。

大模型利用更强的CoT推理能力来不断学习新领域的思维链条,相当于利用软件本身的使用行为来构建AI针对该领域的思维方式。

对于企业软件合作伙伴来说,基于范式的大模型能力,可以对各个领域进行足够深入的钻研,学习足够多的数据。

最终形成场域思维链,发展成为“场”大模型。

当思维链的复杂程度达到一定程度时,其软件可以自动执行越来越复杂的功能。

6.以往范式的工作在这方面有哪些积累?首先,Paradigm拥有制作大型模型的技术能力。

虽然Seer并没有将自己定位为通用模型,但当时将自己定位为专用模型,Seer一直强调模型必须是高维的。

所谓高维其实就是参数,模型一定要做大,就像GPT3.5,就是1亿以上。

参数,从技术上讲,这是您可以移动的地方。

此外,Paradigm拥有国内领先的研究、工程、产品能力等全栈技术能力。

其次,Paradigm原有市场和新市场面临的产业链恰好是上下游。

过去,人工智能更像是一个重要的部分或组件。

除此之外的其他领域并未被人工智能覆盖,而是被企业软件覆盖。

经过这么多年的发展,企业软件基本上已经可以涵盖所有的内容了。

范式和软件公司一直是相互关联的。

Paradigm在软件方面负责AI决策,软件公司负责功能和流程的实现。

例如,如果人工智能预测一家商店明天将运送多少鸡翅,则需要将其放入商店管理系统中。

我们是共生的,彼此非常理解。

当我们看到GPT3时,我们就已经知道它可以帮助企业软件市场。

做到这一点还是需要非常雄厚的行业积累。

第四范式在过去几年中一直深耕该行业。

随着我们对AI产业化的深入了解,我们更加清晰地认识到大模型作为新的生产力工具,如何落地才能产生最大的价值。