本文经AI新媒体量子比特(公众号ID:QbitAI)授权转载,转载请联系出处。谷歌硬充ChatGPT的消息一出,科技圈就坐不住了。就在昨晚,阿里巴巴、百度、网易、京东都宣布将推出类似ChatGPT的新产品,战况十分激烈。阿里巴巴内测的佛法学院版ChatGPT也被提前曝光。连画画的能力都没有?!ChatGPT类型的对话功能也不是问题。先说一个NBA话题:当被问及“乔丹和科比谁更伟大”时,他开始暴露自己的篮球迷身份,甚至说出“毫无疑问”、“奇迹般的出现”这样的话:乔丹仍然是死忠粉,能对你老婆的观点提出异议(手动狗头)看来这个达摩版的ChatGPT不仅有纯文本任务能力,还融入了多模态任务能力。为此使用了什么样的技术?阿里ChatGPT-like产品在本次内测中的能力如何?基于通义的整合升级,透露新品可实现的功能包括知识问答、AI绘图、代码生成、小说续篇、文案、诗词填词等。总之,不仅是既可以实现ChatGPT的能力,又增加了“AI绘画”的功能。能够实现这样的多任务、跨模态的效果,本质上离不开阿里同义大模型的能力。达摩院新版ChatGPT是在统一大模型系统的基础上进行整合升级的。据介绍,统一大模型的基础基于统一学习范式OFA等底层技术,具备处理多任务的能力:单个模型可同时处理图像描述,10多个单模态和跨模态任务,例如本地化、文森特图、视觉蕴含和文档摘要。升级后可处理语音、动作等30余种跨模态任务。这里“大一统”技术的关键是提出并实现三个“一统”:建筑上的统一。使用Transformer(encoder-decoder,codec)架构统一进行预训练和微调,在处理不同任务时无需添加任何特定的模型层。模态统一。无论是NLP、CV等单模态任务,还是图文等多模态任务,都采用相同的框架和训练思路。任务统一。所有的单模态和多模态任务都统一以序列到序列(Seq2seq)生成的形式表达,同类任务的输入几乎是“一模一样”。目前推出的广义大模型应用于电商跨模态搜索、AI辅助设计、法律文件学习、医学文本理解、开放域人机等200多个场景时,可达到2%~10%-电脑对话。%效果增加。从阿里的研发来看,他们其实在2020年左右就已经开始布局这样的技术研究,2021年推出“中国版GPT-3”PLUG,参数量270亿,但是是一个“通用”写神器”,比如GPT-3。比如这是续篇小说的效果:去年,阿里的AliceMind模型在CLUE榜单的AI中文理解任务上取得了第一超人的成绩,获得了86.685的高分。CLUE榜单将从文本分类、阅读理解、自然语言推理等9项任务综合评估AI模型的语言理解能力。然而参赛的AI模型一直未能超越人类的表现,而AliceMind在4项任务中一举超越了人类的表现。等级。国内厂商纷纷追逐ChatGPT。那么,对于此次推出类ChatGPT产品,阿里是怎么看的呢?其实在阿里同义的大模型体系中,已经有很多模型在Mota社区开源了。Mota社区由阿里巴巴达摩院和CCF开源开发委员会共同发起。目前社区上线模型300+,其中大模型10多个,SOTA模型150+,其中三分之一支持中文。不过,据知情人士透露,阿里的长期目标没有改变:打造中国的ChatGPT生态。这个定义对于阿里来说可能窄了一点。相比之下,阿里希望引领中国大机型的发展趋势。不仅是阿里,包括百度、网易、京东在内的各大科技公司也坐不住了。百度正在对类ChatGPT产品“文心一言”进行内测。官方公布的是3月左右完成测试,但因为这波人气,会不会提前还不好说。网易还透露,未来网易有道或将推出ChatGPT同源技术产品,主要应用于在线教育领域。京东集团副总裁何晓东表示,京东是加速AIGC和ChatGPT大规模落地的最佳场景。未来,借助这一系列成果,将加速人工智能在中国的应用。国内外厂商的这波ChatGPT热潮即将掀起。
