作者|徐杰成2月7日,百度官方公众号发布了一个非常简短的公告——《官宣:文心一言》。据了解,文心一言是百度内部研发的一款类ChatGPT聊天机器人,英文名称为ERNIEBot。据百度内部人员介绍:文心一言是由一系列基于百度提出的知识增强模型(Ernie)的高级大型模型组成,可以执行范围广泛的任务,包括语言理解和语言生成(ERNIE3.0Titan)和图像生成来自文本(ERNIE-ViLG)等。与其他语言模型相比,文心一言可以将广泛的知识与海量数据相结合,从而产生非凡的理解和生成能力。公司计划在3月份完成文心一言内测,之后正式对外开放。虽然我们暂时不知道文心一言的实际表现,但我们可以通过百度发表的《ERNIE 3.0 Titan: Exploring Larger-scale Knowledge Enhanced Pre-training for Language Understanding and Generation》论文大致了解其使用的语言模型ERNIE3.0Titan。.论文称:ERNIE3.0Titan是百度在PaddlePaddle平台上训练的千亿参数模型,包含多达2600亿个参数(ChatGPT使用的是GPT3.5模型,有1750亿个参数)。此外,百度还设计了自监督对抗损失和可控语言建模损失,使ERNIE3.0Titan能够生成可信可控的文本。为了减少计算开销和碳排放,百度还为ERNIE3.0Titan提出了一个在线蒸馏框架,教师模型将同时教授学生和训练自己。ERNIE3.0Titan是迄今为止最大的中文强化预训练模型。相关实验结果表明,ERNIE3.0Titan在68个NLP数据集上的性能已经优于现阶段最先进的语言模型,包括ChatGPT应用的GPT3.5模型。ERNIE3.0Titan模型结构图据悉,文心一言已进入上线前的最后冲刺阶段,相关消息的曝光也令百度港股大涨逾17%,市值增加约700亿港币。有业内人士表示,百度文心一言项目可能最早在2022年9月就开始研发。当时,百度CEO李彦宏在世界人工智能大会上表示:无论从技术还是商业应用,人工智能都取得了长足的进步,有些甚至改变了方向。考虑到目前ChatGPT带来的生成式AI的火爆,百度未来势必是国内唯一一家觊觎该领域市场的公司。从市场角度来看,像ChatGPT这样的聊天机器人最明显的价值和落地场景是百度主营的搜索业务。由此看来,如果下一次技术革命真的在该领域爆发,百度无疑将一马当先。此外,不少业内人士认为,考虑到谷歌和微软的推进步伐,文心一言公测的进度可能会继续推进。
