2019年10月27日,智谱AI推出完全自主研发的第三代大基模ChatGLM3及相关系列产品,这也是又一重大智谱AI推出千亿基数的聊天模型ChatGLM和ChatGLM2后取得了突破。
此次推出的ChatGLM3采用独创的多阶段增强预训练方法,使训练更加完整。
评测显示,在44个中英文公开数据集测试中,ChatGLM3在国内同规模模型中排名第一。
智谱AICEO张鹏在现场发布新品,并实时演示最新产品功能。
ChatGLM3全新技术升级,性能更高,成本更低。
更丰富的训练数据和更好的训练方案,让智谱AI推出的ChatGLM3性能更加强大。
与ChatGLM2相比,MMLU提升36%,CEval提升33%,GSM8K提升%,BBH提升%。
同时,ChatGLM3瞄准GPT-4V,实现了多项新功能的迭代升级,其中包括具有多模态理解能力的CogVLM——图像识别语义,在10多个国际标准图形评价数据集上实现了SOTA;代码增强模块Code Interpreter根据用户需求生成并执行代码,自动完成数据分析、文件处理等复杂任务;网页搜索增强 WebGLM-访问搜索增强可以根据问题自动在互联网上搜索相关信息,并在回答时提供相关参考。
或文章链接。
ChatGLM3的语义和逻辑能力得到了极大的增强。
ChatGLM3还集成了自主研发的AgentTuning技术,激活模型代理能力,特别是在智能规划和执行方面,比ChatGLM2高%;它还使国产大型模型能够原生支持工具调用、代码执行、游戏和数据库操作。
、知识图谱搜索与推理、操作系统等复杂场景。
此外,ChatGLM3此次推出了可部署在手机上的端测模型ChatGLM3-1.5B和ChatGLM3-3B。
支持vivo、小米、三星等多种手机及车载平台。
他们甚至支持移动平台上CPU芯片的推理。
速度高达 20 个令牌/秒。
在准确性方面,1.5B和3B模型的性能在公共基准上接近ChatGLM2-6B模型。
基于最新的高效动态推理和内存优化技术,ChatGLM3当前的推理框架在相同的硬件和模型条件下,比目前最好的开源实现更快,包括伯克利大学推出的vLLM和最新版本的ChatGLM3。
拥抱脸TGI。
提升了2-3倍,推理成本也提升了一倍。
每千代币仅需0.5点,成本最低。
新一代“智普轻言”上线,全国首创代码交互能力。
在全新升级的ChatGLM3的赋能下,生成式AI助手智浦轻言成为国内首款具备代码交互能力的大模型产品(代码解释器)(该模型提升了智浦轻言的中文图像和文本理解能力,实现了图像理解能力)接近GPT-4V,可以回答各类视觉问题,可以完成复杂的目标检测、标注,并完成自动数据标注。
今年以来,智谱AI的GLM系列模型已经支持大规模预训练和数据标注。
推论Ascend、神威超算、海光DCU架构 截至目前,智谱AI产品已支持Ascend、神威超算、海光DCU、海飞科、木犀溪云、计算科技、天数智芯、寒武纪、摩尔线程、百度昆仑芯、灵犀科技、长城超云等联合创新、性能持续优化,将助力国产本土大机型、国产芯片尽快走向国际舞台。
智谱AI此次推出的ChatGLM3及相关系列产品,全面提升了自身模型性能,为行业创造了更加开放的环境。
开源生态,进一步降低普通用户使用AIGC产品的门槛。
人工智能正在引领我们进入一个新时代,大型模型必将加速这一时刻的到来。