当前位置：首页 > 科技赋能

适配更多国产芯片，智谱AI推出第三代大基模ChatGLM3

时间：2024-05-19 16:15:18 科技赋能

2019年10月27日，智谱AI推出完全自主研发的第三代大基模ChatGLM3及相关系列产品，这也是又一重大智谱AI推出千亿基数的聊天模型ChatGLM和ChatGLM2后取得了突破。

此次推出的ChatGLM3采用独创的多阶段增强预训练方法，使训练更加完整。

评测显示，在44个中英文公开数据集测试中，ChatGLM3在国内同规模模型中排名第一。

智谱AICEO张鹏在现场发布新品，并实时演示最新产品功能。

ChatGLM3全新技术升级，性能更高，成本更低。

更丰富的训练数据和更好的训练方案，让智谱AI推出的ChatGLM3性能更加强大。

与ChatGLM2相比，MMLU提升36%，CEval提升33%，GSM8K提升%，BBH提升%。

同时，ChatGLM3瞄准GPT-4V，实现了多项新功能的迭代升级，其中包括具有多模态理解能力的CogVLM——图像识别语义，在10多个国际标准图形评价数据集上实现了SOTA；代码增强模块Code Interpreter根据用户需求生成并执行代码，自动完成数据分析、文件处理等复杂任务；网页搜索增强 WebGLM-访问搜索增强可以根据问题自动在互联网上搜索相关信息，并在回答时提供相关参考。

或文章链接。

ChatGLM3的语义和逻辑能力得到了极大的增强。

ChatGLM3还集成了自主研发的AgentTuning技术，激活模型代理能力，特别是在智能规划和执行方面，比ChatGLM2高%；它还使国产大型模型能够原生支持工具调用、代码执行、游戏和数据库操作。

、知识图谱搜索与推理、操作系统等复杂场景。

此外，ChatGLM3此次推出了可部署在手机上的端测模型ChatGLM3-1.5B和ChatGLM3-3B。

支持vivo、小米、三星等多种手机及车载平台。

他们甚至支持移动平台上CPU芯片的推理。

速度高达 20 个令牌/秒。

在准确性方面，1.5B和3B模型的性能在公共基准上接近ChatGLM2-6B模型。

基于最新的高效动态推理和内存优化技术，ChatGLM3当前的推理框架在相同的硬件和模型条件下，比目前最好的开源实现更快，包括伯克利大学推出的vLLM和最新版本的ChatGLM3。

拥抱脸TGI。

提升了2-3倍，推理成本也提升了一倍。

每千代币仅需0.5点，成本最低。

新一代“智普轻言”上线，全国首创代码交互能力。

在全新升级的ChatGLM3的赋能下，生成式AI助手智浦轻言成为国内首款具备代码交互能力的大模型产品（代码解释器）（该模型提升了智浦轻言的中文图像和文本理解能力，实现了图像理解能力）接近GPT-4V，可以回答各类视觉问题，可以完成复杂的目标检测、标注，并完成自动数据标注。

今年以来，智谱AI的GLM系列模型已经支持大规模预训练和数据标注。

推论Ascend、神威超算、海光DCU架构截至目前，智谱AI产品已支持Ascend、神威超算、海光DCU、海飞科、木犀溪云、计算科技、天数智芯、寒武纪、摩尔线程、百度昆仑芯、灵犀科技、长城超云等联合创新、性能持续优化，将助力国产本土大机型、国产芯片尽快走向国际舞台。

智谱AI此次推出的ChatGLM3及相关系列产品，全面提升了自身模型性能，为行业创造了更加开放的环境。

开源生态，进一步降低普通用户使用AIGC产品的门槛。

人工智能正在引领我们进入一个新时代，大型模型必将加速这一时刻的到来。

上一篇：2021世界人工智能大会活动日程

下一篇：自主研发900V高压+天行智能底盘，蔚来发布四大核心技术

适配更多国产芯片，智谱AI推出第三代大基模ChatGLM3相关文章