11月6日,记者从蚂蚁集团获悉,按照国家七部委联合公布的《生成式人工智能服务管理暂行办法》指导要求,蚂蚁百灵大号型号已注册。
基于百灵大模型的多款产品已完成内测,即将向公众开放。
此次通过注册的大型模型是蚂蚁百灵语言模型。
这个大型模型采用 Transfromer 架构,基于万亿 Token 语料库进行训练。
支持32K窗口长度,推理能力领先,在主流推理榜单中排名靠前。
据了解,蚂蚁模型坚持自主研发、全栈布局。
目前已形成包括模型底层基础设施、基础模型、行业模型、应用产品在内的完整技术链。
得益于对大规模模型基础设施的坚决投入,蚂蚁百灵在算力、安全和知识方面都有着出色的表现。
计算能力方面,蚂蚁构建了万卡异构集群,其中硬件计算效率(HFU)超过60%,集群有效训练时间占比超过90%,RLHF训练下的训练吞吐量表现同模型效果优于行业解决方案。
提升3.59倍,推理性能较业界解决方案提升约2倍,处于业界先进水平。
在安全方面,蚂蚁开发了一体化大模安全解决方案——“蚂蚁天镜”。
作为业界首个大模型安全评估工具,“一剑”平台支持50万/日饱和攻击,全面覆盖生成内容中的数百种风险; “天健”平台在运行大模型时可覆盖8大类风险,以大模型对抗大模型,风险召回率大于99%。
其Guardrails前置护栏功能可准确回忆20余类问题风险意图。
在知识方面,蚂蚁通过统一的语料系统、标准化的数据预处理、增强的数据标注、三维评价等,形成了完整的知识处理能力。
其中,EVE是一个集成评估数据集和评估框架的大型模型评估平台,可以支持大型语言模型和多模态大型模型的一站式自动化评估。
据悉,在基础大模型层面,除了本次已注册的百灵语言大模型外,蚂蚁集团还在开发百灵多模态大模型,并已进行内测。
在行业规模模型层面,蚂蚁集团已在金融、医疗、安全等领域进行布局。
今年9月,蚂蚁发布了大型金融模型和两款应用产品:面向消费者的金融智能助手“智小宝2.0”和面向行业专家的金融商务助手“智小猪”。
蚂蚁集团副总裁、百灵大模型负责人徐鹏表示,蚂蚁大模型本着全栈布局、长远发展的原则,以创造产业价值为目标。
注册通过后,“百灵”将全面应用于蚂蚁金服的各类业务场景。
,并在各个垂直领域创新开发产品,更多的应用产品即将向社会开放。
公开信息显示,蚂蚁集团基于丰富业务场景的需求,持续投入人工智能,布局了包括知识图谱、运营优化、图学习、可信AI、大模型等AI技术领域。
