9月25日,百川智能发布百川2-53B闭源大模型,全面升级百川1-53B的能力。
百川2-53B不仅显着提升了数学和逻辑推理能力,而且通过高质量的数据系统和搜索增强,大大减少了模型错觉。
是目前国内最大、幻觉问题最低的车型。
作为首批通过注册流程的大型模型公司之一,百川智能此次也开放了百川2-53B API接口,正式进军To B领域,启动商业化进程。
此次开放API后,百川智能将把业界领先的大模型能力赋能给各界合作伙伴,助力万千企业智能化发展。
百川2-53B是百川智能发布的第六款大型模型。
自4月10日成立以来,该公司以平均每28天推出一款大型车型的惊人速度持续创新。
前不久发布的百川2号开源大模型在多项评测任务中显着领先LLaMA2,在业界获得了较高的声誉和广泛的认可。
了解更多:百川53B搜索增强大模型于2018年8月8日发布,该模型在知识问答、文学创作等方面表现出色,展示了商业文案(邮件撰写、公司命名、营销文案生成) 、文学创作(故事)续写、诗歌创作)、汉语理解(语义识别、成语意义、诗歌分析)等各种任务场景能力较强,大模型的数学和逻辑推理能力一直是重点备受业界关注,也是评价大模型是否领先的重要指标。
百川二号53B在百川53B的基础上,不仅着力加强上述两个维度的能力,而且对整体能力进行了全面升级。
其中,逻辑推理能力提升%,数学能力提升31%,语言理解能力提升29%,文本创作能力提升18%,知识问答能力提升9%。
幻觉处理全国最好,客观问答准确率行业领先。
幻觉是大规模模型实施必须克服的一个差距。
一般来说,有两种方法可以解决这个问题。
一是不断增加模型的数据规模,提高数据质量;另一种是通过调用搜索等外部工具使模型能够获取实时信息。
百川2-53B在这两方面都进行了大量优化。
在高质量数据建设方面,百川2-53B打造了独特的数据质量体系。
根据低质量和高质量标准对数据进行分类,确保百川53B始终使用高质量数据进行预训练。
在信息获取方面,百川2-53B升级了多个模块,包括指挥意图理解、智能搜索、结果增强等关键部件。
该综合系统通过深入理解用户指令,精准驱动查询词的搜索,最终结合大语言模型技术,优化模型结果生成的可靠性,实现更准确、智能的模型答案结果,减少模型错觉。
在高质量数据系统和搜索增强技术的支持下,百川2-53B有效减少了模型错觉。
百川智能FacTool评测结果显示,百川2-53B综合得分为0.5,在主流基础大型机型中排名仅落后于GPT-4,处于国内领先水平。
FacTool是由上海交通大学、卡内基梅隆大学、香港城市大学、Meta等机构的学者联合提出的通用框架(项目地址:API,全面进军To B领域。
除了能力上的全面升级,百川2-53B还开放了API接口,企业和开发者可以通过API将百川2-53B集成到自己的应用和服务中。
百川2-53B集成了最前沿的大模型技术,能够很好地适应不同企业的各种业务需求。
无论是智能客服、智能写作还是智能推荐,百川2-53B的API接口方便易用,客户只需简单配置和集成即可接入。
,并且其与OpenAI的接口高度兼容,客户可以快速迁移,大大降低模型部署和转换成本。
针对企业用户最关心的安全合规问题,百川智能打造了百川2-53B模型,作为首批通过《生成式人工智能服务管理暂行办法》注册的大型模型公司之一。
覆盖大模型预训练、微调、推理全周期的安全增强,可以为客户和合作伙伴提供全流程的安全保障。
借助百川2-53B丰富强大的模型能力,企业用户不仅可以升级现有业务,提高效率、降低成本,还可以探索更多应用场景,拓展创新边界。
未来,百川智能将持续探索大模型能力边界,探索大模型技术前沿创新,更好赋能千行百业。
智能流程。