7月14日晚,智谱AI和清华KEG突然发布公告,表示为了更好地支持国内大模型开源生态,经过智谱AI和清华KEG的实验后,办公室决定,即日起,ChatGLM-6B和ChatGLM2-6B权重全面开放给学术研究,并在完成企业注册并获得授权后允许免费商业使用。
此前,根据智谱AI官网显示,ChatGLM2-6B无限实例+无限推理或微调工具包的私有化价格为每年30万。
突然的免费让人很不解,但看到“免费”二字,很难不让人想起一个月前百川智能发布的百川七号开源免费商业大机型,以及7月10日发布的百川七号.13B 开源、免费且可商用的大型模型。
从这一点来看,智谱AI的自由举动似乎有了合理的解释。
百川7B突然出炉,智谱跟进升级应对。
从Meta开源到现在,市面上开源的模型并不多。
目前国内近一半的大型模型都选择了开源的方式,但总体来看,目前国内能做的只有百川和智谱被广泛使用,其他大型模型在实用性上还远远落后于这两者。
所以,大模型开源战场现在已经完全变成了百川和智谱之间的战斗。
作为ChatGPT火爆后国内最早推出的开源大模型,3月初,当业界还在争论ChatGTP是否是人工智能奇点、是否值得加入大模型时,ChatGLM-6B就已经发布了。
当时,国内互联网上还没有可以与其竞争的产品。
甚至比号称第一家发布大型号的大厂商的百度还要早两天。
凭借先发优势,ChatGLM2-6B在开源社区积累了众多用户。
此外,ChatGLM-6B在MMLU、CEval、GSM8K等数据集上具有出色的评估表现。
与同参数级别的车型相比,性能非常强大。
长期以来,ChatGLM-6B 一直主导着 HuggingFace 趋势排名。
存在。
正是因为这种别人没有的我有,别人有的我有出色的能力,ChatGLM-6B才有冲锋的资本。
这几个月来,ChatGLM-6B就像武林中的佼佼者一样,俯视四方,没有敌人。
凭借先发优势,ChatGLM-6B本可以继续这样下去,继续将领先的技术能力转化为收入。
但没想到的是,百川智能很快就崛起为后起之秀。
成立仅两个月,就发布了开源免费商业大型号百川-7B,上线后达到巅峰。
仅用了6天时间就登上了HuggingFace Trends。
排名第一的 ChatGLM-6B 被挤出了第一名。
在C-Eval、AGIEval、高考等多个榜单的评测中,百川7B取得了优异的成绩,远远超过了包括ChatGLM-6B在内的其他同尺度参数的大型模型。
智谱很快做出了回应。
百川7B发布十天后,他全面升级ChatGLM-6B,推出ChatGLM2-6B,再次占据主动。
评测结果表明,与第一代模型相比,ChatGLM2-6B在MMLU(%)、CEval(%)、GSM8K(%)、BBH(%)等数据集上的性能有了很大的提升。
该机型具有较强的竞争力。
可以说,开源大模型之战第一局,百川智能出奇制胜,以自由招式攻击智谱AI。
这着实让智谱措手不及。
不过智谱反应很快,处理得当,很快就重新掌控了局势。
城池,双方互有胜负。
在百川13B再下一城后,智谱完全免费发布了ChatGLM2-6B。
此后,智谱以为自己可以松一口气,平复一下心情。
没想到,发布仅仅16天,百川智能又推出了百亿参数的大模型百川13B。
它也是开源的,可免费用于商业用途。
而且,国内最权威的中国模型评测机构之一SuperCLUE近期基于SuperCLUE-Open评测基准对现有的多个百亿级开源模型进行了测试评测。
评测中,百川13B变身六角全能战士,各项能力大幅领先同规格开源型号产品。
在当前的生成问题和多轮评估基准中,Baichuan-13B 基本相当于 GPT-3.5 和 Claude 基础版本。
与国内百亿级开源模型相比,百川-13B-聊天有很大领先优势(20多点)。
再次使用同样的招式,但不同的是,威力更强了。
面对百川13B增大的体积,智谱的ChatGLM2-6B实在是招架不住。
毕竟免费版这么好用,为什么会有人关注付费版呢?无奈之下,免费开源成了唯一的选择。
世界上唯一的武术就是快。
第二轮开源大模型之战,百川没有改变自由招式,而是利用研发速度占据优势。
目前,百川-13B-聊天在抱脸的下载量已达6.98万次。
竞争是大模型生态系统最好的催化剂。
目前,业界的共识是,数百亿是大车型商业化的最低门槛。
因为大模型想要达到可以商用的状态,就必须大幅提升大模型在特定任务上的能力。
目前的研究表明,就In Context Learning而言,只有达到数百亿规模,才能在某些特定任务中显现出大型模型的能力。
同时,虽然理论上模型规模越大,其各种性能也会越强大。
但当模型变大时,就会在工业实施中带来问题。
例如,更大的模型通常意味着更大的计算功耗和更高的部署成本,这使得在一些垂直领域(例如学校和医院)难以承受。
因此,商业化的百亿级规模的开源大模型对于大模型生态系统的构建具有重要意义。
也就是说,6B、7B参数级别的比赛,只是高手们比赛前的一场试炼。
开源大模型之战的真正胜利者取决于百亿参数级模型的性能。
目前,百川智能的业绩十分亮眼。
上线短短六天,百川-13B-chat下载量已达到69.8万次,在百亿参数级别上已经处于领先地位。
另一方面,智谱官网目前显示,ChatGLM-12B本地私有化的每年定制费用为1万元。
那么对于百川的全面出击,智谱将如何应对呢?是又免费了还是还有别的伎俩?让我们拭目以待。
不过,无论结果如何,这些都是真正可以使用的、免费的、市售的、真正可以使用的基础大模型,而不是为了评估而优化的实验室产品。
无论最终谁胜出,对于国内大模型应用生态来说都是一个好消息。
国内开源生态系统具有很好的引领作用。
从另一个角度来说,大模型的开发确实需要你们互相追逐、互相竞争。
只有生态系统“卷起来”,生态系统才有活力。
如今百川和智谱在开源大模型领域已经达到了新的高度,希望未来有更多的企业参与进来,共同让中国的大模型变得更好。