当前位置: 首页 > 科技赋能

数学爱好者的好消息,学而思将推出大型数学模型MathGPT

时间:2024-05-19 17:02:32 科技赋能

据了解,学而思正在为全球数学爱好者和科研机构开发一款自主研发的大型数学模型,名为MathGPT,具有数学领域的专业知识数学解题和讲座算法为核心,已取得阶段性成果,年内将推出基于该自研大模型的产品级应用。

据悉,学而思已将MathGPT作为公司的核心项目,由CTO田密负责。

今年春节前,该项目已启动相应的团队建设、数据、算力准备和技术研发。

此外,学而思已在美国硅谷启动团队建设,将建立海外算法和工程团队,从全球招募优秀人工智能专家。

MathGPT 和大语言模型(LLM)之间的区别。

美国公司OpenAI今年3月发布了大型语言模型GPT-4。

国内百度、阿里也发布了自己的大型模型产品,但通用语言模型更像是“文科生”,在语言翻译、概括、理解和生成等任务上表现出色,但在求解、解释等方面存在明显短板。

、解答和推荐数学问题:解决数学问题时常犯错误。

虽然可以解决一些数学问题,但其方法更加成人化,无法适应相应年龄儿童的知识结构和认知水平。

“这个缺点是LLM模型的特点决定的。

”学而思AI团队负责人表示,LLM模型来自于海量语言文本的训练,因此最擅长语言处理。

业界倾向于使用LLM模型来进行读写应用,但如果想要在数学能力上取得突破,就需要开发一个新的大模型。

因此,学而思决心组建团队,专门研究数学领域的大模型MathGPT。

它将利用其在数学和人工智能领域多年的积累,面向全球数学爱好者和科研机构,为大型人工智能模型时代打下良好的数学基础。

工作。

学而思希望用MathGPT来弥补和克服大型语言模型的三个问题:一是做题必须正确,现在GPT结果经常有错误;第二,解题步骤必须稳定、清晰,现在GPT的解题步骤每次都不一样,生成的内容往往非常冗余;第三,解决问题必须有趣且个性化。

目前的GPT讲解过于“学术”和机械,对孩子的学习体验非常不友好。

如何做MathGPT?学而思是科技部批准的“国家新一代人工智能智慧教育开放创新平台”建设单位。

也是教育行业人工智能“国家队”的唯一成员。

在人工智能领域,凭借多年的深入研究,学而思早在2016年就成立了AI实验室。

公开资料显示,基于智慧教育人工智能开放创新平台的帮助,学而思AI实验室在各类顶级学术会议竞赛中获得16个冠军、6个亚军;在国际期刊和会议上发表高水平学术论文31篇,包括光学字符识别、图像、自然语言处理、语音和多模态等多个领域的学术研究,在计算机视觉顶级会议和会议上发表多篇论文顶级自然语言会议;已申请剩余专利、授权专利、软件著作权60余项。

学而思AI实验室在各类顶级学术会议和竞赛中屡获殊荣。

“从数学起家”的学而思拥有20年的数学教学经验,积累了大量的数学相关数据。

该数据对于 MathGPT 训练是必需的。

材料。

此外,学而思的海外业务Think Academy深受全球多个国家和地区数学爱好者的喜爱。

学而思学生每年在IMO、AMC等国际数学竞赛中均取得优异成绩。

每年都有许多学生参加国际数学竞赛。

在数学奥林匹克竞赛中获得金牌。

因此,学而思选择向MathGPT方向发力也是顺理成章的。

另据了解,学而思学习机即将推出“AI助手”,涵盖作文助手、口语助手、阅读助手、数学助手等相关功能。

该AI产品将于5月11日开始内测。

MathGPT的挑战和技术问题如何利用大语言模型服务各行各业是当今社会的焦点问题。

比如在教育领域,Duolingo、Quizlet、Khan Academy等产品主要与OpenAI合作,在GPT大模型上进行微调和接口调用,提升原有产品体验。

但也有一些领域如数学、医学等,要求AI准确、清晰、逻辑推理能力强、容错率低。

目前环球LLM的表现还无法在上述领域取得突破。

未来是否有可能取得突破?目前还不清楚。

以数学领域为例,市场上主要有几所学校。

例如Google收购的Photomath、微软数学、Mathway、WolframAlpha等专注于数学计算的产品,主要采用非LLM传统AI技术和数据库方法来解决数学问题。

走AGI路线的公司正试图让LLM将军“更加数学化”。

例如,GPT4 在数学任务上比之前的 3.5 版本表现更好,Google 的 Minerva 模型也专门针对数学问题进行了调整。

学而思选择了另一条少有人走的路。

它没有在现有的LLM的基础上进行微调和接口调用,也没有做出通用的LLM。

而是基于专业领域开发自己的“数学大模型”MathGPT,致力于打造独立稳定、可持续、高质量的学习解决方案。

在大语言模型不断演进的浪潮中,不同技术路线选择的优缺点仍需要讨论和验证。

学而思研发的大型独立MathGPT模型是否建立,能否在数学任务中超越通用模型的表现,能否更好地匹配不同人群的数学学习场景,这个问题仍需要创新性地回答。

实践。

随着整个行业的深入发展,以及越来越多的人才参与到这个领域,相信不久的将来将会看到更成熟的解决方案。