当前位置: 首页 > 科技观察

为什么人工智能可以解决高等数学问题?

时间:2023-03-12 11:45:19 科技观察

先从考研说起吧。考研的重要性堪比高考。告诉你一个数字:2021年高考考生1078万人,2022年考研考生457万人。也就是说,考研考生人数是接近高考考生人数的一半。再看录取率,2021年高考录取率为87%,而2022年考研录取率仅为24%。考研竞争比高考激烈得多。目前,2022年考研笔试已经结束,成绩尚未公布。不少考生反映,今年的英语科目比较容易,政治科目比想象中难,但最难的还是数学。有考生表示,“70%的复习时间都给了数学,但到头来还是一头撞在了脑袋上,感觉自己什么都不会了。”还有人说,“感觉一年都在白复习,今年考完了,感觉好像没学过数学。”可以说,在考研竞争中,谁能拿下高分,谁就能傲视天下。事实上,不仅是普通人觉得数学题很难,就连人工智能也长期无法解决数学题。一年前,如果你问世界上最先进的人工智能一个问题,就问它:五庄寺种了5棵人参果树,三千年开花,三千年结果,三千年成熟。一万八千年后,一共长出了多少人参果?人工智能很有可能无法回答这个问题。那时,人工智能在回答这种用文字表达的数学问题时,还停留在小学生的水平。就在最近,人工智能突然开窍了,做数学题的能力直接秒杀了理工科大学生。那么这是怎么回事?查看新一期的麻省理工学院技术报告。2022年1月4日,来自麻省理工学院等四所大学的联合研究团队发布了一项新的研究成果:他们开发的神经网络程序可以解决微积分和线性代数等大学数学问题。无论是要求计算数值、写方程式,还是绘制函数图形,都轻松掌握,准确率达到100%。真是渣男秒变高手。要知道,就在几个月前,人工智能回答类似问题的最高正确率还不到10%。说了这么多,人工智能是如何工作的呢?我们先想一想,为什么以前人工智能做不到呢?绝对不是因为计算能力不够,而是因为解数学题不是直接计算公式,而是需要你试着去理解课文,就像西游记中五庄寺的人参果题一样。另外,有些问题还需要结合语境,包括一些隐含的条件。例如,关于概率论的一个问题是:“在德州扑克中获得两对的概率是多少?”这道题在别人看来很清楚,但在计算机看来,其实隐藏着很多Conditional。例如,一副扑克牌有52张牌和4套花色;一手德州扑克有5张牌等等。如果人工智能不知道这些隐含条件,就无法计算出问题。这一突破的核心是一种名为Codex的新翻译工具。这是一个超大型的神经网络模型。经过数亿次代码训练,它可以通过阅读人类语言来理解语言的意思,去除与问题解决无关的冗余信息,同时将上下文放在后面。隐式条件完成,最后用编程语言编写。例如,德州扑克问题“得到两对的概率是多少?”Codex是这样翻译的,大家可以感受一下:“一副牌有5张牌,从13组牌中,每组4张牌,一共随机抽取52张牌。抽两对,共有3张5张牌中的牌种,每种最多2张,请问抽到2对的概率。Codex翻译之后,这道数学题就变成了一道很简单的编程题,对于人工智能来说简直是小菜一碟。同学们,Codex不仅可以让人工智能hack,也可能让像我这样的普通人也能hack。假设世界上还没有发明俄罗斯方块游戏,我首先想出了这个游戏的规则,但是我不会写代码。怎么办?我只需要对Codex说一句话,例如:“我想要一个游戏,由四个正方形组成的各种形状,从屏幕上方掉落,按方向键控制它们的左右移动和加速掉落,如果屏幕中的一行满了,删除这个line...”然后,Codex会根据你的描述,重新生成一个可以用计算机语言流畅运行的游戏程序,真正可以在平板电脑上玩。跑着玩。2021年8月,在Codex发布会上,结果表明,用大约几百的文字描述也就是说,飞机大战、打砖块之类的游戏都是自动生成的。听起来很棒吗?不用写代码我也可以当游戏设计师。最后,看完这篇researchpaper,我也有了一点感触。看似普通的人类语言,我们却很容易理解,每天都在使用,却不知其内容容量。然而,强大的人工智能需要经过数亿次代码训练才能理解其背后的语言。的含义。语言学家乔姆斯基曾说过:“研究人类语言就是探索人类的本质,即探索人类迄今所知的独特心理特征。”