当前位置: 首页 > 科技观察

AI首次超越人类!腾讯、阿里的NLP模型比你懂中文

时间:2023-03-13 22:46:10 科技观察

在AI技术圈,“中文理解”一直是一个难以攻克的难题。因为在世界上所有的语言中——汉语的难度是最高的。比如下面这简单的20个字的句子,一定会让很多老外崩溃的。一个下雨天,我骑自行车的时候差点摔倒,幸好我抓住了。然而,在CLUE最新发布的中文理解领域权威榜单中,腾讯和阿里的AI模型先后超越了人类的成就!真让人疑惑:现在还有什么AI做不到的吗?最新的CLUE排行榜CLUE的全称是ChineseLanguageUnderstandingEvaluation,即“汉语理解评价基准”。就像英文的GLUE和SuperGLUE一样,CLUE是一组评估机器像人类一样理解和响应中文文本能力的任务。它于3年前推出,也是首个大规模的中文语言评测基准,旨在推动NLP技术的发展。不断进步和突破。在CLUE的官网上,有语料库、排名、预训练模型和代表性数据集可供选择。共有文本相似度、分类、上下文推理、阅读理解等17个测评任务,官网有详细介绍。今年11月22日,阿里巴巴的AI模型“AliceMind”获得了86.685的高分,高居总榜首位,同时也打破了人类(HUMAN)在这一系列测试中保持的记录。值得一提的是,这也是人工智能在这一系列测试中首次超越人类。无独有偶,仅仅4天后,腾讯“混元AI大模型”再次打破记录,在测试中以86.918的高分——比AliceMind的分数还要高出0.233分。中国两大互联网巨头的登场,说明人工智能在不同领域、不同方面具备超越人类的能力。上周五,阿里云计算部门也在一篇文章中表示,“这标志着中国对人工智能模型的理解达到了一个新的水平。”中国的大型科技公司正在努力改进他们的自然语言处理(NLP)系统,这些系统用于为阿里巴巴的声控虚拟助手、腾讯的小微和AliGenie等产品以及机器翻译和垃圾邮件检测等其他功能提供支持。今年早些时候,百度开发的人工智能模型杜笑笑在高考中的得分高于绝大多数学生,尽管在作文中不正确使用网络俚语和生僻字。此外,在最新的排名中,中国智能手机制造商OPPO和外卖巨头美团的人工智能模型也分别排名第四和第五。尽管如此,一些研究人员表示,虽然机器在某些语言任务上可以比人类做得更好,但大多数人工智能模型在真正理解语言的复杂性之前还有很长的路要走。去年,阿拉巴马州奥本大学的研究机构和Adob??e的一项联合研究发现,许多在某些理解任务上表现优于人类的AI仍然无法区分随机排列的单词的句子。参考资料:https://www.cluebenchmarks.com/rank.htmlhttps://www.scmp.com/tech/big-tech/article/3201294/tencent-and-alibabas-ai-models-understand-chinese-better-humans-new-rankings-showhttps://www.techtimes.com/articles/284084/20221128/tencent-alibaba-ai-tech-tops-chinese-language-comprehension-humans-ranks.htmhttps://english.newstracklive。com/news/ai-models-from-tencent-and-alibaba-are-superior-to-humans-at-understanding-chinese-sc71-nu355-ta355-1259160-1.html