当前位置: 首页 > 科技观察

平均1秒生成高分高考作文,飞桨文心模型是怎么做到的?

时间:2023-03-15 15:30:18 科技观察

全国高考在即,百度AI科技也迎来“高考”。6月7日,百度数字人杜潇潇在高考语文考试后化身“数字人考生”,挑战高考作文,在网上引发热议。人工智能写作涉及自然语言处理、数据挖掘、知识图谱等多项人工智能技术。百度使用飞桨文心大型模型,助力杜潇潇快速高效地完成高考作文的写作。据介绍,杜晓晓参加了全国新高考卷一的答题《本手、妙手、俗手》议论文。40秒内,他根据话题创作了40多篇文章。平均1秒生成1篇文章。其中一个是随机抽取的,其分数已经赶上了约75%的高考考生。平均每秒一篇文章,考生评分超75%文心大模型写作又快又好  将AI应用于文字创作,在技术圈已经不是什么新鲜事了。随着大数据、深度学习等技术的发展,人工智能生成文本的能力得到了极大的提升。从财经、体育快讯,到诗歌、小说等文艺创作,人工智能写作涉及的领域越来越多,创作形式和内容也更加丰富多彩。  不过,与评论、摘要、公告等内容形式相比,利用AI生成高考作文难度显然更大。高考作文的写作在“应试”、“逻辑”和“创意”三个方面对AI提出了更大的挑战。在复习题层面,高考作文的题材和形式众多,加之内容题材复杂,每一个千变万化的组合都是对AI理解能力的终极考验。逻辑层面,高考作文要求800字以上。如何保证长文各个片段之间的逻辑性和连贯性,是AI面临的又一大挑战。最后,在创意方面,可读性是高考作文最重要的评分标准之一。AI写作不仅要切题连贯,还要善于引用经典,巧用辞藻,甚至推陈出新,避免文章枯燥乏味。  面对这些挑战,杜笑笑在飞桨文心大模型的帮助和指导下,又快又好地完成了写作。曾担任北京高考语文阅卷组组长的沉毅,给杜潇潇的作文打了48分(满分60分)。她说,按照往年的情况,只有不到25%的考生作文在48分以上。也就是说,杜潇潇的作文成绩已经超过了高考75%左右的考生。参加过《最强大脑》的网红潘周丹也对杜潇潇的作曲水平表示“赞赏”。这得益于新发布的千亿级大模型ERNIE3.0Zeus,集成了文信大模型发布的任务相关知识。该模型的效果在各种NLP任务上表现出更强的零样本和小样本学习能力。通俗地说,文心模式就像一个见多识广的“优等生”或“学者”,比传统模式具有更强的理解能力和创造能力。既有“靠马待命”的快速生产能力,又有“文笔如神”的品质保证。  在文心模式的加持下,杜晓晓的高考作文相比之前在质量上有了明显的提升。首先,生成的构图能紧扣主题,思路清晰。杜潇潇很好地理解给定的作文题目,围绕主题组织文本,支持文章观点,输出对题目的正面评价;那么在800字的长文中,杜笑笑可以保证生成的内容结构完整,语言流畅,开头引入标题的引子和结尾,上下文流畅。同时,由于文心模式更强的知识储备,杜笑笑生成的作文更善于引用经典,适当运用排比、比喻等修辞手法,大大提高了文章的可读性。  然而,出乎沉奕意料的是,杜晓晓的作文出现了一个小错误——她用了网络热词YYDS。之所以会出现这样的“失分”,是因为杜晓晓了解了一些网络流行的数据。从生成文章的语境来看,杜潇潇抓住了YYDS的“精髓”,自己的用法是恰当的,但不符合高考作文的写作标准,这也反映出AI写作可以继续去学习和提高。文心大模型助力智能创造,推动AIGC时代过去一年,百度AI技术加速发展,尤其是最近兴起的AIGC。AIGC是继UGC、PGC之后的一种新型内容生产方式。是指利用人工智能技术自动生产内容。DigitalHuman、TTV(TexttoVideo)等是其标杆应用。百度研究院预计,2022年,AIGC技术将利用大模型的跨模态综合技术能力,激发创造力,增加内容多样性,降低生产成本,实现规模化应用。  杜潇潇这次的高考作文是基于飞桨文心模型实现的AIGC创作。文心大模型以“知识增强”为核心特征,能够整合从大规模知识和海量数据中学习,学习效率更高、效果更好,具有通用性好、泛化能力强的特点。  除了智能写作,在文心大模型的支持下,AI已经具备了强大的理解和生成能力,可以实现创意作品的自动生成,包括AI绘画、AI写歌、AI剪辑等目前,文心大模型创意探索社区-阳谷社区已上线智能绘画、智能对话、智能创作、故事生成等大模型创意应用。搜索“文心大模型”进入官网体验。未来,基于大模型的AIGC将开拓和赋能更多的内容生产领域。预训练大型模型的兴起进一步增强了人工智能的通用性。大模型具有效果好、泛化性强、研发过程标准化程度高等特点,正在成为人工智能技术和应用的新基地。百度自2019年开始深度参与预训练模型的研发,先后发布了知识增强的文心系列模型。在刚刚结束的WAVESUMMIT2022深度学习开发者峰会上,文心大模型迎来了一系列升级:发布了10个全新的大模型,包括融合学习任务知识的知识增强型千亿大模型,以及多维度的大模型。任务统一学习视觉大型模型、跨模态大型模型、生物计算大型模型、工业大型模型等;提出支撑大型模型产业落地的三大关键路径:构建更贴合场景需求的大型模型体系,为应用落地提供全流程支撑的工具、平台和方法,构建一个开放的生态系统,激发创新等。  除了智能创造的应用,文信大模型还在工业、能源、教育、金融、通信、媒体等行业得到应用,如质量工业领域的零部件检测、能源领域的输电线路检测、金融行业的合同信息提取等,真正能够帮助企业降本增效,激发创新。同时,文信大模型也全面应用于智能搜索、信息流、智能音箱等互联网产品,提升用户获取信息、知识和服务的效率和效果。目前,Paddle已经构建了业内布局最全、最适合行业应用的模型库体系。作为人工智能“基础设施”的一部分,大模型进一步拓宽了人工智能技术落地的场景覆盖面,深化了产业应用范围。深度。文心大模将不断降低应用门槛,推动行业智能化升级,让人工智能技术惠及每一个人。

猜你喜欢