4月26日,科大讯飞Spark大模型V3.5(以下简称“科大讯飞Spark”)春季发布。
面对用户高效精准知识获取的痛点,科大讯飞发布了业界首个长文本、长图文、长语音大模型。
不仅可以从各种信息源快速学习海量文字、图文资料、会议录音等,还可以在各种行业场景下给出专业、准确的解答。
科大讯飞进一步升级Spark语音模型,推出多情感超拟人合成,具备情感表达能力,并推出一句话语音再现功能,让科技更加温暖。
同时,针对企业应用场景,科大讯飞推出Spark智能平台,帮助企业解决大模型实施的最后一公里问题。
不断用技术进步解决现实需求,科大讯飞Spark也正在获得越来越多用户的认可。
据七麦数据显示,科大讯飞Spark APP在Android端下载量已超过1万次,位居国内工具类通用大模型APP第一名。
首创长文本、长图文、长语音大模型,助力知识高效获取。
科大讯飞为何要打造长文本、长图文、长语音的大模型?从科大讯飞Spark APP可以看出,用户使用高峰并不是在周末,而是在工作日的上午9:30和下午3:30。
这意味着大多数用户使用科大讯飞 Spark 来解决紧急的工作相关问题。
高效的知识获取是用户和开发者都非常关心的问题。
科大讯飞分析发现,在知识获取和学习过程中,大多数用户可以获得的材料往往不仅仅是现成的长文本,还有随手可得的报刊书籍内容、各种研讨会的PPT内容、老师的黑板书、同学的笔记,还有各种会议录音、采访、各种网上发布会、培训教育视频等,你能把这些文字、图片、声音等上传到科大讯飞Spark来快速获取知识吗?为此,科大讯飞推出了首款支持长文本、长图形、长语音的大型模型,解决用户在真实场景下获取多源信息的需求。
此次科大讯飞Spark长文本功能全新升级后,具备长文档信息提取、长文档知识问答、长文档摘要、长文档文本生成等能力。
整体水平已达到4月最新长文版GPT-4 Turbo的97%。
%水平,并且在银行、保险、汽车、电力等多个垂直领域的知识问答任务中,科大讯飞长文本的整体水平已经超越了GPT-4 Turbo。
长文本功能的实现需要解决高效的信息处理问题:面对数百万甚至千万的单词,长文本大型模型消耗非常大的计算资源。
为了解决大模型应用效率和准确性问题,刘庆峰表示,基于科大讯飞Spark V3.5对长文本的理解、学习和回答能力,科大讯飞进行了重要的模型剪枝和蒸馏,推出行业性能。
最优的亿参数大规模模型,使得Spark在文档上传解析处理、知识问答首次响应时间、文本生成等方面实现了极大的效率提升,效果损失仅3%。
测试表明,在保证长文本效果的同时,无论是10K、64K、K token,还是更长的文本,Spark大模型的性能都是业界最好的。
面对复杂的图文场景,科大讯飞基于多年在图文识别、公式识别竞赛领域全球领先的技术积累,首次推出了Spark图文识别大模型。
相比传统小模型逐行文本识别的局限性,Spark图文识别的大模型具有三大优势:1)可以直接处理非常复杂的布局分析,目前覆盖了31种典型场景,例如书籍、学术论文、专利等报纸、海报、PPT等还可以自动识别并标注页眉、页脚、标题、段落、表格、公式、印章、手写??等18种不同类型的布局元素。
; 2)融合文章的上下文语义进行文本识别,识别更准确; 3)针对教育、金融、医疗、科研等专业领域深度优化,可自动实现更多领域的专业符号识别。
根据国际发布的权威英文测试集显示,科大讯飞Spark的图像和文本识别效果超过了微软和谷歌。
从典型应用场景来看,在科研、金融、企业产品技术文档等方面的识别效果在业内名列前茅。
此外,针对音视频信息高效获取的普遍需求,科大讯飞还推出了长语音功能,结合全球领先的语音识别和翻译技术,可实现一键朗读会议录音、学习视频、等,并实现音视频场景的知识高效获取。
发布合约助手,升级AI学习机,用技术进步解决现实需求。
科大讯飞长文本、长图文、长语音能力的升级,将进一步推动大模型在各场景的落地。
刘庆峰重点介绍了科大讯飞Spark在招投标、合同、教育等场景的应用。
在招标场景中,依托科大讯飞领先的文本理解、逻辑推理和数学能力,科大讯飞与国家能源材料公司在企业采购场景合作开发了智能无人审核系统,被列为招标投标中的典型案例。
国资委网站。
案例推荐。
据介绍,国家能源集团已审核订单5.7万余份,准确率达97%。
此次升级后的长文本和长图文能力的叠加,可以让评标更便捷、更高效、更准确。
在日常生活中,我们在买卖商品、装修房屋、购买汽车保险时,经常会遇到各种各样的合同。
如果我们不了解风险该怎么办?科大讯飞推出Spark合同助手,可以对我们的合同进行风险审查、合同比对、汇总汇总和合同生成,快速识别潜在风险漏洞,成为您口袋里的“法律助手”。
在教育场景,科大讯飞进一步升级科大讯飞AI学习机产品,不仅让作文、理科批改更加精准,也让智能辅导更加有针对性、高效;它还将这种多模态能力与百科问答功能进行了升级。
Spark的大模型理解并整合了大量的书本知识。
“爱因斯坦”和他著名的虚拟人类朋友可以回答孩子们奇奇怪怪的问题等复杂问题,让孩子们在有趣的互动学习中学习知识、获得感悟,同时提高孩子们主动提问的意愿和能力。
智能黑板也再次升级,配备了长文本和长语音功能,不仅提高了记录转录的效率,还提高了章节排序能力。
第二个是 Spark 助教。
集成长文本能力后,可以集成优质的教辅内容。
教师在备课过程中可以直接整合教具内容,进一步丰富备课资源,提高备课效率。
此外,Spark Research Assistant目前正在中国科学院、三亚崖州湾科技城、北京邮电大学、哈尔滨工业大学等机构和高校使用。
随着多模态能力的升级,科大讯飞Spark科研助手进一步提升了论文问答、审稿生成、实验解读等效果,丰富了分析的学术数据,进一步赋能高校和科研院所的科研工作。
它可以“产生情感共鸣”和“再现句子的声音”。
万物互联时代,需要更真实的AI语音交互。
年初科大讯飞Spark V3.5发布会上,科大讯飞推出了超拟人对话功能。
AI语音更加自然逼真,拟人化程度达到83%,广受用户欢迎。
无论是语音清晰度、流畅度还是表现力,效果都超过了OpenAI和微软。
此次,科大讯飞发布多情感超拟人合成,进一步提升了情感表达的可感知性。
幸福、道歉、安慰、撒娇、困惑等情绪表达感知度达到85%以上,AI语音更加生动真实。
。
好品HT机型是业内首款搭载科大讯飞超拟人合成技术的机型,已于4月25日在全球正式上市。
除了超拟人对话之外,科大讯飞还推出了“一句话语音复现”功能,一句话就能定制你的AI助手的声音。
比如,我们每天模仿孩子的声音,给爷爷奶奶读报纸;当我们出差时,我们模仿自己的声音给孩子讲故事。
这个功能可以让世界变得更加温暖。
刘庆峰表示,科大讯飞在个性化语音合成方面一直处于行业领先地位,目前已经先进到一句话语音再现的水平。
当时科大讯飞AI需要去台湾录制一周的声音来模仿林志玲的声音。
后来又花了一天时间模仿郭德纲的声音,然后又花了5分钟录音。
现在可以用一句话来模仿。
您可以在科大讯飞Spark APP上体验。
发布Spark智能平台,为企业注入新生产力。
自今年1月30日发布以来,科大讯飞Spark V3.5作为全国生产算力训练的首个大型模型,受到了各行业合作伙伴和开发者的广泛欢迎。
。
刘庆峰表示,大车型云边整体解决方案正在赋能汽车、家电、运营商等越来越多的行业;不到3个月的时间,科大讯飞已新增55万实名认证用户。
开发人员中,一半以上来自企业。
对于企业来说,如何高效地获取和学习知识也是一个痛点。
科大讯飞给出的答案是智能座席,针对企业场景推出了全新的智能座席平台。
企业构建智能代理的步骤主要涉及任务理解、外部信息源接入、内部各类IT系统接入、私有领域知识深度融合等。
最后根据每个任务的执行结果输出答案。
只有这样,才能完成一个完整的过程。
智能代理的建设。
刘庆峰表示,在科大讯飞Spark智能平台上,对于用户输入,首先基于科大讯飞Spark大模型非常智能的基础能力,将自动实现对用户输入的准确理解和任务规划。
其次,在分析相关任务和相应工具后,科大讯飞Spark还搭建了一个系统,连接外部信息源,包括天气、航班、公司巡检等;同时,Spark智能平台还采用了相互认证机制。
,实现往往独立隔离的OA系统、CRM系统和ERP系统之间的连接,并完成相应的操作;最后,通过私域知识整合机制,智能平台可以轻松整合企业所属行业和企业私域知识,实现更精准的专业理解和知识问答。
此外,Spark智能体平台还可以通过拖放的方式实现新智能体的创建以及多个智能体的协作。
星火智能平台可以快速到达大型模型应用企业的最后一公里。
据刘庆峰介绍,科大讯飞将于6月27日发布科大讯飞Spark模型V4.0,进一步解放生产力、释放想象力。
今年的全国两会,启动“人工智能+”行动、加快新生产力发展首次写入《政府工作报告》。
大模型带来的知识管理革命正在发生。
无论是企业还是个人都可以站在人工智能的肩膀上,获得新的比较优势。