1月30日,科大讯飞召开Spark认知大模型V3.5升级发布会。
科大讯飞董事长刘庆峰研究院、院长刘聪研究院正式发布基于首届全国量产算力培训的科大讯飞Spark V3.5。
七大核心能力全面提升,数学、语言理解、语音交互能力超过GPT-4 Turbo。
、Spark智能黑板重大升级; Spark语音大模型正式发布,首批37种主流语言表现超越OpenAI Whisper V3,赋能科大讯飞翻译机迎来全新升级,助力更自由沟通,推动客服、汽车时代万物互联、机器人等场景的人机交互改造。
大规模模型应用落地加速,Spark开发者生态快速增长至超过35万,打造个人应用赋能亿万用户;科大讯飞Spark赋能千行百业,携手保险、银行、能源、汽车、通信等领域领先企业,打造大模型赋能应用标杆。
此外,首次发布深度适配国产算力的科大讯飞Spark开源大模型“Spark Open Source-13B”。
场景应用效果领先,昇思开源社区联合首次上线。
在2019年5月6日的发布会上,科大讯飞推出了新一代大认知模型。
一经发布,不少科研院所和大学都期待科大讯飞能够开源。
为了让大家使用起来更加方便,科大讯飞增加了更多的数据并优化了工具链。
此次,一亿参数的iFlytekSpark-13B模型(iFlytek Spark-13B)正式开源。
也是第一个基于国产算力平台“飞星一号”的大型模型并正式开源!此次开源不仅包括基础模型iFlytekSpark-13B-base、微调模型iFlytekSpark-13B-chat,还包括微调工具iFlytekSpark-13B-Lora、定制工具iFlytekSpark-13B-Charater,使得企业和学术研究您可以基于这些全栈自主创新的Spark优化套件轻松训练自己的专用大型模型。
名列公评榜前茅,应用效果显着领先。
Spark Open Source-13B在多项知名公开评测任务中均排名第一。
在文本生成、语言理解、文本重写、行业问答、机器翻译等典型企业场景中,通过学习辅助、语言理解等领域的深入研究和优化,大大提高了其实用性,使用起来更加舒适在处理复杂的自然语言任务时,确保面对多样化、专业化的应用场景仍能保持高效、准确。
明显优于其他类似规模的开源模型。
这对于追求高性能但对成本敏感的企业来说无疑是巨大的吸引力,也为各行各业的企业提供了高性价比的解决方案。
全栈本地化适配和优化,在昇思 MindSpore开源社区同步上线。
2020年10月24日,科大讯飞与华为联合推出中国首个可训练万亿浮点参数大型模型的大规模计算平台“飞星”。
“一号”基于升腾生态系统,充分利用华为的技术优势。
该平台的推出,标志着我国在超大规模人工智能计算领域迈出了坚实的一步。
此次合作,科大讯飞发挥了在算法领域的深厚积累,不仅深度参与大模型底层算子库的开发和优化,还参与了大模型算法的迁移以及智能运维的开发。
超大规模集群维护软件。
作出了重要贡献。
此次深度合作与优化,使“飞星一号”平台性能显着提升。
Spark Open Source-13B训练过程中,对国内软硬件环境的深度优化带来了显着的成果。
双方使用昇思的MindSpore AI框架将训练效率提升了40%,并与Ascend AI硬件配合实现了高度的适应性。
针对Ascend算力进行训练策略优化,训练效率达到A的90%,充分展现了国内算力追赶国际先进水平的决心和能力。
昇思 MindSpore Transformers大型模型套件也高效开发了开源版本,并在昇思开源社区同步上线。
在全球芯片供应链紧张的背景下,国内算力的突破为大模型产业的发展提供了有力支撑。
开源是完全免费的。
Spark生态系统开源的发布,是为了促进人工智能和机器学习领域的开源协作,推动全球范围内的技术创新。
科大讯飞此前开源了多个热门中文预训练模型,极大推动了行业语音语言处理技术的快速发展。
基于科大讯飞开源的中文预训练模型,许多高校和企业都有创新应用。
开花结果。
在大模型时代的浪潮中,更多底层技术原理和未来发展方向与每一位人工智能推动者和参与者息息相关。
开源可以让更多从事理论研究和学术探索的科研机构、企业和个人加入进来,加强学术合作,深化产业探索。
iFlytek Spark Open Source-13完全免费,可以帮助各类企业、高校、科研院所和个人加强学术合作、深化产业探索。
只有更多的场景落地,才能更好地促进生态合作。
去年7月,科大讯飞正式成立星火军团,负责协助客户大型模型产品的打造与应用,赋能千行百业。