OpenAI的“锋芒毕露”,确实有参考价值,但是否应该成为“追赶”的目标还值得商榷。
回顾过去一年来风起云涌的大模型之战,从最初的拼参数、讲数据,到近期的寻求落地应用,“实用主义”成为了这一年的主节奏。
如何走出自己的大模式?掌握最前沿的技术趋势,却为开发者设定最低的门槛。
这是商汤给出的解决方案。
今日,商汤科技正式发布“日日信SenseNova 4.0”,宣布大模型系统进行多维度全面升级。
“RiRiXin SenseNova 4.0”拥有更全面的知识覆盖、更可靠的推理能力、更好的长文本理解、更稳定的数值推理能力和更强的代码生成能力,并支持跨模态交互。
日日新·商少语言模型通用版(SenseChat V4)综合整体评测结果与GPT 4相当,全面超越GPT 3.5。
商汤还率先推出了阳光·上沙大语言模型Function call & Assistants API版本,支持不同模态工具调用,为高级大模型与各种应用服务工具的??连接提供了便捷的桥梁,大幅减少了对大语言模型的依赖。
开发人员使用大型语言模型。
模型阈值。
与此同时,商汤将先进的大模型能力转化为实际场景的产品应用,完成开发并正式发布基于新发布的《每日新闻·讨论大语言模型》的数据分析工具“Office Raccoon”函数调用&助手API。
01 代码、多模态、多底牌:超丰富的大模型系统,AI能力一应俱全。
“RiRiXin SenseNova 4.0”提供多种灵活的API接口和服务。
开发者可以轻松利用RiRiXin SenseNova大模型的各种AI技术能力,以更低的成本、更高的效率实现各种AI应用。
大模型性能提升的基础在于语言建模能力的增强。
“日日新SenseNova4.0”是日日新·上沙大语言模型-通用版(SenseChat V4)的全新升级。
目前支持不同窗口下的4k、32k、k token,扩大了模型应用范围。
SenseChat V4在知识理解、阅读理解、综合推理、数学、代码和长文本理解等领域的综合能力显着提升。
整体综合评价得分与GPT-4相当,推理和代码编程的评价表现更为出色。
GPT-4。
在权威测试集HumanEval Coding的测试中,首次通过率达到75.6%(GPT-4数据为74.4%)。
基于大模型评估平台OpenCompass的全套测试,日日新·上海大语言模型SenseChat V4正式发布,在数据分析场景的数据测试集(+问题)上,超越GPT-4,准确率85.71%。
支持复杂表、多表、多文件的理解,实现数据清洗、数据操作、对比分析、趋势分析。
、预测分析、可视化等常见数据分析任务,赋能财务分析、业务分析、销售预测、市场分析、宏观分析等多种应用场景。
商汤每日新问诊语言模型-医疗版本:“SenseChat-Medical V4”在本次更新中实现了更强的多轮对话和上下文理解能力,以及更丰富的工具调用。
能够有效实现专业的医疗问答和复杂的医疗任务推理,支持更多模态的医疗文档的智能解读和交互问答。
《大医生》在两项权威行业评测——2018年职业药师考试大模型评测和中华医学大语言模型开放评测平台MedBench中综合得分排名第二,表现逼近GPT-4。
其中,职业药剂师在考试大模型评测中两个细分方向的表现均已超越GPT-4。
根据2017年职业药师考试大型模型的评估结果,“大医生”综合成绩排名第二,其表现在两个细分项目上超过了GPT-4。
大医生的Web展示页面覆盖了13种医疗场景,但在现实生活中,人类接收到的信息形态其实是多种多样的,比如视觉、声音、文字、嗅觉、触觉等。
人类可以综合利用多种信息。
理解和推理事物的方式。
人类的这种能力对应的是人工智能领域,也就是当下最重要的研究课题之一:跨模态开放任务处理能力,这也是接近通用人工智能(AGI)实现的能力的体现。
)。
多模态是人工智能大模型的重要技术演进方向。
日日新·商厦多式联运大车型(SenseChat-Vision V4)正式上市。
它拥有1亿个参数,图像和文本理解能力处于世界领先水平。
在权威评测中,以0.5的综合成绩(超过GPT-4V的0.57)在基准测试集MME Benchmark中排名第一。
已在智能驾驶、智能车舱、电力行业等众多实际场景中得到应用,助力千行百业。
产业升级。
MME Benchmark是多模态大型模型的权威综合基准测试,可以从定位、名人识别、景点识别、OCR、数学计算等14个维度系统、全面地评估模型的能力。
例如,在日常交通场景中,可以向大型多式联运模型提出问题:请结合图片内容确定如何到达黄石东路?乍一看,这似乎是一道考验理解图文内容(OCR)能力的题。
事实上,情况不一定如此。
“万向”的答案不仅是提取画面中占据较小面积的路标上的文字,更要表现出足够的推理能力和较高的认知能力。
它不仅能理解环境,还能理解表情符号。
“万向”还可以识别非人类(猫)的表情及其背后所传达的情绪和态度。
与之前的版本相比,商汤自主研发的日日新·妙华文生图模型(SenseMirage V4)将参数数量增加到了数百亿个。
通过算法优化,语义理解能力和图像纹理细节得到显着增强,实现更准确的提示文字理解和图像绘制能力,可以达到电影级海报生成的水平。
同时,结合Adversarial Distillation算法,发布了秒花SenseMirage-Turbo V4版本,相比V4基础版可实现10倍的推理加速效果。
秒花SenseMirage V4全新升级,一键生成电影级图片。
02 第一个支持不同模态工具调用的函数调用和助手API版本在这里。
是大车型时代的专属开发助手。
大模型的能力前沿而丰富,帮助更多的开发者和相关行业更方便、更高效地更好地使用大模型,商汤推出了每日新讨论大语言模型的 Function call & Assistants API 版本。
如果把大模型看作大脑,Assistants API就相当于给AI加上了眼睛和手,可以自主理解人类分配的任务,制定正确的计划,并使用合适的资源和工具。
日常语言模型Function call & Assistants API版本为开发者提供了灵活且高度可定制的工具调用框架,提供网络搜索、代码讲解、图文问答、文生图等多种工具调用。
,支持商汤新大模型体系,赋能多行业场景。
与其他同类产品相比,日文模型的Function call & Assistants API版本率先支持不同模式下的工具调用,可支持图文结合的多模态交互以及数据分析代码执行结果的直观呈现。
这可以解决更复杂的问题,并使人工智能功能在各种应用中的集成变得更容易、更高效。
通过Assistants API,可以轻松调用内置工具实现多模态交互(注:展示效果加速),加速创新场景应用。
商汤“每日上新”大模型体系持续赋能多行业升级。
大模型的出现带来了人机交互范式的巨大变革,依托商汤“日新感新星”能力的快速迭代,小浣熊家族又增添了新成员——数据分析工具“Office Little” “浣熊”重塑大机型时代应用产品形态。
Office Raccoon是一款无需编程、无需复杂操作即可使用的数据分析工具。
也是上班族的好帮手。
通过自然语言输入,Office Raccoon 结合商汤大模型系统的意图识别、逻辑理解和代码生成能力,自动将数据转换为有意义的分析结果和可视化图表。
得益于商汤大模型系统强大的中文理解能力,该产品更适合中国的数据分析需求。
Office Raccoon演示页面:输入表格,轻松获取分析报告。
产品形态的出现,是大规模模型技术落地的尝试之一。
凭借丰富的AI技术能力,商汤“日日信Sense Nova”大型模型系统目前成本低廉,高效连接各类人工智能应用,并提供:商汤日报·讨论语言大模型-办公场景数据分析版、日日信·讨论语言大模型-医疗版,适用于医疗场景。
”、日日新·自动驾驶、工业场景多模态大模型咨询、创意场景日日新·妙花文生图大模型等丰富工具。
自去年4月10日商汤“每日新议大语言模型”上线以来,商汤“每日新讨论大语言模型”已应用于金融、手机、医疗、汽车、房地产、能源、传媒等多个垂直行业和工业制造。
与100多家客户、100多家企业用户建立深度合作,加速行业??企业智能化转型。
商汤正在走上自己的大模式之路,以尖端技术为支撑,以新工具降低进入门槛,以产品应用触达用户。
。
商汤此次更新推动大模型前置定位,为通用人工智能(AGI)的实现提供精准着力点,助力全场景、多行业实现“大模型+”,拓宽大模型应用边界。