5月9日,中国医学大语言模型开放评测平台MedBench更新评测排行榜。
医都科技大模型(评测名称:HH-YIDU-Med)以61.3分的优异综合成绩位居榜首,成为榜单上首个综合得分超过60分的大型医疗模型。
摘自MedBench评测榜单MedBench是上海AI实验室和上海数字医学创新中心推出的权威评估平台。
依托顶尖医疗机构的经验和知识储备,设置了医学语言理解、医学语言生成、医学知识问答、复杂医学推理、医疗安全与伦理等5大维度,共15项任务、20个数据集、30万个问题,为大型中医模型提供客观、科学的性能评价参考。
MedBench榜单评测维度医疗行业由于其特有的专业性和严谨性,对大型医疗模型的能力提出了极高的要求。
虽然GPT-4在通用大模型领域取得了重大突破,但由于医学文本和知识的特殊性,在处理医疗场景中的实际问题时,如果没有专门的训练,即使是GPT-4也无法取得多大成绩。
好成绩。
医渡科技大模型在医学知识问答、医学语言理解、医疗安全和伦理三个关键维度均排名第一,充分展现了其在专业性、理解性、逻辑性、安全性等方面的医疗专业实力。
。
作为国内医疗智能行业的领军企业,医都科技深耕医疗智能领域近10年。
其“医疗智能大脑”YiduCore已被授权处理和分析超过40亿条病历,积累了大量多维度、可量化的病历。
知识图谱。
医都科技大模型的构建不仅基于对大量临床实践指南和医学文献的筛选和管理,还应用自主研发的数据生成技术,利用多年实践中积累的知识图谱进行大模型的构建。
模型训练,从而显着提高模型在医学领域的专业性能和准确性,增强大型模型生成内容的真实性和可解释性。
医都科技大模型的优异表现得益于公司在医学知识和知识图谱方面的积累,也与其在模型架构和算法上的不断创新密不可分。
忆都科技拥有从硬件联网到训练微调、推理的完整技术能力,拥有国内外主流芯片软硬件全栈适配。
此外,还拥有基于医疗数据特点的自主研发专利技术,进一步提升了模型在医学语言理解、医疗安全等方面的专业能力。
此外,医都科技还利用数据增强、对抗训练等技术来提高模型的鲁棒性。
作为“医疗大脑”YiduCore的核心算法,医都科技的大模型为医疗健康行业的各种应用场景提供了易用、高品质、可定制的强大赋能。
对于B端来说,医都科技的大模型可以利用其强大的专业能力,帮助“医、教、研、管”等场景各方面的质量和效率提升。
公司原有的数据治理、医院管理、临床科研、临床诊疗等多个场景的解决方案基于大模型技术进行了升级;针对C端用户,医都科技大模型提供专业的医疗级个性化服务,包括报告解读、健康问答、指导咨询等。
目前,医都科技大模型正在从大语言模型升级为多语言模型。
模态大模型,满足更多场景的应用需求。
此次登顶MedBench评测榜首,医都科技大模型的模型性能得到了验证和肯定,从“基础”的理解和生成能力,到“高级”的复杂推理能力,再到“高级”的推理能力。
“道德控制能力。
医都科技表示,目前取得的成绩只是开始,大规模医疗模式还有很长的路要走。
公司将继续稳步前行,不断突破和创新,实现医疗人工智能的更大潜力,推动大模型技术向更高水平发展,实现大模型技术在多领域的渗透和应用场景,加快医疗产业发展。
智能化转型升级。