当前位置: 首页 > 科技赋能

国内首个开源医学专业推理数据集蚂蚁百灵大模型助力行业落地

时间:2024-05-19 16:40:36 科技赋能

12月28日,由信息通信研究院主办的“虹桥之源”大模型驱动数字经济新生态峰会召开在上海。

会上,蚂蚁集团商业机器智能部正式开放中国首个医学专业推理数据集,这将提升医疗领域大模型的专业性。

图说:蚂蚁集团商业机器智能部总经理顾进杰介绍国内首个医学专业推理数据集在医疗行业,通用语言模型在回答医疗询问时会直接给出答案,而医生会根据专业知识重复症状,只有通过讨论才能给出答案。

此外,大模型存在幻觉问题和推理能力不足,而目前高质量的中医专业数据集相对匮乏,这对医学领域训练优秀的大模型提出了挑战。

为了克服这些问题,蚂蚁集团与上海仁济医院泌尿外科专家团队基于医生团队的临床经验,联合开发并推出了首个中医专科问答推理数据集RJUA-QA。

构建模拟案例数据。

这也是业界首个临床专业数据集。

数据集由三部分组成:训练、验证、测试。

它包含 1 个问题和答案对。

每个问答对都包含医生根据临床经验编写的问题、专家提供的答案以及用于帮助推理的上下文。

疾病类型覆盖97.6%以上的泌尿外科患者可真实再现诊疗场景。

该数据集可以提升大型模型在医学诊断推理方面的能力,为严肃可控场景的应用提供基准。

顾进杰进一步介绍了蚂蚁百灵模式在医疗领域的技术进展。

“专业性、可控性、轻量化是大模型技术在医疗行业落地的三大重要挑战和机遇。

”顾进杰说道。

在专业性方面,由于医疗行业有100多个科室,每个专科、每个病种都需要专业的调试。

蚂蚁集团与专家医疗联合开发多模态医疗知识引擎,进一步推动中国专业医疗数据集的建设和开放。

在可控性方面,百灵大模型结合知识图谱技术,让大模型的每一个答案都有根据。

“生成的内容可以满足不同医院、不同学科的定制需求,包括风格和调性。

”顾进杰说。

蚂蚁集团拥有超大规模图学习和知识图谱技术的长期积累。

今年,与OpenKG联合发布的OpenSPG开源项目重新定义了业界知识图谱的语义架构。

知识检索增强技术也大大提高了大型模型的正确性和可控性。

重要的话题。

医疗行业对数据隐私、专业知识和系统自治有需求。

考虑到机构的算力成本和部署的便捷性,百灵大模型还攻克了轻量化技术。

在12月开源的模型轻量级框架(PIA)中,集成了模型剪枝、压缩、量化、推理加速等全链路环节的优化。

具有开箱即用、功能无损、低代码访问等优点。

日常可实现10倍以上的压缩比。

目前,蚂蚁百灵大模型在中英文体检和基准测试中均已达到或超过GPT4级别。

例如,在中国医学LLM评估排行榜提示CBLUE上位居A榜第一、B榜第二;在国际医学问答排行榜PubMedQA中,以80.6%的准确率取得前五名的成绩。

也是前十名中参数数量最少的模型,更适合机构部署和使用。

本次峰会也是中国信息通信研究院ICT+深度观察报告上海分会场。

以“智能涌现,创新生态”为主题,共同探索前沿技术创新和大模型的实际应用实践,提供新思路、新方法、新路径。