据5月9日消息,阿里巴巴达摩院(湖畔实验室)、新加坡南洋理工大学等联合提出大模型知识链(CoK)框架。
与传统的检索增强生成(RAG)技术相比,该框架可以实时检索异构知识源并逐步纠正推理错误,进一步提高大型模型问答基于知识的问题的准确性并减少幻觉。
相关论文入选在奥地利维也纳举行的国际表征学习会议(ICLR)。
“导演《El Tio Disparate》的阿根廷总统演员是哪一年出生的?”面对这种需要多步推理的知识型问题,大型模型可能会“胡说八道”,给出看似合乎逻辑但实际上是错误或不一致的答案。
不存在的答案。
这个问题被称为大模型的“幻觉”,极大地限制了大模型的应用场景。
学术界也在重点研究大型模型“插件知识库”的RAG等技术路线。
在论文《Chain-of-Knowledge: Grounding Large Language Models via Dynamic Knowledge Adapting over Heterogeneous Sources》中,达摩院领导的联合研究团队提出了一个名为“Chain-of-Knowledge,CoK”的新框架,包括推理准备、动态知识适应和答案整合。
步。
对于知识密集型问题,知识链首先确定知识领域,并准备好几个中间推理步骤和相应的答案。
如果这些初步结论没有达成共识,知识链会实时搜索相应知识领域的不同知识源,逐步生成并修正推理步骤,给出最终答案。
说明:“知识链”(CoK)框架包括(一)推理准备(二)动态知识适应和(三)答案整合。
与传统的RAG相比,知识链框架创新性地设计了逐步修正的推理分析过程。
最大程度地防止错误从一层传播到另一层。
与以往主要使用非结构化数据源的大模型知识增强解决方案不同,知识链框架还支持结构化数据源,并引入了通过指令微调的自适应查询生成器,可以更准确地生成查询语句。
有效信息是从知识源中提取的。
在常识、医学、物理、生物等多个领域的实验结果表明,与Chain-of-Thought(CoT)方法相比,知识链框架可以将大型模型的答案准确率平均提高4.3%。
与ReAct、Verify-and-Edit等RAG方法相比,知识链也表现出稳定的优势。
论文认为,知识链有望连接各种大型模型和不同格式的知识源,有助于解决隐私保护、知识源可靠性和信息快速更新等关键问题。
据介绍,ICLR 由图灵奖获得者、深度学习领军人物 Yoshua Bengio 和 Yann LeCun 领导。
它是国际顶级人工智能学术会议之一。
达摩院共入选三篇大型模型研究论文,另外两篇涉及大模型推理长度外推、多语言安全等主题。