掘金 人工智能 前天 22:22
深入理解检索增强生成(RAG)技术
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

检索增强生成(RAG)是一种结合信息检索与大语言模型(LLM)的技术,旨在提升回答的准确性和可靠性,减少“幻觉”。其核心流程包括索引、检索和生成三个阶段。朴素RAG遵循线性流程,虽能提升特定领域问题回答能力,但面临噪声干扰、冗余检索和复杂查询理解不足等局限。为克服这些问题,高级RAG在各阶段引入查询重写、分解、智能索引、混合检索、重排序等多种优化技术,显著提高了检索精度、召回率和生成内容的质量,使其能更好地处理复杂查询和多步推理,提供更全面、准确的答案。RAG技术的发展为大语言模型应用开辟了更广阔的前景。

💡 **RAG技术核心:LLM与外部知识的融合** RAG,即检索增强生成,是一种旨在提升大语言模型(LLM)输出质量和可靠性的技术。它通过整合信息检索功能,将用户查询与外部知识库进行匹配,再结合LLM生成答案,从而有效减少模型“幻觉”现象,提供更准确、可信的回答。其基本原理可以概括为 RAG = LLM + 外部知识,强调了外部知识源在增强LLM能力中的关键作用。

⚙️ **RAG技术的三大阶段:索引、检索、生成** RAG的核心工作流程可分解为三个主要阶段。首先是“索引”阶段,将外部知识源(如文档、网页)处理成可检索的向量形式并存储在向量数据库中。接着是“检索”阶段,当用户提问时,系统检索出与查询最相关的知识片段。最后是“生成”阶段,将检索到的片段与原始查询一同输入给LLM,由其生成最终回答。

🚀 **从朴素到高级:RAG技术的持续优化** 朴素RAG遵循简单的“索引-检索-生成”流程,虽然基础但存在噪声干扰、冗余检索和复杂查询理解不足等局限。为了克服这些,高级RAG引入了多项优化技术,如查询重写、查询分解、混合检索、元数据过滤、重排序和提示压缩等。这些进阶策略显著提升了检索精度、召回率,并优化了上下文窗口的使用,使得RAG能够更好地处理复杂问题,生成更准确、连贯的答案。

何为RAG

检索增强生成(Retrieval Augmented Generation,简称 RAG)是一种先进的自然语言处理技术,旨在进一步提升大语言模型的输出质量和可靠性。该技术通过整合信息检索功能,将用户查询与向量数据库进行精准匹配,从而为用户提供了更加准确和可信的答案,有效减轻了大型模型在生成回答时可能出现的“幻觉”现象。

RAG的工作原理基于一个简单而强大的流程:在LLM生成答案前,先从一个外部知识库中检索出与用户查询最相关的片段,然后将这些检索结果作为额外的上下文信息与原始查询一起输入给LLM,指导LLM生成更准确、更丰富、更具时效性的回答。

简单来讲就是 :RAG=LLM+外部知识

与LLM的联系

下面通过一个图片介绍LLM与RAG的相互作用

总归而言RAG技术的核心流程通常包含三个主要阶段:

    索引(Indexing) :将外部知识源(如文档、网页、数据库)处理成可检索的形式,通常涉及文本分块、生成向量嵌入,并存储在向量数据库中。检索(Retrieval) :当用户提出问题时,系统将问题转换成查询向量,从索引中检索出最相关的知识片段。生成(Generation) :将检索到的相关知识片段与原始问题一起提供给LLM,由LLM生成最终回答。

朴素RAG

设计之初时在2020,其严格按照 “索引->检索->生成” 的三阶段流程执行,显现的样式直接但也存在一定的局限性。

工作流程

朴素RAG的工作流程如下:

局限性

尽管存在这些局限性,朴素RAG作为一种基础实现,已经能够显著提升LLM回答特定领域问题的能力,尤其是在处理那些超出模型训练数据范围的问题时。但是人类的进步追求于精益求精,所以RAG技术随后进化出了更高级的形式。

示例

对应到Dify中的知识库中

索引阶段: 选择对文档表格等数据处理时使用通用分段方式,对每一个chunk都做相同大小分段处理

检索阶段: 单纯的使用向量检索,通过设置Top K以寻找与用户查询相似度最高的K个文本直接返回

进阶RAG

高级 RAG 是朴素 RAG 的深度优化版本,它并非对原有框架的颠覆,而是在 RAG 全流程的每个关键环节,都加入了针对性的进阶技术,以此大幅提升检索的精准度与最终生成内容的质量。与朴素 RAG 的线性流程不同,高级 RAG 在索引、检索、生成等各个阶段,都整合了更复杂、更具智能化的处理逻辑。

优化

预检索优化

通过知识库设定QA分段,有助于LLM 更精确定位用户查询的内容以减少模型幻觉问题

检索过程优化

不仅可以使用知识库自带的类似时间、关键词等元数据,还可以自定义强相关性的元数据来帮助模型更好完成查询任务。

后检索优化

较朴素RAG的优势

高级RAG通过上述优化策略,成功解决了朴素RAG面临的主要问题,带来了一系列显著的性能提升:

RAG技术远不止于此剩下的交给大家去继续探索,理论知识总归是落实到实践的,唯有自己动手才能真正领悟RAG的真谛。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

RAG 检索增强生成 大语言模型 LLM 自然语言处理 人工智能 向量数据库 信息检索 NLP AI
相关文章