Skip to content

RAG

RAG(Retrieval Augmented Generation ,检索增强生成)

RAG(Retrieval-Augmented Generation) 是一种结合“搜索”与“生成”的技术,使 LLM 在回答问题时能参考外部知识库,生成更准确、可溯源、事实性强的答案。其工作流程分为三步:Retrieve(检索):根据用户查询,从外部知识库(如文档、数据库)中检索最相关的文本片段;Augment(增强):将检索结果拼接到原始 Prompt 中,形成增强上下文;Generate(生成):LLM 基于增强后的上下文生成最终回答。

参考:

16 Techniques to Supercharge and Build Real-world RAG Systems—Part 1

从零搭建RAG应用:跳过LangChain,掌握文本分块、向量检索、指代消解等核心技术实现IMA知识库:从0到1的架构设计与实践

亲手创建自己所需的软件,是程序员的幸运。