RAG的具体作用
概述
- RAG:结合「检索」与「生成」的混合式架构,通过从外部文档库中检索相关信息,再由大模型生成最终答案,兼具可靠性与创造力。
- 向量模型:将文本、图像等非结构化数据映射到高维向量空间,以便计算相似度。
- 向量数据库:专门存储和检索这些高维向量,支持海量数据的高效近似最近邻搜索(ANN)。
整体流程示意:
用户提问
↓
┌────────────┐ ┌───────────────┐ ┌────────────────┐
│ 1. Embedding │ → │ 2. 向量检索 │ → │ 3. 内容拼接 │
│ 文本向量化 │ │ (Vector DB) │ │ + Prompt │
└────────────┘ └───────────────┘ └────────────────┘
↓
┌────────────────────────┐
│ 4. 大模型生成回答 │
└────────────────────────┘
RAG 原理
RAG(Retrieval-Augmented Generation)是一种结合检索和生成的技术,用于增强大型语言模型(LLM)的回答能力。与传统只依赖模型训练数据不同,RAG允许模型在生成回答时动态检索外部知识库的信息,好比让 AI 进行“开卷考试”。具体来说,RAG 系统通常包括以下步骤:
- 数据摄取(Ingestion):将权威信息(如公司文档、数据库等)加载到向量数据库或检索系统中;
- 检索(Retrieval):当用户提出问题时,系统将问题转化为向量,并在知识库中搜索语义最相近的内容;
- 上下文融合(Augmentation):将检索到的相关信息与用户问题合并,构造新的提示(prompt)给模型;
- 生成(Generation):将增强后的提示输入LLM,由模型根据这些上下文生成回答。
付费内容提示
该文档的全部内容仅对「JavaUp项目实战&技术讲解」知识星球用户开放
加入星球后,你可以获得:
- 超级八股文:100万+字的全栈技术知识库,涵盖技术核心、数据库、中间件、分布式等深度剖析的讲解
- 讲解文档:黑马点评Plus、大麦、大麦pro、大麦AI、流量切换、数据中台的从0到1的550+详细文档
- 讲解视频:黑马点评Plus、大麦、大麦pro、大麦AI、流量切换、数据中台的核心业务详细讲解
- 1 对 1 解答:可以对我进行1对1的问题提问,而不仅仅只限于项目
- 针对性服务:有没理解的地方,文档或者视频还没有讲到可以提出,本人会补充
- 面试与简历指导:提供面试回答技巧,项目怎样写才能在简历中具有独特的亮点
- 中间件环境:对于项目中需要使用的中间件,可直接替换成我提供的云环境
- 面试后复盘:小伙伴去面试后,如果哪里被面试官问住了,可以再找我解答
- 远程的解决:如果在启动项目遇到问题,本人可以帮你远程解决
进入星球后,即可享受上述所有服务,保证不会再有其他隐藏费用。
