RAG的具体作用

概述

RAG：结合「检索」与「生成」的混合式架构，通过从外部文档库中检索相关信息，再由大模型生成最终答案，兼具可靠性与创造力。
向量模型：将文本、图像等非结构化数据映射到高维向量空间，以便计算相似度。
向量数据库：专门存储和检索这些高维向量，支持海量数据的高效近似最近邻搜索（ANN）。

整体流程示意：

用户提问
   ↓
┌────────────┐     ┌───────────────┐     ┌────────────────┐
│ 1. Embedding │ → │ 2. 向量检索    │ → │ 3. 内容拼接     │
│   文本向量化 │     │ (Vector DB)    │     │   + Prompt      │
└────────────┘     └───────────────┘     └────────────────┘
                                                   ↓
                                        ┌────────────────────────┐
                                        │ 4. 大模型生成回答      │
                                        └────────────────────────┘

RAG 原理

RAG（Retrieval-Augmented Generation）是一种结合检索和生成的技术，用于增强大型语言模型（LLM）的回答能力。与传统只依赖模型训练数据不同，RAG允许模型在生成回答时动态检索外部知识库的信息，好比让 AI 进行“开卷考试”。具体来说，RAG 系统通常包括以下步骤：

数据摄取（Ingestion）：将权威信息（如公司文档、数据库等）加载到向量数据库或检索系统中；
检索（Retrieval）：当用户提出问题时，系统将问题转化为向量，并在知识库中搜索语义最相近的内容；
上下文融合（Augmentation）：将检索到的相关信息与用户问题合并，构造新的提示（prompt）给模型；
生成（Generation）：将增强后的提示输入LLM，由模型根据这些上下文生成回答。

付费内容提示

该文档的全部内容仅对「JavaUp项目实战&技术讲解」知识星球用户开放

加入星球后，你可以获得：

超级八股文：100万+字的全栈技术知识库，涵盖技术核心、数据库、中间件、分布式等深度剖析的讲解
讲解文档：超级AI智能体、黑马点评Plus、大麦、大麦pro、大麦AI、流量切换、数据中台的从0到1的详细文档
讲解视频：超级AI智能体、黑马点评Plus、大麦、大麦pro、大麦AI、流量切换、数据中台的核心业务详细讲解
1 对 1 解答：可以对我进行1对1的问题提问，而不仅仅只限于项目
针对性服务：有没理解的地方，文档或者视频还没有讲到可以提出，本人会补充
面试与简历指导：提供面试回答技巧，项目怎样写才能在简历中具有独特的亮点
中间件环境：对于项目中需要使用的中间件，可直接替换成我提供的云环境
面试后复盘：小伙伴去面试后，如果哪里被面试官问住了，可以再找我解答
远程的解决：如果在启动项目遇到问题，本人可以帮你远程解决

进入星球后，即可享受上述所有服务，保证不会再有其他隐藏费用。

1. 打开微信 -> 扫描左侧二维码 -> 加入「JavaUp项目实战&技术讲解」知识星球

2. 查看星球使用指导，获取完整项目讲解资料索引

👉 点击解锁全部付费内容

概述​

RAG 原理​

该文档的全部内容仅对「JavaUp项目实战&技术讲解」知识星球用户开放

概述

RAG 原理