RAG 检索引擎
RAG(Retrieval-Augmented Generation)检索引擎是这个项目里最复杂的模块之一。它不是简单地"搜一下然后丢给模型",而是有一套完整的流水线:双通道并行检索 → 质量过滤 → RRF 融合 → 父块提升 → Rerank 重排序 → 证据预算控制 → Prompt 组装。
检索引擎总入口
RagRetrievalEngine
包路径: org.javaup.ai.chatagent.rag.service
| 方法 | 返回值 | 说明 |
|---|---|---|
retrieve(plan, traceRecorder) | RagRetrievalContext | 检索主入口,返回完整的检索上下文 |
检索流水线(每个子问题)
对于执行计划中的每个子问题,引擎会并行执行以下步骤:
子问题
↓
并行扇出到所有检索通道(向量 + 关键词)
↓
各通道独立检索,带超时保护
↓
证据门控过滤(分数阈值)
↓
RRF 融合排序(K=60)
↓
父块提升(小块→大块)
↓
Rerank 重排序(外部模型)
↓
FinalTopK 裁剪
↓
分配引用编号
多个子问题之间也是并行执行的,最后汇总所有子问题的证据。
付费内容提示
该文档的全部内容仅对「JavaUp项目实战&技术讲解」知识星球用户开放
加入星球后,你可以获得:
- 超级八股文:100万+字的全栈技术知识库,涵盖技术核心、数据库、中间件、分布式等深度剖析的讲解
- 讲解文档:超级AI智能体、黑马点评Plus、大麦、大麦pro、大麦AI、流量切换、数据中台的从0到1的详细文档
- 讲解视频:超级AI智能体、黑马点评Plus、大麦、大麦pro、大麦AI、流量切换、数据中台的核心业务详细讲解
- 1 对 1 解答:可以对我进行1对1的问题提问,而不仅仅只限于项目
- 针对性服务:有没理解的地方,文档或者视频还没有讲到可以提出,本人会补充
- 面试与简历指导:提供面试回答技巧,项目怎样写才能在简历中具有独特的亮点
- 中间件环境:对于项目中需要使用的中间件,可直接替换成我提供的云环境
- 面试后复盘:小伙伴去面试后,如果哪里被面试官问住了,可以再找我解答
- 远程的解决:如果在启动项目遇到问题,本人可以帮你远程解决
进入星球后,即可享受上述所有服务,保证不会再有其他隐藏费用。
