项目简历模板参考

信息

本文将项目所有技术价值点全面列出，请根据自己对项目的掌握程度酌情选择 5-6 个核心亮点写入简历，写上去的内容一定要能从底层原理到细节设计都讲清楚。

一、技术选型

Spring Boot、Spring AI、Spring AI Alibaba、MyBatis-Plus、Redis、Redisson、Kafka、MySQL、Elasticsearch、Neo4j、PostgresSql + Vector、Milvus、MinIO、Apache Tika、SSE、MCP 协议、Docker、Knife4j、JWT

二、项目描述（建议控制在 200 字以内，按需裁剪）

这是一个面向企业知识管理的 AI 智能体平台，支持多格式文档上传与解析、智能分块与向量化、知识库构建、多轮对话问答、ReAct Agent 智能编排、RAG 检索增强生成等全链路业务闭环。

项目在 Spring AI的基础上，添加了很多自己实现的功能 + 多个AI智能体，设计了 三级知识路由漏斗（领域→主题→文档）实现精准知识定位；采用 向量检索 + 关键词检索双通道 并通过 RRF 融合排序，显著提升召回质量。文档处理层面，基于 Neo4j 图数据库 构建文档层级结构图谱，支持章节级导航与上下文扩展；设计了 5 种智能分块策略（结构化/递归/语义/LLM/自动选择），根据文档类型自动匹配最优方案。对话层面，实现了 7 种执行通道（ReAct Agent、标准 RAG、图谱导航、澄清式对话等）的动态路由，配合 3 种会话记忆策略 和 SSE 实时流式输出，提供高质量的智能问答体验。同时引入 影子路由观测机制，持续评估知识路由质量，形成优化闭环。

三、负责内容

3.1 架构方面

1. 设计五步前置编排器（意图识别 + 问题改写 + 歧义澄清 + 子问题拆分 + 知识域收缩）

设计五步链式前置编排器，在检索之前对用户问题进行深度预处理：

第一步，加载会话记忆，恢复对话上下文；
第二步，通过大模型结合对话历史进行 意图识别，判断用户意图类型（知识问答/闲聊/结构浏览等），同时执行 问题改写，将"它的第三章讲了什么"这类包含代词和省略的问题补全为完整的独立问句；
第三步，歧义检测，当信息不足以明确用户意图时，主动生成澄清问题引导用户补充，避免盲目检索；
第四步，子问题拆分，将复杂问题分解为最多 4 个独立子问题，每个子问题独立检索证据后汇总回答；
第五步，知识域收缩，通过三级知识路由将检索范围从全库缩小到具体文档，大幅减少无关内容干扰。五步编排的输出形成统一的执行计划，驱动后续检索和生成流程。

2. 设计三级知识路由漏斗与影子路由观测

构建"领域→主题→文档"的三级漏斗路由模型，逐层缩小检索范围：

领域层通过语义评分 + 词汇评分筛选 Top5 候选领域；
主题层在领域评分基础上叠加关键词实体匹配，对命中顶级领域的主题额外加 8 分权重，筛选 Top8 候选主题；
文档层综合语义、词汇、关键词实体、领域加成（+15）和主题关联（×20）多维评分，筛选 Top5 候选文档。通过置信度公式 topScore / max(10, topScore + secondScore + 5) 评估路由质量，置信度 ≥0.55 为成功，低于则标记为低置信度。
同时设计 影子路由观测机制，当用户手动选择文档时，在后台静默执行完整路由流程，记录各层 Top3 候选、用户实际选择、命中状态和置信度，持续评估路由准确率，形成优化闭环。

3. 设计三层执行器动态路由（澄清→RAG 知识问答→ReAct Agent）

基于前置编排器的输出，设计三层执行器的动态分发机制：

歧义澄清执行器，当检测到用户问题信息不足时，生成引导性澄清问题而非强行回答；
RAG 知识问答执行器，当问题可在知识库中找到答案时，走双通道检索 + 融合排序 + 证据驱动生成的标准 RAG 流程；
ReAct Agent 执行器，当问题是开放性的、需要联网搜索或多步推理时，进入"思考→行动→观察"的自主循环，Agent 可动态调用联网搜索、知识检索等工具，循环执行直到获得足够信息后生成最终回答。三层执行器根据意图识别结果自动匹配，实现"一个入口，多种能力"的智能分发。

4. 设计 ReAct Agent 自主推理与安全防护机制

实现 ReAct（推理+行动） 模式的智能体执行器，Agent 按"思考→行动→观察"循环自主推理：

先分析需要什么信息，再调用工具（联网搜索、知识检索等）获取证据，观察结果后决定是否继续循环，直到获得足够信息后生成最终回答。
支持最多 4 个工具并行调用。为防止 Agent 失控，设计多层安全防护：单次请求模型调用上限 8 次、工具调用上限 6 次；单次会话模型调用上限 40 次、工具调用上限 30 次；
工具调用失败时采用 指数退避重试（200ms-1200ms，最多重试 2 次）；异常时统一拦截并优雅降级。Agent 的推理过程通过 Checkpoint 机制 持久化到数据库，支持断点恢复。

5. 设计向量+关键词双通道并行检索与 RRF 融合排序

实现语义向量检索（基于 PGVector，最低相似度阈值 0.45）和关键词检索（基于 Elasticsearch，相对阈值 0.35）双通道并行召回；
通过 RRF（倒数排名融合） 算法合并两路结果，公式为 score = Σ 1/(k + rank_i)（k=60），兼顾语义相关性与词汇精确匹配，有效提升召回率和排序质量。
融合后可选接入 Rerank 重排序模型 进一步优化排序。检索完成后进入 父子块聚合 环节：检索时使用细粒度的子块提高匹配精度，命中后自动关联其父块获取完整上下文，实现"小块检索、大块回答"的效果。

6. 设计证据预算控制与无证据短路机制

为防止检索结果过多导致 Token 溢出或过少导致幻觉，设计精细化的证据管控机制：

证据预算控制，每个子问题的证据上限为 2200 字符，总预算上限 5200 字符，单个父块上限 2200 字符，超出预算时按相关性评分动态裁剪；
无证据短路，当所有检索通道均未召回有效证据时，直接向用户反馈"未找到相关信息"，而非让大模型强行编造答案，从机制上杜绝幻觉问题。

7. 设计父子块拆分与组合式切块引擎

设计 父子块拆分 架构：将文档切分为较大的父块和较小的子块，子块用于检索提高匹配精度，命中后自动关联父块获取完整上下文段落。切块引擎采用 四种策略组合 的流水线模式：

结构化切块（主干策略，按文档层级切分，保留文档边界）
递归切块（回退策略，控制块大小）→ 语义切块（优化策略，基于语义边界精修切分点）
LLM 智能切块（增强策略，处理低质量或复杂文档）。

系统根据文档类型和质量自动推荐最优切块方案，用户确认后执行。

8. 基于 Neo4j 构建文档层级结构图谱

利用 Neo4j 图数据库 存储文档的三层节点结构：文档节点（标题、ID）→ 章节节点（编号如"1.2.3"、标题、规范化路径、内容）→ 条目节点（锚点文本、内容）.

节点间通过"包含章节""包含子节点""包含条目""下一兄弟"四种关系连接。支持 章节编号定位、标题路径查找、邻接遍历（前后兄弟）、子节点展开、语义最佳匹配 五种查询能力，突破传统关键词搜索的局限。配合文档导航索引实现目录级浏览，用户可按文档结构逐层展开查看内容。

付费内容提示

该文档的全部内容仅对「JavaUp项目实战&技术讲解」知识星球用户开放

加入星球后，你可以获得：

超级八股文：100万+字的全栈技术知识库，涵盖技术核心、数据库、中间件、分布式等深度剖析的讲解
讲解文档：超级AI智能体、黑马点评Plus、大麦、大麦pro、大麦AI、流量切换、数据中台的从0到1的详细文档
讲解视频：超级AI智能体、黑马点评Plus、大麦、大麦pro、大麦AI、流量切换、数据中台的核心业务详细讲解
1 对 1 解答：可以对我进行1对1的问题提问，而不仅仅只限于项目
针对性服务：有没理解的地方，文档或者视频还没有讲到可以提出，本人会补充
面试与简历指导：提供面试回答技巧，项目怎样写才能在简历中具有独特的亮点
中间件环境：对于项目中需要使用的中间件，可直接替换成我提供的云环境
面试后复盘：小伙伴去面试后，如果哪里被面试官问住了，可以再找我解答
远程的解决：如果在启动项目遇到问题，本人可以帮你远程解决

进入星球后，即可享受上述所有服务，保证不会再有其他隐藏费用。

1. 打开微信 -> 扫描左侧二维码 -> 加入「JavaUp项目实战&技术讲解」知识星球

2. 查看星球使用指导，获取完整项目讲解资料索引

👉 点击解锁全部付费内容

一、技术选型​

二、项目描述（建议控制在 200 字以内，按需裁剪）​

三、负责内容​

3.1 架构方面​

1. 设计五步前置编排器（意图识别 + 问题改写 + 歧义澄清 + 子问题拆分 + 知识域收缩）​

2. 设计三级知识路由漏斗与影子路由观测​

3. 设计三层执行器动态路由（澄清→RAG 知识问答→ReAct Agent）​

4. 设计 ReAct Agent 自主推理与安全防护机制​

5. 设计向量+关键词双通道并行检索与 RRF 融合排序​

6. 设计证据预算控制与无证据短路机制​

7. 设计父子块拆分与组合式切块引擎​

8. 基于 Neo4j 构建文档层级结构图谱​

该文档的全部内容仅对「JavaUp项目实战&技术讲解」知识星球用户开放

一、技术选型

二、项目描述（建议控制在 200 字以内，按需裁剪）

三、负责内容

3.1 架构方面

1. 设计五步前置编排器（意图识别 + 问题改写 + 歧义澄清 + 子问题拆分 + 知识域收缩）

2. 设计三级知识路由漏斗与影子路由观测

3. 设计三层执行器动态路由（澄清→RAG 知识问答→ReAct Agent）

4. 设计 ReAct Agent 自主推理与安全防护机制

5. 设计向量+关键词双通道并行检索与 RRF 融合排序

6. 设计证据预算控制与无证据短路机制

7. 设计父子块拆分与组合式切块引擎

8. 基于 Neo4j 构建文档层级结构图谱