项目简历模板参考
本文将项目所有技术价值点全面列出,请根据自己对项目的掌握程度酌情选择 5-6 个核心亮点写入简历,写上去的内容一定要能从底层原理到细节设计都讲清楚。
一、技术选型
Spring Boot、Spring AI、Spring AI Alibaba、MyBatis-Plus、Redis、Redisson、Kafka、MySQL、Elasticsearch、Neo4j、PostgresSql + Vector、Milvus、MinIO、Apache Tika、SSE、MCP 协议、Docker、Knife4j、JWT
二、项目描述(建议控制在 200 字以内,按需裁剪)
这是一个面向企业知识管理的 AI 智能体平台,支持多格式文档上传与解析、智能分块与向量化、知识库构建、多轮对话问答、ReAct Agent 智能编排、RAG 检索增强生成等全链路业务闭环。
项目在 Spring AI的基础上,添加了很多自己实现的功能 + 多个AI智能体 ,设计了 三级知识路由漏斗(领域→主题→文档)实现精准知识定位;采用 向量检索 + 关键词检索双通道 并通过 RRF 融合排序,显著提升召回质量。文档处理层面,基于 Neo4j 图数据库 构建文档层级结构图谱,支持章节级导航与上下文扩展;设计了 5 种智能分块策略(结构化/递归/语义/LLM/自动选择),根据文档类型自动匹配最优方案。对话层面,实现了 7 种执行通道(ReAct Agent、标准 RAG、图谱导航、澄清式对话等)的动态路由,配合 3 种会话记忆策略 和 SSE 实时流式输出,提供高质量的智能问答体验。同时引入 影子路由观测机制,持续评估知识路由质量,形成优化闭环。
三、负责内容
3.1 架构方面
1. 设计五步前置编排器(意图识别 + 问题改写 + 歧义澄清 + 子问题拆分 + 知识域收缩)
设计五步链式前置编排器,在检索之前对用户问题进行深度预处理:
- 第一步,加载会话记忆,恢复对话上下文;
- 第二步,通过大模型结合对话历史进行 意图识别,判断用户意图类型(知识问答/闲聊/结构浏览等),同时执行 问题改写,将"它的第三章讲了什么"这类包含代词和省略的问题补全为完整的独立问句;
- 第三步,歧义检测,当信息不足以明确用户意图时,主动生成澄清问题引导用户补充,避免盲目检索;
- 第四步,子问题拆分,将复杂问题分解为最多 4 个独立子问题,每个子问题独立检索证据后汇总回答;
- 第五步,知识域收缩,通过三级知识路由将检索范围从全库缩小到具体文档,大幅减少无关内容干扰。五步编排的输出形成统一的执行计划,驱动后续检索和生成流程。
2. 设计三级知识路由漏斗与影子路由观测
构建"领域→主题→文档"的三级漏斗路由模型,逐层缩小检索范围:
- 领域层通过语义评分 + 词汇评分筛选 Top5 候选领域;
- 主题层在领域评分基础上叠加关键词实体匹配,对命中顶级领域的主题额外加 8 分权重,筛选 Top8 候选主题;
- 文档层综合语义、词汇、关键词实体、领域加成(+15)和主题关联(×20)多维评分,筛选 Top5 候选文档。通过置信度公式
topScore / max(10, topScore + secondScore + 5)评估路由质量,置信度 ≥0.55 为成功,低于则标记为低置信度。 - 同时设计 影子路由观测机制,当用户手动选择文档时,在后台静默执行完整路由流程,记录各层 Top3 候选、用户实际选择、命中状态和置信度,持续评估路由准确率,形成优化闭环。
3. 设计三层执行器动态路由(澄清→RAG 知识问答→ReAct Agent)
基于前置编排器的输出,设计三层执行器的动态分发机制:
- 歧义澄清执行器,当检测到用户问题信息不足时,生成引导性澄清问题而非强行回答;
- RAG 知识问答执行器,当问题可在知识库中找到答案时,走双通道检索 + 融合排序 + 证据驱动生成的标准 RAG 流程;
- ReAct Agent 执行器,当问题是开放性的、需要联网搜索或多步推理时,进入"思考→行动→观察"的自主循环,Agent 可动态调用联网搜索、知识检索等工具,循环执行直到获得足够信息后生成最终回答。三层执行器根据意图识别结果自动匹配,实现"一个入口,多种能力"的智能分发。
4. 设计 ReAct Agent 自主推理与安全防护机制
实现 ReAct(推理+行动) 模式的智能体执行器,Agent 按"思考→行动→观察"循环自主推理:
- 先分析需要什么信息,再调用工具(联网搜索、知识检索等)获取证据,观察结果后决定是否继续循环,直到获得足够信息后生成最终回答。
- 支持最多 4 个工具并行调用。为防止 Agent 失控,设计多层安全防护:单次请求模型调用上限 8 次、工具调用上限 6 次;单次会话模型调用上限 40 次、工具调用上限 30 次;
- 工具调用失败时采用 指数退避重试(200ms-1200ms,最多重试 2 次);异常时统一拦截并优雅降级。Agent 的推理过程通过 Checkpoint 机制 持久化到数据库,支持断点恢复。
5. 设计向量+关键词双通道并行检索与 RRF 融合排序
- 实现语义向量检索(基于 PGVector,最低相似度阈值 0.45)和关键词检索(基于 Elasticsearch,相对阈值 0.35)双通道并行召回;
- 通过 RRF(倒数排名融合) 算法合并两路结果,公式为
score = Σ 1/(k + rank_i)(k=60),兼顾语义相关性与词汇精确匹配,有效提升召回率和排序质量。 - 融合后可选接入 Rerank 重排序模型 进一步优化排序。检索完成后进入 父子块聚合 环节:检索时使用细粒度的子块提高匹配精度,命中后自动关联其父块获取完整上下文,实现"小块检索、大块回答"的效果。
6. 设计证据预算控制与无证据短路机制
为防止检索结果过多导致 Token 溢出或过少导致幻觉,设计精细化的证据管控机制:
- 证据预算控制,每个子问题的证据上限为 2200 字符,总预算上限 5200 字符,单个父块上限 2200 字符,超出预算时按相关性评分动态裁剪;
- 无证据短路,当所有检索通道均未召回有效证据时,直接向用户反馈"未找到相关信息",而非让大模型强行编造答案,从机制上杜绝幻觉问题。
7. 设计父子块拆分与组合式切块引擎
设计 父子块拆分 架构:将文档切分为较大的父块和较小的子块,子块用于检索提高匹配精度,命中后自动关联父块获取完整上下文段落。切块引擎采用 四种策略组合 的流水线模式:
-
结构化切块(主干策略,按文档层级切分,保留文档边界)
-
递归切块(回退策略,控制块大小)→ 语义切块(优化策略,基于语义边界精修切分点)
-
LLM 智能切块(增强策略,处理低质量或复杂文档)。
系统根据文档类型和质量自动推荐最优切块方案,用户确认后执行。
8. 基于 Neo4j 构建文档层级结构图谱
利用 Neo4j 图数据库 存储文档的三层节点结构:文档节点(标题、ID)→ 章节节点(编号如"1.2.3"、标题、规范化路径、内容)→ 条目节点(锚点文本、内容).
节点间通过"包含章节""包含子节点""包含条目""下一兄弟"四种关系连接。支持 章节编号定位、标题路径查找、邻接遍历(前后兄弟)、子节点展开、语义最佳匹配 五种查询能力,突破传统关键词搜索的局限。配合文档导航索引实现目录级浏览,用户可按文档结构逐层展开查看内容。
付费内容提示
该文档的全部内容仅对「JavaUp项目实战&技术讲解」知识星球用户开放
加入星球后,你可以获得:
- 超级八股文:100万+字的全栈技术知识库,涵盖技术核心、数据库、中间件、分布式等深度剖析的讲解
- 讲解文档:超级AI智能体、黑马点评Plus、大麦、大麦pro、大麦AI、流量切换、数据中台的从0到1的详细文档
- 讲解视频:超级AI智能体、黑马点评Plus、大麦、大麦pro、大麦AI、流量切换、数据中台的核心业务详细讲解
- 1 对 1 解答:可以对我进行1对1的问题提问,而不仅仅只限于项目
- 针对性服务:有没理解的地方,文档或者视频还没有讲到可以提出,本人会补充
- 面试与简历指导:提供面试回答技巧,项目怎样写才能在简历中具有独特的亮点
- 中间件环境:对于项目中需要使用的中间件,可直接替换成我提供的云环境
- 面试后复盘:小伙伴去面试后,如果哪里被面试官问住了,可以再找我解答
- 远程的解决:如果在启动项目遇到问题,本人可以帮你远程解决
