知识范围路由服务的核心实现(上)
上一篇讲了 AUTO_DOCUMENT 模式的整体流程,这一篇我们深入 KnowledgeRouteService.route 方法,看看它是如何实现三层路由决策的。
route 方法的整体结构
KnowledgeRouteServiceImpl.route 方法是整个知识范围路由的核心入口,它的代码结构非常清晰:
/**
* 执行知识范围路由主流程。
* 路由顺序大致为:
* 1. 构造查询上下文
* 2. 识别知识域候选
* 3. 识别主题候选
* 4. 对具体文档打分排序
* 5. 计算置信度并生成最终决策
*
* @param question 原始问题
* @param rewriteQuestion 改写问题
* @return 路由决策结果
*/
@Override
public KnowledgeRouteDecision route(String question, String rewriteQuestion) {
// 先把原问题和改写问题整理成统一的路由查询上下文,后续所有打分都复用这份上下文。
RouteQueryContext queryContext = buildQueryContext(question, rewriteQuestion);
KnowledgeRouteDecision decision = new KnowledgeRouteDecision();
if (queryContext.queryTerms().isEmpty()) {
// 连有效关键词都提不出来时,直接返回失败决策,避免后续无意义打分。
decision.setRouteStatus("FAILED");
decision.setReason("问题为空或无法提取有效关键词");
return decision;
}
// 路由采用"知识域 -> 主题 -> 文档"的逐层缩小策略,先粗筛再细排。
List<ScopeRouteCandidate> scopeCandidates = rankScopes(queryContext);
List<TopicRouteCandidate> topicCandidates = rankTopics(queryContext, scopeCandidates);
List<DocumentRouteCandidate> documentCandidates = rankDocuments(queryContext, scopeCandidates, topicCandidates);
decision.setScopes(scopeCandidates);
decision.setTopics(topicCandidates);
decision.setDocuments(documentCandidates);
// 最终置信度主要由 top1 和 top2 的相对差距决定。
BigDecimal confidence = resolveConfidence(documentCandidates);
decision.setConfidence(confidence);
if (documentCandidates.isEmpty()) {
decision.setRouteStatus("FAILED");
}
else if (confidence.compareTo(BigDecimal.valueOf(0.55D)) < 0) {
// 候选存在但置信度不足时,保留结果但标记为低置信度,交给上层决定是否澄清。
decision.setRouteStatus("LOW_CONFIDENCE");
}
else {
decision.setRouteStatus("SUCCESS");
}
// reason 用于解释"为什么是这些候选",便于调试和前端展示。
decision.setReason(documentCandidates.isEmpty()
? "没有找到可用候选文档"
: resolveDecisionReason(documentCandidates, confidence));
return decision;
}
整个方法可以分为五个步骤,我们按照执行顺序逐一来看。
第一步:构造路由查询上下文
RouteQueryContext queryContext = buildQueryContext(question, rewriteQuestion);
这一步调用 buildQueryContext 方法,把原问题和改写问题整理成一个统一的查询上下文对象。
RouteQueryContext 的结构
/**
* 路由查询上下文。
* 汇总原问题、改写问题、组合路由文本、关键词列表以及问题向量。
*/
private record RouteQueryContext(String originalQuestion,
String rewriteQuestion,
String routingText,
`List<String>` queryTerms,
float[] queryEmbedding) {
private boolean semanticEnabled() {
return queryEmbedding != null && queryEmbedding.length > 0;
}
}
这个上下文对象包含了路由所需的所有信息:
| 字段 | 类型 | 说明 |
|---|---|---|
originalQuestion | String | 用户的原始问题 |
rewriteQuestion | String | 改写后的问题 |
routingText | String | 组合后的路由文本(原问题 + 改写问题) |
queryTerms | List<String> | 提取出的关键词列表 |
queryEmbedding | float[] | 问题的向量表示(用于语义匹配) |
付费内容提示
该文档的全部内容仅对「JavaUp项目实战&技术讲解」知识星球用户开放
加入星球后,你可以获得:
- 超级八股文:100万+字的全栈技术知识库,涵盖技术核心、数据库、中间件、分布式等深度剖析的讲解
- 讲解文档:超级AI智能体、黑马点评Plus、大麦、大麦pro、大麦AI、流量切换、数据中台的从0到1的详细文档
- 讲解视频:超级AI智能体、黑马点评Plus、大麦、大麦pro、大麦AI、流量切换、数据中台的核心业务详细讲解
- 1 对 1 解答:可以对我进行1对1的问题提问,而不仅仅只限于项目
- 针对性服务:有没理解的地方,文档或者视频还没有讲到可以提出,本人会补充
- 面试与简历指导:提供面试回答技巧,项目怎样写才能在简历中具有独特的亮点
- 中间件环境:对于项目中需要使用的中间件,可直接替换成我提供的云环境
- 面试后复盘:小伙伴去面试后,如果哪里被面试官问住了,可以再找我解答
- 远程的解决:如果在启动项目遇到问题,本人可以帮你远程解决
进入星球后,即可享受上述所有服务,保证不会再有其他隐藏费用。
