跳到主要内容

置信度计算与候选文档选择

上一篇讲完了三层路由(rankScopes、rankTopics、rankDocuments)的详细实现,这一篇我们继续讲解 route 方法的后续步骤,以及回到 prepare 方法的候选文档选择逻辑。

route 方法的后续步骤

第三步:计算置信度

// 最终置信度主要由 top1 和 top2 的相对差距决定。
BigDecimal confidence = resolveConfidence(documentCandidates);
decision.setConfidence(confidence);

resolveConfidence 方法会根据文档候选列表计算置信度:

/**
* 根据文档候选列表估算路由置信度。
*
* @param documents 文档候选
* @return 置信度
*/
private BigDecimal resolveConfidence(List<DocumentRouteCandidate> documents) {
if (documents == null || documents.isEmpty()) {
return BigDecimal.ZERO;
}
double top = documents.get(0).getScore().doubleValue();
double second = documents.size() > 1 ? documents.get(1).getScore().doubleValue() : 0D;
// 置信度并不是绝对分,而是主要体现 top1 相对 top2 的优势程度。
double normalized = top / Math.max(10D, top + second + 5D);
return scoreToBigDecimal(normalized);
}

这个方法的核心思想是:置信度不是看 top1 的绝对分数,而是看 top1 相对 top2 的优势程度

计算公式:confidence = top1 / max(10, top1 + top2 + 5)

top1top2confidence说明
501050 / 65 = 0.77top1 远超 top2,高置信度
302530 / 60 = 0.50top1 和 top2 接近,低置信度
20020 / 25 = 0.80只有一个候选,高置信度
545 / 14 = 0.36两个候选都很低分,低置信度
为什么要这样计算置信度?

如果只看 top1 的绝对分数,可能会误判:

  • top1 = 50,top2 = 45:虽然 top1 分数高,但和 top2 差距很小,说明存在歧义
  • top1 = 20,top2 = 5:虽然 top1 分数不高,但远超 top2,说明结果比较明确

通过相对差距来计算置信度,能更准确地反映路由结果的可靠程度。

付费内容提示

该文档的全部内容仅对「JavaUp项目实战&技术讲解」知识星球用户开放

加入星球后,你可以获得:

  • 超级八股文:100万+字的全栈技术知识库,涵盖技术核心、数据库、中间件、分布式等深度剖析的讲解
  • 讲解文档:超级AI智能体、黑马点评Plus、大麦、大麦pro、大麦AI、流量切换、数据中台的从0到1的详细文档
  • 讲解视频:超级AI智能体、黑马点评Plus、大麦、大麦pro、大麦AI、流量切换、数据中台的核心业务详细讲解
  • 1 对 1 解答:可以对我进行1对1的问题提问,而不仅仅只限于项目
  • 针对性服务:有没理解的地方,文档或者视频还没有讲到可以提出,本人会补充
  • 面试与简历指导:提供面试回答技巧,项目怎样写才能在简历中具有独特的亮点
  • 中间件环境:对于项目中需要使用的中间件,可直接替换成我提供的云环境
  • 面试后复盘:小伙伴去面试后,如果哪里被面试官问住了,可以再找我解答
  • 远程的解决:如果在启动项目遇到问题,本人可以帮你远程解决
进入星球后,即可享受上述所有服务,保证不会再有其他隐藏费用。
知识星球二维码

1. 打开微信 -> 扫描左侧二维码 -> 加入「JavaUp项目实战&技术讲解」知识星球

2. 查看星球使用指导,获取完整项目讲解资料索引

👉 点击解锁全部付费内容
🎁优惠