跳到主要内容

双通道检索获得结果后的后续处理(父块提升)

上一篇我们讲了 RRF 融合,把多个通道的候选合并成了一个统一排序的列表。但这些候选还是子块级别的短片段,可能只有几百个字符,上下文不够完整。这一篇我们来看下一步——父块提升,把子块提升为更大的父块,给模型提供更完整的上下文。

父块提升

// 将分块级证据尽量提升回父块,避免最终回答只看到过短的孤立片段。
List<Document> parentCandidates = documentKnowledgeService.elevateToParentBlocks(
mergedCandidates,
properties.getParentEvidenceMaxChars()
);

什么是父块提升?

在文档切块时,一个长文档会被切成多个小块(chunk)。比如一篇文章可能被切成:

  • 块1:第1-3段
  • 块2:第4-6段
  • 块3:第7-9段

如果检索只命中了块2,模型看到的上下文就只有第4-6段,可能会缺少前后文信息。

父块提升的作用是:如果检索命中了某个子块,就尝试把它的父块(更大的上下文)提升上来。比如:

  • 检索命中了块2(第4-6段)
  • 父块提升后,返回块1+2+3(第1-9段)

这样模型就能看到更完整的上下文,回答质量会更好。

为什么要限制字符数?

properties.getParentEvidenceMaxChars() 限制了父块的最大字符数(通常是 2000-3000 字符)。如果父块太大,会占用过多的 Prompt 空间,导致其他证据被挤掉。

付费内容提示

该文档的全部内容仅对「JavaUp项目实战&技术讲解」知识星球用户开放

加入星球后,你可以获得:

  • 超级八股文:100万+字的全栈技术知识库,涵盖技术核心、数据库、中间件、分布式等深度剖析的讲解
  • 讲解文档:超级AI智能体、黑马点评Plus、大麦、大麦pro、大麦AI、流量切换、数据中台的从0到1的详细文档
  • 讲解视频:超级AI智能体、黑马点评Plus、大麦、大麦pro、大麦AI、流量切换、数据中台的核心业务详细讲解
  • 1 对 1 解答:可以对我进行1对1的问题提问,而不仅仅只限于项目
  • 针对性服务:有没理解的地方,文档或者视频还没有讲到可以提出,本人会补充
  • 面试与简历指导:提供面试回答技巧,项目怎样写才能在简历中具有独特的亮点
  • 中间件环境:对于项目中需要使用的中间件,可直接替换成我提供的云环境
  • 面试后复盘:小伙伴去面试后,如果哪里被面试官问住了,可以再找我解答
  • 远程的解决:如果在启动项目遇到问题,本人可以帮你远程解决
进入星球后,即可享受上述所有服务,保证不会再有其他隐藏费用。
知识星球二维码

1. 打开微信 -> 扫描左侧二维码 -> 加入「JavaUp项目实战&技术讲解」知识星球

2. 查看星球使用指导,获取完整项目讲解资料索引

👉 点击解锁全部付费内容
🎁优惠