问题改写服务的完整实现
上一篇讲了问题改写的入口,这一篇我们深入 ChatQueryRewriteService 内部,看看它是如何把用户的原始问题改写成更适合检索的表达的。
问题改写的核心目标
在讲具体实现之前,先明确一下问题改写要解决的几个核心问题:
| 问题类型 | 示例 | 改写目标 |
|---|---|---|
| 上下文省略 | "它是什么?" | 补全上下文,变成"XXX 是什么?" |
| 指代不明 | "这个功能怎么用?" | 消解指代,明确"这个"指的是什么 |
| 口语化表达 | "能不能给我讲讲那个啥来着" | 规范化表达 |
| 多问题混合 | "A 是什么?B 怎么用?" | 拆分成多个独立的子问题 |
rewrite 方法的主流程
ChatQueryRewriteService.rewrite 方法是整个改写流程的入口:
/**
* 执行问题改写主流程。
* 这里会先判断是否值得改写,若不值得则直接走规则兜底;
* 若需要改写,则调用模型生成 JSON 结构化结果,并在失败时退回规则改写。
*
* @param question 原始问题
* @param historySummary 历史摘要
* @param traceRecorder 模型调用追踪器
* @return 改写结果
*/
public RagRewriteResult rewrite(String question,
String historySummary,
ConversationTraceRecorder traceRecorder) {
String normalizedQuestion = StrUtil.trim(question);
if (StrUtil.isBlank(normalizedQuestion)) {
// 空问题没有改写意义,直接返回空结果。
return new RagRewriteResult("", List.of());
}
if (!properties.isRewriteEnabled() || !needsRewrite(normalizedQuestion, historySummary)) {
// 未开启改写或当前问题不值得改写时,直接走规则兜底。
RagRewriteResult fallback = fallback(normalizedQuestion);
log.info("RAG 改写跳过: question='{}', rewritten='{}', subQuestions={}",
normalizedQuestion,
fallback.getRewrittenQuestion(),
fallback.getSubQuestions());
return fallback;
}
try {
// 使用提示词模板把历史摘要和当前问题渲染成结构化改写 Prompt。
String prompt = promptTemplateService.render(PromptTemplateNames.CHAT_QUERY_REWRITE, Map.of(
"history", StrUtil.isNotBlank(historySummary) ? historySummary : "无历史上下文",
"question", normalizedQuestion
));
// 调用模型生成改写结果,阶段名固定为 rewrite,便于追踪与成本统计。
String raw = observedChatModelService.callText("rewrite", null, prompt, buildRewriteCallOptions(), traceRecorder);
RagRewriteResult parsed = normalizeRewriteResult(normalizedQuestion, parse(raw));
if (parsed != null && StrUtil.isNotBlank(parsed.getRewrittenQuestion())) {
// 保留模型原始输出,便于后续调试"为什么改写成这样"。
parsed.setRawModelOutput(raw);
log.info("RAG 改写完成: question='{}', rewritten='{}', subQuestions={}",
normalizedQuestion,
parsed.getRewrittenQuestion(),
parsed.getSubQuestions());
return parsed;
}
// 如果模型输出结构不合法或没有可用改写,则记录告警并退回规则改写。
log.warn("RAG 改写结果不可用,回退到规则改写: question='{}', raw='{}'",
normalizedQuestion,
StrUtil.blankToDefault(raw, ""));
}
catch (Exception exception) {
// 模型调用或解析异常都不阻断主流程,而是回退到规则改写。
log.warn("RAG 改写失败,回退到规则改写: question='{}', message={}",
normalizedQuestion,
exception.getMessage());
}
return fallback(normalizedQuestion);
}
整个流程可以分为五个步骤:
第一步:空值检查
String normalizedQuestion = StrUtil.trim(question);
if (StrUtil.isBlank(normalizedQuestion)) {
// 空问题没有改写意义,直接返回空结果。
return new RagRewriteResult("", List.of());
}
如果问题为空或只有空格,直接返回空结果,没必要继续处理。
付费内容提示
该文档的全部内容仅对「JavaUp项目实战&技术讲解」知识星球用户开放
加入星球后,你可以获得:
- 超级八股文:100万+字的全栈技术知识库,涵盖技术核心、数据库、中间件、分布式等深度剖析的讲解
- 讲解文档:超级AI智能体、黑马点评Plus、大麦、大麦pro、大麦AI、流量切换、数据中台的从0到1的详细文档
- 讲解视频:超级AI智能体、黑马点评Plus、大麦、大麦pro、大麦AI、流量切换、数据中台的核心业务详细讲解
- 1 对 1 解答:可以对我进行1对1的问题提问,而不仅仅只限于项目
- 针对性服务:有没理解的地方,文档或者视频还没有讲到可以提出,本人会补充
- 面试与简历指导:提供面试回答技巧,项目怎样写才能在简历中具有独特的亮点
- 中间件环境:对于项目中需要使用的中间件,可直接替换成我提供的云环境
- 面试后复盘:小伙伴去面试后,如果哪里被面试官问住了,可以再找我解答
- 远程的解决:如果在启动项目遇到问题,本人可以帮你远程解决
进入星球后,即可享受上述所有服务,保证不会再有其他隐藏费用。
