ReAct推理循环机制详解
什么是 ReAct 循环
前面几篇文档讲了 ReactAgentExecutor 怎么被触发、怎么配置、怎么调用 reactAgent.stream()。但有一个核心问题一直没展开:调用 stream() 之后,ReactAgent 内部到底是怎么"思考→行动→再思考"的?
ReAct 是 "Reasoning + Acting" 的缩写。它的核心思想很简单:
- Think(思考):模型拿到当前所有信息,推理下一步该做什么
- Act(行动):如果模型认为需要外部信息,就生成一个工具调用请求
- Observe(观察):工具执行完毕,把结果放回上下文,让模型"看到"
- 循环:模型再次推理,决定是继续调用工具还是直接给出最终答案
这个循环会一直转下去,直到模型认为信息足够了,不再请求工具调用,直接输出答案为止。
举个具体的例子。用户问:"Java 21 有哪些新特性?"
| 轮次 | 步骤 | 发生了什么 |
|---|---|---|
| 第1轮 | Think | 模型推理:"这个问题需要最新信息,我应该搜索一下" |
| 第1轮 | Act | 模型生成工具调用:tavily_search({query: "Java 21 new features"}) |
| 第1轮 | Observe | Tavily 返回搜索结果,包含 Virtual Threads、Pattern Matching 等内容 |
| 第2轮 | Think | 模型看到搜索结果,推理:"信息足够了,我可以组织答案了" |
| 第2轮 | 输出 | 模型直接生成最终答案,不再调用工具,循环结束 |
关键点在于:这个循环不是写在业务代码里的 while 循环。它是通过图(Graph)的节点和条件边来实现的——模型节点执行完后,条件边判断是否有工具调用,有就路由到工具节点,工具节点执行完再路由回模型节点。图框架自动驱动这个过程。
付费内容提示
该文档的全部内容仅对「JavaUp项目实战&技术讲解」知识星球用户开放
加入星球后,你可以获得:
- 超级八股文:100万+字的全栈技术知识库,涵盖技术核心、数据库、中间件、分布式等深度剖析的讲解
- 讲解文档:超级AI智能体、黑马点评Plus、大麦、大麦pro、大麦AI、流量切换、数据中台的从0到1的详细文档
- 讲解视频:超级AI智能体、黑马点评Plus、大麦、大麦pro、大麦AI、流量切换、数据中台的核心业务详细讲解
- 1 对 1 解答:可以对我进行1对1的问题提问,而不仅仅只限于项目
- 针对性服务:有没理解的地方,文档或者视频还没有讲到可以提出,本人会补充
- 面试与简历指导:提供面试回答技巧,项目怎样写才能在简历中具有独特的亮点
- 中间件环境:对于项目中需要使用的中间件,可直接替换成我提供的云环境
- 面试后复盘:小伙伴去面试后,如果哪里被面试官问住了,可以再找我解答
- 远程的解决:如果在启动项目遇到问题,本人可以帮你远程解决
进入星球后,即可享受上述所有服务,保证不会再有其他隐藏费用。
