跳到主要内容

ReAct推理循环机制详解

什么是 ReAct 循环

前面几篇文档讲了 ReactAgentExecutor 怎么被触发、怎么配置、怎么调用 reactAgent.stream()。但有一个核心问题一直没展开:调用 stream() 之后,ReactAgent 内部到底是怎么"思考→行动→再思考"的?

ReAct 是 "Reasoning + Acting" 的缩写。它的核心思想很简单:

  1. Think(思考):模型拿到当前所有信息,推理下一步该做什么
  2. Act(行动):如果模型认为需要外部信息,就生成一个工具调用请求
  3. Observe(观察):工具执行完毕,把结果放回上下文,让模型"看到"
  4. 循环:模型再次推理,决定是继续调用工具还是直接给出最终答案

这个循环会一直转下去,直到模型认为信息足够了,不再请求工具调用,直接输出答案为止。

举个具体的例子。用户问:"Java 21 有哪些新特性?"

轮次步骤发生了什么
第1轮Think模型推理:"这个问题需要最新信息,我应该搜索一下"
第1轮Act模型生成工具调用:tavily_search({query: "Java 21 new features"})
第1轮ObserveTavily 返回搜索结果,包含 Virtual Threads、Pattern Matching 等内容
第2轮Think模型看到搜索结果,推理:"信息足够了,我可以组织答案了"
第2轮输出模型直接生成最终答案,不再调用工具,循环结束

关键点在于:这个循环不是写在业务代码里的 while 循环。它是通过图(Graph)的节点和条件边来实现的——模型节点执行完后,条件边判断是否有工具调用,有就路由到工具节点,工具节点执行完再路由回模型节点。图框架自动驱动这个过程。

付费内容提示

该文档的全部内容仅对「JavaUp项目实战&技术讲解」知识星球用户开放

加入星球后,你可以获得:

  • 超级八股文:100万+字的全栈技术知识库,涵盖技术核心、数据库、中间件、分布式等深度剖析的讲解
  • 讲解文档:超级AI智能体、黑马点评Plus、大麦、大麦pro、大麦AI、流量切换、数据中台的从0到1的详细文档
  • 讲解视频:超级AI智能体、黑马点评Plus、大麦、大麦pro、大麦AI、流量切换、数据中台的核心业务详细讲解
  • 1 对 1 解答:可以对我进行1对1的问题提问,而不仅仅只限于项目
  • 针对性服务:有没理解的地方,文档或者视频还没有讲到可以提出,本人会补充
  • 面试与简历指导:提供面试回答技巧,项目怎样写才能在简历中具有独特的亮点
  • 中间件环境:对于项目中需要使用的中间件,可直接替换成我提供的云环境
  • 面试后复盘:小伙伴去面试后,如果哪里被面试官问住了,可以再找我解答
  • 远程的解决:如果在启动项目遇到问题,本人可以帮你远程解决
进入星球后,即可享受上述所有服务,保证不会再有其他隐藏费用。
知识星球二维码

1. 打开微信 -> 扫描左侧二维码 -> 加入「JavaUp项目实战&技术讲解」知识星球

2. 查看星球使用指导,获取完整项目讲解资料索引

👉 点击解锁全部付费内容
🎁优惠