认识工具调用机制
你有没有想过这样一个问题:为什么大模型能写诗、能写代码,却没法告诉你今天股票涨了多少?
这不是因为它笨,而是因为它的"记忆"是静态的。大模型的知识来源于训练数据,训练完成后这些知识就被"冻结"了。你问它2023年的事情可能还能答上来,但问它今天发生了什么,它只能瞎编。
拿一个具体场景来说:
你:"帮我查一下北京今天多少度"
大模型内心os:"我哪知道今天啥情况,我的数据只到去年...但用户等着呢,要不我编一个?"
大模型:"北京今天大约15度,天气晴朗"
这个回答可能完全是错的,但模型会很自信地说出来。这就是大模型的"知识边界"问题——它只知道训练时学到的东西,对实时信息完全无能为力。
除了时效性问题,还有另一个限制:私有数据。你公司的业务数据、用户信息这些东西,大模型压根没见过,自然也回答不了。
给大模型装上"外挂"
既然模型自己搞不定,那就给它找帮手呗。
工具调用(Tool Calling,也叫Function Calling)就是干这个的——让大模型在需要的时候,能够调用外部的工具或接口来获取信息、执行操作。
打个比方:大模型就像一个学识渊博但没有手机的人。他懂很多道理,但查不了天气、打不了电话、也没法帮你订外卖。工具调用就相当于给他配了一部智能手机,需要什么信息自己查去。
不过这里有个很重要的认知要先纠正一下:
常见误区
大模型自己不会执行任何工具!
虽然叫"工具调用",但大模型干的活其实是"工具决策"——它只负责判断:
- 这个问题需不需要用工具?
- 用哪个工具?
- 参数填什么?
真正动手执行工具的,是你的应用程序。模型输出一个调用指令,你的代码收到后去执行,拿到结果再告诉模型,模型才能组织出最终答案。
付费内容提示
该文档的全部内容仅对「JavaUp项目实战&技术讲解」知识星球用户开放
加入星球后,你可以获得:
- 超级八股文:100万+字的全栈技术知识库,涵盖技术核心、数据库、中间件、分布式等深度剖析的讲解
- 讲解文档:超级AI智能体、黑马点评Plus、大麦、大麦pro、大麦AI、流量切换、数据中台的从0到1的详细文档
- 讲解视频:超级AI智能体、黑马点评Plus、大麦、大麦pro、大麦AI、流量切换、数据中台的核心业务详细讲解
- 1 对 1 解答:可以对我进行1对1的问题提问,而不仅仅只限于项目
- 针对性服务:有没理解的地方,文档或者视频还没有讲到可以提出,本人会补充
- 面试与简历指导:提供面试回答技巧,项目怎样写才能在简历中具有独特的亮点
- 中间件环境:对于项目中需要使用的中间件,可直接替换成我提供的云环境
- 面试后复盘:小伙伴去面试后,如果哪里被面试官问住了,可以再找我解答
- 远程的解决:如果在启动项目遇到问题,本人可以帮你远程解决
进入星球后,即可享受上述所有服务,保证不会再有其他隐藏费用。
