RAG入门与核心原理概述
先来看个真实的场景。
某公司花了大价钱接入了某知名大模型,想做一个智能客服。产品经理信心满满地上线了,结果第一天就翻车了——
用户问:"你们家XX-3000型号打印机的墨盒怎么换?"
AI客服回答得头头是道:"首先打开打印机前盖,取出旧墨盒,将新墨盒按照箭头方向插入卡槽,听到咔哒声即可..."
听起来很专业对吧?问题是,这家公司根本就没有XX-3000这个型号。AI编了个不存在的产品,还煞有介事地教人换墨盒。
为什么会这样呢?因为大模型还有个致命的毛病——它只会"闭卷地考试"。
闭卷考试 vs 开卷考试
我们先搞清楚大模型到底是怎么工作的。
大模型的"学习"过程
简单说,大模型的训练就像让一个学生疯狂读书。它把互联网上能找到的文本资料都读了一遍,从中学会了三样东西:
- 语言规律:怎么组织句子才通顺
- 常识知识:历史事件、地理常识、科学原理这些
- 推理能力:因果关系、逻辑推断
训练完成后,这些知识就"冻结"在模型参数里了。
大模型的"答题"过程
当你跟大模型对话时,它其实就在做一件事:根据你说的话,一个字一个字地往后猜。
你的输入:今天北京的天气
模型预测:怎 → 么 → 样 → ? → 今 → 天 → ...
有点像文字接龙——根据学过的规律,每次猜一个最可能的字,串起来就成了完整的回答。
关键点来了:模型的所有知识都是训练时塞进去的,推理的时候它没法获取新信息。
这就是"闭卷考试"——考试的时候不能翻书,只能靠脑子里记住的东西答题。
闭卷考试的五个很严重的硬伤问题
搞懂了工作原理,就能理解大模型在实际应用中为什么总是翻车。
硬伤一:编故事的本事一流
这是最让人头疼的问题,业内管它叫"幻觉"。
大模型有时候会生成看起来很合理、但实际上纯属瞎编的内容。就像开头那个例子,它不会说"不知道",而是会编一个听起来像那么回事的答案。
为什么会这样?因为模型的本质是预测概率最高的下一个词,它并不真正"理解"什么是事实。当遇到不确定的问题时,它会基于语言规律生成一个"看起来像答案"的内容。
比如我问:阿星不是程序员在抖音发布的讲解Mysql索引是什么时候?
其实我就只讲过Mysql的分页查询,根本没讲过索引。模型却能编出一大段关于索引的内容来。🤣
付费内容提示
该文档的全部内容仅对「JavaUp项目实战&技术讲解」知识星球用户开放
加入星球后,你可以获得:
- 超级八股文:100万+字的全栈技术知识库,涵盖技术核心、数据库、中间件、分布式等深度剖析的讲解
- 讲解文档:超级AI智能体、黑马点评Plus、大麦、大麦pro、大麦AI、流量切换、数据中台的从0到1的详细文档
- 讲解视频:超级AI智能体、黑马点评Plus、大麦、大麦pro、大麦AI、流量切换、数据中台的核心业务详细讲解
- 1 对 1 解答:可以对我进行1对1的问题提问,而不仅仅只限于项目
- 针对性服务:有没理解的地方,文档或者视频还没有讲到可以提出,本人会补充
- 面试与简历指导:提供面试回答技巧,项目怎样写才能在简历中具有独特的亮点
- 中间件环境:对于项目中需要使用的中间件,可直接替换成我提供的云环境
- 面试后复盘:小伙伴去面试后,如果哪里被面试官问住了,可以再找我解答
- 远程的解决:如果在启动项目遇到问题,本人可以帮你远程解决
