RAG入门与核心原理概述

先来看个真实的场景。

某公司花了大价钱接入了某知名大模型，想做一个智能客服。产品经理信心满满地上线了，结果第一天就翻车了——

用户问："你们家XX-3000型号打印机的墨盒怎么换？"

AI客服回答得头头是道："首先打开打印机前盖，取出旧墨盒，将新墨盒按照箭头方向插入卡槽，听到咔哒声即可..."

听起来很专业对吧？问题是，这家公司根本就没有XX-3000这个型号。AI编了个不存在的产品，还煞有介事地教人换墨盒。

为什么会这样呢？因为大模型还有个致命的毛病——它只会"闭卷地考试"。

闭卷考试 vs 开卷考试

我们先搞清楚大模型到底是怎么工作的。

简单说，大模型的训练就像让一个学生疯狂读书。它把互联网上能找到的文本资料都读了一遍，从中学会了三样东西：

训练完成后，这些知识就"冻结"在模型参数里了。

当你跟大模型对话时，它其实就在做一件事：根据你说的话，一个字一个字地往后猜。

你的输入：今天北京的天气
模型预测：怎 → 么 → 样 → ？ → 今 → 天 → ...

有点像文字接龙——根据学过的规律，每次猜一个最可能的字，串起来就成了完整的回答。

关键点来了：模型的所有知识都是训练时塞进去的，推理的时候它没法获取新信息。

这就是"闭卷考试"——考试的时候不能翻书，只能靠脑子里记住的东西答题。

大模型局限性

搞懂了工作原理，就能理解大模型在实际应用中为什么总是翻车。

这是最让人头疼的问题，业内管它叫"幻觉"。

大模型有时候会生成看起来很合理、但实际上纯属瞎编的内容。就像开头那个例子，它不会说"不知道"，而是会编一个听起来像那么回事的答案。

为什么会这样？因为模型的本质是预测概率最高的下一个词，它并不真正"理解"什么是事实。当遇到不确定的问题时，它会基于语言规律生成一个"看起来像答案"的内容。

比如我问：阿星不是程序员在抖音发布的讲解Mysql索引是什么时候？

其实我就只讲过Mysql的分页查询，根本没讲过索引。模型却能编出一大段关于索引的内容来。🤣

付费内容提示

加入星球后，你可以获得：

进入星球后，即可享受上述所有服务，保证不会再有其他隐藏费用。

1. 打开微信 -> 扫描左侧二维码 -> 加入「JavaUp项目实战&技术讲解」知识星球

2. 查看星球使用指导，获取完整项目讲解资料索引