跳到主要内容

RAG入门与核心原理概述

先来看个真实的场景。

某公司花了大价钱接入了某知名大模型,想做一个智能客服。产品经理信心满满地上线了,结果第一天就翻车了——

用户问:"你们家XX-3000型号打印机的墨盒怎么换?"

AI客服回答得头头是道:"首先打开打印机前盖,取出旧墨盒,将新墨盒按照箭头方向插入卡槽,听到咔哒声即可..."

听起来很专业对吧?问题是,这家公司根本就没有XX-3000这个型号。AI编了个不存在的产品,还煞有介事地教人换墨盒。

为什么会这样呢?因为大模型还有个致命的毛病——它只会"闭卷地考试"

闭卷考试 vs 开卷考试

我们先搞清楚大模型到底是怎么工作的。

大模型的"学习"过程

简单说,大模型的训练就像让一个学生疯狂读书。它把互联网上能找到的文本资料都读了一遍,从中学会了三样东西:

  • 语言规律:怎么组织句子才通顺
  • 常识知识:历史事件、地理常识、科学原理这些
  • 推理能力:因果关系、逻辑推断

训练完成后,这些知识就"冻结"在模型参数里了。

大模型的"答题"过程

当你跟大模型对话时,它其实就在做一件事:根据你说的话,一个字一个字地往后猜。

你的输入:今天北京的天气
模型预测:怎 → 么 → 样 → ? → 今 → 天 → ...

有点像文字接龙——根据学过的规律,每次猜一个最可能的字,串起来就成了完整的回答。

关键点来了:模型的所有知识都是训练时塞进去的,推理的时候它没法获取新信息。

这就是"闭卷考试"——考试的时候不能翻书,只能靠脑子里记住的东西答题。

闭卷考试的五个很严重的硬伤问题

大模型局限性

搞懂了工作原理,就能理解大模型在实际应用中为什么总是翻车。

硬伤一:编故事的本事一流

这是最让人头疼的问题,业内管它叫"幻觉"。

大模型有时候会生成看起来很合理、但实际上纯属瞎编的内容。就像开头那个例子,它不会说"不知道",而是会编一个听起来像那么回事的答案。

为什么会这样?因为模型的本质是预测概率最高的下一个词,它并不真正"理解"什么是事实。当遇到不确定的问题时,它会基于语言规律生成一个"看起来像答案"的内容。

比如我问:阿星不是程序员在抖音发布的讲解Mysql索引是什么时候?

讲解

其实我就只讲过Mysql的分页查询,根本没讲过索引。模型却能编出一大段关于索引的内容来。🤣

付费内容提示

该文档的全部内容仅对「JavaUp项目实战&技术讲解」知识星球用户开放

加入星球后,你可以获得:

  • 超级八股文:100万+字的全栈技术知识库,涵盖技术核心、数据库、中间件、分布式等深度剖析的讲解
  • 讲解文档:超级AI智能体、黑马点评Plus、大麦、大麦pro、大麦AI、流量切换、数据中台的从0到1的详细文档
  • 讲解视频:超级AI智能体、黑马点评Plus、大麦、大麦pro、大麦AI、流量切换、数据中台的核心业务详细讲解
  • 1 对 1 解答:可以对我进行1对1的问题提问,而不仅仅只限于项目
  • 针对性服务:有没理解的地方,文档或者视频还没有讲到可以提出,本人会补充
  • 面试与简历指导:提供面试回答技巧,项目怎样写才能在简历中具有独特的亮点
  • 中间件环境:对于项目中需要使用的中间件,可直接替换成我提供的云环境
  • 面试后复盘:小伙伴去面试后,如果哪里被面试官问住了,可以再找我解答
  • 远程的解决:如果在启动项目遇到问题,本人可以帮你远程解决
进入星球后,即可享受上述所有服务,保证不会再有其他隐藏费用。
知识星球二维码

1. 打开微信 -> 扫描左侧二维码 -> 加入「JavaUp项目实战&技术讲解」知识星球

2. 查看星球使用指导,获取完整项目讲解资料索引

👉 点击解锁全部付费内容
🎁优惠