跳到主要内容

向量数据库选型实战指南

买房子要考虑什么？

预算多少？（成本）
几口人住？（规模）
上班远不远？（性能）
将来要换大房子吗？（扩展性）
物业靠不靠谱？（维护成本）

选向量数据库也是一样的逻辑。

没有"最好的"向量数据库，只有"最适合你场景的"。

向量数据库的核心作用

向量数据库在RAG中承担两个核心职责：存储（保存文档块的向量表示及原始文本）和检索（根据查询向量快速找出语义最相近的文档块）。它的本质是将暴力全量比较（O(n)）优化为近似最近邻搜索（O(log n)），使得百万级向量检索能在毫秒级内完成。

先搞清楚向量数据库是干什么的

普通数据库 vs 向量数据库

普通数据库（MySQL、PostgreSQL）擅长精确匹配：

SELECT * FROM users WHERE name = '张三';
SELECT * FROM products WHERE price < 100;

要么完全匹配，要么不匹配。

向量数据库擅长相似度匹配：

给定向量 [0.23, -0.45, 0.67, ...]
找出数据库中最相似的5个向量

不是完全匹配，是找"最像的"。

在RAG中的作用

回顾一下RAG的流程：

文档切块 → 转成向量 → 存进向量数据库
用户提问 → 转成向量 → 在向量数据库中检索 → 找到最相似的文档块
文档块 + 问题 → 发给大模型 → 生成回答

向量数据库承担了存储和检索两个核心职责。

向量数据库存了什么

以PGVector为例，看一下实际存储的数据：

字段	内容	作用
embedding_id	主键	唯一标识
embedding	高维向量 [0.23, -0.45, ...]	用于相似度检索
text	原始文本块	检索到后返回给大模型
metadata	元数据 JSON	过滤、溯源

检索的时候用向量算相似度，返回的时候把原始文本一起带回来。

付费内容提示

该文档的全部内容仅对「JavaUp项目实战&技术讲解」知识星球用户开放

加入星球后，你可以获得：

超级八股文：100万+字的全栈技术知识库，涵盖技术核心、数据库、中间件、分布式等深度剖析的讲解
讲解文档：超级AI智能体、黑马点评Plus、大麦、大麦pro、大麦AI、流量切换、数据中台的从0到1的详细文档
讲解视频：超级AI智能体、黑马点评Plus、大麦、大麦pro、大麦AI、流量切换、数据中台的核心业务详细讲解
1 对 1 解答：可以对我进行1对1的问题提问，而不仅仅只限于项目
针对性服务：有没理解的地方，文档或者视频还没有讲到可以提出，本人会补充
面试与简历指导：提供面试回答技巧，项目怎样写才能在简历中具有独特的亮点
中间件环境：对于项目中需要使用的中间件，可直接替换成我提供的云环境
面试后复盘：小伙伴去面试后，如果哪里被面试官问住了，可以再找我解答
远程的解决：如果在启动项目遇到问题，本人可以帮你远程解决

进入星球后，即可享受上述所有服务，保证不会再有其他隐藏费用。

知识星球二维码

1. 打开微信 -> 扫描左侧二维码 -> 加入「JavaUp项目实战&技术讲解」知识星球

2. 查看星球使用指导，获取完整项目讲解资料索引

👉 点击解锁全部付费内容

先搞清楚向量数据库是干什么的

🎁优惠