向量数据库选型实战指南
买房子要考虑什么?
- 预算多少?(成本)
- 几口人住?(规模)
- 上班远不远?(性能)
- 将来要换大房子吗?(扩展性)
- 物业靠不靠谱?(维护成本)
选向量数据库也是一样的逻辑。
没有"最好的"向量数据库,只有"最适合你场景的"。
向量数据库的核心作用
向量数据库在RAG中承担两个核心职责:存储(保存文档块的向量表示及原始文本)和检索(根据查询向量快速找出语义最相近的文档块)。它的本质是将暴力全量比较(O(n))优化为近似最近邻搜索(O(log n)),使得百万级向量检索能在毫秒级内完成。
先搞清楚向量数据库是干什么的
普通数据库 vs 向量数据库
普通数据库(MySQL、PostgreSQL)擅长精确匹配:
SELECT * FROM users WHERE name = '张三';
SELECT * FROM products WHERE price < 100;
要么完全匹配,要么不匹配。
向量数据库擅长相似度匹配:
给定向量 [0.23, -0.45, 0.67, ...]
找出数据库中最相似的5个向量
不是完全匹配,是找"最像的"。
在RAG中的作用
回顾一下RAG的流程:
- 文档切块 → 转成向量 → 存进向量数据库
- 用户提问 → 转成向量 → 在向量数据库中检索 → 找到最相似的文档块
- 文档块 + 问题 → 发给大模型 → 生成回答
向量数据库承担了存储和检索两个核心职责。
向量数据库存了什么
以PGVector为例,看一下实际存储的数据:
| 字段 | 内容 | 作用 |
|---|---|---|
| embedding_id | 主键 | 唯一标识 |
| embedding | 高维向量 [0.23, -0.45, ...] | 用于相似度检索 |
| text | 原始文本块 | 检索到后返回给大模型 |
| metadata | 元数据 JSON | 过滤、溯源 |
检索的时候用向量算相似度,返回的时候把原始文本一起带回来。
付费内容提示
该文档的全部内容仅对「JavaUp项目实战&技术讲解」知识星球用户开放
加入星球后,你可以获得:
- 超级八股文:100万+字的全栈技术知识库,涵盖技术核心、数据库、中间件、分布式等深度剖析的讲解
- 讲解文档:超级AI智能体、黑马点评Plus、大麦、大麦pro、大麦AI、流量切换、数据中台的从0到1的详细文档
- 讲解视频:超级AI智能体、黑马点评Plus、大麦、大麦pro、大麦AI、流量切换、数据中台的核心业务详细讲解
- 1 对 1 解答:可以对我进行1对1的问题提问,而不仅仅只限于项目
- 针对性服务:有没理解的地方,文档或者视频还没有讲到可以提出,本人会补充
- 面试与简历指导:提供面试回答技巧,项目怎样写才能在简历中具有独特的亮点
- 中间件环境:对于项目中需要使用的中间件,可直接替换成我提供的云环境
- 面试后复盘:小伙伴去面试后,如果哪里被面试官问住了,可以再找我解答
- 远程的解决:如果在启动项目遇到问题,本人可以帮你远程解决
进入星球后,即可享受上述所有服务,保证不会再有其他隐藏费用。
