Vector Database 是向量数据库，用来存储和检索 Embedding，常服务 RAG、语义搜索和推荐系统。

Vector Database

Vector Database 是向量数据库，用来存储 Embedding 以及对应的来源、标题、权限等元数据，并在用户查询时快速找出“语义上最相近”的内容片段。

Vector database retrieval flow

图片说明：原创流程图，展示资料和问题先被转成向量，再由向量数据库检索相关片段，最后进入 RAG 或语义搜索流程。

一句话先记住

向量数据库负责“找相似资料”，不是负责“判断资料是否正确”，也不是直接让模型变聪明。

先记住这 3 点

它服务检索

向量数据库常用于语义搜索、推荐和 RAG，把问题匹配到相近资料片段。

Embedding 决定入口

如果内容被转成了糟糕的向量，数据库再快也只是在快速找错东西。

仍要做来源校验

向量相似只说明“可能相关”，不说明资料真实、最新、完整或适合回答。

给普通人的解释

关键词搜索像是在问：“哪些文档里出现了这个词？”向量数据库更像是在问：“哪些内容意思接近这个问题？”

比如用户问“怎么报销出差打车费”，资料库里可能没有完全一样的句子，但有一段“差旅交通费用报销规则”。如果这段文字和问题的 Embedding 足够接近，向量数据库就能把它找出来。

这就是它在 RAG 里有用的原因：LLM 本身不一定知道你的内部资料，也不应该凭空编答案；向量数据库先把相关资料取出来，再由模型基于这些资料组织回答。

它和 Prompt、RAG、Fine-Tuning 的边界

向量数据库是检索组件。它存储向量、做相似度搜索、返回候选资料片段。

Prompt 负责告诉模型任务、格式、约束和引用要求。提示词写得再好，也不会自动补齐缺失资料。

RAG 是完整流程：资料处理、Embedding、检索、排序、提示、生成和校验。向量数据库只是其中一环。

Fine-Tuning 改变模型行为、格式或领域适配倾向；向量数据库不改模型参数，只在回答前提供外部资料。

一个最短使用流程

把文档切成适合检索的片段，并保留标题、URL、时间、权限等元数据。

用 Embedding 模型把每个片段转成向量。

把向量和元数据写入向量数据库，并建立索引。

用户提问时，把问题也转成向量。

检索相近片段，必要时重排、去重，再交给 LLM 或搜索界面。

常见误解

参考来源

OpenAI, Vector embeddings
Johnson, Douze, Jégou, Billion-scale similarity search with GPUs
Qdrant, Vector search overview
最后核查日期：2026-05-06

Vector Database

Vector Database

先记住这 3 点

它服务检索

Embedding 决定入口

仍要做来源校验

给普通人的解释

它和 Prompt、RAG、Fine-Tuning 的边界

一个最短使用流程

常见误解

延伸阅读

参考来源

On this page

Vector Database

它服务检索

Embedding 决定入口

仍要做来源校验

向量数据库就是知识库吗？

有了向量数据库，RAG 就一定准确吗？

它能替代微调吗？

On this page