RAG流程

截图来源b站马克的技术工作坊

RAG（检索增强生成）是一种AI技术，通过检索外部知识库信息来增强大语言模型的生成能力，提高回答准确性和时效性。

有两个流程

用户提问前(准备数据阶段):
1. 将文本内容分片
2. 而后用Embedding向量化
3. 之后将向量放入向量数据库中

用户提问后(实际使用阶段):
1. 先将用户提问通过Embedding向量化.
2. 在向量数据库中召回.

这是召回时,计算向量相似度的方法

后用cross-encoder重排.(召回和重排相当于两层筛选)

重排后将找到的数据好用户提问的

注:召回和重排的统称是检索