截图来源b站马克的技术工作坊
RAG(检索增强生成)是一种AI技术,通过检索外部知识库信息来增强大语言模型的生成能力,提高回答准确性和时效性。
有两个流程
- 用户提问前(准备数据阶段):
- 将文本内容分片
- 而后用Embedding向量化
- 之后将向量放入向量数据库中
- 用户提问后(实际使用阶段):
- 先将用户提问通过Embedding向量化.
- 在向量数据库中召回.
- 后用cross-encoder重排.(召回和重排相当于两层筛选)
- 重排后将找到的数据好用户提问的
注:召回和重排的统称是检索
截图来源b站马克的技术工作坊
RAG(检索增强生成)是一种AI技术,通过检索外部知识库信息来增强大语言模型的生成能力,提高回答准确性和时效性。
有两个流程
注:召回和重排的统称是检索