截图来源b站马克的技术工作坊

RAG(检索增强生成)是一种AI技术,通过检索外部知识库信息来增强大语言模型的生成能力,提高回答准确性和时效性。

有两个流程

Image

Image

这是召回时,计算向量相似度的方法
Image

  1. 后用cross-encoder重排.(召回和重排相当于两层筛选)

Image

  1. 重排后将找到的数据好用户提问的

Image

注:召回和重排的统称是检索