(原理|实战)RAG Rerank

Reranker [22] #

A reranking model — also known as a cross-encoder — is a type of model that,given a query and document pair, will output a similarity score.

Rerankers

产品 #

BGE Ranker [20] #

交叉编码器将对查询和答案实时计算相关性分数,这比**向量模型(即双编码器)**更准确,但比向量模型更耗时。 因此,它可以用来对嵌入模型返回的前k个文档重新排序。 我们在多语言数据上训练了交叉编码器,数据格式与向量模型相同,因此您可以根据我们的示例 轻松地对其进行微调。

BCE[24] #

中文效果比BGE好[老刘说nlp]

优秀的组合 [21] #

OpenAI + CohereRerank Voyage + big-reranker-large

参考 #

  1. BGE Reranker transformers二次开发——bge-reranker模型微调流程 V RAG 再添新利器!智源开源最强检索排序模型 BGE Re-Ranker v2.0

  2. 提升RAG——选择最佳Embedding和重新排名模型 Boosting RAG: Picking the Best Embedding & Reranker models

  3. Rerankers and Two-Stage Retrieval *** 文中的第二阶段就是指Reranker

  4. youdao RerankerModal BCE

1xx. 一文详看Langchain框架中的RAG多阶段优化策略:从问题转换到查询路由再到生成优化 rag-from-scratch Repo git