(原理|实战)Query Rewrite

Query rewrite #

query rewrite [1][2] #

  • 论文使用LLM重写用户查询,而不是直接使用原始用户查询进行检索。 因为对于LLM 而言,原始查询不可能总是最佳检索结果,可以让LLM重写查询。
  • Repo git 【问题的多样化】

Transformation-多样性 #

Step Back #

Step Back问答回退策略 [3] #

Step Back问答回退,首先提示LLM提出一个关于高级概念或原则的通用后退问题,并检索有关它们的相关事实,使用此基础来帮助回答用户问题。

Step-back Prompting [1][2] #

  • 论文使用退一步提示,使用LLM生成"后退"(Step back prompting)问题。 使用检索时,“后退"问题和原始问题都会被用来进行检索,然后这两个结果都会被用来作为语言模型回复的基础。
  • Repo git 【问题的抽象化】

Transformation-抽象化 #

HyDE #

HyDE混合策略[3] #

LLM将问题转换为回答问题的假设文档使用嵌入的假设文档检索真实文档,前提是doc-doc相似性搜索可以产生更多相关匹配。

  • HyDE At a high level, HyDE is an embedding technique that takes queries, generates a hypothetical answer, and then embeds that generated document and uses that as the final example.

Transformation-具体化 #

参考 #

  1. 知识图谱用于细粒度大模型幻觉评估:兼论Langchain-RAG问答中的问题改写范式 RAG: rewrite , Step back, fusion

  2. Query Transformations

  3. 一文详看Langchain框架中的RAG多阶段优化策略:从问题转换到查询路由再到生成优化 *** 原理paper,代码示例
    Multi Query多查询策略, Decomposition问题,RAG-Fusion, Step Back, HyDE混合
    rag-from-scratch Repo git
    RAG(检索增强) 从入门到精通 虚拟文档嵌入(Hyde) V

1xx. 业界总结|搜索中的Query理解 ***

1xx. 智能扩充机器人的“标准问”库之Query生成

LLM之RAG实战(二十八)| 探索RAG query重写

高级RAG检索中的五种查询重写策略