(原理|实战)Query Rewrite

Query rewrite #

query rewrite [1][2] #

论文使用LLM重写用户查询，而不是直接使用原始用户查询进行检索。因为对于LLM 而言，原始查询不可能总是最佳检索结果，可以让LLM重写查询。
Repo git 【问题的多样化】

Transformation-多样性 #

Step Back #

Step Back问答回退策略 [3] #

Step Back问答回退，首先提示LLM提出一个关于高级概念或原则的通用后退问题，并检索有关它们的相关事实，使用此基础来帮助回答用户问题。

Step-back Prompting [1][2] #

论文使用退一步提示，使用LLM生成"后退"(Step back prompting)问题。使用检索时，“后退"问题和原始问题都会被用来进行检索，然后这两个结果都会被用来作为语言模型回复的基础。
Repo git 【问题的抽象化】

Transformation-抽象化 #

HyDE #

HyDE混合策略[3] #

LLM将问题转换为回答问题的假设文档。使用嵌入的假设文档检索真实文档，前提是doc-doc相似性搜索可以产生更多相关匹配。

HyDE At a high level, HyDE is an embedding technique that takes queries, generates a hypothetical answer, and then embeds that generated document and uses that as the final example.

Transformation-具体化 #

参考 #

知识图谱用于细粒度大模型幻觉评估：兼论Langchain-RAG问答中的问题改写范式 RAG: rewrite , Step back, fusion
Query Transformations
一文详看Langchain框架中的RAG多阶段优化策略：从问题转换到查询路由再到生成优化 *** 原理paper，代码示例
Multi Query多查询策略， Decomposition问题，RAG-Fusion， Step Back， HyDE混合
rag-from-scratch Repo git
RAG(检索增强）从入门到精通虚拟文档嵌入（Hyde) V

1xx. 业界总结｜搜索中的Query理解 ***

1xx. 智能扩充机器人的“标准问”库之Query生成

LLM之RAG实战（二十八）| 探索RAG query重写

高级RAG检索中的五种查询重写策略