P-Tuning

P-Tuning[2] #

P-Tuning 的创新之处在于将提示（Prompt）转化为可学习的嵌入层（Embedding Layer）

架构 #

ptuning

一个关于“The capital of Britain is [MASK]” 示例：
- 蓝色是上下文 “Britain”
- 红色是目标单词 “[MASK]”，
- 橙色区域是提示词。
传统方式与 P-Tuning 对比：
- 在（a）中，提示生成器只接收离散奖励；
- 在（b）中，连续的提示嵌入（Prompt Embedding） 和**提示编码器（Prompt Encoder）**以可微的方式进行优化。

P-Tuning v2[2] #

背景 #

之前的方法在以下两方面有所限制： • 模型规模差异：在大型预训练模型中，Prompt Tuning 和 P-Tuning 能取得与全面微调相似的效果，但在参数较少的模型上则表现不佳。 • 任务类型差异：无论是 Prompt Tuning 还是 P-Tuning，在序列标注任务上的表现都较差。

目的 #

P-Tuning v2 旨在使提示调整（Prompt Tuning）在不同规模的预训练模型上，针对各种下游任务都能达到类似全面微调（Fine-tuning）的效果。

架构 [1] #

ptuning-v2 在每一层都加入了Prompts tokens 作为输入, 而不是仅仅加在输入层

总结 #

compare

P-tuning 和 Prompt Tuning 仅仅更新第一个Transformer层
Prefix tuning 和 P-Tuning v2 针对每一个Transformer 层进行更新
Prefix tuning 和 P-Tuning 需要重新参数化(PromptEncoder), 而Prompt Tuning 和 P-Tuning v2则不需要
简单将P-Tuning认为是针对 Prompt Tuning的改进, P-Tuning v2 认为是针对 Prefix tuning 的改进.

参考 #

大模型参数高效微调技术原理及实践 pdf 如何高效微调大模型？技术原理与最佳实践揭秘！ V ***
《3-大模型微调技术揭秘-PEFT》 Ai大模型微调