(实战)PEFT P-Tuning

最佳实践[1] #

要看losss, 也要看业务的loss
生成模型常用的评价方法
- BLEU 能评估流畅度**
- 结果都是流畅的前提下，ROUGE 反应参照句中多少内容被生成的句子包含（召回）
垂直模型
- stf之后失去通用能力
- 要有通用能力, 需要pre-train和STF中都融入通用的语料
每个模型的学习率lr不一样
- chatglm的学习率 LR=2e-2

学习率 #

改的特别大 模型训练的时候会震荡
改的特别小 模型训练的时候会收敛非常慢

参考 #

《13-基于 ChatGLM2的 Fine-tuning 实战》 AI 大模型全栈工程师培养计划 2期 train_pt2.sh git 基于法律文本的chatglm的p-tuning train_pt2.sh git 基于法律文本的chatglm-2的P-tuning v2 课件 bili有相关的总结的视频