In Context Learning ( ICL ) 上下文学习 #

- in context learning,大意是在prompt learning的基础上,将少量有标签样本融入prompt。
- 上图的ICL模型可以理解成有监督、无训练的小样本学习。
- 但并非所有ICL都不训练。比如下图右上角的FLAN就是用instruction tuning训练参数的。

- FLAN,既属于 in context learning,也属于 instruction learning
Instruction Learning [1] #
Instruct Tuning- #
FLANv1, FLANv2
instructGPT #
chatGPT #
Instruction Tuning #

-
对于已有的预训练模型,继续在多项任务(B、C、D等)上做训练,在其他任务(A)上做预测。虽然依然没见过任务A,但是根据对B、C、D等的训练,对A的效果有所提升; [1]
-
Instruct Tuning 本质上也是Prompt Tuning [2]
-
研究了缩放对指令微调的影响 [3] 与微调指令的任务数量有关,任务数量越多效果越好 与模型的大小有关,模型越大效果越好
-
Prompt vs. Instruction Tuning [4] Prompt是去激发语言模型的补全能力,比如给出上半句生成下半句、或者做完形填空,都还是像在做language model任务. 而Instruction Tuning则是激发语言模型的理解能力,通过给出更明显的指令/指示,让模型去理解并做出正确的action Prompt tuning都是针对一个任务的,比如做个情感分析任务的prompt tuning,精调完的模型只能用于情感分析任务,而经过Instruction Tuning多任务精调后,可以用于其他任务的zero-shot
-
Instruction Tuning 指令微调 [4]
- Self Instruction
- Alpaca = LLaMA + Intruction Tuning [2]
- Self Instruction
Limitation of instruction finetuning [2] #
问题1. 开放性问题
问题2. 看图
参考 #
-
第九课:Instruct Tuning *** V
1xx. June 2023, A Stage Review of Instruction Tuning
1xx. 【LLM系列之FLAN-T5/PaLM】Scaling Instruction-Finetuned Language Models