Prompt-to-Prompt

论文 #

论文地址 PROMPT-TO-PROMPT IMAGE EDITING WITH CROSS-ATTENTION CONTROL
开源地址 Prompt-to-Prompt git
Project page Project page

示意[1] #

应用[1] #

**应用方面：**Prompt-to-Prompt 这个方法是原理上的创新，应用方面只适用于“已经生成了一张大致满意的图，我们想对它进行部分修改”。但是对于“手头有一张来历不明的图，我们想对它进行修改”这个任务就很麻烦了，因为很难去倒推这张图对应的prompt是啥。

所以后续有一项工作叫 InstructPix2Pix，作用是“一张来历不明的图，只要说‘把猫改成狗’，模型就能把画面里的猫改成狗，其他不变。”非常好用，听说已经集成在 Stable Diffusion WebUI 里可以直接用了。

Method[1] #

上半部分，原版cross-attention，下半部分，本文的cross-attention

参考 #

Prompt-to-prompt：让生成的图像保持一致

diffusion model(十四)： prompt-to-prompt 深度剖析