Imagic

文章目标是实现对单张真实图像的non-rigid(可改变布局)编辑。 方法非常简单,总共分为三步:1、将目标prompt作为初始值,微调prompt embedding,使得该prompt引导生成原真实图像。2、固定优化后的embedding,微调整个扩散模型,使得更好还原真实图像。3、用优化后的embedding与目标prompt embedding进行线性组合,得到编辑后的图像。 此外,还开源了一个基于文本进行真实图像编辑的benchmark用于评测对比。
  • 数据:单张真实图像微调
  • 指标:User Study
  • 硬件:1 A100
  • 开源:benchmark开源