Imagic | lc's space

文章标题：Imagic: Text-Based Real Image Editing with Diffusion Models
文章地址：https://arxiv.org/abs/2210.09276
CVPR 2023

文章目标是实现对单张真实图像的non-rigid（可改变布局）编辑。方法非常简单，总共分为三步：1、将目标prompt作为初始值，微调prompt embedding，使得该prompt引导生成原真实图像。2、固定优化后的embedding，微调整个扩散模型，使得更好还原真实图像。3、用优化后的embedding与目标prompt embedding进行线性组合，得到编辑后的图像。此外，还开源了一个基于文本进行真实图像编辑的benchmark用于评测对比。

数据：单张真实图像微调
指标：User Study
硬件：1 A100
开源：benchmark开源

DAAM

DemoCaricature