DemoCaricature | lc's space

文章标题：DemoCaricature: Democratising Caricature Generation with a Rough Sketch
文章地址：https://arxiv.org/abs/2312.04364
CVPR 2024

该文章的任务是根据素描生成特定人物的漫画图像，需要对单张图像进行训练。该方法实现了较好的人脸保留度与形状对齐度的平衡，此外还增加了风格图像作为风格条件作为引导。方法跟我之前那个idea很像，在TI基础上进行改进，通过在每个cross-attention processor中增加一个可学习的向量，增加K和V的表达能力，该方法在这里有一个相似度的计算，不是很明白。（源于Perfusion）此外，文章还增加了对人脸进行随机mask的trick，以及对学习到的向量的正则化的惩罚项，增加模型的鲁棒性。

数据：测试时单张图像微调
指标：CLIP-Score；User Study
硬件：1 GTX4090/bs16
开源：https://democaricature.github.io

Imagic

MasaCtrl