PhotoVerse

当前定制化文生图面临着一些挑战,包括很长的未微调时间、大的存储需求、所需多张输入图片以及在保证id和可编辑性的不足。为了解决这些问题,文章提出PhotoVerse,一种使用了具有对偶分支的作用于文本和图像域的条件机制。 此外,为了提高id相似度,在训练时,模型使用了脸部的id loss。值得注意的是,PhotoVerse消除了测试时的微调,并且支持目标对象单张图片的输入。 - 数据:Fairface CelebA-HQ FFHQ - 指标:脸部ID相似度(使用人脸识别模型Arcface计算脸部特征的余弦相似度) - 硬件:1 V100/bs64 - 开源:https://photoverse2d.github.io/(暂未开源)