<ul class="dashed" data-apple-notes-indent-amount="0"><li><span style="font-family: '.PingFangSC-Regular'">文章标题:</span><i>PhotoVerse</i>: Tuning-Free Image Customization with Text-to-Image Diffusion Models</li><li><span style="font-family: '.PingFangSC-Regular'">文章地址:</span><a href="https://arxiv.org/abs/2309.05793">https://arxiv.org/abs/2309.05793</a> </li><li>arxiv</li></ul> <img src="https://res.cloudinary.com/montaigne-io/image/upload/v1725329843/BE802AC2-8414-4747-88C9-718876F2D4DE.png" style="background-color:initial;max-width:min(100%,1124px);max-height:min(1562px);;background-image:url(https://res.cloudinary.com/montaigne-io/image/upload/v1725329843/BE802AC2-8414-4747-88C9-718876F2D4DE.png);height:auto;width:100%;object-fit:cover;background-size:cover;display:block;" width="1124" height="1562"> <span style="font-family: '.PingFangSC-Regular'"> 当前定制化文生图面临着一些挑战,包括很长的未微调时间、大的存储需求、所需多张输入图片以及在保证</span>id和可编辑性的不足。<span style="font-family: '.PingFangSC-Regular'">为了解决这些问题,文章提出</span>PhotoVerse,一种使用了具有对偶分支的作用于文本和图像域的条件机制。 <span style="font-family: '.PingFangSC-Regular'"> 此外,为了提高</span>id相似度,在训练时,模型使用了脸部的id loss。值得注意的是,PhotoVerse消除了测试时的微调,并且支持目标对象单张图片的输入。 <img src="https://res.cloudinary.com/montaigne-io/image/upload/v1725329843/5B37DFE9-98D6-4983-B553-2C730DA69165.png" style="background-color:initial;max-width:min(100%,1930px);max-height:min(1420px);;background-image:url(https://res.cloudinary.com/montaigne-io/image/upload/v1725329843/5B37DFE9-98D6-4983-B553-2C730DA69165.png);height:auto;width:100%;object-fit:cover;background-size:cover;display:block;" width="1930" height="1420"> - 数据:Fairface CelebA-HQ FFHQ - 指标:脸部ID相似度(使用人脸识别模型Arcface计算脸部特征的余弦相似度) - 硬件:1 V100/bs64 - 开源:<a href="https://photoverse2d.github.io/">https://photoverse2d.github.io/</a>(暂未开源)