<ul class="dashed" data-apple-notes-indent-amount="0"><li><span style="font-family: '.PingFangSC-Regular'">文章标题:</span>An Image is Worth One Word: Personalizing Text-to-Image Generation using Textual Inversion</li><li><span style="font-family: '.PingFangSC-Regular'">文章地址:</span><a href="https://arxiv.org/abs/2208.01618">https://arxiv.org/abs/2208.01618</a> </li><li>ICLR 2023</li></ul> <img src="https://res.cloudinary.com/montaigne-io/image/upload/v1724663535/7EA4A07A-A7B2-4A9A-9795-E74BB794E820.png" style="background-color:initial;max-width:min(100%,2128px);max-height:min(1468px);;background-image:url(https://res.cloudinary.com/montaigne-io/image/upload/v1724663535/7EA4A07A-A7B2-4A9A-9795-E74BB794E820.png);height:auto;width:100%;object-fit:cover;background-size:cover;display:block;" width="2128" height="1468"> 利用图片进行定制化文生图的开山之作。 现有的文生图没办法生成自己想要的某个对象的图片,文章提出了一种方法,用户提供3-5张特定对象的图片,学习该对象在embedding空间的值,对应词S*,从而用户可以使用S*来表达该特定的对象。并且文章指出,仅使用一个词来代表一个特定对象是足够的。方法非常简单有效,就是训练了一个embedding。 <img src="https://res.cloudinary.com/montaigne-io/image/upload/v1724664150/43752DB6-BEF3-43BF-804F-29B8E327850A.png" style="background-color:initial;max-width:min(100%,2162px);max-height:min(1240px);;background-image:url(https://res.cloudinary.com/montaigne-io/image/upload/v1724664150/43752DB6-BEF3-43BF-804F-29B8E327850A.png);height:auto;width:100%;object-fit:cover;background-size:cover;display:block;" width="2162" height="1240">