<ul class="dashed" data-apple-notes-indent-amount="0"><li><span style="font-family: '.PingFangUITextSC-Regular'">文章标题:</span>FreeU: Free Lunch in Diffusion U-Net</li><li><span style="font-family: '.PingFangSC-Regular'">文章地址:</span><a href="https://arxiv.org/abs/2309.11497">https://arxiv.org/abs/2309.11497</a> </li><li>CVPR 2024</li></ul> <img src="https://res.cloudinary.com/montaigne-io/image/upload/v1731124475/CFD925A1-F10B-477B-9C24-9EC80F8A20AF.png" style="background-color:initial;max-width:min(100%,2352px);max-height:min(1242px);;background-image:url(https://res.cloudinary.com/montaigne-io/image/upload/v1731124475/CFD925A1-F10B-477B-9C24-9EC80F8A20AF.png);height:auto;width:100%;object-fit:cover;background-size:cover;display:block;" width="2352" height="1242"><ul class="dashed" data-apple-notes-indent-amount="0"><li></li></ul> 文章通过对去噪过程的图像进行分析,发现低频段图像变化比较平缓,而高频段部分变化比较强烈,从而作者对UNet的结构进行了分析,发现backbone的特征对去噪过程做出主要贡献,而跨连接的特征对图像去噪的贡献比较微弱,并且在推理时,跨连接的特征可能会对去噪过程造成负面影响。基于此观察,作者提出了一个可以无需任何代价就可以提升生成图像质量的方法FreeU,其简单来说就是对backbone的特征和skip连接的特征之间的权重调整一下,就能够实现生成图像质量的提升。 <img src="https://res.cloudinary.com/montaigne-io/image/upload/v1731125212/0D3EC512-3057-420C-9698-9C111F46231B.png" style="background-color:initial;max-width:min(100%,2348px);max-height:min(1060px);;background-image:url(https://res.cloudinary.com/montaigne-io/image/upload/v1731125212/0D3EC512-3057-420C-9698-9C111F46231B.png);height:auto;width:100%;object-fit:cover;background-size:cover;display:block;" width="2348" height="1060"> <ul class="dashed" data-apple-notes-indent-amount="0"><li>开源:<a href="https://chenyangsi.top/FreeU/">https://chenyangsi.top/FreeU/</a> </li></ul>