<ul class="dashed" data-apple-notes-indent-amount="0"><li><span style="font-family: '.PingFangUITextSC-Regular'">文章标题:</span>What the DAAM: Interpreting Stable Diffusion Using Cross Attention</li><li><span style="font-family: '.PingFangSC-Regular'">文章地址:</span><a href="https://arxiv.org/abs/2210.04885">https://arxiv.org/abs/2210.04885</a> </li><li>ACL 2023</li></ul> <img src="https://res.cloudinary.com/montaigne-io/image/upload/v1734429065/0AB52B39-3DF4-4F36-9E1F-888ED53378D3.png" style="background-color:initial;max-width:min(100%,1110px);max-height:min(566px);;background-image:url(https://res.cloudinary.com/montaigne-io/image/upload/v1734429065/0AB52B39-3DF4-4F36-9E1F-888ED53378D3.png);height:auto;width:100%;object-fit:cover;background-size:cover;display:block;" width="1110" height="566"><ul class="dashed" data-apple-notes-indent-amount="0"><li></li></ul> 该文章比较老,属于是对SD进行可解释性分析的一个工作。 文章对SD中的cross-attention map进行了分析,发现了其反映了生成图像的像素与文本单词的对应关系,并发现了共同下义词的重合问题与形容词的广泛问题。 可以利用该文章的开源代码进行文生图的热力图分析。 地址:<a href="https://github.com/castorini/daam">https://github.com/castorini/daam</a>