IP-Adapter是图像提示适配器,用于预训练的文本到图像扩散模型,以实现使用图像提示生成图像的能力。
IP-Adapter通过解耦的交叉注意力机制,将交叉注意力层分离为文本特征和图像特征,实现了图像提示的能力。
相比于text-to-image方法,IP-Adapter具有更小的参数量(22M参数),并且不需要进行大规模的微调。
此外,IP-Adapter还具有良好的泛化能力,可以与文本提示兼容,实现多模态图像生成。
\”IP-Adapter不仅可用于自定义模型,还与现有的可控工具兼容,可实现文本提示和图像提示的多模态图像生成。\”
IP-Adapter 使用图像作为prompt
出自:https://mp.weixin.qq.com/s/_KBiqIt1y8MCMAxTnW4AkA
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...