LayerDiffusion

LayerDiffusion 是一种使大规模预训练潜在扩散模型能够生成透明图像的方法。该方法允许生成单个透明图像或多个透明图层。它学习了一种 “潜在透明度”，将 Alpha 通道透明度编码到预训练潜在扩散模型的潜在空间中。通过将添加的透明度调节为潜在偏移，最小程度地改变预训练模型的原始潜在分布，以保留大型扩散模型的生产就绪质量。通过调整潜在空间对其进行微调，可以将任何潜在扩散模型转换为透明图像生成器。我们使用人机协作收集的 100 万个透明图像层对对模型进行训练。我们展示了潜在透明度可以应用于不同的开源图像生成器，或者适应于各种条件控制系统，实现前景 / 背景条件图层生成，联合图层生成，图层内容结构控制等应用。用户研究发现，在大多数情况下（97%），用户更喜欢我们本地生成的透明内容，而不是之前的临时解决方案，比如生成然后抠图。用户还报告说，我们生成的透明图像的质量与 Adobe Stock 等真实商业透明资产相媲美。

数据统计

相关导航

Snapby AI

Snapby AI是一款AI生成图片工具,可以通过文字描述生成高质量、可定制的图片,无需担心版权问题。支持生成卡通、动漫等创意图片,也可生成逼真的人像。用户可自定义图片中的人物属性、场景元素等细节。 Snapby AI可广泛应用于内容创作、广告设计等领域,有效提高工作效率。

CosXL

Cos Stable Diffusion XL 1.0 Base调整为使用余弦连续EDM VPred调度。最重要的特性是其产生从纯黑到纯白的全色彩范围图像，同时对图像每一步的变化率进行了更细微的改进。 Edit Stable Diffusion XL 1.0 Base调整为使用余弦连续EDM VPred调度，并升级为执行图像编辑。此模型以源图像和提示作为输入，将提示解释为如何改变图像的指令。定价：免费使用。定位：用于生成艺术品、设计等创意过程中，在教育或创意工具中的应用，研究生成模型，部署具有生成有害内容潜力的模型，探究理解生成模型的局限性和偏见。

ActAnywhere

ActAnywhere是一个用于自动生成与前景主体运动和外观相符的视频背景的生成模型。该任务涉及合成与前景主体运动和外观相一致的背景,同时也符合艺术家的创作意图。ActAnywhere利用大规模视频扩散模型的力量,并专门定制用于此任务。ActAnywhere以一系列前景主体分割作为输入,以描述所需场景的图像作为条件,生成与条件帧相一致的连贯视频,同时实现现实的前景和背景交互。该模型在大规模人机交互视频数据集上进行训练。大量评估表明该模型的性能明显优于基准,可以泛化到各种分布样本,包括非人类主体。