MGIE(多模态大语言模型引导的编辑)是一项由苹果开源的技术,利用多模态大型语言模型(MLLMs)生成图像编辑指令,通过端到端训练,捕捉视觉想象力并执行图像处理操作,使图像编辑...
TestDalkey是一个测试Dalle-3模型的网站。它允许用户以2美元的价格获得2张高清图像,并将其保存在网站上。这些图像可以用于商业用途,并提供免费客户支持。
Anthropic Cookbook提供代码和指南,旨在帮助开发者使用Claude构建项目,提供可复制的代码片段,易于集成到您自己的项目中。这些示例主要用Python编写,但概念可以适应任何支持与Anthropic API交互的编程语言。
Pixel-Aware Stable Diffusion(PASD)旨在实现真实图像超分辨率和个性化风格化。通过引入像素感知交叉注意力模块,PASD使得扩散模型能够以像素级别感知图像局部结构,同时利用降级去除模块提取降级不敏感特征,与图像高层信息一起引导扩散过程。PASD可轻松集成到现有的扩散模型中,如稳定扩散。在真实图像超分辨率和个性化风格化方面的实验验证了我们提出的方法的有效性。
Remove-BG.AI是一款基于AI技术的图片背景去除工具。它可以快速、免费地去除图片的背景,并支持编辑背景、调整图片大小、添加文本等功能。无需专业技能,即可轻松处理图片。
UniVG是一款统一多模态视频生成系统,能够处理多种视频生成任务,包括文本和图像模态。通过引入多条件交叉注意力和偏置高斯噪声,实现了高自由度和低自由度视频生成。在公共学术基准MSR-VTT上实现了最低的Fr'echet视频距离(FVD),超越了当前开源方法在人类评估上的表现,并与当前闭源方法Gen2不相上下。
Imagifly是一款用于简化AI图像生成的应用,用户可以创建和保存提示,然后将这些提示粘贴到Midjourney、Dall-E或Photoshop等AI工具中。该应用提供了简化的提示功能,让用户在创建新提示时即时访问其关键词库。此外,用户还可以保存发现的能产生出色图像的提示,以及创建一个有组织的常用关键词库。Imagifly旨在提供便捷的AI图像生成体验。