aMUSEd是一个开源平台,提供各种自然语言处理(NLP)模型、数据集和工具。其中包括aMUSEd,一个基于MUSE的轻量级遮蔽图像模型(MIM),用于文本到图像的生成。相比于潜在扩散(lat...
Mini-Gemini是一个多模态视觉语言模型,支持从2B到34B的系列密集和MoE大型语言模型,同时具备图像理解、推理和生成能力。它基于LLaVA构建,利用双视觉编码器提供低分辨率视觉嵌入和高分辨率候选区域,采用补丁信息挖掘在高分辨率区域和低分辨率视觉查询之间进行补丁级挖掘,将文本与图像融合用于理解和生成任务。支持包括COCO、GQA、OCR-VQA、VisualGenome等多个视觉理解基准测试。
Paint3D能够为无纹理的3D网格生成高分辨率、无光照效果、多样化的2K UV纹理图,同时基于文本或图像输入进行条件化生成。它通过预训练的考虑深度信息的2D扩散模型首先生成视角条件图像并进行多视角纹理融合来获得初始的粗糙纹理图。然后它使用专门的UV补全和UVHD纹理模型来去除光照效果和填补不完整区域。Paint3D可以生成语义一致、无光照的高质量2K UV纹理,从而显著提升无纹理3D物体的纹理生成水平。
UIED用户体验学习平台是由UIED设计团队创建的专注于AIGC技术领域的学习平台。该平台旨在为希望深入了解AIGC和AI技术的设计师提供全面的教程、案例分析和实战项目。通过UIED,设计师可以学习AIGC工具的操作方法、探索AI在设计中的应用案例,并利用这些技术优化设计流程,提升创作质量。
Qdrant是一个开源的向量搜索数据库和向量搜索引擎,使用Rust语言编写。它提供了快速可扩展的向量相似性搜索服务,并具有方便的API。Qdrant可以与任何东西集成,是下一代AI应用中先进和高性能向量相似性搜索技术的基础。它是一个云原生的向量数据库,可以水平扩展,利用资源高效,完全使用Rust语言开发。Qdrant可以解决推荐系统、语义搜索、相似产品发现、反欺诈系统、人才匹配等业务场景。
Wirestock的Discord机器人是一个AI图像生成和销售工具,可在Discord上直接生成、提升和销售AI图像。它支持与Midjourney、Blue Willow等机器人的直接集成,可立即提升图像质量并将其发布到Wirestock以供销售或参与挑战。
GraphQL AI是为开发者提供的一站式AI平台。通过我们的AI开发者平台,轻松启动您的工具、机器人和聊天助手!您可以创建独立的上下文,使用各种图像生成模型创建出色的内容,还可以使用最新的AI算法训练聊天机器人。