aAMUSEd - PROMPT

aMUSEd是一个开源平台，提供各种自然语言处理（NLP）模型、数据集和工具。其中包括aMUSEd，一个基于MUSE的轻量级遮蔽图像模型（MIM），用于文本到图像的生成。相比于潜在扩散（latent diffusion），MIM需要更少的推理步骤并且更易解释。此外，MIM可以通过仅有一张图片进行微调以学习额外的风格。aMUSEd还提供了两个模型的检查点，可以直接生成256x256和512x512分辨率的图像。

数据统计

相关导航

MiniGemini

Mini-Gemini是一个多模态视觉语言模型,支持从2B到34B的系列密集和MoE大型语言模型,同时具备图像理解、推理和生成能力。它基于LLaVA构建,利用双视觉编码器提供低分辨率视觉嵌入和高分辨率候选区域,采用补丁信息挖掘在高分辨率区域和低分辨率视觉查询之间进行补丁级挖掘,将文本与图像融合用于理解和生成任务。支持包括COCO、GQA、OCR-VQA、VisualGenome等多个视觉理解基准测试。

Paint3D

Paint3D能够为无纹理的3D网格生成高分辨率、无光照效果、多样化的2K UV纹理图,同时基于文本或图像输入进行条件化生成。它通过预训练的考虑深度信息的2D扩散模型首先生成视角条件图像并进行多视角纹理融合来获得初始的粗糙纹理图。然后它使用专门的UV补全和UVHD纹理模型来去除光照效果和填补不完整区域。Paint3D可以生成语义一致、无光照的高质量2K UV纹理,从而显著提升无纹理3D物体的纹理生成水平。

UIED-用户体验学习平台

UIED用户体验学习平台是由UIED设计团队创建的专注于AIGC技术领域的学习平台。该平台旨在为希望深入了解AIGC和AI技术的设计师提供全面的教程、案例分析和实战项目。通过UIED，设计师可以学习AIGC工具的操作方法、探索AI在设计中的应用案例，并利用这些技术优化设计流程，提升创作质量。

Qdrant

Qdrant是一个开源的向量搜索数据库和向量搜索引擎,使用Rust语言编写。它提供了快速可扩展的向量相似性搜索服务,并具有方便的API。Qdrant可以与任何东西集成,是下一代AI应用中先进和高性能向量相似性搜索技术的基础。它是一个云原生的向量数据库,可以水平扩展,利用资源高效,完全使用Rust语言开发。Qdrant可以解决推荐系统、语义搜索、相似产品发现、反欺诈系统、人才匹配等业务场景。