该代码仓库包含从合成图像数据(主要是图片)进行学习的研究,包括StableRep、Scaling和SynCLR三个项目。这些项目研究了如何利用文本到图像模型生成的合成图像数据进行视觉表示模型的...
Depthify.ai是一个工具,可以将RGB图像转换为与Apple Vision Pro和Meta Quest兼容的各种空间格式。通过转换RGB图像为空间照片,可以为各种计算机视觉和3D建模应用提供支持。它可以生成深度图、立体图像和HEIC文件,可在Apple Vision Pro上使用。
img2img-turbo是一个开源项目,它是对原始img2img项目的改进,旨在提供更快的图像到图像转换速度。该项目使用了先进的深度学习技术,能够处理各种图像转换任务,如风格迁移、图像着色、图像修复等。
美图AI开放平台专注于人脸技术、人体技术、图像识别、图像处理、图像生成等核心领域,为客户提供经市场验证的专业AI算法服务和解决方案。平台提供人脸技术、人体技术、图像识别、图像处理、图像生成等多种图像AI服务,支持Web API、Mobile SDK等多种接入方式,可应用于企业服务、美妆门店、医疗美容、智能硬件等多个行业场景,帮助企业快速进行图像AI能力打通和应用。
OnlyFakes是一款免费的AI图片生成器,使用先进的深度学习技术生成从逼真的图像到Hentai到引人注目的数字艺术的图片。用户可以自由发挥创造力,无需注册即可使用。支持生成各种风格和类型的图片,包括写实、动漫和数字艺术等。同时,用户可以浏览和分享社区中的图片。
MDT通过引入掩码潜在模型方案来显式增强扩散概率模型(DPMs)在图像中对象部分之间关系学习的能力。MDT在训练期间在潜在空间中操作,掩蔽某些标记,然后设计一个不对称的扩散变换器来从未掩蔽的标记中预测掩蔽的标记,同时保持扩散生成过程。MDTv2进一步通过更有效的宏网络结构和训练策略提高了MDT的性能。
Open-Sora-Plan是一个开源项目,旨在为开源社区提供高质量的视频数据集。该项目已经爬取并处理了40258个来自开源网站的高质量视频,涵盖了60%的横屏视频。同时还提供了自动生成的密集字幕,供机器学习等应用使用。该项目免费开源,欢迎大家共同参与和支持。