Denoising Vision Transformers

去噪视觉变换器（Denoising Vision Transformers，DVT）是一种针对视觉变换器（ViTs）的新型噪声模型。通过解剖ViT输出并引入可学习的去噪器，DVT能够提取无噪声的特征，从而在离线应用和在线功能中显著改善基于Transformer的模型的性能。DVT不需要重新训练现有的预训练ViTs，可立即应用于任何基于Transformer的架构。通过在多个数据集上进行广泛评估，我们发现DVT在语义和几何任务中持续显著改善现有的最先进通用模型（例如，+3.84 mIoU）。我们希望我们的研究能够鼓励重新评估ViT设计，特别是关于位置嵌入的天真使用。

数据统计

相关导航

face-to-sticke

face-to-sticke是一个在线工具，可以将人脸照片转换为贴纸。用户可以上传一个人物照片，然后调整参数生成不同风格的贴纸。这款产品简单易用，可以用于制作个性化的贴纸表情包等。目前免费使用。

AI Image Generator

AI图像生成器是一个AI图像Chrome插件，可以帮助您通过简单的提示快速创建漂亮的AI动漫图像。您甚至可以通过设置3D模型的姿势来创建特定姿势的AI图像。无论您是动漫迷、插画师还是创意作家，我们的工具都为您提供了无限的创作可能性。通过几个简单的步骤，您可以轻松设计各种姿势的角色，并将您的想象角色栩栩如生。

Cartoonify

Cartoonify是一款提供AI视频和图像处理工具的网站，其中包括视频编辑、字幕生成、表情包制作、视频裁剪等功能。其中的Cartoonify项目是一个基于人工智能的图片转换为手绘卡通风格的实验项目，用户可以上传图片并获得卡通风格的输出。由于服务器成本上升，该项目于2023年停止运营，但很多功能已经整合到Cartoonify的主要产品中。

GLEE

GLEE 是一个针对图片和视频的通用对象基础模型，通过统一的框架实现了定位和识别图像和视频中的对象，并能应用于各种对象感知任务。GLEE 通过联合训练来自不同监督水平的各种数据源，形成通用的对象表示，在保持最先进性能的同时，能够有效地进行零样本迁移和泛化。它还具备良好的可扩展性和鲁棒性。

Bookmarks Ninja

Image Search是一个在线图像搜索工具，您可以通过上传图像进行搜索。它具有快速高效的搜索引擎和准确的搜索结果。无论您想要找到相似的图片、识别图片中的物体，还是查找特定主题的图片，Image Search都可以帮助您。

SIGNeRF

SIGNeRF是一种用于快速和可控的NeRF场景编辑以及场景集成对象生成的新方法。它引入了一种新的生成更新策略，确保在编辑图像时保持3D一致性，而无需进行迭代优化。SIGNeRF利用了ControlNet的深度条件图像扩散模型的优势，通过几个简单的步骤在单个前向传递中编辑现有的NeRF场景。它可以生成新的对象到现有的NeRF场景中，也可以编辑已存在的对象，从而实现对场景的精确控制。

暂无评论

暂无评论...

Denoising Vision Transformers翻译站点

数据统计

相关导航

暂无评论

热门网址

热门标签