Textation是一款智能AI聊天助手,提供实时文本和语音通话功能,能够创建可定制的虚拟角色,并通过互动故事情节,使对话更加生动有趣。产品完全保护用户的隐私,支持创建多个角色,...
Karlo是一款AI图像生成工具,能够通过文字生成想象中的图像。它采用Kakao Brain独特的图像生成模型,为您的艺术之旅提供支持。Karlo可以帮助您激发创意,生成令人印象深刻的AI图像。定价和定位请参考官方网站。
Mini-Gemini是一个多模态视觉语言模型,支持从2B到34B的系列密集和MoE大型语言模型,同时具备图像理解、推理和生成能力。它基于LLaVA构建,利用双视觉编码器提供低分辨率视觉嵌入和高分辨率候选区域,采用补丁信息挖掘在高分辨率区域和低分辨率视觉查询之间进行补丁级挖掘,将文本与图像融合用于理解和生成任务。支持包括COCO、GQA、OCR-VQA、VisualGenome等多个视觉理解基准测试。
W.A.L.T是一个基于transformer的实景视频生成方法,通过联合压缩图像和视频到一个统一的潜在空间,实现跨模态的训练和生成。它使用了窗注意力机制来提高内存和训练效率。该方法在多个视频和图像生成基准测试上取得了最先进的性能。
Bigjpg 是一款使用人工智能深度卷积神经网络(CNN)的图片无损放大工具。它可以将图片放大到 4K 级超高清分辨率,最大可放大 32 倍。通过 Bigjpg,用户可以轻松将低分辨率图片放大至高清或超高清,同时保持图片细节清晰,效果优于传统放大工具如 PhotoZoom。
ArtKey是一个内容平台,为Midjourney艺术家提供prompt提示词。汇集了世界各地的优秀创作者,支持多个版本,用户可以自主发布提示词或解锁其他用户发布的提示词,更高效地支持社区用户共享、交易。拥有丰富的高质量prompt库,能够激发艺术家们出色的创造力。
InteraxAI是一个无代码白标平台,提供可监控和可嵌入的AI小组件,无需编写任何代码。它允许无缝集成AI功能如文本补全、聊天机器人、图像生成等到网站、博客或SaaS平台中,开发者可以通过配置API和定制样式来 DIY AI小组件,同时可以通过会员计划或按使用次数收费来获利。关键词:聊天机器人、文本生成、图像生成、无代码、SaaS、API、嵌入式。