Elmo是一款AI网络副驾驶,作为Chrome扩展程序,能够将网页内容即时压缩成简洁的摘要,提供具体问题的答案,从网页中获取相关信息,并与PDF和YouTube视频进行互动,以增强用户的生...
PhotoStyleAI是一款先进的AI风格转换和滤镜工具,可以轻松地将您的照片、图像和视频进行转换。它提供了多种风格选项,可以将照片转换成不同的艺术风格,如印象派、油画、卡通等。它还具有PS2 AI Filter功能,可以将照片转换成类似于PS2游戏的风格。PhotoStyleAI非常易于使用,只需上传您的照片,选择风格或添加滤镜,然后点击编辑即可。
MakeMyWeb 是一款人工智能驱动的网站设计工具,根据用户的业务目标和流量趋势全天优化网站,提供专业特定的可选布局,可编辑的页面部分,以及免费和付费的不同版本,满足不同用户的需求。
OPT2I是一个T2I优化框架,利用大型语言模型(LLM)提高提示-图像一致性。通过迭代生成修订后的提示,优化生成过程。能显著提高一致性得分,同时保持FID并增加生成数据与真实数据召回率。
EMAGE是一种统一的整体共话手势生成模型,通过表情丰富的掩蔽音频手势建模来生成自然的手势动作。它可以从音频输入中捕捉语音和韵律信息,并生成相应的身体姿势和手势动作序列。EMAGE能够生成高度动态和表现力丰富的手势,从而增强虚拟人物的互动体验。
Open-Sora-Plan是一个开源项目,旨在为开源社区提供高质量的视频数据集。该项目已经爬取并处理了40258个来自开源网站的高质量视频,涵盖了60%的横屏视频。同时还提供了自动生成的密集字幕,供机器学习等应用使用。该项目免费开源,欢迎大家共同参与和支持。
Hand Talk App利用人工智能自动将文本和音频翻译成美国手语(ASL)和巴西手语(Libras)。这款应用被联合国选为“世界上最佳的社交应用”,旨在帮助世界上4.66亿聋人和重听人士通过技术和交流更好地融入社会。该平台自在巴西推出Hand Talk插件以来,已翻译了近20亿个单词。