MetaVoice-1B是一个1.2B参数的语音合成基础模型,通过训练10万小时的语音数据而成。它具有以下特点:支持英语情感语调和语气;支持语音克隆;少量数据(1分钟内)就可实现印度语音克隆;无参克隆美式和英式语音(30秒音频);支持长文本语音合成。我们在Apache 2.0许可下免费开源这个模型,可以无限制使用。
数据统计
相关导航
Stable Diffusion WebUI Forge
Stable Diffusion WebUI Forge基于Stable Diffusion WebUI和Gradio开发,旨在优化资源管理、加速推理。相比原版WebUI在1024px分辨率下的SDXL推理,Forge可提升30-75%的速度,最大分辨率提升2-3倍,最大batch size提升4-6倍。Forge保持了原版WebUI的所有功能,同时新增了DDPM、DPM++、LCM等采样器,实现了Free U、SVD、Zero123等算法。使用Forge的UNet Patcher,开发者可以用极少的代码实现算法。Forge还优化了控制网络的使用,实现真正的零内存占用调用。
暂无评论...