Audiobox是Meta的新一代音频生成研究模型,可以利用语音输入和自然语言文本提示生成声音和音效,轻松为各种用例创建定制音频。Audiobox系列模型还包括专业模型Audiobox Speech和Audiobox Sound,所有Audiobox模型都是基于共享的自监督模型Audiobox SSL构建的。