MusicLM是一个模型,可以根据文本描述生成高保真音乐。它可以生成24kHz的音频,音乐风格和文本描述一致,并支持根据旋律进行条件生成。通过使用MusicCaps数据集,模型在音频质量和与文本描述的一致性方面优于之前的系统。MusicLM可以应用于不同的场景,如生成音乐片段、根据画作描述生成音乐等。