简介
腾讯云语音合成(Tencent Cloud Text To Speech, TTS)是腾讯云推出的将文本转化为拟人化语音的AI服务,打通人机交互闭环,提供多场景、多语言的音色选择与自定义音色能力。

核心功能
- 多种合成方式:提供通用语音合成和长文本语音合成两类产品。通用语音合成包含三种方式——基础语音合成(非流式,整段合成后一次性下发)、实时语音合成(流式,一次性输入文本、流式返回音频)和流式文本语音合成(双向流式,支持大语言模型逐字输入场景)。长文本语音合成支持10万字以内的长文本音频合成,适用于有声阅读、新闻媒体等场景。
- 丰富音色选择:支持男女共46种声音效果。提供标准音色、精品音色、大模型音色及超自然大模型音色等不同品质层级。支持按需调节音量、语速(0.6倍至1.5倍可选)、采样率(8K/16K/24K)等参数。
- 多语言与语种支持:支持中文、英文、粤语、四川话等语言及方言。声音复刻能力支持中、英、日、韩等40+语种。
- 声音复刻与定制:提供声音复刻服务,基于客户上传的少量录音数据自动训练模型,定制发音人音色。支持一句话版声音复刻(训练语料5-15秒)和基础版声音复刻(需10-20分钟语料)两种类型。同时提供深度声音定制服务(CTTS),通过深度学习技术高效满足企业级定制需求。
- SSML标记语言支持:支持SSML标记语言,可精细化控制语音的停顿、重音、语调等合成效果。
产品优势
- 高拟真度:基于业界领先技术构建的语音合成系统,合成语音自然流畅、拟真度高。新一代合成产品可模拟多种情感和语气,情绪表现力强。
- 灵活配置:支持根据业务需求选择合适的音量、语速等属性。支持离线音频文件和实时音频流两种合成格式。对话式TTS主打超低延迟、拟人度高,支持声音克隆与多语种。
- 灵活计费模式:提供预付费和后付费两种计费模式,调用量扣费顺序为免费资源包>付费资源包>后付费。新用户可领取免费调用额度。
- 丰富生态集成:广泛应用于智能客服、有声阅读、新闻播报、人机交互等业务场景。与语音识别、自然语言处理等模块联动,打通人机交互闭环。
应用场景
- 智能客服与机器人发声:在客服机器人、服务机器人等场景中,与语音识别、自然语言处理等模块联动,实现高品质的机器人发声,使人机交互更流畅自然。
- 有声读物制作:将文本内容转化为高质量语音,适用于有声书、播客、音视频创作等场景。
- 新闻播报与资讯播报:移动APP语音播报新闻、资讯内容。声音复刻适用于资讯播报、短视频制作等场景。
- 智能助手与智能设备:智能设备语音提醒、智能助手语音交互。
- 车载导航:支持车载导航语音合成的个性化语音播报。
- 数字人与语音社交:声音复刻广泛适用于数字人、语音社交等场景。
使用教程
- 注册与开通服务:注册腾讯云账号并完成实名认证。登录语音合成控制台,开通语音合成服务。
- 获取API密钥:进入API密钥管理页面,新建密钥,生成AppID、SecretId和SecretKey,用于API调用时生成签名。
- 领取免费额度:在语音合成控制台领取免费调用额度。基础/精品音色免费额度为800万字符,大模型音色为10万字符,超自然大模型音色为2万字符。
- 选择接入方式:根据需求使用SDK或API进行接入,推荐使用SDK方式。
- 调用API接口:调用语音合成API接口,传入文本、指定音色ID等参数,获取合成音频数据。接口请求域名为tts.tencentcloudapi.com。
- 音色复刻(可选) :调用同步配音接口,传入待复刻的音频(建议10秒-20秒,仅包含单人清晰语音),获取复刻音色ID。
价格说明
腾讯云语音合成TTS提供预付费和后付费两种计费模式。
- 免费额度:基础/精品音色免费额度800万字符,大模型音色10万字符,超自然大模型音色2万字符。免费资源包自领取起三个月内有效,每个账号限领一次。
- 预付费资源包(字符包) :
- 通用语音合成-精品音色:1万字符包约210元(单价0.21元/万字符)
- 通用语音合成-大模型音色:100万字符包约100元(单价1元/万字符)
- 通用语音合成-超自然大模型音色:10万字符包约60元(单价6元/万字符)
- 长文本语音合成-大模型音色:50万字符包约140元(单价2.8元/万字符)
- 后付费:按实际使用量计费,计费周期为自然日。标准音色约0.125美元/万字符,精品音色约0.185美元/万字符。
- 并发叠加费用:在免费并发额度外进一步提升并发资源需额外付费,仅支持预付费。
- 资源包退款:预付费资源包若购买7天内无使用可申请退款,超过7天不予退款。
FAQ
Q1:腾讯语音合成由哪家公司开发和运营?
A:由腾讯云计算(北京)有限责任公司开发运营。
Q2:腾讯语音合成支持哪些语言?
A:支持中文、英文、粤语、四川话等。声音复刻支持中、英、日、韩等40+语种。
Q3:腾讯语音合成有哪些音色可以选择?
A:目前支持男女共46种声音效果。提供标准音色、精品音色、大模型音色及超自然大模型音色等不同品质层级。
Q4:腾讯语音合成如何收费?
A:提供预付费和后付费两种计费模式。新用户可领取免费调用额度。预付费资源包有效期1年,后付费按自然日计费。
Q5:腾讯语音合成支持哪些合成方式?
A:支持基础语音合成(非流式)、实时语音合成(流式)、流式文本语音合成(双向流式)和长文本语音合成(10万字以内)。
Q6:如何定制自己的音色?
A:通过声音复刻功能,上传少量录音数据(一句话版5-15秒,基础版10-20分钟)即可自动训练定制音色。
Q7:腾讯语音合成支持SSML吗?
A:支持SSML标记语言,可精细化控制语音的停顿、重音、语调等合成效果。
Q8:免费额度如何使用?
A:在语音合成控制台领取免费资源包,计费时优先扣减免费额度。基础/精品音色免费额度800万字符,大模型音色10万字符,超自然大模型音色2万字符。




