AI音频工具AI语音合成

腾讯云语音合成

语音合成系列产品可以将文本转化为超拟人化的语音,打通人机交互闭环。提供丰富的平台音色选择,且支持用户自定义音色,满足多样化的声音需求。新一代合成产品可模拟多种情感和语...

标签:
Seko
LibTVLibTVLibTV

简介

腾讯云语音合成(Tencent Cloud Text To Speech, TTS)是腾讯云推出的将文本转化为拟人化语音的AI服务,打通人机交互闭环,提供多场景、多语言的音色选择与自定义音色能力

腾讯云语音合成

核心功能

  • 多种合成方式:提供通用语音合成和长文本语音合成两类产品。通用语音合成包含三种方式——基础语音合成(非流式,整段合成后一次性下发)、实时语音合成(流式,一次性输入文本、流式返回音频)和流式文本语音合成(双向流式,支持大语言模型逐字输入场景)。长文本语音合成支持10万字以内的长文本音频合成,适用于有声阅读、新闻媒体等场景
  • 丰富音色选择:支持男女共46种声音效果。提供标准音色、精品音色、大模型音色及超自然大模型音色等不同品质层级。支持按需调节音量、语速(0.6倍至1.5倍可选)、采样率(8K/16K/24K)等参数
  • 多语言与语种支持:支持中文、英文、粤语、四川话等语言及方言。声音复刻能力支持中、英、日、韩等40+语种
  • 声音复刻与定制:提供声音复刻服务,基于客户上传的少量录音数据自动训练模型,定制发音人音色。支持一句话版声音复刻(训练语料5-15秒)和基础版声音复刻(需10-20分钟语料)两种类型。同时提供深度声音定制服务(CTTS),通过深度学习技术高效满足企业级定制需求
  • SSML标记语言支持:支持SSML标记语言,可精细化控制语音的停顿、重音、语调等合成效果

产品优势

  • 高拟真度:基于业界领先技术构建的语音合成系统,合成语音自然流畅、拟真度高。新一代合成产品可模拟多种情感和语气,情绪表现力强
  • 灵活配置:支持根据业务需求选择合适的音量、语速等属性。支持离线音频文件和实时音频流两种合成格式。对话式TTS主打超低延迟、拟人度高,支持声音克隆与多语种
  • 灵活计费模式:提供预付费和后付费两种计费模式,调用量扣费顺序为免费资源包>付费资源包>后付费。新用户可领取免费调用额度
  • 丰富生态集成:广泛应用于智能客服、有声阅读、新闻播报、人机交互等业务场景。与语音识别、自然语言处理等模块联动,打通人机交互闭环

应用场景

  • 智能客服与机器人发声:在客服机器人、服务机器人等场景中,与语音识别、自然语言处理等模块联动,实现高品质的机器人发声,使人机交互更流畅自然
  • 有声读物制作:将文本内容转化为高质量语音,适用于有声书、播客、音视频创作等场景
  • 新闻播报与资讯播报:移动APP语音播报新闻、资讯内容。声音复刻适用于资讯播报、短视频制作等场景
  • 智能助手与智能设备:智能设备语音提醒、智能助手语音交互
  • 车载导航:支持车载导航语音合成的个性化语音播报
  • 数字人与语音社交:声音复刻广泛适用于数字人、语音社交等场景

使用教程

  1. 注册与开通服务:注册腾讯云账号并完成实名认证。登录语音合成控制台,开通语音合成服务
  2. 获取API密钥:进入API密钥管理页面,新建密钥,生成AppID、SecretId和SecretKey,用于API调用时生成签名
  3. 领取免费额度:在语音合成控制台领取免费调用额度。基础/精品音色免费额度为800万字符,大模型音色为10万字符,超自然大模型音色为2万字符
  4. 选择接入方式:根据需求使用SDK或API进行接入,推荐使用SDK方式
  5. 调用API接口:调用语音合成API接口,传入文本、指定音色ID等参数,获取合成音频数据。接口请求域名为tts.tencentcloudapi.com
  6. 音色复刻(可选) :调用同步配音接口,传入待复刻的音频(建议10秒-20秒,仅包含单人清晰语音),获取复刻音色ID

价格说明

腾讯云语音合成TTS提供预付费和后付费两种计费模式

  • 免费额度:基础/精品音色免费额度800万字符,大模型音色10万字符,超自然大模型音色2万字符。免费资源包自领取起三个月内有效,每个账号限领一次
  • 预付费资源包(字符包) :
    • 通用语音合成-精品音色:1万字符包约210元(单价0.21元/万字符)
    • 通用语音合成-大模型音色:100万字符包约100元(单价1元/万字符)
    • 通用语音合成-超自然大模型音色:10万字符包约60元(单价6元/万字符)
    • 长文本语音合成-大模型音色:50万字符包约140元(单价2.8元/万字符)
  • 后付费:按实际使用量计费,计费周期为自然日。标准音色约0.125美元/万字符,精品音色约0.185美元/万字符
  • 并发叠加费用:在免费并发额度外进一步提升并发资源需额外付费,仅支持预付费
  • 资源包退款:预付费资源包若购买7天内无使用可申请退款,超过7天不予退款

FAQ

Q1:腾讯语音合成由哪家公司开发和运营?

A:由腾讯云计算(北京)有限责任公司开发运营。

Q2:腾讯语音合成支持哪些语言?

A:支持中文、英文、粤语、四川话等。声音复刻支持中、英、日、韩等40+语种

Q3:腾讯语音合成有哪些音色可以选择?

A:目前支持男女共46种声音效果。提供标准音色、精品音色、大模型音色及超自然大模型音色等不同品质层级

Q4:腾讯语音合成如何收费?

A:提供预付费和后付费两种计费模式。新用户可领取免费调用额度。预付费资源包有效期1年,后付费按自然日计费

Q5:腾讯语音合成支持哪些合成方式?

A:支持基础语音合成(非流式)、实时语音合成(流式)、流式文本语音合成(双向流式)和长文本语音合成(10万字以内)

Q6:如何定制自己的音色?

A:通过声音复刻功能,上传少量录音数据(一句话版5-15秒,基础版10-20分钟)即可自动训练定制音色

Q7:腾讯语音合成支持SSML吗?

A:支持SSML标记语言,可精细化控制语音的停顿、重音、语调等合成效果

Q8:免费额度如何使用?

A:在语音合成控制台领取免费资源包,计费时优先扣减免费额度。基础/精品音色免费额度800万字符,大模型音色10万字符,超自然大模型音色2万字符

数据统计

相关导航