大模型大模型服务平台

TokenHub|腾讯云

TokenHub是腾讯云推出的一站式大模型服务平台,由原MaaS(Model as a Service)平台于2026年3月正式升级而来。平台致力于为企业和开发者提供统一的大模型服务入口,整合腾讯自研的...

标签:

TokenHub是腾讯云推出的一站式大模型服务平台,由原MaaS(Model as a Service)平台于2026年3月正式升级而来。平台致力于为企业和开发者提供统一的大模型服务入口,整合腾讯自研的混元大模型能力,并引入DeepSeek、智谱GLM、Kimi、MiniMax、通义千问等多家行业领先的第三方主流模型,覆盖通用对话、深度推理、代码生成、视觉理解、图像生成、视频生成及3D生成等多类场景。平台支持按量调用、保障型资源、专属部署等多种服务模式,并提供兼容OpenAI协议的API接口,一个API Key即可接入全模型

TokenHub|腾讯云

技术特点

  • 统一API接入架构:平台聚合多家主力大模型至同一入口,开发者以一个API Key调用平台全部语言模型与多模态能力,无需多平台多账号管理,显著降低多模型集成的技术复杂度
  • 双协议兼容:完全兼容OpenAI API与Anthropic API协议,已使用OpenAI SDK的项目仅需修改base_url和API Key即可无缝接入,业务代码几乎无需改动。兼容能力贯穿全部语言模型和多模态接口,覆盖Python、Node.js、Java、Go等主流语言生态
  • 多模型差异化解耦:平台采用积木式设计理念,将不同模型的独立定价、上下文窗口、能力支持差异透明化,开发者可根据任务场景在统一接口下灵活切换模型,实现能力选型与成本控制的最佳平衡
  • 高性能推理优化:依托多元芯片适配、训推潮汐调度、FlexKV分布式缓存等推理优化技术,平台整体算力利用率显著提升,缓存命中率大幅提高,有效降低Agent推理成本
  • Prompt Cache机制:支持请求级缓存标识,当多个请求前缀相同时复用KV缓存数据,缓存命中输入Token享受更低单价,针对长system prompt和多轮工具调用等Agent高消耗场景实现成本优化
  • 精细化权限与安全控制:支持API Key级别配置可访问模型范围、独占额度、总额度上限及TPM限制,实现多团队、多业务线下的精细化权限与用量管理

主要功能

  • 模型广场:汇聚多家厂商的主力大模型,支持按类型、服务商、体验状态等多维度筛选、模型对比和详细信息查看,帮助用户快速选择合适的模型使用。平台当前已上架18款语言模型,覆盖混元系列、DeepSeek系列、智谱GLM系列、Kimi系列、MiniMax系列及Qwen系列
  • 体验中心:支持在线体验大模型能力,涵盖文本对话(深度思考、流式输出)、图片生成(多风格、多尺寸)、视频生成及3D生成,便于用户在接入API之前充分评估模型效果
  • 在线推理与API调用:创建并管理模型的推理服务实例,获取专属API Endpoint。支持按需选择计费方式——免费体验、按Token计费,满足从测试验证到生产部署的全阶段需求。平台同时支持在线实时推理与离线批量推理两类任务模式
  • Prompt Cache缓存:平台提供请求级缓存功能,支持多种主流模型的Cache缓存调用,缓存命中价格较常规输入价格显著降低,适用于长上下文中高频前缀复用场景
  • API Key集中管理:集中管理API访问密钥,支持精细化的权限控制(全部模型及服务或限定范围),实现便捷的启停切换和调用统计,保障接口调用的安全性与可控性
  • 模型监控与用量统计:展示模型与服务性能相关指标(TTFT、TPOT、RPM等)以及计费用量指标(输入Token、输出Token、TPM、插件调用次数等)
  • Token Plan企业套餐:面向企业级场景的专属订阅套餐。提供专业套餐(积分池模式,多模型可选,各模型不同单价从积分池实时扣减)与轻享套餐(Token池模式,采用Auto智能路由自动选最优模型,2元/百万Tokens刊例价)两类方案
  • AI创作与智能创作Agent:视频特效中心展示海量创意视频特效模板,支持一键复刻爆款同款和API灵活调用。平台提供智能创作Agent,依托腾讯混元大模型实现“描述即生成”,覆盖短视频制作、微短剧、品牌营销、虚拟人运营等核心创作场景
  • 批量推理:支持以API形式发起批量推理任务,适用于离线大批量处理场景,计费规则与在线推理独立,有效降低大规模批量调用的单位成本

适用场景

  • 多模型对比与方案选型:企业在同一环境中对多款主流模型进行同步压测,直观比较同等任务下的输出质量、延迟及成本,辅助技术决策和模型选型
  • 企业级AI应用开发:企业可利用平台的一站式能力快速构建智能客服、电商推荐、政务办公等场景的AI应用,整合混元、DeepSeek、GLM等模型满足不同业务需求
  • AI编程与开发者工具集成:支持CodeBuddy、Claude Code、Cursor等主流AI编程工具集成,以及OpenClaw等原生化场景实现办公自动化,适用于开发者日常代码生成、调试、SQL优化及技术文档撰写
  • 智能Agent开发与部署:依托TokenHub的模型能力与Prompt Cache优化,为Agent类应用提供长system prompt复用、多轮工具调用和上下文管理能力,降低Agent推理成本
  • 内容创作与视觉生成:面向短视频博主、微短剧团队、品牌运营和虚拟人IP工作室,通过视频特效智能体实现“描述即生成”,支持文生视频、图生视频、视频特效模板一键复刻,覆盖从脚本到成片的完整链路
  • 科研与教育培训:高校及科研院所利用平台多模型资源开展AI研究和教学实践,通过新用户免费体验额度零成本验证模型能力
  • 多模态应用开发:基于平台图像生成、视频生成、3D生成能力,开发广告创意、虚拟人、产品展示等多模态应用场景
  • 长文本处理与深度推理:依托DeepSeek-V4-Pro的百万级上下文窗口和384k最大输出能力,适用于长文档审阅、整库代码理解、多轮Agent任务等长记忆需求;利用Hy3 preview的深度思考能力,适应复杂推理与长Context指令遵循场景
  • 国产化模型统一接入:面向需要统一集成多家国产大模型的企业,通过一个API Key接入混元、DeepSeek、GLM、Kimi、MiniMax等主流国产模型,降低多模型接入的管理成本

使用方法

  • 步骤一:注册与认证访问腾讯云官网注册腾讯云账号,完成实名认证
  • 步骤二:登录TokenHub控制台登录腾讯云大模型服务平台TokenHub控制台,按照界面提示开通服务。开通后可在模型广场浏览选择模型
  • 步骤三:开通模型并领取免费体验额度
    • 按量付费方式:在在线推理服务列表中,找到所需模型,启用后付费
    • 免费体验包领取:进入模型广场页面,单击“新用户福利免费体验”,在弹窗中勾选所需模型后单击“立即领取”,即可获得多个模型的免费使用额度
  • 步骤四:创建API Key
    • 进入API Key管理页面,在页面上方选择地域后单击“创建API Key”
    • 填写Key名称,并设置可访问范围(全选或限定范围),单击“确定”完成创建
    • 创建完成后务必复制并妥善保管API Key,后续API调用将使用该Key进行鉴权
  • 步骤五:通过API调用模型平台兼容OpenAI API协议,可使用熟悉的SDK和工具直接接入。调用方式如下
    • base_url:在线推理入口为 https://tokenhub.tencentmaas.com/v1;Token Plan订阅入口为 https://api.lkeap.cloud.tencent.com/plan/v3
    • 鉴权:通过 Authorization: Bearer YOUR_API_KEY Header完成鉴权
    • 调用示例:将示例代码中的YOUR_API_KEY替换为实际API Key,model字段更换为目标模型调用参数,即可发起调用
  • 步骤六:模型监控与用量管理(可选)通过控制台的模型监控页面查看TTFT、TPOT、RPM等性能指标,通过用量统计页面查看输入Token、输出Token、TPM等计费用量指标,便于服务运维与成本分析
  • 步骤七:批量推理(可选)对于离线大批量处理场景,可调用批量推理API发起批量任务,按批量推理独立计费规则计费
  • 步骤八:Token Plan企业版配置(可选)企业用户可在Token Plan页面购买专业套餐或轻享套餐。轻享套餐采用Auto智能路由模型,刊例价为2元/百万Tokens,套餐规格从5000万至500000万Tokens/月可选,有效期1至12个月,购买后即刻生效

数据统计

相关导航