TokenHub｜腾讯云

TokenHub是腾讯云推出的一站式大模型服务平台，由原MaaS（Model as a Service）平台于2026年3月正式升级而来。平台致力于为企业和开发者提供统一的大模型服务入口，整合腾讯自研的混元大模型能力，并引入DeepSeek、智谱GLM、Kimi、MiniMax、通义千问等多家行业领先的第三方主流模型，覆盖通用对话、深度推理、代码生成、视觉理解、图像生成、视频生成及3D生成等多类场景。平台支持按量调用、保障型资源、专属部署等多种服务模式，并提供兼容OpenAI协议的API接口，一个API Key即可接入全模型。

技术特点

统一API接入架构：平台聚合多家主力大模型至同一入口，开发者以一个API Key调用平台全部语言模型与多模态能力，无需多平台多账号管理，显著降低多模型集成的技术复杂度。
双协议兼容：完全兼容OpenAI API与Anthropic API协议，已使用OpenAI SDK的项目仅需修改base_url和API Key即可无缝接入，业务代码几乎无需改动。兼容能力贯穿全部语言模型和多模态接口，覆盖Python、Node.js、Java、Go等主流语言生态。
多模型差异化解耦：平台采用积木式设计理念，将不同模型的独立定价、上下文窗口、能力支持差异透明化，开发者可根据任务场景在统一接口下灵活切换模型，实现能力选型与成本控制的最佳平衡。
高性能推理优化：依托多元芯片适配、训推潮汐调度、FlexKV分布式缓存等推理优化技术，平台整体算力利用率显著提升，缓存命中率大幅提高，有效降低Agent推理成本。
Prompt Cache机制：支持请求级缓存标识，当多个请求前缀相同时复用KV缓存数据，缓存命中输入Token享受更低单价，针对长system prompt和多轮工具调用等Agent高消耗场景实现成本优化。
精细化权限与安全控制：支持API Key级别配置可访问模型范围、独占额度、总额度上限及TPM限制，实现多团队、多业务线下的精细化权限与用量管理。

主要功能

模型广场：汇聚多家厂商的主力大模型，支持按类型、服务商、体验状态等多维度筛选、模型对比和详细信息查看，帮助用户快速选择合适的模型使用。平台当前已上架18款语言模型，覆盖混元系列、DeepSeek系列、智谱GLM系列、Kimi系列、MiniMax系列及Qwen系列。
体验中心：支持在线体验大模型能力，涵盖文本对话（深度思考、流式输出）、图片生成（多风格、多尺寸）、视频生成及3D生成，便于用户在接入API之前充分评估模型效果。
在线推理与API调用：创建并管理模型的推理服务实例，获取专属API Endpoint。支持按需选择计费方式——免费体验、按Token计费，满足从测试验证到生产部署的全阶段需求。平台同时支持在线实时推理与离线批量推理两类任务模式。
Prompt Cache缓存：平台提供请求级缓存功能，支持多种主流模型的Cache缓存调用，缓存命中价格较常规输入价格显著降低，适用于长上下文中高频前缀复用场景。
API Key集中管理：集中管理API访问密钥，支持精细化的权限控制（全部模型及服务或限定范围），实现便捷的启停切换和调用统计，保障接口调用的安全性与可控性。
模型监控与用量统计：展示模型与服务性能相关指标（TTFT、TPOT、RPM等）以及计费用量指标（输入Token、输出Token、TPM、插件调用次数等）。
Token Plan企业套餐：面向企业级场景的专属订阅套餐。提供专业套餐（积分池模式，多模型可选，各模型不同单价从积分池实时扣减）与轻享套餐（Token池模式，采用Auto智能路由自动选最优模型，2元/百万Tokens刊例价）两类方案。
AI创作与智能创作Agent：视频特效中心展示海量创意视频特效模板，支持一键复刻爆款同款和API灵活调用。平台提供智能创作Agent，依托腾讯混元大模型实现“描述即生成”，覆盖短视频制作、微短剧、品牌营销、虚拟人运营等核心创作场景。
批量推理：支持以API形式发起批量推理任务，适用于离线大批量处理场景，计费规则与在线推理独立，有效降低大规模批量调用的单位成本。

适用场景

多模型对比与方案选型：企业在同一环境中对多款主流模型进行同步压测，直观比较同等任务下的输出质量、延迟及成本，辅助技术决策和模型选型。
企业级AI应用开发：企业可利用平台的一站式能力快速构建智能客服、电商推荐、政务办公等场景的AI应用，整合混元、DeepSeek、GLM等模型满足不同业务需求。
AI编程与开发者工具集成：支持CodeBuddy、Claude Code、Cursor等主流AI编程工具集成，以及OpenClaw等原生化场景实现办公自动化，适用于开发者日常代码生成、调试、SQL优化及技术文档撰写。
智能Agent开发与部署：依托TokenHub的模型能力与Prompt Cache优化，为Agent类应用提供长system prompt复用、多轮工具调用和上下文管理能力，降低Agent推理成本。
内容创作与视觉生成：面向短视频博主、微短剧团队、品牌运营和虚拟人IP工作室，通过视频特效智能体实现“描述即生成”，支持文生视频、图生视频、视频特效模板一键复刻，覆盖从脚本到成片的完整链路。
科研与教育培训：高校及科研院所利用平台多模型资源开展AI研究和教学实践，通过新用户免费体验额度零成本验证模型能力。
多模态应用开发：基于平台图像生成、视频生成、3D生成能力，开发广告创意、虚拟人、产品展示等多模态应用场景。
长文本处理与深度推理：依托DeepSeek-V4-Pro的百万级上下文窗口和384k最大输出能力，适用于长文档审阅、整库代码理解、多轮Agent任务等长记忆需求；利用Hy3 preview的深度思考能力，适应复杂推理与长Context指令遵循场景。
国产化模型统一接入：面向需要统一集成多家国产大模型的企业，通过一个API Key接入混元、DeepSeek、GLM、Kimi、MiniMax等主流国产模型，降低多模型接入的管理成本。

使用方法

步骤一：注册与认证访问腾讯云官网注册腾讯云账号，完成实名认证。
步骤二：登录TokenHub控制台登录腾讯云大模型服务平台TokenHub控制台，按照界面提示开通服务。开通后可在模型广场浏览选择模型。
步骤三：开通模型并领取免费体验额度
- 按量付费方式：在在线推理服务列表中，找到所需模型，启用后付费。
- 免费体验包领取：进入模型广场页面，单击“新用户福利免费体验”，在弹窗中勾选所需模型后单击“立即领取”，即可获得多个模型的免费使用额度。
步骤四：创建API Key
- 进入API Key管理页面，在页面上方选择地域后单击“创建API Key”。
- 填写Key名称，并设置可访问范围（全选或限定范围），单击“确定”完成创建。
- 创建完成后务必复制并妥善保管API Key，后续API调用将使用该Key进行鉴权。
步骤五：通过API调用模型平台兼容OpenAI API协议，可使用熟悉的SDK和工具直接接入。调用方式如下：
- base_url：在线推理入口为 https://tokenhub.tencentmaas.com/v1；Token Plan订阅入口为 https://api.lkeap.cloud.tencent.com/plan/v3。
- 鉴权：通过 Authorization: Bearer YOUR_API_KEY Header完成鉴权。
- 调用示例：将示例代码中的YOUR_API_KEY替换为实际API Key，model字段更换为目标模型调用参数，即可发起调用。
步骤六：模型监控与用量管理（可选）通过控制台的模型监控页面查看TTFT、TPOT、RPM等性能指标，通过用量统计页面查看输入Token、输出Token、TPM等计费用量指标，便于服务运维与成本分析。
步骤七：批量推理（可选）对于离线大批量处理场景，可调用批量推理API发起批量任务，按批量推理独立计费规则计费。
步骤八：Token Plan企业版配置（可选）企业用户可在Token Plan页面购买专业套餐或轻享套餐。轻享套餐采用Auto智能路由模型，刊例价为2元/百万Tokens，套餐规格从5000万至500000万Tokens/月可选，有效期1至12个月，购买后即刻生效。

TokenHub｜腾讯云

技术特点

主要功能

适用场景

使用方法

数据统计

相关导航

热门网址

热门标签