混元语言开源模型
中国
AI模型平台通用大模型

混元语言开源模型

腾讯混元语言开源模型是覆盖从端侧1.8B到千亿级MoE的全链路自研大模型系列,支持多语言翻译、复杂推理与智能体工作流,以Apache 2.0协议全面开源,可免费商用。

标签:
SEKOLibTVliblibdinghua

混元语言开源模型简介

腾讯混元语言开源模型是腾讯全链路自研的通用大语言模型系列,采用混合专家(MoE)架构,覆盖从端侧轻量级模型到千亿级旗舰模型的完整产品矩阵。模型已全面开源,支持开发者自由下载、部署与商用,致力于以高性能、低成本、多尺寸的AI能力推动产业智能化升级

混元语言开源模型

混元语言开源模型核心功能

  • Hy3 preview 旗舰模型:腾讯迄今最智能的开源模型,总参数295B、激活参数21B,最大支持256K上下文长度。采用快慢思考融合的MoE架构,在复杂推理、指令遵循、上下文学习、代码生成及Agent能力上实现大幅提升。可稳定支撑长达495步的复杂智能体工作流,覆盖文档处理、数据分析、知识检索、MCP工具链编排等多元场景

  • Hy-MT2 多语言翻译模型:专为翻译场景优化的开源模型家族,支持33种主要语言互译及5种民族语言/方言互译。提供1.8B、7B、30B-A3B(MoE)三种体量,在通用翻译、专业领域翻译、真实业务场景翻译及指令遵循翻译等任务上均表现优异。在WMT25比赛中30种语言获得第一。轻量级1.8B版本采用自研极低比特量化技术压缩至440MB,可在手机端离线本地运行

  • Hunyuan-Large 超大MoE模型:拥有3890亿总参数量、520亿激活参数量,支持256K上下文长度。是目前业界参数规模最大、性能领先的开源MoE模型,在推理速度和参数规模之间取得平衡

  • HunyuanOCR 光学字符识别模型:参数仅1B的轻量级模型,在多项OCR应用榜单中达到SOTA水平

  • 开源生态与社区支持:模型在GitHub和Hugging Face等平台开源发布。Hunyuan-Large等模型已集成至腾讯云TI-ONE平台,支持企业级精调、推理与部署。自建数据集IFMT Bench已同步开源


混元语言开源模型产品优势

  • 全链路自主研发:坚持从训练数据、模型架构到训练策略的全链路自主研发,不依赖外部开源模型,确保数据安全与迭代可控。

  • 完整的模型矩阵:覆盖从1.8B端侧轻量模型到3890B超大规模MoE模型的完整产品线,适配从手机端本地部署到企业级高性能推理的全场景需求。

  • MoE架构领先:采用混合专家(MoE)架构,通过专家并行与稀疏激活技术,在推理速度与参数规模之间实现优秀平衡

  • 中文能力卓越:在中文创作、复杂语境逻辑推理、翻译等任务上表现突出,SuperCLUE基准测评中语言能力达到国内第一梯队。

  • 开源免费商用:模型遵循开源许可证发布,允许个人与企业免费商用。开源社区持续贡献,推动开发者生态建设

  • 端侧部署能力领先:Hy-MT2-1.8B通过极致量化压缩至440MB,可在手机端离线运行,将高端翻译能力从云端特权降至移动端可及的门槛


混元语言开源模型应用场景

  • 多语言翻译与本地化:Hy-MT2系列支持33种语言互译及5种民族语言/方言互译,适用于跨境业务、多语言内容本地化、国际会议等场景。轻量级版本可在手机端离线运行,满足移动端即时翻译需求

  • 智能体(Agent)工作流:Hy3 preview可稳定支撑长达495步的复杂智能体工作流,适用于文档处理、数据分析、知识检索、MCP工具链编排等企业级自动化场景

  • 企业级AI应用开发:通过腾讯云TI-ONE平台进行模型精调、推理与部署,适用于智能客服、知识管理、内容生成等企业级AI应用开发。

  • 软件开发与代码生成:Hy3 preview在代码生成能力上实现大幅提升,适用于代码辅助、自动化编程等软件开发场景。

  • 文档处理与OCR识别:HunyuanOCR模型以1B参数实现OCR领域SOTA性能,适用于文档数字化、图像文字提取等场景。

  • 学术研究与模型蒸馏:开源模型为学术界和开发者社区提供研究基础,支持模型蒸馏、二次开发与定制化微调。


混元语言开源模型使用教程

  1. 访问开源平台:访问混元语言开源模型官网(llm.hunyuan.tencent.com),或通过GitHub和Hugging Face平台获取模型

  2. 选择模型版本:根据业务需求选择合适的模型——Hy3 preview(旗舰通用模型)、Hy-MT2系列(翻译专用,提供1.8B/7B/30B-A3B三种尺寸)、Hunyuan-Large(超大规模MoE)等

  3. 下载模型权重:在GitHub或Hugging Face页面下载模型权重文件,遵循开源许可证条款。

  4. 本地部署与推理

    • Hy-MT2轻量级部署:1.8B版本采用GGUF量化格式,仅需440MB存储空间即可在本地或移动端高效部署

    • 企业级部署:通过腾讯云TI-ONE平台进行模型精调、推理与部署

  5. API调用(可选) :如需通过云端API调用,可访问腾讯云TokenHub,获取API密钥后按接口文档调用模型服务。

  6. 定制化开发:基于开源模型进行微调、蒸馏或二次开发,适配垂直领域业务需求。


混元语言开源模型收费标准(以官方为准)

混元语言开源模型本身免费开源,开发者可通过GitHub和Hugging Face等平台自由下载模型权重

  • 开源免费:模型权重遵循开源许可证发布,允许个人与企业免费下载、使用和商用

  • 云端API(可选) :如需通过腾讯云TokenHub调用API服务,采用按量计费模式。首次开通服务后发放免费调用额度供测试体验。Hy3 preview API输入价格最低为1.2元/百万tokens。混元-lite模型API已调整为全面免费

注:以上价格为第三方平台及官方公开信息参考,具体请以腾讯云官网(cloud.tencent.com)最新公布为准。


混元语言开源模型常见问题(FAQ)

  • 混元语言开源模型是什么? 腾讯混元语言开源模型是腾讯全链路自研的通用大语言模型系列,采用MoE架构,覆盖从端侧轻量级到千亿级旗舰模型的完整产品矩阵,已全面开源。

  • 混元语言开源模型是免费的吗? 模型权重免费开源,开发者可自由下载使用。云端API调用采用按量计费模式。

  • Hy3 preview是什么? Hy3 preview是腾讯混元2026年4月发布并开源的旗舰语言模型,总参数295B、激活参数21B,最大支持256K上下文,在复杂推理、指令遵循、Agent能力上实现大幅提升

  • Hy-MT2支持哪些语言? 支持33种主要语言互译及5种民族语言/方言互译

  • Hy-MT2-1.8B需要多大存储空间? 采用自研极低比特量化技术压缩至约440MB,可在手机端离线本地运行

  • Hunyuan-Large有多大? 拥有3890亿总参数量、520亿激活参数量,支持256K上下文长度,是目前业界参数规模最大的开源MoE模型

  • 混元语言开源模型可以商用吗? 可以。模型遵循开源许可证发布,允许个人与企业免费商用

  • 如何获取混元语言开源模型? 可通过混元语言开源模型官网(llm.hunyuan.tencent.com)、GitHub和Hugging Face平台获取

  • 混元语言开源模型支持哪些部署方式? 支持本地部署(含端侧离线部署)和腾讯云TI-ONE平台企业级部署两种方式

相关导航