大模型大模型服务平台算力市场

模力方舟(Gitee AI)

汇聚最新最热 AI 模型,提供模型体验、推理、训练、部署和应用的一站式服务,提供充沛算力,做中国最好的 AI 社区。

标签:

模力方舟(Gitee AI)是开源中国于2023年推出的一站式大模型服务平台,致力于打造中国本土化的AI社区。平台整合模型服务、Serverless能力、API组合与应用生命周期管理,依托Gitee既有DevOps能力实现从开发到上线的协同支持。面向开发者提供从开源模型、训练数据集、国产算力底座到模型在线微调测试的全流程支持,旨在帮助企业和开发者解决AI落地与应用问题

模力方舟(Gitee AI)

技术特点

  • 自研推理引擎:平台拥有自研的高性能推理引擎GiEngine(Gitee Inference Engine),聚焦于大模型的高性能推理与国产算力适配,助力开发者在本地或云端环境中高效部署AI能力。GiEngine已获评年度创新软件产品。
  • 国产算力深度适配:率先完成主流国产GPU的深度适配与优化,支持沐曦、华为昇腾、天数智芯、壁仞、燧原等国产算力集群,关键模型推理性能对比基线提升显著,确保生产级应用的稳定高效
  • Serverless无服务器架构:提供开箱即用的企业级大模型推理API服务,无需管理基础设施,具备自动扩缩容、高性能GPU加速和极低延迟特性,支持按实际使用量计费
  • 训推潮汐调度:多模型共存环境下的算力分配与任务优先级管理机制,支持任务优先级与资源动态调整。支持多级缓存与模型复用机制,推理成本实现显著优化
  • 低代码微调框架:提供可视化监控、效果验证与国产GPU支持,可基于企业知识库、产品文档等私有数据训练定制模型。内置多种图像打标算法与裁切工具,有效降低标注技术门槛
  • 标准接口生态:兼容OpenAI SDK及ComfyUI、Dify、n8n、Claude Code、Codex等主流应用框架,实现无缝对接

主要功能

  • 模型广场:汇聚海量开源模型与高质量数据集,覆盖自然语言处理、计算机视觉、语音识别等主流AI领域。用户可在线体验模型能力并通过Serverless API快速调用
  • Serverless API服务:覆盖文本生成、视觉模型、图像生成与处理、自动语音识别、语音合成、特征抽取、代码生成等多类别,提供开箱即用的企业级大模型推理API服务,无需繁琐的部署和算力配置
  • 模型微调定制:提供安全、私密且高效的模型定制服务,涵盖微调、强化学习与参数插拔。支持可视化训练追踪,清晰记录各训练批次的损失值变化
  • 算力租赁:提供按需付费的GPU算力租赁服务,支持从单卡到大规模集群的多种规格,小时级起租。兼容沐曦、昇腾等国产异构算力。用户可通过浏览器一键进入Jupyter开发环境,快速验证与迭代模型
  • AI应用市场:专为AI应用开发者打造的生态平台,提供从应用上架、服务部署到商业化变现的全链路支持,支持按次付费、订阅制等多种商业化方案,配备零抽成机制
  • 模型托管:支持从Hugging Face导入和本地推送两种方式上传AI模型,全面支持Git LFS功能。用户可通过网页下载或命令行方式获取模型文件
  • 多模型协作:支持快速串联不同模型的输入输出,智能处理参数转换,降低多模型协作的复杂度。支持多模型链路与LoRA动态加载,使开发者能够灵活组合能力快速构建业务应用

适用场景

  • 企业级AI应用开发:企业可利用平台的一站式能力快速构建智能客服、电商推荐、政务办公等场景的AI应用
  • AI模型测试与选型:开发者可在模型广场中对比不同模型的性能表现,利用Serverless API进行技术方案验证和成本评估
  • 科研与教育培训:高校及科研院所利用平台的开源模型和数据集资源开展AI研究,结合平台提供的免费算力进行教学实践
  • 国产化替代:有自主可控需求的政企客户可通过平台的国产算力支持,在符合安全合规要求的前提下构建AI基础设施
  • AI应用商业化:独立开发者及AI创业团队可依托AI应用市场,将模型能力打包为在线应用并通过平台实现收益转化。
  • DevOps智能化升级:企业将平台模型能力集成至Gitee DevOps流水线,实现代码质量检测、自动化测试、智能评审等研发全流程的AI赋能

使用方法

  • 注册与登录:访问模力方舟官网,新用户可直接通过手机号注册创建账号;原Gitee账号用户首次登录时可同步原有数据。登录成功后自动跳转至个人工作台界面
  • 在线体验模型:进入AI模型广场,浏览选择所需模型,在模型详情页点击在线体验即可直接调用,无需配置
  • 通过API调用:在模型体验页找到API部分,复制示例代码片段。在个人工作台获取访问令牌,即可在应用中集成模型能力。API兼容OpenAI标准接口
  • 模型微调:上传业务数据,选择基础模型,配置微调参数,启动训练任务。训练过程中可实时监控损失值变化
  • 算力租赁:访问算力市场,选择所需算力规格(如曦云C500、燧原S60等),点击租用并配置开发环境,通过Jupyter Notebook在线工作
  • 托管AI模型:支持从Hugging Face导入模型地址自动完成迁移,或通过Git LFS从本地推送模型文件至平台仓库
  • 上架AI应用:在应用市场中提交应用,完成模型接入、页面配置与定价设置。应用审核通过后即面向平台用户开放调用

数据统计

相关导航