Gemini是由Google DeepMind团队开发的一款超级AI模型,旨在成为一款多模态的智能助手。它不仅能够理解文本信息,还能处理图像、音频和视频等多种类型的数据。
Gemini 是基于 Transformer 架构 的多模态大语言模型(LLM),定位为通用人工智能(AGI)的基础设施。其核心能力覆盖 自然语言理解与生成、代码创作、数学推理、多模态处理(文本/图像/音频/视频) 及 复杂任务自动化,适用于企业级服务、科研、教育及工业场景。