AI模型平台多模态模型通用聊天

Gemini

Google Gemini 是谷歌推出的多模态 AI 智能体平台,深度整合搜索、Chrome 与 Android,提供跨应用任务自动化、无代码应用开发、深度研究及多模态内容生成等能力,月活跃用户已突破...

标签:
SEKOLibTVliblibdinghua

Google Gemini简介

Google Gemini 是谷歌推出的新一代多模态 AI 智能体平台,已深度整合进搜索、Chrome 浏览器、Android 系统及智能眼镜等核心入口,成为一个可以持续运行、跨应用执行任务的 AI 代理,能够替用户追踪信息、生成内容、调用工具,甚至直接完成下单和操作流程

Gemini

Google Gemini核心功能

  • 多模态理解与推理:Gemini 具备原生的多模态能力,能够同时处理文本、图像、音频、视频等多种输入形式。旗舰模型提供高达 100 万令牌的上下文窗口,可一次性处理大量信息,包括长视频、长音频、数万行代码或数十万单词的文档。高级模型支持“深度思考”模式,可进行复杂推理和多步骤任务规划

  • AI 智能体与任务自动化:Gemini 已从对话助手升级为跨设备、跨应用的智能操作层,支持自动浏览网页、总结内容、对比信息、自动填写复杂表单。可跨越应用边界,理解屏幕内容并主动执行多步骤任务——例如自动读取 Gmail 中的书单,并直接在电商平台将所有书加入购物车。支持在 Chrome 浏览器中实现自动预约牙医、抢停车位等繁琐操作

  • Gemini Canvas(无代码应用开发):用户可通过自然语言提示直接生成可运行的应用、小游戏、图表和信息图等可视化内容,并支持在对话过程中持续迭代修改。非技术用户也能通过对话完成应用开发,无需编写任何代码

  • Gemini in Gmail 与办公套件:Gmail AI 收件箱可自动梳理日程并生成回复草稿。Docs Live 允许用户通过语音与 Google Docs 对话,自动提取演讲要点、获取简历信息、调取活动详情并创建编辑文档

  • 图像与视频生成:支持图像生成、音乐生成、视频生成(Omni Flash)等多模态创作能力。Gemini Omni 支持从单张照片或视频一键应用模板并进行对话式迭代剪辑。免费用户在美国地区可使用 AI Mode 访问“高级思考与生成式布局”及专业图像生成功能

  • 深度研究(Deep Research) :自动执行多步骤搜索、分析和总结,以完成复杂的研究任务

  • 屏幕自动化与跨应用操作:支持屏幕自动化任务执行。可自动生成个性化的桌面小组件——用户只需用自然语言描述需求,Gemini 便能自动生成定制化组件

  • Gemini Canvas 与 Gems:Canvas 支持可视化内容生成与迭代;Gems 支持创建自定义的 AI 助手角色。Storybook 支持自动生成儿童故事书

  • NotebookLM 集成:提供笔记、来源管理、音频/视频概述、报告、闪卡、测验、思维导图、深度研究等多功能支持

  • 多平台覆盖:深度整合进搜索框、Chrome 浏览器、Android 手机、智能手表、汽车及智能眼镜等谷歌核心产品中


Google Gemini产品优势

  • 系统性智能体转型:谷歌正将 AI 智能体全面“塞进”所有核心入口,Gemini 不再只是一个对话助手,而是一个可以持续运行、跨应用执行任务的 AI 代理。推动安卓从传统的“操作系统”向“智能系统”转型

  • 领先的多模态与上下文能力:旗舰模型提供高达 100 万令牌的上下文窗口,在长文档问答、长视频问答和长上下文语音识别等任务上达到行业领先水平。Gemini 1.5 模型在长上下文检索任务上实现近乎完美的召回率

  • 统一订阅体系与算力计量:谷歌取消了每日固定提问次数限制,转向“基于算力消耗”的新计量模式,综合考量提示词复杂度、调用功能及对话历史长度。算力额度每 5 小时刷新一次,并设有每周上限

  • 多层级定价,满足不同需求:提供 Free、AI Plus($7.99/月)、AI Pro($19.99/月)、AI Ultra 基础版($100/月)及 AI Ultra 旗舰版($200/月)等多个层级。AI Plus 用户可获得标准用户 2 倍算力额度,AI Pro 用户可获得 4 倍额度

  • 大规模用户验证:Gemini 应用月活跃用户数达 9 亿。谷歌每月处理的 Token 数量达 3.2 千万亿个,同比增长 7 倍

  • 企业级 API 能力:提供按 token 计费的 API 服务,覆盖从轻量级 Flash-Lite 到高性能 Pro 的完整模型矩阵,支持上下文缓存等高级功能。提供按需付费的算力点数(AI credits),用户可额外购买

  • 开源与开发者生态:提供 Gemini API、Google AI Studio 和 Agent 请求等开发者工具。支持通过自然语言提示进行 vibe coding(氛围编程)


Google Gemini应用场景

  • 个人效率与日常任务自动化:自动读取 Gmail 中的书单并直接加入购物车;自动梳理日程并生成邮件回复草稿;自动预约牙医、抢停车位等;通过语音与 Google Docs 对话完成文档编辑

  • 无代码应用开发:非技术用户通过自然语言在 Gemini Canvas 中直接生成可运行的应用、小游戏及图表等可视化内容

  • 内容创作与多媒体制作:图像生成、音乐生成、视频生成与对话式剪辑。自动生成儿童故事书

  • 深度研究与知识工作:执行多步骤搜索、分析和总结;总结数千页文档、分析数万行代码

  • 教育学习:生成闪卡、测验、思维导图、音频概述和视频概述。帮助高中生准备校友演讲

  • Android 系统级智能:生成个性化桌面小组件;Android Auto 集成 Gemini 提供驾驶辅助与语音指令订餐

  • YouTube 视频搜索:通过自然语言引导系统找到更符合搜索意图的视频片段,并直接跳转至相关部分


Google Gemini使用教程

  1. 访问与注册:通过浏览器访问 gemini.google.com,或从 Google Play / App Store 下载 Gemini 官方应用。

  2. 免费体验:免费用户可使用 Gemini 3.5 Flash 驱动的“Auto”模型,享有标准算力额度及 32,000 令牌上下文窗口

  3. 升级订阅:根据需求选择 Google AI Plus($7.99/月)、AI Pro($19.99/月)或 AI Ultra 方案($100–$200/月),获取更高算力额度、更大上下文窗口及高级功能。

  4. 使用核心功能:在对话界面中可调用 Canvas(无代码应用开发)、Gems(自定义 AI 助手)、Deep Research(深度研究)、图像/视频生成等功能

  5. 跨应用任务:在 Gmail、Chrome 等谷歌应用中调用 Gemini,执行自动浏览、内容总结、信息对比、自动填表等任务

  6. 开发者使用:通过 ai.google.dev 获取 API Key,按 token 用量调用 Gemini API。在 Google AI Studio 中构建和测试 AI 应用

  7. 算力管理:算力额度每 5 小时刷新一次。若耗尽高阶模型额度,系统自动降级至轻量模型以确保服务不中断。可额外购买按需付费的算力点数


Google Gemini收费标准(以官方为准)

Google Gemini 采用“免费 + 订阅”的消费者定价与“按 token 计费”的 API 定价双轨模式。

消费者订阅(按月计费)

方案月费核心权益
Free$0标准算力额度,32K 上下文,Canvas、Gems、Deep Research 等基础功能
AI Plus$7.992 倍标准算力额度,128K 上下文,视频生成,Google Flow 200 积分/月
AI Pro$19.994 倍标准算力额度,100 万令牌上下文,免费 YouTube Premium Lite,Chrome 自动浏览
AI Ultra 基础版$1005 倍 Pro 算力额度,20TB 云存储,YouTube Premium
AI Ultra 旗舰版$20020 倍标准算力额度,AI 数字助理 Gemini Spark Beta

注:以上为美国地区定价。AI Plus 方案另有报道为 $5/月,具体以 Google 官方最新公布为准。

API 定价(每百万 tokens)

模型Input($/1M)Output($/1M)
gemini-2.5-flash-lite$0.10$0.40
gemini-2.5-flash$0.30$2.50
gemini-3-flash$0.50$3.00
gemini-3.1-flash-lite$0.25$1.50
gemini-3.5-flash$1.50$9.00
gemini-3.1-pro(≤200K)$2.00$12.00
gemini-3.1-pro(>200K)$4.00

注:API 定价以 ai.google.dev 最新公布为准


Google Gemini常见问题(FAQ)

  • Google Gemini 是什么? Gemini 是谷歌推出的新一代多模态 AI 智能体平台,已深度整合进搜索、Chrome 浏览器、Android 系统等核心入口,可跨应用执行任务

  • Google Gemini 是免费的吗? 提供 Free 免费版本,包含标准算力额度和基础功能。高级功能需订阅 AI Plus、AI Pro 或 AI Ultra 方案

  • Gemini 的算力额度如何计算? 谷歌已取消每日固定提问次数限制,转向“基于算力消耗”的计量模式,综合考量提示词复杂度、调用功能及对话历史长度。额度每 5 小时刷新一次

  • Gemini 的上下文窗口有多大? 免费版为 32,000 令牌,AI Plus 为 128,000 令牌,AI Pro 为 1,000,000 令牌

  • Gemini 有哪些主要 AI 模型? 包括 Gemini 3.5 Flash、Gemini 3.1 Pro、Gemini 2.5 Flash 系列及 Gemini Omni 视频生成模型

  • Gemini 支持哪些功能? 支持多模态理解与推理、无代码应用开发(Canvas)、深度研究、图像/视频/音乐生成、屏幕自动化、跨应用任务执行、Gmail 智能收件箱等

  • Gemini 如何保障数据安全? Google 遵循行业标准的数据隐私与安全实践。具体隐私政策请参阅 Google 官方隐私声明。

  • Gemini 支持哪些平台? 支持 Web、Android、iOS,并深度整合进 Chrome 浏览器、Gmail、Google Docs、Android 系统、Android Auto 及智能眼镜等

  • 如何开始使用 Gemini? 访问 gemini.google.com 或下载官方应用,使用 Google 账号登录即可开始免费使用

  • Gemini API 如何计费? 按每百万 tokens 计费,输入和输出分别计费,不同模型价格不同。具体以 ai.google.dev 公布为准

相关导航