Skip to content

Gemini 官网入口:Google AI Gemini 3.1 国内使用指南【2026年4月更新】

更新时间:2026-04-19

Gemini(双子座)是 Google DeepMind 团队开发的旗舰级 AI 模型,以卓越的多模态能力和深度逻辑推理闻名于世。它能处理文本、图像、音频、视频,并生成高质量代码,被广泛认为是当前 AI 技术的顶尖代表。

2026 年 2 月,Google 发布 Gemini 3.1 Pro,在 ARC-AGI-2 基准测试中取得 77.1% 的成绩,是上一代 Gemini 3 Pro 的两倍以上,全面超越 GPT-5.2 和 Claude Opus 4.6。2026 年 4 月,Google 又推出 Gemini 3.1 Flash TTS,支持 70+ 语言的文本转语音控制,内置 200+ 音频标签,可精细调控语速、语调、情感。

本文详细介绍如何在国内使用 Gemini 以及其最新模型能力。

什么是 Gemini?

Gemini 是 Google DeepMind 打造的多模态 AI 系统,目前最新系列为 Gemini 3.x,核心成员包括:

模型发布时间核心亮点
Gemini 3.1 Pro2026年2月超长上下文(100万输入/6.4万输出),ARC-AGI-2 得分77.1%,支持 SVG 动画、3D 交互、复杂系统合成
Gemini 3.1 Flash TTS2026年4月最可控的 TTS 模型,70+ 语言,200+ 音频标签,支持多角色对话
Gemini 3 Pro2025年11月多模态深度推理,动画 SVG 生成,复杂代码编写
Gemini 2.5 Pro2025年高效推理能力,支持深度思考模式

Gemini 3.1 Pro 的核心能力

顶级推理性能:Gemini 3.1 Pro 在 ARC-AGI-2 基准测试中得分 77.1%(Gemini 3 Pro 的两倍以上),GPQA Diamond 测试达 94.3%,Humanity's Last Exam 达 44.4%,全面领先 GPT-5.2 和 Claude Opus 4.6。

超长上下文:支持高达 100 万输入 token6.4 万输出 token,可一次性处理整本书籍、代码库或长篇文档。

代码生成与动画:Gemini 3.1 Pro 能直接从文本提示生成网站级动画 SVG(任意缩放保持清晰)、构建实时航天仪表盘(接入国际空间站遥测数据)、编写复杂 3D 交互体验。

创意编程:可以将文学主题转化为功能代码。例如读取《呼啸山庄》的氛围基调后,设计出现代感十足的文学作品展示网站。

Gemini 3.1 Flash TTS 的核心能力

精细语音控制:通过 200+ 音频标签(如 [whispered][excited][shouting])直接控制语音的语速、语调、情感和风格。

多语言与口音:支持 70+ 语言,提供丰富的地区口音选择,包括美式、英式、南部口音,以及 Brixton、RP 等地方口音变体。

场景模板:内置播客对话、有声书 narrator、语言导师、语音助手、健康指南、新闻播报、客服代表等多种场景模板,可直接调用。

多角色对话:原生支持多角色对话,每个角色可保持一致的声音和自然的轮转节奏,适合播客和对话式 agent 开发。

排名表现:在 Artificial Analysis TTS 排行榜中以 1211 分排名第二,质量与成本比领先。

国内如何使用 Gemini?

通过 Google 官方访问

Gemini 官方提供以下产品,国内用户需自行解决网络访问:

国内直达方案

如无法访问 Google 服务,可通过以下国内平台使用 Gemini:

Gemini 3.1 Pro 界面

Gemini 3.1 Pro 界面

Gemini 3.1 Pro 技术规格一览

规格项Gemini 3.1 Pro
输入上下文最高 100 万 token
输出上下文最高 6.4 万 token
ARC-AGI-277.1%
GPQA Diamond94.3%
多模态文本、图像、音频、视频、代码
SVG 动画支持,矢量级清晰度
APIGemini API / Vertex AI
平台Gemini App、AI Studio、NotebookLM、Android Studio、Antigravity

常见问题(FAQ)

Q:Gemini 3.1 Pro 与 3 Pro 相比有哪些提升?

A:Gemini 3.1 Pro 在 ARC-AGI-2 基准测试中是 3 Pro 的两倍以上,支持更长的输出 token(6.4万),在创意编程、复杂系统合成和动画生成方面能力显著增强。

Q:Gemini 3.1 Flash TTS 适合什么场景?

A:非常适合有声书制作、播客录制、多语言语音应用、客服对话机器人、语言学习助手等需要精细语音控制的场景。

Q:国内使用镜像站安全吗?

A:推荐的所有站点均经过筛选。但建议不要在对话中输入敏感个人信息(如真实姓名、身份证号、密码等)。

Q:Gemini 模型有使用限制吗?

A:通过官方渠道使用有免费额度和速率限制。国内镜像站的限制政策各有不同,部分高级功能可能需要付费。

Q:Gemini CLI 是什么?

A:Gemini CLI 是 Google 提供的命令行工具,开发者可通过终端直接调用 Gemini API,适合本地开发和脚本集成。


本文基于 2026 年 4 月最新资讯整理,Gemini 模型持续迭代中,能力以 Google 官方发布为准。

Gemini 中文版博客