# 快速了解

<figure><img src="https://293311848-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2F7GGz8p5Vv0PvFaH88Kde%2Fuploads%2F8py961ehoWyo3AkiPDPx%2Fimage.png?alt=media&#x26;token=df244f6b-3318-4565-b499-77609cc5537f" alt=""><figcaption></figcaption></figure>

### 什么是Gemini? <a href="#shen-me-shi-shan-jing-ai" id="shen-me-shi-shan-jing-ai"></a>

Gemini 3 是我们迄今为止最智能的模型系列，建立在先进的推理技术基础上。 它旨在通过掌握智能体工作流、自主编码和复杂的多模态任务，将任何想法变为现实。 本指南介绍了Gemini 3 模型系列的主要功能，以及如何充分利用这些功能。

### 认识一下 Gemini 3 <a href="#meet_gemini_3" id="meet_gemini_3"></a>

最强且没有之一的视觉推理模型，以及拖后腿的Google产品。

在gemini 3.0 pro问世之前，无论是数学、代码、文字、创意……一切需要大模型的形态，[GPT-5.1](https://zhida.zhihu.com/search?content_id=757600087\&content_type=Answer\&match_order=1\&q=GPT-5.1\&zd_token=eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJpc3MiOiJ6aGlkYV9zZXJ2ZXIiLCJleHAiOjE3NjQ2ODY5MjIsInEiOiJHUFQtNS4xIiwiemhpZGFfc291cmNlIjoiZW50aXR5IiwiY29udGVudF9pZCI6NzU3NjAwMDg3LCJjb250ZW50X3R5cGUiOiJBbnN3ZXIiLCJtYXRjaF9vcmRlciI6MSwiemRfdG9rZW4iOm51bGx9.5RQLpx1BJyF0XeKGioV9Kt8DCG9nWcKdKMDTPns0v4A\&zhida_source=entity)基本上都能够占据绝对能力第一名，或者是难分高下的并列第一名.

就是你只要没有网络、支付、预算的问题，那么任何需求基本上都可以无脑选择GPT来解决，如果GPT解决不了，在同量级成本下，其他模型也不会做得更好了。

除了一个领域——多模态。

在这个领域，和GPT形成竞争的是Doubao-Seed-1.6-vision。在对图像的理解的绝对能力上，Doubao比GPT略差一点，但是这个差距远无法弥补他们俩之间的高差价，他们俩之间能力和价格的距离，有点像年初Deepseek-r1和openai-o1之间的距离——都知道o1应该会强一点，但是正常人是不可能弃R1不用，去用O1的。

所以大量vl、图像理解的工程，Doubao都是第一首选。

但无论是Doubao，还是你愿意花钱，用GPT 5.1，或者是Gemini 2.5 pro，都有一个对人类来说不是很难（虽然有点麻烦）的任务，大模型是完不成的。

### **模型：**

**无论是完成日常任务，还是解决复杂问题，都能找到适合您需求的模型。**

Gemini 为你的日常生活带来理性和智慧。

<table data-view="cards"><thead><tr><th></th><th data-hidden data-card-cover data-type="image">Cover image</th></tr></thead><tbody><tr><td><h4>3 Pro</h4><p>最适合处理复杂任务，并将创意概念变为现实。</p></td><td><a href="https://293311848-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2F7GGz8p5Vv0PvFaH88Kde%2Fuploads%2Flhw5rX4SpLmDyWju0yWy%2Fimage.png?alt=media&#x26;token=552167c0-77f0-48c8-b303-8dae90bfa43f">image.png</a></td></tr><tr><td><h4>2.5 Flash</h4><p>最适合快速完成日常任务</p></td><td><a href="https://293311848-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2F7GGz8p5Vv0PvFaH88Kde%2Fuploads%2F8y4YFcAlZfoK8JeJwoyt%2Fimage.png?alt=media&#x26;token=9820b226-2100-498d-9e2f-7ec2f1b0097b">image.png</a></td></tr><tr><td><h4>2.5 Flash-Lite</h4><p>最适合大批量、高性价比的任务</p></td><td><a href="https://293311848-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2F7GGz8p5Vv0PvFaH88Kde%2Fuploads%2FKbclUgqf5nqHo18hWoji%2Fimage.png?alt=media&#x26;token=b7a9471c-9ea3-4305-bbd0-548aebdffcb0">image.png</a></td></tr></tbody></table>

### 能力：

**Gemini 3 将这些功能整合在一起，让您能够将任何想法变为现实。**

1. **学习任何知识：**&#x7528;清晰、简洁、有用的回答，以易于理解的方式理解复杂的主题。
2. **建造任何东西：**&#x5C06;您的想法变为现实——从草图和提示到互动工具和体验。
3. **计划任何事：**&#x59D4;派任务和多步骤项目，以前所未有的速度完成工作。<br>

### 表现：

**Gemini 3 在各项基准测试中均处于最先进水平。**

我们迄今为止最智能的模型为人工智能模型的性能树立了新的标杆。

<table data-full-width="false"><thead><tr><th width="163">基准</th><th width="171.6666259765625"></th><th width="114.6666259765625">Gemini 3 Pro</th><th width="97.33349609375">Gemini 2.5 Pro</th><th width="104.6666259765625">Claude Sonnet 4.5</th><th>GPT-5.1</th></tr></thead><tbody><tr><td><p><sup><sub>学术推理</sub></sup></p><p>人类的最后考试</p></td><td><sub>无需工具</sub></td><td>37.5%</td><td>21.6%</td><td>13.7%</td><td>26.5%</td></tr><tr><td></td><td><sub>通过搜索和代码执行</sub></td><td>45.8%</td><td>-</td><td>-</td><td>-</td></tr><tr><td><p><sub>视觉推理谜题</sub></p><p>ARC-AGI-2</p></td><td><sub>ARC 奖项已核实</sub></td><td>31.1%</td><td>4.9%</td><td>13.6%</td><td>17.6%</td></tr><tr><td><p><sub>科学知识</sub></p><p>GPQA钻石级</p></td><td><sub>无需工具</sub></td><td>91.9%</td><td>86.4%</td><td>83.4%</td><td>88.1%</td></tr><tr><td><p><sub>数学</sub></p><p>AIME 2025</p></td><td><sub>无需工具</sub></td><td>95.0%</td><td>88.0%</td><td>87.0%</td><td>94.0%</td></tr><tr><td></td><td><sub>通过代码执行</sub></td><td>100.0%</td><td>-</td><td>100.0%</td><td>-</td></tr><tr><td><p><sub>具有挑战性的数学竞赛题目</sub></p><p>MathArena Apex</p></td><td></td><td>23.4%</td><td>0.5%</td><td>1.6%</td><td>1.0%</td></tr><tr><td><p><sub>多模态理解与推理</sub></p><p>MMMU-Pro</p></td><td></td><td>81.0%</td><td>68.0%</td><td>68.0%</td><td>76.0%</td></tr><tr><td><p><sub>屏幕理解</sub></p><p>ScreenSpot-Pro</p></td><td></td><td>72.7%</td><td>11.4%</td><td>36.2%</td><td>3.5%</td></tr><tr><td><sub>从复杂图表中综合信息</sub>CharXiv 推理</td><td></td><td>81.4%</td><td>69.6%</td><td>68.5%</td><td>69.5%</td></tr><tr><td><p><sub>OCR</sub></p><p>OmniDocBench 1.5</p></td><td><sub>整体编辑距离，越低越好</sub></td><td>0.115</td><td>0.145</td><td>0.145</td><td>0.147</td></tr><tr><td><p><sub>从视频中获取知识</sub></p><p>视频-MMMU</p></td><td></td><td>87.6%</td><td>83.6%</td><td>77.8%</td><td>80.4%</td></tr><tr><td><sub>竞争性编程问题</sub>LiveCodeBench Pro</td><td><sub>Elo 等级分越高越好</sub></td><td>2,439</td><td>1,775</td><td>1,418</td><td>2,243</td></tr><tr><td><p><sub>代理终端</sub></p><p>编码终端工作台 2.0</p></td><td><sub>终点站-2 特工</sub></td><td>54.2%</td><td>32.6%</td><td>42.8%</td><td>47.6%</td></tr><tr><td><p><sub>代理编码</sub></p><p>SWE-Bench 验证</p></td><td><sub>单次尝试</sub></td><td>76.2%</td><td>59.6%</td><td>77.2%</td><td>76.3%</td></tr><tr><td><p><sub>代理工具的使用</sub></p><p>τ2-bench</p></td><td></td><td>85.4%</td><td>54.9%</td><td>84.7%</td><td>80.2%</td></tr><tr><td><p><sub>长时程智能体任务</sub></p><p>自动售货长椅 2</p></td><td><sub>净资产（平均值），越高越好</sub></td><td>5,478.16 美元</td><td>573.64美元</td><td>3,838.74 美元</td><td>1473.43美元</td></tr><tr><td><p><sub>坚持内部基础、参数化、MM 和搜索检索基准</sub></p><p>FACTS 基准测试套件</p></td><td></td><td>70.5%</td><td>63.4%</td><td>50.4%</td><td>50.8%</td></tr><tr><td><p><sub>参数知识</sub></p><p>SimpleQA 已验证</p></td><td></td><td>72.1%</td><td>54.5%</td><td>29.3%</td><td>34.9%</td></tr><tr><td><p><sub>多语言问答</sub></p><p>MMMLU</p></td><td></td><td>91.8%</td><td>89.5%</td><td>89.1%</td><td>91.0%</td></tr><tr><td><p><sub>跨越100种语言和文化的常识推理</sub></p><p>全球PIQA</p></td><td></td><td>93.4%</td><td>91.5%</td><td>90.1%</td><td>90.9%</td></tr><tr><td><p><sub>长上下文表现</sub></p><p>MRCR v2（8针）</p></td><td><sub>128k（平均）</sub></td><td>77.0%</td><td>58.0%</td><td>47.1%</td><td>61.6%</td></tr><tr><td></td><td><sub>1M（逐点）</sub></td><td>26.3%</td><td>16.4%</td><td>不支持</td><td>不支持</td></tr></tbody></table>

**Gemini 3 深思熟虑，它突破了智能的界限，使 Gemini 3 的推理和多模态理解能力实现了质的飞跃，从而帮助您解决最复杂的问题。**

Gemini 3 Deep Think 可以更好地帮助解决需要创造力、战略规划和逐步改进的问题。

<figure><img src="https://293311848-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2F7GGz8p5Vv0PvFaH88Kde%2Fuploads%2F6OzwPMGNlu4h8BYlHxXb%2Fimage.png?alt=media&#x26;token=ab63066e-f1c1-4d11-abcb-4148e5d7c368" alt=""><figcaption></figcaption></figure>
