# 快速了解

<figure><img src="https://293311848-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2F7GGz8p5Vv0PvFaH88Kde%2Fuploads%2F8py961ehoWyo3AkiPDPx%2Fimage.png?alt=media&#x26;token=df244f6b-3318-4565-b499-77609cc5537f" alt=""><figcaption></figcaption></figure>

### 什么是Gemini? <a href="#shen-me-shi-shan-jing-ai" id="shen-me-shi-shan-jing-ai"></a>

Gemini 3 是我们迄今为止最智能的模型系列，建立在先进的推理技术基础上。 它旨在通过掌握智能体工作流、自主编码和复杂的多模态任务，将任何想法变为现实。 本指南介绍了Gemini 3 模型系列的主要功能，以及如何充分利用这些功能。

### 认识一下 Gemini 3 <a href="#meet_gemini_3" id="meet_gemini_3"></a>

最强且没有之一的视觉推理模型，以及拖后腿的Google产品。

在gemini 3.0 pro问世之前，无论是数学、代码、文字、创意……一切需要大模型的形态，[GPT-5.1](https://zhida.zhihu.com/search?content_id=757600087\&content_type=Answer\&match_order=1\&q=GPT-5.1\&zd_token=eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJpc3MiOiJ6aGlkYV9zZXJ2ZXIiLCJleHAiOjE3NjQ2ODY5MjIsInEiOiJHUFQtNS4xIiwiemhpZGFfc291cmNlIjoiZW50aXR5IiwiY29udGVudF9pZCI6NzU3NjAwMDg3LCJjb250ZW50X3R5cGUiOiJBbnN3ZXIiLCJtYXRjaF9vcmRlciI6MSwiemRfdG9rZW4iOm51bGx9.5RQLpx1BJyF0XeKGioV9Kt8DCG9nWcKdKMDTPns0v4A\&zhida_source=entity)基本上都能够占据绝对能力第一名，或者是难分高下的并列第一名.

就是你只要没有网络、支付、预算的问题，那么任何需求基本上都可以无脑选择GPT来解决，如果GPT解决不了，在同量级成本下，其他模型也不会做得更好了。

除了一个领域——多模态。

在这个领域，和GPT形成竞争的是Doubao-Seed-1.6-vision。在对图像的理解的绝对能力上，Doubao比GPT略差一点，但是这个差距远无法弥补他们俩之间的高差价，他们俩之间能力和价格的距离，有点像年初Deepseek-r1和openai-o1之间的距离——都知道o1应该会强一点，但是正常人是不可能弃R1不用，去用O1的。

所以大量vl、图像理解的工程，Doubao都是第一首选。

但无论是Doubao，还是你愿意花钱，用GPT 5.1，或者是Gemini 2.5 pro，都有一个对人类来说不是很难（虽然有点麻烦）的任务，大模型是完不成的。

### **模型：**

**无论是完成日常任务，还是解决复杂问题，都能找到适合您需求的模型。**

Gemini 为你的日常生活带来理性和智慧。

<table data-view="cards"><thead><tr><th></th><th data-hidden data-card-cover data-type="image">Cover image</th></tr></thead><tbody><tr><td><h4>3 Pro</h4><p>最适合处理复杂任务，并将创意概念变为现实。</p></td><td><a href="https://293311848-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2F7GGz8p5Vv0PvFaH88Kde%2Fuploads%2Flhw5rX4SpLmDyWju0yWy%2Fimage.png?alt=media&#x26;token=552167c0-77f0-48c8-b303-8dae90bfa43f">image.png</a></td></tr><tr><td><h4>2.5 Flash</h4><p>最适合快速完成日常任务</p></td><td><a href="https://293311848-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2F7GGz8p5Vv0PvFaH88Kde%2Fuploads%2F8y4YFcAlZfoK8JeJwoyt%2Fimage.png?alt=media&#x26;token=9820b226-2100-498d-9e2f-7ec2f1b0097b">image.png</a></td></tr><tr><td><h4>2.5 Flash-Lite</h4><p>最适合大批量、高性价比的任务</p></td><td><a href="https://293311848-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2F7GGz8p5Vv0PvFaH88Kde%2Fuploads%2FKbclUgqf5nqHo18hWoji%2Fimage.png?alt=media&#x26;token=b7a9471c-9ea3-4305-bbd0-548aebdffcb0">image.png</a></td></tr></tbody></table>

### 能力：

**Gemini 3 将这些功能整合在一起，让您能够将任何想法变为现实。**

1. **学习任何知识：**&#x7528;清晰、简洁、有用的回答，以易于理解的方式理解复杂的主题。
2. **建造任何东西：**&#x5C06;您的想法变为现实——从草图和提示到互动工具和体验。
3. **计划任何事：**&#x59D4;派任务和多步骤项目，以前所未有的速度完成工作。<br>

### 表现：

**Gemini 3 在各项基准测试中均处于最先进水平。**

我们迄今为止最智能的模型为人工智能模型的性能树立了新的标杆。

<table data-full-width="false"><thead><tr><th width="163">基准</th><th width="171.6666259765625"></th><th width="114.6666259765625">Gemini 3 Pro</th><th width="97.33349609375">Gemini 2.5 Pro</th><th width="104.6666259765625">Claude Sonnet 4.5</th><th>GPT-5.1</th></tr></thead><tbody><tr><td><p><sup><sub>学术推理</sub></sup></p><p>人类的最后考试</p></td><td><sub>无需工具</sub></td><td>37.5%</td><td>21.6%</td><td>13.7%</td><td>26.5%</td></tr><tr><td></td><td><sub>通过搜索和代码执行</sub></td><td>45.8%</td><td>-</td><td>-</td><td>-</td></tr><tr><td><p><sub>视觉推理谜题</sub></p><p>ARC-AGI-2</p></td><td><sub>ARC 奖项已核实</sub></td><td>31.1%</td><td>4.9%</td><td>13.6%</td><td>17.6%</td></tr><tr><td><p><sub>科学知识</sub></p><p>GPQA钻石级</p></td><td><sub>无需工具</sub></td><td>91.9%</td><td>86.4%</td><td>83.4%</td><td>88.1%</td></tr><tr><td><p><sub>数学</sub></p><p>AIME 2025</p></td><td><sub>无需工具</sub></td><td>95.0%</td><td>88.0%</td><td>87.0%</td><td>94.0%</td></tr><tr><td></td><td><sub>通过代码执行</sub></td><td>100.0%</td><td>-</td><td>100.0%</td><td>-</td></tr><tr><td><p><sub>具有挑战性的数学竞赛题目</sub></p><p>MathArena Apex</p></td><td></td><td>23.4%</td><td>0.5%</td><td>1.6%</td><td>1.0%</td></tr><tr><td><p><sub>多模态理解与推理</sub></p><p>MMMU-Pro</p></td><td></td><td>81.0%</td><td>68.0%</td><td>68.0%</td><td>76.0%</td></tr><tr><td><p><sub>屏幕理解</sub></p><p>ScreenSpot-Pro</p></td><td></td><td>72.7%</td><td>11.4%</td><td>36.2%</td><td>3.5%</td></tr><tr><td><sub>从复杂图表中综合信息</sub>CharXiv 推理</td><td></td><td>81.4%</td><td>69.6%</td><td>68.5%</td><td>69.5%</td></tr><tr><td><p><sub>OCR</sub></p><p>OmniDocBench 1.5</p></td><td><sub>整体编辑距离，越低越好</sub></td><td>0.115</td><td>0.145</td><td>0.145</td><td>0.147</td></tr><tr><td><p><sub>从视频中获取知识</sub></p><p>视频-MMMU</p></td><td></td><td>87.6%</td><td>83.6%</td><td>77.8%</td><td>80.4%</td></tr><tr><td><sub>竞争性编程问题</sub>LiveCodeBench Pro</td><td><sub>Elo 等级分越高越好</sub></td><td>2,439</td><td>1,775</td><td>1,418</td><td>2,243</td></tr><tr><td><p><sub>代理终端</sub></p><p>编码终端工作台 2.0</p></td><td><sub>终点站-2 特工</sub></td><td>54.2%</td><td>32.6%</td><td>42.8%</td><td>47.6%</td></tr><tr><td><p><sub>代理编码</sub></p><p>SWE-Bench 验证</p></td><td><sub>单次尝试</sub></td><td>76.2%</td><td>59.6%</td><td>77.2%</td><td>76.3%</td></tr><tr><td><p><sub>代理工具的使用</sub></p><p>τ2-bench</p></td><td></td><td>85.4%</td><td>54.9%</td><td>84.7%</td><td>80.2%</td></tr><tr><td><p><sub>长时程智能体任务</sub></p><p>自动售货长椅 2</p></td><td><sub>净资产（平均值），越高越好</sub></td><td>5,478.16 美元</td><td>573.64美元</td><td>3,838.74 美元</td><td>1473.43美元</td></tr><tr><td><p><sub>坚持内部基础、参数化、MM 和搜索检索基准</sub></p><p>FACTS 基准测试套件</p></td><td></td><td>70.5%</td><td>63.4%</td><td>50.4%</td><td>50.8%</td></tr><tr><td><p><sub>参数知识</sub></p><p>SimpleQA 已验证</p></td><td></td><td>72.1%</td><td>54.5%</td><td>29.3%</td><td>34.9%</td></tr><tr><td><p><sub>多语言问答</sub></p><p>MMMLU</p></td><td></td><td>91.8%</td><td>89.5%</td><td>89.1%</td><td>91.0%</td></tr><tr><td><p><sub>跨越100种语言和文化的常识推理</sub></p><p>全球PIQA</p></td><td></td><td>93.4%</td><td>91.5%</td><td>90.1%</td><td>90.9%</td></tr><tr><td><p><sub>长上下文表现</sub></p><p>MRCR v2（8针）</p></td><td><sub>128k（平均）</sub></td><td>77.0%</td><td>58.0%</td><td>47.1%</td><td>61.6%</td></tr><tr><td></td><td><sub>1M（逐点）</sub></td><td>26.3%</td><td>16.4%</td><td>不支持</td><td>不支持</td></tr></tbody></table>

**Gemini 3 深思熟虑，它突破了智能的界限，使 Gemini 3 的推理和多模态理解能力实现了质的飞跃，从而帮助您解决最复杂的问题。**

Gemini 3 Deep Think 可以更好地帮助解决需要创造力、战略规划和逐步改进的问题。

<figure><img src="https://293311848-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2F7GGz8p5Vv0PvFaH88Kde%2Fuploads%2F6OzwPMGNlu4h8BYlHxXb%2Fimage.png?alt=media&#x26;token=ab63066e-f1c1-4d11-abcb-4148e5d7c368" alt=""><figcaption></figcaption></figure>


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://docs.2sj.ai/gemini/introduction.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
