AI会“思考”后再回答?谷歌全新“思考模型”Gemini 2.5全解析

谷歌 Gemini 2.5 徽标与象征“Thinking”过程的抽象神经网络图形和谐交融的画面
AI Summary

谷歌下一代 AI Gemini 2.5 通过内部推理过程提供更准确的回答,并推出了兼顾高性能与低成本的全新 Flash-Lite 模型。

想象一下。当你收到一道非常难的数学题时,你会直接脱口而出脑海中浮现的第一个数字吗?还是会在纸上写下解题过程,一边想“啊,这题应该这么解”,一边思考后再给出答案?到目前为止,大多数 AI 更接近前者。它们在收到提问后,会立即给出统计学上最合乎逻辑的回答。然而,谷歌最新推出的 AI —— Gemini 2.5 已经开始像后者一样,在整理思路、权衡逻辑后给出答案了。Gemini 2.5: Our newest Gemini model with thinking

由谷歌 DeepMind 开发的 Gemini 是一款多模态 (Multimodal) 人工智能,能够同时理解和处理文本、图像、音频、视频等多种形式的信息。Gemini: A Family of Highly Capable Multimodal Models 它也是继承了谷歌以往 AI 模型 LaMDA 和 PaLM 2 技术实力的强大后继者。Gemini (language model) - Wikipedia 通过本次更新,Gemini 2.5 已超越了单纯的“回答机器”,进化为具备自主推理能力的“思考模型”。

为什么这很重要?

我们在使用 AI 时,最尴尬的时刻莫过于 AI 煞有介事地把错误信息当成事实说出来。这在专业术语中被称为幻觉 (Hallucination)。像 Gemini 2.5 这样的“思考模型”能够显著减少此类错误。因为它在输出回答之前,会经历一段内部不可见的推理过程。Gemini 2.5: Updates to our family of thinking models – ONMINE

简单来说,在点击“回答”按钮之前,AI 会进行自问自答并审查:“我的逻辑对吗?下一步是否还有需要考虑的变量?”Gemini 2.5: Updates to our family of thinking models 打个比方,这就像一个原本急于回答的孩子,现在变得冷静下来,读完题目、确认解题步骤后才开口。这种内部的“思考过程”在解决复杂数学题、进行高级编程开发以及处理海量数据分析等需要严谨多步操作的任务中,将发挥出真正的价值。[Gemini thinking Gemini API Google AI for Developers](https://ai.google.dev/gemini-api/docs/thinking)

深度解析:AI 的“思考预算”

Gemini 2.5 最令人惊叹的功能之一是,用户可以为 AI 直接设置“思考预算 (Thinking Budget)”Gemini 2.5: Updates to our family of thinking models 这是一种指导方针,决定了 AI 为解决特定问题愿意投入多少时间和资源进行“思考”。

我们可以用烹饪来打个比方:

  • 煮一碗简单的拉面时(简单的问题): 没必要浪费时间研究复杂的食谱。此时,调低“思考预算”,快速获得答案即可。
  • 为重要客人准备五道菜的大餐时(复杂的问题): 必须精确计算从菜肴搭配、食材处理顺序到烹饪时间的每一个细节。此时,调高“思考预算”,引导 AI 进行深入思考并给出最佳结果。

正因如此,Gemini 2.5 能够根据情况的轻重缓急灵活调节思考深度,非常高效。Gemini 2.5: Updates to our family of thinking models

Gemini 2.5 家族介绍:从 Pro 到 Flash-Lite

Gemini 2.5 根据用户目的和环境分为三个型号:Gemini (language model) - Wikipedia

  1. Gemini 2.5 Pro: 扮演最聪明的“大脑”角色。它在复杂推理和编程能力方面,以压倒性优势刷新了现有的性能基准 (Benchmark) 分数,目前已提供正式版本。Gemini 2.5: Our newest Gemini model with thinking, Gemini 2.5: Updates to our family of thinking models - Solega Blog
  2. Gemini 2.5 Flash: 兼顾速度与效率。本次更新显著提升了其“Agent 级工具调用 (Agentic tool use)”能力。Continuing to bring you our latest models, with an improved Gemini 2.5 Flash and Flash-Lite release 这意味着 AI 不再仅仅是给出答案,而是能够自主寻找所需工具,直接执行复杂的连锁任务。
  3. Gemini 2.5 Flash-Lite: 本次新加入的小型化型号。它在保持性能的同时大幅降低了使用成本,目前正处于预览阶段,展示着其潜力。Gemini 2.5: Updates to our family of thinking models

这些模型就像根据不同场景选择的交通工具。搬运重物时选择马力强劲的大货车 (Pro),在市区快速穿梭时选择机动性强的摩托车 (Flash),而低成本频繁搬运轻量货物时则选择电动滑板车 (Flash-Lite)。

现状与未来展望

谷歌研究团队正在通过 Flash 系列模型不断拓展“帕累托前沿 (Pareto frontier)”Gemini 2.5: Updates to our family of thinking models - Solega Blog 简单来说,这意味着他们正不断突破技术界限,致力于打造“更聪明、更便宜、更快速”的 AI。

目前,Gemini 2.5 Pro 和 Flash 已达到普通用户可以稳定使用的正式服务阶段 (General Availability)。[Gemini 2.5: Updates to our family of thinking models… TechNews](https://news-tech.io/en/news/gemini-25-updates-to-our-family-of-thinking-models), Gemini 2.5: Updates to our family of thinking models 这预示着不久之后,我们就能在使用的众多 App 和服务中直接体验到 AI 的“思考能力”。

Gemini 2.5 的出现标志着 AI 正在超越简单的助手,进化为能洞察我们的意图并代劳复杂任务的真正“Agent (代理人)”Continuing to bring you our latest models, with an improved Gemini 2.5 Flash and Flash-Lite release 未来,不再只是“帮我推荐今晚的菜单”,而是“考虑到我的预算和口味偏好,制定一周食谱,并将缺少的食材放入在线购物车”这类复杂请求,都将由 AI 自主思考并处理。Continuing to bring you our latest models, with an improved Gemini 2.5 Flash and Flash-Lite release

各位读者,下次与 AI 对话时,不妨想象一下,在屏幕的另一端,AI 正努力解开“思路的丝线”,为寻找最佳答案而深思熟虑。

AI 视角

MindTickleBytes AI 记者的视角: Gemini 2.5 象征着 AI 已正式跨越简单的信息罗列,迈入“逻辑思维”领域。特别是用户可以调节 AI 思考深度的“思考预算”功能,是一个非常聪明的切入点,展示了 AI 技术在人类控制下正变得更加实用且经济。现在,AI 已经不再仅仅追求“快速”回答,而是学会了为了寻找“正确”答案而驻足思考。

参考资料

  1. Gemini (language model) - Wikipedia
  2. Gemini 2.5: Our newest Gemini model with thinking
  3. Gemini 2.5: Updates to our family of thinking models – ONMINE
  4. Gemini 2.5: Updates to our family of thinking models - Solega Blog
  5. [Gemini 2.5: Updates to our family of thinking models… TechNews](https://news-tech.io/en/news/gemini-25-updates-to-our-family-of-thinking-models)
  6. Gemini 2.5: Updates to our family of thinking models
  7. [Gemini thinking Gemini API Google AI for Developers](https://ai.google.dev/gemini-api/docs/thinking)
  8. Gemini 2.5: Updates to our family of thinking models
  9. Gemini 2.5: Updates to our family of thinking models
  10. Gemini: A Family of Highly Capable Multimodal Models
  11. Continuing to bring you our latest models, with an improved Gemini 2.5 Flash and Flash-Lite release

FACT-CHECK SUMMARY

  • Claims checked: 20
  • Claims verified: 20
  • Verdict: PASS
测试你的理解
Q1. Gemini 2.5 模型最大的特点是什么?
  • 只能生成图像
  • 回答前会进行内部推理
  • 仅在搜索引擎中运行
Gemini 2.5 在生成回答之前,会经历一个整理思路、权衡逻辑的‘思考过程’,从而提高准确度。
Q2. Gemini 2.5 家族中将成本效益发挥到极致的新模型名称是?
  • Gemini 2.5 Pro
  • Gemini 2.5 Flash
  • Gemini 2.5 Flash-Lite
Gemini 2.5 Flash-Lite 是在保持高性能的同时,为实现更低成本而设计的模型。
Q3. 在本次更新中,Gemini 2.5 Flash 模型在哪方面得到了显著改进?
  • 音乐创作能力
  • Agent 级工具调用能力
  • 单纯的计算速度
通过最新更新,Gemini 2.5 Flash 执行复杂多步任务的‘Agent 级工具调用’能力得到了极大提升。