谷歌发布了能够自主推理复杂问题的“思考模型”Gemini 2.5 正式版,并推出了将速度和成本效益发挥到极致的新模型。
在与人工智能 (AI) 对话时,我们有时会产生这样的好奇:“这家伙真的理解我问题的意图吗?还是只是以极快的速度拼凑出看似合理的回答?”如果说之前的 AI 更接近后者,那么现在,像人类一样经过“思考”后再回答的时代正在开启。
谷歌最近正式宣布了其尖端 AI 模型 Gemini 系列的新进化版本——“Gemini 2.5”系列的扩展。据称,它不仅比以前更聪明,还具备了在解决复杂问题前进行深度自主思考的能力。这个来到我们身边的智能助手具体发生了哪些变化?MindTickleBytes 为您深入浅出地梳理核心要点。Gemini 2.5: Updates to our family of thinking models
这为什么对我们很重要?
| 当我们使用智能手机或电脑时,最期待的是什么?大概是“能快速、准确且尽可能便宜地完成我布置的任务”。这正是谷歌大规模扩展 Gemini 2.5 系列的原因。[Google DeepMind Expands Gemini AI Models to… | HARU-AI.BLOG](https://haru-ai.blog/en/daily-news-en/gemini-ai-expansion-en/) |
如果说过去的 AI 模型更像是展示庞大体积和复杂结构的“科研型”产品,那么这次的 Gemini 2.5 系列则完全聚焦于实际的“可用性”。企业在处理海量数据时可以显著降低成本负担,而开发服务的开发者则可以根据情况直接调节 AI 的思考深度。打个比方,如果之前的 AI 是性能卓越但耗油量大的超跑,那么现在它已进化为能根据路况自由调节速度和油耗的尖端混合动力轿车。Gemini 2.5 model family expands
通俗理解:AI 也需要“思考时间”
本次发布中最引人注目的关键词是“思考模型 (Thinking model)”。AI 会思考究竟意味着什么呢?Gemini 2.5: Our newest Gemini model with thinking
1. 脱口而出的回答 vs 慎重深思的见解
请想象一下。 你正在解一道数学难题,旁边的朋友还没等读完题就喊出了答案。虽然有时会碰巧对,但如果是带有陷阱的复杂问题,出错的概率会非常高吧?相反,另一个朋友会闭上眼睛思考片刻,仔细把握问题的结构,然后有条不紊地逻辑解释道:“因为是这个原理,所以答案是这个。”
Gemini 2.5 就如同后一位朋友。在输出答案之前,它会先进行内部的“推理过程”。通过这种方式,在编写复杂的程序代码或面对需要高度逻辑思维的问题时,它能给出比以往更准确、更深入的回答。Gemini 2.5: Updates to our family of thinking models
2. “思考预算 (Thinking Budget)”这一惊人概念
更有趣的是,用户可以亲自决定 AI 的思考深度。谷歌将其称为“思考预算 (Thinking Budget)”。Gemini 2.5: Updates to our family of thinking models
简单来说,对于“推荐一下今天的午餐菜单”这类轻松的问题,可以让它减少思考,快速作答;而对于“在数千行复杂的代码中寻找安全漏洞”这类重任,则可以投入充足的预算(时间和资源)让它进行深度思考。这非常类似于我们快速处理琐碎的日常事务,而在决定人生大事时则会彻夜思索几天几夜。
现状:Gemini 2.5 家族的成员们
Gemini 是继谷歌之前推出的 LaMDA 和 PaLM 2 之后,谷歌最强大的 AI 家族。 Gemini (language model) - Wikipedia 通过这次扩展,家族成员根据各自的角色得到了进一步细分,让我们来看看都有哪些模型吧?
- Gemini 2.5 Pro: 智商最高、最多才多艺的大哥。现在已顺利结束试运行 (Preview) 阶段,进入正式发布 (GA, General Availability) 状态。其复杂的推理和编程能力堪称一绝。Google’s Gemini AI family updated with stable 2.5 Pro, super-efficient …
-
Gemini 2.5 Flash: 顾名思义,像闪电一样快速高效。它是性能与价格之间的完美平衡,在需要在短时间内处理海量任务时表现最为出色。[Models Gemini API Google AI for Developers](https://ai.google.dev/gemini-api/docs/models) - Gemini 2.5 Flash-Lite: 这次新加入的小弟模型。它是 Gemini 2.5 家族中最快、成本最低的,非常适合预算有限的个人开发者或重复性的简单任务。Gemini 2.5 model family expands
- Gemini 2.5 Flash Image: 专门用于绘制精美图像而不只是生成文字的模型。每 100 万个 Token 的成本约为 30 美元,打个比方,这意味着生成一张照片的成本仅需约 0.039 美元(约合人民币 0.28 元)。Introducing Gemini 2.5 Flash Image, our state-of-the-art image model
值得注意的是,所有这些模型都内置了“多模态 (Multimodal)”功能,即能够同时理解和处理文本、图像、音频等多种形式的数据,应用前景极其广阔。Gemini 2.5: Pushing the Frontier with Advanced Reasoning, Multimodality …
未来展望:我们将面对的明天
谷歌的这一举措并不仅仅是为了制造性能更好的机器。Gemini 2.5 是人工智能向“智能体系统 (Agentic systems,能够自主设定目标并使用工具完成复杂工作的系统)”进化的核心垫脚石。
参考资料
- Gemini (language model) - Wikipedia
- Gemini 2.5 model family expands
-
[We’re expanding our Gemini 2.5 family of models Hanzhao…](https://www.linkedin.com/posts/magical_were-expanding-our-gemini-25-family-of-activity-7340820864948457472-Jyi6) -
[Google DeepMind Expands Gemini AI Models to… HARU-AI.BLOG](https://haru-ai.blog/en/daily-news-en/gemini-ai-expansion-en/) -
[Google unveils a next-gen family of AI reasoning models TechCrunch](https://techcrunch.com/2025/03/25/google-unveils-a-next-gen-ai-reasoning-model/) -
[Models Gemini API Google AI for Developers](https://ai.google.dev/gemini-api/docs/models) - Gemini 2.5: Our newest Gemini model with thinking
- Gemini 3 — Google DeepMind
- Introducing Gemini 2.5 Flash Image, our state-of-the-art image model
- Expanding Gemini 2.5 Flash and Pro capabilities - Google Cloud
- Gemini 2.5: Updates to our family of thinking models
- Gemini 2.5: Pushing the Frontier with Advanced Reasoning, Multimodality …
- Google’s Gemini AI family updated with stable 2.5 Pro, super-efficient …
- Gemini 2.5 Pro
- Gemini 2.5 Flash-Lite
- Gemini 2.5 Image
- 响应速度绝对会变快
- 在给出回答前经过推理过程以提高准确度
- 无需联网即可运行
- 约 0.39 美元
- 约 0.039 美元
- 免费