谷歌 DeepMind 的 “Gemini Deep Think” 在 2025 年国际数学奥林匹克竞赛中解决了 6 道题目中的 5 道,正式创下了金牌水平的成绩。
AI 登上数学巅峰:Gemini 的金牌挑战
想象一下。来自世界各地最擅长数学的天才们聚集在一起。他们不仅仅是计算速度快的孩子。他们是能够为了解决无人能解的难题而苦思冥想数小时,并创造出新逻辑体系的“创造性天才”。这项赛事就是自 1959 年以来每年举办一次的、世界上最权威的青少年数学竞赛——国际数学奥林匹克竞赛 (IMO, International Mathematical Olympiad) Advanced version of Gemini with Deep Think officially achieves gold …。
然而在 2025 年,这一历史性的赛事中发生了一件令人惊讶的事情。非人类的人工智能 (AI)——谷歌 DeepMind 的 Gemini 获得了金牌水平的成绩 AI in Mathematics: Gemini with DeepThinking Sets New Standard at …。这意味着人工智能不再仅仅是加减乘除的计算器,而是作为能够独立思考和展开逻辑的“数学家”获得了正式认可。
为什么这很重要? (Why It Matters)
如果你问我们常用的聊天机器人“1,234 乘以 5,678 是多少?”,它会在 0.1 秒内给出答案。但如果你说“证明为什么这个几何定理成立”,情况就完全不同了。因为数学证明要求的不是给出背诵的答案,而是高度的推理 (Reasoning,基于已知知识得出新结论的过程) 能力。
这次成就对我们具有特殊意义,原因有三点:
- 实际专家的正式认可:这次成绩不仅仅是谷歌单方面的说法。它得到了实际评阅国际数学奥林匹克竞赛试题的协调员们的正式确认。这是 AI 系统首次在人类精英水平上得到正式的能力验证 AI in Mathematics: Gemini with DeepThinking Sets New Standard at …。
- 像我们一样交流和思考:Gemini 并不是通过编写复杂的编程语言代码来得出答案的。它像我们人类一样,使用自然语言 (Natural Language,人日常使用的语言) 来理解问题并描述解决过程 Google DeepMind’s Gemini wins Mathematical Olympiad gold using …。
- 思维肌肉变得强壮:该模型配备了名为“Deep Think”的特殊模式。这是一种让 AI 在仓促下结论之前,能像人类深思熟虑一样,进行更深入、更复杂思考的技术 Advanced version of Gemini with Deep Think officially achieves gold …。
易于理解:Gemini 的“Deep Think”是如何运作的? (The Explainer)
为了理解 AI 解决困难数学问题的过程,我们可以将其比喻为我们身边熟悉的事物。
比喻 1:“快嘴说唱歌手” vs “沉稳的哲学家”
如果说现有的 AI 是在收到问题后立即吐出概率最高单词的“快嘴说唱歌手”,那么 Gemini Deep Think 则更像是在给出答案前在脑海中描绘无数场景的“哲学家”。简单来说,该模型使用并行思维 (Parallel Thinking,同时进行多种思考的方式) 技术,针对一个问题从多个角度审查成千上万种解决方案,并选择最逻辑化的路径 Advanced version of Gemini with Deep Think officially achieves gold …。
比喻 2:漆黑迷宫中的探险家
解决数学问题类似于在不知道出口在哪里的巨大迷宫中寻找路径。普通的 AI 在遇到死胡同时会迷失方向并停下,但处于 Deep Think 模式的 Gemini 表现得像个探险家。它会自己判断并修正逻辑之路:“啊,这条路堵住了?那回到刚才经过的岔路口,再往右走试试!”形象地说,在自己寻找错误答案并修正为正确答案的过程中,它最终解决了总共 6 道题中的 5 道,表现令人惊叹 Google News - Google DeepMind, OpenAI achieve gold at math…。
这一令人惊叹的项目是在 Thang Luong 的技术领导和 Edward Lockhart 的协作下完成的 Advanced version of Gemini with Deep Think officially achieves gold …。
现状:达到了什么水平? (Where We Stand)
Gemini 在本次竞赛中获得了 35 分 的成绩 World’s First AI Wins Gold in IMO: Google’s Gemini Scores 35, Shocks Judges。打个比方,在世界前 0.1% 的数学天才中,它达到了能够被认可并被邀请“加入我们队!”,堂堂正正摘得金牌的水平。
| 有趣的是 AI 行业激烈的“脑力竞赛”。就在谷歌发布这一消息的前两天,OpenAI 的 ChatGPT 也传出了在数学奥林匹克竞赛中获得金牌水平成就的消息 Google Gemini wins the IMO 2025 after ChatGPT: another AI conquers the …。这意味着人工智能之间也开启了比拼“谁更擅长复杂推理”的奥林匹克时代 [Google ‘officially’ bags IMO gold | The Rundown AI](https://www.therundown.ai/p/google-officially-bags-imo-gold)。 |
当然,AI 并没有成为完美的“数学之神”。Gemini 也没能解出所给 6 道题中的最后 1 道 Google News - Google DeepMind, OpenAI achieve gold at math…。这表明 AI 并非神奇地得知正确答案,而是通过激烈地模仿人类思维过程,正在一步步成长。
未来会怎样? (What’s Next)
你可能会想:“数学奥林匹克金牌和我的生活有什么关系?”但这项技术不仅限于代做数学作业,它具有改变我们世界的潜力。
- 新技术的诞生:在开发新药或设计高效存储绿色能源的材料时,需要极其复杂的数学模型。像 Gemini 这样的“推理型 AI”可以将科学家们原本需要苦思冥想数年的研究时间缩短到仅仅几个小时。
- 真正聪明的人工智能助手:如果说目前的 AI 只是执行诸如“告诉我明天的天气”之类的命令,未来的 AI 将能执行更高层次的任务,如“分析我们公司过去 3 年的销售数据,并逻辑性地提出明年的市场策略”。
- 教育方式的大变革:仅仅追求正确答案的教育现在已成为 AI 的领域。未来的学生将通过与 AI 对话,共同思考“为什么会得出这样的结论?”,并以此为工具,朝着培养解决更大难题的“逻辑协作能力”的方向发展。
谷歌强调,这是通用语言 AI 首次正式达到此类水平 Gemini with Deep Think Achieves Gold at International Math Olympiad。我们现在正见证一个与“会思考的 AI”而非仅仅是“拥有知识的 AI”共同生活的新世界。
AI 的视角 (AI’s Take)
MindTickleBytes AI 记者的视角:Gemini 的这次金牌证明了 AI 正在从简单的“数据检索器”进化为“知识创造者”。征服了人类几千年来积累的逻辑精华——“数学”之后,AI 的下一个目标会是哪里?也许会是气候危机、难治性疾病等人类面临的更为复杂且没有标准答案的现实世界难题。AI 现在不再是人类的竞争对手,而是作为最强大的“智力合作伙伴”站在我们身边。
参考资料
- Advanced version of Gemini with Deep Think officially achieves gold …
- AI in Mathematics: Gemini with DeepThinking Sets New Standard at …
- Advanced version of Gemini with Deep Think officially achieves gold …
- Gemini Deep Think learns math, wins gold medal at International Math …
- Gemini with Deep Think Achieves Gold at International Math Olympiad
- World’s First AI Wins Gold in IMO: Google’s Gemini Scores 35, Shocks Judges
- Google News - Google DeepMind, OpenAI achieve gold at math…
- Gemini with Deep Think wins gold at IMO, a breakthrough in math AI
- Advanced version of Gemini with Deep Think officially achieves gold …
-
[Google ‘officially’ bags IMO gold The Rundown AI](https://www.therundown.ai/p/google-officially-bags-imo-gold) - Google DeepMind’s Gemini wins Mathematical Olympiad gold using …
- Google Gemini wins the IMO 2025 after ChatGPT: another AI conquers the …
FACT-CHECK SUMMARY
- Claims checked: 16
- Claims verified: 16
- Verdict: PASS
- 25分
- 30分
- 35分
- 6 题中的 4 题
- 6 题中的 5 题
- 6 题中的 6 题
- 直觉思维
- 并行思维 (Parallel Thinking)
- 单纯记忆