Google的新型AI模型“Gemini Deep Think”在世界最具权威的数学竞赛IMO中完美解决了6道题中的5道,成为AI历史上首次获得官方认可的金牌级性能表现。
AI挑战数学天才的领地
想象一下,来自世界各地最擅长数学的青少年天才聚集一堂。为了在两天内解出区区6道题,他们伏案苦思,直到铅笔把纸磨破。这项赛事就是自1959年以来每年举办的世界最具权威的青少年数学竞赛——国际数学奥林匹克 (International Mathematical Olympiad, 简称 IMO) Advanced version of Gemini with Deep Think officially achieves gold …。
长期以来,AI 虽然擅长复杂计算,但在需要高度创造性和逻辑推理 (Reasoning,即根据给定信息得出结论的思考过程) 的 IMO 题目面前却屡屡碰壁。然而,在2025年夏天,传来了一个令人震惊的消息:Google DeepMind 的最新 AI 模型 “Gemini Deep Think” 打破了这道坚不可摧的围墙,取得了金牌级别的成绩 Advanced version of Gemini with Deep Think officially achieves gold-medal standard at the International Mathematical Olympiad - Google DeepMind。
这不仅仅是“解题解得好”的水平,而是正式证明了人工智能在被誉为人类智慧结晶的数学思维能力上已经达到了巅峰。现在,是时候让我们把 AI 视为共同探讨问题的伙伴,而不仅仅是简单的计算工具了。
为什么这很重要?“从计算器到思想家的进化”
我们常用的计算器或普通 AI 专注于快速找到答案。但解决数学难题就像是在迷雾笼罩的森林中寻找出路,必须在无数分岔口中明确选择这条路的逻辑依据,并一步步积累。
Gemini Deep Think 在此次 IMO 中取得的成果之所以非常特别,原因如下:
- 官方认可:这是 AI 系统首次在这场精英级别的竞争中获得 IMO 协调员的官方认可 AI in Mathematics: Gemini with DeepThinking Sets New Standard at …。如果说以前 AI 的挑战更接近于“参考”,那么现在它已与人类天才在同一标准下接受评价,并堂堂正正地证明了自己的实力。
- 自然语言的胜利:Gemini 并没有仅通过特殊的数学符号或代码进行交流。它像人类一样使用自然语言 (Natural Language,即我们日常使用的语言) 解决了复杂的数学问题 Google DeepMind makes AI history with gold medal win at world’s …。打个比方,这意味着它不仅是用公式解题,还用我们的语言娓娓道来地解释“为什么要得出这样的结论”。这表明 AI 并非将数学概念视为单纯的数字排列,而是通过人类的逻辑体系来理解。
- 智能衡量标准的转变:现在 AI 的性能表现正从“记住了多少数据”转向“能进行多深层次的思考和推理”。
轻松理解:“Gemini Deep Think”的魔力
简单来说,可以将 “Gemini Deep Think” 理解为从“急于给出答案的学生”转变为“仔细检查解题过程并深入思考的学生”。
普通 AI 在收到提问时,往往会在不到一秒钟内尝试给出答案。这在心理学中被称为“系统1思维(直觉且快速的反应)”。相比之下,Gemini Deep Think 在接收题目后,会自主建立多种假设,确认是否存在逻辑矛盾,并在遇到阻碍时寻找其他路径。这就是“系统2思维(缓慢但逻辑严密的推理)”,Google 将其称为“深度思考 (Deep Think)”。
举个例子,如果普通 AI 对“为什么这个苹果掉在地上了?”的回答是“因为重力”,那么应用了 Deep Think 的 Gemini 则会展示“计算物体质量与地球之间的引力,查看空气阻力有多少,自主审查是否存在其他变量,然后得出结论”的过程。
事实上,在此次竞赛中,Gemini 完美地 (Flawlessly) 解决了 6 道题中的 5 道,获得了 35 分 的总分,取得了金牌级别的成果 Advanced version of Gemini with Deep Think officially achieves gold-medal standard at the International Mathematical Olympiad - Google DeepMind, AdvancedversionofGeminiwithDeepThinkofficiallyachieves…。这是只有前 1% 的数学天才才能触及的领域。
当前进展:公平公正的对决
这次成果之所以更有价值,是因为 Google DeepMind 团队在参加竞赛时严格遵守了官方 IMO 规则 Gemini Deep Think learns math, wins gold medal at International Math …。虽然其他一些研究机构也声称其模型取得了类似成绩,但 Google 明确表示,他们是在与实际赛场最相似的限制条件下达成这一记录的 Google DeepMind’s AIachievesgoldatInternationalMathOlympiad…。
此外,该项目是 Google DeepMind 内部众多团队和研究人员通力协作取得的巨大成就 Advanced version of Gemini with Deep Think officially achieves gold …。核心研究员 Thang Luong 和 Edward Lockhart 强调,这一成果将成为 AI 加速科学发现的重要里程碑 Advanced version of Gemini with Deep Think officially achieves gold …。
未来展望:从数学迈向科学
擅长解数学题的 AI 对我们的生活有什么帮助?数学是所有科学的基础语言。用于解决 IMO 题目的“推理能力”将成为未来解决我们社会最棘手问题的钥匙。
- 新药研发:可以从数亿种分子组合中,通过逻辑推理找到既能治愈疾病又无副作用的组合。这不再是单纯尝试所有可能性,而是通过“思考”找到可能性最高的路径。
- 解决气候变化:分析复杂的气象数据,提出可以减缓全球变暖的最佳能源政策方案。
- 编程:Gemini Deep Think 的增强版本已经在国际大学生程序设计竞赛 (ICPC) 世界总决赛中取得了金牌级别的成绩,预示着软件开发方式的变革 Gemini achieves gold-medal level at the International Collegiate Programming Contest World Finals — Google DeepMind。
DeepMind 自 2025 年夏天取得这一成果以来一直在不断改进模型,目前普通用户也可以通过 Gemini 应用程序直接体验这一“深度思考”功能的部分特性 Try Deep Think in the Gemini app。
AI 视角 (MindTickleBytes 的 AI 记者视角)
此次 Gemini 获得金牌,象征着 AI 已超越单纯的数据“模仿”,进入了像人类一样“深度思考并解决问题”的阶段。既然在数学这一最严谨、最严苛的逻辑世界中取得了成果,我们非常期待作为未来能与我们共同探讨复杂问题的可靠“思考伙伴”,AI 将创造出怎样的未来。现在,AI 正在超越单纯给出答案的存在,成为与我们共同寻找答案的存在。
参考资料
- Advanced version of Gemini with Deep Think officially achieves gold-medal standard at the International Mathematical Olympiad - Google DeepMind
- Advanced version of Gemini with Deep Think officially achieves gold-medal standard at the International Mathematical Olympiad - Simon Willison
- Gemini achieves gold-medal level at the International Collegiate Programming Contest World Finals — Google DeepMind
- Gemini Deep Think: Redefining the Future of Scientific Research — Google DeepMind
- Try Deep Think in the Gemini app
- Advanced version of Gemini with Deep Think officially achieves gold … - Google DeepMind Blog
- Gemini Deep Think learns math, wins gold medal at International Math … - Ars Technica
- AI in Mathematics: Gemini with DeepThinking Sets New Standard at … - Promptwire
- Google DeepMind makes AI history with gold medal win at world’s … - VentureBeat
- Advanced version of Gemini with Deep Think officially achieves gold … - IT Consulting Group
- Gemini(language model) - Wikipedia
- AdvancedversionofGeminiwithDeepThinkofficiallyachieves… - LinkedIn (lmarmot)
- Google DeepMind’s AIachievesgoldatInternationalMathOlympiad… - Google News
- AdvancedversionofGeminiwithDeepThinkofficiallyachieves… - Sunface
- AdvancedversionofGeminiwithDeepThinkofficiallyachieves… - All Headline
- 30分
- 35分
- 42分
- 解题速度最快
- 使用了数学专用计算程序
- 作为AI系统首次获得了竞赛协调员的正式认可
- 1959年
- 1990년
- 2000년