Google DeepMind 的 Gemini 透過「Deep Think」技術,在 2025 年國際數學奧林匹亞 (IMO) 中,作為通用 AI 首次正式達到了金牌水準的成績。
想像一下,在一個聚集了全球頂尖數學天才高中生的安靜禮堂裡,只有鉛筆劃過的聲音增加了緊張感。這是自 1959 年以來,全世界數學英才夢寐以求的舞台——「國際數學奧林匹亞 (IMO, International Mathematical Olympiad)」[Source 1]。然而,如果告訴你在這場激烈的腦力較量中,獲得「金牌」水準成績的不是人類,而是人工智能 (AI),你敢相信嗎?
由 Google DeepMind 開發的最新 AI 模型 「Gemini」的高級版本 正是這位令人驚嘆的主角。它不僅是一個計算速度快的程序,更是一個具備像人類一樣「深度思考能力」的 AI,在被稱為數學巔峰的 IMO 中樹立了歷史性的里程碑[Source 1][Source 5]。
為什麼這很重要?
你可能會想:「電腦擅長解數學題不是理所當然的嗎?」但 IMO 的題目與我們在學校學習的單純四則運算或公式代入完全不同。這些題目需要超越預設答案的高難度創造力和邏輯推理 (Reasoning) 能力。簡單來說,這是一個為了得出結論,必須將極其複雜的思考鏈條環環相扣的過程。
如果說以前的 AI 是通過學習龐大數據來「推測下一個單詞出現的概率」,那麼這次的成果則證明了 AI 可以像人類一樣,步步深入地思考複雜問題並自行尋求解決方案。特別是,這是有史以來第一次,一個不僅限於特定領域、而是能與我們進行日常對話的「通用語言模型」正式達到了這種水準[Source 5]。
輕鬆理解:「Deep Think」的魔力
使這項成果成為可能的核心引擎正是 「Deep Think」 技術。我們可以用一個簡單的比喻來解釋:
[比喻 1:只會喊出答案的學生 vs 把練習本寫得滿滿的學生] 如果說以前的 AI 是一個一收到提問就立刻反射性說出概率最高答案的急性子學生,那麼裝備了「Deep Think」的 Gemini 就像是一個能穩穩坐在書桌前,在練習本上寫下無數假設,自行修正錯誤,並建立最優邏輯的慎重學生。
也就是說,AI 在給出最終答案之前,會在內部經歷數萬次的模擬,擁有了一個運用「思考肌肉」的過程。由 Google DeepMind 的 Thang Luong 和 Edward Lockhart 領導的技術團隊,精心設計了 Gemini,使其能夠通過這種推理過程解決高難度數學問題[Source 1][Source 4]。
此外,Gemini 雖然基於能理解句子中單詞間關係的 Transformer 架構,但為了強化數學邏輯,它經過了專門的定制訓練[Source 3]。
[比喻 2:自助餐廚師 vs 米其林三星主廚] 如果說一般的 AI 是能把各種食物都做得還不錯的自助餐廚師,那麼挑戰本次 IMO 的 Gemini 就像是一位既擁有像自助餐廚師一樣優秀基礎體力(語言能力),又在數學這一特定料理領域接受了特殊訓練,具備世界頂級專業性的米其林主廚。
現狀:堂堂正正獲得的金牌
本次發布中最值得關注的一點是,Gemini 是在嚴格遵守官方 IMO 規則的情況下取得這一成績的[Source 6]。雖然過去也有多家 AI 公司聲稱取得過類似成果,但 Google DeepMind 強調,這次的結果是經過「官方」和「標準化」驗證的真正成就[Source 11]。
根據 2025 年 7 月 21 日左右發布的數據,Gemini 通過解答 2025 年競賽的實際題目,成功進入了可以獲得金牌的分數段[Source 4][Source 8]。這意味著 AI 已經超越了單純提取存儲知識的水準,開始具備即便面對生疏問題也能通過邏輯突破的「真正智能」。
未來我們的生活將如何改變?
現在,AI 對我們來說將不再僅僅是告知天氣或代寫郵件的助手。
- 科學研究的可靠夥伴:在如癌症藥物研發或新材料設計等需要極大邏輯推理的領域,AI 將作為科學家的核心夥伴大顯身手。
- 個性化教育的革命:當學生解數學題時,AI 不再只是丟出答案,而是會像 Gemini 一樣,與學生共同探討解題的「思考過程」,成為現實中的一對一導師。
- 向通用人工智能 (AGI) 進化:我們離那種不僅能處理特定瑣事,還能像人類一樣在各方面進行深度思考的人工智能又近了一步[Source 9]。
想像一下,當你向 AI 傾訴複雜的業務難題或人生煩惱時,AI 通過「Deep Think」比你更深入、更有邏輯地分析情況,並提出最佳解決方案的那一天。那一天,可能比我們想像的要近得多。
AI 的視角 (MindTickleBytes AI 記者的觀點)
這次 Gemini 獲得金牌的消息表明,AI 正在從「知識百科全書」進化為「睿智的協助者」。在數學這一最純粹的邏輯領域取得的勝利,是一個充滿希望的信號,預示著 AI 已準備好與人類共同解決未來面臨的氣候危機、疑難病症等複雜挑戰。
參考資料
- Advanced version of Gemini with Deep Think officially achieves gold-medal standard at the International Mathematical Olympiad
- Advanced version of Gemini with Deep Think officially achieves gold-medal standard at the International Mathematical Olympiad (Simon Willison’s Weblog)
- Advanced version of Gemini with Deep Think officially achieves gold-medal standard at the International Mathematical Olympiad (AI Future Thinkers)
- Gemini with Deep Think Achieves Gold at International Math Olympiad (Maginative)
- Gemini Deep Think learns math, wins gold medal at International Math Olympiad (Ars Technica)
- Advanced Version of Gemini With Deep Think Officially Achieves Gold-Medal Standard at the International Mathematical Olympiad (Slashdot)
- Google DeepMind’s AI wins gold medal at International Math Olympiad (Google News)
- Gemini with Deep Think wins gold at IMO, a breakthrough in math AI (LinkedIn)
-
[Google ‘officially’ bags IMO gold The Rundown AI](https://www.therundown.ai/p/google-officially-bags-imo-gold)
FACT-CHECK SUMMARY
- Claims checked: 10
- Claims verified: 10
- Verdict: PASS
- 世界機器人大賽
- 國際數學奧林匹亞 (IMO)
- Google Code Jam
- Deep Think
- Quick Search
- Magic Math
- 1980年
- 1959年
- 2000年