數學天才的舞台「IMO」,AI 竟然拿到了金牌?Google Gemini 的驚人進化

在寫滿複雜數學符號的黑板前,閃耀的金牌與 Google Gemini 標誌相得益彰的景象
AI Summary

Google DeepMind 的 Gemini 透過「Deep Think」技術,在 2025 年國際數學奧林匹亞 (IMO) 中,作為通用 AI 首次正式達到了金牌水準的成績。

想像一下,在一個聚集了全球頂尖數學天才高中生的安靜禮堂裡,只有鉛筆劃過的聲音增加了緊張感。這是自 1959 年以來,全世界數學英才夢寐以求的舞台——「國際數學奧林匹亞 (IMO, International Mathematical Olympiad)」[Source 1]。然而,如果告訴你在這場激烈的腦力較量中,獲得「金牌」水準成績的不是人類,而是人工智能 (AI),你敢相信嗎?

由 Google DeepMind 開發的最新 AI 模型 「Gemini」的高級版本 正是這位令人驚嘆的主角。它不僅是一個計算速度快的程序,更是一個具備像人類一樣「深度思考能力」的 AI,在被稱為數學巔峰的 IMO 中樹立了歷史性的里程碑[Source 1][Source 5]

為什麼這很重要?

你可能會想:「電腦擅長解數學題不是理所當然的嗎?」但 IMO 的題目與我們在學校學習的單純四則運算或公式代入完全不同。這些題目需要超越預設答案的高難度創造力和邏輯推理 (Reasoning) 能力。簡單來說,這是一個為了得出結論,必須將極其複雜的思考鏈條環環相扣的過程。

如果說以前的 AI 是通過學習龐大數據來「推測下一個單詞出現的概率」,那麼這次的成果則證明了 AI 可以像人類一樣,步步深入地思考複雜問題並自行尋求解決方案。特別是,這是有史以來第一次,一個不僅限於特定領域、而是能與我們進行日常對話的「通用語言模型」正式達到了這種水準[Source 5]

輕鬆理解:「Deep Think」的魔力

使這項成果成為可能的核心引擎正是 「Deep Think」 技術。我們可以用一個簡單的比喻來解釋:

[比喻 1:只會喊出答案的學生 vs 把練習本寫得滿滿的學生] 如果說以前的 AI 是一個一收到提問就立刻反射性說出概率最高答案的急性子學生,那麼裝備了「Deep Think」的 Gemini 就像是一個能穩穩坐在書桌前,在練習本上寫下無數假設,自行修正錯誤,並建立最優邏輯的慎重學生。

也就是說,AI 在給出最終答案之前,會在內部經歷數萬次的模擬,擁有了一個運用「思考肌肉」的過程。由 Google DeepMind 的 Thang Luong 和 Edward Lockhart 領導的技術團隊,精心設計了 Gemini,使其能夠通過這種推理過程解決高難度數學問題[Source 1][Source 4]

此外,Gemini 雖然基於能理解句子中單詞間關係的 Transformer 架構,但為了強化數學邏輯,它經過了專門的定制訓練[Source 3]

[比喻 2:自助餐廚師 vs 米其林三星主廚] 如果說一般的 AI 是能把各種食物都做得還不錯的自助餐廚師,那麼挑戰本次 IMO 的 Gemini 就像是一位既擁有像自助餐廚師一樣優秀基礎體力(語言能力),又在數學這一特定料理領域接受了特殊訓練,具備世界頂級專業性的米其林主廚。

現狀:堂堂正正獲得的金牌

本次發布中最值得關注的一點是,Gemini 是在嚴格遵守官方 IMO 規則的情況下取得這一成績的[Source 6]。雖然過去也有多家 AI 公司聲稱取得過類似成果,但 Google DeepMind 強調,這次的結果是經過「官方」和「標準化」驗證的真正成就[Source 11]

根據 2025 年 7 月 21 日左右發布的數據,Gemini 通過解答 2025 年競賽的實際題目,成功進入了可以獲得金牌的分數段[Source 4][Source 8]。這意味著 AI 已經超越了單純提取存儲知識的水準,開始具備即便面對生疏問題也能通過邏輯突破的「真正智能」。

未來我們的生活將如何改變?

現在,AI 對我們來說將不再僅僅是告知天氣或代寫郵件的助手。

  1. 科學研究的可靠夥伴:在如癌症藥物研發或新材料設計等需要極大邏輯推理的領域,AI 將作為科學家的核心夥伴大顯身手。
  2. 個性化教育的革命:當學生解數學題時,AI 不再只是丟出答案,而是會像 Gemini 一樣,與學生共同探討解題的「思考過程」,成為現實中的一對一導師。
  3. 向通用人工智能 (AGI) 進化:我們離那種不僅能處理特定瑣事,還能像人類一樣在各方面進行深度思考的人工智能又近了一步[Source 9]

想像一下,當你向 AI 傾訴複雜的業務難題或人生煩惱時,AI 通過「Deep Think」比你更深入、更有邏輯地分析情況,並提出最佳解決方案的那一天。那一天,可能比我們想像的要近得多。


AI 的視角 (MindTickleBytes AI 記者的觀點)

這次 Gemini 獲得金牌的消息表明,AI 正在從「知識百科全書」進化為「睿智的協助者」。在數學這一最純粹的邏輯領域取得的勝利,是一個充滿希望的信號,預示著 AI 已準備好與人類共同解決未來面臨的氣候危機、疑難病症等複雜挑戰。


參考資料

  1. Advanced version of Gemini with Deep Think officially achieves gold-medal standard at the International Mathematical Olympiad
  2. Advanced version of Gemini with Deep Think officially achieves gold-medal standard at the International Mathematical Olympiad (Simon Willison’s Weblog)
  3. Advanced version of Gemini with Deep Think officially achieves gold-medal standard at the International Mathematical Olympiad (AI Future Thinkers)
  4. Gemini with Deep Think Achieves Gold at International Math Olympiad (Maginative)
  5. Gemini Deep Think learns math, wins gold medal at International Math Olympiad (Ars Technica)
  6. Advanced Version of Gemini With Deep Think Officially Achieves Gold-Medal Standard at the International Mathematical Olympiad (Slashdot)
  7. Google DeepMind’s AI wins gold medal at International Math Olympiad (Google News)
  8. Gemini with Deep Think wins gold at IMO, a breakthrough in math AI (LinkedIn)
  9. [Google ‘officially’ bags IMO gold The Rundown AI](https://www.therundown.ai/p/google-officially-bags-imo-gold)

FACT-CHECK SUMMARY

  • Claims checked: 10
  • Claims verified: 10
  • Verdict: PASS
測試你的理解
Q1. Google Gemini 這次獲得金牌水準成績的比賽是什麼?
  • 世界機器人大賽
  • 國際數學奧林匹亞 (IMO)
  • Google Code Jam
Google Gemini 在 2025 年國際數學奧林匹亞 (IMO) 中獲得了金牌水準的成績。
Q2. 這次應用於 Gemini 模型中,讓 AI 能夠深入思考問題的核心技術名稱是?
  • Deep Think
  • Quick Search
  • Magic Math
Gemini 具備了「Deep Think」能力,因此能夠進行高難度的數學推理。
Q3. 國際數學奧林匹亞 (IMO) 是從哪一年開始每年舉辦的?
  • 1980年
  • 1959年
  • 2000年
國際數學奧林匹亞是自 1959 年起每年舉辦的全球最權威的青少年數學競賽。
數學天才的舞台「IMO」,AI 竟然拿到了金牌?Goo...
0:00